Nucleu (algebră liniară)

De la testwiki
Sari la navigare Sari la căutare

În matematică, și mai precis în algebra liniară și Format:Ill-wd, nucleul (de asemenea, cunoscut sub numele de kernel sau ker, după notația practicată) al unei aplicații liniare Format:Nowrap între două spații vectoriale V și W, este mulțimea tuturor elementelor v din V pentru care Format:Nowrap, unde 0 indică vectorul zero din W. Adică, în Format:Ill-wd,

ker(L)={𝐯VL(𝐯)=𝟎}.

Proprietăți ale nucleului

Nucleul și imaginea unei aplicații L.

Nucleul lui L este un Format:Ill-wd al domeniului V.[1] În aplicația liniară Format:Nowrap, două elemente din V au aceeași imagine în W dacă și numai dacă diferența lor aparține nucleului lui L:

L(𝐯1)=L(𝐯2)L(𝐯1𝐯2)=𝟎.

Rezultă că imaginea L este izomorfă cu Format:Ill-wd lui V în raport cu nucleul:

im(L)V/ker(L).

Acest lucru implică Format:Ill-wd:

dim(kerL)+dim(imL)=dim(V).

Dimensiunea imaginii lui L se numește „rang”, iar cea a nucleului se numește „defect”.

Când V este un spațiu cu produs scalar, factorul Format:Nowrap poate fi identificat cu complementul ortogonal în V al  lui ker(L). Aceasta este o generalizare a aplicațiilor liniare a spațiului rândurilor unei matrice.

Aplicații în domeniul modulelor

Noțiunea de nucleu se aplică omomorfismelor de module, acestea din urmă fiind o generalizare a spațiilor vectoriale (care sunt definite peste un corp) peste un inel. Domeniul aplicațiilor este un modul, și nucleul constituie un „Format:Ill-wd”. Aici, nu se mai aplică neapărat noțiunile de rang și defect.

Nucleul în analiza funcțională

Dacă V și W sunt Format:Ill-wd (și W este finit-dimensional), atunci aplicația liniară L: VW este Format:Ill-wd dacă și numai dacă nucleul lui L este un subspațiu închis al lui V.

Reprezentarea ca înmulțire de matrice

Fie o aplicație liniară reprezentată ca o matrice m × n A cu coeficienți într-un corp K (de obicei, corpul numerelor reale sau al numerelor complexe) și care funcționează ca vectori coloană x cu n componente peste K. Nucleul acestei aplicații liniare este mulțimea soluțiilor ecuației Ax = 0Format:Nowrap, unde 0 se înțelege ca vector zero. Dimensiunea nucleului lui A se numește defectul lui A. În Format:Ill-wd,

N(A)=Null(A)=ker(A)={𝐱Kn|A𝐱=𝟎}.

Ecuația matriceală este echivalentă cu un sistem de ecuații liniare omogen:

A𝐱=𝟎a11x1+a12x2++a1nxn=0a21x1+a22x2++a2nxn=0am1x1+am2x2++amnxn=0.

Astfel, nucleul lui A este același ca și mulțimea soluțiilor ecuațiilor omogene de mai sus.

Proprietățile subspațiului

Nucleul unei matrice Format:Nowrap A peste un corp K este un Format:Ill-wd al lui Kn. Cu alte cuvinte, nucleul lui A, mulțimea ker(A), are următoarele trei proprietăți:

  1. Ker(A) conține întotdeauna vectorul zero, deoarece Format:Nowrap.
  2. Dacă Format:Nowrap și Format:Nowrap, atunci Format:Nowrap. Acest lucru rezultă din distributivitatea înmulțirii matricilor în raport cu adunarea.
  3. Dacă Format:Nowrap și c este un scalar Format:Nowrap, atunci Format:Nowrap, deoarece Format:Nowrap.

Spațiul rândurilor unei matrice

Produsul Ax poate fi scris în termeni de produs scalar al vectorilor după cum urmează:

A𝐱=[𝐚1𝐱𝐚2𝐱𝐚m𝐱].

Aici, cu a1, ... , am se notează transpusele rândurilor matricei A. Rezultă că x este în nucleul lui A dacă și numai dacă x este ortogonal pe fiecare vector-rând al lui A (pentru că atunci când produsul scalar a doi vectori este egal cu zero, ei sunt, prin definiție, ortogonali).

Format:Ill-wd unei matrice A este Format:Ill-wd de vectoriu rând din A. Prin raționamentul de mai sus, nucleul lui A este complement ortogonal al spațiului rândurilor. Cu alte cuvinte, un vector x se află în nucleul lui A dacă și numai dacă este ortogonal pe orice vector din spațiul rândurilor lui A.

Dimensiunea spațiului rândurilor lui A se numește rang al lui A, și dimensiunea nucleului lui A se numește defectul lui A. Aceste cantități sunt legate de Format:Ill-wd

rank(A)+nullity(A)=n.

Nucleul la stânga, sau conucleul unei matrice A este format din toți vectorii x , astfel încât xTA = 0T, unde cu T la exponent se notează transpusa unui vector coloană. Nucleul la stânga al lui A este nucleul lui AT. Nucleul la stânga al lui A este complementul ortogonal al Format:Ill-wd lui A, și este dual cu Format:Ill-wd asociată aplicației liniare. Nucleul, spațiul rândurilor, spațiul coloanelor, și nucleul la stânga ale lui A sunt cele Format:Ill-wd asociate matricei A.

Sisteme de ecuatii liniare neomogene

Nucleul joacă un rol și în soluțiile unui sistem de ecuații liniare neomogene:

A𝐱=𝐛ora11x1+a12x2++a1nxn=b1a21x1+a22x2++a2nxn=b2am1x1+am2x2++amnxn=bm

Dacă u și v sunt două posibile soluții pentru ecuația de mai sus, atunci

A(𝐮𝐯)=A𝐮A𝐯=𝐛𝐛=𝟎

Astfel, diferența dintre oricare două soluții pentru ecuația Ax = b se află în nucleul lui A.

Rezultă că orice soluție a ecuației Ax = b poate fi exprimată ca sumă între o soluție fixă v și un element arbitrar din nucleu. Cu alte cuvinte, mulțimea soluțiilor ecuației Ax = b este

{𝐯+𝐱|A𝐯=𝐛𝐱Null(A)},

Din punct de vedere geometric, aceasta spune că soluția pentru Ax = b este o translație a nucleului lui A prin vectorul v

Ilustrare

Vom da aici un exemplu simplu de calcul al nucleului unei matrice (a se vedea secțiunea Baze de mai jos pentru metode mai potrivite pentru calcule mai complexe). Exemplul atinge și noțiunea de spațiu al rândurilor și relația acesteia cu nucleul.

Fie matricea

A=[235423].

Nucleul acestei matrice este format din toți vectorii (x, y, z) ∈ R3 pentru care

[235423][xyz]=[00],

ceea ce se poate exprima ca un sistem de ecuații liniare omogen în x, y, și z:

2x+3y+5z=0,4x+2y+3z=0.

Aceleași ecuații liniare pot fi scrise în formă de matrice ca:

[23504230].

Prin eliminare Gauss–Jordan, se reduce la:

[101/1600113/80].

Rescriind matricea sub formă de ecuații, rezultă:

x=116zy=138z.

Elementele nucleului pot fi mai departe exprimate sub formă parametrică după cum urmează:

[xyz]=c[1/1613/81](where c)

pentru un c scalar.

Deoarece c este o Format:Ill-wd, acest lucru poate fi exprimat la fel de bine ca:

[xyz]=c[12616].

Nucleul lui A este soluția acestor ecuații (în acest caz, o dreaptă prin originea lui R3); vectorul (-1,-26,16)T constituie o bază a nucleului lui A. Astfel, defectul lui A este 1.

Se observă  și că următoarele produse scalare sunt zero:

[235][12616]=0and[423][12616]=0,

ceea ce ilustrează faptul că vectorii din nucleul lui A sunt ortogonali pe fiecare vector-rând al lui A.

Acești doi vectori-rând (liniar independenți) generează spațiul rândurilor lui A, un plan ortogonal pe vectorul (-1,-26,16)T.

Cum rangul lui A este 2, defectul lui A este 1, și dimensiunea lui A 3, avem o ilustrare a teoremei rangului.

Exemple

  • Dacă L: RmRn, atunci nucleul lui L este mulțimea soluțiilor unui sistem de ecuații liniare omogen. La fel ca în ilustrația de mai sus, dacă L este aplicația:
L(x1,x2,x3)=(2x1+3x2+5x3,4x1+2x2+3x3)
atunci nucleul lui L este mulțimea soluțiilor ecuațiilor
2x1+3x2+5x3=04x1+2x2+3x3=0
  • Fie C[0,1] spațiul vectorial al tuturor funcțiilor continue cu valori reale definite pe intervalul [0,1], fie L: C[0,1] → R definit prin regula:
L(f)=f(0.3).
Atunci nucleul lui L constă din toate funcțiile fC[0,1] pentru care f(0.3) = 0.
D(f)=dfdx.
Atunci, nucleul lui D este format din toate funcțiile din C(R), care au derivata zero, adică mulțimea tuturor funcțiilor constante.
s(x1,x2,x3,x4,)=(x2,x3,x4,).
Atunci nucleul lui s este subspațiu unidimensional format din toți vectorii (x1, 0, 0, ...).

Calcul prin eliminare Gauss

O bază a nucleului unei matrice poate fi calculată prin Format:Ill-wd.

În acest scop, dată fiind o matrice m × n A, se construiește mai întâi matricea [AI], unde IFormat:Math este matricea unitate n × n.

Calculând Format:Ill-wd prin eliminare Gauss (sau orice altă metodă adecvată), se obține o matrice [BC]. O bază a nucleului lui A constă în coloanele nenule ale lui C astfel încât coloana corespunzătoare din B este o coloană nulă.

În fapt, calculul poate fi oprit de îndată ce partea superioară este matricea în forma eșalon pe coloană: restul calculului constă în schimbarea bazei spațiului vectorial generat de coloanele a căror parte superioară este zero.

De exemplu, să presupunem că

A=[103028015014000179000000].

Atunci

[AI]=[103028015014000179000000100000010000001000000100000010000001].

Aducând partea de sus în forma eșalon pe coloane prin operațiuni cu coloanele pe întreaga matrice rezultă

[BC]=[100000010000001000000000100328010514000100001079000010000001].

Ultimele trei coloane din B sunt coloane nule. Prin urmare, în ultimii trei vectori de C,

[351000],[210710],[840901]

sunt o bază a nucleului lui A.

Întrucât operațiile pe coloane corespund unei înmulțiri prealabile cu matrici inversabile, faptul că [AI] se reduce la [BC] ne spune că AC=B. Cu alte cuvinte, acțiunea lui A via (coloanele lui) C corespunde cu acțiunea lui B. Întrucât B este în formă eșalon pe coloane, ea acționează trivial doar asupra elementelor bazei elementare ce corespund coloanelor nule din B. Întrucât acțiunea lui B corespunde acțiunii lui A prin coloanele lui C, coloanele corespunzătoare din C trebuie să fie coloane nule pentru A, și trebuie să formeze baza nucleului lui A conform teoremei rangului.

Calcul numeric

Problema de calcul pe calculator al nucleului depinde de natura coeficienților.

Coeficienții exacți

Dacă coeficienții matricei sunt numere date, Format:Ill-wd a matricei poate fi calculată prin Format:Ill-wd mai eficient decât prin eliminare gaussiană. Este chiar mai eficient să se utilizeze Format:Ill-wd, care reduce problema la una similară peste un corp finit.Format:Necesită citare

Pentru coeficienți într-un corp finit, eliminarea gaussiană funcționează bine, dar pentru matrice mari ca cele care apar in criptografie se cunosc algoritmi mai buni, care au aproximativ aceeași Format:Ill-wd, dar sunt mai rapide și se comportă mai bine pe hardware modern.Format:Necesită citare

Calculul în virgulă mobilă

Pentru matrice ale căror elemente sunt numere în virgulă mobilă, problema calculării nucleului are sens numai pentru matrice al căror număr de rânduri este egal cu rangul: din cauza Format:Ill-wd, o matrice cu elemente în virgulă mobilă are aproape întotdeauna rang complet, chiar și atunci când este o aproximare a unei matrice cu rang mult mai mic. Chiar și pentru o matrice cu rang complet, se poate calcula nucleul numai dacă este Format:Ill-wd, adică are un număr de condiționare mic.[2]

Chiar și pentru o matrice cu rang complet bine condiționată, eliminarea gaussiană nu se comportă corect: introduce erori de rotunjire care sunt prea mari pentru a obține un rezultat semnificativ. Întrucât calculul nucleului unei matrice este un caz particular de rezolvare a unui sistem omogen de ecuații liniare, nucleul poate fi calculat de către oricare dintre diverșii algoritmi concepuți pentru a rezolva sisteme omogene. Un software de ultimă generație pentru acest scop este biblioteca Format:Ill-wd.Format:Necesită citare

Note

  1. Algebra liniară, așa cum este discutată în acest articol, este o disciplină matematică foarte bine stabilită, pentru care există multe surse. Aproape tot materialul din acest articol poate fi găsit în Format:Harvnb, Format:Harvnb, și cursul lui Strang.
  2. Format:Citat web

Referințe

Legături externe

Format:Portal