Derivarea funcțiilor compuse
În calculul diferențial derivarea funcțiilor compuse este o formulă folosită pentru a găsi derivatele unei Format:Ill-wd de două funcții derivabile, Format:Mvar și Format:Mvar în funcție de derivatele lui Format:Mvar și Format:Mvar Mai exact, dacă este o funcție astfel încât pentru orice Format:Mvar, atunci regula derivării lui Format:Mvar este, în notația lui Lagrange:
sau, echivalent,
Regula poate fi exprimată și în notația lui Leibniz. Dacă o variabilă Format:Mvar depinde de variabila Format:Mvar, care ea însăși depinde de variabila Format:Mvar (adică Format:Mvar și Format:Mvar sunt Format:Ill-wd), atunci Format:Mvar depinde și de Format:Mvar prin variabila intermediară Format:Mvar. În acest caz, regula se exprimă ca
și
pentru a indica în ce puncte trebuie evaluate derivatele.
La integrare, omoloaga regulii este schimbarea de variabilă.
Explicație intuitivă
Intuitiv, regula de derivare a funcțiilor compuse afirmă că variația instantanee a lui Format:Mvar în funcție de Format:Mvar și cea a lui Format:Mvar în funcție de Format:Mvar permite calcularea variației lui Format:Mvar în funcție de Format:Mvar ca produs al celor două variații.
După cum a spus George F. Simmons: „Dacă o mașină se deplasează de două ori mai repede decât o bicicletă și bicicleta este de patru ori mai rapidă decât un om care merge, atunci mașina se deplasează de Format:Math ori mai repede decât omul”.[1]
Relația dintre acest exemplu și regula de derivare a funcțiilor compuse este următoarea. Fie Format:Mvar, Format:Mvar și Format:Mvar pozițiile (variabile) mașinii, bicicletei, respectiv a omului care merge. Raportul vitezelor mașinii și bicicletei este Similar, Deci, raportul vitezelor mașinii și ale omului care merge este
Rata de schimbare a pozițiilor este raportul dintre viteze, iar viteza este derivata poziției în funcție de timp, adică
sau, echivalent,
care este și o aplicare a regulii de derivare.
Istoric
Regula derivării funcțiilor compuse pare să fi fost folosită pentru prima dată de Gottfried Wilhelm Leibniz. A folosit-o pentru a calcula derivata lui ca un compus al funcției rădăcină pătrată și al funcției El a menționat-o pentru prima dată într-un memoriu din 1676 (cu o eroare de semn în calcul).[2] Notația comună a acestei reguli se datorează lui Leibniz.[3] Guillaume de l'Hôpital a folosit regula de derivare în mod implicit în Analyse des infiniment petits. Regula derivării funcțiilor compuse nu apare în niciuna dintre cărțile de analiză ale lui Leonhard Euler, deși au fost scrise la peste o sută de ani după descoperirea lui Leibniz. Se crede că prima versiune „modernă” a regulii apare în Théorie des fonctions analytiques a lui Lagrange, din 1797. Apare și în Résumé des Leçons données a L’École Royale Polytechnique sur Le Calcul Infinitesimal al lui Cauchy, din 1823.[3]
Formulare
Cea mai simplă formă a regulii derivării funcțiilor compuse apare la funcțiile reale de variabilă reală. Se afirmă că dacă Format:Mvar este o funcție care este derivabilă într-un punct Format:Mvar (adică derivata Format:Math există) și Format:Mvar este o funcție derivabilă în Format:Math, atunci funcția compusă este derivabilă în Format:Mvar, iar derivata este[4]
Regula este uneori prescurtată ca
Dacă Format:Math și Format:Math, atunci această formă prescurtată este scrisă în notația lui Leibniz ca:
De asemenea, punctele în care sunt evaluate derivatele pot fi precizate explicit:
În continuare, prin același raționament, fiind date Format:Mvar și funcțiile cu funcția compusă , dacă fiecare funcție este derivabilă în punctul argumentului său imediat, atunci funcția compusă este și ea derivabilă prin aplicarea repetată a regulii derivării funcțiilor compuse, unde derivata este (în notația lui Leibniz):
Aplicații
Derivarea unei funcții compuse de mai mult de două funcții
Regula derivării funcțiilor compuse poate fi aplicată compunerilor de mai mult de două funcții. Pentru a afla derivata unei compuse de mai mult de două funcții, se observă că compunerea lui Format:Mvar Format:Mvar și Format:Mvar (în această ordine) este compusa lui Format:Mvar cu Format:Math. Regula compunerii spune că pentru a calcula derivata lui Format:Math, este suficientă calcularea derivatei lui Format:Mvar și a derivatei lui Format:Math. Derivata lui Format:Mvar poate fi calculată direct, iar derivata lui Format:Math poate fi calculată prin aplicarea din nou a regulii.
Concret, fie funcția
Aceasta poate fi descompusă ca un compus de trei funcții:
adică
Derivatele lor sunt:
Regula derivării unei funcții compuse spune că derivata compusei în punctul Format:Math este:
În notația lui Leibniz, aceasta este:
sau, pe scurt,
Derivata funcției este deci:
Un alt mod de a calcula această derivată este de a vedea funcția compusă Format:Math ca fiind compusa dintre Format:Math și Format:Mvar. Aplicând regula pentru derivarea funcțiilor compuse în acest mod ar rezulta:
Aceasta este aceeași cu cea calculată mai sus. Acest lucru este de așteptat deoarece Format:Math.
Uneori, este necesar să se deriveze o compunere arbitrar de lungă de forma . În acest caz se definește
unde și când . Atunci regula derivării ia forma
sau, în notația lui Lagrange,
Derivarea unui raport
Regula pentru derivarea funcțiilor compuse poate fi utilizată pentru a deduce unele reguli de derivare binecunoscute. De exemplu, regula de derivare a raportului este o consecință a regulii de derivare a funcțiilor compuse și a regulii de derivare a unui produs. Pentru asta, se scrie funcția Format:Math ca produsul Format:Math. Mai întâi se aplică regula derivării produsului:
Pentru a calcula derivata lui Format:Math, se observă că expresia este compusa lui Format:Mvar cu funcția inversă, adică cu funcția care trimite Format:Mvar la Format:Math. Derivata funcției inverse este . Prin aplicarea regulii de derivare a funcțiilor compuse, ultima expresie devine:
care este formula uzuală pentru regula derivării unui raport.
Derivarea funcțiilor inverse
Fie Format:Math a cărei funcție inversă este Format:Mvar astfel că Format:Math. Există o formulă pentru derivata lui Format:Mvar în funcție de derivata lui Format:Mvar. Pentru a arăta acest lucru, se observă că Format:Mvar și Format:Mvar satisfac relația
Și pentru că funcțiile și Format:Mvar sunt egale, derivatele lor trebuie să fie egale. Derivata lui Format:Mvar este funcția constantă cu valoarea 1, iar derivata lui este determinată de regula pentru derivarea funcțiilor compuse. Prin urmare:
Pentru a exprima Format:Mvar ca o funcție de variabila independentă Format:Mvar, se înlocuiește peste tot cu Format:Mvar Atunci se poate găsi soluția pentru Format:Mvar
De exemplu, fie funcția Format:Math. Are inversa Format:Math. Deoarece Format:Math, formula de mai sus spune că
Această formulă este adevărată ori de câte ori Format:Mvar este derivabilă și inversa sa, Format:Mvar este și ea derivabilă. Această formulă poate eșua atunci când una dintre aceste condiții nu este adevărată. De exemplu, fie Format:Math. Inversa sa este Format:Math care nu este derivabilă în zero. Dacă se încearcă să se folosească formula de mai sus pentru a calcula derivata lui Format:Mvar în zero, trebuie evaluată Format:Math. Deoarece Format:Math și Format:Math, trebuie evaluată expresia 1/0, care este nedefinită. Prin urmare, formula eșuează în acest caz. Acest lucru nu este surprinzător deoarece Format:Mvar nu este derivabilă în zero.
Propagarea înapoi
Regula pentru derivarea funcțiilor compuse formează baza algoritmului backpropagation, care este utilizat în Format:Ill-wd la rețelele neurale în învățarea profundă (inteligență artificială).[5]
Derivate superioare
Format:Ill-wd generalizează regula pentru derivarea funcțiilor compuse pentru derivatele superioare. Fie Format:Math și Format:Math, atunci primele câteva derivate sunt:
Demonstrații
Prima demonstrație
O demonstrație a regulii derivării funcțiilor compuse începe prin definirea derivatei funcției compuse Format:Math, unde se ia limita lui Format:Math când Format:Mvar tinde la Format:Mvar:
Se presupune pentru moment că nu este egală cu pentru niciun lîngă . Atunci expresia anterioară este egală cu produsul a doi factori:
Dacă variază lângă Format:Mvar, atunci s-ar putea întâmpla ca, indiferent cât de aproape s-ar ajunge de Format:Mvar, să existe întotdeauna un Format:Mvar și mai aproape, astfel încât Format:Math De exemplu, acest lucru se poate întâmpla lângă Format:Math pentru funcția continuă Format:Mvar definită de Format:Math pentru Format:Math și Format:Math altfel. Ori de câte ori se întâmplă acest lucru, expresia de mai sus este nedefinită deoarece implică împărțirea cu zero. Pentru a rezolva acest lucru, se introduce o funcție după cum urmează:
Se va arăta că raportul este întotdeauna egal cu:
Ori de câte ori Format:Math nu este egal cu Format:Math, acest lucru este clar deoarece factorii lui Format:Math se anulează. Când Format:Math este egal cu Format:Math, atunci deoarece Format:Math iar produsul de mai sus este zero deoarece este egal cu Format:Math înmulțit cu zero. Deci produsul de mai sus este întotdeauna egal cu și pentru a arăta că derivata lui Format:Math în Format:Mvar există și pentru a-i determina valoarea, trebuie doar să se arate că limita produsului de mai sus când Format:Mvar tinde la Format:Mvar există și să se determine valoarea ei.
Pentru asta, se reamintește că limita unui produs există dacă există limitele factorilor săi, iar limita produsului va fi egală cu produsul limitelor factorilor. Cei doi factori sunt Format:Math și Format:Math. Deoarece Format:Mvar este derivabilă în Format:Mvar prin presupunere, limita sa când Format:Mvar tinde la Format:Mvar există și este egală cu Format:Math.
În ceea ce privește Format:Math, se observă că Format:Mvar este definită oriunde este definită Format:Mvar. În plus, Format:Mvar este derivabilă în Format:Math prin presupunere, deci Format:Mvar este continuă în Format:Math, prin definiția derivatei. Funcția Format:Mvar este continuă în Format:Mvar deoarece este derivabilă în Format:Mvar și, prin urmare, Format:Math este continuă în Format:Mvar. Deci limita sa când Format:Mvar tinde la Format:Mvar există și este egală cu Format:Math, care este Format:Math.
Aceasta arată că limitele ambilor factori există și că ele sunt egale cu Format:Math și, respectiv, Format:Math. Prin urmare, derivata lui Format:Math în Format:Mvar există și este egală cu Format:MathFormat:Math.
A doua demonstrație
O altă modalitate de a demonstra regula pentru derivarea funcțiilor compuse este măsurarea erorii în aproximarea liniară determinată de derivată. Această demonstrație are avantajul că se poate generaliza la mai multe variabile. Se bazează pe următoarea definiție echivalentă a derivabilității într-un punct: o funcție Format:Mvar este derivabilă în Format:Mvar dacă există un număr real Format:Math și o funcție Format:Math care tinde la zero când Format:Mvar tinde la zero și, în plus,
Aici membrul stâng reprezintă diferența adevărată dintre valorile lui Format:Mvar în Format:Math și în Format:Mvar, în timp ce membrul drept reprezintă aproximarea determinată de derivată plus un termen de eroare.
În situația regulii de derivare a funcțiilor compuse, o astfel de funcție Format:Mvar există deoarece Format:Mvar se presupune că este derivabilă la Format:Mvar. Din nou, prin presupunere, o funcție similară există și pentru Format:Mvar în Format:Math. Numind această funcție Format:Mvar, avem
Definiția de mai sus nu impune constrângeri pentru Format:Math chiar dacă se presupune că Format:Math tinde la zero când Format:Mvar tinde la zero. Dacă se pune Format:Math atunci Format:Mvar este continuă în 0.
Demonstrarea teoremei necesită studierea diferenței Format:Math când Format:Mvar tinde la zero. Primul pas este înlocuirea lui Format:Math folosind definiția derivării lui Format:Mvar în Format:Mvar:
Următorul pas este folosirea definiției derivabilității lui Format:Mvar în Format:Math Acest lucru necesită un termen de forma Format:Math pentru unele Format:Mvar. În ecuația de mai sus, Format:Mvar-ul corect variază cu Format:Mvar. Se pune Format:Math și partea dreaptă devine Format:Math Aplicând definiția derivatei rezultă:
Pentru a studia comportamentul acestei expresii când Format:Mvar tinde la zero, se dezvoltă Format:Math După regruparea termenilor, membrul drept devine:
Deoarece Format:Math și Format:Math tind la zero când Format:Mvar tinde la zero, primii doi termeni dintre paranteze tind la zero când Format:Mvar tinde la zero. Aplicând aceeași teoremă la produsele limitelor ca în prima demonstrație, al treilea termen dintre paranteze tinde și el la zero. Deoarece expresia de mai sus este egală cu diferența Format:Math prin definiție derivata lui Format:Math este derivabilă în Format:Mvar iar derivata sa este Format:Math
În această demonstrație rolul lui Format:Mvar din prima demonstrație este jucat de Format:Mvar. Ele sunt legate prin ecuația:
Necesitatea de a defini Format:Mvar în Format:Math este analogă cu necesitatea de a defini Format:Mvar în zero.
A treia demonstrație
Definiția alternativă a lui Constantin Carathéodory a derivabilității unei funcții poate fi folosită pentru a da o demonstrație elegantă a regulii de derivare a funcțiilor compuse.[6]
Conform acestei definiții, o funcție Format:Mvar este derivabilă într-un punct Format:Mvar dacă și numai dacă există o funcție Format:Mvar continuă la Format:Mvar și astfel încât Format:Math Există cel mult o astfel de funcție și dacă Format:Mvar este derivabilă în Format:Mvar atunci Format:Math.
Fiind admise ipotezele regulii de derivare a funcțiilor compuse și faptul că funcțiile derivabile și compusele funcțiilor continue sunt continue, rezultă că există funcția Format:Mvar continuă în Format:Math și funcția Format:Mvar continuă în Format:Mvar, astfel încât
și
Prin urmare,
dar funcția Format:Math este continuă în Format:Mvar iar pentru acest Format:Mvar se obține
O abordare similară funcționează pentru funcțiile (vectoriale) derivabile continuu de mai multe variabile. Această metodă de factorizare permite și o abordare unificată a formelor mai tari de derivabilitate, atunci când derivata este necesară să fie Format:Ill-wd, Format:Ill-wd etc. Derivarea în sine poate fi privită ca Format:Ill-wd, generalizată la o clasă adecvată de funcții.
Demonstrația cu infinitezimale
Dacă și atunci alegând infinitezimala se calculează corespondenta și apoi corespondenta , astfel încât
și aplicând Format:Ill-wd se obține
care este chiar regula derivării funcțiilor compuse.
Cazul funcțiilor de mai multe variabile
Generalizarea completă a regulii pentru derivarea funcțiilor compuse la Format:Ill-wd (cum ar fi ) este mai degrabă o chestiune tehnică. Totuși, este mai simplu de scris pentru cazul funcțiilor de forma
unde , și pentru orice
Deoarece acest caz apare adesea în studiul funcțiilor de o singură variabilă, merită descris separat.
Cazul funcțiilor scalare cu intrări multiple
Fie și pentru Se scrie regula pentru derivarea funcțiilor compuse pentru compunerea funcțiilor
Este nevoie de derivatele parțiale ale lui Format:Mvar în funcție de Format:Mvar. Notațiile uzuale pentru derivate parțiale implică nume pentru argumentele funcției. Deoarece aceste argumente nu sunt denumite în formula de mai sus, este mai simplu și mai clar să se folosească notația D și să se noteze cu
derivata parțială a lui Format:Mvar în funcție de argumentul său Format:Mvar și cu
valoarea acestei derivate în Format:Mvar.
Cu această notație, regula pentru derivarea funcțiilor compuse este
Exemplu: operații aritmetice
Dacă funcția Format:Mvar este o adunare, adică dacă
atunci și Astfel, regula pentru derivarea funcțiilor compuse dă
La înmulțire
derivatele parțiale sunt și Astfel,
Cazul exponențierii
este ceva mai complicat, cu
și cu
Rezultă că
Regula generală: Funcții vectoriale cu intrări multiple
Cel mai simplu mod de a scrie regula pentru derivarea funcțiilor compuse în cazul general este de a folosi Format:Ill-wd, care este o transformare liniară care tratează toate derivatele direcționale într-o singură formulă. Fie funcțiile derivabile Format:Math și Format:Math și un punct Format:Math din Format:Math Fie Format:Math derivata totală a lui Format:Mvar în Format:Math și Format:Math derivata totală a lui Format:Mvar în Format:Math Aceste două derivate sunt transformări liniare Format:Math și Format:Math deci pot fi compuse. Regula pentru derivarea funcțiilor compuse la derivatele totale este că derivata totală a lui Format:Math în Format:Math este compunerea derivatelor:
sau, pe scurt,
Regula pentru derivatele superioare ale funcțiilor compuse poate fi demonstrată folosind o tehnică similară celei de-a doua demonstrații prezentate mai sus.[7]
Deoarece derivata totală este o transformare liniară, funcțiile care apar în formulă pot fi rescrise ca matrici. Matricea corespunzătoare unei derivate totale este Format:Ill-wd, iar compusa a două derivate corespunde produsului dintre matricile lor jacobiene. Din această perspectivă, regula pentru derivarea funcțiilor compuse este:
sau, pe scurt,
Adică, jacobianul unei funcții compuse este produsul jacobienilor funcțiilor compuse (evaluate în punctele corespunzătoare).
Regula pentru derivatele superioare ale funcțiilor compuse este o generalizare a regulii pentru derivarea funcțiilor compuse unidimensionale. Dacă Format:Mvar, Format:Mvar și Format:Mvar sunt 1, astfel încât Format:Math și Format:Math atunci matricile jacobiene ale lui Format:Mvar și Format:Mvar sunt Format:Math Mai exact, acestea sunt:
Jacobianul lui Format:Math este produsul acestor matrici Format:Math, adică Format:Math așa cum era de așteptat din regula unidimensională pentru derivarea funcțiilor compuse. În limbajul transformărilor liniare, Format:Math este funcția care scalează un vector cu un factor de Format:Math iar Format:Math este funcția care scalează un vector cu un factor de Format:Math Regula pentru derivarea funcțiilor compuse spune că compunerea acestor două transformări liniare este tot o transformarea liniară Format:Math prin urmare este funcția care scalează un vector cu Format:Math
Un alt mod de scriere a regulii pentru derivarea funcțiilor compuse este folosit atunci când Format:Mvar și Format:Mvar sunt exprimate în funcție de componentelor lor ca Format:Math și Format:Math În acest caz, regula de mai sus pentru matricile jacobiene este de obicei scrisă ca:
Regula pentru derivatele totale ale funcțiilor compuse implică o regulă pentru derivate parțiale ale funcțiilor compuse. Se reamintește că atunci când derivata totală există, derivata parțială în direcția coordonatei Format:Mvar se găsește prin înmulțirea matricei jacobiene cu al Format:Mvar-lea vector al bazei. Făcând acest lucru cu formula de mai sus, se obține:
Deoarece intrările matricei jacobiene sunt derivate parțiale, se poate simplifica formula de mai sus pentru a obține:
Mai conceptual, această regulă exprimă faptul că o schimbare a direcției lui Format:Math poate schimba toate Format:Math până la Format:Math, și oricare dintre aceste schimbări poate afecta Format:Mvar
În cazul particular în care Format:Math astfel încât Format:Mvar este o funcție reală, atunci această formulă se simplifică și mai mult:
Acesta poate fi rescris ca un produs scalar. Reamintind că Format:Math derivata parțială Format:Math este tot un vector, iar regula pentru derivarea funcțiilor compuse spune că:
Exemplu
Fie Format:Math unde Format:Math și Format:Math determină valoare lui Format:Math și Format:Math folosind regula pentru derivarea funcțiilor compuse.
și
Derivate superioare ale funcțiilor de mai multe variabile
Formula lui Faà di Bruno pentru derivatele de ordin superior ale funcțiilor cu o singură variabilă se generalizează la cazul funcțiilor de mai multe variabile. Dacă Format:Math este o funcție de Format:Math ca mai sus, atunci derivata de ordinul al doilea a lui Format:Math este:
Alte generalizări
Toate extensiile din analiza matematică au o regulă pentru derivarea funcțiilor compuse. În cele mai multe dintre acestea formula rămâne aceeași, deși sensul acelei formule poate fi foarte diferit.
O generalizare este la varietăți geometrice. În această situație, regula de derivare a funcțiilor compuse reprezintă faptul că derivata lui Format:Math este compusa dintre derivata lui Format:Math și derivata lui Format:Math. Această teoremă este o consecință imediată a regulii privind derivatele superioare ale funcțiilor compuse prezentate mai sus și are exact aceeași formulă.
Regula pentru derivarea funcțiilor compuse este valabilă și pentru Format:Ill-wd din spații Banach. Este valabilă aceeași formulă ca înainte.[8] Acest caz și cel precedent admit o generalizare simultană la Format:Ill-wd.
În Format:Ill-wd derivata este interpretată ca un morfism de module de Format:Ill-wd. Un Format:Ill-wd comutative Format:Math determină un morfism al diferențialelor Kähler Format:Math care trimite un element Format:Math la Format:Math, diferențiala exterioară a lui Format:Math Formula Format:Math este valabilă și în acest context. Caracteristica comună a acestor exemple este că sunt expresii ale ideii că derivata face parte dintr-un functor. Un functor este o operație asupra spațiilor și funcțiilor dintre ele. Asociază fiecărui spațiu un spațiu nou și fiecărei funcții dintre două spații o nouă funcție între spațiile noi corespunzătoare. În fiecare dintre cazurile de mai sus, functorul trimite fiecare spațiu către Format:Ill-wd și trimite fiecare funcție către derivata sa. De exemplu, în cazul unei varietăți, derivata trimite varietatea Format:Math la varietatea Format:Math (fibratul său tangent) și funcția Format:Math la derivata sa totală. Există o cerință pentru ca acesta să fie un functor, și anume că derivata unui compus trebuie să fie compusa derivatelor. Aceasta este tocmai formula Format:Math.
De asemenea, există reguli de derivare a compuselor în Format:Ill-wd. Una dintre acestea, Format:Ill-wd, exprimă compusul unui proces Itô (sau mai general o Format:Ill-wd) dXt cu o funcție Format:Mvar derivabilă de două ori. În lema lui Itô, derivata funcției compuse depinde nu numai de dXt și de derivata lui Format:Mvar ci și de derivata de orfinul al doilea a lui Format:Mvar Dependența de derivata de ordinul al doilea este o consecință a Format:Ill-wd nenule a procesului stohastic, ceea ce în linii mari înseamnă că procesul se poate deplasa în sus și în jos într-un mod foarte grosier. Această variantă a regulii de derivare a funcțiilor compuse nu este un exemplu de functor deoarece cele două funcții care se compun sunt de tipuri diferite.
Note
- ↑ Format:En icon George F. Simmons, Calculus with Analytic Geometry (1985), p. 93
- ↑ Format:En icon Format:Cite journal
- ↑ 3,0 3,1 Format:En icon Format:Cite journal
- ↑ Format:En icon Format:Cite book
- ↑ Format:En icon Format:Citation, pp=197–217
- ↑ Format:En icon Format:Cite journal
- ↑ Format:En icon Format:Cite book
- ↑ Format:En icon Format:Cite book
Vezi și
- Integrare prin schimbare de variabilă
- Derivarea inversei unei funcții
- Derivarea unui produs
- Derivarea unui raport