Drsná matematika III. přednáška Funkce více proměnných: Aproximace vyšších rádů, Taylorova věta, inverzní zobrazení Masarykova univerzita Fakulta informatiky 3. 9. 6
Obsah přednášky Literatura Derivace vyšších řádů Iterované parciální derivace Hessián aproximace. řádu Lokální extrémy funkcí více proměnných 3 Zobrazení mezi euklidovskými prostory Zobrazení a transformace Chain Rule Věta o inverzním zobrazení
Plán přednášky Literatura Derivace vyšších řádů Iterované parciální derivace Hessián aproximace. řádu Lokální extrémy funkcí více proměnných 3 Zobrazení mezi euklidovskými prostory Zobrazení a transformace Chain Rule Věta o inverzním zobrazení
Kde je dobré číst? Zuzana Došlá, Roman Plch, Petr Sojka, Diferenciální počet funkcí více proměnných s programem Maple, MU Brno, 999, 73 s.
Kde je dobré číst? Zuzana Došlá, Roman Plch, Petr Sojka, Diferenciální počet funkcí více proměnných s programem Maple, MU Brno, 999, 73 s. Riley, K.F., Hobson, M.P., Bence, S.J. Mathematical Methods for Physics and Engineering, second edition, Cambridge University Press, Cambridge 4, ISBN 5 8967 5, xxiii + 3 pp.
Plán přednášky Literatura Derivace vyšších řádů Iterované parciální derivace Hessián aproximace. řádu Lokální extrémy funkcí více proměnných 3 Zobrazení mezi euklidovskými prostory Zobrazení a transformace Chain Rule Věta o inverzním zobrazení
Definition Funkce f : R n R je diferencovatelná v bodě x, jestliže v bodě x existují všechny směrové derivace d v f (x), v R n, d v f (x) je lineární v závislosti na přírůstku v a 3 = lim v v ( f (x + v) f (x) dv f (x) ).
Definition Funkce f : R n R je diferencovatelná v bodě x, jestliže v bodě x existují všechny směrové derivace d v f (x), v R n, d v f (x) je lineární v závislosti na přírůstku v a 3 = lim v v ( f (x + v) f (x) dv f (x) ). Theorem Nechť f : E n R je funkce n proměnných, která má v okolí bodu x E n spojité parciální derivace. Pak existuje její diferenciál df v bodě x a jeho souřadné vyjádření je dáno rovnicí df = f x dx + f x dx + + f x n dx n. ( )
Diferenciál zadává tečné (nad)roviny funkce n proměnných. - - 4 5 3 y 4 6 5 6 3 x - - 4 5 3 y 4 6 5 6 3 x Graf funkce f (x, y) = sin(x) cos(y), červená čára je obrazem křivky c(t) = (t, t, f (t, t)).
Diferenciál zadává tečné (nad)roviny funkce n proměnných. - - 4 5 3 y 4 6 5 6 3 x - - 4 5 3 y 4 6 5 6 3 x Graf funkce f (x, y) = sin(x) cos(y), červená čára je obrazem křivky c(t) = (t, t, f (t, t)). Diferencovatelná funkce f na E n v bodě x E n má nulový diferenciál tehdy a jen tehdy, když její složení s libovolnou křivkou procházející tímto bodem zde má stacionární bod.
Diferenciál zadává tečné (nad)roviny funkce n proměnných. - - 4 5 3 y 4 6 5 6 3 x - - 4 5 3 y 4 6 5 6 3 x Graf funkce f (x, y) = sin(x) cos(y), červená čára je obrazem křivky c(t) = (t, t, f (t, t)). Diferencovatelná funkce f na E n v bodě x E n má nulový diferenciál tehdy a jen tehdy, když její složení s libovolnou křivkou procházející tímto bodem zde má stacionární bod. To ovšem neznamená, že v takovém bodě musí mít f aspoň lokálně buď maximum nebo minimum. Stejně jako u funkcí jedné proměnné můžeme rozhodovat teprve podle derivací vyšších.
Pro pevný přírůstek v R n je vyčíslení diferenciálů na tomto přírůstku opět (diferenciální) operace na funkcích f : E n R f d v f = df (v). Výsledkem je df (v) : E n R. Jestliže je tato funkce opět diferencovatelná, můžeme iterovat.
Pro pevný přírůstek v R n je vyčíslení diferenciálů na tomto přírůstku opět (diferenciální) operace na funkcích f : E n R f d v f = df (v). Výsledkem je df (v) : E n R. Jestliže je tato funkce opět diferencovatelná, můžeme iterovat. Pro parciální derivace druhého řádu píšeme ( x j x i )f = x i x j f = v případě opakované volby i = j píšeme také ( x i x i )f = x i f f = f x i x i x j.
Úplně stejně postupujeme při dalších iteracích a hovoříme o parciálních derivacích k-tého řádu k f x i... x ik. Theorem Nechť f : E n R je k-krát diferencovatelná funkce se spojitými parciálními derivacemi až do řádu k včetně v okolí bodu x R n. Pak všechny parciální derivace nezávisí na pořadí derivování.
Definition Je-li f : R n R libovolná dvakrát diferencovatelná funkce, nazýváme symetrickou matici funkcí ( ) f x f x (x)... f x x n (x) Hf (x) = (x) =. x i x j.... f x n x (x)... f x n x n (x) Hessián funkce f v bodě x.
Pro křivku c(t) = (x(t), y(t)) = (x + ξt, y + ηt) mají funkce α(t) = f (x(t), y(t)) ( f β(t) = f (x, y ) + t x (x, y )ξ + f ) y (x, y )η + ( ) t f xx (x, y )ξ + f xy (x, y )ξη + f yy (x, y )η stejné derivace do druhého řádu včetně.
Pro křivku c(t) = (x(t), y(t)) = (x + ξt, y + ηt) mají funkce α(t) = f (x(t), y(t)) ( f β(t) = f (x, y ) + t x (x, y )ξ + f ) y (x, y )η + ( ) t f xx (x, y )ξ + f xy (x, y )ξη + f yy (x, y )η stejné derivace do druhého řádu včetně. Funkci β píšeme vektorově: ( ) ξ β(t) = f (x, y ) + tdf (x, y ) + ( ) ξ η t (ξ η) Hf (x, y ) η
Pro křivku c(t) = (x(t), y(t)) = (x + ξt, y + ηt) mají funkce α(t) = f (x(t), y(t)) ( f β(t) = f (x, y ) + t x (x, y )ξ + f ) y (x, y )η + ( ) t f xx (x, y )ξ + f xy (x, y )ξη + f yy (x, y )η stejné derivace do druhého řádu včetně. Funkci β píšeme vektorově: ( ) ξ β(t) = f (x, y ) + tdf (x, y ) + ( ) ξ η t (ξ η) Hf (x, y ) η nebo β(t) = f (x, y ) + tdf (x, y )(v) + t Hf (x, y )(v, v), kde v = (ξ, η) = c (t) je přírůstek zadaný derivací křivky c(t) a Hessián symetrická forma.
Použití Hessiánu připomíná Taylorovu větu funkcí jedné proměnné! - - 6 5 6 5 3 4 y 4 x 3 - - 6 5 6 5 3 4 y 4 x 3 Tečná rovina je vynesena spolu s kvadratickým přiblížením pro funkci f (x, y) = sin(x) cos(y).
Použití Hessiánu připomíná Taylorovu větu funkcí jedné proměnné! - - 6 5 6 5 3 4 y 4 x 3 - - 6 5 6 5 3 4 y 4 x 3 Tečná rovina je vynesena spolu s kvadratickým přiblížením pro funkci f (x, y) = sin(x) cos(y). Obecně pro funkce f : E n R, body x = (x,..., x ) E n a přírůstky v = (ξ,..., ξ n ) klademe D k f (x)(v) = i,...,i k n k f x i... x ik (x,..., x n ) ξ i ξ ik.
Ukažme ve dvou proměnných:
Ukažme ve dvou proměnných: Tečná rovina: f (x, y ) + D (x, y )(x x, y y )
Ukažme ve dvou proměnných: Tečná rovina: f (x, y ) + D (x, y )(x x, y y ) Aproximace pomocí hesiánu: f (x, y ) + D (x, y )(x x, y y ) + D (x, y )f (x x, y y )
Ukažme ve dvou proměnných: Tečná rovina: f (x, y ) + D (x, y )(x x, y y ) Aproximace pomocí hesiánu: f (x, y ) + D (x, y )(x x, y y ) + D (x, y )f (x x, y y ) výraz třetího řádu D 3 f (x, y)(ξ, η) = 3 f x 3 ξ3 + 3 3 f x y ξ η + 3 3 f x y ξη + 3 f y 3 η3
Ukažme ve dvou proměnných: Tečná rovina: f (x, y ) + D (x, y )(x x, y y ) Aproximace pomocí hesiánu: f (x, y ) + D (x, y )(x x, y y ) + D (x, y )f (x x, y y ) výraz třetího řádu D 3 f (x, y)(ξ, η) = 3 f x 3 ξ3 + 3 3 f x y ξ η + 3 3 f x y ξη + 3 f y 3 η3 a obecně D k f (x, y)(ξ, η) = k l= ( ) k k f l x k l y l ξk l η l.
Theorem Nechť f : E n R je k krát diferencovatelná funkce v okolí O δ (x) bodu x E n. Pro každý přírůstek v R n s velikostí v < δ pak existuje číslo θ takové, že f (x + v) = f (x) + D f (x)(v) + + + k! Dk f (x + θ v)(v). (k )! Dk f (x)(v)
Theorem Nechť f : E n R je k krát diferencovatelná funkce v okolí O δ (x) bodu x E n. Pro každý přírůstek v R n s velikostí v < δ pak existuje číslo θ takové, že f (x + v) = f (x) + D f (x)(v) + + + k! Dk f (x + θ v)(v). (k )! Dk f (x)(v) Náznak důkazu: Pro přírůstek v R n volíme c(t) = x + tv v E n a zkoumáme ϕ : R R definovanou složením ϕ(t) = f c(t). Taylorova věta pro funkce jedné proměnné říká: ϕ(t) = ϕ() + ϕ ()t + + (k )! ϕ(k ) ()t k + k! ϕ(k) (θ)t k. Zbývá nám tedy jen ověřit, že postupným derivováním složené funkce ϕ dostaneme právě požadovaný vztah. To lze provést indukcí přes řád k.
Definition Vnitřní bod x E n definičního oboru funkce f je (lokálním) maximem nebo minimem, jestliže existuje jeho okolí U takové, že pro všechny body x U splňuje funkční hodnota f (x) f (x ) nebo f (x) f (x ). Pokud nastává v předchozích nerovnostech ostrá nerovnost pro všechny x x, hovoříme o ostrém extrému. Vnitřní bod x E n definičního oboru funkce f, ve kterém je diferenciál df (x) nulový nazýváme stacionární bod funkce f.
Definition Vnitřní bod x E n definičního oboru funkce f je (lokálním) maximem nebo minimem, jestliže existuje jeho okolí U takové, že pro všechny body x U splňuje funkční hodnota f (x) f (x ) nebo f (x) f (x ). Pokud nastává v předchozích nerovnostech ostrá nerovnost pro všechny x x, hovoříme o ostrém extrému. Vnitřní bod x E n definičního oboru funkce f, ve kterém je diferenciál df (x) nulový nazýváme stacionární bod funkce f. Nutnou podmínkou pro existenci maxima nebo minima v bodě x je vymizení diferenciálu v tomto bodě, tj. df (x ) =. Skutečně, pokud je df (x ), pak existuje směr v, ve kterém je d v f (x ). Pak ovšem nutně je podél přímky x + tv na jednu stranu od bodu x hodnota funkce roste a na druhou klesá.
Uvažme funkci f (x, y) = sin(x) cos(y), která připomíná známá kartonová plata na vajíčka,5 -,5-4 6 8 8 6 4
Spočtěme si první a poté druhé derivace: f x (x, y) = cos(x) cos(y), f y (x, y) = sin(x) sin(y), takže obě derivace budou nulové pro dvě sady bodů cos(x) =, sin(y) =, to je (x, y) = ( k+ π, lπ), pro libovolné k, l Z cos(x) =, sin(y) =, to je (x, y) = (kπ, l+ π), pro libovolné k, l Z.
Spočtěme si první a poté druhé derivace: f x (x, y) = cos(x) cos(y), f y (x, y) = sin(x) sin(y), takže obě derivace budou nulové pro dvě sady bodů cos(x) =, sin(y) =, to je (x, y) = ( k+ π, lπ), pro libovolné k, l Z cos(x) =, sin(y) =, to je (x, y) = (kπ, l+ π), pro libovolné k, l Z. Druhé parciální derivace jsou ( ) ( ) fxx f Hf (x, y) = xy sin(x) cos(y) cos(x) sin(y) (x, y) = cos(x) sin(y) sin(x) cos(y) f xy f yy
V našich dvou sadách bodů ( tedy ) dostáváme následující hessiány: Hf (kπ + π, lπ) = ±, přičemž znaménko + nastává, když parity k a l jsou ( stejné ) a naopak pro, Hf (kπ, lπ + π ) = ±, přičemž znaménko + nastává, když parity k a l jsou stejné a naopak pro.
V našich dvou sadách bodů ( tedy ) dostáváme následující hessiány: Hf (kπ + π, lπ) = ±, přičemž znaménko + nastává, když parity k a l jsou ( stejné ) a naopak pro, Hf (kπ, lπ + π ) = ±, přičemž znaménko + nastává, když parity k a l jsou stejné a naopak pro. Taylorova věta pro řád k = dává okolí stacionárních bodů (x, y ) f (x, y) = f (x, y )+ Hf (x +θ(x x ), y +θ(y y ))(x x, y y ), kde Hf nyní vnímáme jako kvadratickou formu vyčíslenou na přírůstku (x x, y y ).
V našich dvou sadách bodů ( tedy ) dostáváme následující hessiány: Hf (kπ + π, lπ) = ±, přičemž znaménko + nastává, když parity k a l jsou ( stejné ) a naopak pro, Hf (kπ, lπ + π ) = ±, přičemž znaménko + nastává, když parity k a l jsou stejné a naopak pro. Taylorova věta pro řád k = dává okolí stacionárních bodů (x, y ) f (x, y) = f (x, y )+ Hf (x +θ(x x ), y +θ(y y ))(x x, y y ), kde Hf nyní vnímáme jako kvadratickou formu vyčíslenou na přírůstku (x x, y y ). Protože naše funkce má spojitý hessián, který je nedegenerovaný, nastane lokální maximum tehdy a jen tehdy, když náš bod (x, y ) patří do první skupiny se stejnými paritami k a l. Když budou parity opačné, pak bod z první skupiny bude naopak bodem lokálního minima.
V našich dvou sadách bodů ( tedy ) dostáváme následující hessiány: Hf (kπ + π, lπ) = ±, přičemž znaménko + nastává, když parity k a l jsou ( stejné ) a naopak pro, Hf (kπ, lπ + π ) = ±, přičemž znaménko + nastává, když parity k a l jsou stejné a naopak pro. Taylorova věta pro řád k = dává okolí stacionárních bodů (x, y ) f (x, y) = f (x, y )+ Hf (x +θ(x x ), y +θ(y y ))(x x, y y ), kde Hf nyní vnímáme jako kvadratickou formu vyčíslenou na přírůstku (x x, y y ). Protože naše funkce má spojitý hessián, který je nedegenerovaný, nastane lokální maximum tehdy a jen tehdy, když náš bod (x, y ) patří do první skupiny se stejnými paritami k a l. Když budou parity opačné, pak bod z první skupiny bude naopak bodem lokálního minima. Naopak, hessián u druhé skupiny bodů se vyčíslí kladně na některých přírůstcích a záporně na jiných. Stejně se proto bude chovat i celá funkce f v okolí.
Definition Kvadratická forma h : E n R je positivně definitní, je-li h(u) > pro všechny u positivně semidefinitní, je-li h(u) pro všechny u V negativně definitní, je-li h(u) < pro všechny u negativně semidefinitní, je-li h(u) pro všechny u V indefinitní, je-li h(u) > a f (v) < pro vhodné u, v V.. semestr metody, které umožňují přímo zjistit, zda daná forma má některou z těchto vlastností.
Theorem Nechť f : E n R je dvakrát spojitě diferencovatelná funkce a x E n nechť je stacionární bod funkce f. Potom f má v x ostré lokální minimum, je-li Hf (x) positivně definitní, f má v x ostré lokální maximum, je-li Hf (x) negativně definitní, 3 f nemá v bodě x lokální extrém je-li Hf (x) indefinitní.
Theorem Nechť f : E n R je dvakrát spojitě diferencovatelná funkce a x E n nechť je stacionární bod funkce f. Potom f má v x ostré lokální minimum, je-li Hf (x) positivně definitní, f má v x ostré lokální maximum, je-li Hf (x) negativně definitní, 3 f nemá v bodě x lokální extrém je-li Hf (x) indefinitní. Všimněme si, že věta nedává žádný výsledek, pokud je hessián funkce ve zkoumaném bodě degenerovaný a přitom není indefinitní. Důvod je opět stejný jako u funkcí jedné proměnné. V takových případech totiž existují směry, ve kterých první i druhá derivace zmizí a my proto v tomto řádu přiblížení neumíme poznat, zda se funkce bude chovat jako t 3 nebo jako ±t 4 dokud nespočteme alespoň v potřebných směrech derivace vyšší.
Plán přednášky Literatura Derivace vyšších řádů Iterované parciální derivace Hessián aproximace. řádu Lokální extrémy funkcí více proměnných 3 Zobrazení mezi euklidovskými prostory Zobrazení a transformace Chain Rule Věta o inverzním zobrazení
Zobrazení F : E n E m je při zvolených kartézských souřadnicích na obou stranách obyčejná m tice F (x,..., x n ) = (f (x,..., x n ),..., f m (x,..., x n )) funkcí f i : E n R. Řekneme, že F je diferencovatelné nebo spojitě diferencovatelné zobrazení, jestliže tuto vlastnost mají všechny funkce f,..., f m.
Zobrazení F : E n E m je při zvolených kartézských souřadnicích na obou stranách obyčejná m tice F (x,..., x n ) = (f (x,..., x n ),..., f m (x,..., x n )) funkcí f i : E n R. Řekneme, že F je diferencovatelné nebo spojitě diferencovatelné zobrazení, jestliže tuto vlastnost mají všechny funkce f,..., f m. Diferencovatelná zobrazení F : E n E n, která mají inverzní zobrazení G : E n E n definované na celém svém obrazu, se nazývají (diferencovatelné) transformace. Příkladem transformace byl přechod mezi kartézkými a polárními souřadnicemi.
Zobrazení F : E n E m je při zvolených kartézských souřadnicích na obou stranách obyčejná m tice F (x,..., x n ) = (f (x,..., x n ),..., f m (x,..., x n )) funkcí f i : E n R. Řekneme, že F je diferencovatelné nebo spojitě diferencovatelné zobrazení, jestliže tuto vlastnost mají všechny funkce f,..., f m. Diferencovatelná zobrazení F : E n E n, která mají inverzní zobrazení G : E n E n definované na celém svém obrazu, se nazývají (diferencovatelné) transformace. Příkladem transformace byl přechod mezi kartézkými a polárními souřadnicemi. Lineární zobrazení D f i (x) : R n R lineárně aproximují přírůstky f i.
Definition df (x) D df (x) F (x) =. =. df m (x) f f x f f x f m x f x n f x n x... x........ f m x... f m x n (x) se nazývá Jacobiho matice zobrazení F v bodě x. Lineární zobrazení D F (x) definované na přírůstcích v = (v,..., v n ) pomocí stejně značené Jacobiho matice nazýváme diferenciál zobrazení F v bodě x z definičního oboru, jestliže lim v ( F (x + v) F (x) D F (x)(v) ) =. v
Důsledek Věty o existenci diferenciálu pro funkce n proměnných je: Theorem Nechť F : E n E m je zobrazení, jehož všechny souřadné funkce mají spojité parciální derivace v okolí bodu x E n. Pak existuje diferenciál D F (x) zadaný Jacobiho maticí.
Theorem Nechť F : E n E m a G : E m E r jsou dvě diferencovatelná zobrazení, přičemž definiční obor G obsahuje celý obor hodnot F. Pak také složené zobrazení G F je diferencovatelné a jeho diferenciál je v každém bodě z definičního obodu F kompozicí diferenciálů D (G F )(x) = D G(F (x)) D F (x). Příslušná Jacobiho matice je dána součinem příslušných Jacobiho matic.
Polární souřadnice vzniknou z kartézských transformací F : R R, kterou v souřadnicích (x, y) a (r, ϕ) zapíšeme: r = x + y, ϕ = arctan y x.
Polární souřadnice vzniknou z kartézských transformací F : R R, kterou v souřadnicích (x, y) a (r, ϕ) zapíšeme: r = x + y, ϕ = arctan y x. Funkci g t : E R v polárních souřadnicích g(r, ϕ, t) = sin(r-t). Funkce nám docela dobře přibližuje vlnění povrchu hladiny po bodovém vzruchu v počátku v čase t:
Derivace v kartézských souřadnicích: g x g r g (x, y, t) = (r, ϕ) (x, y) + r x ϕ (r, ϕ) ϕ(x, y) x = cos( x + y x t) x + y + a podobně g y g r g (x, y, t) = (r, ϕ) (x, y) + r y ϕ (r, ϕ) ϕ(x, y) y = cos( x + y y t) x + y.
Theorem Nechť F : E n E n je spojitě diferencovatelné zobrazení na nějakém okolí bodu x E n a nechť je Jacobiho matice D f (x ) invertibilní. Pak na nějakém okolí bodu x existuje inverzní zobrazení F a jeho diferenciál v bodě F (x ) je inverzním zobrazením k D F (x ), tzn. je zadán inverzní maticí k Jacobiho matici zobrazení F v bodě x.