Ortogonální projekce a ortogonální zobrazení

Drsná matematika I 9. přednáška Ortogonální projekce a ortogonální zobrazení Jan Slovák Masarykova univerzita Fakulta informatiky 27. 4. 2010

Obsah přednášky 1 Literatura 2 Projekce a ortogonální zobrazení 3 Struktura ortogonálních zobrazení

Plán přednášky 1 Literatura 2 Projekce a ortogonální zobrazení 3 Struktura ortogonálních zobrazení

Kde je dobré číst? vlastní poznámky, texty současného nebo předcházejícího přednášejícího, GOOGLE, atd.

Kde je dobré číst? vlastní poznámky, texty současného nebo předcházejícího přednášejícího, GOOGLE, atd. Pavel Horák, Úvod do lineární algebry, MU Brno, skripta. Luboš Motl, Miloš Zahradník, Pěstujeme lineární algebru, 3. vydání, Univerzita Karlova v Praze, Karolinum, 348 stran (elektronické vydání také na http://www.kolej.mff.cuni.cz/ lmotm275/skripta/). Riley, K.F., Hobson, M.P., Bence, S.J. Mathematical Methods for Physics and Engineering, second edition, Cambridge University Press, Cambridge 2004, ISBN 0 521 89067 5, xxiii + 1232 pp. František Šik, Lineární algebra zaměřená na numerickou analýzu, MU, 1998, 176 s. ISBN 80-210-1996-2.

Lineární zobrazení f : V V se nazývá projekce, jestliže platí f f = f. V takovém případě je pro každý vektor v V v = f (v) + (v f (v)) Im(f ) + Ker(f ) = V a je-li v Im(f ) a f (v) = 0, pak je i v = 0. Je tedy přechozí součet podprostorů přímý. Říkáme, že f je projekce na podprostor W = Im(f ) podél podprostoru U = Ker(f ). Slovy se dá projekce popsat přirozeně takto: rozložíme daný vektor na komponentu ve W a v U a tu druhou zapomeneme.

Předpokládejme nyní, že na V je definován skalární součin. Pro každý pevně zvolený podprostor W V definujeme jeho ortogonální doplněk W = {u V ; u, v = 0 pro všechny v W }. Přímo z definice je zjevné, že W je vektorový podprostor. Jestliže W V má bázi (u 1,..., u k ) je podmínka pro W dána jako k homogenních rovnic pro n proměnných. Bude tedy mít W dimenzi alespoň n k. Zároveň ale u W W znamená u, u = 0 a tedy i u = 0 podle definice skalárního součinu. Zřejmě je tedy vždy V = W W. Každý podprostor W V definuje kolmou projekci na W. Je to projekce na W podél W.

Existence ortonormální báze Přímočaré početní využití kolmých projekcí vede k tzv. Grammovu Schmidtovu ortogonalizačnímu procesu. Cílem procedury je z dané posloupnosti nenulových generátorů v 1,..., v k konečněrozměrného prostoru V vytvořit ortogonální množinu nenulových generátorů pro V.

Existence ortonormální báze Přímočaré početní využití kolmých projekcí vede k tzv. Grammovu Schmidtovu ortogonalizačnímu procesu. Cílem procedury je z dané posloupnosti nenulových generátorů v 1,..., v k konečněrozměrného prostoru V vytvořit ortogonální množinu nenulových generátorů pro V. Začneme prvním (nenulovým) vektorem v 1 a spočteme kolmou projekci v 2 do v 1 {v 1, v 2 }. Výsledek bude nenulový právě, když je v 2 nezávislé na v 1. Ve všech dalších krocích budeme postupovat obdobně.

Existence ortonormální báze Přímočaré početní využití kolmých projekcí vede k tzv. Grammovu Schmidtovu ortogonalizačnímu procesu. Cílem procedury je z dané posloupnosti nenulových generátorů v 1,..., v k konečněrozměrného prostoru V vytvořit ortogonální množinu nenulových generátorů pro V. Začneme prvním (nenulovým) vektorem v 1 a spočteme kolmou projekci v 2 do v 1 {v 1, v 2 }. Výsledek bude nenulový právě, když je v 2 nezávislé na v 1. Ve všech dalších krocích budeme postupovat obdobně. V l-tém kroku tedy chceme, aby pro v l+1 = u l+1 + a 1 v 1 + + a l v l platilo v l+1, v i = 0, pro všechny i = 1,..., l. Odtud plyne 0 = u l+1 + a 1 v 1 + + a l v l, v i = u l+1, v i + a i v i, v i a je vidět, že vektory s požadovanými vlastnostmi jsou určeny

Dokázali jsme tedy následující tvrzení: Theorem Nechť (u 1,..., u k ) je lineárně nezávislá k-tice vektorů prostoru V se skalárním součinem. Pak existuje ortogonální systém vektorů (v 1,..., v k ) takový, že v i u 1,..., u i, i = 1,..., k. Získáme je následující procedurou: Z nezávislosti vektorů u i plyne u 1 0. Položíme v 1 = u 1. Máme-li již vektory v 1,..., v l potřebných vlastností klademe v l+1 = u l+1 + a 1 v 1 + + a l v l, a i = u l+1, v i v i 2

Kdykoliv máme ortogonální bázi vektorového prostoru V, stačí vektory vynormovat a získáme bázi ortonormální. Dokázali jsme proto také: Corollary Na každém vektorovém prostoru se skalárním součinem existuje ortonormální báze.

Kdykoliv máme ortogonální bázi vektorového prostoru V, stačí vektory vynormovat a získáme bázi ortonormální. Dokázali jsme proto také: Corollary Na každém vektorovém prostoru se skalárním součinem existuje ortonormální báze. V ortonormální bázi se obzvlášť snadno spočtou souřadnice a kolmé projekce. Skutečně, mějme ortonormální bázi (e 1,..., e n ) prostoru V. Pak každý vektor v = x 1 e 1 + + x n e n splňuje a platí tedy vždy e i, v = e i, x 1 e 1 + + x n e n = x i v = e 1, v e 1 + + e n, v e n.

Pokud máme zadán podprostor W V a jeho ortonormální bázi (e 1,..., e k ), jde ji jistě doplnit na ortonormální bázi (e 1,..., e n ) celého V. Kolmá projekce obecného vektoru v V do W pak bude dána vztahem v e 1, v e 1 + + e n, v e k. Pro kolmou projekci nám tedy stačí znát jen ortonormání bázi podprostoru W, na nejž promítáme.

Pokud máme zadán podprostor W V a jeho ortonormální bázi (e 1,..., e k ), jde ji jistě doplnit na ortonormální bázi (e 1,..., e n ) celého V. Kolmá projekce obecného vektoru v V do W pak bude dána vztahem v e 1, v e 1 + + e n, v e k. Pro kolmou projekci nám tedy stačí znát jen ortonormání bázi podprostoru W, na nejž promítáme. Povšimněme si také, že obecně jsou projekce f na podprostor W podél U a projekce g na U podél W svázány vztahem g = id V f. Je tedy u kolmých projekcí na daný podprostor W vždy výhodnější počítat ortonormální bázi toho z dvojice W, W, který má menší dimenzi.

Ortogonální zobrazení Zobrazení f : V W, které zachovává velikosti pro všechny vektory u V, se nazývá ortogonální zobrazení. Požadujeme tedy f (u), f (u) = u, u.

Ortogonální zobrazení Zobrazení f : V W, které zachovává velikosti pro všechny vektory u V, se nazývá ortogonální zobrazení. Požadujeme tedy f (u), f (u) = u, u. Z linearity f a symetrie skalárního součinu plyne f (u + v), f (u + v) = f (u), f (u) + f (v), f (v) + 2 f (u), f (v), je tedy ekvivalentní podmínkou i zdánlivě silnější požadavek, aby pro všechny vektory u, v V. f (u), f (v) = u, v,

Obecně, ortogonální zobrazení musí vždycky být injektivní, protože podmínka f (u), f (u) = 0 znamená i u, u = 0 a tedy u = 0. Je tedy vždy v takovém případě dimenze oboru hodnot alespoň taková, jako je dimenze definičního oboru f.

Obecně, ortogonální zobrazení musí vždycky být injektivní, protože podmínka f (u), f (u) = 0 znamená i u, u = 0 a tedy u = 0. Je tedy vždy v takovém případě dimenze oboru hodnot alespoň taková, jako je dimenze definičního oboru f. Bez újmy na obecnost proto můžeme rovnou předpokládat, že jsou stejné a f : V V (pokud by nebyly, doplníme ortonormální bázi na oboru hodnot.

Obecně, ortogonální zobrazení musí vždycky být injektivní, protože podmínka f (u), f (u) = 0 znamená i u, u = 0 a tedy u = 0. Je tedy vždy v takovém případě dimenze oboru hodnot alespoň taková, jako je dimenze definičního oboru f. Bez újmy na obecnost proto můžeme rovnou předpokládat, že jsou stejné a f : V V (pokud by nebyly, doplníme ortonormální bázi na oboru hodnot. Naše podmínka pro matici ortogonálního zobrazení v ortonormální bázi pak říká pro všechny vektory x a y v prostoru K n : (A x) T (A y) = x T (A T A) y = x T y. Speciálními volbami vektorů standardní báze za x a y dostaneme přímo, že A T A = E, tedy tentýž výsledek jako v dimenzi 2!

Dokázali jsme tak následující tvrzení: Theorem Nechť V je reálný vektorový prostor se skalárním součinem a f : V V je lineární zobrazení. Pak f je ortogonální právě, když v některé ortonormální bázi (a pak už všech) má matici A splňující A T = A 1.

Dokázali jsme tak následující tvrzení: Theorem Nechť V je reálný vektorový prostor se skalárním součinem a f : V V je lineární zobrazení. Pak f je ortogonální právě, když v některé ortonormální bázi (a pak už všech) má matici A splňující A T = A 1. Skutečně, jestliže zachovává f velikosti, musí mít uvedenou vlastnost v každé ortonormální bázi. Naopak, předchozí výpočet ukazuje, že vlastnost matice v jedné bázi už zaručuje zachovávání velikostí.

Důsledkem této věty je také popis všech matic přechodu S mezi ortonormálními bázemi. Každá totiž musí zadávat zobrazení K n K n zachovávající velikosti a splňují tady také právě podmínku S 1 = S T. Při přechodu od jedné báze ke druhé se tedy matice ortogonálního zobrazení mění podle vztahu A = S T AS.

Příklad. Napište matici zobrazení kolmé projekce do roviny procházející počátkem a kolmé na vektor (1, 1, 1). Příklad. Gramm-Schmidtovým ortogonalizaením procesem nalezněte nějakou ortonormální bázi podprostoru V R 4, kde V = {(x1; x2; x3; x4) R 4 ; x1 + 2x2 + x3 = 0}.

Invariantní podprostory Nechť f : V V je lineární a předpokládejme, že pro nějaký podprostor W V platí f (W ) W. Říkáme, že W je invariantní podprostor pro zobrazení f. Jestliže je V konečněrozměrné a vybereme nějakou bázi (u 1,..., u k ) podprostoru W, můžeme ji vždy doplnit na bázi (u 1,..., u n ) celého V a v každé takové bázi má naše zobrazení matici A tvaru ( ) B C A = (1) 0 D kde B je čtvercová matice dimenze k, D je čtvercová matice dimenze n k a C je matice typu n/(n k). Naopak, jestliže existuje v nějaké bázi matice zobrazení f tvaru (1), je W = u 1,..., u k invariantní podprostor zobrazení f.

Extrémní případy jsme viděli při hledání báze z vlastních vektorů. V případě existence n různých vlastních čísel zobrazení f jsme dostali rozklad V na přímý součet n vlastních podprostorů a v bazích z vlastních vektorů má naše zobrazení diagonální tvar s vlastními čísly na diagonále.

Extrémní případy jsme viděli při hledání báze z vlastních vektorů. V případě existence n různých vlastních čísel zobrazení f jsme dostali rozklad V na přímý součet n vlastních podprostorů a v bazích z vlastních vektorů má naše zobrazení diagonální tvar s vlastními čísly na diagonále. Zároveň jsme viděli dva různé příklady důvodů, proč zobrazení diagonální matici mít nemusí. První souvisel s nilpotentními zobrazeními, druhý s rotacemi v dvourozměrných podprostorech.

Extrémní případy jsme viděli při hledání báze z vlastních vektorů. V případě existence n různých vlastních čísel zobrazení f jsme dostali rozklad V na přímý součet n vlastních podprostorů a v bazích z vlastních vektorů má naše zobrazení diagonální tvar s vlastními čísly na diagonále. Zároveň jsme viděli dva různé příklady důvodů, proč zobrazení diagonální matici mít nemusí. První souvisel s nilpotentními zobrazeními, druhý s rotacemi v dvourozměrných podprostorech. Nejsložitější a úplně obecný popis jsme formulovali jako Jordanův rozklad matice/zobrazení: Nad algebraicky uzavřeným polem skalárů se celý prostor vždy rozloží na invariantní podprostory na kterých je zobrazení dáno tzv. Jordanovými bloky.

Rozklad ortogonálního zobrazení Nechť je zobrazení f : V V ortogonální, s maticí A v nějaké ortonormální bázi.

Rozklad ortogonálního zobrazení Nechť je zobrazení f : V V ortogonální, s maticí A v nějaké ortonormální bázi. Jestliže pro libovolný podprostor W V a ortogonální zobrazení f : V V platí f (W ) W, pak také platí pro všechny v W, w W f (v), w = f (v), f f 1 (w) = v, f 1 (w) = 0 protože i f 1 (w) W. To ale znamená, že také f (W ) W.

Rozklad ortogonálního zobrazení Nechť je zobrazení f : V V ortogonální, s maticí A v nějaké ortonormální bázi. Jestliže pro libovolný podprostor W V a ortogonální zobrazení f : V V platí f (W ) W, pak také platí pro všechny v W, w W f (v), w = f (v), f f 1 (w) = v, f 1 (w) = 0 protože i f 1 (w) W. To ale znamená, že také f (W ) W. Theorem Ortogonální doplněk k invariantnímu podprostoru je také invariantní.

Kdyby byla vlastní čísla ortogonálního zobrazení reálná, zaručovalo by už toto tvrzení, že bude vždy existovat báze V z vlastních vektorů. Skutečně, zúžení f na ortogonální doplněk invariantního podprostoru je opět ortogonální zobrazení, takže můžeme do báze přibírat jeden vlastní vektor za druhým, až dostaneme celý rozklad V.

Kdyby byla vlastní čísla ortogonálního zobrazení reálná, zaručovalo by už toto tvrzení, že bude vždy existovat báze V z vlastních vektorů. Skutečně, zúžení f na ortogonální doplněk invariantního podprostoru je opět ortogonální zobrazení, takže můžeme do báze přibírat jeden vlastní vektor za druhým, až dostaneme celý rozklad V. Nicméně většinou nejsou vlastní čísla ortogonálních zorbazení reálná. Musíme si proto pomoci opět výletem do komplexních vektorových prostorů.

Kdyby byla vlastní čísla ortogonálního zobrazení reálná, zaručovalo by už toto tvrzení, že bude vždy existovat báze V z vlastních vektorů. Skutečně, zúžení f na ortogonální doplněk invariantního podprostoru je opět ortogonální zobrazení, takže můžeme do báze přibírat jeden vlastní vektor za druhým, až dostaneme celý rozklad V. Nicméně většinou nejsou vlastní čísla ortogonálních zorbazení reálná. Musíme si proto pomoci opět výletem do komplexních vektorových prostorů. Theorem Nechť f : V V je ortogonální zobrazení na prostoru se skalárním součinem. Pak všechny kořeny charakteristického polynomu f mají velikost jedna a existuje rozklad V na jednorozměrné vlastní podprostory odpovídající vlastním číslům λ = ±1 a dvourozměrné podprostory P λ, λ, na kterých působí f rotací o úhel rovný argumentu komplexního čísla λ. Všchny tyto různé podprostory jsou po dvou ortogonální.

Náznak důkazu Jestliže považujeme matici A za matici lineárního zobrazení na komplexním prostoru C n (která je jen shodou okolností reálná), budeme mít právě n kořenů charakteristického polynomu, včetně jejich algebraické násobnosti. Navíc, protože charakteristický polynom zobrazení bude mít výhradně reálné koeficienty, budou tyto kořeny buď reálné, nebo půjde o dvojice komplexně sdružených kořenů λ a λ. Příslušné vlastní vektory v C n k takové dvojici vektorů budou také komplexně sdružené, protože budou řešením dvou komplexně sdružených systémů lineárních rovnic.

Označme v λ vlastní vektor příslušný k vlastnímu číslu λ = α + iβ, β 0. Reálný vektorový podprostor P λ generovaný reálnou a imaginární částí x λ = re v λ, y λ = im v λ je zjevně invariantní vůči násobení maticí A a dostáváme A x λ = αx λ βy λ, A y λ = αy λ + βx λ. To ale neznamená nic jiného, než že zúžení našeho zobrazení na P λ je dáno složením rotace o argument vlastní honoty λ (úhel α arccos ) s násobením velikostí vlastní hodnoty λ (skalárem α 2 +β2 α 2 + β 2 ). Protože naše zobrazení zachovává velikosti, musí být velikost vlastní hodnoty λ rovna jedné.

Example V dimenzi tři má charakteristický polynom alespoň jeden reálný kořen, kterým musí být buď jednička nebo mínus jednička. Další dva musí být opět ±1 nebo dva komplexně sdružené nereálné. V posledním případě zadává vlastní vektor odpovídající reálnému vlastnímu číslu osu rotace o argument vlastního čísla druhého. Pokud je reálné vlastní číslo 1, bude navíc ještě uplatněno zrcadlení podle roviny rotace.

Example V dimenzi tři má charakteristický polynom alespoň jeden reálný kořen, kterým musí být buď jednička nebo mínus jednička. Další dva musí být opět ±1 nebo dva komplexně sdružené nereálné. V posledním případě zadává vlastní vektor odpovídající reálnému vlastnímu číslu osu rotace o argument vlastního čísla druhého. Pokud je reálné vlastní číslo 1, bude navíc ještě uplatněno zrcadlení podle roviny rotace. Uvažme tedy zobrazení s maticí ve standardní bázi 0 0 1 f : R 3 R 3, A = 0 1 0. 1 0 0 Dostaneme polynom λ 3 + λ 2 λ + 1 = (λ 1)(λ 2 + 1) s kořeny λ 1 = 1, λ = i a λ = i. Pochopitelně matice zadává rotaci o devadesát stupnů podle osy y.