2. Schurova věta Petr Tichý 3. října 2012 1
Podobnostní transformace a výpočet vlastních čísel Obecný princip: Úloha: Řešíme-li matematickou úlohu, je často velmi vhodné hledat její ekvivalentní formulaci tak, aby se řešení úlohy podstatně zjednodušilo či se stalo zjevným. Řešení úlohy pak spočívá v nalezení vhodné transformace úlohy. Schurova věta je ilustrativním příkladem. Uvažujme matici A C n n a úlohu nalezení jejího spektra. Podobnostní transformace pomocí regulární matice S, B = S 1 A S, zachovává Jordanův kanonický tvar, tj. i spektrum. Jak volit regulární matici transformace S? 3
Praktické výpočty Vstupní data zatížena chybami. A obsahuje kromě původních dat  rovněž chyby reprezentované maticí chyb E, A =  + E. Pak ve skutečnosti hledáme podobnostní transformaci B = S 1 A S = S 1  S + S 1 E S B je podobná  až na transformovanou matici chyb S 1 ES. Její normu pro jednoduchost charakterizujeme odhadem S 1 E S κ(s) E Je-li κ(s) = S S 1 1, může podobnostní transformace výrazně zvětšit chyby obsažené ve vstupních datech. 4
Jaké podobnostní transformace používat? ortogonální, unitární B = S 1 A S. Při κ(s) 1 může dojít k výraznému zvětšení chyb na úkor vlastních dat vypovídajících o dané úloze. Vlastní čísla matice B se v takovém případě mohou lišit od vlastních čísel matice  mnohem podstatněji, než by odpovídalo původním chybám dat E. Je velice důležité používat pouze takové podobnostní transformace, které velikosti chyb výrazně nezvětší, κ(s) 1. Příkladem takových transformací jsou unitární transformace. 5
Unitární (ortogonální) transformace Řekneme, že čtvercová matice U je unitární, jestliže U U = UU = I, kde I je jednotková matice. Unitární transformace jsou transformace realizované unitárními maticemi. Transformace  + E pomocí unitární matice S, platí S 1 ES = S ES = E. Výpočetní postup by neměl zvyšovat neurčitost výsledku nad neurčitost vstupních dat. V kapitole o singulárním rozkladu ukážeme, že κ(s) = 1 S je násobek unitární matice. 6
Na jaký tvar transformovat matici A abychom mohli z tvaru vyčíst vlastní čísla? B = S 1 AS Jordanův kanonický tvar podstatný praktický problém: transformace může být velmi špatně podmíněna. Postačí, když B bude v horním trojúhelníkovém tvaru vlastní čísla jsou na diagonále. Dva požadavky: 1 Transformace musí vynulovat všechny poddiagonální prvky. 2 Transformace nesmí zvýšit neurčitost výsledku nad neurčitost obsaženou v původních datech: omezení se na unitární podobnostní transformace. Lze obecnou matici transformovat pomocí unitárních podobnostních transformací na matici v horním trojúhelníkovém tvaru? 7
Schurova věta Schurova věta Pro libovolnou čtvercovou matici A existuje unitární matice U tak, že matice R = U A U je horní trojúhelníková s vlastními čísly matice A na diagonále v libovolném předepsaném pořadí. Důkaz: Indukcí podle řádu matice A. Pro matice řádu n = 1 věta platí. n n + 1: Nechť A C (n+1) (n+1), nechť je dáno uspořádání vlastních čísel matice A. Označme λ první vlastní číslo v tomto uspořádání, nechť x je odpovídající normalizovaný vlastní vektor, Ax = λx, x = 1. 9
Důkaz Schurovy věty Doplňme x na čtvercovou unitární matici, H = [x, X]. Platí [ ] [ ] H x A H = Ax x AX λ b X Ax X =, AX 0 C neboť x Ax = λx x = λ a X Ax = λx x je nulový vektor. Dle indukčího předpokladu existuje unitární matice V taková, že V CV je horní trojúhelníková matice s vlastními čísly na diagonále v předepsaném pořadí. Položíme-li [ ] 1 0 U = [x, XV ] = H, 0 V pak R = U AU = je hledaný rozklad. [ 1 0 0 V ] [ λ b 0 C ] [ 1 0 0 V ] = [ λ b V 0 V CV ] 10
Schurův rozklad, Schurova transformace R = U AU A = UR U. Definice: Rozklad A = UR U budeme nazývat Schurovým rozkladem matice A. Matici R nazveme výsledkem Schurovy transformace matice A. Schurův rozklad velmi důležitý, základ algoritmů pro výpočet vlastních čísel matic, funkcí matic aj. Lze jej spočíst (aproximovat) numericky stabilním způsobem (používáme unitární transformace). 11
Výpočet Schurova rozkladu Schurův rozklad nelze obecně vypočítat konečným algoritmem Problém hledání vlastních čísel matice lze převést na problém hledání kořenů polynomu. Vlastní čísla matice lze nalézt jako kořeny jejího charakteristického polynomu a naopak, pro každý polynom existuje jeho přidružená (companion) matice taková, že její vlastní čísla jsou rovna kořenům daného polynomu. Existuje vzorec, který pro obecný polynom libovolného řádu určí s použitím +,,, / a jeho kořeny? Věta (Abel, Galois) Obecná polynomiální rovnice n-tého stupně není pro n 5 řešitelná v radikálech. Důsledek: Vlastní čísla matice řádu n 5 nelze obecně na počítači spočíst v konečném počtu kroků. Následkem toho nelze ani Schurův rozklad obecně vypočítat konečným algoritmem. 12
Důsledky Schurovy věty Spektrální rozklad pro normální matice Definice: Čtvercová matice A se nazývá normální, komutuje-li se svojí maticí hermitovsky sdruženou, tj. platí-li A A = A A Věta (Spektrální věta pro normální matice) Matice A je normální právě tehdy, když existuje unitární matice U a diagonální matice D tak, že U A U = D, neboli A = UD U. Důkaz: Pokud A = UD U pak A je normální: A A = UD U UD U = UD D U = A A. Indukcí: n n + 1. Dle Schurovy věty existuje unitární matice V a horní trojúhelníková matice R tak, že A = V R V, tj. A = V R V. 14
Spektrální věta pro normální matice Důkaz, část II A A = AA R R = R R, tedy R je rovněž normální matice. Označme [ ] ρ r T R =, 0 R 1 kde ρ C, r C n, R 1 C n n. Potom R R = R R [ ] [ ] [ ] [ ] ρ r T ρ 0 ρ 0 ρ r T 0 R 1 r R1 = r R1. 0 R 1 Prvek na pozici (1, 1) ρ 2 + r 2 = ρ 2 r = 0. Prvky na (blokové) pozici (2, 2): R 1 R1 = R1R 1 R 1 je normální. 15
Spektrální věta pro normální matice Důkaz, část III Podle indukčního předpokladu existuje unitární matice V 1 tak, že V1 R 1V 1 je diagonální matice D 1. Matici R lze tedy napsat ve tvaru R = [ ρ 0 0 V 1 D 1 V 1 ] = [ 1 0 0 V 1 ] [ ρ 0 0 D 1 ] [ 1 0 0 V 1 ]. Označíme-li [ 1 0 ] [ ρ 0 ] U V 0 V 1, D 0 D 1, zřejmě platí A = V R V = V [ 1 0 0 V 1 ] [ ρ 0 0 D 1 ] [ 1 0 0 V 1 ] V = UD U, což dává hledaný rozklad. 16
Důsledky A je normální právě tehdy, pokud existují unitární matice U a diagonální matice D tak, že A U = UD. Označme D = diag(λ 1,..., λ n ). Rozepíšeme-li maticovou rovnost po sloupcích, dostaneme Au j = λ j u j, j = 1,..., n. Sloupce matice U jsou normalizované vlastní vektory matice A a prvky na diagonále matice D jsou vlastní čísla matice A. Vlastnosti spektrálního rozkladu normální matice Matice A C n n je normální právě tehdy, pokud existuje ortogonální báze prostoru C n složená z vlastních vektorů matice A. 17
Dyadický rozklad (rozvoj) normální matice Součin dvou matic lze zapsat pomocí vnějšího součinu. Potom n A = UD U = λ i u i u i, i=1... dyadický rozklad (rozvoj) normální matice A. Z definice spektrální normy platí λ i u i u i = λ i, i = 1,..., n. Pro Frobeniovu normu normální matice platí n A 2 F = λ i 2 (cvičení). i=1 18
Příklady normálních matic Unitární a hermitovské matice Důležité třídy normálních matic: unitární a hermitovské. Věta o unitárních a hermitovských maticích (cvičení) Matice A je unitární právě tehdy, je-li normální a její vlastní čísla leží na jednotkové kružnici. Matice A je hermitovská právě tehdy, je-li normální a všechna její vlastní čísla jsou reálná. Třída normálních matic je totožná s třídou matic, které lze unitární podobnostní transformací převést na diagonální tvar. Nepožadujeme-li, aby matice realizující podobnostní transformaci byla unitární, dostaneme třídu diagonalizovatelných matic: Matici A nazveme diagonalizovatelnou, jestliže existuje regulární matice S taková, že S 1 A S = D, kde D je diagonální matice. 19
Diagonalizovatelné matice tj. S 1 A S = D, A S = SD. S regulární Vlastní vektory rovněž tvoří bázi prostoru C n. Tato báze může být špatně podmíněná. Není-li matice diagonalizovatelná defektní matice. Lze každou matici libovolně blízko aproximovat pomocí matice diagonalizovatelé? Ano. Množina diagonalizovatelných matic je hustá v C n n. 20
Aproximace libovolné matice pomocí diagonalizovatelné Věta o hustotě diagonalizovatelných matic Pro libovolnou matici A C n n a pro libovolně malé ǫ > 0 existuje diagonalizovatelná matice A ǫ C n n s navzájem různými vlastními čísly tak, že A A ǫ < ǫ. Důkaz: Pomocí Schurovy věty. A = UR U. Není-li matice A diagonalizovatelná alespoň jedno násobné vlastní číslo. Stačí porušit diagonálu matice R pomocí diagonální matice D ǫ tak, aby na perturbované diagonále byly různé hodnoty a zároveň Zvolíme-li D ǫ < ǫ a R ǫ = R + D ǫ. A ǫ UR ǫ U, má matice A ǫ různá vlastní čísla diagonalizovatelná a platí A A ǫ = UR U U(R+D ǫ )U = UD ǫ U = D ǫ < ǫ. 21
Třídy matic v C n n 22
Reálný Schurův rozklad Schurův rozklad obecně komplexní i pro reálné matice. Motivace přechod do komplexní aritmetiky co nejvíce oddálit. Pro reálné matice - snaha přiblížit se Schurovu rozkladu a zároveň dosáhnout toho, aby výsledné faktory zůstaly reálné. Pro reálné symetrické matice lze přímo Schurův rozklad volit reálný. Definice: Řekneme, že čtvercová reálná matice U je ortogonální, jestliže U T U = UU T = I, kde I je jednotková matice. Ortogonální transformace jsou transformace realizované ortogonálními maticemi. 24
Věta o spektrálním rozkladu pro reálné symetrické matice Nechť A je reálná symetrická matice. Potom existují ortogonální matice U a reálná diagonální matice D takové, že D = U T AU. Definice: Čtvercová matice T je horní kvazi-trojúhelníková, pokud je blokově horní trojúhelníková, kde každý blok na hlavní diagonále je buď 1 1 nebo 2 2, T 1,1 T 1,2... T 1,m 0 T 2,2 T 2,m T =......... 0... 0 T m,m Reálný Schurův rozklad pro obecné pro reálné matice Nechť A je reálná čtvercová matice. Potom existují ortogonální matice U a reálná kvazi-trojúhelníková matice T takové, že T = U T AU. Navíc vlastní čísla každého 2 2 diagonálního bloku matice T tvoří komplexně sdružený pár. 25
Funkce matic pro normální matice Jak vhodně zobecnit funkci f : C C na funkci, která dané matici A C n n přiřadí matici f(a) stejné dimenze? Nechť A je normální ( A = UDU, D = diag(λ 1,..., λ n )) a f je analytická. Pak je možné definovat funkci matice pomocí Taylorovy řady f (i) (0) f(z) = z i, i! i=0 kde za proměnnou z dosadíme matici A, tj. ( f (i) (0) f(a) A i f (i) (0) = U i! i! i=0 i=0 = Uf(D)U = U f(λ 1 ) D i )... f(λn) U U. 27
Funkce matic pro obecné matice Lze definovat např. pomocí Jordanova kanonického tvaru s r bloky velikosti n 1,..., n r jako f(a) Sf(J)S 1 = S diag(f(j n1 (λ 1 )),..., f(j nr (λ r ))) S 1. V případě, že A není diagonalizovatelná, zbývá definovat vhodně funkci Jordanova bloku f(j nj (λ j )) pro j = 1,..., r. S využitím Taylorovy řady rozvinuté v λ j lze ukázat f(λ j ) f (λ j )... (n j 1)!. f(λ j )... f(j nj (λ j )) =... f (λ j ) f(λ j ) f (n j 1) (λ j ). 28
Cvičení 2.4 Nechť U C n n je unitární matice. Dokažte, že pro všechny vektory x C n, y C n platí Ux, Uy = x, y, Ux = x. 2.5 Dokažte větu: Čtvercová matice je unitární právě tehdy, když je normální a její vlastní čísla leží na jednotkové kružnici. Čtvercová matice je hermitovská právě tehdy, když je normální a všechna její vlastní čísla jsou reálná. 2.6 Dokažte přímo z definice generované maticové normy, že pro matice λ i u i u i, platí λ iu i u i = λ i. Jak vypadají prvky matice u i u i a jaká je její hodnost? 30
Cvičení 2.7 Ukažte pomocí spektrální věty o normálních maticích aplikované na matici A A, že spektrální normu libovolné matice A C n m lze vypočítat pomocí vzorce A = (A A) 1/2, kde (B) označuje spektrální poloměr matice B. 2.9 Ukažte, že pro unitární matici U C n n a libovolnou matici A C n n platí U = 1, U = 1, UA = A, AU = A, UA F = A F, AU F = A F. 2.10 Dokažte, že pro normální matici A platí n A 2 F = λ i 2, kde sp(a) = {λ 1,..., λ n }. i=1 31