JakfungujeGoogle?-obsah Kapitola 5 JakfungujeGoogle? Počítá vlastní vektory matice webu Perronova-Frobeniova teorie 5-1 Jak funguje Google? 5-2 Jak porovnat důležitost stránek Příklad grafu webu důležitost stránky je přímo úměrná součtu důležitostí stránek, které na ni odkazují zdánlivě definice kruhem jak zaznamenat, které stránky na které dokazují? maticewebuh= (h ij ) Jak funguje Google? 5-3 Jak funguje Google? 5-4
Definice důležitosti stránek JakávlastníčíslaavlastnívektorymámaticewebuH? neznámoudůležitosti-téstránkyoznačímex i,i =1,2,...,N N je počet stránek, které Google indexuje slovní definici důležitost i-té stránky je přímo úměrná součtu důležitostí stránek, které na ni odkazují zapíšeme jako Hjereálnámatice má tedy N komplexních vlastních čísel včetně algebraických násobností definice: spektrální poloměr komplexní čtvercové matice A je ρ(a) =max{ λ : λjevlastníčíslomaticea} 0 H = (h ij )jenezápornámatice,tj.každýprvekh ij 0 Jak funguje Google? 5-5 Jak funguje Google? 5-6 Perronova-Frobeniova teorie nezáporných matic Perronova-Frobeniova věta je-lia = (a ij )reálnánezápornámaticeřádun,prokteroujea k kladnápronějakék N,pakplatí 1.spektrálnípoloměr ρ(a) >0 2. spektrální poloměr ρ(a) je(kladné) vlastní číslo matice A 3. algebraická(a tedy také geometrická) násobnost ρ(a) je 1 4.existujekladnývlastnívektorx = (x 1,x 2,...,x n ) T příslušný ρ(a) 5. vlastní vektor x příslušný ρ(a) a splňující x 1 =x 1 +x 2 + +x n =1jeurčenýjednoznačně, Perronův vektor Široké možnosti použití jak porovnávat výkonnost fotbalových týmů? jak porovnávat výkonnost tenisových hráček? coznamenápředpoklad,žea k >0pronějakék? Jak funguje Google? 5-7 Jak funguje Google? 5-8
Jak vylepšit matici webu- obsah Pravděpodobnost kliku Jakvylepšitmaticiwebu Započtením počtu odkazů na stránce Teleportace Frobeniova teorie stránka, ze které vede spousta odkazů, přispěje důležitosti všech stránek, na které odkazuje, stejně jako stránka, která odkazuje pouze na jednu jinou maticiwebuh= (h 1 h 2 h N )upravímetak,žesloupech j nahradímesloupcem (1/k j )h j,kdek j jepočetodkazůnastráncej novámatices = ((1/k 1 )h 1 (1/k 2 )h 2 (1/k N )h N ) Jak vylepšit matici webu 5-9 Jak vylepšit matici webu 5-10 Další úprava S je stále nezáporná matice, lze použít Perronovu-Frobeniou teorii, pokuds k jekladnápronějakék matices = (s ij )říká,žezestránkyjpřeskočímnastránkuis pravděpodobnostís ij nulové sloupce v matici S jsou nevýhodou- nějakou důležitost mají,alenedělíseonisostatnímistránkami proto ještě v matici S nahradíme nulové sloupce sloupci (1/N)1, kde1 = (1,1,...,1) N Stochastické matice maticesjenezáporná,navícmákaždýsloupecsoučet1 takovým maticím se říká stochastické lze je interpretovat jako matici náhodné procházky po webu zvolím-lisipočátečnístránkuispravděpodobnostíp 0i,pakto,kde se nacházím na začátku klikání je popsáno počátečním vektorem p k =S k p 0 pakudává p 0 = (p 01,p 02,...,p 0N ) T Jak vylepšit matici webu 5-11 Jak vylepšit matici webu 5-12
Teleportace zůstáváproblémspředpokladem,žes k jekladnápronějakék N zakladatelé Googlu jej vyřešili teleportací řeklisi,ženáhodnýchodecpowebuklikánaodkazyv90% případů a v 10% prostě přeskočí na jakoukoliv jinou stránku to znamená, že matici S nahradili maticí G =0,9S +0,1 (1/N)1 1 T Frobeniova teorie kladných matic matice G je stále stochastická, navíc má všechny prvky kladné Frobeniova věta je-lia = (a ij )kladnámaticeřádun,pakplatí 1.spektrálnípoloměr ρ(a) =1 2. spektrální poloměr 1 je vlastní číslo matice A 3. algebraická(a tedy také geometrická) násobnost ρ(a) je 1 4.existujekladnývlastnívektorx = (x 1,x 2,...,x n ) T příslušný ρ(a) 5. vlastní vektor x příslušný ρ(a) a splňující x 1 =x 1 +x 2 + +x n =1jeurčenýjednoznačně, Perronův vektor 6.projakékolivjinévlastníčíslo λ 1maticeAplatí λ <1 Jak vylepšit matici webu 5-13 Jak vylepšit matici webu 5-14 Geometrická intuice za Frobeniovou větou Mocninná metoda- obsah Mocninnámetoda Jak spočítat Perronův vektor Výhody mocninné metody Jak vylepšit matici webu 5-15 Mocninná metoda 5-16
Mocninná metoda 1 Mocninná metoda 2 matici G chápeme jako matici nad komplexními čísly je diagonalizovatelná jako komplexní matice mávlastníčísla λ 1 =1, λ 2,...,λ N (salgebraickýminásobnostmi) přepokládáme λ 1 =1> λ 2 λ 3 λ N v C N existujebázeu 1,u 2,u 3,...,u N zvlastníchvektorů počátečnístavp 0 vyjádřímejako p 0 =a 1 u 1 +a 2 u 2 +a 3 u 3 + +a N u N potom p k =G k p 0 =a 1 λ k 1u 1 +a 2 λ k 2u 2 +a 3 λ k 3u 3 + +a N λ k N u N to znamená, že p k konvergujepro k k rychlost konergence závisí na Googleuvádí,žemustačímezi50a80iteracemi Mocninná metoda 5-17 Mocninná metoda 5-18 Proč mocninná metoda funguje pro tak velkou matici 1.maticiGnenínutnéukládatcelou 2.stačíuložitpouzeH 3. tu lze dobře komprimovat 4.přivýpočtusematiceH(neboG)nemění 5.jedinýmezivýpočet,kterýjetřebadočasněuložit,jep i Mocninná metoda 5-19