8. licenční studium Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie MATEMATICKÉ PRINCIPY VÍCEROZMĚRNÉ ANALÝZY DAT Příklady: ) Najděte vlastní (charakteristická) čísla a vlastní vektory matice A 2) Vypočtěte výběrový průměr, Wishartovu matici W a výběrovou kovarianční matici S pro n=4. Kolik různých párových korelačních koeficientů obsahuje korelační matice R. Zpracoval: Ing. Roman Lisztwan V Třinci dne 5.5.200
Příklad č. Najděte vlastní (charakteristická) čísla a vlastní vektory matice A [řádek,sloupec]: A[,] =, A[2,] = -2, A[,2] = -2, A[2,2] =. Přesvědčte se, že jsou vlastní vektory dané matice ortogonální. Existuje matice A -. Je A regulární? Řešení: Cílem je zjistit, zda existují čísla λ a nenulové vektory v tak, aby vektor Av přiřazený k v danou transformací, byl roven λv (aby byl kolineární s původním vektorem v. Z charakteristické rovnice vypočteme vlastní čísla a vlastní vektory matice A. Daná matice má pro libovolné t (různé od nuly) právě dva různé lineárně nezávislé charakteristické vektory, což dokazuje nenulový determinant se souřadnic obou vektorů. Skalární součin vektorů v * v 2 je roven nule, a tudíž jsou vlastní vektory ortogonální. Řada maticových operací se neobejde bez inverzní matice. Nutnou a postačující podmínkou proto, aby existovala k dané čtvercové matici typu n matice inverzní je regulárnost dané matice. Je-li det A různý od 0 (tj. hodnost matice h = n, tzn., že hodnost matice A je číselně rovna maximálnímu možnému počtu lineárně nezávislých řádků matice A) pak matici A můžeme považovat za regulární. K této čtvercové regulární matici A existuje jediná inverzní matice A -, která je také regulární. K určení inverzní matice se využívá adjungované matice. Nalezení vlastních čísel a vlastních vektorů matice A Av = λv (A- λe)v = 0 Rovnici det (λe a) = 0 nazýváme charakteristickou rovnicí matice A. A = -2-2 det A = a. a 22 a 2. a 2 = -3 Výpočet vlastních čísel: A = -λ -2-2 -λ (-λ) 2 4 = 0 λ 2-2λ - 3 = 0 λ = 3 λ 2 = - Výpočet vlastních vektorů: pro λ = 3 pro λ 2 = - A = -2-2 * v = 0 A = 2-2 * v = 0-2 -2 v 2 0-2 2 v 2 0-2 v - 2 v 2 = 0 2 v - 2 v 2 = 0 - v - v 2 = 0 v - v 2 = 0 v = - v 2 v = v 2 v = t, -t v 2 = t, t
2 det V = t -t = 2t 2 0, pro t 0 t t pro t = v =, - v 2 =, Nalezení inverzní matice k matici A A - = /det A. adj A det A = a. a 22 - a 2. a 2 adj A = a 22 - a 2 A = a a 2 - a 2 a a 2 a 22 A - = /3 2 = -/3-2/3 2-2/3 -/3 Závěr: Vlastní vektory matice a jsou ortogonální. K matici A existuje matice inverzní. Matice A je regulární. 2
3 Příklad č.2 Je dán náhodný výběr o rozsahu n = 4. Vypočtěte výběrový průměr, Wishartovu matici W a výběrovou kovarianční matici S. Kolik různých párových korelačních koeficientů obsahuje korelační matice R. Data: V4 (p=2) = x i = x x 2 x 3 x 4 V4 (p=3) = x i = x x 2 x 3 x 4 x j = x 2 x 22 x 23 x 24 x j = x 2 x 22 x 23 x 24 x k = x 3 x 32 x 33 x 44 V4 (p=2) = x i = 0 2 V4 (p=3) = x i = 0 2 x j = 2-2 0 x j = 2-2 0 x k = 2 0 - Řešení: K výpočtu byly použity dva výběry o rozsahu n = 4 pro p = 2 a pro p = 3. U vícerozměrných náhodných veličin lze jednotlivé složky náhodného vektoru x charakterizovat pomocí momentů. K odvození kovariance vyjdeme z charakteristiky variability (disperze) a její vlastnosti. Pomocí Whishartovy matice dospějeme k výběrové kovarianční matici S a následně ke korelační matici R. Kovarianční matice má na diagonále rozptyly a charakterizuje míru intenzity vztahu mezi složkami náhodného vektoru x. Korelační matice má na diagonále jedničky a je zvláštním případem kovariance (normovaná verze kovarianční matice). Pokud je absolutní hodnota párového korelačního koeficientu ρ xi xj rovna pak existuje mezi x i a x j přesně lineární vztah, je-li roven 0 pak x i a x j jsou vzájemně nekorelované. Výpočet pro p = 2 Charakteristika polohy X-střední hodnota: EX Výpočet výběrového průměru x i = /n x i, x j = /n x j Charakteristika variability X-rozptyl: DX=E(X-EX) 2 Výpočet výběrového rozptylu s i 2 = /(n-) (x i - x i ) 2, s j 2 = /(n-) (x j - x j ) 2 Vlastnosti disperze pro p = 2 D(X+Y) = E[(X+Y) E(X+Y)] 2 = E[(X-EX) + (Y-EY)] 2 = E[(X-EX) 2 +2(X-EX)(Y-EY) + (Y-EY) 2 ] = DX + 2E(X-EX)(Y-EY) + DY Charakteristika vztahu mezi X, Y-kovariance: cov(x,y) = E(X-EX)(Y-EY) Výpočet výběrové kovariance s ij = /(n-) (x i - x i )(x j - x j ) Standardizace kovariance - párový korelační koeficient ρ XY = ρ(x,y) = cov(x,y) / σ X σ Y Whishartova matice -W= (x - x)(x - x) T Kovarianční matice - S = W/(n-) 3
4 Whishartova matice -W Kovarianční matice - S Korelační matice - R W = w ii w ji S = s ii s ji R = r ii r ji w ij w jj s ij s jj r ij r jj w ii = (x i - x i ) 2 s ii = /(n-) (x i - x i ) 2 r ii = w jj = (x j - x j ) 2 s ij = /(n-) (x j - x j ) 2 r jj = w ij = w ji = (x i - x i )(x j - x j ) s jj = s ji = /(n-) (x i - x i )(x j - x j ) r ij = r ji = s jj /s ii s ij i,j x - x (x - x) (x - x) T (x - x) * (x - x) T x x - x i x - x i * x - x i ; x 2 - x j = (x - x i ) 2 (x 2 - x j )* (x - x i ) x 2 x 2 - x j x 2 - x j (x 2 - x j )* (x - x i ) (x 2 - x j ) 2 x 2 x 2 - x i x 2 - x i * x 2 - x i ; x 22 - x j = (x 2 - x i ) 2 (x 22 - x j )* (x 2 - x i ) x 22 x 22 - x j x 22 - x j (x 22 - x j )* (x 2 - x i ) (x 22 - x j ) 2 x 3 x 3 - x i x 3 - x i * x 3 - x i ; x 23 - x j = (x 3 - x i ) 2 (x 23 - x j )* (x 3 - x i ) x 23 x 23 - x j x 23 - x j (x 23 - x j )* (x 3 - x i ) (x 23 - x j ) 2 x 4 x 4 - x i x 4 - x i * x 4 - x i ; x 24 - x j = (x 4 - x i ) 2 (x 24 - x j )* (x 4 - x i ) x 24 x 24 - x j x 24 - x j (x 24 - x j )* (x 4 - x i ) (x 24 - x j ) 2 Wishartova matice W W = (x - x i ) 2 + (x 2 - x i ) 2 + (x 3 - x i ) 2 + (x 4 - x i ) 2 (x 2 - x j )* (x - x i ) + (x 22 - x j )* (x 2 - x i ) + (x 23 - x j )* (x 3 - x i ) + (x 24 - x j )* (x 4 - x i ) (x 2 - x j )* (x - x i ) + (x 22 - x j )* (x 2 - x i ) + (x 23 - x j )* (x 3 - x i ) + (x 24 - x j )* (x 4 - x i ) (x 2 - x j ) 2 + (x 22 - x j ) 2 + (x 23 - x j ) 2 + (x 24 - x j ) 2 Kovarianční matice S (x - x i ) 2 + (x 2 - x i ) 2 + (x 3 - x i ) 2 + (x 4 - x i ) 2 (x 2 - x j )* (x - x i ) + (x 22 - x j )* (x 2 - x i ) + S = /(n-) (x2 - x j )* (x - x i ) + (x 22 - x j )* (x 2 - x i ) + (x 23 - x j )* (x 3 - x i ) + (x 24 - x j )* (x 4 - x i ) (x 23 - x j )* (x 3 - x i ) + (x 24 - x j )* (x 4 - x i ) (x 2 - x j ) 2 + (x 22 - x j ) 2 + (x 23 - x j ) 2 + (x 24 - x j ) 2 Korelační matice R R = [(x 2 - x j )* (x - x i ) + (x 22 - x j )* (x 2 - x i ) + (x 23 - x j )* (x 3 - x i ) + (x 24 - x j )* (x 4 - x i )]/ (n-)[(((x - x i ) 2 + (x 2 - x i ) 2 + (x 3 - x i ) 2 + (x 4 - x i ) 2 )/(n-)) -/2 * (((x 2 - x j ) 2 + (x 22 - x j ) 2 + (x 23 - x j ) 2 + (x 24 - x j ) 2 )/(n-)) -/2 ] [(x 2 - x j )* (x - x i ) + (x 22 - x j )* (x 2 - x i ) + (x 23 - x j )* (x 3 - x i ) + (x 24 - x j )* (x 4 - x i )]/ (n-) [(((x - x i ) 2 + (x 2 - x i ) 2 + (x 3 - x i ) 2 + (x 4 - x i ) 2 )/(n-)) -/2 * ((x 2 - x j ) 2 + (x 22 - x j ) 2 + (x 23 - x j ) 2 + (x 24 - x j ) 2 )/(n-)) -/2 ] 4
5 i,j x - x (x - x) (x - x) T (x - x) * (x - x) T 0 0 * 0; 0,75 = 0 0 0,75 0,75 0 0,56 0 - - * -;,75 = -,75 2,75,75 -,75 3,06 0 0 * 0; -2,25 = 0-0,25-2 -2,25-2,25 0 0,06 2 * ; -0,25 = -0,25 0-0,25-0,25-0,25 0,06 x = x i x j 0,25 Whishartova matice -W Kovarianční matice - S Korelační matice - R W = 2-2 S = 0,67-0,67 R = -0,478-2 8,75-0,67 2,92-0,478 5
6 Výpočet pro p = 3 V4 (p=3) = x i = x x 2 x 3 x 4 x j = x 2 x 22 x 23 x 24 x k = x 3 x 32 x 33 x 44 V4 (p=3) = x i = 0 2 x j = 2-2 0 x k = 2 0 - Výpočet výběrového průměru x i = /n x i, x j = /n x j, x k = /n x k x i x = x j 0,25 x k 0,50 Vlastnosti disperze D(X+Y+Z) = E[(X+Y+Z) E(X+Y+Z)] 2 = E[(X-EX) + (Y-EY) + (Z-EZ)] 2 = E[(X-EX) 2 +2(X-EX)(Y-EY) + 2(X-EX)(Z-EZ) + (Y-EY) 2 + 2(Y-EY)(Z-EZ) + (Z-EZ) 2 ] = DX + 2E(X- EX)(Y-EY) + 2(X-EX)(Z-EZ) + 2(Y-EY)(Z-EZ) + DY + DZ Kovariance - cov(x,y) = E(X-EX)(Y-EY) - cov(x,z) = E(X-EX)(Z-EZ) - cov(y,z) = E(Y-EY)(Z-EZ) Korelace - ρ(x,y) = cov(x,y) / σ X σ Y - ρ(x,y) = cov(x,z) / σ X σ Z - ρ(x,y) = cov(y,z) / σ Y σ Z Whishartova matice -W Kovarianční matice - S Korelační matice - R w ii w ji w ki s ii s ji s ki r ii r ji r ki W = w ij w jj w kj S = s ij s jj s kj R = r ij r jj r kj w ik w jk w kk s ik s jk s kk r ik r jk r kk w ii = (x i - x i ) 2 s ii = /(n-) (x i - x i ) 2 r ii = w jj = (x j - x j ) 2 s ij = /(n-) (x j - x j ) 2 r jj = w kk = (x k - x k ) 2 s kk = /(n-) (x k - x k ) 2 r kk = w ij = w ji = (x i - x i )(x j - x j ) s ij = s ji = /(n-) (x i - x i )(x j - x j ) r ij = r ji = s ij /s ii s jj w ik = w ki = (x i - x i )(x k - x k ) s ik = s ki = /(n-) (x i - x i )(x k - x k ) r ik = r ki = s ik /s ii s kk w jk = w kj = (x j - x j )(x k - x k ) s jk = s kj = /(n-) (x j - x j )(x k - x k ) r jk = r kj = s jk /s jj s kk 6
7 i,j,k x - x (x - x) (x - x) T x x - x i x - x i * x - x i ; x 2 - x j ; x 3 - x k x 2 x 2 - x j x 2 - x j x 3 x 3 - x k x 3 - x k x 2 x 2 - x i x 2 - x i * x 2 - x i ; x 22 - x j ; x 32 - x k x 22 x 22 - x j x 22 - x j x 32 x 32 - x k x 32 - x k x 3 x 3 - x i x 3 - x i * x 3 - x i ; x 23 - x j ; x 33 - x k x 23 x 23 - x j x 23 - x j x 33 x 33 - x k x 33 - x k x 4 x 4 - x i x 4 - x i * x 4 - x i ; x 24 - x j ; x 34 - x k x 24 x 24 - x j x 24 - x j x 34 x 34 - x k x 34 - x k (x - x) * (x - x) T (x - x i ) 2 (x 2 - x j )* (x - x i ) (x 3 - x k )* (x - x i ) (x 2 - x j )* (x - x i ) (x 2 - x j ) 2 (x 2 - x j )* (x 3 - x k ) (x 3 - x k )* (x - x i ) (x 2 - x j )* (x 3 - x k ) (x 3 - x k ) 2 (x 2 - x i ) 2 (x 22 - x j )* (x 2 - x i ) (x 32 - x k )* (x 2 - x i ) (x 22 - x j )* (x 2 - x i ) (x 22 - x j ) 2 (x 22 - x j )* (x 32 - x k ) (x 32 - x k )* (x 2 - x i ) (x 22 - x j )* (x 32 - x k ) (x 32 - x k ) 2 (x 3 - x i ) 2 (x 23 - x j )* (x 3 - x i ) (x 33 - x k )* (x 3 - x i ) (x 23 - x j )* (x 3 - x i ) (x 23 - x j ) 2 (x 23 - x j )* (x 33 - x k ) (x 33 - x k )* (x 3 - x i ) (x 23 - x j )* (x 33 - x k ) (x 33 - x k ) 2 (x 4 - x i ) 2 (x 24 - x j )* (x 4 - x i ) (x 34 - x k )* (x 4 - x i ) (x 24 - x j )* (x 4 - x i ) (x 24 - x j ) 2 (x 24 - x j )* (x 34 - x k ) (x 34 - x k )* (x 4 - x i ) (x 24 - x j )* (x 34 - x k ) (x 34 - x k ) 2 7
8 Wishartova matice (x - x i ) 2 + (x 2 - x i ) 2 + (x 3 - x i ) 2 + (x 4 - x i ) 2 (x 2 - x j )* (x - x i ) + (x 22 - x j )* (x 2 - x i )+(x 23 - x j )* (x 3 - x i )+ (x 24 - x j )* (x 4 - x i ) (x 3 - x k )* (x - x i )+ (x 32 - x k )* (x 2 - x i )+ (x 33 - x k )* (x 3 - x i )+ (x 34 - x k )* (x 4 - x i ) W = (x 2 - x j )*(x - x i ) + (x 22 - x j )*(x 2 - x i ) + (x 23 - x j )* (x 3 - x i ) + (x 24 - x j )*(x 4 - x i ) (x 2 - x j ) 2 + (x 22 - x j ) 2 + (x 23 - x j ) 2 + (x 24 - x j ) 2 (x 2 - x j )* (x 3 - x k )+ (x 22 - x j )* (x 32 - x k )+ (x 23 - x j )* (x 33 - x k )+ (x 24 - x j )* (x 34 - x k ) Kovarianční matice S (x 3 - x k )*(x - x i )+ (x 32 - x k )*(x 2 - x i )+ (x 33 - x k )* (x 3 - x i )+ (x 34 - x k ) (x 4 - x i ) (x 2 - x j )* (x 3 - x k )+ (x 22 - x j )* (x 32 - x k )+ (x 23 - x j )* (x 33 - x k )+ (x 24 - x j )* (x 34 - x k ) (x 3 - x k ) 2 + (x 32 - x k ) 2 + (x 33 - x k ) 2 + (x 44 - x k ) 2 (x - x i ) 2 + (x 2 - x i ) 2 + (x 3 - x i ) 2 + (x 4 - x i ) 2 (x 2 - x j )* (x - x i ) + (x 22 - x j )* (x 2 - x i )+(x 23 - x j )* (x 3 - x i )+ (x 24 - x j )* (x 4 - x i ) (x 3 - x k )* (x - x i )+ (x 32 - x k )* (x 2 - x i )+ (x 33 - x k )* (x 3 - x i )+ (x 34 - x k )* (x 4 - x i ) S = /(n-) (x 2 - x j )*(x - x i ) + (x 22 - x j )*(x 2 - x i ) + (x 23 - x j )* (x 3 - x i ) + (x 24 - x j )*(x 4 - x i ) (x 2 - x j ) 2 + (x 22 - x j ) 2 + (x 23 - x j ) 2 + (x 24 - x j ) 2 (x 2 - x j )* (x 3 - x k )+ (x 22 - x j )* (x 32 - x k )+ (x 23 - x j )* (x 33 - x k )+ (x 24 - x j )* (x 34 - x k ) Korelační matice R (x 3 - x k )*(x - x i )+ (x 32 - x k )*(x 2 - x i )+ (x 33 - x k )* (x 3 - x i )+ (x 34 - x k )*(x 4 - x i ) (x 2 - x j )* (x 3 - x k )+ (x 22 - x j )* (x 32 - x k )+ (x 23 - x j )* (x 33 - x k )+ (x 24 - x j )* (x 34 - x k ) [(x 2 - x j )* (x - x i ) + (x 22 - x j )* (x 2 - x i )+(x 23 - x j )* (x 3 - x i )+ (x 24 - x j )* (x 4 - x i )]/(n-)[(((x - x i ) 2 + (x 2 - x i ) 2 +(x 3 - x i ) 2 +(x 4 - x i ) 2 )/(n-)) -/2 *(((x 2 - x j ) 2 +(x 22 - x j ) 2 +(x 23 - x j ) 2 +(x 24 - x j ) 2 )/(n-)) -/2 ] (x 3 - x k ) 2 + (x 32 - x k ) 2 + (x 33 - x k ) 2 + (x 44 - x k ) 2 [(x 3 - x k )* (x - x i )+ (x 32 - x k )* (x 2 - x i )+ (x 33 - x k )* (x 3 - x i )+ (x 34 - x k )* (x 4 - x i )]/(n-)[(((x - x i ) 2 + (x 2 - x i ) 2 +(x 3 - x i ) 2 +(x 4 - x i ) 2 )/(n- )) -/2 * (((x 3 - x k ) 2 + (x 32 - x k ) 2 + (x 33 - x k ) 2 + (x 44 - x k ) 2 )/(n-)) -/2 ] R = [(x 2 - x j )*(x - x i )+ (x 22 - x j )*(x 2 - x i )+ (x 23 - x j )* (x 3 - x i )+(x 24 - x j )*(x 4 - x i )]/(n- )[(((x - x i ) 2 + (x 2 - x i ) 2 +(x 3 - x i ) 2 +(x 4 - x i ) 2 )/(n-)) -/2 *(((x 2 - x j ) 2 +(x 22 - x j ) 2 +(x 23 - x j ) 2 +(x 24 - x j ) 2 )/(n-)) -/2 ] [(x 2 - x j )* (x 3 - x k )+ (x 22 - x j )* (x 32 - x k )+ (x 23 - x j )* (x 33 - x k )+ (x 24 - x j )* (x 34 - x k )]/(n-)[(((x 2 - x j ) 2 + (x 22 - x j ) 2 + (x 23 - x j ) 2 + (x 24 - x j ) 2 )/(n-)) -/2 * (((x 3 - x k ) 2 + (x 32 - x k ) 2 + (x 33 - x k ) 2 + (x 44 - x k ) 2 )/(n- )) -/2 ] [(x 3 - x k )*(x - x i )+ (x 32 - x k )*(x 2 - x i )+ (x 33 - x k )* (x 3 - x i )+ (x 34 - x k )*(x 4 - x i )]/(n- )[(((x - x i ) 2 + (x 2 - x i ) 2 +(x 3 - x i ) 2 +(x 4 - x i ) 2 )/(n-)) -/2 * (((x 3 - x k ) 2 + (x 32 - x k ) 2 + (x 33 - x k ) 2 + (x 44 - x k ) 2 )/(n-)) -/2 ] [(x 2 - x j )* (x 3 - x k )+ (x 22 - x j )* (x 32 - x k )+ (x 23 - x j )* (x 33 - x k )+ (x 24 - x j )* (x 34 - x k )]/(n-)[(((x 2 - x j ) 2 + (x 22 - x j ) 2 + (x 23 - x j ) 2 + (x 24 - x j ) 2 )/(n-)) -/2 * (((x 3 - x k ) 2 + (x 32 - x k ) 2 + (x 33 - x k ) 2 + (x 44 - x k ) 2 )/(n-)) -/2 ] 8
9 i,j,k x - x (x - x) (x - x) T (x - x) (x - x) T 0 0 * 0; 0,75;,5 = 0 0 0 0,75 0,75 0 0,563,25 2,5,5 0,25 2,25 0 - - * -;,75; 0,5 = -,75-0,5 2,75,75 -,75 3,06 0,875 0,5 0,5-0,5 0,875 0,25 0 0 * 0; -2,25; -0,5 = 0 0 0-2 -2,25-2,25 0 5,063,25 0-0,5-0,5 0,25 0,25 2 * ; -0,25; -,5 = -0,25 -,5 0-0,25-0,25-0,25 0,063 0,375 - -,5 -,5 -,50 0,375 2,25 Whishartova matice -W Kovarianční matice - S Korelační matice - R 2-2 -2 0,67-0,67-0,67-0,48-0,63 W = -2 8,75 3,5 S = -0,67 2,92,7 R = -0,48 0,53-2 3,5 5-0,67,7,67-0,63 0,53 Závěr: Korelační matice pro p = 2 má dva různé korelační koeficienty a pro p = 3 má 4. 9