Metoda hlavních komponent

Podobné dokumenty
Přednáška č. 11 Analýza rozptylu při dvojném třídění

Univerzita Pardubice FAKULTA CHEMICKO TECHNOLOGICKÁ

Výslednice, rovnováha silové soustavy.

Q N v místě r. Zobecnění Coulombova zákona Q 3 Q 4 Q 1 Q 2

Téma 5: Parametrická rozdělení pravděpodobnosti spojité náhodné veličiny

SMR 1. Pavel Padevět

Definice spojité náhodné veličiny zjednodušená verze

Neuronové sítě. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

6 Diferenciální operátory

METODA HLAVNÍCH KOMPONENT V LABORATORNÍ PRAXI

ANALÝZA ROZPTYLU (Analysis of Variance ANOVA)

hmotný bod: těleso s nekonečně malými rozměry, ale nenulovou hmotností, tj. žádné otáčení, žádná deformace atd. = bodová hmotnost

ROZDĚLENÍ PŘÍJMŮ A JEHO MODELY. Jitka Bartošová

2. Najděte funkce, které vedou s těmto soustavám normálních rovnic

Přednáška. Další rozdělení SNP. Limitní věty. Speciální typy rozdělení. Další rozdělení SNP Limitní věty Speciální typy rozdělení


Příklady elektrostatických jevů - náboj

Gravitační pole. a nepřímo úměrná čtverci vzdáleností r. r r

27 Systémy s více vstupy a výstupy

4. konference o matematice a fyzice na VŠT Brno, Fraktály ve fyzice. Oldřich Zmeškal

k + q. Jestliže takový dipól kmitá s frekvencí ν (odpovídající

Náhodným (stochastickým) procesem nazveme zobrazení, které každé hodnotě náhodnou veličinu X ( t)

Náhodné vektory a matice

MAGNETICKÉ POLE ELEKTRICKÉHO PROUDU. r je vyjádřen vztahem

do strukturní rentgenografie e I

KOMPLEXNÍ ČÍSLA. Algebraický tvar komplexního čísla

Kinematika. Hmotný bod. Poloha bodu

Metody s latentními proměnnými a klasifikační metody

Parabola. Předpoklady: 7501, Pedagogická poznámka: Na všechny příklady je potřeba asi jeden a půl vyučovací hodiny.

VYHODNOCENÍ MĚŘENÍ (varianta "soulodí")

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

4EK211 Základy ekonometrie

ANALÝZA A KLASIFIKACE DAT

Způsobilost. Data a parametry. Menu: QCExpert Způsobilost

3.2 Metody s latentními proměnnými a klasifikační metody

Neuronové sítě. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Regresní lineární model symboly

KGG/STG Statistika pro geografy

Spektrofotometrické stanovení pk léčiv

E = E red,pravý E red,levý + E D = E red,pravý + E ox,levý + E D

Markovovy řetězce se spojitým časem CTMC (Continuous time Markov Chain)

Národní informační středisko pro podporu jakosti

ÚVOD. Rozdělení slouží: K přesnému popisu pravděpodobnostního chování NV Střední hodnota, rozptyl, korelace atd.

Třídění a významné hodnoty

4EK211 Základy ekonometrie

ZÁKLADY GEOMETRIE KŘIVEK A PLOCH

Atom vodíku. Nejjednodušší soustava: p + e Řešitelná exaktně. Kulová symetrie. Potenciální energie mezi p + e. e =

ANALÝZA A KLASIFIKACE DAT

Základy počítačové grafiky

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Řešení 1) = 72000cm = 30 80

Normální (Gaussovo) rozdělení

Úvod do problematiky měření

Příklady: - počet členů dané domácnosti - počet zákazníků ve frontě - počet pokusů do padnutí čísla šest - životnost televizoru - věk člověka

Příklady - Bodový odhad

Kartézská soustava souřadnic

1.7.2 Moment síly vzhledem k ose otáčení

VYBRANÁ ROZDĚLENÍ. SPOJITÉ NÁH. VELIČINY Martina Litschmannová

ODVOZENÍ OBLASTI NECITLIVOSTI PRO PARAMETRY STŘEDNÍ HODNOTY REGULÁRNÍHO SMÍŠENÉHO LINEÁRNÍHO REGRESNÍHO MODELU BEZ PODMÍNEK

Rekonstrukce diskrétního rozdělení psti metodou maximální entropie

KOMPLEXNÍ ČÍSLA. Algebraický tvar komplexního čísla

Normální (Gaussovo) rozdělení

Hmotnostní tok výfukových plynů turbinou, charakteristika turbiny

4. cvičení z Matematické analýzy 2

můžeme toto číslo považovat za pravděpodobnost jevu A.

Učební texty k státní bakalářské zkoušce Matematika Posloupnosti a řady funkcí. študenti MFF 15. augusta 2008

Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc.

NÁVRH A OVĚŘENÍ BETONOVÉ OPŘENÉ PILOTY ZATÍŽENÉ V HLAVĚ KOMBINACÍ SIL

Rozklad přírodních surovin minerálními kyselinami

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE. FAKULTA STAVEBNÍ, OBOR GEODÉZIE A KARTOGRAFIE KATEDRA SPECIÁLNÍ GEODÉZIE název předmětu

FYZIKA I. Mechanická energie. Prof. RNDr. Vilém Mádr, CSc. Prof. Ing. Libor Hlaváč, Ph.D. Doc. Ing. Irena Hlaváčová, Ph.D. Mgr. Art.

Chyby měření 210DPSM

MAGNETICKÉ POLE CÍVEK V HELMHOLTZOVĚ USPOŘÁDÁNÍ

K přednášce NUFY080 Fyzika I prozatímní učební materiál, verze 01 Keplerova úloha Leoš Dvořák, MFF UK Praha, Keplerova úloha

Řešení testu 2b. Fyzika I (Mechanika a molekulová fyzika) NOFY ledna 2016

Charakteristika datového souboru

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

IDENTIFIKACE BIMODALITY V DATECH

Energie elektrického pole

Slezská univerzita v Opavě Obchodně podnikatelská fakulta v Karviné

Fuzzy regulátory. Miloš Schlegel. Několik výroků o přesnosti

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

y = 0, ,19716x.

7. CVIČENÍ. Sedmé cvičení bude vysvětlovat tuto problematiku:

Trivium z optiky Vlnění

GAUSSŮV ZÁKON ELEKTROSTATIKY

SP2 Korelační analýza. Korelační analýza. Libor Žák

Pravděpodobnost, náhodná proměnná. Statistické metody a zpracování dat. III. Pravděpodobnost, teoretická rozdělení. Pravděpodobnost, náhodná proměnná

II. ročník, zimní semestr 2. týden P O P U L A Č N Í G E N E T I K A

Lambertův-Beerův zákon

Hlavní body. Keplerovy zákony Newtonův gravitační zákon. Konzervativní pole. Gravitační pole v blízkosti Země Planetární pohyby

Regrese. používáme tehdy, jestliže je vysvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA

1. Ukazatele primární: - jsou přímo zjišťované, neodvozené - např. stav zásob, počet pracovníků k , atd.

Řešený příklad:: Kloubový přípoj nosníku na pásnici sloupu s čelní deskou

Řešený příklad: Přípoj příhradového vazníku na sloup čelní deskou

Tepelná kapacita = T. Ē = 1 2 hν + hν. 1 = 1 e x. ln dx. Einsteinův výpočet (1907): Soustava N nezávislých oscilátorů se stejnou vlastní frekvencí má

Detekce interakčních sil v proudu vozidel

rovinná soustava sil (paprsky všech sil soustavy leží v jedné rovině) rovinný svazek sil rovinná soustava rovnoběžných sil

ELEKTRICKÝ NÁBOJ COULOMBŮV ZÁKON INTENZITA ELEKTRICKÉHO POLE

Transkript:

d d Víceozměná data Metoda hlavních komonent Václav Adamec vadamec@mendelucz Extenze unvaetních dat na více oměnných () Datová matce: n x Hodnot oměnných získán z jednoho subjektu () Předoklad závslostí mez oměnným Rozsah MV soubou: n Studum MV souboů: umělé oměnné vznklé lneání funkcí ůvodních oměnných x = w + w + + w Váh w zvolen odle ůzných ktéí Multvaetní ozdělení Bvaetní ozdělení Y ~ MVN (µ,σ) ; µ vekto oulačních ůměů; Σ oulační matce kovaancí Funkce MVN avdě hustot: ( µ ) Σ ( µ ) / f ( ) = e / (π ) Σ Mahalanobsova vzdálenost: = z z = ( µ ) Σ ( µ ) ~ χ 3 Bvaetn Gaussovo ozdelen, = 9 Bvaetn Gaussovo ozdelen, = Detemnant: Genealzovaná vaance S, Σ Malý Σ výskt kolneat (lneáních závslostí) Velký Σ absence kolneat (lneáních závslostí) - - x - - x - - x - - x

Konfdenční els Multvaetní ozdělení x - Konfdencn els: =,9 x - Konfdencn els: =, va els MV ozdělení je dán Hlavní odélná osa funkcí největšího chaaktestckého čísla max Vedlejší říčná osa funkcí nejmenšího chaaktestckého čísla mn Unvaetní nomalta neznamená multvaetní nomaltu est MVN oblematčtější: est elsodního tvau bvaetních ozdělení Multvaetní Q-Q lot Omezeně test (multvaetní SW test, atd) - - - - - - x x Ilustační data Multvaetní Q-Q lot Q-Q lot: Mahalanobsova vzdalenost d vs kvantl χ Kanální mí fotbalstů (Renche, 99): V V3 šířka hlav obvod hlav V V V6 V7 ředo - zadní mía v úovn očí výška oč - temeno výška uš - temeno šířka čelst d 8 6 Kvantl χ

Kovaanční a koelační matce Za odmínk nomalt užtečné Smetcké matce x Výběové (S, R) vs Poulační (Σ) Hlavní dagonála: vaance (S, Σ), jednčk (R) Mmo dagonální vk: kovaance (S, Σ), koelační koef (R) σ j = σ j, j = j R má edukovanou škálu σ σ σ3 σ σ σ σ σ3 σ σ σ3 σ3 σ3 σ3 σ3 Σ= σ σ σ3 σ σ σ σ σ3 σ σ σ6 σ6 σ63 σ6 σ6 σ 6 σ6 σ 36 σ6 σ 6 σ6 3 3 R = 6 6 3 3 3 3 63 3 6 3 6 6 6 36 6 6 V7 V6 V V V3 V Koelační matce Coelační matce - V V3 V V V6 V7 Metoda hlavních komonent Rozklad na vlastní čísla Účel: Hledání lneání f-ce oměnných maxmalzující celkovou vaanc Zjednodušení stuktu dat, edukce dmenze soubou (očtu oměnných) Výbě žádaných (odobných, neodobných) oměnných Studum stuktu dsese MV soubou nebo lneáních závslostí Regese hlavních komonent (řešení kolneat v matc egesoů) Většnou ozkládáme S, R nebo dstanční matc (D) Vžd smetcká čtvecová matce A = A Defnujeme dagonální matc Λ ( x ) a matc koesondujících vlastních vektoů E ( x ) Platí: A = E Λ E A Λ = Matce Λ obsahuje vlastních čísel usořádaných sestuně Matce E obsahuje slouců vlastních vektoů e, kde každý slouec řnáleží jednomu vlastnímu číslu

Vlastnost vlastních čísel Vlastnost vlastních vektoů Součn vlastních čísel: = = A Mají jednotkovou délku e e = e =, Součet vlastních čísel: = = R = t ( R ) = = t ( S ) = S Vlastní čísla ve vztahu Počet nulových udává očet lneáních závslostí v, sngulatu E Podíl k součtu všech vlastních čísel udává ocento celkové vaance vsvětlené Podíl vaance lze kumulovat = s Jsou vzájemně otogonální Matce E je ak otonomální e e = e e =, j Hodnot vlastního vektou e vjadřují míu atcace koesondující oměnné na vaanc (závslost) j E j = E EE = I abulkové vjádření ozkladu Gafcké vjádření ozkladu Sceelot č Lambda % Vaance Kumul % 333 787 787 37 393 88 3 76 89 99 3 6 97 6 7 987 6 88 3 3 333 37 Suma = 997 Součn = 99 76 3 6 88 3 6 Egenvalues

Vaance v matc S: Vlastní vekto ( a ): Pvní dva vlastní vekto V V3 V V V6 V7 6 888 39 38 3 E E V -7 V3-878 9 V -63 3 V -39-89 V6-66 - V7-79 87 Hlavní komonent Pnc: Výočet nových oměnných (hlavních komonent), kteé zachovávají vaanc, ale elmnují kovaance Výočet: Z = YE c = z = e = e + e + + e Vaance PC: c c = z = z = e = e = e = e Va ( c ) = + e + e + + e + + e Hlavní komonent Gaf hlavních komonent Hlavní komonent c jsou vzájemně otogonální Vaance c ae jsou maxmální o =, ale ostuně klesají Hlavní komonent nulových jsou téměř konstantní Nulové důležté o detekc lneáních závslostí PC vs PC -6 PC vs PC3-8 Poslední vlastní vekto: V V3 V V V6 V7 73-38 38 3-3 -6 PC 8 PC3 - - 6 - Na téměř lneání závslost se odílí ředevším V a V7-7 -68-66 -6-6 -6-7 -68-66 -6-6 -6 PC PC

Počet vbaných vlastních čísel Poznámk Ktéa: Vlastní čísla vsvětlující nejméně 8 9 % vaance Vsuální osouzení gafu úatí Λ Nadůměné, > Asmtotcký věohodnostní test Metoda boken stck (Jackson, 993) Počet zvolený odle nejvššího očtu metod PCA je vztažena ke škále oměnných (ozdílná o S a R) Multvaetní nomalta výhodou Výstu PCA ovlvněn extém v datech Koefcent PC egese jsou vchýlené, obtížně nteetovatelné As fa as the laws of mathematcs efe to ealt, the ae not cetan; as fa as the ae cetan, the do not efe to ealt Albet Ensten