Výstupy z výukové jednotky. 2. Princip faktorové analýzy

Rozměr: px
Začít zobrazení ze stránky:

Download "Výstupy z výukové jednotky. 2. Princip faktorové analýzy"

Transkript

1 Faktorová analýza Faktorová analýza je vícerozměrná statistická metoda, jejíž podstatou je rozbor struktury vzájemných závislostí proměnných na základě předpokladu, že jsou tyto závislosti důsledkem působení určitého menšího počtu v pozadí stojících nezměřitelných faktorů, které jsou nazývány společné faktory (nebo faktory, common factors, factors). Cílem faktorové analýzy je tedy redukce počtu proměnných (neboli charakterizování sady p proměnných menším počtem společných faktorů) a odhalení struktury vztahů mezi proměnnými. Faktorová analýza vznikla v oblasti psychologie a byla po dlouhou dobu používána téměř výhradně v tomto oboru. V posledních desetiletích ovšem pronikla i do dalších vědních oborů a našla uplatnění i v biologii a medicíně. Faktorovou analýzu lze do určité míry považovat za rozšíření metody hlavních komponent (PCA) [odkaz na ale na rozdíl od PCA vychází ze snahy vysvětlit závislosti proměnných. Mezi nedostatky PCA patří, že je závislá na změnách měřítka proměnných (normování dat hraje roli v tom smyslu, že kovarianční matice vede k jinému řešení než korelační matice). Přístup faktorové analýzy umožňuje tento nedostatek odstranit, ale má jiné slabiny. Problémy ve faktorové analýze můžou spočívat v nejednoznačnosti odhadů faktorových parametrů (tedy závislost výsledků faktorové analýzy na použité rotaci) a v nutnosti specifikovat počet společných faktorů (common factors) před provedením analýzy. Předností faktorové analýzy je větší úspornost a obecnost. Stejně jako u PCA je i u faktorové analýzy problémem při interpretaci faktorů, pokud proměnné nemají vícerozměrné normální rozdělení Výstupy z výukové jednotky Student: umí definovat podstatu faktorové analýzy, umí popsat model faktorové analýzy, umí definovat společné znaky i rozdíly faktorové analýzy a analýzy hlavních komponent, umí definovat rozdíly různých metod rotace faktorů, umí interpretovat výsledek faktorové analýzy podle numerických výsledků.. Princip faktorové analýzy Na rozdíl od analýzy hlavních komponent (PCA), jejíž hlavním cílem je vysvětlit maximum variability dat, se faktorová analýza snaží vysvětlit kovarianci mezi proměnnými. Faktorová analýza předpokládá, že pozorované proměnné jsou lineární kombinací hypotetických proměnných - faktorů. Ve faktorové analýze se tedy vysvětluje vzájemná lineární závislost pozorovaných proměnných existencí menšího počtu nepozorovatelných faktorů zvaných společné faktory (common factors) a dalších zdrojů variability nazývaných chybové či specifické faktory (nebo též rušivé či reziduální složky). Společné faktory vyvolávají korelace mezi proměnnými, zatímco chybové faktory pouze přispívají k rozptylu jednotlivých pozorovaných proměnných. Předmětem zájmu faktorové analýzy jsou především společné faktory. Základem faktorové 1

2 analýzy je předpoklad, že pozorované kovariance (resp. korelace) mezi proměnnými jsou výsledkem působení společných faktorů a ne vzájemného vztahu mezi proměnnými. 3. Porovnání faktorové analýzy a analýzy hlavních komponent V první řadě připomeňme nutnou podmínku pro použití faktorové analýzy nebo analýzy hlavních komponent, a tou jsou korelace mezi původními proměnnými. Faktorovou analýzu ani PCA nemá smysl použít, když jsou původní proměnné nekorelované. Faktorová analýza pak nemá co objasnit a PCA povede k hlavním komponentám totožným s původními proměnnými. Faktorová analýza pracuje podobně jako PCA s korelační nebo kovarianční maticí a nalézá první hlavní faktor tak, aby vysvětloval největší část rozptylu datové matice. Další faktory jsou konstruovány takovým způsobem, aby byly nezávislé, čili nekorelované, a vyčerpávaly sestupně maximum celkového rozptylu. Faktorová analýza se pokouší objasnit kovariance a korelace původních proměnných pomocí několika málo společných faktorů, zatímco PCA objasňuje pouze rozptyl původních proměnných. Výpočet u PCA je přímočarý, jednoduchý. U faktorové analýzy je výpočet faktorového skóre daleko komplexnější a byla pro něj navržena řada postupů. Rozdíl mezi faktorovou analýzou a analýzou hlavních komponent je i v posledním kroku analýzy. U faktorové analýzy jsou faktory rotovány tak, aby co nejjednodušeji popisovaly proměnné, tj. aby byly co nejblíže situovány co největšímu počtu původních proměnných. To je dosaženo v situacích, kdy jsou hlavní faktory co nejblíže skupině silně korelovaných proměnných. V těchto situacích můžou být hlavní faktory do určité míry korelovány (viz níže neortogonální rotace faktorů). 4. Model faktorové analýzy Předpokládejme, že x T = (x 1, x,..., x p ) T je jeden objekt popsaný p pozorovanými proměnnými. Obecný model faktorové analýzy předpokládá, že existuje m v pozadí stojících společných faktorů F 1, F,..., F m, kterých je méně než p. Potom můžeme daný objekt zapsat jako lineární kombinaci společných faktorů následujícím způsobem x 1 = l11f1 + l1 F l1m Fm + e1 = l1f1 + lf lm Fm + e x... x = l F + l F l F + e p p1 1 p pm m p, (1) kde F 1, F,... F m jsou společné faktory, které vyvolávají korelace mezi p původními proměnnými. Tyto faktory mají nulovou střední hodnotu a jednotkový rozptyl. V modelu se dále vyskytují chybové složky e 1, e,... e p, označované jako specifické faktory, které přispívají k rozptylu jednotlivých proměnných. Koeficienty l ik nazýváme faktorové váhy nebo zátěže (factor loadings) i-té proměnné na j-tém společném faktoru F j, i=1,...,p, j=1,...,m. Jinak řečeno, faktorové zátěže l ij lze za předpokladu stejných měřících jednotek interpretovat jako příspěvek j- tého faktoru i-té vysvětlované proměnné. Faktorové zátěže tedy představují (při splnění určitých podmínek řešení) kovariance či korelace mezi původními a novými proměnnými. Uvedený faktorový model můžeme přepsat v maticové podobě jako T X = FL + E, ()

3 kde X je datová matice rozměru nxp, F je matice rozměru nxm, jejíž sloupce jsou jednotlivé společné faktory F 1, F,... F m, L je matice faktorových zátěží rozměru pxm a E je matice chyb s rozměrem nxp, jejíž sloupce jsou jednotlivé specifické faktory e 1, e,... e p. Pro ortogonální faktorový model lze kovarianční matici S vstupujících proměnných (tedy sloupců datové matice X), jejíž rozměr je pxp, napsat ve formě tzv. základní faktorové věty ve tvaru T S = LL + Γ, (3) kde LL T je kovarianční matice sloupců matice FL T, přičemž (FL T ) T (FL T ) =L F T FL T = LL T, protože kovarianční matice společných faktorů F T F je jednotková matice z důvodu, že faktory jsou nekorelované a mají jednotkový rozptyl. Matice Γ je kovarianční matice chybových faktorů a nazývá se matice jedinečností. Je to diagonální matice, protože předpokládáme nekorelované chyby. Faktorový model nám tedy umožní rozdělení rozptylu původních proměnných (diagonální prvky matice S) na dvě části, a to na část vysvětlenou společnými faktory (diagonální prvky matice LL T ) označovanou jako komunalita (communality) a část nevysvětlenou společnými faktory (diagonální prvky matice jedinečností Γ ) označovanou jako jedinečnost. Komunalita i-té proměnné h i (tedy i-tý diagonální prvek matice LL T ) vyjadřuje míru proměnlivosti a je vahou, s jakou jednotlivé společné faktory přispívají do rozptylu dané proměnné. Lze ji vyjádřit jako h i = l i1 + l i l im, tedy jako součet druhých mocnin faktorových zátěží. Jedinečnost i-té proměnné (Γ i ) bývá dále rozdělována na specificitu Γ is a nespolehlivost Γ in. Specifita představuje tu část variability, kterou nelze vysvětlit ani chybou experimentu, ani společnými faktory, zatímco nespolehlivost představuje experimentální chybu při měření faktorů. Uvedený způsob rozkladu variability představuje základní hledisko pro klasifikaci metod faktorové analýzy. Metoda hlavních komponent je zvláštním případem faktorové analýzy, kdy je matice jedinečností Γ nulová, a tudíž se předpokládá, že prostřednictvím hlavních komponent lze proměnlivost zdrojové matice beze zbytku reprodukovat. Jde tedy o vhodnou ortogonální transformaci, která beze zbytku zachovává všechnu původní proměnlivost. Hovoříme pak z hlediska faktorové analýzy o úplné komponentní analýze. Jestliže při reprodukci pomocí hlavních komponent reprodukujeme pouze podstatnou část proměnlivosti (ale ne všechnu), jedná se o neúplnou komponentní analýzu. Pro odhad parametrů faktorového modelu se často používá analýza hlavních komponent. Pomocí hlavních komponent si můžeme daný objekt zapsat pomocí p x1 = a11 y1 + a1 y a1 p y p x = a1 y1 + a y a p y p... x = a y + a y a p1 1 p pp p. y (4) Naším cílem je však nalezení pouze m společných faktorů (m<p), proto je pomocí PCA nalezeno jen prvních m hlavních komponent (y j, j=1,...,m), které zahrnují největší podíl rozptylu všech původních proměnných. Stanovení hodnoty m může probíhat na základě expertní znalosti, procenta vyčerpané variability danými komponentami, sutinového grafu (scree plot) či Kaiserova-Gutmanova kritéria. Hlavní komponenty jsou následně modifikovány do faktorového modelu. Aby byl rozptyl společných faktorů jednotkový, vydělí se každá hlavní komponenta její směrodatnou odchylkou s jj (což je diagonální prvek matice S) a vznikne tak společný faktor 3

4 F j = y s, (5) j jj z něhož můžeme vyjádřit j-tou hlavní komponentu jako y = F s. (6) j j jj Po dosazení do (4) a použití pouze prvních m komponent, přičemž zbylé komponenty shrneme do chybových složek (specifických faktorů) e i následujícím způsobem e i = am 1, i Fm+ 1 sm+ 1, m a pi Fp s pp +, (7) dostáváme 1 = l11f1 + l1 F l1m Fm + e1 = l1f1 + lf lm Fm + e x x... x = l F + l F l F + e p p1 1 p pm m p, (8) což je faktorový model totožný s (1), přičemž faktorové zátěže lze vyjádřit jako l = a. Tím jsme transformovali hlavní komponenty na faktory. Protože naším cílem je nejen nalezení společných faktorů, jejichž počet je menší než počet původních proměnných, ale i jejich dobrá interpretace, provedeme v následujícím kroku rotaci faktorů. ij ij s jj 5. Rotace faktorů Přestože první fáze faktorové analýzy probíhá stejně jako PCA, interpretace výsledků je jiná než při PCA, což je způsobeno právě rotací faktorů ve druhé fázi analýzy. Rotace faktorů slouží k usnadnění jejich interpretace. Cílem je lokalizace souřadnicové soustavy do prostoru společných faktorů tak, aby byla dosažena nejjednodušší struktura, tj. řešení, kde některé faktorové zátěže jsou maximalizovány a jiné minimalizovány. Pro rotaci faktorů existuje několik možností (Obrázek 1). Rotace faktorů může být ortogonální (orthogonal) nebo neortogonální (non-orthogonal, oblique). Ortogonální rotace zachovává nezávislost faktorů, které jsou tedy nekorelované. U neortogonální rotace se nové faktory stávají do určité míry korelované. Nejznámější metody ortogonální rotace jsou varimax (variance maximazing) a quartimax. Rotace varimax je nejběžnější možností rotace. Maximalizuje sumu rozptylů všech faktorů. Quartimax rotace minimalizuje počet faktorů potřebných k vysvětlení všech proměnných. Při této rotaci má každá proměnná vysokou váhu jenom pro jeden faktor a nízké váhy pro všechny ostatní faktory. Obě tyto rotace mohou být použity s normalizací vah faktorů nebo bez této normalizace. 4

5 a b F c F F 1 F 1 Obrázek 1 a. Nerotovaný prostor, b. Ortogonální rotace v prostoru dvou faktorů F1 a F, c. Neortogonální rotace stejné situace. 6. Příklad Faktorovou analýzu představíme na příkladu hodnocení životní spokojenosti respondentů. Jde o datový soubor factor.sta, který je součástí ukázkových příkladů v softwaru STATISTICA (Tabulka 1). Tabulka 1 Část vstupní tabulky k analýze hodnocení životní spokojenosti respondentů. Hodnoty spokojenosti s prací, koníčky a domácností byly zaznamenány u 100 respondentů (zde pouze ukázka prvních 10 respondentů). V posledních dvou řádcích je uveden průměr a směrodatná odchylka jednotlivých proměnných. ID Prace1 Prace Prace3 Konicky1 Konicky Doma1 Doma Doma3 Ruzne1 Ruzne 1 105,1 101,7 115,1 101,0 95, 100,3 101,7 85,6 104,0 110,3 77,0 7,9 77,5 7,7 61,6 93,9 95,4 88,6 70,1 7,0 3 86,0 8, 78,9 78,0 91,7 86,8 108,1 93,3 86,0 70,7 4 91,4 106,1 95,6 90,9 111,5 100, 86,1 93,8 101, 8, ,7 9,0 99,1 79,3 98,4 104,0 83,3 69,6 8,8 70,0 6 86,6 87,8 67,7 93,7 78,0 99,8 97,3 108,6 91,4 79,8 5

6 7 95,1 94,5 98,1 94,5 97,4 93,7 99, 96,4 90,7 86, ,5 104,6 105,6 101,0 10,3 87,4 96,7 86,6 93,1 11, ,5 97,3 94,1 88,5 98,1 97,8 99,6 99,8 99,4 105, ,6 97,9 85,8 8,5 90,4 104,7 95,1 99,7 77,6 6, Průměr 97,0 98, 98,9 98,0 100,1 99,5 101,6 101,4 99, 98, Sm.odch. 15,5 11,3 1,5 15,9 19,9 1,0 11,1 1,7 17,0 19,1 Řešení Před výpočtem faktorových zátěží je vhodné zkontrolovat, zda jsou původní proměnné korelovány. Kdyby byla korelace všech proměnných malá a statisticky nevýznamná, v datech by se skrytá struktura nevyskytovala a nemělo by tedy smysl faktorovou analýzu k jejímu hledání použít. Sílu korelace proměnných ověříme pomocí korelační matice (Tabulka ) a maticového grafu (Obr. ). Protože tabulka i graf ukazují, že jsou v datech silné korelace mezi některými proměnnými, použijeme faktorovou analýzu k nalezení skrytých faktorů. Tabulka Matice korelací původních proměnných. Prace1 Prace Prace3 Konicky1 Konicky Doma1 Doma Doma3 Ruzne1 Ruzne Prace1 1 0,65 0,65 0,60 0,5 0,14 0,15 0,14 0,61 0,55 Prace 0,65 1 0,73 0,69 0,70 0,14 0,18 0,4 0,71 0,68 Prace3 0,65 0,73 1 0,64 0,63 0,16 0,4 0,5 0,70 0,67 Konicky1 0,60 0,69 0,64 1 0,80 0,54 0,63 0,58 0,90 0,84 Konicky 0,5 0,70 0,63 0,80 1 0,51 0,50 0,48 0,81 0,76 Doma1 0,14 0,14 0,16 0,54 0,51 1 0,66 0,59 0,50 0,4 Doma 0,15 0,18 0,4 0,63 0,50 0,66 1 0,73 0,64 0,59 Doma3 0,14 0,4 0,5 0,58 0,48 0,59 0,73 1 0,59 0,5 Ruzne1 0,61 0,71 0,70 0,90 0,81 0,50 0,64 0,59 1 0,84 Ruzne 0,55 0,68 0,67 0,84 0,76 0,4 0,59 0,5 0,84 1 Prace1 Prace Prace3 Konicky1 Konicky Doma1 Doma Doma3 Ruzne1 Ruzne 6

7 Obrázek Maticový graf vztahů původních proměnných. Jako metodu extrakce faktorů zvolíme analýzu hlavních komponent, tedy vytvoříme hlavní komponenty na základě výše uvedené korelační matice. Vlastní číslo prvního faktoru je 6,118 a rozptyl vysvětlený tímto faktorem je 61,%. Druhý faktor vysvětluje 18,0% rozptylu a zbylé faktory vždy méně než 5% celkového rozptylu (Obr 3). Další vlastní čísla jsou menší než jedna, podle Kaiserova-Guttmanova kritéria je tedy vhodné interpretovat pouze první dva faktory, protože jenom ty vysvětlují více rozptylu než původní proměnné. Z grafického znázornění vlastních čísel pomocí sutinového grafu (scree plot) na Obr. 3 však vyplývá, že došlo ke dvěma důležitým zlomům na křivce, a to pro dva a tři faktory. Z tohoto důvodu je možné doporučit řešení faktorové analýzy nejen pro dva faktory, jak tomu vyplynulo z Kaiserova-Guttmanova kritéria, ale i pro tři faktory. 7,0 6,5 6,0 6,118 5,5 5,0 4,5 Vlastní číslo 4,0 3,5 3,0,5,0 1,801 1,5 1,0 0,5 0,0 0,473 0,408 0,317 0,93 0,196 0,170 0,138 0, Obrázek 3 Sutinový graf znázorňující vlastní čísla příslušná jednotlivým faktorům. Podívejme se teď na faktorové zátěže. Uvedli jsme, že faktorové váhy (neboli zátěže) můžeme interpretovat jako korelace mezi faktory a proměnnými. Faktorové zátěže tedy představují nejdůležitější informaci pro interpretaci faktorů. V tabulce 3 jsou uvedeny faktorové zátěže nerotovaných faktorů. U prvního faktoru se nalézají nejvyšší faktorové zátěže, u druhého nižší, atd. Faktory s vyšším pořadovým číslem vysvětlují stále méně a méně variability v datech. Červeně jsou vyznačeny statisticky významné vztahy. Znaménko faktorové zátěže hraje roli jen v tom smyslu, že proměnné se zátěžemi s opačným znaménkem u toho samého faktoru mají k tomuto faktoru opačný vztah. Když všechny zátěže u faktoru vynásobíme hodnotou -1 (např. v našem případě u Faktoru 1), výsledek tímto nebude ovlivněn. Faktor Tabulka 3 Faktorové zátěže nerotovaných faktorů. Faktor 1 Faktor Faktor 3 Faktor 4 Faktor 9 Faktor 10 Prace1-0,653 0,514 0,30 0,439 0,080 0,004 Prace -0,757 0,495-0,079-0,1 0,104 0,01 Prace3-0,746 0,457-0,105 0,031-0,018 0,039 Konicky1-0,94-0,0 0,013 0,00-0,43 0,17 7

8 Konicky -0,876 0,05 0,100-0,35 0,089 0,018 Doma1-0,576-0,605 0,491-0,115 0,004-0,00 Doma -0,671-0,618-0,16 0,160 0,145 0,048 Doma3-0,64-0,574-0,69 0,153 0,007 0,001 Ruzne1-0,95 0,014-0,050 0,07-0,157-0,4 Ruzne -0,900 0,048-0,15-0,035 0,088-0,030 Vlastní číslo 6,118 1,801 0,473 0,408 0,138 0,085 Vysvětlená variabilita 0,61 0,180 0,047 0, ,014 0,009 Přistupme nyní k rotaci faktorů. Aktuální orientace faktorů je náhodná a všechny rotace reprodukují korelace stejně dobře. Je zřejmé, že rotace faktorů bude taková, aby faktorová struktura byla nejjednodušeji interpretovatelná. Faktorové řešení má jednoduchou strukturu, když mají faktory vysoké zátěže pro určité proměnné, nízké zátěže pro jiné a když je málo proměnných s vysokou zátěží pro více než jeden faktor. Nejběžnější metoda rotace, kterou je možné dosáhnout jednoduché struktury výsledných dat, je rotace varimax. Jak jsme již uvedli, je nutno zvolit počet faktorů, které chceme rotovat, tj. zachovat a interpretovat. Uvedli jsme, že podle Kaiserova-Guttmanova kritéria je vhodný počet faktorů dva, ovšem podle sutinového grafu můžeme zvolit také tři faktory. V našem příkladu tedy zvolíme počet faktorů tři a metodu rotace varimax. Výsledkem faktorové analýzy jsou tři faktory, jejichž zátěže jsou uvedeny v Tabulce 4. Vysoké faktorové zátěže prvního faktoru byly u všech proměnných kromě proměnných spokojenosti doma. Druhý faktor měl vysoké hodnoty faktorové zátěže pro dvě proměnné spokojenosti doma, třetí faktor pouze jedinou vysokou faktorovou zátěž pro jednu proměnnou spokojenosti doma. V tomto případě, kdy pouze jedna proměnná vykazuje vysokou hodnotu faktorové zátěže na třetím faktoru, je vhodné přehodnotit zachování tří faktorů a zvolit pouze dva faktory. Tabulka 4 Faktorové zátěže třech rotovaných faktorů (metoda rotace varimax). Faktor 1 Faktor Faktor 3 Prace1 0,840-0,157 0,7 Prace 0,899 0,119-0,049 Prace3 0,866 0,15-0,057 Konicky1 0,731 0,50 0,318 Konicky 0,76 0,371 0,337 Doma1 0,100 0,47 0,864 Doma 0,148 0,84 0,385 Doma3 0,147 0,858 0,36 Ruzne1 0,759 0,518 0,53 Ruzne 0,736 0,55 0,136 Vlastní číslo 4,495,59 1,305 Vysvětlená variabilita 0,450 0,59 0,131 Byla tedy následně provedena rotace varimax pro dva faktory (Tabulka 5). Při zachování dvou faktorů vykazuje první faktor vysoké zátěže pro proměnné spokojenosti při práci, spokojenosti s koníčky a spokojenosti v dalších (různých) oblastech. Proměnné spokojenosti doma dosahují nejmenších zátěží. Druhý faktor vykazuje nejvyšší zátěže proměnných spokojenosti doma a nejnižší zátěže pro spokojenost v práci. Ostatní proměnné leží přibližně 8

9 uprostřed. Faktorové zátěže všech proměnných můžeme zobrazit v dvourozměrném grafu (Obrázek 4). Interpretace faktorů je zcela zřejmá, první faktor můžeme interpretovat jako spokojenost při práci (Faktor 1) a druhý faktor jako spokojenost doma (Faktor ). Spokojenost s koníčky a spokojenost v dalších oblastech života mají vztah s oběma faktory. Spokojenost při práci a spokojenost doma jsou na sobě nezávislé, obě ovšem přispívají ke spokojenosti s koníčky a spokojenosti v dalších aspektech života. Tabulka 5 Faktorové zátěže dvou rotovaných faktorů (metoda rotace varimax). Faktor 1 Faktor Prace1 0,831-0,019 Prace 0,90 0,059 Prace3 0,871 0,083 Konicky1 0,740 0,583 Konicky 0,731 0,484 Doma1 0,097 0,830 Doma 0,166 0,897 Doma3 0,168 0,844 Ruzne1 0,769 0,561 Ruzne 0,749 0,50 Vlastní číslo 4,56 3,358 Vysvětlená variabilita 0,456 0,336 1,0 0,8 Doma1 Doma Doma3 Faktor 0,6 0,4 Konicky1 Ruzne1 Konicky Ruzne 0, 0,0 Prace3 Prace Prace1 0,0 0,1 0, 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 Faktor 1 Obrázek 4 Zobrazení faktorových zátěží v dvourozměrném řešení, metoda rotace varimax. Na tomto místě můžeme přistoupit ke zhodnocení spolehlivosti dvourozměrné reprezentace původních proměnných. Jak už jsme výše uvedli, první dva faktory vysvětlují 79% celkové variability. Z matice reziduálních korelací (Tabulka 6) vidíme, jak dobře dvourozměrné řešení faktorové analýzy reprodukuje pozorovanou korelační matici původních proměnných. Hodnoty v matici reziduí představují korelaci proměnných, která není vysvětlena dvourozměrným řešením faktorové analýzy. Prvky na diagonále matice představují směrodatnou odchylku, která nemohla 9

10 být vysvětlena. Tato hodnota je rovna odmocnině z jedna mínus příslušná komunalita dvou faktorů (komunalita proměnné je rozptyl, který může být vysvětlen příslušným počtem faktorů). Tabulka 6 Reziduální korelace. Prace1 Prace Prace3 Konicky1 Konicky Doma1 Doma Doma3 Ruzne1 Ruzne Prace1 0,31-0,10-0,07-0,01-0,08 0,08 0,0 0,01-0,0-0,06 Prace -0,10 0,18-0,06-0,01 0,01 0,01-0,0 0,03-0,0-0,0 Prace3-0,07-0,06 0,4-0,06-0,05 0,01 0,0 0,04-0,0-0,0 Konicky1-0,01-0,01-0,06 0,11-0,0-0,0-0,01-0,03 0,01 0,00 Konicky -0,08 0,01-0,05-0,0 0,3 0,03-0,06-0,05-0,0-0,04 Doma1 0,08 0,01 0,01-0,0 0,03 0,30-0,10-0,13-0,04-0,06 Doma 0,0-0,0 0,0-0,01-0,06-0,10 0,17-0,05 0,01 0,0 Doma3 0,01 0,03 0,04-0,03-0,05-0,13-0,05 0,6-0,0-0,03 Ruzne1-0,0-0,0-0,0 0,01-0,0-0,04 0,01-0,0 0,09-0,0 Ruzne -0,06-0,0-0,0 0,00-0,04-0,06 0,0-0,03-0,0 0,19 Z tabulky 6 vidíme, že reziduální korelace nejsou větší než 0,13 nebo menší než -0,13. To jsou velice příznivé hodnoty potvrzující (společně s 79% vysvětlenou variabilitou) spolehlivé dvourozměrné řešení. Na závěr uvedeme komunality a koeficienty faktorového skóre (Tabulka 7). Připomeňme, že komunality proměnných představují část rozptylu vysvětlenou daným počtem faktorů. Rotace faktorového prostoru nemá na komunality žádný vliv. Velice nízké komunality jedné nebo více proměnných naznačují, že tyto proměnné nejsou dostatečně dobře vysvětleny daným modelem. Koeficienty faktorových skóre představují váhy, které se použijí k výpočtu faktorového skóre z proměnných. Můžou být použity v dalších analýzách. Tabulka 7 Komunality a faktorové skóre Komunality Koef. faktorových skóre Z 1 faktoru Z faktorů R^ Faktor 1 Faktor Prace1 0,690 0,690 0,560 0,57-0,164 Prace 0,814 0,818 0,735 0,64-0,145 Prace3 0,758 0,765 0,654 0,50-0,130 Konicky1 0,547 0,887 0,866 0,116 0,10 Konicky 0,535 0,769 0,739 0,13 0,063 Doma1 0,009 0,698 0,541-0,16 0,35 Doma 0,07 0,833 0,739-0,118 0,340 Doma3 0,08 0,741 0,584-0,108 0,318 Ruzne1 0,591 0,906 0,884 0,19 0,087 Ruzne 0,561 0,813 0,779 0,134 0, Seznam použité literatury [1] Hebák, P., Hustopecký, J., Pecáková, I., Průša, M., Řezanková, H., Svobodová, A., Vlach, P. Vícerozměrné statistické metody (3).. přepracované vydání, Informatorium, Praha, ISBN (007) 10

11 [] Legendre, P., Legendre, L. Numerical Ecology, nd Engl. Ed., Elsevier, Amsterdam, ISBN (1998) [3] Manly, B.F.J. Multivariate Statistical Methods. Second edition. Chapman & Hall. 3 pp. (1994) [4] Meloun, M., Militký, J. Kompendium statistického zpracování dat. Metody a řešené úlohy včetně CD. Academia. 766pp. (00). [5] StatSoft, Inc. STATISTICA (data analysis software system), version 1. (013) 11

12 Obsah Faktorová analýza... 1 Výstupy z výukové jednotky Princip faktorové analýzy Porovnání faktorové analýzy a analýzy hlavních komponent Model faktorové analýzy Rotace faktorů Příklad Seznam použité literatury

Faktorová analýza (FACT)

Faktorová analýza (FACT) Faktorová analýza (FAC) Podobně jako metoda hlavních komponent patří také faktorová analýza mezi metody redukce počtu původních proměnných. Ve faktorové analýze předpokládáme, že každou vstupující proměnnou

Více

AVDAT Mnohorozměrné metody metody redukce dimenze

AVDAT Mnohorozměrné metody metody redukce dimenze AVDAT Mnohorozměrné metody metody redukce dimenze Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Opakování vlastní čísla a vlastní vektory A je čtvercová matice řádu n. Pak

Více

Úvod do vícerozměrných metod. Statistické metody a zpracování dat. Faktorová a komponentní analýza (Úvod do vícerozměrných metod)

Úvod do vícerozměrných metod. Statistické metody a zpracování dat. Faktorová a komponentní analýza (Úvod do vícerozměrných metod) Úvod do vícerozměrných metod Statistické metody a zpracování dat Faktorová a komponentní analýza (Úvod do vícerozměrných metod) Petr Dobrovolný O řadě jevů či procesů máme k dispozici ne jeden statistický

Více

Statistické metody a zpracování dat. IX Faktorová a komponentní analýza (Úvod do vícerozměrných metod) Petr Dobrovolný

Statistické metody a zpracování dat. IX Faktorová a komponentní analýza (Úvod do vícerozměrných metod) Petr Dobrovolný Statistické metody a zpracování dat IX Faktorová a komponentní analýza (Úvod do vícerozměrných metod) Petr Dobrovolný Úvod do vícerozměrných metod O řadě jevů či procesů máme k dispozici ne jeden statistický

Více

Faktorová analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Faktorová analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz J. Neubauer, J. Michálek (Katedra ekonometrie UO) 1 / 27 úvod Na sledovaných objektech

Více

ZX510 Pokročilé statistické metody geografického výzkumu

ZX510 Pokročilé statistické metody geografického výzkumu ZX510 Pokročilé statistické metody geografického výzkumu Téma: Explorační faktorová analýza (analýza hlavních komponent) Smysl a princip faktorové analýzy v explorační verzi není faktorová analýza určena

Více

Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody

Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody Fakulta chemicko-technologická Katedra analytické chemie 3.2 Metody s latentními proměnnými a klasifikační metody Vypracoval: Ing. Tomáš Nekola Studium: licenční Datum: 21. 1. 2008 Otázka 1. Vypočtěte

Více

Faktorová analýza Osnova

Faktorová analýza Osnova Faktorová analýza Osnova Motivace Formulace modelu faktorové analýzy Vhodnost použití modelu faktorové analýzy Odhad faktorové matice a její rotace Volba počtu společných faktorů Odhad faktorového skóre

Více

Příklad 2: Obsah PCB v játrech zemřelých lidí. Zadání: Data: Program:

Příklad 2: Obsah PCB v játrech zemřelých lidí. Zadání: Data: Program: Příklad 2: Obsah PCB v játrech zemřelých lidí Zadání: V rámci Monitoringu zdraví byly měřeny koncentrace polychlorovaných bifenylů vjátrech lidí zemřelých náhodnou smrtí ve věku 40 let a více. Sedm vybraných

Více

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Autor práce : RNDr. Ivo Beroun,CSc. Vedoucí práce: prof. RNDr. Milan Meloun, DrSc. PROFILOVÁNÍ Profilování = klasifikace a rozlišování

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Univerzita Pardubice 8. licenční studium chemometrie

Univerzita Pardubice 8. licenční studium chemometrie Univerzita Pardubice 8. licenční studium chemometrie Statistické zpracování dat při managementu jakosti Semestrální práce Metody s latentními proměnnými a klasifikační metody Ing. Jan Balcárek, Ph.D. vedoucí

Více

Faktorová analýza příklad. Obrázek 1 Ukázka části vstupních dat

Faktorová analýza příklad. Obrázek 1 Ukázka části vstupních dat Faktorová analýza příklad Obrázek 1 Ukázka části vstupních dat Maticový graf vybraných proměnných: Fueltank Passengers Length Wheelbase Width U Turn Space Rear seat Luggage Weight Horsepower Engine Size

Více

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Maticí typu (m, n), kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru:

Maticí typu (m, n), kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru: 3 Maticový počet 3.1 Zavedení pojmu matice Maticí typu (m, n, kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru: a 11 a 12... a 1k... a 1n a 21 a 22...

Více

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti. Autor práce: Přednášející: Prof. RNDr. Milan Meloun, DrSc Zpracovávaná data jsou

Více

Kanonická korelační analýza

Kanonická korelační analýza Kanonická korelační analýza Kanonická korelační analýza je vícerozměrná metoda, která se používá ke zkoumání závislosti mezi dvěma skupinami proměnných. První ze skupin se považuje za soubor nezávisle

Více

SEMESTRÁLNÍ PRÁCE. Určení vnitřní struktury analýzou vícerozměrných dat. Ing. Pavel Bouchalík

SEMESTRÁLNÍ PRÁCE. Určení vnitřní struktury analýzou vícerozměrných dat. Ing. Pavel Bouchalík SEMESTRÁLNÍ PRÁCE Určení vnitřní struktury analýzou vícerozměrných dat Ing. Pavel Bouchalík 1. ZADÁNÍ Tato semestrální práce je písemným vypracováním zkouškových otázek z okruhu Určení vnitřní struktury

Více

Korelace. Komentované řešení pomocí MS Excel

Korelace. Komentované řešení pomocí MS Excel Korelace Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A2:B84 (viz. obrázek) Prvotní představu o tvaru a síle závislosti docházky a počtu bodů nám poskytne

Více

Faktorová analýza. PSY252 Statistická analýza dat v psychologii II

Faktorová analýza. PSY252 Statistická analýza dat v psychologii II Faktorová analýza PSY252 Statistická analýza dat v psychologii II 8.12.2010 Latentní a manifestní proměnné Perspektiva CTT: (pro)jevy, které spolu nějakým způsobem souvisejí, mají stejnou podstatu, jsou

Více

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení 2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků

Více

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie 12. licenční studium PYTHAGORAS Statistické zpracování dat 3.1 Matematické principy vícerozměrných metod statistické analýzy

Více

Univerzita Pardubice. Fakulta chemicko-technologická. Katedra analytické chemie. Semestrální práce. Licenční studium

Univerzita Pardubice. Fakulta chemicko-technologická. Katedra analytické chemie. Semestrální práce. Licenční studium Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie Semestrální práce Licenční studium Statistické zpracování dat při kontrole a řízení jakosti předmět 3.1. Matematické principy

Více

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými. POLYNOMICKÁ REGRESE Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými. y = b 0 + b 1 x + b 2 x 2 + + b n x n kde b i jsou neznámé parametry,

Více

S E M E S T R Á L N Í

S E M E S T R Á L N Í Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie S E M E S T R Á L N Í P R Á C E Licenční studium Statistické zpracování dat při managementu jakosti Předmět Určení vnitřní

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Stochastický proces Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2 } se nazývá stochastický proces

Více

Zpracování digitalizovaného obrazu (ZDO) - Popisy III

Zpracování digitalizovaného obrazu (ZDO) - Popisy III Zpracování digitalizovaného obrazu (ZDO) - Popisy III Statistické popisy tvaru a vzhledu Ing. Zdeněk Krňoul, Ph.D. Katedra Kybernetiky Fakulta aplikovaných věd Západočeská univerzita v Plzni Zpracování

Více

Počítačová analýza vícerozměrných dat v oborech přírodních, technických a společenských věd

Počítačová analýza vícerozměrných dat v oborech přírodních, technických a společenských věd Počítačová analýza vícerozměrných dat v oborech přírodních, technických a společenských věd Prof. RNDr. Milan Meloun, DrSc. (Univerzita Pardubice, Pardubice) 20.-24. června 2011 Tato prezentace je spolufinancována

Více

Analýza hlavních komponent

Analýza hlavních komponent Analýza hlavních komponent Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz J. Neubauer, J. Michálek (Katedra ekonometrie UO) Analýza

Více

Úlohy nejmenších čtverců

Úlohy nejmenších čtverců Úlohy nejmenších čtverců Petr Tichý 7. listopadu 2012 1 Problémy nejmenších čtverců Ax b Řešení Ax = b nemusí existovat, a pokud existuje, nemusí být jednoznačné. Často má smysl hledat x tak, že Ax b.

Více

Fakulta chemicko technologická Katedra analytické chemie

Fakulta chemicko technologická Katedra analytické chemie Fakulta chemicko technologická Katedra analytické chemie Licenční studium statistické zpracování dat Analýza vícerozměrných dat Ing. Pavel Valášek Školní rok OBSAH ÚVOD DATA EDA EXPLORATORÍ AALÝZA 4 PCA

Více

6. Lineární regresní modely

6. Lineární regresní modely 6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu

Více

Aplikovaná numerická matematika

Aplikovaná numerická matematika Aplikovaná numerická matematika 6. Metoda nejmenších čtverců doc. Ing. Róbert Lórencz, CSc. České vysoké učení technické v Praze Fakulta informačních technologií Katedra počítačových systémů Příprava studijních

Více

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů Časové řady, typy trendových funkcí a odhady trendů Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Jiří Neubauer (Katedra ekonometrie UO Brno) Časové

Více

Definice 13.1 Kvadratická forma v n proměnných s koeficienty z tělesa T je výraz tvaru. Kvadratická forma v n proměnných je tak polynom n proměnných s

Definice 13.1 Kvadratická forma v n proměnných s koeficienty z tělesa T je výraz tvaru. Kvadratická forma v n proměnných je tak polynom n proměnných s Kapitola 13 Kvadratické formy Definice 13.1 Kvadratická forma v n proměnných s koeficienty z tělesa T je výraz tvaru f(x 1,..., x n ) = a ij x i x j, kde koeficienty a ij T. j=i Kvadratická forma v n proměnných

Více

11 Analýza hlavních komponet

11 Analýza hlavních komponet 11 Analýza hlavních komponet Tato úloha provádí transformaci měřených dat na menší počet tzv. fiktivních dat tak, aby většina informace obsažená v původních datech zůstala zachována. Jedná se tedy o úlohu

Více

Měření závislosti statistických dat

Měření závislosti statistických dat 5.1 Měření závislosti statistických dat Každý pořádný astronom je schopen vám předpovědět, kde se bude nacházet daná hvězda půl hodiny před půlnocí. Ne každý je však téhož schopen předpovědět v případě

Více

Vektory a matice. Obsah. Aplikovaná matematika I. Carl Friedrich Gauss. Základní pojmy a operace

Vektory a matice. Obsah. Aplikovaná matematika I. Carl Friedrich Gauss. Základní pojmy a operace Vektory a matice Aplikovaná matematika I Dana Říhová Mendelu Brno Obsah 1 Vektory Základní pojmy a operace Lineární závislost a nezávislost vektorů 2 Matice Základní pojmy, druhy matic Operace s maticemi

Více

KORELACE. Komentované řešení pomocí programu Statistica

KORELACE. Komentované řešení pomocí programu Statistica KORELACE Komentované řešení pomocí programu Statistica Vstupní data I Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost

Více

AVDAT Mnohorozměrné metody, metody klasifikace

AVDAT Mnohorozměrné metody, metody klasifikace AVDAT Mnohorozměrné metody, metody klasifikace Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Mnohorozměrné metody Regrese jedna náhodná veličina je vysvětlována pomocí jiných

Více

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009

Více

8. Normální rozdělení

8. Normální rozdělení 8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, 2 ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) 2 e 2 2, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá

Více

Pearsonův korelační koeficient

Pearsonův korelační koeficient I I.I Pearsonův korelační koeficient Úvod Předpokládejme, že náhodně vybereme n objektů (nebo osob) ze zkoumané populace. Často se stává, že na každém z objektů měříme ne pouze jednu, ale několik kvantitativních

Více

Vliv realizace, vliv přesnosti centrace a určení výšky přístroje a cíle na přesnost určovaných veličin

Vliv realizace, vliv přesnosti centrace a určení výšky přístroje a cíle na přesnost určovaných veličin Vliv realizace, vliv přesnosti centrace a určení výšky přístroje a cíle na přesnost určovaných veličin doc. Ing. Martin Štroner, Ph.D. Fakulta stavební ČVUT v Praze 1 Úvod Při přesných inženýrsko geodetických

Více

Vícerozměrné statistické metody

Vícerozměrné statistické metody Vícerozměrné statistické metody Ordinační analýzy principy redukce dimenzionality Jiří Jarkovský, Simona Littnerová FSTA: Pokročilé statistické metody Ordinační analýza a její cíle Cíle ordinační analýzy

Více

AVDAT Klasický lineární model, metoda nejmenších

AVDAT Klasický lineární model, metoda nejmenších AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica Program Statistica I Statistica je velmi podobná Excelu. Na základní úrovni je to klikací program určený ke statistickému zpracování dat.

Více

Stavový model a Kalmanův filtr

Stavový model a Kalmanův filtr Stavový model a Kalmanův filtr 2 prosince 23 Stav je veličina, kterou neznáme, ale chtěli bychom znát Dozvídáme se o ní zprostředkovaně prostřednictvím výstupů Příkladem může býapř nějaký zašuměný signál,

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

Vícerozměrná rozdělení

Vícerozměrná rozdělení Vícerozměrná rozdělení 7. září 0 Učivo: Práce s vícerozměrnými rozděleními. Sdružené, marginální, podmíněné rozdělení pravděpodobnosti. Vektorová střední hodnota. Kovariance, korelace, kovarianční matice.

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO

Více

Příklad 2: Určení cihlářských surovin na základě chemické silikátové analýzy

Příklad 2: Určení cihlářských surovin na základě chemické silikátové analýzy Příklad 2: Určení cihlářských surovin na základě chemické silikátové analýzy Zadání: Deponie nadložních jílových sedimentů SHP byla testována za účelem využití v cihlářské výrobě. Z deponie bylo odebráno

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Náhodný vektor a jeho charakteristiky

Náhodný vektor a jeho charakteristiky Náhodný vektor a jeho číselné charakteristiky 1 Náhodný vektor a jeho charakteristiky V následující kapitole budeme věnovat pozornost pouze dvourozměřnému náhodnému vektoru, i když uvedené pojmy a jejich

Více

AVDAT Geometrie metody nejmenších čtverců

AVDAT Geometrie metody nejmenších čtverců AVDAT Geometrie metody nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model klasický lineární regresní model odhad parametrů MNČ y = Xβ + ε, ε

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

4. Aplikace matematiky v ekonomii

4. Aplikace matematiky v ekonomii 4. Aplikace matematiky v ekonomii 1 Lineární algebra Soustavy 1) Na základě statistických údajů se zjistilo, že závislost množství statku z poptávaného v průběhu jednoho týdne lze popsat vztahem q d =

Více

3.4 Určení vnitřní struktury analýzou vícerozměrných dat

3.4 Určení vnitřní struktury analýzou vícerozměrných dat 3. Určení vnitřní struktury analýzou vícerozměrných dat. Metoda hlavních komponent PCA Zadání: Byly provedeny analýzy chladící vody pro odběrové místa. Byly stanoveny parametry - ph, vodivost, celková

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých

Více

NÁHODNÝ VEKTOR. 4. cvičení

NÁHODNÝ VEKTOR. 4. cvičení NÁHODNÝ VEKTOR 4. cvičení Náhodný vektor Náhodným vektorem rozumíme sloupcový vektor X=(X, X,, X n ) složený z náhodných veličin X, X,, X n, který je charakterizován sdruženým rozdělením pravděpodobnosti.

Více

Teorie informace a kódování (KMI/TIK) Reed-Mullerovy kódy

Teorie informace a kódování (KMI/TIK) Reed-Mullerovy kódy Teorie informace a kódování (KMI/TIK) Reed-Mullerovy kódy Lukáš Havrlant Univerzita Palackého 10. ledna 2014 Primární zdroj Jiří Adámek: Foundations of Coding. Strany 137 160. Na webu ke stažení, heslo:

Více

31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě

31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě 31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě Motto Statistika nuda je, má však cenné údaje. strana 3 Statistické charakteristiky Charakteristiky polohy jsou kolem ní seskupeny ostatní hodnoty

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOS A SAISIKA Regresní analýza - motivace Základní úlohou regresní analýzy je nalezení vhodného modelu studované závislosti. Je nutné věnovat velkou pozornost tomu aby byla modelována REÁLNÁ

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Přednáška 13 Redukce dimenzionality

Přednáška 13 Redukce dimenzionality Vytěžování Dat Přednáška 13 Redukce dimenzionality Miroslav Čepek Fakulta Elektrotechnická, ČVUT Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti ČVUT (FEL) Redukce dimenzionality 1 /

Více

LIDSKÉ ZDROJE JAKO PŘEDPOKLAD REGIONÁLNÍHO ROZVOJE

LIDSKÉ ZDROJE JAKO PŘEDPOKLAD REGIONÁLNÍHO ROZVOJE ACTA UNIVERSITATIS AGRICULTURAE ET SILVICULTURAE MENDELIANAE BRUNENSIS SBORNÍK MENDELOVY ZEMĚDĚLSKÉ A LESNICKÉ UNIVERZITY V BRNĚ Ročník LV 17 Číslo 6, 2007 LIDSKÉ ZDROJE JAKO PŘEDPOKLAD REGIONÁLNÍHO ROZVOJE

Více

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Korelační a regresní analýza 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Pearsonův korelační koeficient u intervalových a poměrových dat můžeme jako

Více

Ilustrační příklad odhadu LRM v SW Gretl

Ilustrační příklad odhadu LRM v SW Gretl Ilustrační příklad odhadu LRM v SW Gretl Podkladové údaje Korelační matice Odhad lineárního regresního modelu (LRM) Verifikace modelu PEF ČZU Praha Určeno pro posluchače předmětu Ekonometrie Needitovaná

Více

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou Úvod.................................................................. 11 Kapitola 1 Než začneme.................................................................. 17 1.1 Logika kvantitativního výzkumu...........................................

Více

Vícerozměrné statistické metody

Vícerozměrné statistické metody Vícerozměrné statistické metody Ordinační analýzy přehled metod Jiří Jarkovský, Simona Littnerová FSTA: Pokročilé statistické metody Analýza hlavních komponent jako příklad výpočtu redukce dimenzionality

Více

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

Lineární regrese. Komentované řešení pomocí MS Excel

Lineární regrese. Komentované řešení pomocí MS Excel Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních

Více

MATEMATICKÉ PRINCIPY VÍCEROZMĚRNÉ ANALÝZY DAT

MATEMATICKÉ PRINCIPY VÍCEROZMĚRNÉ ANALÝZY DAT 8. licenční studium Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie MATEMATICKÉ PRINCIPY VÍCEROZMĚRNÉ ANALÝZY DAT Příklady: ) Najděte vlastní (charakteristická) čísla a vlastní

Více

Value at Risk. Karolína Maňáková

Value at Risk. Karolína Maňáková Value at Risk Karolína Maňáková Value at risk Historická metoda Model-Building přístup Lineární model variance a kovariance Metoda Monte Carlo Stress testing a Back testing Potenciální ztráta s danou pravděpodobností

Více

4 STATISTICKÁ ANALÝZA VÍCEROZMĚRNÝCH DAT

4 STATISTICKÁ ANALÝZA VÍCEROZMĚRNÝCH DAT 4 SAISICKÁ ANALÝZA VÍCEROZMĚRNÝCH DA V technické biologické ale také lékařské praxi se často vedle informací obsažených v náhodném skaláru ξ vyskytují i informace obsažené v náhodném vektoru ξ s m složkami

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 10. Mgr. David Fiedor 27. dubna 2015 Nelineární závislost - korelační poměr užití v případě, kdy regresní čára není přímka, ale je vyjádřena složitější matematickou funkcí

Více

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel Regresní analýza Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Regresní analýza 1 / 23

Více

Porovnání dvou výběrů

Porovnání dvou výběrů Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů

Více

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie ANOVA Semestrální práce Licenční studium Galileo Interaktivní statistická analýza dat Brno 2015 Ing. Petra Hlaváčková, Ph.D.

Více

UNIVERZITA PARDUBICE

UNIVERZITA PARDUBICE UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Licenční studium chemometrie na téma Statistické zpracování dat Semestrální práce ze 6. soustředění Předmět: 3.3 Tvorba nelineárních

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

LEKCE 11 FAKTOROVÁ ANALÝZA

LEKCE 11 FAKTOROVÁ ANALÝZA LEKCE 11 FAKTOROVÁ ANALÝZA Představuje způsob REDUKCE DAT: Jde o přeměnu souboru vzájemně korelovaných proměnných (matice jejich korelací) na menší soubor nekorelovaných faktorů, tento původní soubor reprezentující

Více

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé. 1. Korelační analýza V životě většinou nesledujeme pouze jeden statistický znak. Sledujeme více statistických znaků zároveň. Kromě vlastností statistických znaků nás zajímá také jejich těsnost (velikost,

Více

VYBRANÉ PARTIE Z NUMERICKÉ MATEMATIKY

VYBRANÉ PARTIE Z NUMERICKÉ MATEMATIKY VYBRANÉ PARTIE Z NUMERICKÉ MATEMATIKY Jan Krejčí 31. srpna 2006 jkrejci@physics.ujep.cz http://physics.ujep.cz/~jkrejci Obsah 1 Přímé metody řešení soustav lineárních rovnic 3 1.1 Gaussova eliminace...............................

Více

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D. Ing. Michal Dorda, Ph.D. 1 Př. 1: Cestující na vybraném spoji linky MHD byli dotazováni za účelem zjištění spokojenosti s kvalitou MHD. Legenda 1 Velmi spokojen Spokojen 3 Nespokojen 4 Velmi nespokojen

Více

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

MÍRY ZÁVISLOSTI (KORELACE A REGRESE) zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky

Více

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely ) Úloha M608 Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely ) Zadání : Při kvantitativní analýze lidského krevního séra ovlivňují hodnotu obsahu vysokohustotního

Více

MODEL TVÁŘECÍHO PROCESU

MODEL TVÁŘECÍHO PROCESU MODEL TVÁŘECÍHO PROCESU Zkouška tlakem na válcových vzorcích 2 Vyhodnocení tlakové zkoušky Síla F způsobí změnu výšky H a průměru D válce. V každém okamžiku při stlačování je přetvárný odpor definován

Více

Vzorová prezentace do předmětu Statistika

Vzorová prezentace do předmětu Statistika Vzorová prezentace do předmětu Statistika Popis situace: U 3 náhodně vybraných osob byly zjišťovány hodnoty těchto proměnných: SEX - muž, žena PUVOD Skandinávie, Středomoří, 3 západní Evropa IQ hodnota

Více

MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ

MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ v praxi u jednoho prvku souboru se často zkoumá více veličin, které mohou na sobě různě záviset jednorozměrný výběrový soubor VSS X vícerozměrným výběrovým souborem VSS

Více

Statistika II. Jiří Neubauer

Statistika II. Jiří Neubauer Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Časová řada konečná posloupnost reálných hodnot určitého sledovaného ukazatele měřeného v určitých

Více