Faktorová analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Rozměr: px
Začít zobrazení ze stránky:

Download "Faktorová analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel"

Transkript

1 Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel J. Neubauer, J. Michálek (Katedra ekonometrie UO) 1 / 27

2 úvod Na sledovaných objektech se často zjišťují hodnoty většího počtu statistických znaků nebo proměnných, ty jsou obvykle mezi sebou korelovány. Lze si představit, že korelace mezi jednotlivými proměnnými jsou způsobeny vlivem nějakého menšího počtu nepřímo měřitelných společných faktorů, které ovlivňují hodnoty sledovaných proměnných. Každý z těchto faktorů může ovlivnit hodnoty pozorování každé ze zkoumaných proměnných. Cílem faktorové analýzy pak je tyto faktory odhadnout, odhadnout počet statisticky významných faktorů a konečně odhadnout hodnoty každého z faktorů pro každý sledovaný objekt, tedy popsat objekty pomocí nalezených faktorů. V tomto směru je faktorová analýza metodou pro snížení rozsahu dat. Navíc sledováním realizací společných faktorů u jednotlivých objektů mohou být identifikovány výjimečné objekty. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 2 / 27

3 Ortogonální faktorový model Ortogonální faktorový model Ve faktorovém modelu předpokládáme, že p-rozměrný sloupcový náhodný vektor sledovaných proměnných X = (X 1,..., X p) se střední hodnotou µ a varianční maticí Σ lineárně závisí na m-rozměrném náhodném vektoru společných faktorů F = (F 1,..., F m) a p-rozměrném vektoru specifických faktorů ɛ = (ɛ 1,..., ɛ p). Maticově lze faktorový model zapsat X µ = LF + ɛ, kde L je matice typu p m. Speciálně pro i-tou proměnnou X i platí X i µ i = l i1 F 1 + l i2 F l im F m + ɛ i. V uvedeném modelu popisuje koeficient l ij vliv faktoru F j na proměnnou X i, a proto se matice L nazývá matice faktorových zátěží. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 3 / 27

4 Ortogonální faktorový model Ortogonální faktorový model Vektor společných faktorů F a vektor specifických faktorů ɛ nelze přímo pozorovat. Aby bylo možné je odhadnout, jsou na ně kladeny následující předpoklady. 1 Střední hodnoty obou těchto vektorů jsou nulové, tj. E(F ) = 0, E(ɛ) = 0. 2 Variační matice vektoru F je jednotková, tj. var(f ) = I, a varianční matice vektoru ɛ je diagonální, tj. var(ɛ) = Ψ = diag(ψ 1,..., ψ p). 3 Vektory F a ɛ jsou nekorelované, tedy jejich kovarianční matice cov(ɛ, F ) = 0. Za uvedených předpokladů lze snadno odvodit, že (X µ)(x µ) = (LF + ɛ)(lf + ɛ) = (LF + ɛ)((lf ) + ɛ ) = = LF (LF ) + ɛ(lf ) + LF ɛ + ɛɛ, odkud pro varianční matici vektoru sledovaných proměnných X platí neboli var(x ) = E(X µ)(x µ) = LE(FF )L + E(ɛF )L + LE(F ɛ ) + E(ɛɛ ) = = LL + Ψ, D(X i ) = li1 2 + li lim 2 + ψ i, i = 1, 2,..., p, C(X i, X k ) = l i1 l k1 + l i2 l k2 + + l im l km, i, k = 1, 2,..., p, i k. (1) J. Neubauer, J. Michálek (Katedra ekonometrie UO) 4 / 27

5 Ortogonální faktorový model Ortogonální faktorový model Dále platí, že kovarianční matice vektorů X a F je rovna matici faktorových zátěží L, tj. neboli cov(x, F ) = E[(X µ)f ] = E[(LF + ɛ)f ] = E[LFF + ɛf ] = = LE(FF ) + E(ɛF ) = L, C(X i, F j ) = l ij, i = 1, 2,... p, j = 1, 2,... m. V této souvislosti pak říkáme, že uvedená vyjádření varianční matice var(x) a kovarianční matice cov(x, F ) popisují kovarianční strukturu ortogonálního faktorového modelu. Model X µ = LF + ɛ je lineární vzhledem ke společným faktorům. Je-li vztah mezi X a faktory jiný než lineární, popis kovarianční struktury LL + Ψ uvedený v (1) nebude odpovídající. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 5 / 27

6 Ortogonální faktorový model Ortogonální faktorový model Ta část rozptylu proměnné X i, která je vysvětlená pomocí m společných faktorů, se nazývá komunalita ( communality ), příspěvek specifického faktoru k této variabilitě je označován jako specifický rozptyl, tedy σ }{{} ii = l i1 2 + li lim 2 + ψ i }{{}}{{} D(X i ) = komunalita + specifický rozptyl (2) Pro i-tou komunalitu h 2 i lze psát a rozptyl D(X i ) vyjádřit ve tvaru h 2 i = l 2 i1 + l 2 i2 + + l 2 im, σ ii = h 2 i + ψ i, i = 1, 2,..., p. Je-li dán ortogonální faktorový model, je třeba pomocí opakovaných nezávislých pozorování odhadnout matici faktorových zátěží L a dále najít odhady hodnot společných faktorů F 1... F p pro každou statistickou jednotku. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 6 / 27

7 Ortogonální faktorový model Ortogonální faktorový model Matice faktorových zátěží L a vektor společných faktorů F nejsou v daném ortogonálním modelu určeny jednoznačně. Pro libovolnou ortogonální transformací vektoru společných faktorů F získáme nový vektor společných faktorů F = T F (zde T je ortogonální matice typu m m, tj. TT = T T = I ) a novou matici faktorových zátěží L = LT, které opět splňují předpoklady modelu, neboť X µ = LTT F + ɛ = L F + ɛ, var(x ) = LTT L + Ψ = L L + Ψ. Jak bude dále naznačeno, lze uvedenou nejednoznačnost modelu s výhodou použít při interpretaci výsledků. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 7 / 27

8 Geometrická interpretace Geometrická interpretace Bylo nasimulováno 500 pozorování trojrozměrného náhodného vektoru X z normálního rozdělení s nulovou střední hodnotou a nediagonální varianční maticí Σ. Na obr. 1 jsou jednotlivá pozorování znázorněna body. Z obrázku je vidět, jaká je variabilita dat. V každém směru se souřadnice jednotlivých pozorování nacházejí přibližně v rozmezí od 4 do 4. Úsečky v 1 představují směry vlastních vektorů e 1, e 2 a e 3 varianční matice Σ. Jejich délky jsou úměrné vlastním číslům λ 1, λ 2 a λ 3 varianční matice Σ, λ 1 > λ 2 > λ 3. Elipsy v rovinách os znázorňují vrstevnice hustot příslušných dvourozměrných marginálních rozdělení. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 8 / 27

9 Geometrická interpretace Geometrická interpretace Obrázek: Simulovaná data před transformací J. Neubauer, J. Michálek (Katedra ekonometrie UO) 9 / 27

10 Geometrická interpretace Geometrická interpretace Když zvolíme novou souřadnou soustavu tak, že osa x bude ve směru vlastního vektoru e 1, osa y ve směru vlastního vektoru e 2 a osa z ve směru vlastního vektoru e 3 a všech 500 simulovaných bodů znázorníme v této nové souřadné soustavě, dostaneme situaci znázorněnou na obr. 2. Z tohoto obrázku je dobře patrné, že největší variabilita znázorněných bodů je ve směru nové osy x. Při tom není možné najít jiný směr, v němž by byla větší variabilita dat, než ve směru osy x, tedy ve směru určeném vlastním vektorem e 1. Vektor e 2, který udává směr nové osy y, zároveň udává směr, kolmý na osu x, v němž je opět největší variabilita ze všech těchto kolmých směrů. Konečně se ukazuje, že ve směru osy z, tedy ve směru vlastního vektoru v 3, je variabilita ze všech těchto tří směrů nejmenší. Variabilita znázorněných bodů ve směru vlastního vektoru v i je úměrná vlastnímu číslu λ i a pro celkovou variabilitu vektoru X platí σ 2 T (X ) = σ σ σ 2 3 = λ 1 + λ 2 + λ 3, zde σ 2 i = D(X i ). J. Neubauer, J. Michálek (Katedra ekonometrie UO) 10 / 27

11 Geometrická interpretace Geometrická interpretace Obrázek: Simulovaná data po transformaci do báze tvořené vlastními vektory varianční matice J. Neubauer, J. Michálek (Katedra ekonometrie UO) 11 / 27

12 Odhadování parametrů modelu Odhadování parametrů modelu Předpokládejme, že je předem znám pevný počet faktorů m. Při odhadování parametrů modelu vycházíme z náhodného výběru X 1,..., X n z rozdělení náhodného vektoru X. Tento výběr je často před zpracováním standardizován, takže předpokládáme, že výsledný výběr je pak z rozdělení standardizované náhodné veličiny Y = (Diag (Σ)) 1/2 (X µ), pro kterou lze faktorový model přepsat následovně Y = LF + ɛ, var(y) = cor(x ) = LL + Ψ. Z tohoto náhodného výběru nejdříve stanovíme výběrový průměr X jako odhad vektoru střední hodnoty µ dále odhadneme korelační matici cor(x ) výběrovou korelační maticí R. Pokud mimodiagonální prvky matice R nejsou malé, tj. pokud jsou složky náhodného vektoru X silně korelované, má smysl hledat společné faktory. V opačném případě by totiž hlavní roli hrály pouze specifické faktory. Z kovarianční struktury ortogonálního faktorového modelu vyplývá, že při faktorové analýze hledáme rozklad varianční matice Σ náhodného vektoru X na symetrickou, pozitivně definitní matici LL a diagonální matici Ψ. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 12 / 27

13 Odhadování parametrů modelu Metoda založená na hlavních komponentách Mějme varianční matici Σ a jí odpovídající dvojice vlastních čísel a vlastních vektorů (λ i, e i ), λ 1 λ 2 λ p 0, potom ji lze vyjádřit jako Σ = λ 1e 1e 1 + λ 2e 2e λ pe pe p = λ1e 1 ( λ1e = 1 λ2e 2 ) λ2e 2 λpe p. λpe p Uvedený rozklad se nazývá spektrální dekompozice. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 13 / 27

14 Odhadování parametrů modelu Metoda založená na hlavních komponentách Tímto lze popsat faktorový model mající tolik faktorů kolik proměnných (m = p) a specifické rozptyly ψ i = 0 pro všechna i, lze tedy psát Σ = (p p) L (p p) L + 0 = (p p) (p p) LL (3) Faktorové zátěže ( factor loadings ) j-tého faktoru jsou až na λ j rovny j-té hlavní komponentě. Reprezentace matice Σ popsaná v (3) je sice přesná, nicméně obsahuje stejný počet faktorů kolik je proměnných. Cílem bude najít model, který vystihuje kovarianční strukturu pomocí několika málo faktorů. Jednou z možností je zanedbání posledních p m členů ve spektrálním rozkladu, pokud odpovídající vlastní čísla jsou malá. λ1e 1 Σ =. ( ) λ1e λ2e 2 1 λ2e 2 λme m = L L (p m)(m p). λme m (4) J. Neubauer, J. Michálek (Katedra ekonometrie UO) 14 / 27

15 Odhadování parametrů modelu Metoda založená na hlavních komponentách Přibližné vyjádření popsané v (4) předpokládá, že specifické faktory ɛ lze zanedbat. Pokud tyto specifické faktory do modelu zahrneme, lze psát λ1e 1 Σ =. ( λ1e LL + Ψ = 1 λ2e 2 ) λ2e 2 ψ ψ 2 0 λme m ψ p λme m kde pro rozptyly ψ i specifických faktorů platí ψ i = σ ii m j=1 l 2 ij pro i = 1, 2,..., p. (5) J. Neubauer, J. Michálek (Katedra ekonometrie UO) 15 / 27

16 Odhadování parametrů modelu Metoda založená na hlavních komponentách Předtím, než uvedený postup aplikujeme na data (náhodný výběr), obvykle se provádí centrování odečtením výběrového průměru, případně standardizace proměnných. Výběrová kovarianční matice S takto standardizovaných proměnných je rovna výběrové korelační matici původních dat R. Mějme výběrovou kovarianční matici S, (ˆλ 1, ê 1), (ˆλ 2, ê 2),..., (ˆλ p, ê p), jsou dvojice vlastních čísel a vektorů této matice splňující ˆλ 1 ˆλ 2 ˆλ p. Předpokládejme, že m < p je počet společných faktorů. Odhad matice faktorových zátěží je dán výrazem ˆL = ( ˆλ 1ê 1 ˆλ 2ê 2 ˆλ mê m ). Odhady specifických rozptylů jsou diagonální prvky matice S ˆLˆL ˆψ ˆψ2 0 ˆΨ = , 0 0 ˆψp Komunality lze odhadnou ze vztahu ĥ 2 i = ˆl 2 i1 + ˆl 2 i2 + + ˆl 2 im. ˆψ i = s ii m ˆl ij. j=1 J. Neubauer, J. Michálek (Katedra ekonometrie UO) 16 / 27

17 Odhadování parametrů modelu Odhady metodou maximální věrohodnosti Jestliže předpokládáme, že společné faktory F a specifické faktory ɛ mají normální rozdělení, lze pro jejich odhady použít metodu maximální věrohodnosti. Věrohodnostní funkce má tvar L(µ, Σ) = (2π) np 2 Σ n 2 e 1 2 tr[σ 1 ( n j=1 (x j x)(x j x) +n(x µ)(x µ) )] = = (2π) (n 1)p 2 Σ n 1 2 e 1 2 tr[σ 1 ( n j=1 (x j x)(x j x) )] (6) (2π) p 2 Σ 1 2 e n 2 (x µ) Σ 1 (x µ). Věrohodnostní funkce (6) závisí na L a Ψ prostřednictvím Σ = LL + Ψ. Tento model není zcela jednoznačně definovaný vzhledem k možným volbám matice L. K modelu se obvykle přidá podmínka L Ψ 1 L = je diagonální matice. Maximálně věrohodné odhady ˆL a ˆΨ se získají numerickou maximalizací (6). Odhady komunalit jsou tvaru ĥ 2 i = ˆl 2 i1 + ˆl 2 i2 + + ˆl 2 im. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 17 / 27

18 Odhadování parametrů modelu Odhady metodou maximální věrohodnosti Pokud jsou proměnné standardizované, podobně jako tomu bylo u metody hlavních komponent, máme Z = V 1/2 (X µ), potom kovarianční matice je rovna matici korelační a platí ρ = V 1/2 ΣV 1/2 = (V 1/2 L)(V 1/2 L) + V 1/2 ΨV 1/2. Matice faktorových zátěží odpovídající ρ má tvar L z = V 1/2 L a matice specifických rozptylů je rovna Ψ z = V 1/2 ΨV 1/2. Maximálně věrohodný odhad ρ je potom dán výrazem ˆρ = ( ˆV 1/2 ˆL)( ˆV 1/2 ˆL) + ˆV 1/2 ˆΨ ˆV 1/2 = = ˆL z ˆL z + ˆΨ z Poznámka: Počítačové programy obvykle provádějí standardizaci proměnných, faktorizovaná je tedy výběrová korelační matice R. Díky tomu získáme maximálně věrohodné odhady ˆL z a ˆΨ z. Maximálně věrohodné odhady matice faktorových zátěží a specifických rozptylů odpovídající matici n 1 S jsou ˆL = ˆV 1/2 ˆL n z a ˆΨ = ˆV 1/2 ˆΨ z ˆV 1/2, neboli ˆl ij = ˆl z,ij ˆσii a ˆψ i = ˆψ z,i ˆσ ii, kde ˆσ ii v tomto případě neznačí výběrový rozptyl, ale rozptyl momentový. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 18 / 27

19 Stanovení počtu faktorů Stanovení počtu faktorů Obecně počet faktorů není známý. Uvažujme reziduální matici S (ˆLˆL + ˆΨ) získanou aproximací výběrové kovarianční matice S. Diagonální prvky jsou nulové, a pokud jsou i ostatní prvky matice malé, lze usoudit, že zvolený počet faktorů m je dostatečný. Pro jeho stanovení se při metodě hlavních komponent užívá podíl variability vysvětlené pomocí zvoleného počtu faktorů a celkové variability. Podíl j-tého faktoru na celkové výběrové variabilitě je ˆλ j s 11 + s s pp = ˆλ j ˆλ 1 + ˆλ ˆλ p, kde ˆλ i, ˆλ 1 ˆλ 2 ˆλ p jsou vlastní čísla matice S. Máme-li m faktorů, pak jejich relativní příspěvek k celkové variabilitě je m ˆλ m ˆλ j=1 j j=1 j p i=1 s = p ii ˆλ. i=1 i Snahou je nalézt takový počet faktorů m, při kterém je tento podíl dostatečně blízký 1. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 19 / 27

20 Stanovení počtu faktorů Stanovení počtu faktorů U metody maximální věrohodnosti je možné podíl j-tého faktoru na celkové variabilitě vyjádřit zlomkem ˆl 2 1j + ˆl 2 2j + + ˆl 2 pj s 11 + s s pp Za předpokladu normality lze odvodit test adekvátnosti modelu s m společnými faktory. Jedná se o test věrohodnostním poměrem a je založen a testovací statistice 2 ln ( ) n/2 ˆΣ [ ] + n tr( ˆΣ 1 S n) p S n kde ˆΣ = ˆLˆL + ˆΨ, ˆL, ˆΨ jsou odhady matic L a Ψ získané metodou maximální věrohodnosti a S n = n 1 S. Tato testovací statistika má asymptoticky rozdělení n χ2 (ν) se stupni volnosti ν = 1 [(p 2 m)2 (p + m)]. Lze dokázal, že výraz tr( ˆΣ 1 S n) p = 0, za předpokladu, že ˆΣ = ˆLˆL + ˆΨ je maximálně věrohodný odhad Σ = LL + Ψ. Dostáváme tedy testovací statistiku ( ) ˆΣ n ln. (7) S n J. Neubauer, J. Michálek (Katedra ekonometrie UO) 20 / 27

21 Stanovení počtu faktorů Stanovení počtu faktorů Je-li realizace této statistiky větší než příslušný kvantil χ 2 rozdělení, pak zamítáme hypotézu o dostatečném počtu faktorů. Aproximaci rozdělení testovací statistiky χ 2 rozdělením lze zpřesnit nahrazením n v testovací statistice (7) hodnotou n 1 (2p + 4m + 5)/6. Vzhledem k tomu, že stupně volnosti jsou kladné, pro použití testu musí platit nerovnost m < 1 2 (2p + 1 8p + 1). J. Neubauer, J. Michálek (Katedra ekonometrie UO) 21 / 27

22 Rotace faktorů Rotace faktorů Lepší interpretaci faktorů je možno získat po provedení ortogonální transformace společných faktorů. Takovou ortogonální transformací (rotací) neporušíme předpoklady modelu. Je-li ˆL odhad p m matice faktorových zátěží, potom ˆL = ˆLT, kde TT = T T = I, je p m matice rotovaných faktorových zátěží. Navíc odhadnuté kovarianční (nebo korelační) matice zůstávají nezměněny, neboť ˆLˆL + ˆΨ = ˆLTT ˆL + ˆΨ = ˆL ˆL + ˆΨ. (8) Z rovnice (8) lze usoudit, že reziduální matice S n ˆLˆL ˆΨ = S n ˆL ˆL ˆΨ zůstávají nezměněny. Totéž platí pro specifické rozptyly ˆψ i a komunality ĥ2 i. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 22 / 27

23 Rotace faktorů Rotace faktorů Původní matice faktorových zátěží nemusí být snadno interpretovatelná. V praxi je obvyklé provádět takovou rotaci, která umožní snadnější interpretaci. V ideálním případě docílit toho, aby každá proměnná byla silně zastoupena v jednom faktoru a v ostatních faktorech se již téměř nevyskytovala. Jedním z nejčastěji používaných kritérií optimální ortogonální transformace je varimax kritérium. Definujme l ij = ˆl ij /ĥ i jako rotované koeficienty škálované pomocí druhých odmocnin komunalit. Cílem je najít takovou ortogonální transformaci T, která maximalizuje výraz ) 2 ] V = 1 p [ m p j=1 i=1 l 4 ij 1 p ( p Po nalezení matice T přenásobíme získané zátěže l ij konstantami ĥi a získáme potřebné zátěže ˆl ij. Varimax kritérium tedy minimalizuje počet proměnných vysvětlovaných jedním faktorem. i=1 l 2 ij. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 23 / 27

24 Odhad společných faktorů Odhad společných faktorů Při faktorové analýze se pozornost obvykle zaměřuje na parametry faktorového modelu, nicméně odhady hodnot společných faktorů, které se nazývají faktorové skóry, mohou být také užitečné. Tyto hodnoty jsou často používány pro diagnostické účely, případně jako vstupy pro následující analýzy. Faktorové skóry nejsou odhady neznámých parametrů v obvyklém smyslu, jsou to odhady hodnot nepozorovaných náhodných faktorů F j, j = 1, 2,..., n. Faktorové skóry ˆf j tedy jsou odhady f j získané pro F j. Považujeme-li nyní získané odhady matic L a Ψ za skutečné pevné hodnoty, můžeme odhadnout společné faktory buď váženou metodou nejmenších čtverců, nebo metodou regresní. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 24 / 27

25 Odhad společných faktorů Odhad společných faktorů vážená metoda nejmenších čtverců Předpokládejme, že vektor středních hodnot µ, matice faktorových zátěží L a matice specifických rozptylů jsou ve faktorovém modelu známé, tedy X µ = L (p 1) (p 1) F + ɛ (p m)(m 1) (p 1) Považujme specifické faktory za chybové složky ɛ = (ɛ 1, ɛ 2,..., ɛ p). Protože rozptyly D(ɛ i ) = ψ i, i = 1, 2,..., p, nemusí být stejné, použijeme pro odhad společných faktorů váženou metodu nejmenších čtverců. Součet čtverců vážený převrácenými hodnotami rozptylů je p ɛ 2 i = ɛ Ψ 1 ɛ = (x µ Lf ) Ψ(x µ Lf ). (9) ψ i i=1 Minimalizací výrazu (9) lze získat odhad ˆf = (ˆL ˆΨ 1 ˆL) 1 ˆL ˆΨ 1 (X j µ). (10) J. Neubauer, J. Michálek (Katedra ekonometrie UO) 25 / 27

26 Odhad společných faktorů Odhad společných faktorů vážená metoda nejmenších čtverců Dosazením odhadů do (10) získáme faktorové skóry ve tvaru ˆf j = (ˆL ˆΨ 1 ˆL) 1 ˆL ˆΨ 1 (X j X ), j = 1, 2..., n. V případě, že byla faktorizována korelační matice, jsou faktorové skóry dány vztahem ˆf j = (ˆL z ) 1 1 ˆΨ z ˆL z ˆL 1 z ˆΨ z z j, j = 1, 2..., n, kde z j jsou standardizované proměnné a ˆρ = ˆL z ˆL z + ˆΨ z. Faktorové skóry mají nulovou střední hodnotu a nulovou výběrovou kovarianci. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 26 / 27

27 Odhad společných faktorů Odhad společných faktorů regresní metoda Regresní metoda vede k odhadu ˆf j = ˆL (ˆLˆL + ˆΨ) 1 (Xj X ), j = 1, 2,..., n. Z důvodu snížení efektu možného nesprávného určení počtu faktorů v modelu, je někdy místo matice ˆΣ = ˆLˆL + ˆΨ použita matice výběrová kovarianční matice S. Odhady potom mají tvar ˆf j = ˆL S 1 (X j X ), j = 1, 2,..., n. Byla-li faktorizována korelační matice, potom ˆf j = ˆL R 1 z, j = 1, 2,..., n. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 27 / 27

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

Analýza hlavních komponent

Analýza hlavních komponent Analýza hlavních komponent Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz J. Neubauer, J. Michálek (Katedra ekonometrie UO) Analýza

Více

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel Regresní analýza Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Regresní analýza 1 / 23

Více

Základy teorie odhadu parametrů bodový odhad

Základy teorie odhadu parametrů bodový odhad Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Odhady parametrů Úkolem výběrového šetření je podat informaci o neznámé hodnotě charakteristiky základního souboru

Více

AVDAT Mnohorozměrné metody metody redukce dimenze

AVDAT Mnohorozměrné metody metody redukce dimenze AVDAT Mnohorozměrné metody metody redukce dimenze Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Opakování vlastní čísla a vlastní vektory A je čtvercová matice řádu n. Pak

Více

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů Časové řady, typy trendových funkcí a odhady trendů Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Jiří Neubauer (Katedra ekonometrie UO Brno) Časové

Více

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Stochastický proces Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2 } se nazývá stochastický proces

Více

Bodové a intervalové odhady parametrů v regresním modelu

Bodové a intervalové odhady parametrů v regresním modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model Mějme lineární regresní model (LRM) Y = Xβ + e, kde y 1 e 1 β y 2 Y =., e

Více

Statistika II. Jiří Neubauer

Statistika II. Jiří Neubauer Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Zaměříme se především na popis dvourozměrných náhodných veličin (vektorů). Definice Nechť X a Y jsou

Více

AVDAT Geometrie metody nejmenších čtverců

AVDAT Geometrie metody nejmenších čtverců AVDAT Geometrie metody nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model klasický lineární regresní model odhad parametrů MNČ y = Xβ + ε, ε

Více

AVDAT Náhodný vektor, mnohorozměrné rozdělení

AVDAT Náhodný vektor, mnohorozměrné rozdělení AVDAT Náhodný vektor, mnohorozměrné rozdělení Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Opakování, náhodná veličina, rozdělení Náhodná veličina zobrazuje elementární

Více

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace Jan Slovák Masarykova univerzita Fakulta informatiky 28. 11 2. 12. 2016 Obsah přednášky 1 Literatura 2 Střední

Více

Výběrové charakteristiky a jejich rozdělení

Výběrové charakteristiky a jejich rozdělení Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový

Více

Definice 13.1 Kvadratická forma v n proměnných s koeficienty z tělesa T je výraz tvaru. Kvadratická forma v n proměnných je tak polynom n proměnných s

Definice 13.1 Kvadratická forma v n proměnných s koeficienty z tělesa T je výraz tvaru. Kvadratická forma v n proměnných je tak polynom n proměnných s Kapitola 13 Kvadratické formy Definice 13.1 Kvadratická forma v n proměnných s koeficienty z tělesa T je výraz tvaru f(x 1,..., x n ) = a ij x i x j, kde koeficienty a ij T. j=i Kvadratická forma v n proměnných

Více

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457. 0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti

Více

Charakterizace rozdělení

Charakterizace rozdělení Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf

Více

Úlohy nejmenších čtverců

Úlohy nejmenších čtverců Úlohy nejmenších čtverců Petr Tichý 7. listopadu 2012 1 Problémy nejmenších čtverců Ax b Řešení Ax = b nemusí existovat, a pokud existuje, nemusí být jednoznačné. Často má smysl hledat x tak, že Ax b.

Více

Náhodný vektor a jeho charakteristiky

Náhodný vektor a jeho charakteristiky Náhodný vektor a jeho číselné charakteristiky 1 Náhodný vektor a jeho charakteristiky V následující kapitole budeme věnovat pozornost pouze dvourozměřnému náhodnému vektoru, i když uvedené pojmy a jejich

Více

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé. 1. Korelační analýza V životě většinou nesledujeme pouze jeden statistický znak. Sledujeme více statistických znaků zároveň. Kromě vlastností statistických znaků nás zajímá také jejich těsnost (velikost,

Více

AVDAT Klasický lineární model, metoda nejmenších

AVDAT Klasický lineární model, metoda nejmenších AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

Výstupy z výukové jednotky. 2. Princip faktorové analýzy

Výstupy z výukové jednotky. 2. Princip faktorové analýzy Faktorová analýza Faktorová analýza je vícerozměrná statistická metoda, jejíž podstatou je rozbor struktury vzájemných závislostí proměnných na základě předpokladu, že jsou tyto závislosti důsledkem působení

Více

LINEÁRNÍ MODELY. Zdeňka Veselá

LINEÁRNÍ MODELY. Zdeňka Veselá LINEÁRNÍ MODELY Zdeňka Veselá vesela.zdenka@vuzv.cz Genetika kvantitativních vlastností Jednotlivé geny nejsou zjistitelné ani měřitelné Efekty většího počtu genů poskytují variabilitu, kterou lze většinou

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

Úvod do analýzy časových řad

Úvod do analýzy časových řad Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2... } se nazývá stochastický

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

Mnohorozměrná statistická data

Mnohorozměrná statistická data Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistický znak, statistický soubor Jednotlivé objekty nebo subjekty, které jsou při statistickém

Více

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina. Parametrické metody odhadů z neúplných výběrů 2 1 Metoda maximální věrohodnosti pro cenzorované výběry 11 Náhodné cenzorování Při sledování složitých reálných systémů často nemáme možnost uspořádat experiment

Více

7. Analýza rozptylu.

7. Analýza rozptylu. 7. Analýza rozptylu. Uvedeme obecnou ideu, která je založena na minimalizaci chyby metodou nejmenších čtverců. Nejdříve uvedeme několik základních tvrzení. Uvažujeme náhodný vektor Y = (Y, Y,..., Y n a

Více

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOS A SAISIKA Regresní analýza - motivace Základní úlohou regresní analýzy je nalezení vhodného modelu studované závislosti. Je nutné věnovat velkou pozornost tomu aby byla modelována REÁLNÁ

Více

MATEMATICKÉ PRINCIPY VÍCEROZMĚRNÉ ANALÝZY DAT

MATEMATICKÉ PRINCIPY VÍCEROZMĚRNÉ ANALÝZY DAT 8. licenční studium Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie MATEMATICKÉ PRINCIPY VÍCEROZMĚRNÉ ANALÝZY DAT Příklady: ) Najděte vlastní (charakteristická) čísla a vlastní

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2017/2018 Tutoriál č. 2:, náhodný vektor Jan Kracík jan.kracik@vsb.cz náhodná veličina rozdělení pravděpodobnosti náhodné

Více

Mnohorozměrná statistická data

Mnohorozměrná statistická data Mnohorozměrná statistická data Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Mnohorozměrná

Více

Aplikovaná numerická matematika

Aplikovaná numerická matematika Aplikovaná numerická matematika 6. Metoda nejmenších čtverců doc. Ing. Róbert Lórencz, CSc. České vysoké učení technické v Praze Fakulta informačních technologií Katedra počítačových systémů Příprava studijních

Více

Poznámky k předmětu Aplikovaná statistika, 4. téma

Poznámky k předmětu Aplikovaná statistika, 4. téma Poznámky k předmětu Aplikovaná statistika, 4. téma 4. Náhodné vektory V praxi se nám může hodit postihnout více vlastností jednoho objektu najednou, např. výšku, váhu a pohlaví člověka; rychlost chemické

Více

Regresní a korelační analýza

Regresní a korelační analýza Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Regresní analýza Cíl regresní analýzy: stanovení formy (trendu, tvaru, průběhu)

Více

Kontingenční tabulky, korelační koeficienty

Kontingenční tabulky, korelační koeficienty Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Budeme předpokládat, že X a Y jsou kvalitativní náhodné veličiny, obor hodnot X obsahuje r hodnot (kategorií,

Více

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel Analýza rozptylu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 1 / 30 Analýza

Více

Poznámky k předmětu Aplikovaná statistika, 4. téma

Poznámky k předmětu Aplikovaná statistika, 4. téma Poznámky k předmětu Aplikovaná statistika, 4. téma 4. Náhodné vektory V praxi se nám může hodit postihnout více vlastností jednoho objektu najednou, např. výšku, váhu a pohlaví člověka; rychlost chemické

Více

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně 7 Náhodný vektor Nezávislost náhodných veličin Definice 7 Nechť je dán pravděpodobnostní prostor (Ω, A, P) Zobrazení X : Ω R n, které je A-měřitelné, se nazývá (n-rozměrný) náhodný vektor Měřitelností

Více

EUKLIDOVSKÉ PROSTORY

EUKLIDOVSKÉ PROSTORY EUKLIDOVSKÉ PROSTORY Necht L je lineární vektorový prostor nad tělesem reálných čísel R. Zobrazení (.,.) : L L R splňující vlastnosti 1. (x, x) 0 x L, (x, x) = 0 x = 0, 2. (x, y) = (y, x) x, y L, 3. (λx,

Více

odpovídá jedna a jen jedna hodnota jiných

odpovídá jedna a jen jedna hodnota jiných 8. Regresní a korelační analýza Problém: hledání, zkoumání a hodnocení souvislostí, závislostí mezi dvěma a více statistickými znaky (veličinami). Typy závislostí: pevné a volné Pevná závislost každé hodnotě

Více

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

MATEMATICKÁ STATISTIKA.   Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým

Více

Modely stacionárních časových řad

Modely stacionárních časových řad Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Proces bílého šumu Proces {ɛ t} nazveme bílým šumem s nulovou střední hodnotou a rozptylem σ 2 a

Více

Testování předpokladů pro metodu chain-ladder. Seminář z aktuárských věd Petra Španihelová

Testování předpokladů pro metodu chain-ladder. Seminář z aktuárských věd Petra Španihelová Testování předpokladů pro metodu chain-ladder Seminář z aktuárských věd 4. 11. 2016 Petra Španihelová Obsah Datová struktura Posouzení dat Předpoklady metody chain-ladder dle T. Macka Běžná lineární regrese

Více

n = 2 Sdružená distribuční funkce (joint d.f.) n. vektoru F (x, y) = P (X x, Y y)

n = 2 Sdružená distribuční funkce (joint d.f.) n. vektoru F (x, y) = P (X x, Y y) 5. NÁHODNÝ VEKTOR 5.1. Rozdělení náhodného vektoru Náhodný vektor X = (X 1, X 2,..., X n ) T n-rozměrný vektor, složky X i, i = 1,..., n náhodné veličiny. Vícerozměrná (n-rozměrná) náhodná veličina n =

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

Normální rozložení a odvozená rozložení

Normální rozložení a odvozená rozložení I Normální rozložení a odvozená rozložení I.I Normální rozložení Data, se kterými pracujeme, pocházejí z různých rozložení. Mohou být vychýlena (doleva popř. doprava, nebo v nich není na první pohled vidět

Více

8 Coxův model proporcionálních rizik I

8 Coxův model proporcionálních rizik I 8 Coxův model proporcionálních rizik I Předpokládané výstupy z výuky: 1. Student umí formulovat Coxův model proporcionálních rizik 2. Student rozumí významu regresních koeficientů modelu 3. Student zná

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Přijímací zkouška na navazující magisterské studium 2017

Přijímací zkouška na navazující magisterské studium 2017 Přijímací zkouška na navazující magisterské studium 27 Studijní program: Studijní obor: Matematika Finanční a pojistná matematika Varianta A Řešení příkladů pečlivě odůvodněte. Věnujte pozornost ověření

Více

MATICE. a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij]

MATICE. a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij] MATICE Matice typu m/n nad tělesem T je soubor m n prvků z tělesa T uspořádaných do m řádků a n sloupců: a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij] a m1 a m2 a mn Prvek a i,j je prvek matice A na místě

Více

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D. Ing. Michal Dorda, Ph.D. 1 Př. 1: Cestující na vybraném spoji linky MHD byli dotazováni za účelem zjištění spokojenosti s kvalitou MHD. Legenda 1 Velmi spokojen Spokojen 3 Nespokojen 4 Velmi nespokojen

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě

Více

Úvod do vícerozměrných metod. Statistické metody a zpracování dat. Faktorová a komponentní analýza (Úvod do vícerozměrných metod)

Úvod do vícerozměrných metod. Statistické metody a zpracování dat. Faktorová a komponentní analýza (Úvod do vícerozměrných metod) Úvod do vícerozměrných metod Statistické metody a zpracování dat Faktorová a komponentní analýza (Úvod do vícerozměrných metod) Petr Dobrovolný O řadě jevů či procesů máme k dispozici ne jeden statistický

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

3 Bodové odhady a jejich vlastnosti

3 Bodové odhady a jejich vlastnosti 3 Bodové odhady a jejich vlastnosti 3.1 Statistika (Skripta str. 77) Výběr pořizujeme proto, abychom se (více) dověděli o souboru, ze kterého jsme výběr pořídili. Zde se soustředíme na situaci, kdy známe

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 2. KAPITOLA PODMÍNĚNÁ PRAVDĚPODOBNOST 3. KAPITOLA NÁHODNÁ VELIČINA 9.11.2017 Opakování Uveďte příklad aplikace geometrické definice pravděpodobnosti

Více

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin Příklady k procvičení z Matematické statistiky Poslední úprava. listopadu 207. Konvergence posloupnosti náhodných veličin. Necht X, X 2... jsou nezávislé veličiny s rovnoměrným rozdělením na [0, ]. Definujme

Více

Vlastnosti odhadů ukazatelů způsobilosti

Vlastnosti odhadů ukazatelů způsobilosti Vlastnosti odhadů ukazatelů způsobilosti Jiří Michálek CQR při Ústavu teorie informace a automatizace AV ČR v Praze Úvod Ve výzkumné zprávě č 06 Odhady koeficientů způsobilosti a jejich vlastnosti viz

Více

Faktorová analýza (FACT)

Faktorová analýza (FACT) Faktorová analýza (FAC) Podobně jako metoda hlavních komponent patří také faktorová analýza mezi metody redukce počtu původních proměnných. Ve faktorové analýze předpokládáme, že každou vstupující proměnnou

Více

Odhady Parametrů Lineární Regrese

Odhady Parametrů Lineární Regrese Odhady Parametrů Lineární Regrese Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké

Více

12. cvičení z PST. 20. prosince 2017

12. cvičení z PST. 20. prosince 2017 1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace

Více

Ekonometrie. Jiří Neubauer

Ekonometrie. Jiří Neubauer Úvod do analýzy časových řad Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Úvod do analýzy

Více

Pravděpodobnost a statistika (BI-PST) Cvičení č. 7

Pravděpodobnost a statistika (BI-PST) Cvičení č. 7 Pravděpodobnost a statistika (BI-PST) Cvičení č. 7 R. Blažek, M. Jiřina, J. Hrabáková, I. Petr, F. Štampach, D. Vašata Katedra aplikované matematiky Fakulta informačních technologií České vysoké učení

Více

NMAI059 Pravděpodobnost a statistika

NMAI059 Pravděpodobnost a statistika NMAI059 Pravděpodobnost a statistika podle přednášky Daniela Hlubinky (hlubinka@karlin.mff.cuni.cz) zapsal Pavel Obdržálek (pobdr@matfyz.cz) 205/20 poslední změna: 4. prosince 205 . přednáška. 0. 205 )

Více

Lineární zobrazení. 1. A(x y) = A(x) A(y) (vlastnost aditivity) 2. A(α x) = α A(x) (vlastnost homogenity)

Lineární zobrazení. 1. A(x y) = A(x) A(y) (vlastnost aditivity) 2. A(α x) = α A(x) (vlastnost homogenity) 4 Lineární zobrazení Definice: Nechť V a W jsou vektorové prostory Zobrazení A : V W (zobrazení z V do W nazýváme lineárním zobrazením, pokud pro všechna x V, y V a α R platí 1 A(x y = A(x A(y (vlastnost

Více

Vícerozměrná rozdělení

Vícerozměrná rozdělení Vícerozměrná rozdělení 7. září 0 Učivo: Práce s vícerozměrnými rozděleními. Sdružené, marginální, podmíněné rozdělení pravděpodobnosti. Vektorová střední hodnota. Kovariance, korelace, kovarianční matice.

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Statistické metody a zpracování dat. IX Faktorová a komponentní analýza (Úvod do vícerozměrných metod) Petr Dobrovolný

Statistické metody a zpracování dat. IX Faktorová a komponentní analýza (Úvod do vícerozměrných metod) Petr Dobrovolný Statistické metody a zpracování dat IX Faktorová a komponentní analýza (Úvod do vícerozměrných metod) Petr Dobrovolný Úvod do vícerozměrných metod O řadě jevů či procesů máme k dispozici ne jeden statistický

Více

Bodové a intervalové odhady parametrů v regresním modelu

Bodové a intervalové odhady parametrů v regresním modelu Bodové a intervalové odhady parametrů v regresním modelu 1 Odhady parametrů 11 Bodové odhady Mějme lineární regresní model (LRM) kde Y = y 1 y 2 y n, e = e 1 e 2 e n Y = Xβ + e, x 11 x 1k, X =, β = x n1

Více

Statistika II. Jiří Neubauer

Statistika II. Jiří Neubauer Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Časová řada konečná posloupnost reálných hodnot určitého sledovaného ukazatele měřeného v určitých

Více

Ekonometrie. Jiří Neubauer, Jaroslav Michálek

Ekonometrie. Jiří Neubauer, Jaroslav Michálek Ekonometrie Jiří Neubauer, Jaroslav Michálek Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz J. Neubauer, J. Michálek (Katedra ekonometrie UO) Zobecněný lineární

Více

STATISTICKÁ VAZBA. 1.1 Statistická vazba Charakteristiky statistické vazby dvou náhodných veličin Literatura 9

STATISTICKÁ VAZBA. 1.1 Statistická vazba Charakteristiky statistické vazby dvou náhodných veličin Literatura 9 STATISTICKÁ VAZBA Obsah 1 Korelační analýza 1 1.1 Statistická vazba.................................... 1 1.2 Motivační příklady................................... 1 1.3 Sdružená distribuční funkce a nezávislost

Více

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I

Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I Příklad Tahová síla papíru používaného pro výrobu potravinových sáčků je důležitá charakteristika kvality. Je známo, že síla

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné

Více

Vlastní čísla a vlastní vektory

Vlastní čísla a vlastní vektory 5 Vlastní čísla a vlastní vektor Poznámka: Je-li A : V V lineární zobrazení z prostoru V do prostoru V někd se takové zobrazení nazývá lineárním operátorem, pak je přirozeným požadavkem najít takovou bázi

Více

9 Kolmost vektorových podprostorů

9 Kolmost vektorových podprostorů 9 Kolmost vektorových podprostorů Od kolmosti dvou vektorů nyní přejdeme ke kolmosti dvou vektorových podprostorů. Budeme se zabývat otázkou, kdy jsou dva vektorové podprostory na sebe kolmé a jak to poznáme.

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie ZS 2015/16 Cvičení 1: Opakování ze statistiky LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Z čeho studovat 1) Z KNIHY Krkošková,

Více

Faktorová analýza Osnova

Faktorová analýza Osnova Faktorová analýza Osnova Motivace Formulace modelu faktorové analýzy Vhodnost použití modelu faktorové analýzy Odhad faktorové matice a její rotace Volba počtu společných faktorů Odhad faktorového skóre

Více

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D. Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít

Více

Chyby měření 210DPSM

Chyby měření 210DPSM Chyby měření 210DPSM Jan Zatloukal Stručný přehled Zdroje a druhy chyb Systematické chyby měření Náhodné chyby měření Spojité a diskrétní náhodné veličiny Normální rozdělení a jeho vlastnosti Odhad parametrů

Více

vyjádřete ve tvaru lineární kombinace čtverců (lineární kombinace druhých mocnin). Rozhodněte o definitnosti kvadratické formy κ(x).

vyjádřete ve tvaru lineární kombinace čtverců (lineární kombinace druhých mocnin). Rozhodněte o definitnosti kvadratické formy κ(x). Řešené příklady z lineární algebry - část 6 Typové příklady s řešením Příklad 6.: Kvadratickou formu κ(x) = x x 6x 6x x + 8x x 8x x vyjádřete ve tvaru lineární kombinace čtverců (lineární kombinace druhých

Více

Charakteristika datového souboru

Charakteristika datového souboru Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním

Více

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je = Příklad 1 Metodou nejmenších čtverců nalezněte odhad lineární regresní funkce popisující závislost mezi výnosy pšenice a množstvím použitého hnojiva na základě hodnot výběrového souboru uvedeného v tabulce.

Více

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Výsledky některých náhodných pokusů jsou přímo vyjádřeny číselně (např. při hodu kostkou padne 6). Náhodnou veličinou

Více

Markovské metody pro modelování pravděpodobnosti

Markovské metody pro modelování pravděpodobnosti Markovské metody pro modelování pravděpodobnosti rizikových stavů 1 Markovský řetězec Budeme uvažovat náhodný proces s diskrétním časem (náhodnou posloupnost) X(t), t T {0, 1, 2,... } s konečnou množinou

Více

MATEMATICKÁ STATISTIKA - XP01MST

MATEMATICKÁ STATISTIKA - XP01MST MATEMATICKÁ STATISTIKA - XP01MST 1. Úvod. Matematická statistika (statistics) se zabývá vyšetřováním zákonitostí, které v sobě obsahují prvek náhody. Zpracováním hodnot, které jsou výstupem sledovaného

Více

1 Linearní prostory nad komplexními čísly

1 Linearní prostory nad komplexními čísly 1 Linearní prostory nad komplexními čísly V této přednášce budeme hledat kořeny polynomů, které se dále budou moci vyskytovat jako složky vektorů nebo matic Vzhledem k tomu, že kořeny polynomu (i reálného)

Více

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) cvičení z PSI 0-4 prosince 06 Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) Z realizací náhodných veličin X a Y s normálním rozdělením) jsme z výběrů daného rozsahu obdrželi

Více

5. T e s t o v á n í h y p o t é z

5. T e s t o v á n í h y p o t é z 5. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009

Více