Faktorová analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel
|
|
- Jaroslava Machová
- před 5 lety
- Počet zobrazení:
Transkript
1 Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel J. Neubauer, J. Michálek (Katedra ekonometrie UO) 1 / 27
2 úvod Na sledovaných objektech se často zjišťují hodnoty většího počtu statistických znaků nebo proměnných, ty jsou obvykle mezi sebou korelovány. Lze si představit, že korelace mezi jednotlivými proměnnými jsou způsobeny vlivem nějakého menšího počtu nepřímo měřitelných společných faktorů, které ovlivňují hodnoty sledovaných proměnných. Každý z těchto faktorů může ovlivnit hodnoty pozorování každé ze zkoumaných proměnných. Cílem faktorové analýzy pak je tyto faktory odhadnout, odhadnout počet statisticky významných faktorů a konečně odhadnout hodnoty každého z faktorů pro každý sledovaný objekt, tedy popsat objekty pomocí nalezených faktorů. V tomto směru je faktorová analýza metodou pro snížení rozsahu dat. Navíc sledováním realizací společných faktorů u jednotlivých objektů mohou být identifikovány výjimečné objekty. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 2 / 27
3 Ortogonální faktorový model Ortogonální faktorový model Ve faktorovém modelu předpokládáme, že p-rozměrný sloupcový náhodný vektor sledovaných proměnných X = (X 1,..., X p) se střední hodnotou µ a varianční maticí Σ lineárně závisí na m-rozměrném náhodném vektoru společných faktorů F = (F 1,..., F m) a p-rozměrném vektoru specifických faktorů ɛ = (ɛ 1,..., ɛ p). Maticově lze faktorový model zapsat X µ = LF + ɛ, kde L je matice typu p m. Speciálně pro i-tou proměnnou X i platí X i µ i = l i1 F 1 + l i2 F l im F m + ɛ i. V uvedeném modelu popisuje koeficient l ij vliv faktoru F j na proměnnou X i, a proto se matice L nazývá matice faktorových zátěží. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 3 / 27
4 Ortogonální faktorový model Ortogonální faktorový model Vektor společných faktorů F a vektor specifických faktorů ɛ nelze přímo pozorovat. Aby bylo možné je odhadnout, jsou na ně kladeny následující předpoklady. 1 Střední hodnoty obou těchto vektorů jsou nulové, tj. E(F ) = 0, E(ɛ) = 0. 2 Variační matice vektoru F je jednotková, tj. var(f ) = I, a varianční matice vektoru ɛ je diagonální, tj. var(ɛ) = Ψ = diag(ψ 1,..., ψ p). 3 Vektory F a ɛ jsou nekorelované, tedy jejich kovarianční matice cov(ɛ, F ) = 0. Za uvedených předpokladů lze snadno odvodit, že (X µ)(x µ) = (LF + ɛ)(lf + ɛ) = (LF + ɛ)((lf ) + ɛ ) = = LF (LF ) + ɛ(lf ) + LF ɛ + ɛɛ, odkud pro varianční matici vektoru sledovaných proměnných X platí neboli var(x ) = E(X µ)(x µ) = LE(FF )L + E(ɛF )L + LE(F ɛ ) + E(ɛɛ ) = = LL + Ψ, D(X i ) = li1 2 + li lim 2 + ψ i, i = 1, 2,..., p, C(X i, X k ) = l i1 l k1 + l i2 l k2 + + l im l km, i, k = 1, 2,..., p, i k. (1) J. Neubauer, J. Michálek (Katedra ekonometrie UO) 4 / 27
5 Ortogonální faktorový model Ortogonální faktorový model Dále platí, že kovarianční matice vektorů X a F je rovna matici faktorových zátěží L, tj. neboli cov(x, F ) = E[(X µ)f ] = E[(LF + ɛ)f ] = E[LFF + ɛf ] = = LE(FF ) + E(ɛF ) = L, C(X i, F j ) = l ij, i = 1, 2,... p, j = 1, 2,... m. V této souvislosti pak říkáme, že uvedená vyjádření varianční matice var(x) a kovarianční matice cov(x, F ) popisují kovarianční strukturu ortogonálního faktorového modelu. Model X µ = LF + ɛ je lineární vzhledem ke společným faktorům. Je-li vztah mezi X a faktory jiný než lineární, popis kovarianční struktury LL + Ψ uvedený v (1) nebude odpovídající. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 5 / 27
6 Ortogonální faktorový model Ortogonální faktorový model Ta část rozptylu proměnné X i, která je vysvětlená pomocí m společných faktorů, se nazývá komunalita ( communality ), příspěvek specifického faktoru k této variabilitě je označován jako specifický rozptyl, tedy σ }{{} ii = l i1 2 + li lim 2 + ψ i }{{}}{{} D(X i ) = komunalita + specifický rozptyl (2) Pro i-tou komunalitu h 2 i lze psát a rozptyl D(X i ) vyjádřit ve tvaru h 2 i = l 2 i1 + l 2 i2 + + l 2 im, σ ii = h 2 i + ψ i, i = 1, 2,..., p. Je-li dán ortogonální faktorový model, je třeba pomocí opakovaných nezávislých pozorování odhadnout matici faktorových zátěží L a dále najít odhady hodnot společných faktorů F 1... F p pro každou statistickou jednotku. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 6 / 27
7 Ortogonální faktorový model Ortogonální faktorový model Matice faktorových zátěží L a vektor společných faktorů F nejsou v daném ortogonálním modelu určeny jednoznačně. Pro libovolnou ortogonální transformací vektoru společných faktorů F získáme nový vektor společných faktorů F = T F (zde T je ortogonální matice typu m m, tj. TT = T T = I ) a novou matici faktorových zátěží L = LT, které opět splňují předpoklady modelu, neboť X µ = LTT F + ɛ = L F + ɛ, var(x ) = LTT L + Ψ = L L + Ψ. Jak bude dále naznačeno, lze uvedenou nejednoznačnost modelu s výhodou použít při interpretaci výsledků. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 7 / 27
8 Geometrická interpretace Geometrická interpretace Bylo nasimulováno 500 pozorování trojrozměrného náhodného vektoru X z normálního rozdělení s nulovou střední hodnotou a nediagonální varianční maticí Σ. Na obr. 1 jsou jednotlivá pozorování znázorněna body. Z obrázku je vidět, jaká je variabilita dat. V každém směru se souřadnice jednotlivých pozorování nacházejí přibližně v rozmezí od 4 do 4. Úsečky v 1 představují směry vlastních vektorů e 1, e 2 a e 3 varianční matice Σ. Jejich délky jsou úměrné vlastním číslům λ 1, λ 2 a λ 3 varianční matice Σ, λ 1 > λ 2 > λ 3. Elipsy v rovinách os znázorňují vrstevnice hustot příslušných dvourozměrných marginálních rozdělení. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 8 / 27
9 Geometrická interpretace Geometrická interpretace Obrázek: Simulovaná data před transformací J. Neubauer, J. Michálek (Katedra ekonometrie UO) 9 / 27
10 Geometrická interpretace Geometrická interpretace Když zvolíme novou souřadnou soustavu tak, že osa x bude ve směru vlastního vektoru e 1, osa y ve směru vlastního vektoru e 2 a osa z ve směru vlastního vektoru e 3 a všech 500 simulovaných bodů znázorníme v této nové souřadné soustavě, dostaneme situaci znázorněnou na obr. 2. Z tohoto obrázku je dobře patrné, že největší variabilita znázorněných bodů je ve směru nové osy x. Při tom není možné najít jiný směr, v němž by byla větší variabilita dat, než ve směru osy x, tedy ve směru určeném vlastním vektorem e 1. Vektor e 2, který udává směr nové osy y, zároveň udává směr, kolmý na osu x, v němž je opět největší variabilita ze všech těchto kolmých směrů. Konečně se ukazuje, že ve směru osy z, tedy ve směru vlastního vektoru v 3, je variabilita ze všech těchto tří směrů nejmenší. Variabilita znázorněných bodů ve směru vlastního vektoru v i je úměrná vlastnímu číslu λ i a pro celkovou variabilitu vektoru X platí σ 2 T (X ) = σ σ σ 2 3 = λ 1 + λ 2 + λ 3, zde σ 2 i = D(X i ). J. Neubauer, J. Michálek (Katedra ekonometrie UO) 10 / 27
11 Geometrická interpretace Geometrická interpretace Obrázek: Simulovaná data po transformaci do báze tvořené vlastními vektory varianční matice J. Neubauer, J. Michálek (Katedra ekonometrie UO) 11 / 27
12 Odhadování parametrů modelu Odhadování parametrů modelu Předpokládejme, že je předem znám pevný počet faktorů m. Při odhadování parametrů modelu vycházíme z náhodného výběru X 1,..., X n z rozdělení náhodného vektoru X. Tento výběr je často před zpracováním standardizován, takže předpokládáme, že výsledný výběr je pak z rozdělení standardizované náhodné veličiny Y = (Diag (Σ)) 1/2 (X µ), pro kterou lze faktorový model přepsat následovně Y = LF + ɛ, var(y) = cor(x ) = LL + Ψ. Z tohoto náhodného výběru nejdříve stanovíme výběrový průměr X jako odhad vektoru střední hodnoty µ dále odhadneme korelační matici cor(x ) výběrovou korelační maticí R. Pokud mimodiagonální prvky matice R nejsou malé, tj. pokud jsou složky náhodného vektoru X silně korelované, má smysl hledat společné faktory. V opačném případě by totiž hlavní roli hrály pouze specifické faktory. Z kovarianční struktury ortogonálního faktorového modelu vyplývá, že při faktorové analýze hledáme rozklad varianční matice Σ náhodného vektoru X na symetrickou, pozitivně definitní matici LL a diagonální matici Ψ. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 12 / 27
13 Odhadování parametrů modelu Metoda založená na hlavních komponentách Mějme varianční matici Σ a jí odpovídající dvojice vlastních čísel a vlastních vektorů (λ i, e i ), λ 1 λ 2 λ p 0, potom ji lze vyjádřit jako Σ = λ 1e 1e 1 + λ 2e 2e λ pe pe p = λ1e 1 ( λ1e = 1 λ2e 2 ) λ2e 2 λpe p. λpe p Uvedený rozklad se nazývá spektrální dekompozice. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 13 / 27
14 Odhadování parametrů modelu Metoda založená na hlavních komponentách Tímto lze popsat faktorový model mající tolik faktorů kolik proměnných (m = p) a specifické rozptyly ψ i = 0 pro všechna i, lze tedy psát Σ = (p p) L (p p) L + 0 = (p p) (p p) LL (3) Faktorové zátěže ( factor loadings ) j-tého faktoru jsou až na λ j rovny j-té hlavní komponentě. Reprezentace matice Σ popsaná v (3) je sice přesná, nicméně obsahuje stejný počet faktorů kolik je proměnných. Cílem bude najít model, který vystihuje kovarianční strukturu pomocí několika málo faktorů. Jednou z možností je zanedbání posledních p m členů ve spektrálním rozkladu, pokud odpovídající vlastní čísla jsou malá. λ1e 1 Σ =. ( ) λ1e λ2e 2 1 λ2e 2 λme m = L L (p m)(m p). λme m (4) J. Neubauer, J. Michálek (Katedra ekonometrie UO) 14 / 27
15 Odhadování parametrů modelu Metoda založená na hlavních komponentách Přibližné vyjádření popsané v (4) předpokládá, že specifické faktory ɛ lze zanedbat. Pokud tyto specifické faktory do modelu zahrneme, lze psát λ1e 1 Σ =. ( λ1e LL + Ψ = 1 λ2e 2 ) λ2e 2 ψ ψ 2 0 λme m ψ p λme m kde pro rozptyly ψ i specifických faktorů platí ψ i = σ ii m j=1 l 2 ij pro i = 1, 2,..., p. (5) J. Neubauer, J. Michálek (Katedra ekonometrie UO) 15 / 27
16 Odhadování parametrů modelu Metoda založená na hlavních komponentách Předtím, než uvedený postup aplikujeme na data (náhodný výběr), obvykle se provádí centrování odečtením výběrového průměru, případně standardizace proměnných. Výběrová kovarianční matice S takto standardizovaných proměnných je rovna výběrové korelační matici původních dat R. Mějme výběrovou kovarianční matici S, (ˆλ 1, ê 1), (ˆλ 2, ê 2),..., (ˆλ p, ê p), jsou dvojice vlastních čísel a vektorů této matice splňující ˆλ 1 ˆλ 2 ˆλ p. Předpokládejme, že m < p je počet společných faktorů. Odhad matice faktorových zátěží je dán výrazem ˆL = ( ˆλ 1ê 1 ˆλ 2ê 2 ˆλ mê m ). Odhady specifických rozptylů jsou diagonální prvky matice S ˆLˆL ˆψ ˆψ2 0 ˆΨ = , 0 0 ˆψp Komunality lze odhadnou ze vztahu ĥ 2 i = ˆl 2 i1 + ˆl 2 i2 + + ˆl 2 im. ˆψ i = s ii m ˆl ij. j=1 J. Neubauer, J. Michálek (Katedra ekonometrie UO) 16 / 27
17 Odhadování parametrů modelu Odhady metodou maximální věrohodnosti Jestliže předpokládáme, že společné faktory F a specifické faktory ɛ mají normální rozdělení, lze pro jejich odhady použít metodu maximální věrohodnosti. Věrohodnostní funkce má tvar L(µ, Σ) = (2π) np 2 Σ n 2 e 1 2 tr[σ 1 ( n j=1 (x j x)(x j x) +n(x µ)(x µ) )] = = (2π) (n 1)p 2 Σ n 1 2 e 1 2 tr[σ 1 ( n j=1 (x j x)(x j x) )] (6) (2π) p 2 Σ 1 2 e n 2 (x µ) Σ 1 (x µ). Věrohodnostní funkce (6) závisí na L a Ψ prostřednictvím Σ = LL + Ψ. Tento model není zcela jednoznačně definovaný vzhledem k možným volbám matice L. K modelu se obvykle přidá podmínka L Ψ 1 L = je diagonální matice. Maximálně věrohodné odhady ˆL a ˆΨ se získají numerickou maximalizací (6). Odhady komunalit jsou tvaru ĥ 2 i = ˆl 2 i1 + ˆl 2 i2 + + ˆl 2 im. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 17 / 27
18 Odhadování parametrů modelu Odhady metodou maximální věrohodnosti Pokud jsou proměnné standardizované, podobně jako tomu bylo u metody hlavních komponent, máme Z = V 1/2 (X µ), potom kovarianční matice je rovna matici korelační a platí ρ = V 1/2 ΣV 1/2 = (V 1/2 L)(V 1/2 L) + V 1/2 ΨV 1/2. Matice faktorových zátěží odpovídající ρ má tvar L z = V 1/2 L a matice specifických rozptylů je rovna Ψ z = V 1/2 ΨV 1/2. Maximálně věrohodný odhad ρ je potom dán výrazem ˆρ = ( ˆV 1/2 ˆL)( ˆV 1/2 ˆL) + ˆV 1/2 ˆΨ ˆV 1/2 = = ˆL z ˆL z + ˆΨ z Poznámka: Počítačové programy obvykle provádějí standardizaci proměnných, faktorizovaná je tedy výběrová korelační matice R. Díky tomu získáme maximálně věrohodné odhady ˆL z a ˆΨ z. Maximálně věrohodné odhady matice faktorových zátěží a specifických rozptylů odpovídající matici n 1 S jsou ˆL = ˆV 1/2 ˆL n z a ˆΨ = ˆV 1/2 ˆΨ z ˆV 1/2, neboli ˆl ij = ˆl z,ij ˆσii a ˆψ i = ˆψ z,i ˆσ ii, kde ˆσ ii v tomto případě neznačí výběrový rozptyl, ale rozptyl momentový. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 18 / 27
19 Stanovení počtu faktorů Stanovení počtu faktorů Obecně počet faktorů není známý. Uvažujme reziduální matici S (ˆLˆL + ˆΨ) získanou aproximací výběrové kovarianční matice S. Diagonální prvky jsou nulové, a pokud jsou i ostatní prvky matice malé, lze usoudit, že zvolený počet faktorů m je dostatečný. Pro jeho stanovení se při metodě hlavních komponent užívá podíl variability vysvětlené pomocí zvoleného počtu faktorů a celkové variability. Podíl j-tého faktoru na celkové výběrové variabilitě je ˆλ j s 11 + s s pp = ˆλ j ˆλ 1 + ˆλ ˆλ p, kde ˆλ i, ˆλ 1 ˆλ 2 ˆλ p jsou vlastní čísla matice S. Máme-li m faktorů, pak jejich relativní příspěvek k celkové variabilitě je m ˆλ m ˆλ j=1 j j=1 j p i=1 s = p ii ˆλ. i=1 i Snahou je nalézt takový počet faktorů m, při kterém je tento podíl dostatečně blízký 1. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 19 / 27
20 Stanovení počtu faktorů Stanovení počtu faktorů U metody maximální věrohodnosti je možné podíl j-tého faktoru na celkové variabilitě vyjádřit zlomkem ˆl 2 1j + ˆl 2 2j + + ˆl 2 pj s 11 + s s pp Za předpokladu normality lze odvodit test adekvátnosti modelu s m společnými faktory. Jedná se o test věrohodnostním poměrem a je založen a testovací statistice 2 ln ( ) n/2 ˆΣ [ ] + n tr( ˆΣ 1 S n) p S n kde ˆΣ = ˆLˆL + ˆΨ, ˆL, ˆΨ jsou odhady matic L a Ψ získané metodou maximální věrohodnosti a S n = n 1 S. Tato testovací statistika má asymptoticky rozdělení n χ2 (ν) se stupni volnosti ν = 1 [(p 2 m)2 (p + m)]. Lze dokázal, že výraz tr( ˆΣ 1 S n) p = 0, za předpokladu, že ˆΣ = ˆLˆL + ˆΨ je maximálně věrohodný odhad Σ = LL + Ψ. Dostáváme tedy testovací statistiku ( ) ˆΣ n ln. (7) S n J. Neubauer, J. Michálek (Katedra ekonometrie UO) 20 / 27
21 Stanovení počtu faktorů Stanovení počtu faktorů Je-li realizace této statistiky větší než příslušný kvantil χ 2 rozdělení, pak zamítáme hypotézu o dostatečném počtu faktorů. Aproximaci rozdělení testovací statistiky χ 2 rozdělením lze zpřesnit nahrazením n v testovací statistice (7) hodnotou n 1 (2p + 4m + 5)/6. Vzhledem k tomu, že stupně volnosti jsou kladné, pro použití testu musí platit nerovnost m < 1 2 (2p + 1 8p + 1). J. Neubauer, J. Michálek (Katedra ekonometrie UO) 21 / 27
22 Rotace faktorů Rotace faktorů Lepší interpretaci faktorů je možno získat po provedení ortogonální transformace společných faktorů. Takovou ortogonální transformací (rotací) neporušíme předpoklady modelu. Je-li ˆL odhad p m matice faktorových zátěží, potom ˆL = ˆLT, kde TT = T T = I, je p m matice rotovaných faktorových zátěží. Navíc odhadnuté kovarianční (nebo korelační) matice zůstávají nezměněny, neboť ˆLˆL + ˆΨ = ˆLTT ˆL + ˆΨ = ˆL ˆL + ˆΨ. (8) Z rovnice (8) lze usoudit, že reziduální matice S n ˆLˆL ˆΨ = S n ˆL ˆL ˆΨ zůstávají nezměněny. Totéž platí pro specifické rozptyly ˆψ i a komunality ĥ2 i. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 22 / 27
23 Rotace faktorů Rotace faktorů Původní matice faktorových zátěží nemusí být snadno interpretovatelná. V praxi je obvyklé provádět takovou rotaci, která umožní snadnější interpretaci. V ideálním případě docílit toho, aby každá proměnná byla silně zastoupena v jednom faktoru a v ostatních faktorech se již téměř nevyskytovala. Jedním z nejčastěji používaných kritérií optimální ortogonální transformace je varimax kritérium. Definujme l ij = ˆl ij /ĥ i jako rotované koeficienty škálované pomocí druhých odmocnin komunalit. Cílem je najít takovou ortogonální transformaci T, která maximalizuje výraz ) 2 ] V = 1 p [ m p j=1 i=1 l 4 ij 1 p ( p Po nalezení matice T přenásobíme získané zátěže l ij konstantami ĥi a získáme potřebné zátěže ˆl ij. Varimax kritérium tedy minimalizuje počet proměnných vysvětlovaných jedním faktorem. i=1 l 2 ij. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 23 / 27
24 Odhad společných faktorů Odhad společných faktorů Při faktorové analýze se pozornost obvykle zaměřuje na parametry faktorového modelu, nicméně odhady hodnot společných faktorů, které se nazývají faktorové skóry, mohou být také užitečné. Tyto hodnoty jsou často používány pro diagnostické účely, případně jako vstupy pro následující analýzy. Faktorové skóry nejsou odhady neznámých parametrů v obvyklém smyslu, jsou to odhady hodnot nepozorovaných náhodných faktorů F j, j = 1, 2,..., n. Faktorové skóry ˆf j tedy jsou odhady f j získané pro F j. Považujeme-li nyní získané odhady matic L a Ψ za skutečné pevné hodnoty, můžeme odhadnout společné faktory buď váženou metodou nejmenších čtverců, nebo metodou regresní. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 24 / 27
25 Odhad společných faktorů Odhad společných faktorů vážená metoda nejmenších čtverců Předpokládejme, že vektor středních hodnot µ, matice faktorových zátěží L a matice specifických rozptylů jsou ve faktorovém modelu známé, tedy X µ = L (p 1) (p 1) F + ɛ (p m)(m 1) (p 1) Považujme specifické faktory za chybové složky ɛ = (ɛ 1, ɛ 2,..., ɛ p). Protože rozptyly D(ɛ i ) = ψ i, i = 1, 2,..., p, nemusí být stejné, použijeme pro odhad společných faktorů váženou metodu nejmenších čtverců. Součet čtverců vážený převrácenými hodnotami rozptylů je p ɛ 2 i = ɛ Ψ 1 ɛ = (x µ Lf ) Ψ(x µ Lf ). (9) ψ i i=1 Minimalizací výrazu (9) lze získat odhad ˆf = (ˆL ˆΨ 1 ˆL) 1 ˆL ˆΨ 1 (X j µ). (10) J. Neubauer, J. Michálek (Katedra ekonometrie UO) 25 / 27
26 Odhad společných faktorů Odhad společných faktorů vážená metoda nejmenších čtverců Dosazením odhadů do (10) získáme faktorové skóry ve tvaru ˆf j = (ˆL ˆΨ 1 ˆL) 1 ˆL ˆΨ 1 (X j X ), j = 1, 2..., n. V případě, že byla faktorizována korelační matice, jsou faktorové skóry dány vztahem ˆf j = (ˆL z ) 1 1 ˆΨ z ˆL z ˆL 1 z ˆΨ z z j, j = 1, 2..., n, kde z j jsou standardizované proměnné a ˆρ = ˆL z ˆL z + ˆΨ z. Faktorové skóry mají nulovou střední hodnotu a nulovou výběrovou kovarianci. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 26 / 27
27 Odhad společných faktorů Odhad společných faktorů regresní metoda Regresní metoda vede k odhadu ˆf j = ˆL (ˆLˆL + ˆΨ) 1 (Xj X ), j = 1, 2,..., n. Z důvodu snížení efektu možného nesprávného určení počtu faktorů v modelu, je někdy místo matice ˆΣ = ˆLˆL + ˆΨ použita matice výběrová kovarianční matice S. Odhady potom mají tvar ˆf j = ˆL S 1 (X j X ), j = 1, 2,..., n. Byla-li faktorizována korelační matice, potom ˆf j = ˆL R 1 z, j = 1, 2,..., n. J. Neubauer, J. Michálek (Katedra ekonometrie UO) 27 / 27
Testování hypotéz o parametrech regresního modelu
Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO
VíceTestování hypotéz o parametrech regresního modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,
VíceAnalýza hlavních komponent
Analýza hlavních komponent Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz J. Neubauer, J. Michálek (Katedra ekonometrie UO) Analýza
VíceRegresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel
Regresní analýza Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Regresní analýza 1 / 23
VíceZáklady teorie odhadu parametrů bodový odhad
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Odhady parametrů Úkolem výběrového šetření je podat informaci o neznámé hodnotě charakteristiky základního souboru
VíceAVDAT Mnohorozměrné metody metody redukce dimenze
AVDAT Mnohorozměrné metody metody redukce dimenze Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Opakování vlastní čísla a vlastní vektory A je čtvercová matice řádu n. Pak
VíceČasové řady, typy trendových funkcí a odhady trendů
Časové řady, typy trendových funkcí a odhady trendů Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Jiří Neubauer (Katedra ekonometrie UO Brno) Časové
VíceČasové řady, typy trendových funkcí a odhady trendů
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Stochastický proces Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2 } se nazývá stochastický proces
VíceBodové a intervalové odhady parametrů v regresním modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model Mějme lineární regresní model (LRM) Y = Xβ + e, kde y 1 e 1 β y 2 Y =., e
VíceStatistika II. Jiří Neubauer
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Zaměříme se především na popis dvourozměrných náhodných veličin (vektorů). Definice Nechť X a Y jsou
VíceAVDAT Geometrie metody nejmenších čtverců
AVDAT Geometrie metody nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model klasický lineární regresní model odhad parametrů MNČ y = Xβ + ε, ε
VíceAVDAT Náhodný vektor, mnohorozměrné rozdělení
AVDAT Náhodný vektor, mnohorozměrné rozdělení Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Opakování, náhodná veličina, rozdělení Náhodná veličina zobrazuje elementární
VíceMatematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace
Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace Jan Slovák Masarykova univerzita Fakulta informatiky 28. 11 2. 12. 2016 Obsah přednášky 1 Literatura 2 Střední
VíceVýběrové charakteristiky a jejich rozdělení
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový
VíceDefinice 13.1 Kvadratická forma v n proměnných s koeficienty z tělesa T je výraz tvaru. Kvadratická forma v n proměnných je tak polynom n proměnných s
Kapitola 13 Kvadratické formy Definice 13.1 Kvadratická forma v n proměnných s koeficienty z tělesa T je výraz tvaru f(x 1,..., x n ) = a ij x i x j, kde koeficienty a ij T. j=i Kvadratická forma v n proměnných
Více10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.
0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti
VíceCharakterizace rozdělení
Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf
VíceÚlohy nejmenších čtverců
Úlohy nejmenších čtverců Petr Tichý 7. listopadu 2012 1 Problémy nejmenších čtverců Ax b Řešení Ax = b nemusí existovat, a pokud existuje, nemusí být jednoznačné. Často má smysl hledat x tak, že Ax b.
VíceNáhodný vektor a jeho charakteristiky
Náhodný vektor a jeho číselné charakteristiky 1 Náhodný vektor a jeho charakteristiky V následující kapitole budeme věnovat pozornost pouze dvourozměřnému náhodnému vektoru, i když uvedené pojmy a jejich
VíceNáhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.
1. Korelační analýza V životě většinou nesledujeme pouze jeden statistický znak. Sledujeme více statistických znaků zároveň. Kromě vlastností statistických znaků nás zajímá také jejich těsnost (velikost,
VíceAVDAT Klasický lineární model, metoda nejmenších
AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i
VíceOdhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
VíceVýstupy z výukové jednotky. 2. Princip faktorové analýzy
Faktorová analýza Faktorová analýza je vícerozměrná statistická metoda, jejíž podstatou je rozbor struktury vzájemných závislostí proměnných na základě předpokladu, že jsou tyto závislosti důsledkem působení
VíceLINEÁRNÍ MODELY. Zdeňka Veselá
LINEÁRNÍ MODELY Zdeňka Veselá vesela.zdenka@vuzv.cz Genetika kvantitativních vlastností Jednotlivé geny nejsou zjistitelné ani měřitelné Efekty většího počtu genů poskytují variabilitu, kterou lze většinou
Více1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou
VíceÚvod do analýzy časových řad
Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2... } se nazývá stochastický
VíceRegresní analýza 1. Regresní analýza
Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému
VíceMnohorozměrná statistická data
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistický znak, statistický soubor Jednotlivé objekty nebo subjekty, které jsou při statistickém
Vícejevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.
Parametrické metody odhadů z neúplných výběrů 2 1 Metoda maximální věrohodnosti pro cenzorované výběry 11 Náhodné cenzorování Při sledování složitých reálných systémů často nemáme možnost uspořádat experiment
Více7. Analýza rozptylu.
7. Analýza rozptylu. Uvedeme obecnou ideu, která je založena na minimalizaci chyby metodou nejmenších čtverců. Nejdříve uvedeme několik základních tvrzení. Uvažujeme náhodný vektor Y = (Y, Y,..., Y n a
VíceTestování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,
VíceOdhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOS A SAISIKA Regresní analýza - motivace Základní úlohou regresní analýzy je nalezení vhodného modelu studované závislosti. Je nutné věnovat velkou pozornost tomu aby byla modelována REÁLNÁ
VíceMATEMATICKÉ PRINCIPY VÍCEROZMĚRNÉ ANALÝZY DAT
8. licenční studium Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie MATEMATICKÉ PRINCIPY VÍCEROZMĚRNÉ ANALÝZY DAT Příklady: ) Najděte vlastní (charakteristická) čísla a vlastní
VícePravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík
Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2017/2018 Tutoriál č. 2:, náhodný vektor Jan Kracík jan.kracik@vsb.cz náhodná veličina rozdělení pravděpodobnosti náhodné
VíceMnohorozměrná statistická data
Mnohorozměrná statistická data Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Mnohorozměrná
VíceAplikovaná numerická matematika
Aplikovaná numerická matematika 6. Metoda nejmenších čtverců doc. Ing. Róbert Lórencz, CSc. České vysoké učení technické v Praze Fakulta informačních technologií Katedra počítačových systémů Příprava studijních
VícePoznámky k předmětu Aplikovaná statistika, 4. téma
Poznámky k předmětu Aplikovaná statistika, 4. téma 4. Náhodné vektory V praxi se nám může hodit postihnout více vlastností jednoho objektu najednou, např. výšku, váhu a pohlaví člověka; rychlost chemické
VíceRegresní a korelační analýza
Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Regresní analýza Cíl regresní analýzy: stanovení formy (trendu, tvaru, průběhu)
VíceKontingenční tabulky, korelační koeficienty
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Budeme předpokládat, že X a Y jsou kvalitativní náhodné veličiny, obor hodnot X obsahuje r hodnot (kategorií,
VíceAnalýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel
Analýza rozptylu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 1 / 30 Analýza
VícePoznámky k předmětu Aplikovaná statistika, 4. téma
Poznámky k předmětu Aplikovaná statistika, 4. téma 4. Náhodné vektory V praxi se nám může hodit postihnout více vlastností jednoho objektu najednou, např. výšku, váhu a pohlaví člověka; rychlost chemické
VíceDefinice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně
7 Náhodný vektor Nezávislost náhodných veličin Definice 7 Nechť je dán pravděpodobnostní prostor (Ω, A, P) Zobrazení X : Ω R n, které je A-měřitelné, se nazývá (n-rozměrný) náhodný vektor Měřitelností
VíceEUKLIDOVSKÉ PROSTORY
EUKLIDOVSKÉ PROSTORY Necht L je lineární vektorový prostor nad tělesem reálných čísel R. Zobrazení (.,.) : L L R splňující vlastnosti 1. (x, x) 0 x L, (x, x) = 0 x = 0, 2. (x, y) = (y, x) x, y L, 3. (λx,
Víceodpovídá jedna a jen jedna hodnota jiných
8. Regresní a korelační analýza Problém: hledání, zkoumání a hodnocení souvislostí, závislostí mezi dvěma a více statistickými znaky (veličinami). Typy závislostí: pevné a volné Pevná závislost každé hodnotě
VíceMATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci
MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým
VíceModely stacionárních časových řad
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Proces bílého šumu Proces {ɛ t} nazveme bílým šumem s nulovou střední hodnotou a rozptylem σ 2 a
VíceTestování předpokladů pro metodu chain-ladder. Seminář z aktuárských věd Petra Španihelová
Testování předpokladů pro metodu chain-ladder Seminář z aktuárských věd 4. 11. 2016 Petra Španihelová Obsah Datová struktura Posouzení dat Předpoklady metody chain-ladder dle T. Macka Běžná lineární regrese
Vícen = 2 Sdružená distribuční funkce (joint d.f.) n. vektoru F (x, y) = P (X x, Y y)
5. NÁHODNÝ VEKTOR 5.1. Rozdělení náhodného vektoru Náhodný vektor X = (X 1, X 2,..., X n ) T n-rozměrný vektor, složky X i, i = 1,..., n náhodné veličiny. Vícerozměrná (n-rozměrná) náhodná veličina n =
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
VíceNormální rozložení a odvozená rozložení
I Normální rozložení a odvozená rozložení I.I Normální rozložení Data, se kterými pracujeme, pocházejí z různých rozložení. Mohou být vychýlena (doleva popř. doprava, nebo v nich není na první pohled vidět
Více8 Coxův model proporcionálních rizik I
8 Coxův model proporcionálních rizik I Předpokládané výstupy z výuky: 1. Student umí formulovat Coxův model proporcionálních rizik 2. Student rozumí významu regresních koeficientů modelu 3. Student zná
Více15. T e s t o v á n í h y p o t é z
15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
VícePřijímací zkouška na navazující magisterské studium 2017
Přijímací zkouška na navazující magisterské studium 27 Studijní program: Studijní obor: Matematika Finanční a pojistná matematika Varianta A Řešení příkladů pečlivě odůvodněte. Věnujte pozornost ověření
VíceMATICE. a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij]
MATICE Matice typu m/n nad tělesem T je soubor m n prvků z tělesa T uspořádaných do m řádků a n sloupců: a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij] a m1 a m2 a mn Prvek a i,j je prvek matice A na místě
VíceZpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.
Ing. Michal Dorda, Ph.D. 1 Př. 1: Cestující na vybraném spoji linky MHD byli dotazováni za účelem zjištění spokojenosti s kvalitou MHD. Legenda 1 Velmi spokojen Spokojen 3 Nespokojen 4 Velmi nespokojen
Více1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě
VíceÚvod do vícerozměrných metod. Statistické metody a zpracování dat. Faktorová a komponentní analýza (Úvod do vícerozměrných metod)
Úvod do vícerozměrných metod Statistické metody a zpracování dat Faktorová a komponentní analýza (Úvod do vícerozměrných metod) Petr Dobrovolný O řadě jevů či procesů máme k dispozici ne jeden statistický
Více15. T e s t o v á n í h y p o t é z
15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
Více3 Bodové odhady a jejich vlastnosti
3 Bodové odhady a jejich vlastnosti 3.1 Statistika (Skripta str. 77) Výběr pořizujeme proto, abychom se (více) dověděli o souboru, ze kterého jsme výběr pořídili. Zde se soustředíme na situaci, kdy známe
VícePravděpodobnost a aplikovaná statistika
Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 2. KAPITOLA PODMÍNĚNÁ PRAVDĚPODOBNOST 3. KAPITOLA NÁHODNÁ VELIČINA 9.11.2017 Opakování Uveďte příklad aplikace geometrické definice pravděpodobnosti
Vícez Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin
Příklady k procvičení z Matematické statistiky Poslední úprava. listopadu 207. Konvergence posloupnosti náhodných veličin. Necht X, X 2... jsou nezávislé veličiny s rovnoměrným rozdělením na [0, ]. Definujme
VíceVlastnosti odhadů ukazatelů způsobilosti
Vlastnosti odhadů ukazatelů způsobilosti Jiří Michálek CQR při Ústavu teorie informace a automatizace AV ČR v Praze Úvod Ve výzkumné zprávě č 06 Odhady koeficientů způsobilosti a jejich vlastnosti viz
VíceFaktorová analýza (FACT)
Faktorová analýza (FAC) Podobně jako metoda hlavních komponent patří také faktorová analýza mezi metody redukce počtu původních proměnných. Ve faktorové analýze předpokládáme, že každou vstupující proměnnou
VíceOdhady Parametrů Lineární Regrese
Odhady Parametrů Lineární Regrese Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké
Více12. cvičení z PST. 20. prosince 2017
1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace
VíceEkonometrie. Jiří Neubauer
Úvod do analýzy časových řad Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Úvod do analýzy
VícePravděpodobnost a statistika (BI-PST) Cvičení č. 7
Pravděpodobnost a statistika (BI-PST) Cvičení č. 7 R. Blažek, M. Jiřina, J. Hrabáková, I. Petr, F. Štampach, D. Vašata Katedra aplikované matematiky Fakulta informačních technologií České vysoké učení
VíceNMAI059 Pravděpodobnost a statistika
NMAI059 Pravděpodobnost a statistika podle přednášky Daniela Hlubinky (hlubinka@karlin.mff.cuni.cz) zapsal Pavel Obdržálek (pobdr@matfyz.cz) 205/20 poslední změna: 4. prosince 205 . přednáška. 0. 205 )
VíceLineární zobrazení. 1. A(x y) = A(x) A(y) (vlastnost aditivity) 2. A(α x) = α A(x) (vlastnost homogenity)
4 Lineární zobrazení Definice: Nechť V a W jsou vektorové prostory Zobrazení A : V W (zobrazení z V do W nazýváme lineárním zobrazením, pokud pro všechna x V, y V a α R platí 1 A(x y = A(x A(y (vlastnost
VíceVícerozměrná rozdělení
Vícerozměrná rozdělení 7. září 0 Učivo: Práce s vícerozměrnými rozděleními. Sdružené, marginální, podmíněné rozdělení pravděpodobnosti. Vektorová střední hodnota. Kovariance, korelace, kovarianční matice.
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
VíceStatistické metody a zpracování dat. IX Faktorová a komponentní analýza (Úvod do vícerozměrných metod) Petr Dobrovolný
Statistické metody a zpracování dat IX Faktorová a komponentní analýza (Úvod do vícerozměrných metod) Petr Dobrovolný Úvod do vícerozměrných metod O řadě jevů či procesů máme k dispozici ne jeden statistický
VíceBodové a intervalové odhady parametrů v regresním modelu
Bodové a intervalové odhady parametrů v regresním modelu 1 Odhady parametrů 11 Bodové odhady Mějme lineární regresní model (LRM) kde Y = y 1 y 2 y n, e = e 1 e 2 e n Y = Xβ + e, x 11 x 1k, X =, β = x n1
VíceStatistika II. Jiří Neubauer
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Časová řada konečná posloupnost reálných hodnot určitého sledovaného ukazatele měřeného v určitých
VíceEkonometrie. Jiří Neubauer, Jaroslav Michálek
Ekonometrie Jiří Neubauer, Jaroslav Michálek Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz J. Neubauer, J. Michálek (Katedra ekonometrie UO) Zobecněný lineární
VíceSTATISTICKÁ VAZBA. 1.1 Statistická vazba Charakteristiky statistické vazby dvou náhodných veličin Literatura 9
STATISTICKÁ VAZBA Obsah 1 Korelační analýza 1 1.1 Statistická vazba.................................... 1 1.2 Motivační příklady................................... 1 1.3 Sdružená distribuční funkce a nezávislost
VíceÚvodem Dříve les než stromy 3 Operace s maticemi
Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová
VíceStatistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I
Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I Příklad Tahová síla papíru používaného pro výrobu potravinových sáčků je důležitá charakteristika kvality. Je známo, že síla
VíceTestování statistických hypotéz
Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné
VíceVlastní čísla a vlastní vektory
5 Vlastní čísla a vlastní vektor Poznámka: Je-li A : V V lineární zobrazení z prostoru V do prostoru V někd se takové zobrazení nazývá lineárním operátorem, pak je přirozeným požadavkem najít takovou bázi
Více9 Kolmost vektorových podprostorů
9 Kolmost vektorových podprostorů Od kolmosti dvou vektorů nyní přejdeme ke kolmosti dvou vektorových podprostorů. Budeme se zabývat otázkou, kdy jsou dva vektorové podprostory na sebe kolmé a jak to poznáme.
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie ZS 2015/16 Cvičení 1: Opakování ze statistiky LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Z čeho studovat 1) Z KNIHY Krkošková,
VíceFaktorová analýza Osnova
Faktorová analýza Osnova Motivace Formulace modelu faktorové analýzy Vhodnost použití modelu faktorové analýzy Odhad faktorové matice a její rotace Volba počtu společných faktorů Odhad faktorového skóre
VíceProblematika analýzy rozptylu. Ing. Michael Rost, Ph.D.
Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít
VíceChyby měření 210DPSM
Chyby měření 210DPSM Jan Zatloukal Stručný přehled Zdroje a druhy chyb Systematické chyby měření Náhodné chyby měření Spojité a diskrétní náhodné veličiny Normální rozdělení a jeho vlastnosti Odhad parametrů
Vícevyjádřete ve tvaru lineární kombinace čtverců (lineární kombinace druhých mocnin). Rozhodněte o definitnosti kvadratické formy κ(x).
Řešené příklady z lineární algebry - část 6 Typové příklady s řešením Příklad 6.: Kvadratickou formu κ(x) = x x 6x 6x x + 8x x 8x x vyjádřete ve tvaru lineární kombinace čtverců (lineární kombinace druhých
VíceCharakteristika datového souboru
Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex
VíceKGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním
VíceParametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =
Příklad 1 Metodou nejmenších čtverců nalezněte odhad lineární regresní funkce popisující závislost mezi výnosy pšenice a množstvím použitého hnojiva na základě hodnot výběrového souboru uvedeného v tabulce.
VíceJiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Výsledky některých náhodných pokusů jsou přímo vyjádřeny číselně (např. při hodu kostkou padne 6). Náhodnou veličinou
VíceMarkovské metody pro modelování pravděpodobnosti
Markovské metody pro modelování pravděpodobnosti rizikových stavů 1 Markovský řetězec Budeme uvažovat náhodný proces s diskrétním časem (náhodnou posloupnost) X(t), t T {0, 1, 2,... } s konečnou množinou
VíceMATEMATICKÁ STATISTIKA - XP01MST
MATEMATICKÁ STATISTIKA - XP01MST 1. Úvod. Matematická statistika (statistics) se zabývá vyšetřováním zákonitostí, které v sobě obsahují prvek náhody. Zpracováním hodnot, které jsou výstupem sledovaného
Více1 Linearní prostory nad komplexními čísly
1 Linearní prostory nad komplexními čísly V této přednášce budeme hledat kořeny polynomů, které se dále budou moci vyskytovat jako složky vektorů nebo matic Vzhledem k tomu, že kořeny polynomu (i reálného)
Více12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)
cvičení z PSI 0-4 prosince 06 Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) Z realizací náhodných veličin X a Y s normálním rozdělením) jsme z výběrů daného rozsahu obdrželi
Více5. T e s t o v á n í h y p o t é z
5. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
VíceStatistika. Regresní a korelační analýza Úvod do problému. Roman Biskup
Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009
Více