Zpracování dat v edukačních vědách - Testování hypotéz Kamila Fačevicová Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci
Obsah seminářů 5.11. Úvod do matematické statistiky: definice náhodné veličiny a jejich číselných charakteristik, základní rozdělení pravděpodobnosti, práce v R. 19.11. Parametrické testy hypotéz: odhady parametrů, princip testování hypotéz, testy střední hodnoty a rozptylu, ANOVA, kontingenční tabulky, práce v R. 3.12. Neparametrické testy: neparametrické alternativy testů polohy, Kruskal-Wallisův test, práce v R.
Náhodný výběr Experimentální data představují realizace náhodných veličin. Výsledky experimentu chceme zobecnit na celou populaci. Na základě realizací x 1,..., x n NV X chceme stanovit hodnotu parametru θ. Jsou-li pozorování realizacemi nezávislých, stejně rozdělených NV, mluvíme o tzv. náhodném výběru.
Bodový odhad = náhodná veličina T (X), od které očekáváme, že bude v průměru (ve smyslu opakování pokusu) odhadovat skutešnou hodnotu θ - nestranný, bude nejméně koĺısat kolem skutečné hodnoty - stejnomějně nejlepší, s rostoucím počtem pozorování se bĺıží skutečné hodnotě - konzistentní odhad. Např. a X = 1 n Xi S 2 = 1 (Xi n 1 X ) 2 jsou nejlepší nestranné odhady střední hodnoty µ a rozptylu σ 2.
Intervalový odhad (T 1 (X), T 2 (X)) Upřesňují informaci o skutečné hodnotě parametru. Platí P [θ (T 1 (X), T 2 (X))] 1 α, α (0, 1). Pro X N(µ, σ 2 ) mají intervalové odhady tvar [ ( )] σ P µ X u 1 α/2 n, X σ + u 1 α/2 n 1 α při známém rozptylu σ 2, [ ( P µ X t n 1 (1 α/2) n S, X + t n 1 (1 α/2) n S )] 1 α při neznámém rozptylu a [ ( )] P σ 2 S 2 (n 1) S 2 (n 1) χ 2 n 1 (1 α/2), χ 2 n 1 (α/2) 1 α).
Základní principy Předpokládejme, že parametr θ může nabývat hodnot z množiny Θ, a a) tvrzení H 0 : θ Θ 0 Θ nazveme nulovou hypotézou b) tvrzení H 1 : θ Θ 1, Θ 0 Θ 1 = 0, Θ 0 Θ 1 = Θ nazveme alternativní hypotézou. Na základě testu můžeme dospět ke dvěma závěrům: 1. Zamítáme H 0 ve prospěch alternativy. 2. Hypotézu H 0 nelze zamítnout. Hypotézy NIKDY nepřijímáme!
Základní principy Při rozhodování o hypotéze H 0 se můžeme dopustit dvou chyb: H 0 zamítneme H 0 nezamítneme H 0 je správná chyba 1. druhu H 0 není správná chyba 2. druhu Minimalizace pravděpodobnosti obou chyb naráz není možná. Požadujeme aby pr. chyby 1. druhu byla nejvýše α - hladina testu. Hladinu testu voĺıme většinou 0.05 nebo 0.01. Přílišná přísnost na chybu 1. druhu vede nárůstu pr. chyby 2. druhu.
Postup 1. Stanovení nulové a alternativní hypotézy. 2. Stanovení hladiny testu α. 3. Volba testové statistiky T a výpočet její realizace. 4. Stanovení kritického oboru. 5. Rozhodnutí. Pokud T (x) leží v kritickém oboru, pak H 0 zamítáme, v opačném případě ji zamítnout nelze.
P-value = nejmenší hladina, při které bychom hypotézu ještě zamítli. Udává míru naší jistoty při rozhodování o nulové hypotéze. Čím bĺıže je p-value 0 nebo 1, tím jsme si jistější. Je-li p-value α, hypotézu zamítáme. Je-li p-value > α, hypotézu zamítnout nelze.
Jednovýběrový t-test H 0 : µ = µ 0. H 1 : µ µ 0. Předpoklady: X N(µ, σ 2 ), kdy µ ani σ 2 neznáme. Testová statistika: Kritický obor: Funkce v R: t.test() T (X) = X µ n tn 1. S (, t n 1 (1 α/2) t n 1 (1 α/2), )
Test rozptylu H 0 : σ 2 = σ0 2. H 1 : σ 2 σ0 2. Předpoklady: X N(µ, σ 2 ), kdy µ ani σ 2 neznáme. Testová statistika: (n 1)S 2 T (X) = χ 2 n 1. Kritický obor: ( 0, χ 2 n 1 (α/2) χ 2 n 1(1 α/2), ) Funkce v R: onesample.var.test() σ 2
F-test shody rozptylu H 0 : σ 2 1 = σ2 2. H 1 : σ 2 1 σ2 2. Předpoklady: X N(µ 1, σ 2 1 ), Y N(µ 2, σ 2 2 ) a X a Y jsou nezávislé. Testová statistika: Kritický obor: Funkce v R: var.test() T = S n 2 σ2 2 Sm 2 σ1 2 F n 1,m 1. (0, F n 1,m 1 (α/2) F n 1,m 1 (1 α/2), )
Dvouvýběrový t-test H 0 : µ 1 = µ 2. H 1 : µ 1 µ 2. Předpoklady: X N(µ 1, σ 2 ), Y N(µ 2, σ 2 ), rozptyly σ 2 neznáme, ale jsou shodné a X a Y jsou nezávislé. Testová statistika: Kritický obor: T = Funkce v R: t.test() X Ȳ (µ 1 µ 2 ) nm(n + m 2) t n+m 2 (n 1)S 2 n + (m 1)Sm 2 n + m (, t n+m 2 (1 α/2) t n+m 2 (1 α/2), )
Kontingenční tabulky X \Y 1 2... J 1 n 11 n 12... n 1J n 1. 2 n 21 n 22... n 2J n 2...... I n I 1 n I 2... n IJ n I. n.1 n.2... n.j n
Kontingenční tabulky H 0 : NV X a Y jsou nezávislé. H 1 : X a Y nejsou nezávislé. Předpoklady: n ij jsou realizace multinomického rozdělení s parametry n a p ij a n i.n.j n 5. Testová statistika: T = I i=1 j=1 ( J nij n i.n.j n i. n.j n n ) 2 χ 2 (I 1)(J 1). Kritický obor: Funkce v R: chisq.test() χ 2 (I 1)(J 1) (1 α), )
ANOVA H 0 : Sledovaný faktor nemá vliv (µ 1 = = µ k ). H 1 : Sledovaný faktor má vliv. Předpoklady: X 1 N(µ 1, σ 2 ),..., X k N(µ k, σ 2 ) vyžadujeme normální rozdělení (shapiro.test()) a shodu rozptylů (bartlett.test()). Testová statistika: S e = k n i ( ) 2, Yij Ȳ i. SA = i=1 j=1 k ) 2, n i (Ȳi. Ȳ.. i=1 Kritický obor: Funkce v R: aov(), anova() F A = S A S e n k k 1 F k 1,n k. F k 1,n k (1 α), )
ANOVA V případě zamítnutí nulové hypotézy chceme zjistit, mezi kterými úrovněmi faktoru je významný rozdíl. K tomuto účelu využijeme mnohonásobné porovnávání. Scheffeho metoda - nevyvážené třídění, Tukeyho metoda - vyvážené třídění. V R použijeme funkci TukeyHSV() - úprava Tukeyho metody na nevyvážené třídění.
PRÁCE V R
Literatura Anděl J (2011) Základy matematické statistiky. MatFyz Press, Praha. Hron K, Kunderová P (2015) Základy počtu pravděpodobnosti a metod matematické statistiky. VUP, Olomouc.