Parametrů II Testování Hypotéz Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické v Praze Rudolf Blažek & Roman Kotecký, 011 Pravděpodobnost a statistika BI-PST, LS 010/11, Přednáška 10 Evropský sociální fond Praha & EU: Investujeme do vaší budoucnos@
Odhad střední hodnoty Intervalové Odhady Konfidenční Intervaly, Intervaly spolehlivosti (Confidence Intervals)
Odhad střední hodnoty Bodové odhady populačního průměru μ a rozptylu σ Bodové odhady μ a σ Nechť X1, X, X3,..., Xn je náhodný výběr (i.i.d. náhodné veličiny) se střední hodnotou μ a rozptylem σ (konečnými). Jako bodový odhad μ použijeme výběrový průměr Jako bodový odhad σ použijeme výběrový rozptyl s n = 1 n 1 X n = 1 n P n i=1 X i P n i=1 (X i X n ) i.i.d....* independent and identically distributed * * * nezávislé a stejně rozdělené 3
Odhad střední hodnoty Intervalový odhad popul. průměru μ Intervalový odhad střední hodnoty μ Nechť X1, X, X3,..., Xn je náhodný výběr (i.i.d. náhodné veličiny) se střední hodnotou μ a rozptylem σ (konečnými). (1 α)100% Oboustranný konfidenční interval pro μ: Při známém σ: Při neznámém σ: X n ± z / / n X n ± t /,n 1 s/ n zα/ * *... kritická hodnota rozdělení N(0,1) tα/,n-1*... kritická hodnota Studentova t-rozdělení tn-1 Pozn.: Pro malé n rozdělení Xi musí být normální 4
Odhad střední hodnoty Intervalový odhad popul. průměru μ Přibližné rozdělení je známo pomocí CLV Z = X n µ / p n N(0, 1) α/ 1 α α/ 0 - -zα/ zα/ 5
Odhad střední hodnoty Intervalový odhad popul. průměru μ Pro malé n rozdělení Xi musí být normální T = X n µ s/ p n t(n 1) α/ 1 α α/ -tα/,n-1 0 -.. tα/,n-1 6
Odhad střední hodnoty Intervalový odhad popul. průměru μ α/ 1 α α/ -zα/ 0 zα/ -.. -tα/,n-1 tα/,n-1 7
Odhad střední hodnoty Intervalový odhad popul. průměru μ Intervalový odhad střední hodnoty μ Nechť X1, X, X3,..., Xn je náhodný výběr (i.i.d. náhodné veličiny) se střední hodnotou μ a rozptylem σ (konečnými). (1 α)100% Jednostranný konfidenční interval pro μ: Při známém σ: (X n z / p n, 1) ( 1, X n + z / p n) Při neznámém σ: (X n t,n 1 s/ p n, 1) ( 1, X n + t,n 1 s/ p n) zα* *... kritická hodnota rozdělení N(0,1) tα,n-1*... kritická hodnota Studentova t-rozdělení tn-1 8
Odhad střední hodnoty Intervalový odhad popul. průměru μ Přibližné rozdělení je známo pomocí CLV Z = X n µ / p n N(0, 1) 1 α α 0 zα 9
Odhad střední hodnoty Intervalový odhad popul. průměru μ Pro malé n rozdělení Xi musí být normální T = X n µ s/ p n t(n 1) 1 α α 0 tα,n-1 10
Odhad střední hodnoty Intervalový odhad popul. průměru μ T = X n µ s/ p n t(n 1) 1 α α 0 zα tα,n-1 11
Odhad střední hodnoty Pravidla použití normálního a t-rozdělení Kritickou hodnotu zα/ normálního rozdělení použijeme pokud známe přesně populační rozptyl σ pravděpodobnost pokrytí přesně (1 α) když výběr je z normálního rozdělení (i pro malé n) pravděpodobnost pokrytí přibližně (1 α) když výběr je dostatečně velký (CLV pro velké n) obvykle stačí n = 30 či n = 50 ale pro šikmá či vícemodální rozdělení n musí být veliké 1
Odhad střední hodnoty Pravidla použití normálního a t-rozdělení Kritickou hodnotu tα/ Studentova t-rozdělení použijeme když populační rozptyl σ odhadujeme pomocí s pravděpodobnost pokrytí přesně (1 α) pokud výběr je z normálního rozdělení (i pro malé n) pravděpodobnost pokrytí přibližně (1 α) pokud výběr je ze symetrického unimodálního rozdělení, bez odlehlých pozorování a velikost výběru je n 15 výběr je ze mírně šikmého, unimodálního rozdělení, bez odlehlých pozorování a velikost výběru je 16 n 40 výběr je velký (n > 40) a bez odlehlých pozorování 13
Odhad rozptylu Intervalový odhad popul. rozptylu σ Intervalový odhad rozptylu σ Nechť X1, X, X3,..., Xn je náhodný výběr (i.i.d. náhodné veličiny) z normálního rozdělení se střední hodnotou μ a rozptylem σ (konečnými). (1 α)100% Oboustranný konfidenční interval pro σ : (n 1)s 1 /, n 1 apple apple (n 1)s /, n 1 /, n 1 a 1 /, n 1 * * * * * * * *...* kvantily rozdělení chi-kvadrát 14
Odhad rozptylu Intervalový odhad popul. rozptylu σ Rozdělení Xi musí být normální (n 1)s n 1 1 α α/ α/ 0 /, n 1 1 /, n 1 15
Odhad rozptylu Intervalový odhad popul. rozptylu σ Rozdělení Xi musí být normální P /, n 1 apple (n 1)s apple 1 /, n 1 1 α α/ α/ 0 /, n 1 1 /, n 1 16
Odhad rozptylu Intervalový odhad popul. rozptylu σ Pravděpodobnost pokrytí parametru σ 1 = P /, n 1 apple (n 1)s apple 1 /, n 1! 1 = P 1 1 /, n 1 apple (n 1)s apple 1 /, n 1! 1 = P (n 1)s 1 /, n 1 apple apple (n 1)s /, n 1 17
Příklad: odhad střední hodnoty a rozptylu normálního rozdělení Příklad: odhad střední hodnoty a rozptylu normálního rozdělení Příklad Uvažujme následující výběr (iid) z normálního rozdělení: i 1 3 4 5 6 7 8 9 10 Xi 1.7 1.88 1.84 1.81 1.75 1.9 1.80 1.68 1.80 1.81 Najděte intervalové odhady pro střední hodnotu a rozptyl rozdělení veličin Xi. Bodové odhady: X n = 1 P n n i=1 X i = 1.80 s n = 1 P n n 1 i=1 (X i X n ) P 10 i=1 (X i 1.80) = 0.0051 = 1 9 18
Příklad: odhad střední hodnoty a rozptylu normálního rozdělení Příklad: odhad střední hodnoty a rozptylu normálního rozdělení Příklad 90% intervalový odhad pro střední hodnotu X n ± t /,n 1 s/ n 1.80 ± (1.833) p 0.0051/10 X n = 1.80 s = 0.0051 t /,n 1 = t 0.05,9 = 1.833 90% intervalový odhad pro střední hodnotu: [1.76, 1.84] 19
Příklad: odhad střední hodnoty a rozptylu normálního rozdělení Příklad: odhad střední hodnoty a rozptylu normálního rozdělení Příklad 90% intervalový odhad pro rozptyl (n 1)s 1 /, n 1 apple apple (n 1)s /, n 1 (9)(0.0051) 16.9189 apple apple (9)(0.0051) 3.351 90% intervalový odhad pro rozptyl [0.007, 0.0138] 0
Testování Hypotéz Testování Hypotéz (Hypotheses Testing) 1
Testování Hypotéz Úvod Bodové a intervalové odhady Vyberu náhodně 30 kuliček (s vracením) Vidím do dlaně: 0 z 30 je červených Kolik procent kuliček Nevidím do krabičky v krabičce je asi červených? Bodový odhad: cca /3 = 66.67% Intervalový odhad s 95% spolehlivostí: 48.76% 84.57%
Testování Hypotéz Úvod Testování hypotéz Vyberu náhodně 30 kuliček (s vracením) Vidím do dlaně: 0 z 30 je červených Nevidím do krabičky Je v krabičce 40% červených kuliček? Závěr s 95% jistotou: NE Protože na 95% věřím: 48.76% 84.57% 3
Testování Hypotéz Úvod Testování hypotéz Dá se provádět s použitím intervalů spolehlivosti. V předchozím případě uvažovali následující hypotézy: Nulová hypotéza* * * * * H0: μ = 0.4 Oboustranná alternativa* * * HA: μ 0.4 Všimněte si: μ = EX = 0.q + 1.p = p = P(červená kulička) Závěr testu: Založen na oboustranném 95% intervalovém odhadu pro střední hodnotu μ: [0.4876, 0.8457] 0.4 [0.4876, 0.8457] Zamítneme H0 P(chyby) = 0.05... podívejme se blíže co chyba znamená 4
Testování Hypotéz Chyby při testování hypotéz Chyby při testování hypotéz Uvažované hypotézy: Nulová hypotéza* * * * * H0: μ = 0.4 Oboustranná alternativa* * * HA: μ 0.4 Závěr testu: Zamítneme H0 P(chyby) = P(zamítnu chybně H0) * = P( rozhodnu H0 neplatí přestože H0 platí ) * = P( rozhodnu μ 0.4 μ = 0.4 ) * = P( μ = 0.4 leží mimo 95% interval pro μ = 0.4 μ = 0.4 ) 0.05... protože histogram je centrován v 0.4 5
Testování Hypotéz Chyby při testování hypotéz Chyby při testování hypotéz T = X n µ s/ p n t(n 1).5% 95%.5% -.045 0.045 -.. 6
Testování Hypotéz Chyby při testování hypotéz Chyby při testování hypotéz X n N(µ, /n).5% 95%.5% μ.045 -s μ=0.40 μ+.045 s / p n / p n 7
Testování Hypotéz Chyby při testování hypotéz Chyby při testování hypotéz X n N(µ, /n).5% 95%.5% X n = 0.6667 μ 0.179 - μ=0.40 μ+0.179 0.1 0.579 8
Testování Hypotéz Chyby při testování hypotéz Chyby při testování hypotéz Uvažované hypotézy: Nulová hypotéza* * * * * H0: μ = 0.4 Oboustranná alternativa* * * HA: μ 0.4 Opačný závěr testu: Nezamítneme H0 P(chyby) = P(chybně nezamítnu H0) * = P( rozhodnu H0 platí přestože H0 neplatí ) * = P( rozhodnu μ = 0.4 μ 0.4 ) * = P( 0.4 leží uvnitř 95% intervalu pro μ 0.4 μ 0.4 ) =?... protože histogram je centrován v neznámém μ 0.4 9
Testování Hypotéz Chyby při testování hypotéz Oboustranná alternativa Obecné hypotézy o střední hodnotě μ Nulová hypotéza* * * * * H0: μ = μ0 Oboustranná alternativa* * * HA: μ μ0 Test založen na oboustranném (1 α)100% intervalovém odhadu pro střední hodnotu μ μ0 konfidenční interval Zamítneme H0 P(chyby) = α... Chyba prvního druhu malá, nastavená μ0 konfidenční interval Nezamítneme H0 P(chyby) =??... Chyba druhého druhu je neznámá Zamítnutí H0 je silný výsledek! 30
Testování Hypotéz Chyby při testování hypotéz Jednostranné alternativy Obecné hypotézy o střední hodnotě μ Nulová hypotéza* * * * * H0: μ = μ0 Jednostranná alternativa** * HA: μ < μ0 Test založen na jedstranném (1 α)100% konf. intervalu pro μ Typ intervalu: (, A) μ0 konfidenční interval (A < μ0 ) Zamítneme H0 P(chyby) = α... Chyba prvního druhu malá, nastavená μ0 konfidenční interval Nezamítneme H0 P(chyby) =??... Chyba druhého druhu je neznámá Zamítnutí H0 je silný výsledek! 31
Testování Hypotéz Chyby při testování hypotéz Jednostranné alternativy Konfidenční interval pro jednostrannou alternativu HA: μ < μ0 1 ) X n + t,n X n Věřím HA: μ < μ0 (a zamítnu H0) pokud výběrový průměr je mnohem menší než μ0 1 s/ p n X n ) A μ0 P(chybné zamítnutí H0) = α 1 X n ) A μ0 3
Testování Hypotéz Chyby při testování hypotéz Jednostranné alternativy Obecné hypotézy o střední hodnotě μ Nulová hypotéza* * * * * H0: μ = μ0 Jednostranná alternativa** * HA: μ > μ0 Test založen na jedstranném (1 α)100% konf. intervalu pro μ Typ intervalu: (A, ) μ0 konfidenční interval (A < μ0 ) Zamítneme H0 P(chyby) = α... Chyba prvního druhu malá, nastavená μ0 konfidenční interval Nezamítneme H0 P(chyby) =??... Chyba druhého druhu je neznámá Zamítnutí H0 je silný výsledek! 33
Testování Hypotéz Chyby při testování hypotéz Volba jednostranné alternativy Zamítnutí H0 je silný výsledek! Pokud potřebuji evidenci, že průměrná hodnota je veliká Nulová hypotéza* * * * * H0: μ = μ0 Jednostranná alternativa** * HA: μ > μ0 Např. při dokazovnání, že továrna příliš zamořuje ovzduší Pokud potřebuji evidenci, že průměrná hodnota je malá Nulová hypotéza* * * * * H0: μ = μ0 Jednostranná alternativa** * HA: μ < μ0 Např. při dokazovnání, že továrna NEzamořuje ovzduší nad daný limit 34
Testování Hypotéz Chyby při testování hypotéz Oboustranná a jednostranné alternativy Jednostranná alternativa* * * HA: μ < μ0 X n ) X n + t,n 1 s/ p n Jednostranná alternativa* * * HA: μ > μ0* * (se stejnými daty) ( X n t,n 1 s/ p n X n Oboustranná alternativa* * * HA: μ μ0* * (se stejnými daty) ( X n t,n 1 s/ p n 1 X n ) X n + t,n 1 s/ p n 35
Testování Hypotéz Chyby při testování hypotéz Oboustranná a jednostranné alternativy Oboustranná alternativa Nulová hypotéza* * * * * * * H0: μ = μ0 Oboustranná alternativa* * * * * HA: μ μ0 Test založen na oboustranném (1 α)100% konf. intervalu Jednostranná alternativa Nulová hypotéza* * * * * * * H0: μ = μ0 Jednostranná alternativa** Buď * * HA: μ > μ0!!!!!!!!! Anebo * HA: μ > μ0) Test založen na jednostranném (1 α)100% konf. intervalu Anebo na oboustranném (1 α)100% konf. intervalu 36