Testování hypotéz. December 10, 2008

Testování hypotéz December, 2008

(Testování hypotéz o neznámé pravděpodobnosti) Jan a Františe mají pytlíy s uličami. Jan má 80 bílých a 20 červených, Františe má 30 bílých a 70 červených. Vybereme náhodně jeden pytlí a máme zjistit, omu patří. Napřílad tahle: Vytáhneme z pytlía uliče (po aždém tahu uliču vrátíme a přemícháme). Jestliže není mezi nimi víc červených uliče než 2, přisoudíme pytlí Janovi, v opačném případě Františovi. Jaá je pravděpodobnost omylu?

Je nutno si uvědomit, že se můžeme dopustit hned dvou omylů: pytlí patří Janovi, přisoudíme ho Františovi (chyba prvního druhu), pytlí patří Františovi, přisoudíme ho Janovi (chyba druhého druhu).

Chyba prvního druhu: Chyba nastane jestliže pytlí nepřisoudíme Janovi, ale je jeho. To se stane a p = 0.2, ale počet () červených uliče je aspoň 3. Zřejmě pravděpodobnost vytažení právě uliče z Janovho pytlía je ( ) P(X = ) = 0.2 0.8. Potom pravděpodobnost chyby prvního druhu je =3 ( ) 0.2 0.8 = 1 co je pomerně hodně. 2 =0 ( ) 0.2 0.8 = 0.3222,

Chyba druhého druhu: Chyba nastane jestliže pytlí přisoudíme Janovi, ale není jeho. To se stane a p = 0.7, ale počet () červených uliče je nejvíc 2. Zřejmě pravděpodobnost vytažení právě uliče z Ferovho pytlía je ( ) P(X = ) = 0.7 0.3. Potom pravděpodobnost chyby druhého druhu je 2 =0 ( ) 0.7 0.3 = 0.0016.

Zusíme pozměnit "testování": Pytlí přisoudíme Janovi jestliže počet červených uliče bude maximálně 3. Potom pro chybu prvního druhu platí =4 ( ) 0.2 0.8 = 1 a pro chybu druhého druhu platí 3 =0 3 =0 ( ) 0.2 0.8 = 0.12087, ( ) 0.7 0.3 = 0.060. Vidíme, že snížení chyby prvního druhu vedlo e zvýšení chyby druhého druhu. Pravděpodobnost chyby prvního druhu souvisí s hladinou významnostiα, hypotézu H 0 zamítneme na hladině významnosti α a je pravděpodobnost chyby prvního druhu právě α.

(Testování hypotéz - o střední hodnotě, v případě normality) Nechť naměřené údaje x 1, x 2,..., x n jsou výsledem náhodního výběru ze záladního souboru, na terém jsou hodnoty měřeného znau normálně rozdeleny N(µ,σ 2 ). Označme x výběrový průměr. Dá se doázat, že pro jeho disperzi platí D ( x) = σ2 n. Při dostatečně velém rozsahu výběru může být x spolehlivým uazatelem hodnoty µ. Jestliže x bude blízo předpoládané hodnotyµ 0, bude to ve prospěch hypotézy H 0, jestliže tato hodnota bude hodně menší, nebo hodně větší, bude to v neprospěch H 0.

(Testování hypotéz - o střední hodnotě, v případě normality) Známeσ 2. Náhodná veličina U = x µ σ n má rozdělení N(0, 1). Tuto veličinu použĳeme jao testovací statistiu na ověření platnosti hypotézy. Zvolíme si hladinu významnosti α. Hladina významnosti je pravděpodobnost s jaou ještě připustíme, že můžeme zamítnout nulovou hypotézu, ačoliv ve sutečnosti platí. Nejčastěji se používá α = 0.05 nebo α = 0.01 Potom riticá oblast pro test oboustranné hypotézy proµ =µ 0 je určena nerovností: de U = x µ σ n> x, Φ(x ) = 1 α 2.

Přílad (Testování hypotéz - o střední hodnotě, v případě normality) Hmotnost studentů 2. ročníu FIT-u je normálně rozdělená, µ = 70g,σ 2 = 4g. Provedli jsme náhodný výběr a odvážili jsme se odvážit 30 studentů po zoušce z INM. Zjistili jsme, že jejich průměrná hmotnost je jenom 65g. Je tenhle poles hmotnosti statisticy významný na hladine α = 0.05? Má zouša z INM neblahý vliv na studenty?

Přílad (řešení) H 0 :µ=70 H 1 :µ 70 riterium... x poud platí H 0, ta x N 0 (µ = 70,σ 2 = 4) volmeα = 0.05 x = 1.96 x = 65 U = 65 70 2 30. = 13.693 ( 1.96, 1.96) H 0 zamítáme. Hubnutí je tedy štatisticy významní a tedy zouša z INM ma neblahý vliv. Co se naonec dalo očeávat. Kdyby U x, ta se jedná o případ, terý jsme za předpoladu, že H 0 je správná, očeávali s veliou pravděpodobností. Proto nulovou hypotézu nezamítáme a tvrdíme, že se nejedná o štatisticy významní rozdíl.

Nechť X je výslede testu pohybových schopností. Z dlouhodobého měření bylo zjištěno, že veličinu X lze popsat normálním rozdělením se střední hodnotou µ = 70, rozptylem σ 2 = 36. Chceme stat. testem ověřit hypotézu, že pohybové schopnosti leváů jsou lepší. U deseti náhodně vybraných leváů byl průměr pohybového testu 78 bodů. Je toto navýšení stat. významní na hladine α = 0.05?

H 0 :µ=70 H 1 :µ 70 riterium... x 36 poud platí H 0, ta x N 0 (µ = 70,σ2 x = = 3.6) riticé hodnoty vzhledem α = 0.05 jsou 1.96 a 1.96 U = 78 70. 3.6 = 4.22 ( 1.96, 1.96) H0 zamítáme.

(Síla testu) Určete sílu testu z předchozího příladu, poud ve sutečnosti je bodový průměr pohybového testu leváů 75 bodů.

(Síla testu) Síla testu = pravděpodobnost správného zamítnutí H 0 :µ=70, poud platí H 1 :µ=75. Nejprve převedeme riticé hodnoty 1.96, 1.96 normovaného normálního rozdělení na příslušné riticé hodnoty veličiny X. U = x µ σ x teda ±1.96 = x 70 3.6 x =±1.96 3.6 + 70 x m = 66.28, x v = 73.72. Síla testu: ) ( xv 75 1 F( x v ) = 1 Φ = 0.74857 3.6