7. TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ 7.1. Podstata testu statistické hypotézy Statistická hypotéza určitý předpoklad o parametrech nebo tvaru rozdělení zkoumaného st. znaku. Testování hypotéz proces ověřování správnosti nebo nesprávnosti hypotézy pomocí výsledk získaných realizací náhodného výběru. Test hypotézy zahrnuje dvě hypotézy. Nulová hypotéza (H, H 0 ) (null hypothesis) hypotéza, která je testovaná. Alternativní hypotéza (A, H A ) (alternative hyp.) hypotéza, která je uvažovaná jako alternativa k nulové h., nějakým způsobem popírá vlastnost vyslovené nulové h. Výsledek rozhodování: zamítnutí H 0 ve prospěch A nezamítnutí H 0. Formulace hypotéz H : θ = θ 0, θ Θ A 1 : θ θ 0 dvoustranná alternativa (two-tailed) A 2 : θ < θ 0 levostranná alternativa (left-tailed) A 3 : θ > θ 0 pravostranná alternat. (right-tailed)
7.2. Základní pojmy a terminologie Testová statistika (test statistics): Statistika použitá jako základ pro rozhodnutí, zda nulová hypotéza by měla být zamítnuta. Obor zamítnutí - kritický obor (rejection region): Množina hodnot testové statistiky, která vede k zamítnutí hypotézy. Obor přijetí (nonrejection region or acceptance region): Množina hodnot testové statistiky, která vede k přijetí hypotézy. Kritické hodnoty (critical values): Hodnoty testové statistiky, které oddělují obor přijetí od oboru zamítnutí. Chyby I. a II. druhu Chyba I. druhu (type I error): Zamítnutí H, když je ve skutečnosti pravdivá. Chyba II. druhu (type II error): Nezamítnutí H, když je ve skutečnosti nepravdivá. Pravděpodobnosti chyb I. a II. druhu Pst, že se dopustíme chyby I. druhu je pst zamítnutí správné nulové hypotézy. Je to pst, že testová statistika bude v oboru zamítnutí, jestliže ve skutečnosti nulová hypotéza je správná. Hladina významnosti α (significance level): pst, že se dopustíme chyby I.druhu. Pst β, že se dopustíme chyby II. druhu je pst nezamítnutí
nesprávné nulové hypotézy. Je to pst, že testová statistika bude v oboru přijetí, jestliže ve skutečnosti nulová hypotéza je nesprávná. Vztah mezi pravděpodobnostmi chyb I. a II. druhu Pro daný rozsah výběru platí, že čím menší je pst chyby I. druhu tím větší je pst chyby II. druhu a naopak. Ideální stav: α i β malé. Možné závěry při testování hypotéz If nulová hypotéza je zamítnuta, děláme závěr, že alternativní hypotéza je správná. If nulová hypotéza není zamítnuta, děláme závěr, že data nám neposkytla dostatek podkladů k podpoře alternativní h. Výsledek testu je statisticky významný na hladině α nulová hypotéza je zamítnuta na hladině významnosti α Vztah mezi testováním h. a intervaly spolehlivosti Nulová hypotéza o určitém parametru bude zamítnuta iff hodnota parametru daná nulovou hypotézou leží vně 100(1 α)% intervalu spolehlivosti pro testovaný parametr. Silofunkce testu: funkce P W (θ), která každému θ Θ přiřadí pst P (T (X) W θ), tedy pst zamítnutí hypotézy H, má-li parametr hodnotu θ. Hodnotu silofunkce v bodě θ = θ 1 nazýváme silou testu vzhledem k alternativě θ = θ 1.
Výsledky testu hypotéz Rozhodnutí: H je: H se nezamítá H se zamítá pravdivá správné rozhodnutí chyba I.druhu Pst = 1 α Pst = α hladina významnosti nepravdivá chyba II.druhu správné rozhodnutí Pst = β Pst = 1 β síla testu 7.3. Klasický přístup k testování hypotéz Postup při testování užitím klasického přístupu Step 1 Formuluj nulovou a alternativní hypotézu. Step 2 Zvolte hladinu významnosti α. Step 3 Určete kritickou hodnotu (kritické hodnoty). Step 4 Výpočtěte hodnotu testové statistiky. Step 5 If hodnota testové statistiky padne do oboru zamítnutí, zamítni H; jinak nezamítej H. Step 6 Formulujte slovně závěr.
7.4. Přístup k testování založený na P -hodnotě P - hodnota jako pozorovaná hladina významnosti P - hodnota testu hypotézy je rovna nejmenší hladině významnosti, na které H může být zamítnuta. Velká P - hodnota neposkytuje dostatečný důvod zamítnout H. Malá P - hodnota poskytuje důvod zamítnouth. X testová statistika; x 0 zjištěná hodnota test. stat. Pak P -hodnota 2 min{p (X x 0 ), P (X x 0 )} pro dvoustranný test P = P (X x 0 ) pro levostranný test P = P (X x 0 ) pro pravostranný test Postup při testování užitím P - hodnoty Step 1 Formulujte nulovou a alternativní hyp. Step 2 Zvolte hladinu významnosti α. Step 3 Výpočtěte hodnotu testové statistiky. Step 4 Určete P - hodnotu. Step 5 If P α zamítni H; jinak nezamítej H. Step 6 Formulujte slovně závěr.
Příklad 7/1: V právním systému ČR je obžalovaný považován za neviného, dokud mu není prokázána vina. Při procesech s obžalovanými se porota musí rozhodnout mezi nulovou hypotézou H 0 a alternativní hypotézou H A : H 0 : Obžalovaný je nevinen. H A : Obžalovaný je vinen. a) Pokud by jste byl obžalovaný, jakou hodnotu psti chyby I.druhu α byste zvolil? Proč? b) Pokud by jste byl obhájce obžalovaného, jaká hodnota pravděpodobnosti chyby II.druhu β by vám nejvíce vyhovovala? Proč? c) Co by znamenalo pro soudní systém, kdybychom zvolili α = 0? β = 0?
Příklad 7/4: Nakolik jsou bezpečnostní pásy účinné? Pro zodpovězení této otázky byl proveden průzkum automobilů, které byly vybaveny bezpečnostními pásy a které se zúčastnily dopravních nehod. Náhodný výběr 10 000 pasažérů těchto vozidel měl následující míru poranění (Na základě U.S. Department of Transportation, 1981): Bezpečnostní pásy Těžké nebo smrtelné zranění ANO NE celkem ANO 3 119 122 NE 829 9 049 9 878 Celkem 832 9 168 10 000 a) Formulujte nulovou a alternativní hypotézu slovně a symbolicky. b) Do jaké míry podporují tyto údaje tvrzení, že bezpečnostní pásy jsou dobrou prevencí proti úrazu při dopravní nehodě?