PRAVDĚPODOBNOST A STATISTIKA
Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr ϑ. Na základě měření (pokusů) chceme odhadnou neznámý parametr ϑ. Provedeme n pokusů (n měření). Výsledky těchto pokusů jsou popsány náhodným výběrem X ( X 1,, X n ) a jeho realizací x x,, x ). ( 1 n Opět předpokládáme, že složky náhodného vektoru jsou nezávislé a mají stejné rozdělení jako náhodná proměnná X. Odhad parametru ϑ budeme provádět pomocí vhodné statistiky X,, X ) a její realizace. T t T x,, x ) ( 1 n ( 1 n
Testování hypotéz Požadavek na vybrané statistiky je, aby byly nestranné, konzistentní a pokud možno nejlepší nestranné. Budeme využívat hlavně statistiky: výběrový průměr: X 1 n n i1 X i vývěrový rozptyl (modifikovaný): Výběrový koeficient korelace: Sˆ 1 n 1 i1 n 1 X i X Yi Y n i1 R S( X ) S( Y ) n X i X
Testování hypotéz Statistická hypotéza H je tvrzení o vlastnostech rozdělení pravděpodobnosti pozorované náhodné veličiny X s distribuční funkcí F(x, ϑ) nebo náhodného vektoru (X, Y ) se simultánní distribuční funkcí F(x,y, ϑ) apod. Postup, jímž ověřujeme danou hypotézu, se nazývá test statistické hypotézy. Proti testované hypotéze H, nazývané také nulová hypotéza - H 0, stavíme tzv. alternativní hypotézu - H A, kterou volíme dle požadavku úlohy. Jestliže H je hypotéza, že parametr ϑ má hodnotu ϑ 0, píšeme H: ϑ = ϑ 0. Případ H A : ϑ ϑ 0 je dvoustranná alternativní hypotéza a H A : ϑ > ϑ 0, resp. H A : ϑ < ϑ 0, je jednostranná alternativní hypotéza.
Testování hypotéz Pro testování hypotézy H: ϑ = ϑ 0 proti nějaké zvolené alternativní hypotéze H A se konstruuje vhodná statistika T X,, X ),tzv. testové kritérium. ( 1 n Při hledání statistiky T se vychází z požadavků na zamítnutí hypotézy H: Za jakých podmínek lze hypotézu zamítnout. K tomu se konstruuje množina možných hodnot realizace statistiky T. Tato množina se nazývá kritický obor a označuje se α. Velikost této množiny závisí na spolehlivosti našeho tvrzení. Pokud realizace zvolené statistiky T: t T ( x 1,, x n ) padne do kritického oboru α ( t ) říkáme, že hypotézu zamítáme na hladině významnosti α. U většiny testů se místo kritického oboru udává doplněk kritického oboru: R \. Pokud realizace zvolené statistiky T padne do doplňku kritického oboru ( t ) říkáme, že hypotézu nezamítáme na hladině významnosti α.
Testování hypotéz Hladinu významnosti α volíme opět nejčastěji α = 0.1, 0.05, 0.01 Nezamítnutí hypotézy H, resp. H A, neznamená ještě prokázání její platnosti, neboť jsme na základe realizace náhodného výběru získali pouze informace, které nestačí na její zamítnutí. Je-li to možné, je vhodné před přijetím dané hypotézy zvětšit rozsah statistického souboru a znovu hypotézu H testovat.
Testování hypotéz Předpokládejme, že máme hypotézu H: ϑ ϑ 0, a H A : ϑ > ϑ 0. Pak lze pravděpodobnosti α a β zobrazit:
Testování hypotéz p hodnota V některých statistických programech se místo testovacího kritéria a doplňku kritického oboru používá tzv.p-hodnota. P-hodnota je hodnota distribuční funkce příslušné statistiky pro testovací kritérium. Pokud p-hodnota je větší rovna zvolenému alfa pak nulovou hypotézu nezamítáme na hladině alfa. Pokud p-hodnota je menší než zvolené alfa pak nulovou hypotézu zamítáme na hladině alfa. P-hodnota udává, pro jaké alfa lze ještě lze nulovou hypotézu nezamítnout (či zamítnout).
Hypotézy pro Binomické rozdělení Nechť X je náhodná proměnná, která má Binomické rozdělení Bi(1,p). Neznámý parametr je p pravděpodobnost úspěchu při jednom pokuse. Pokus je úspěšný, pokud náhodně vybraný prvek má sledovanou vlastnost. Provedeme n -měření n-pokusů. Nechť je náhodný výběr, kde pro realizaci i-té složky X i platí: x i =0, pokud vybraný prvek nemá sledovanou vlastnost a x i =1, pokud vybraný prvek má sledovanou vlastnost. x Označme. Pak realizace výběrového průměru je a tedy bodový odhad parametru p je. ( X1,, X n ) n x x i i1 n x p n
Hypotézy pro Binomické rozdělení Testujeme hypotézu H: p = p 0 vzhledem k alternativní hypotéze: H A : p p 0 : testovací kritérium: doplněk kritického oboru: t x p0 n p 1 p u 0 ( 0 Pro hypotézu H: p = p 0 (H: p p 0 ) vzhledem k alternativní hypotéze: H A : p > p 0 je doplněk : Pro hypotézu H: p = p 0 (H: p p 0 ) vzhledem k alternativní hypotéze: H A : p < p 0 je doplněk : u kde, jsou kvantily normovaného normálního rozdělení. 1 u 1 n ) 1, u 1, u1, u 1
Hypotézy pro Binomické rozdělení Příklad 1: Hodíte 100x kostkou. 6 vám padla 0x. Otestujte hypotézu, že pravděpodobnost padnutí 6 je 1/6 vzhledem k alternativní hypotéze, že je větší než 1/6. Otestujte hypotézu (na hladině významnosti α=0,05), že pravděpodobnost padnutí 6 větší rovno než 1/6 vzhledem k alternativní hypotéze, že je menší než 1/6. Příklad : Strana XYZ nechá udělat průzkum její volitelnosti. Vybraná agentura udělá průzkum u reprezentativního vzorku obyvatelstva. Osloví 107 respondentů. Z nich 81 by danou stranu volilo. Otestujte hypotézu (na hladině významnosti α=0,05), že pravděpodobnost volební preference strany větší rovno 30% vzhledem k alternativní hypotéze, že je menší než 30%.
Hypotézy pro Binomické rozdělení Nechť X1 je náhodná proměnná, která má Binomické rozdělení Bi(1,p1).. Provedeme n1-pokusů a nechť x1 je úspěšných. Bodový odhad pravděpodobnosti p1 je: Nechť X je náhodná proměnná, která má Binomické rozdělení Bi(1,p).. Provedeme n-pokusů a nechť x je úspěšných. Bodový odhad pravděpodobnosti p je:. p1 p x1 n1 x n
Hypotézy pro Binomické rozdělení Testujeme hypotézu H: p1 = p vzhledem k alternativní hypotéze: H A : p1 p : testovací kritérium: doplněk kritického oboru: u 1, u 1 Pro hypotézu H: p1 = p (H: p1 p) vzhledem k alternativní hypotéze: H A : p1 > p je doplněk : Pro hypotézu H: p1 = p (H: p1 p ) vzhledem k alternativní hypotéze: H A : p1 < p je doplněk : u kde, jsou kvantily normovaného normálního rozdělení. 1 u 1 t x1 x n1 n n1* n f (1 f ) n1 n, u1 u 1, x1 x f n1 n
Hypotézy pro Binomické rozdělení Příklad 3: Strana XYZ nechá udělat průzkum její volitelnosti. Vybraná agentura udělá průzkum u reprezentativního vzorku obyvatelstva. Osloví 107 respondentů. Z nich 81 by danou stranu volilo. 10 000 000 je stála předvolební kampaň. Po předvolební kampani si zadali další průzkum. Z 138 respondentů by 403 danou stranu volilo. Otestujte hypotézu (na hladině významnosti α=0,05), že 10 000 000 byly vhodně investované peníze.
Hypotézy pro Normální rozdělení Nechť X je náhodná proměnná, která má Normální rozdělení N(μ, σ ). Neznámé parametry jsou: μ, σ Při testování hypotéz budeme vycházet z výběrového průměru a výběrového rozptylu: Nechť X, S je výběrový průměr a výběrový rozptyl. Pak platí: X n n 1 S je nejlepší nestranný konzistentní odhad parametru E(X) = μ je nejlepší nestranný konzistentní odhad parametru D(X) = σ Provedeme n pokusů (n měření). Výsledky těchto pokusů jsou popsány náhodným výběrem X ( X,, ) a jeho realizací 1 X n. x ( x 1,, x n )
Hypotézy pro jeden výběr z Normální rozdělení Testujeme hypotézu H: μ = μ 0 vzhledem k alternativní hypotéze: H A : μ μ 0 : testovací kritérium: t x s 0 n 1 doplněk kritického oboru: t 1, t 1 Pro hypotézu H: μ = μ 0 (H : μ μ 0 ) vzhledem k alternativní hypotéze: H A : μ > μ 0 je doplněk : Pro hypotézu H: μ = μ 0 (H: μ μ 0 ) vzhledem k alternativní hypotéze: H A : μ < μ 0 je doplněk : t kde, jsou kvantily Studentova rozdělení s k=n-1 stupni volnosti. 1 t 1, t1 t 1,
Hypotézy pro jeden výběr z Normální rozdělení Testujeme hypotézu H: σ =σ 0 vzhledem k alternativní hypotéze: H A : σ σ 0 : testovací kritérium: t n s 0 doplněk kritického oboru:, 1 Pro hypotézu H: σ = σ 0 (H: σ σ 0 ) vzhledem k alternativní hypotéze: H A : σ > σ 0 je doplněk : Pro hypotézu H: σ = σ 0 (H: σ σ 0 ) vzhledem k alternativní hypotéze: H A : σ < σ 0 je doplněk :,, 0, 1, kde, jsou kvantily Pearsonovarozdělení s k=n-1 stupni 1 1 volnosti.
Hypotéza pro párové dvojice z Normální rozdělení Nechť (X,Y) je náhodný vektor, který má Normální rozdělení N (μ, σ ), kde μ= (μ(x), μ(y)) je vektor. Chceme porovnat μ(x) a μ(y). Zavedeme novou náhodnou proměnnou D=X-Y. Náhodná proměnná D má opět normální rozdělení se střední hodnotou μ = μ(x) - μ(y). Z naměřených hodnot (x i, y i ) vytvoříme nový soubor d: kde d i = x i, - y i K tomuto souboru spočítáme d, s( d) Testujeme hypotézu H: μ = μ 0 vzhledem k alternativní hypotéze: H A : μ μ 0 : testovací kritérium: doplněk kritického oboru: t kde, jsou kvantily Studentova rozdělení s k=n-1 stupni volnosti. 1 t 1 t d s( d) t 0 n 1 1, t 1
Hypotéza pro párové dvojice z Normální rozdělení Test na koeficient korelace Nechť (X,Y) je náhodný vektor, který má Normální rozdělení N (μ, σ ), Chceme odhadnou korelaci složek náhodného vektoru ρ(x,y). Nechť r je bodový odhad. Předpokládejme: n 10, r <1, ρ 0 <1. Testujeme hypotézu H: ρ = ρ 0 vzhledem k alternativní hypotéze: H A : ρ ρ 0 : testovací kritérium: doplněk kritického oboru: u u 1, u 1 kde, jsou kvantily normovaného normálního rozdělení 1 u 1
Hypotéza pro párové dvojice z Normální rozdělení Test na nulový koeficient korelace Nechť (X,Y) je náhodný vektor, který má Normální rozdělení N (μ, σ ), Chceme zjisti, lineární závislost či nezávislost složek náhodného vektoru (X,Y). Testujeme ρ(x,y) na 0. Nechť r je bodový odhad. Testujeme hypotézu H: ρ = 0 vzhledem k alternativní hypotéze: H A : ρ 0 : testovací kritérium: doplněk kritického oboru: kde t 1 0, t 1 je kvantily Studentova rozdělení s k=n- stupni volnosti
Hypotéza pro dva výběry z Normální rozdělení Nechť X, Y jsou náhodné veličiny, které mají Normální rozdělení: X N(μ(X), σ (X), Y N(μ(Y), σ (Y). Chceme porovnat μ(x) a μ(y). Provedeme n1 měření pro náhodnou proměnnou X. Výsledky těchto pokusů jsou popsány náhodným výběrem ( X,, ) a jeho realizací. 1 X n1 ( x1,, xn 1) Spočítáme x, s( x) Provedeme n měření pro náhodnou proměnnou Y. Výsledky těchto pokusů jsou popsány náhodným výběrem ( Y1,, Yn ) a jeho realizací ( y1,, yn ). Spočítáme y, s( y). Testujeme hypotézu H: μ(x) - μ(y) = :μ 0 vzhledem k alternativní hypotéze: H A : : μ(x) - μ(y) μ 0. Tento test má dvě varianty: pro stejné rozptyly a pro různé rozptyly.
Hypotéza pro dva výběry z Normální rozdělení Test rovnosti rozptylů Nechť X, Y jsou náhodné veličiny, které mají Normální rozdělení: X N(μ(X), σ (X), Y N(μ(Y), σ (Y). Testujeme hypotézu H: σ (X) = σ (Y) vzhledem k alternativní hypotéze: H A : σ (X) σ (Y) : testovací kritérium: 1, F1 / ( k1, k) doplněk kritického oboru:, F ( 1 k1, k) kde /, je kvantil Fischerova-Snedecorova rozdělení s k1 a k stupni volnosti. k1=n1-1, k=n-1 pro k1=n-1, k=n1-1 pro
Hypotéza pro dva výběry z Normální rozdělení Test rovnosti středních hodnot za podmínky σ (X) = σ (Y) Nechť X, Y jsou náhodné veličiny, které mají Normální rozdělení: X N(μ(X), σ (X), Y N(μ(Y), σ (Y). Testujeme hypotézu H: μ(x) - μ(y) = μ 0 vzhledem k alternativní hypotéze: H A : μ(x) - μ(y) μ 0 testovací kritérium: 1, t 1 doplněk kritického oboru:, t t kde, jsou kvantily Studentova rozdělení s k=n-1 stupni volnosti. 1 t 1
Hypotéza pro dva výběry z Normální rozdělení Test rovnosti středních hodnot za podmínky σ (X) σ (Y) Nechť X, Y jsou náhodné veličiny, které mají Normální rozdělení: X N(μ(X), σ (X), Y N(μ(Y), σ (Y). Testujeme hypotézu H: μ(x) - μ(y) = μ 0 vzhledem k alternativní hypotéze: H A : μ(x) - μ(y) μ 0 : testovací kritérium: doplněk kritického oboru:, kde, a t(x), t(y) jsou kvantily Studentova rozdělení s k x =n1-1, k y =n-1 stupni volnosti.