Testování hypotéz: dvouvýběrový t-test, Studentův párový test Ing. Michael Rost, Ph.D.
Úvod do problému... Již známe jednovýběrový t-test, při kterém jsme měli k dispozici pouze jeden výběr. Můžeme se setkat také se situací, ve které potřebujeme porovnat dva či více souborů navzájem. V případě dvou výběrů, můžeme použít, při splnění určitých předpokladů, dvouvýběrové t-testy. Postup je stejný:
Magdalena Rettigová doporučuje: 1. Zformulovat hypotézy: H 0 vs. H A.. Stanovit hodnotu α, nejčastěji voĺıme α = 0, 05 nebo α = 0, 01. 3. Zvolit adekvátní testové kritérium a stanovit hodnotu testového kritéria 4. Zjistit zda T K nebo zda p-value α 5. Závěr
Příklad - motivace U šestnácti pracovníků bez výcviku (n 1 = 16) a u deseti (n = 10) pracovníků, kteří absolvovali výcvik, byla sledována doba reakce na určitý podmět v sekundách. Původní datové soubory již nejsou k dispozici, nicméně jeden z psychologů si poznamenal tyto charakteristiky obou souborů: x 1 = 11, 8; s 1 =, 3. x = 10, 00; s =, 5. S 95 % spolehlivostí ověřte, zda výcvik vede ke zrychlení sledované reakce. Dobu reakce pracovníka, budeme pokládat za náhodnou veličinu s normálním rozdělením.
Testy hypotéz o shodě středních hodnot dvou normálních rozdělení Testujeme-li hypotézu o shodě středních hodnot dvou nezávislých normálních rozdělení, jejichž rozptyly neznáme, je způsob testu závislý na tom, zda můžeme předpokládat následující: rozptyly jsou shodné. rozptyly obou výběrů lze považovat za různé. Z tohoto důvodu je nutné nejprve provést test shody rozptylů.
Test shody rozptylů F -test Provádíme test hypotézy H 0 : σ1 = σ. proti alternativní hypotéze (ta může být levostranná, pravostranná, nebo oboustranná). Testovacím kritériem je statistika F : F = s 1 s, která má za platnosti nulové hypotézy rozdělení F (m 1, n 1). Symbolicky tedy F F (m 1, n 1).
Test shody rozptylů F -test Jednotlivé kritické obory jsou pak vymezeny následovně: H 0 H A K σ1 σ σ1 > σ {F : F F 1 α (m 1, n 1)} σ1 σ σ1 < σ {F : F F α (m 1, n 1)} σ1 = σ σ1 σ {F : F Fα(m 1, n 1) F F 1 α(m 1, n 1)}
Varianta a) shodné rozptyly - homoskedasticita Pokud tedy předpokládáme, na základě předchozího testu, že jsou oba rozptyly shodné, lze k testování nulové hypotézy o shodě středních hodnot H 0 : µ 1 = µ využít testovací statistiky: kde s = t = x 1 x s mn m + n, (m 1)s 1 + (n 1)s m + n.
Varianta a) shodné rozptyly - homoskedasticita Dle formulace alternativní hypotézy, pak používáme kritické obory uvedené v tabulce: H 0 H A K µ 1 µ µ 1 > µ {t : t t 1 α (m + n )} µ 1 µ µ 1 < µ {t : t t 1 α (m + n )} µ 1 = µ µ 1 µ {t : t t 1 α (m + n )}
Varianta b) neshodné rozptyly - heteroskedasticita V praxi se setkáváme i s případem, kdy nemůžeme předpokládat, že jsou rozptyly shodné. Výsledek předcházejícího testu na shodu rozptylů vedl zamítnutí nulové hypotézy H 0 : σ 1 = σ. V takovém případě jsme nuceni použít poněkud jiné testové statistiky: t = x 1 x s 1 m + s n
Varianta b) neshodné rozptyly - heteroskedasticita Tato statistika sleduje, za předpokladu platnosti nulové hypotézy, rozdělení t(f), kde (s 1m + s n ) f = ( ) ). 1 s 1 (s m 1 m + n 1 1 n Číslo f je zde nemusí být přirozeným číslem!
Varianta b) neshodné rozptyly - heteroskedasticita Dle alternativní hypotézy pak rozeznáváme následující kritické obory viz tabulka: H 0 H A K µ 1 µ µ 1 > µ {t : t t 1 α (f)} µ 1 µ µ 1 < µ {t : t t 1 α (f)} µ 1 = µ µ 1 µ {t : t t 1 α(f)}
Příklad pokračování Formulujeme hypotézy: H 0 : µ 1 µ vs. H A : µ 1 > µ. Nejprve musíme ověřit hypotézu o shodě rozptylů - homoskedasticitu. Formulujeme tedy pomocné hypotézy: H 0 : σ 1 = σ vs. H A : σ 1 σ. Použijeme testové kritérium F : F = s s 1 =, 5, 3 = 1, 0869565.
Získanou hodnotu porovnáme s kritickým oborem: W α = {F : F Fα (n 1; n 1 1) F F 1 α (n 1; n 1 1)} = K = {F : F F 0,05 (10 1; 16 1) F F 1 0,05(10 1; 16 1)} = K = {F : F F 0,05 (9; 15) F F 0,975 (9; 15)} = K = {F : F 0, 6597; F 3, 171}. Vidíme, že testovací statistika F neleží v kritickém oboru. Lze tedy říci, že se nám nepodařilo, na základě pozorovaných
dat s 95% spolehlivostí zamítnout nulovou hypotézu. Lze tedy předpokládat, že rozptyly jsou shodné. Dále využijeme t-test za předpokladu: Pro test hypotézy X 1 N(µ 1, σ ) X N(µ, σ ) H 0 : µ 1 µ vs. H A : µ 1 > µ, použijeme tedy testové kritérium kde s = t = x 1 x s (n 1 1)s 1 + (n 1)s n 1 + n n1 n n 1 + n, = 15, 3 + 9, 5 16 + 10 =, 37
a t = 11, 8 10, 16 10, 37 16 + 10 = 1, 88. Hodnotu testového kritéria porovnáme s kritickým oborem K: a tedy K = {t : t t 1 α (n + n 1 )}, K = {t : t t 0,95 (4)} = 1, 71088. Vidíme, že naše testové kritérium leží v kritickém oboru a lze tedy říci, že s 95 % spolehlivostí se nám na základě pozorovaných dat podařilo zamítnout nulovou hypotézu o shodě dvou středních hodnot. Můžeme tedy usuzovat na to, že výcvik vede ke zkrácení doby reakce.
Testy hypotéz o shodě středních hodnot při závislých výběrech Jde o takzvaný Studentův párový t-test. V tomto případě lze převést nulovou hypotézu tvrdící, že náhodné výběry x 1 a x pocházejí z rozdělení se stejnými středními hodnotami na hypotézu H 0, která tvrdí, že náhodný výběr d = [d 1, d,, d n ], pochází z rozdělení jehož střední hodnota se rovná nule. Pro jednotlivé hodnoty d i, i = 1,,..., n platí: d i = d 1i d i.
Studentův párový t-test Testujeme tak hypotézu H 0 : µ d = µ 1 µ = 0. Testovým kritériem je statistika: t = d s d n. Kritické obory pro jednotlivé alternativní hypotézy udává tabulka: H 0 H A K µ d = µ 1 µ 0 µ d = µ 1 µ > 0 {t : t t 1 α (n 1)} µ d = µ 1 µ 0 µ d = µ 1 µ < 0 {t : t t 1 α (n 1)} µ d = µ 1 µ = 0 µ d = µ 1 µ 0 {t : t t 1 α(n 1)}