t-test, Studentův párový test Ing. Michael Rost, Ph.D.



Podobné dokumenty
1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

= = 2368

Ing. Michael Rost, Ph.D.

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

4ST201 STATISTIKA CVIČENÍ Č. 7

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

12. cvičení z PST. 20. prosince 2017

Příklady na testy hypotéz o parametrech normálního rozdělení

Testování statistických hypotéz

Testování statistických hypotéz

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Statistika. Testování hypotéz - statistická indukce Parametrické testy. Roman Biskup

STATISTICKÉ TESTY VÝZNAMNOSTI

You created this PDF from an application that is not licensed to print to novapdf printer (

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Testování statistických hypotéz. Obecný postup

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Normální (Gaussovo) rozdělení

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

STATISTICKÉ TESTY VÝZNAMNOSTI

2 ) 4, Φ 1 (1 0,005)

Testy statistických hypotéz

Jednostranné intervaly spolehlivosti

Cvičení ze statistiky - 9. Filip Děchtěrenko

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

15. T e s t o v á n í h y p o t é z

PRAVDĚPODOBNOST A STATISTIKA

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Normální (Gaussovo) rozdělení

Stručný úvod do testování statistických hypotéz

Charakteristika datového souboru

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Korelační a regresní analýza

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

STATISTICA Téma 7. Testy na základě více než 2 výběrů

STATISTICKÉ HYPOTÉZY

Aproximace binomického rozdělení normálním

15. T e s t o v á n í h y p o t é z

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

Jednofaktorová analýza rozptylu

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Testování statistických hypotéz

12. prosince n pro n = n = 30 = S X

Cvičení ze statistiky - 8. Filip Děchtěrenko

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Jednofaktorová analýza rozptylu

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Pohlédněte si základní charakteristiky polohy jednotlivých veličin pomocí funkce summary.

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

5. T e s t o v á n í h y p o t é z

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

KGG/STG Statistika pro geografy

Zápočtová práce STATISTIKA I

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Úvod do analýzy rozptylu

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Testy. Pavel Provinský. 19. listopadu 2013

MATEMATIKA III V PŘÍKLADECH

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.

7. Analýza rozptylu.

Testování hypotéz Biolog Statistik: Matematik: Informatik:

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

Statistika pro každého. Párový test Test shody dvou rozptylů Dvouvýběrový t-test Porovnání středních hodnot při nestejných rozptylech

4EK211 Základy ekonometrie

Neparametrické metody

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

Lineární regrese. Komentované řešení pomocí MS Excel

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Pravděpodobnost a aplikovaná statistika

5 Parametrické testy hypotéz

diskriminaci žen letní semestr = výrok, o jehož pravdivosti chceme rozhodnout tvrzení o populaci, o jehož platnosti rozhodujeme

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Matematická statistika Zimní semestr

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Transkript:

Testování hypotéz: dvouvýběrový t-test, Studentův párový test Ing. Michael Rost, Ph.D.

Úvod do problému... Již známe jednovýběrový t-test, při kterém jsme měli k dispozici pouze jeden výběr. Můžeme se setkat také se situací, ve které potřebujeme porovnat dva či více souborů navzájem. V případě dvou výběrů, můžeme použít, při splnění určitých předpokladů, dvouvýběrové t-testy. Postup je stejný:

Magdalena Rettigová doporučuje: 1. Zformulovat hypotézy: H 0 vs. H A.. Stanovit hodnotu α, nejčastěji voĺıme α = 0, 05 nebo α = 0, 01. 3. Zvolit adekvátní testové kritérium a stanovit hodnotu testového kritéria 4. Zjistit zda T K nebo zda p-value α 5. Závěr

Příklad - motivace U šestnácti pracovníků bez výcviku (n 1 = 16) a u deseti (n = 10) pracovníků, kteří absolvovali výcvik, byla sledována doba reakce na určitý podmět v sekundách. Původní datové soubory již nejsou k dispozici, nicméně jeden z psychologů si poznamenal tyto charakteristiky obou souborů: x 1 = 11, 8; s 1 =, 3. x = 10, 00; s =, 5. S 95 % spolehlivostí ověřte, zda výcvik vede ke zrychlení sledované reakce. Dobu reakce pracovníka, budeme pokládat za náhodnou veličinu s normálním rozdělením.

Testy hypotéz o shodě středních hodnot dvou normálních rozdělení Testujeme-li hypotézu o shodě středních hodnot dvou nezávislých normálních rozdělení, jejichž rozptyly neznáme, je způsob testu závislý na tom, zda můžeme předpokládat následující: rozptyly jsou shodné. rozptyly obou výběrů lze považovat za různé. Z tohoto důvodu je nutné nejprve provést test shody rozptylů.

Test shody rozptylů F -test Provádíme test hypotézy H 0 : σ1 = σ. proti alternativní hypotéze (ta může být levostranná, pravostranná, nebo oboustranná). Testovacím kritériem je statistika F : F = s 1 s, která má za platnosti nulové hypotézy rozdělení F (m 1, n 1). Symbolicky tedy F F (m 1, n 1).

Test shody rozptylů F -test Jednotlivé kritické obory jsou pak vymezeny následovně: H 0 H A K σ1 σ σ1 > σ {F : F F 1 α (m 1, n 1)} σ1 σ σ1 < σ {F : F F α (m 1, n 1)} σ1 = σ σ1 σ {F : F Fα(m 1, n 1) F F 1 α(m 1, n 1)}

Varianta a) shodné rozptyly - homoskedasticita Pokud tedy předpokládáme, na základě předchozího testu, že jsou oba rozptyly shodné, lze k testování nulové hypotézy o shodě středních hodnot H 0 : µ 1 = µ využít testovací statistiky: kde s = t = x 1 x s mn m + n, (m 1)s 1 + (n 1)s m + n.

Varianta a) shodné rozptyly - homoskedasticita Dle formulace alternativní hypotézy, pak používáme kritické obory uvedené v tabulce: H 0 H A K µ 1 µ µ 1 > µ {t : t t 1 α (m + n )} µ 1 µ µ 1 < µ {t : t t 1 α (m + n )} µ 1 = µ µ 1 µ {t : t t 1 α (m + n )}

Varianta b) neshodné rozptyly - heteroskedasticita V praxi se setkáváme i s případem, kdy nemůžeme předpokládat, že jsou rozptyly shodné. Výsledek předcházejícího testu na shodu rozptylů vedl zamítnutí nulové hypotézy H 0 : σ 1 = σ. V takovém případě jsme nuceni použít poněkud jiné testové statistiky: t = x 1 x s 1 m + s n

Varianta b) neshodné rozptyly - heteroskedasticita Tato statistika sleduje, za předpokladu platnosti nulové hypotézy, rozdělení t(f), kde (s 1m + s n ) f = ( ) ). 1 s 1 (s m 1 m + n 1 1 n Číslo f je zde nemusí být přirozeným číslem!

Varianta b) neshodné rozptyly - heteroskedasticita Dle alternativní hypotézy pak rozeznáváme následující kritické obory viz tabulka: H 0 H A K µ 1 µ µ 1 > µ {t : t t 1 α (f)} µ 1 µ µ 1 < µ {t : t t 1 α (f)} µ 1 = µ µ 1 µ {t : t t 1 α(f)}

Příklad pokračování Formulujeme hypotézy: H 0 : µ 1 µ vs. H A : µ 1 > µ. Nejprve musíme ověřit hypotézu o shodě rozptylů - homoskedasticitu. Formulujeme tedy pomocné hypotézy: H 0 : σ 1 = σ vs. H A : σ 1 σ. Použijeme testové kritérium F : F = s s 1 =, 5, 3 = 1, 0869565.

Získanou hodnotu porovnáme s kritickým oborem: W α = {F : F Fα (n 1; n 1 1) F F 1 α (n 1; n 1 1)} = K = {F : F F 0,05 (10 1; 16 1) F F 1 0,05(10 1; 16 1)} = K = {F : F F 0,05 (9; 15) F F 0,975 (9; 15)} = K = {F : F 0, 6597; F 3, 171}. Vidíme, že testovací statistika F neleží v kritickém oboru. Lze tedy říci, že se nám nepodařilo, na základě pozorovaných

dat s 95% spolehlivostí zamítnout nulovou hypotézu. Lze tedy předpokládat, že rozptyly jsou shodné. Dále využijeme t-test za předpokladu: Pro test hypotézy X 1 N(µ 1, σ ) X N(µ, σ ) H 0 : µ 1 µ vs. H A : µ 1 > µ, použijeme tedy testové kritérium kde s = t = x 1 x s (n 1 1)s 1 + (n 1)s n 1 + n n1 n n 1 + n, = 15, 3 + 9, 5 16 + 10 =, 37

a t = 11, 8 10, 16 10, 37 16 + 10 = 1, 88. Hodnotu testového kritéria porovnáme s kritickým oborem K: a tedy K = {t : t t 1 α (n + n 1 )}, K = {t : t t 0,95 (4)} = 1, 71088. Vidíme, že naše testové kritérium leží v kritickém oboru a lze tedy říci, že s 95 % spolehlivostí se nám na základě pozorovaných dat podařilo zamítnout nulovou hypotézu o shodě dvou středních hodnot. Můžeme tedy usuzovat na to, že výcvik vede ke zkrácení doby reakce.

Testy hypotéz o shodě středních hodnot při závislých výběrech Jde o takzvaný Studentův párový t-test. V tomto případě lze převést nulovou hypotézu tvrdící, že náhodné výběry x 1 a x pocházejí z rozdělení se stejnými středními hodnotami na hypotézu H 0, která tvrdí, že náhodný výběr d = [d 1, d,, d n ], pochází z rozdělení jehož střední hodnota se rovná nule. Pro jednotlivé hodnoty d i, i = 1,,..., n platí: d i = d 1i d i.

Studentův párový t-test Testujeme tak hypotézu H 0 : µ d = µ 1 µ = 0. Testovým kritériem je statistika: t = d s d n. Kritické obory pro jednotlivé alternativní hypotézy udává tabulka: H 0 H A K µ d = µ 1 µ 0 µ d = µ 1 µ > 0 {t : t t 1 α (n 1)} µ d = µ 1 µ 0 µ d = µ 1 µ < 0 {t : t t 1 α (n 1)} µ d = µ 1 µ = 0 µ d = µ 1 µ 0 {t : t t 1 α(n 1)}