5 Parametrické testy hypotéz

Podobné dokumenty
Testy. Pavel Provinský. 19. listopadu 2013

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA DOPRAVNÍ STATISTIKA. Semestrální práce

Testování statistických hypotéz

PRAVDĚPODOBNOST A STATISTIKA

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Testování statistických hypotéz

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Ing. Michael Rost, Ph.D.

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

4ST201 STATISTIKA CVIČENÍ Č. 7

12. cvičení z PST. 20. prosince 2017

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Aproximace binomického rozdělení normálním

Testování hypotéz. 4. přednáška

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z

STATISTICKÉ HYPOTÉZY

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Testování statistických hypotéz. Obecný postup

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

2 ) 4, Φ 1 (1 0,005)

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

5. T e s t o v á n í h y p o t é z

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Pravděpodobnost a matematická statistika

Charakteristika datového souboru

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

= = 2368

6. T e s t o v á n í h y p o t é z

Testování hypotéz Biolog Statistik: Matematik: Informatik:

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

12. prosince n pro n = n = 30 = S X

Cvičení ze statistiky - 8. Filip Děchtěrenko

Příklady na testy hypotéz o parametrech normálního rozdělení

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Regrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly:

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Náhodné veličiny, náhodné chyby

Pravděpodobnost a aplikovaná statistika

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

na za átku se denuje náhodná veli ina

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Testy statistických hypotéz

Testování statistických hypotéz

TECHNICKÁ UNIVERZITA V LIBERCI

Stručný úvod do testování statistických hypotéz

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

7.1. Podstata testu statistické hypotézy

Matematická Statistika. Ivan Nagy, Jitka Kratochvílová

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Regresní analýza 1. Regresní analýza

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

KGG/STG Statistika pro geografy

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

STATISTICKÉ TESTY VÝZNAMNOSTI

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

prosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina

Jednofaktorová analýza rozptylu

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

4EK211 Základy ekonometrie

1 Klasická pravděpodobnost. Bayesův vzorec. Poslední změna (oprava): 11. května 2018 ( 6 4)( 43 2 ) ( 49 6 ) 3. = (a) 1 1 2! + 1 3!

I. D i s k r é t n í r o z d ě l e n í

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

p(x) = P (X = x), x R,

Zápočtová práce STATISTIKA I

Jednostranné intervaly spolehlivosti

Jednofaktorová analýza rozptylu

Neparametrické metody

Matematika III. 3. prosince Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

PRAVDĚPODOBNOST A STATISTIKA

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

Základní statistické metody v rizikovém inženýrství

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

3 Bodové odhady a jejich vlastnosti

Intervalové Odhady Parametrů

KGG/STG Statistika pro geografy

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

You created this PDF from an application that is not licensed to print to novapdf printer (

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Transkript:

5 Parametrické testy hypotéz 5.1 Pojem parametrického testu (Skripta str. 95-96) Na základě výběru srovnáváme dvě tvrzení o hodnotě určitého parametru θ rozdělení f(x, θ). První tvrzení (které většinou obhajuje stávající stav věcí) se nazývá nulová hypotéza a značí se H 0, druhé tvrzení (které většinou prosazuje, že věci se změnily) je alternativní hypotéza označená H A. Nulová hypotéza něco tvrdí: např., že střední hodnota µ je rovna µ 0 a alternativní hypotéza ji odporuje. To může mít tři různé podoby: hypotéza příklad I. parametr má podle H A větší hodnotu než podle H 0 µ > µ 0 II. parametr má podle H A menší hodnotu než podle H 0 µ < µ 0 III. parametr se podle H A nerovná hodnotě parametru podle H 0 µ µ 0 (25) Tvrzení testujeme na základě testové statistiky, kterou je statistika pro bodový odhad parametru podle H 0. Pro parametrické testy lze podstatu testování vyložit v souvislosti s IS následujícím způsobem (pro jednoduchost budeme uvažovat test pro střední hodnotu a se známým rozptylem souboru). Nulová hypotéza říká, že µ = µ 0. Jestliže je tato hypotéza pravdivá a kolem bodu µ 0 sestrojíme α IS a tam by s také s pravděpodobností 1 α měl padnout bodový odhad, pořízený z výběru. Pokud tam padne, hypotézu H 0 nezamítáme řekneme, že data neprokázala její neplatnost. Pokud bodový odhad padne mimo IS, hypotézu H 0 zamítneme. Jediný (formální) rozdíl testů a intervalů je v tom, že při intervalu používáme nenormovaný tvar statistiky, např. pro střední hodnotu se známým rozptylem je to výběrový průměr X, zatímco pro test použijeme normovaný výběrový průměr z = X µ 0 σ n. Jeho realizaci označíme zr. P o z n á m k a: Všimněte si, že pro normování použijeme µ 0, což je střední hodnota podle nulové hypotézy. Celý test probíhá za platnosti H 0, která bud dále trvá, nebo je testem vyvrácena. f(z H 0 ) α/2 1 α α/2 IS z r 5.2 Základní pojmy (Skripta str. 97) V předchozím odstavci jsme dosti netradičně nastínili podstatu testování parametrických hypotéz. Nyní uvedeme základní pojmy a postupy pro testování tak, jak je lze běžně nalézt v učebnicích klasické statistiky. Pojmy budeme ihned demonstrovat na následujícím příkladě. 17

P ř í k l a d: Závod vyrábí televizní obrazovky u kterých udává střední životnost 1200 h a rozptyl životnosti 900 h 2. Vývojové oddělení provedlo některé technologické změny při výrobě a tvrdí, že životnost nově vyrobených obrazovek je větší. Své tvrzení dokládá výběrem 10 obrazovek z nové série pro něž byla zjištěna průměrná životnost 1216 h. Testujte H 0 : střední životnost obrazovek je 1200 hodin na hladině významnosti 0.05. Nulová hypotéza H 0 je základní hypotéza, která většinou potvrzuje stávající stav. [H 0 : střední životnost obrazovek je 1200 h.] Alternativní hypotéza H A je nová hypotéza, která jedním ze způsobů (25) popírá H 0. [H A : střední životnost obrazovek je větší.] Testová statistika je normovaná statistika pro bodový odhad testovaného parametru. [Zde se jedná o střední hodnotu, jejíž odhadová statistika je výběrový průměr.] Dále se jako parametr bude objevovat rozptyl se statistikou výběrový rozptyl a podíl se statistikou výběrový podíl. Hladina významnosti α je pravděpodobnost α z IS. Je to tzv. pravděpodobnost I. druhu, tj., že H 0 bude zamítnuta, zatímco je ve skutečnosti pravdivá. [V příkladu je α = 0.05, což bývá nejčastěji používaná hodnota.] Obor přijetí je množina hodnot normované statistiky, která odpovídá IS. Pokud normovaná statistika padne do oboru přijetí, není H 0 zamítnuta. Kritický obor W je množina hodnot normované statistiky, která odpovídá doplňku IS. Pokud normovaná statistika padne do kritického oboru, je H 0 zamítnuta. P o z n á m k a: Podle alternativní hypotézy H A poznáme směrování testu. pro W = ( ; ) podle I. hovoříme o pravostranném testu; pro W = ( ; ) podle II. hovoříme o levostranném testu; pro W = ( ; ) ( ; ) podle III. hovoříme o oboustranném testu. P ř í k l a d: (pokračování) Vypočteme příklad o televizních obrazovkách. Statistika pro odhad: x = 1216 (zadáno). Hladina významnosti: α = 0.05 (zadáno). Normovaná statistika: z r = x µ 0 σ n = 1216 1200 900 10 = 1.687. Obor přijetí: dostaneme normováním pravostranného IS, tj. ( ; z α ) = ( ; 1.645). Kritický obor: je doplňkem oboru přijetí, tj. W = (1.645; ). Závěr: z W H 0 zamítáme. Tedy, není pravda, že střední životnost obrazovek je 1200 hodin. 18

5.3 P-hodnota (Skripta str. 101-103) Z předchozího příkladu je patrné, že z klasického testu nepoznáme, jak moc H 0 zamítáme nebo jak daleko od zamítnutí se H 0 nachází. Abychom tento nedostatek odstranili, a také abychom výsledek testu vyjádřili jediným číslem, zavádíme p-hodnotu p v. Pro pravostranný test střední hodnoty je p-hodnota definována vztahem p v = P (Z > z r H 0 ), (26) což je plocha pod hustotou pravděpodobnosti normované statistiky, vpravo od realizované statistiky. f(z H 0 ) α/2 1 α α/2 p v z r W Z obrázku je patrné, že: bude-li p v = α, budeme na hranici zamítnutí, pro p v < α leží realizovaná statistika v kritickém oboru W, a tedy H 0 zamítáme, pro p v > α leží realizovaná statistika mimo kritický obor W, a tedy H 0 nezamítáme. P ř í k l a d: (pokračování) K předchozímu příkladu ještě dopočteme p-hodnotu: Protože p v < α, hypotézu H 0 zamítáme. p v = P (Z > 1.687) = 0.046. 5.4 Obecné schéma testu hypotézy (Skripta str. 101) Pro jednotlivé případy z kapitoly 2 lze použít obecné schema: Známe: zadané a spočtené charakteristiky a konstanty. Testová statistika T : použitá normovaná statistika a její rozdělení (vzorec - normovaný podle H 0 ). Hodnota statistiky T r : statistika s dosazeným výběrem (vypočtené číslo). 19

P-hodnota: spočteme pravděpodobnost P r = P (T < T r ) (kvantil pro hodnotu statistiky - funkce xxx.cdf) p v = 1 P r pro pravostranný test, tj. θ 0 > θ p v = P r pro levostranný test, tj. θ 0 < θ p v = 2 min{p r, 1 P r } pro oboustranný test, tj. θ 0 θ Závěr: slovní interpretace výsledku. P ř í k l a d: (test pro dva podíly) Na dvou pracovištích A a B byly sledovány pracovní prostoje. Pracoviště A bylo sledováno v n A = 800 časových okamžicích a bylo zaznamenáno n + A = 116 prostojů, zatímco pracoviště B bylo sledováno n B = 1200 krát a zjištěno n + B = 138 prostojů. Na hladině významnosti α = 0.05 testujte hypotézu o rovnosti středních podílů prostojů na obou pracovištích. Řešení provedeme podle uvedeného schématu: Známe: Hypotézy: H 0 : p A = p B, H A : p A p B Směrování: Podíly: oboustranný test. p A = 116 800 = 0.145, p B = 138 1200 = 0.115, p P = p 1(1 p 1 ) + p 2(1 p 2 ) = 2.4 10 4 n 1 1 n 2 1 Hladina významnosti: α = 0.05 Testová statistika: z = p 1 p 2 pp N(0; 1) Hodnota statistiky: z r = 1.94 Kritický obor W = ( 1.96; 1.96) P-hodnota: p v = 2 0.0265 = 0.053. Závěr: Na hladině 0.05 hypotézu H 0 nezamítáme, podíly prostojů na pracovištích A a B nejsou stejné. P-hodnota navíc ukazuje, že zamítnutí je poměrně těsné. P o z n á m k a: 1. Výběr charakteristiky (vzorce) pro test určuje H 0 - o čem vypovídá tvrzení nulové hypotézy, to se testuje. 2. O směrování testu rozhoduje H A - podle toho jak odporuje nulové hypotéze (<, >, ) určíme směrování. 20

5.5 Vybrané parametrické testy (Skripta str. 103-115) Budeme sledovat parametrické testy pro střední hodnotu, rozptyl a podíl, jako pro IS. Střední hodnota (známé σ 2 ) 13 V programu O c t a v e lze pro tyto testy použít funkci [pval, z] = z test (x, m, v, alt), [pval, z] = z test 2(x, y, v x, v y, alt), kde pval je p-hodnota, z je hodnota statistiky, x,y je výběr, v,v x,v y je rozptyl souboru, alt typ testu (<, >, <>). Střední hodnota (neznámé σ 2 ) 14 V programu O c t a v e lze pro tyto testy použít funkci [pval, t, df] = t test (x, m, alt), [pval, t, df] = t test 2s (x, y, alt), [pval, t, df] = t test 2n (x, y, alt), [pval, t, df] = t test 2p (x, y, alt), kde pval je p-hodnota, t je hodnota statistiky, df jsou stupně volnosti, x,y je výběr, alt typ testu (<, >, <>). Rozptyl 15 V programu O c t a v e lze pro tyto testy použít funkci [pval, ch2, df] = var test (x, v0, alt), [pval, f, df num, df den] = var test 2 (x, y, alt), kde pval je p-hodnota, ch2,t je hodnota statistiky, df,df num,df den jsou stupně volnosti, x,y je výběr, v0 je rozptyl podle nulové hypotézy, alt typ testu (<, >, <>). Podíl 16 U tohoto testu se v literatuře obvykle uvádí trochu jiná statistika. V zájmu jednotnosti jsme ponechali stejnou statistiku, jako pro odhad (což je zvykem). Rozdíly jsou zanedbatelné. V programu O c t a v e lze pro tento test použít funkci 13 Skripta str. 103 14 Skripta str. 105,108-113 15 Skripta str. 106 16 Skripta str. 107,113-114 21

[pval, z] = prop test 2 (x1, n1, x2, n2, alt), kde pval je p-hodnota, z je hodnota statistiky, x1,x2 jsou výběrové podíly (počty), n1,n2 jsou počty pokusů, alt typ testu (<, >, <>). 22