Příklady na testy hypotéz o parametrech normálního rozdělení

Podobné dokumenty
12. cvičení z PST. 20. prosince 2017

PRAVDĚPODOBNOST A STATISTIKA

= = 2368

15. T e s t o v á n í h y p o t é z

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Testování statistických hypotéz

5. T e s t o v á n í h y p o t é z

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Testování statistických hypotéz

Statistika pro každého. Párový test Test shody dvou rozptylů Dvouvýběrový t-test Porovnání středních hodnot při nestejných rozptylech

4ST201 STATISTIKA CVIČENÍ Č. 7

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

15. T e s t o v á n í h y p o t é z

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

Jednostranné intervaly spolehlivosti

Testy. Pavel Provinský. 19. listopadu 2013

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

Testování statistických hypotéz. Obecný postup

12. prosince n pro n = n = 30 = S X

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Aproximace binomického rozdělení normálním

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

STATISTICKÉ TESTY VÝZNAMNOSTI

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Normální (Gaussovo) rozdělení

Cvičení ze statistiky - 8. Filip Děchtěrenko

Testování statistických hypotéz

4EK211 Základy ekonometrie

Intervalové Odhady Parametrů

Pravděpodobnost a matematická statistika

KGG/STG Statistika pro geografy

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Cvičení ze statistiky - 9. Filip Děchtěrenko

STATISTICKÉ HYPOTÉZY

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

STATISTICKÉ TESTY VÝZNAMNOSTI

Stručný úvod do testování statistických hypotéz

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Testy statistických hypotéz

Testování hypotéz. 4. přednáška

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Charakteristika datového souboru

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Intervalové Odhady Parametrů II Testování Hypotéz

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

2 ) 4, Φ 1 (1 0,005)

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

5 Parametrické testy hypotéz

Statistika, Biostatistika pro kombinované studium. Jan Kracík

7. Analýza rozptylu.

Normální (Gaussovo) rozdělení

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Ing. Michael Rost, Ph.D.

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Zápočtová práce STATISTIKA I

Úvod do analýzy rozptylu

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

MATEMATIKA III V PŘÍKLADECH

Přednáška X. Testování hypotéz o kvantitativních proměnných

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Kontingenční tabulky, korelační koeficienty

You created this PDF from an application that is not licensed to print to novapdf printer (

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

prosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina

Analýza dat z dotazníkových šetření

Korelační a regresní analýza

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

6. T e s t o v á n í h y p o t é z

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

Statistika. Testování hypotéz - statistická indukce Parametrické testy. Roman Biskup

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Pohlédněte si základní charakteristiky polohy jednotlivých veličin pomocí funkce summary.

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Tomáš Karel LS 2012/2013

Testování hypotéz o parametrech regresního modelu

Porovnání dvou výběrů

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Náhodné veličiny, náhodné chyby

Tomáš Karel LS 2012/2013

Testování hypotéz o parametrech regresního modelu

Transkript:

Příklady na testy hypotéz o parametrech normálního rozdělení. O životnosti 75W žárovky (v hodinách) je známo, že má normální rozdělení s = 5h. Pro náhodný výběr 0 žárovek byla stanovena průměrná životnost x = 04h. (a) Na hladině významnosti 0,05 otestujte hypotézu H 0, že životnost (µ) je 000 hodin, proti alternativě, že µ 000. Využijeme testovou statistiku U = n X µ 0 35,06. Při oboustranné alternativě W α = u α/, u α/ (Nakreslete si pro představu hustotu N(0, ) rozdělení W 0.05 = u 0.975, u 0.975 =.96,.96. Hypotézu H 0 tedy na hladině významnosti 0,05 (b) Otestujte hypotézu H 0, že životnost (µ) je 000 hodin, proti alternativě, že µ > 000. Využijeme testovou statistiku U = n X µ 0 35,06. Při jednostranné alternativě W α = (, u α. V tomto případě je tedy W 0.05 = (,.645. Hypotézu H 0 opět na hladině významnosti 0,05 (c) Na hladině významnosti 0,05 otestujte hypotézu H 0, že životnost (µ) je 000 hodin, proti alternativě, že µ 000 pomocí intervalu spolehlivosti. Využijeme testovou statistiku U = n X µ 0. Z jejího tvaru odvodíme interval spolehlivosti X u α n, X + u α n. V našem případě P (µ 0.8, 06. ) = 0.95. Testovaná hodnota 000 neleží ve vypočteném intervalu spolehlivosti a proto hypotézu H 0 zamítáme na hladině významnosti 0,05.. Požadovaná střední hodnota vlhkosti čaje je 4.% a směrodatná odchylka 0,4%. V 5 vzorcích byly analýzou zjištěny tyto skutečné hodnoty vlhkosti v %: 4.4 3.75 4.0 3.93 4.4 3. 3.86 4.6 4.0 4.5 4.3 3.73 4.09 3.98 3.94 Předpokládáme, že jde o realizace náhodného výběru z normálního rozdělení. (a) Na hladině významnosti 0,05 otestujte hypotézu H 0, že střední hodnota vlhkosti čaje je 4.%. Využijeme testovou statistiku T = n X µ 0 n t = 5 4.0073 4. 0.895 =.397. Při oboustranné alternativě je doplněk kritického oboru W α = t α/ (4), t α/ (4) (Nakreslete si pro představu Pravděpodobnost a statistika I (P) Z. Hübnerová, ÚM FI VUT v Brně, 05

hustotu t rozdělení a vyznačte odpovídající kvantily). V tomto případě je tedy W 0.05 =.44,.44. Hypotézu H 0 tedy na hladině významnosti 0,05 ne (b) Na hladině významnosti 0,05 otestujte hypotézu H 0, že směrodatná odchylka vlhkosti čaje je 0.4%. Hypotéza je shodná s hypotézou, že rozptyl vlhkosti čaje je roven 0.6. Využijeme testovou statistiku K = n n. Její realizace je v tomto případě k = 4 0.60.0838 = 7.335. Při oboustranné alternativě je doplněk kritického oboru W α = χ α/ (4), χ α/ (4) (Nakreslete si pro představu hustotu χ rozdělení W 0.05 = 5.687, 6.89. Hypotézu H 0 tedy na hladině významnosti 0,05 ne 3. U 5 dospělých mužů ve věku mezi 35 a 50 let byl zkoumán vliv diety a cvičení na hladinu cholesterolu. Celková hladina cholesterolu byla měřena u každého jedince na počátku a po třech měsících účasti na programu aerobního cvičení a zkoumané diety. Výsledky jsou uvedeny v následující tabulce. Předpokládáme, že jde o realizace náhodného výběru z normálního rozdělení. osoba 3 4 5 6 7 8 9 0 před 65 40 58 95 5 45 87 34 60 79 poté 9 3 7 40 38 4 34 56 47 39 osoba 3 4 5 před 83 40 38 5 47 poté 46 8 9 6 33 (a) Na hladině významnosti 0,05 otestujte hypotézu H 0, že program nemá vliv na hladinu cholesterolu. Hladiny cholesterolu před a po programu jsou jednoznačně závislé. Proto nemůžeme využít dvouvýběrový t-test při shodných nebo různých rozptylech. Vypočteme rozdíl hladin cholesterolů před a po programu pro každého jednotlivce. Poté otestujeme hypotézu, že střední hodnota rozdílu je nulová. Využijeme testovou statistiku T = n D µ 0 n t = 5 6.8667 0 9.037 = 5.4659. Při oboustranné alternativě je doplněk kritického oboru W α = t α/ (4), t α/ (4) (Nakreslete si pro představu hustotu t rozdělení W 0.05 =.44,.44. Hypotézu H 0 tedy na hladině významnosti 0,05 Pravděpodobnost a statistika I (P) Z. Hübnerová, ÚM FI VUT v Brně, 05

4. Koncentrace arzenu v kohoutkové vodě může znamenat potencionální zdravotní riziko. Byla měřena koncentrace arzenu [v miliardtinách] v 0 oblastech v hlavního města Arizony Phoenixu a 0 oblastech venkovské Arizony. Bylo zjištěno x =.5 a s = 7.63 ve Phoenixu a x = 7.5 a s = 5.3 na venkově. Předpokládáme, že jde o realizace náhodného výběru z normálního rozdělení. (a) Na hladině významnosti 0,05 otestujte hypotézu H 0, že rozptyl koncentrací arzenu ve Phoenixu a na venkově je stejný. Testujeme hypotézu H 0 : =. Předpokládáme nezávislost náhodných výběrů, protože šlo o vzdálené lokality. Využijeme F statistiku F =. Její realizace je v tomto případě f = 7.63 5.3 = 0.487. Při oboustranné alternativě W α = F α/ (9, 9), F α/ (9, 9) (Nakreslete si pro představu hustotu F rozdělení W 0.05 = 0.484, 4.060. Hypotézu H 0 tedy na hladině významnosti 0,05 ne (b) Na hladině významnosti 0,05 otestujte hypotézu H 0, že střední hodnoty koncentrací arzenu ve Phoenixu a na venkově jsou stejné. Testujeme hypotézu H 0 : µ µ = 0. Předpokládáme nezávislost náhodných výběrů, protože šlo o vzdálené lokality. Kvůli výsledku přechozího testu využijeme dvouvýběrový t test se shodnými rozptyly, který je založen na statistice T = X X n n n +n, kde = ((n ) + (n ) )/(n + n ). Vypočteme = (9 7.63 + 9 5.3 )/8 =.0894. Proto je realizace testové statistiky t =.5 7.5.0894 00 0 =.7744. Při oboustranné alternativě W α = t α/ (8), t α/ (8) (Nakreslete si pro představu hustotu t rozdělení W 0.05 =.009,.009. Hypotézu H 0 tedy na hladině významnosti 0,05 5. Byla sledována hmotnost vápníku ve standardním cementu a v cementu s příměsí olova. Nižší hladina vápníku by znamenala, že mechanismus hydratace cementu je blokován a umožnila by vodě koncentrovat se av různých místech struktury cementu. Deset vzorků standardního cementu mělo průměrnou hmotnostní procento vápníku x = 90.0 s výběrovou směrodatnou odchylkou s = 7.0 a 5 vzorků olovem obohaceného cementu mělo průměrnou procentulání váhu Pravděpodobnost a statistika I (P) Z. Hübnerová, ÚM FI VUT v Brně, 05

kalcia x = 87.0 s s = 4.0. Předpokládáme, že hmotnostní procento kalcia má normální rozdělení. (a) Na hladině významnosti 0. otestujte hypotézu H 0, že rozptyl hmotnostního procenta kalcia v obou typech cementu je stejný. Testujeme hypotézu H 0 : =. Předpokládáme nezávislost náhodných výběrů, protože jde o nezávislé vzorky. Využijeme F statistiku F =. Její realizace je v tomto případě f = 7.0 4.0 = 3.065. Při oboustranné alternativě W α = F α/ (4, 9), F α/ (4, 9) (Nakreslete si pro představu hustotu F rozdělení W 0. = 0.3780, 3.055. Hypotézu H 0 tedy na hladině významnosti 0. (b) Na hladině významnosti 0. otestujte hypotézu H 0, že střední hodnoty hmotnostního procenta kalcia v obou typech cementu jsou stejné. Testujeme hypotézu H 0 : µ µ = 0. Předpokládáme nezávislost náhodných výběrů, protože jde o nezávislé vzorky. Kvůli výsledku přechozího testu využijeme dvouvýběrový t test s rozdílnými rozptyly, který je založen na statistice X Y n + 49 90 87 T =. Realizace testové statistiky je t = =.3599. Při 5 + 6 0 n tomto testu není známé přesné rozdělení testovací statistiky a je třeba jej aproximovat. Jedna z možností je využít studentovo t rozdělení s df stupni volnosti, kde df = ( ) R +R n + (+R) n, a R = n n. V našem případě to je R = 49 0 6 5 =.047 a df = ( ).047 3.047 4 + (+.047) 9 = 0.044. Odtud df =.684. Přesnou hodnotu kvantilu t 0.95 (.684) lze získat ze softwaru jako.75. Případně využijeme vhodnou interpolaci blízkých hodnot z tabulek. Při oboustranné alternativě W α =.75,.75 (Nakreslete si pro představu hustotu t rozdělení a vyznačte odpovídající kvantily). Hypotézu H 0 tedy na hladině významnosti 0. ne Pravděpodobnost a statistika I (P) Z. Hübnerová, ÚM FI VUT v Brně, 05

Testy o parametrech normálního a binomického rozdělení rozdělení hypotéza předpoklad rozdělení testové stat. testová statistika poznámka N(µ, ) µ = µ0 známe U N(0, ) U = n X µ 0 N(µ, ) µ = µ0 neznáme T t(n ) T = n X µ n t-test pro jeden výběr N(µ, ) = 0 µ neznáme K χ (n ) K = n n Pearsonův test N(µ, µ,,, ρ) ρ = 0 µ, µ,, neznáme T t(n ) T = r XY r n pouze pro test lineární nezávislosti XY N(µ, µ,,, ρ) ρ = ρ0 µ, µ,, neznáme Z as N( Bi(n, π) π = π0 n známe U as +ρ ln + ρ, ) Z = ln +r XY ρ (n ) n 3 rxy N(0, ) U = Yn n 0 n n > 30 π 0( π0) n 0, r, ρ. výběr z. výběr z rozsahy závislé hypotéza předpoklad rozdělení testové stat. testová statistika poznámka N(µ, ) N(µ, ) n = n ano µ µ =,, ρ TD t(n ) TD = n D, D i = párový t-test D neznáme N(µ, ) N(µ, ) n, n ne µ µ =, neznáme, = N(µ, ) N(µ, ) n, n ne µ µ =, neznáme, N(µ, ) N(µ, ) n, n ne = µ, µ neznáme A(π) A(π) n, n ne π = π U as N(0, ) Xi Yi T t(n + n ) T = T as t(f) T = X Y viz pozn. F F (n, n ) F = X Y Yn X Y X n + Y v( v) n n Zn n n n n, n+n dvouvýběrový t-test při stejných rozptylech t-test při různých rozptylech (Behrens-Fisher problém) n dvouvýběrový n+n F-test n > 50 a n > 50 Poznámky:. = ((n ) X + (n ) Y )/(n + n ). = ( R f +R ) +, kde R = n (+R) X n Y pravděpodobnost, 007) n n Welchův přibližný t-test (jiný viz. Karpíšek: Matematika IV, tatistika a 3. v = Yn +Zn n+n