Příklady na testy hypotéz o parametrech normálního rozdělení. O životnosti 75W žárovky (v hodinách) je známo, že má normální rozdělení s = 5h. Pro náhodný výběr 0 žárovek byla stanovena průměrná životnost x = 04h. (a) Na hladině významnosti 0,05 otestujte hypotézu H 0, že životnost (µ) je 000 hodin, proti alternativě, že µ 000. Využijeme testovou statistiku U = n X µ 0 35,06. Při oboustranné alternativě W α = u α/, u α/ (Nakreslete si pro představu hustotu N(0, ) rozdělení W 0.05 = u 0.975, u 0.975 =.96,.96. Hypotézu H 0 tedy na hladině významnosti 0,05 (b) Otestujte hypotézu H 0, že životnost (µ) je 000 hodin, proti alternativě, že µ > 000. Využijeme testovou statistiku U = n X µ 0 35,06. Při jednostranné alternativě W α = (, u α. V tomto případě je tedy W 0.05 = (,.645. Hypotézu H 0 opět na hladině významnosti 0,05 (c) Na hladině významnosti 0,05 otestujte hypotézu H 0, že životnost (µ) je 000 hodin, proti alternativě, že µ 000 pomocí intervalu spolehlivosti. Využijeme testovou statistiku U = n X µ 0. Z jejího tvaru odvodíme interval spolehlivosti X u α n, X + u α n. V našem případě P (µ 0.8, 06. ) = 0.95. Testovaná hodnota 000 neleží ve vypočteném intervalu spolehlivosti a proto hypotézu H 0 zamítáme na hladině významnosti 0,05.. Požadovaná střední hodnota vlhkosti čaje je 4.% a směrodatná odchylka 0,4%. V 5 vzorcích byly analýzou zjištěny tyto skutečné hodnoty vlhkosti v %: 4.4 3.75 4.0 3.93 4.4 3. 3.86 4.6 4.0 4.5 4.3 3.73 4.09 3.98 3.94 Předpokládáme, že jde o realizace náhodného výběru z normálního rozdělení. (a) Na hladině významnosti 0,05 otestujte hypotézu H 0, že střední hodnota vlhkosti čaje je 4.%. Využijeme testovou statistiku T = n X µ 0 n t = 5 4.0073 4. 0.895 =.397. Při oboustranné alternativě je doplněk kritického oboru W α = t α/ (4), t α/ (4) (Nakreslete si pro představu Pravděpodobnost a statistika I (P) Z. Hübnerová, ÚM FI VUT v Brně, 05
hustotu t rozdělení a vyznačte odpovídající kvantily). V tomto případě je tedy W 0.05 =.44,.44. Hypotézu H 0 tedy na hladině významnosti 0,05 ne (b) Na hladině významnosti 0,05 otestujte hypotézu H 0, že směrodatná odchylka vlhkosti čaje je 0.4%. Hypotéza je shodná s hypotézou, že rozptyl vlhkosti čaje je roven 0.6. Využijeme testovou statistiku K = n n. Její realizace je v tomto případě k = 4 0.60.0838 = 7.335. Při oboustranné alternativě je doplněk kritického oboru W α = χ α/ (4), χ α/ (4) (Nakreslete si pro představu hustotu χ rozdělení W 0.05 = 5.687, 6.89. Hypotézu H 0 tedy na hladině významnosti 0,05 ne 3. U 5 dospělých mužů ve věku mezi 35 a 50 let byl zkoumán vliv diety a cvičení na hladinu cholesterolu. Celková hladina cholesterolu byla měřena u každého jedince na počátku a po třech měsících účasti na programu aerobního cvičení a zkoumané diety. Výsledky jsou uvedeny v následující tabulce. Předpokládáme, že jde o realizace náhodného výběru z normálního rozdělení. osoba 3 4 5 6 7 8 9 0 před 65 40 58 95 5 45 87 34 60 79 poté 9 3 7 40 38 4 34 56 47 39 osoba 3 4 5 před 83 40 38 5 47 poté 46 8 9 6 33 (a) Na hladině významnosti 0,05 otestujte hypotézu H 0, že program nemá vliv na hladinu cholesterolu. Hladiny cholesterolu před a po programu jsou jednoznačně závislé. Proto nemůžeme využít dvouvýběrový t-test při shodných nebo různých rozptylech. Vypočteme rozdíl hladin cholesterolů před a po programu pro každého jednotlivce. Poté otestujeme hypotézu, že střední hodnota rozdílu je nulová. Využijeme testovou statistiku T = n D µ 0 n t = 5 6.8667 0 9.037 = 5.4659. Při oboustranné alternativě je doplněk kritického oboru W α = t α/ (4), t α/ (4) (Nakreslete si pro představu hustotu t rozdělení W 0.05 =.44,.44. Hypotézu H 0 tedy na hladině významnosti 0,05 Pravděpodobnost a statistika I (P) Z. Hübnerová, ÚM FI VUT v Brně, 05
4. Koncentrace arzenu v kohoutkové vodě může znamenat potencionální zdravotní riziko. Byla měřena koncentrace arzenu [v miliardtinách] v 0 oblastech v hlavního města Arizony Phoenixu a 0 oblastech venkovské Arizony. Bylo zjištěno x =.5 a s = 7.63 ve Phoenixu a x = 7.5 a s = 5.3 na venkově. Předpokládáme, že jde o realizace náhodného výběru z normálního rozdělení. (a) Na hladině významnosti 0,05 otestujte hypotézu H 0, že rozptyl koncentrací arzenu ve Phoenixu a na venkově je stejný. Testujeme hypotézu H 0 : =. Předpokládáme nezávislost náhodných výběrů, protože šlo o vzdálené lokality. Využijeme F statistiku F =. Její realizace je v tomto případě f = 7.63 5.3 = 0.487. Při oboustranné alternativě W α = F α/ (9, 9), F α/ (9, 9) (Nakreslete si pro představu hustotu F rozdělení W 0.05 = 0.484, 4.060. Hypotézu H 0 tedy na hladině významnosti 0,05 ne (b) Na hladině významnosti 0,05 otestujte hypotézu H 0, že střední hodnoty koncentrací arzenu ve Phoenixu a na venkově jsou stejné. Testujeme hypotézu H 0 : µ µ = 0. Předpokládáme nezávislost náhodných výběrů, protože šlo o vzdálené lokality. Kvůli výsledku přechozího testu využijeme dvouvýběrový t test se shodnými rozptyly, který je založen na statistice T = X X n n n +n, kde = ((n ) + (n ) )/(n + n ). Vypočteme = (9 7.63 + 9 5.3 )/8 =.0894. Proto je realizace testové statistiky t =.5 7.5.0894 00 0 =.7744. Při oboustranné alternativě W α = t α/ (8), t α/ (8) (Nakreslete si pro představu hustotu t rozdělení W 0.05 =.009,.009. Hypotézu H 0 tedy na hladině významnosti 0,05 5. Byla sledována hmotnost vápníku ve standardním cementu a v cementu s příměsí olova. Nižší hladina vápníku by znamenala, že mechanismus hydratace cementu je blokován a umožnila by vodě koncentrovat se av různých místech struktury cementu. Deset vzorků standardního cementu mělo průměrnou hmotnostní procento vápníku x = 90.0 s výběrovou směrodatnou odchylkou s = 7.0 a 5 vzorků olovem obohaceného cementu mělo průměrnou procentulání váhu Pravděpodobnost a statistika I (P) Z. Hübnerová, ÚM FI VUT v Brně, 05
kalcia x = 87.0 s s = 4.0. Předpokládáme, že hmotnostní procento kalcia má normální rozdělení. (a) Na hladině významnosti 0. otestujte hypotézu H 0, že rozptyl hmotnostního procenta kalcia v obou typech cementu je stejný. Testujeme hypotézu H 0 : =. Předpokládáme nezávislost náhodných výběrů, protože jde o nezávislé vzorky. Využijeme F statistiku F =. Její realizace je v tomto případě f = 7.0 4.0 = 3.065. Při oboustranné alternativě W α = F α/ (4, 9), F α/ (4, 9) (Nakreslete si pro představu hustotu F rozdělení W 0. = 0.3780, 3.055. Hypotézu H 0 tedy na hladině významnosti 0. (b) Na hladině významnosti 0. otestujte hypotézu H 0, že střední hodnoty hmotnostního procenta kalcia v obou typech cementu jsou stejné. Testujeme hypotézu H 0 : µ µ = 0. Předpokládáme nezávislost náhodných výběrů, protože jde o nezávislé vzorky. Kvůli výsledku přechozího testu využijeme dvouvýběrový t test s rozdílnými rozptyly, který je založen na statistice X Y n + 49 90 87 T =. Realizace testové statistiky je t = =.3599. Při 5 + 6 0 n tomto testu není známé přesné rozdělení testovací statistiky a je třeba jej aproximovat. Jedna z možností je využít studentovo t rozdělení s df stupni volnosti, kde df = ( ) R +R n + (+R) n, a R = n n. V našem případě to je R = 49 0 6 5 =.047 a df = ( ).047 3.047 4 + (+.047) 9 = 0.044. Odtud df =.684. Přesnou hodnotu kvantilu t 0.95 (.684) lze získat ze softwaru jako.75. Případně využijeme vhodnou interpolaci blízkých hodnot z tabulek. Při oboustranné alternativě W α =.75,.75 (Nakreslete si pro představu hustotu t rozdělení a vyznačte odpovídající kvantily). Hypotézu H 0 tedy na hladině významnosti 0. ne Pravděpodobnost a statistika I (P) Z. Hübnerová, ÚM FI VUT v Brně, 05
Testy o parametrech normálního a binomického rozdělení rozdělení hypotéza předpoklad rozdělení testové stat. testová statistika poznámka N(µ, ) µ = µ0 známe U N(0, ) U = n X µ 0 N(µ, ) µ = µ0 neznáme T t(n ) T = n X µ n t-test pro jeden výběr N(µ, ) = 0 µ neznáme K χ (n ) K = n n Pearsonův test N(µ, µ,,, ρ) ρ = 0 µ, µ,, neznáme T t(n ) T = r XY r n pouze pro test lineární nezávislosti XY N(µ, µ,,, ρ) ρ = ρ0 µ, µ,, neznáme Z as N( Bi(n, π) π = π0 n známe U as +ρ ln + ρ, ) Z = ln +r XY ρ (n ) n 3 rxy N(0, ) U = Yn n 0 n n > 30 π 0( π0) n 0, r, ρ. výběr z. výběr z rozsahy závislé hypotéza předpoklad rozdělení testové stat. testová statistika poznámka N(µ, ) N(µ, ) n = n ano µ µ =,, ρ TD t(n ) TD = n D, D i = párový t-test D neznáme N(µ, ) N(µ, ) n, n ne µ µ =, neznáme, = N(µ, ) N(µ, ) n, n ne µ µ =, neznáme, N(µ, ) N(µ, ) n, n ne = µ, µ neznáme A(π) A(π) n, n ne π = π U as N(0, ) Xi Yi T t(n + n ) T = T as t(f) T = X Y viz pozn. F F (n, n ) F = X Y Yn X Y X n + Y v( v) n n Zn n n n n, n+n dvouvýběrový t-test při stejných rozptylech t-test při různých rozptylech (Behrens-Fisher problém) n dvouvýběrový n+n F-test n > 50 a n > 50 Poznámky:. = ((n ) X + (n ) Y )/(n + n ). = ( R f +R ) +, kde R = n (+R) X n Y pravděpodobnost, 007) n n Welchův přibližný t-test (jiný viz. Karpíšek: Matematika IV, tatistika a 3. v = Yn +Zn n+n