10 cvičení z PSI 5-9 prosince 016 101 intervalový odhad Veličina X, představující životnost žárovky, má exponenciální rozdělení s parametrem τ Průměrná životnost n = 64 náhodně vybraných žárovek je x = 10 hodin Pomocí centrální limitní věty určete oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ Pro veličinu X máme EX = τ a DX = τ Veličina průměrná životnost n = 64 žárovek je dána jako X = 1 n X i n Pro ni máme EX = τ a DX = τ n Podle CLV má veličina normx = X τ n τ přibližně normované normální rozdělení N0, 1 Pro α = 005 označme u 0975 = Φ 1 1 α = Φ 1 0975 = 196 Díky CLV můžeme přibližně psát 095 = P u 0975 normx u 0975 = P u 0975 X τ n u0975 = τ = P u 0975 X n τ 1 u 0975 X X = P τ n 1+ u0975 n 1 u0975 n Realizace veličiny X je x = 10 hodin Hledaný oboustranný symetrický 95% interval spolehlivosti v hodinách pro τ je tak přibližně x x 10 10, = 1+ u0975 n 1 u0975 n 1+ 196, 64 1 196 = 168675, 78146 64 10 odhad parametru - diskrétní rozdělení Náhodná veličina X nabývá hodnot z množiny {0, 1, } a pravděpodobnostmi PX = j = a+bj pro všechna j {0, 1, } Odhadněte metodou momentů parametry a, b na základě četností podle následující tabulky: hodnota 0 1 pozorovaná četnost 17 15 8
Protože hodnoty PX = j = a+bj musí být pravděpodobnosti, dostáváme podmínky a+b 0 0 a+b 1 0 a+b 0 1 = a+b 0+a+b 1+a+b = 3a+3b Dále budeme chtít, aby se rovnal první moment a jeho odhad: Pro střední hodnotu dostáváme EX = m X EX = 0 a+b 0+1 a+b 1+ a+b = 3a+5b Pro výběrový průměr tj odhad prvního momentu pak máme Celkově máme soustavu rovnic s řešením b = 9 80 = 0115 a a = 1 3 vycházejí jako m X = 0 17+1 15+ 8 17+15+8 3a+3b = 1 3a+5b = 31 40 b = 107 40 = 31 40 PX = 0 = a = 107 = 04459 44 = 04458 Jednotlivé pravděpodobnosti pak PX = 1 = a+b = 1 = 03333 3 PX = = a+b = 53 = 008 40 takže všechny podmínky máme splněny a našli jsme skutečně odhad parametru 103 odhad parametru - směs veličin V osudí jsou dva druhy kostek - na prvních jsou čísla 1,,6 a na druhých pouze čísla,4,6 U obou druhů jsou všechny možné výsledky na dané kostce vždy stejně pravděpodobné Vytáhli jsme 0 kostek a jednou jimi hodili Četnost výsledků udává tabulka: hodnota 1 3 4 5 6 pozorovaná četnost 3 4 4 4 3 Odhadněte v jakém poměru jsou jednotlivé druhy kostek mezi kostkami, které jsme vytáhli a kolik z vytažených kostek bylo prvního druhu Použijte metodu momentů i metodu maximální věrohodnosti Celkem jsem vytáhli 3+4+4+4++3 = 0 kostek Označme k počet kostek prvního druhu mezi těmito vytaženými Zřejmě tedy je k {0,1,,0} Protože liché hodnoty padají pouze na kostkách prvního druhu, musí být k 3+4+ = 9 Page
Označme si Ω = množina kostek, které jsme si vytáhli, Ω 1 = kostky 1druhu z Ω, Ω = kostky druhu z Ω Zřejmě je Ω = Ω 1 Ω, Ω = 0 a PΩ 1 = k 0 Naše veličina X : Ω R, X = hodnota, která padne na kostce z Ω je pak směsí veličin Y 1 : Ω 1 R a Y : Ω R Y 1 = hodnota, která padne na kostce z Ω 1 Y = hodnota, která padne na kostce z Ω ve tvaru X = Mix k Y 1,Y 0 Metoda maximální věrohodnosti: Z definice směsi máme p X i = k 0 p Y 1 i+ 1 k p Y i = 0 Takže pro věrohodnost dostáváme Lk = k 0 1 6 = k k 0 1 10, i = 1,3,5, 6 + 1 k 0 k 3+4+ 1 10 3 k 4+4+3 10 1 3 = 1 3 k 10, i =,4,6 k 40 k lk = lnlk = 9 ln +11 ln 10 10 kde k {9,,0} Pro nalezení maxima je jednodušší na chvíli předpokládat, že funkce l je dodefinována na vhodném intervalu Můžeme tedy postupovat jako při hledání maxima funkce na intervalu a to pomocí derivace l k = 9 k 11 40 k = 360 0k k40 k Z tvaru derivace l je ihned zřejmé, ze např na intervalu 0,40 má funkce l jediné maximum tam, kde je l nulová, tedy pro k = 360 0 = 18 Tato hodnota je i v souladu s počátečními omezujícími podmínkami Metoda momentů: Zřejmě EY 1 = 7 a EY = 4 Z definice směsi máme a výběrový průměr je EX = k 0 EY 1+ 1 k EY = k 0 0 7 1 + k 4 = 4 k 0 40 x = 3 1+4 +4 3+4 4+ 5+3 6 0 = 67 0 Page 3
Srovnáním dostaneme což dává 4 k 40 = EX = x = 67 0, k = 6 Tato hodnota ale NEODPOVÍDÁ počátečním omezujícím podmínkám Metoda momentů nám tedy v tomto případě žádný odhad NEPOSKYTUJE 104 odhad parametru - spojité rozdělení Náhodná veličina X s oborem hodnot a,+ má hustotu { 0, t,a, f X t = e a t, t a,, kde a R je parametr Pomocí metody maximální věrohodnosti i metody momentů odhadněte parametr a Úlohu vyřešte obecně pro realizaci x = x 1,x,,x n a také pro konkrétní realizaci rozsahu n = 7 x = 1,,,, 3, 3, 4 Funkce f X je posunutá hustota exponenciálního rozdělení s parametrem τ = 1 Je to tedy opět hustota, tj je nezáporná a platí R f Xt dt = 1 Realizované výsledky musí spadat do oboru hodnot, tj x i a,+ pro všechna i = 1,,n neboli musí platit, že a min{x 1,,x n } Metoda maximální věrohodnosti: Naším cílem je maximalizovat funkci n Λa = e a xi = e na e i xi Tato funkce nabývá maxima pro největší přípustnou hodnotu parametru â = min{x 1,x n } Pro konkrétní zadání je to pak â = min{1,,,,3,3,4}= 1 Metoda momentů: Porovnáme teoretickou střední hodnotu Page 4
EX = t f X tdt = a te a t dt = [ te a t ] t=a + e a t dt = = a+[ e a t ] t=a = a+1 a výběrový průměr x Odtud tak pro parametr â dostaneme â = x 1, POKUD je ovšem splněno, že a min{x 1,,x n }! Pro konkrétní zadání je x = 1++++3+3+4 7 = 17 7 a a tedy â = 17 7 1 = 143, což ale NENÍ menší než min{1,,,,3,3,4} = 1 V tomto případě tedy metoda momentů NEDÁVÁ žádný odhad 105 odhad parametru - spojité rozdělení Náhodná veličina X má biexponenciální rozdělení s hustotou f X t = c e a t, t R kde a,c > 0 Metodou momentů odhadněte parametry na základě realizace rozsahu n = 10, z níž jsme vypočítali realizaci výběrového průměru x = a realizaci výběrového rozptylu s x = 4 Aby funkce f X byla hustotou, musí být splněno, že [ e 1 = f X t dt = c e at at dt = c a 0 tedy c = a a zbývá odhadnout parametr a Hustota je sudá funkce a proto střední hodnota EX stejně jako všechny liché momenty bude nulová Příslušné nevlastní integrály existují, protože klesající exponenciála převáží jakýkoliv polynom v nekonečnu Porovnáním teoretické střední hodnoty a výběrového průměru dostaneme 0 = EX = x = což sice evidentně neplatí, ale nedává to žádné omezení na volbu parametrů a Navíc těžko můžeme čekat, že se měřením přesně trefíme do teoretické hodnoty Musíme proto použít další moment: ] t=0 = c a EX = t f X t dt = 0 ] [t e at = + a t=0 a }{{} =0 t ae at dt = [ t e at ] + t=0 }{{} =0 0 e at dt = a, 0 te at dt = který chceme srovnat s druhým vyběrovým momentem nikoliv s výběrovým rozptylem!: m = 1 n n x i Page 5
Ten se dá získat z hodnot x = a s x = 4 podobným vztahem jako máme pro rozptyl, tj, DX = EX EX jen si musíme dát pozor na to, že někde je 1 n a někde zase 1 n 1 Máme tedy takže Srovnáním dostaneme a celkem tak máme a = n 1 n s x = 1 n m = n 1 n 5 95 19 = 19 n x i x = m x s x +x = 9 10 4+ = 38 5 a = EX = m = 38 5 = 051989 a c = a 95 = 38 = 056495 106 test střední hodnoty při známém rozptylu Posud te na hladině významnosti α = 001 hypotézu, že mince je symetrická, jestliže a při n = 00 hodech padl líc 80, b při n = 100 hodech padl líc 40 tj v obou případech to bylo 40% výsledků Návod: Použijte vhodnou statistiku s přibližně normálním rozdělením odvozenou na základě centrální limitní věty pro náhodnou veličinu Xlíc = 1, Xrub = 0 Situace, kdy přesně známe rozptyl danéhonormálního rozdělení, není příliš obvyklá Většinou jej máme jen odhadnutý a pak musíme používat Studentovo rozdělení namísto normálního Výjimkou jsou ale případy, kdy rozptyl nějakého rozděleníalternativního, exponenciálního, Poissonova, atd je svázaný se střední hodnotou tohoto rozdělení prostřednictvím nějakého parametru Může se zdát, že pak se ale nedá použít obvyklý postup pro test střední hodnoty se známým rozptylem, protože nemáme normální rozdělení To si ale můžeme vyrobit přibližně pomocí CLV Výsledky hodu mincí představují náhodnou veličinu Xlíc = 1, Xrub = 0 s alternativním rozdělením s parametrem p, tj PX = 1 = p Naše nulová hypotéza tedy bude H 0 : p = p 0 proti alternativní hypotéze: H 1 : p p 0 kde p 0 = 1 Vezmeme si nezávislé náhodné veličiny kopie veličiny X { 1,při i-tém pokusu padl líc, X i = 0,při i-tém pokusu padl rub Page 6
Za předpokladu nulové hypotézy budeme pro veličinu X = 1 n mít EX = 1 a DX = 1 4n, takže podle CLV má normovaná statistika n X i T = X 1 1 4n = X 05 n, 05 přibližně normované normální rozdělení N0, 1 Poznámka: Tato statistika je analogií statistiky T = X µ 0 n, σ pro případ veličiny X s normálním rozdělením Nµ,σ a pro nulovou hypotézu H 0 : µ = µ 0 Pozor! Nenaznačujeme tím, že by naše původní veličina X s alternativním rozdělením snad měla vlastnosti nějaké jiné veličiny X s normálním rozdělením! Jde tu o to, ze při hledání kritického oboru pro X při dané hladině významnosti α je postup principiálně stejný jako pro případ, kdy X má normální rozdělení - viz dále Kritérium pro ZAMÍTNUTÍ je tvaru t > Φ 1 1 α zamítáme H 0 na dané hladině α Zdůvodnění tvaru zamítacího kritéria: Nulová hypotéza je tvaru H 0 : p = p 0 a hodnotu p aproximujeme pomocí xchceme siproto zvolittakovou dolníhraniciu 1 Ratakovou horníhraniciu R,aby pravděpodobnost, že je hodnota veličiny X překročí, byla nejvýše rovna hodnotě α = 1% zvolená hladina významnosti a navíc tak, že překročení směrem výše bude stejně pravděpodobně jako směrem níže neboli na každou stranu α/ Jinými slovy, má platit, že PX < u 1 = α = Pu < X neboli u 1 = q X α a u = q X 1 α u veličiny X předpokládáme normální rozdělení Pokud nastane jedno z překročení tj pro realizaci x máme x R\ u 1,u, budeme to považovat za přílišné porušení nulové hypotézy pro danou toleranci chyby a zamítneme ji Místo veličiny X a jejích kvantilů si ale raději vezmeme už zmíněnou statistiku T = X 05 05 n, která je jen transformací veličiny X, a problém pomocí ní ekvivalentně přeformulujeme Veličina T má přibližně rozdělení N0, 1, takže meze pro T snadno najdeme: neboli P T < Φ 1 α = α = P Φ 1 1 α < T Tedy kritériem pro ZAMÍTNUTÍ nulové hypotézy je případ, kdy pro realizaci t statistiky T nastane t < Φ 1 α nebo Φ 1 1 α < t protože máme rovnost Φ 1 α = Φ 1 1 α t > Φ 1 1 α, Nyní stačí už jen dosadit: Page 7
a Zde máme n = 00, x = 80 00 = 04 a 1 α t = x 05 n = 05 = 0995 takže 04 05 00 =,88 >,576 = Φ 1 0995 05 Hypotézu H 0 : p = 1 tedy ZAMÍTÁME na dané hladině α = 1% b Zde máme n = 100 a opět x = 40 100 = 04 a 1 α t = x 05 n = 05 = 0995 takže 04 05 100 =,576 = Φ 1 0995 05 Hypotézu H 0 : p = 1 tedy NEZAMÍTÁME na dané hladině α = 1% Jak je vidět, za předpokladu, že mince je symetrická se jen 40% úspěšných pokusů dá ještě tolerovat při n = 100 hodech, ale už ne při n = 00 hodech 107 test střední hodnoty normálního rozdělení při neznámém rozptylu Výrobce tvrdí, že spotřeba automobilu je µ 0 = 8 litrů na 100 km Průměrná spotřeba n = 49 uživatelů však byla x = 84 litru na 100 km s výběrovým rozptylem s x = 56 Testujte na hladině významnosti α = 5%, zda má výrobce pravdu, a uved te použité předpoklady K provedení testu střední hodnoty s neznámým rozptylem potřebujeme předpokládat, že testovaná veličina spotřeby X má normální rozdělení Nµ,σ a že měření odpovídají náhodnému výběru tj jsou nezávislá Protože předpokládáme přesné normální rozdělení, nemusíme jako u CLV mít zase tak velký rozsah souboru Podle zadání máme otestovat hypotézu o střední hodnotě H 0 : µ = µ 0 = 8 proti alternativní hypotéze: H 1 : µ µ 0 = 8 Hodnotu rozptylu neznáme, takže je nutné použít testovací statistiku, která obsahuje odhad směrodatné odchylky σ pomocí S X : T = X µ 0 S X n Kritérium pro ZAMÍTNUTÍ je tvaru t > q tn 1 1 α zamítáme H 0 na dané hladině α Zdůvodnění tvaru zamítacího kritéria: Za předpokladu platnosti nulové hypotézy, tj pokud EX = µ 0, bude mít statistika T tzv Studentovo t-rozdělení s n 1 stupni volnosti speciálně tedy bude platit ET = 0 a očekávané hodnoty takovéto statistiky by se měly pohybovat blízko nuly Pokud se příliš odchýlí více než bude dovolovat hladina α omezující chybu 1 druhu, bude to důvod k zamítnutí nulové hypotézy Odchýlení opět znamená, že realizované hodnoty t statistiky T spadnou do kritického oboru W pro statistiku T, který je symetrický vzhledem k 0 z hlediska pravděpodobnosti Bude tedy tvaru W :,u 0 u 1,, kde Page 8
PT < u 0 = α = Pu 1 < T což je omezení chyby 1 druhu, tj že bychom se spletli a zamítli něco, co platí Dostáváme tak u 0 = q α tn 1 = qtn 1 1 α = u1, tudíž W :, q tn 1 1 α q tn 1 1 α, a kritérium pro ZAMÍTNUTÍ je tak skutečně tvaru t > q tn 1 1 α zamítáme H 0 na dané hladině α Ted už tedy dosadíme konkrétní hodnoty Realizace testovací statistiky je Protože t = x µ 0 84 8 04 n = 49 = 7 = 175 s x 56 16 t = 175 011 = q t48 0975 = q tn 1 1 α, nulovou hypotézu NEZAMÍTÁME Naše měření tak nejsou dostačující na to, abychom mohli zamítnout tvrzení výrobce na hladině významnosti 5% Je dobré si ještě zjistit, jak moc bychom si museli dovolit být nejistí, abychom už tvrzení výrobce zamítli Tato hladina α 0 je určena jako q tn 1 1 α 0 = t, tedy α 0 = F tn 1 t = F tn 1 175 = 09567= 00866 Pokud tedy budeme posuzovat hypotézu na hladině významnosti VYŠŠÍ než 8, 66%, dojdeme k jejímu zamítnutí A naopak čím více si chceme být jistí, že jsme se nespletli tj zmenšujeme hodnoty α, tím víc prohřešků od výrobce budeme muset tolerovat Poznámka: Podle zadání jsme uvažovali případ, kde se ptáme na rovnost tj µ = µ 0 V této situaci máme jedinou možnost, jak zvolit nulovou hypotézu - a sice výše uvedeným způsobem Jako nulovou hypotézu není možné zvolit případ µ µ 0, protože množina {µ R µ µ 0 } není uzavřená V úvahu vzhledem k zadání by ale mohl ještě přicházet jednostranný test, protože výrobce určitě raději tvrdí, že µ µ 0 V tomto případě pak bud můžeme testovat H 0 : µ µ 0, ale mohli bychom také testovat H 0 : µ µ 0 V případě testu hypotézy H 0 : µ µ 0 se snažíme vyhnout tomu, že bychom omylem poškodili výrobce, a výsledek testu bude t = 175 > 1677 = q t48 095 = q tn 1 1 α takže hypotézu výrobce ZAMÍTNEME Pozor, jde o jednostranný test, takže kvantil je jiný! Veškerou chybu jsme spotřebovali jen na ty vysoké hodnoty A toto malé zvětšení, oproti oboustrannému testu, už stačilo na zamítnutí A v případě testu hypotézy H 0 : µ µ 0 se snažíme vyhnout tomu, že bychom omylem poškodili uživatele, a výsledek testu bude takže hypotézu uživatelů NEZAMÍTNEME t = 175 1677 = q t48 095 = q tn 1 α 108 test střední hodnoty normálního rozdělení při neznámém rozptylu Z n = 10 měření krevního tlaku u jednoho pacienta jsme obdrželi výběrový průměr x = 150 a výběrovou směrodatnou odchylku s x = 0 Rozhodněte na hladině významnosti α = 005, zda je středníhodnotakrevníhotlakunejvýšeµ 0 = 140Předpokládejte,ževýškakrevníhotlakumánormální rozdělení a jednotlivá měření jsou nezávislá Page 9
Hypotéza, že µ µ 0 = 140 by znamenala, že pacient je na tom asi dost špatně To ale předpokládat nechcemeledaže bychom k tomu měli zvláštní důvod a naopak budeme předpokládat, že by měl být spíš v pořádku a budeme proto testovat hypotézu H 0 : µ µ 0 proti hypotéze Opět použijeme testovací statistiku H 1 : µ > µ 0 T = X µ 0 n S X a kritérium pro ZAMÍTNUTÍ bude tvaru t > q tn 1 1 α zamítáme H 0 na dané hladině α Dosadíme opět konkrétní hodnoty Realizace testovací statistiky je Protože t = x µ 0 s x 150 140 n = 10 = 158 0 t = 158 183 = q t9 095 = q tn 1 1 α, nulovou hypotézu NEZAMÍTÁME Zdůvodnění tvaru zamítacího kritéria: Abychom si více uvědomili závislost veličiny X na parametru µ, budeme ji vyznačovat jako X µ a podobně pro statistiku T µ = Xµ µ 0 S n Protože předpokládáme H0 : µ µ 0, X µ a tedy EX µ = µ, budou očekávané hodnoty statistiky T µ především v intervalu,0 Jako kritický obor si proto zvolíme W : u 1,, kde požadujeme, aby u 1 R bylo nejmenší takové, aby chyba 1 druhu byla nejvýše α, tj µ µ 0 PT µ W = Pu 1 < T µ α Je nutné zdůraznit, že za předpokladu nulové hypotézy tj že µ µ 0 statistika T µ obecně NEMÁ Studentovo t-rozdělení t-rozdělení se objeví právě jen pokud µ = µ 0 Přesto ho ale nakonec použijeme, protože případ µ = µ 0 je za předpokladu H 0 ten nejhorší možný, jak je vidět z následujícího: tedy µ µ 0 T µ = Xµ µ 0 S Xµ n = X µ µ S Xµ n+ µ µ 0 S Xµ n P u 1 < T µ P u 1 < Vidíme tedy, že P u 1 < T µ P a kritérium pro ZAMÍTNUTÍ je tak skutečně tvaru Xµ µ n S Xµ }{{}}{{} 0 t rozdělení Xµ µ n = 1 F tn 1 u 1 = P u 1 < T µ0 S Xµ u 1 < T µ0 a hledané u 1 tak musí splňovat, že P u 1 < T µ0 = α u 1 = q tn 1 1 α t > q tn 1 1 α zamítáme H 0 na dané hladině α Page 10
109 test střední hodnoty normálního rozdělení při neznámém rozptylu Provádíme průzkum, jaký skutečný objem piva X točí v nejmenované restauraci Zakoupeno bylo n = 10 piv a jejich objem byl v litrech: x = 0510, 046, 0491, 0466, 0451, 0503, 0475, 0487, 051, 0505 Předpokládejte, že natočený objem piva X se řídí normálním rozdělením a jednotlivá měření jsou nezávislá a Pro zvolenou hladinu α = 005 odhadněte symetricky intervalově střední hodnotu objemu natočeného piva b Na hladině α = 005 otestujte hypotézu, že dostaneme natočeno alespoň µ 0 = 05 litru Rozptyl je neznámý Spočítáme si proto realizaci výběrového průměru x a výběrové směrodatné odchylky s x : x = 1 n n x i = 1 486 0510+046+ +0505 = = 0486, 10 10 s x = 1 n x i x = 1 [ n x i n x ] = n 1 n 1 = 1 [ 0510 +046 + +0505 10 0486 ] = 9 = 1 368154 3639044 = 0004496 = 47178 10 4, 9 9 s x = s x = 47178 10 = 173 10 a Veličina X má normální rozdělení Nµ,σ Statistika T = X µ S X n má pak Studentovo t-rozdělení s n 1 stupni volnosti Pokud chceme, aby T padlo MIMO interval u 0,u 1 s pravděpodobností α a to se stejnou pravděpodobností nad i pod, pak budeme mít u 0,u 1 = q tn 1 1 α, q tn 1 1 α Pro α = 005 tak úpravami dostaneme 095 = P q t9 0975 X µ n qt9 0975 = S X = P X SX q t9 0975 µ X + SX q t9 0975 n n Kvantil Studentova rozdělení je q tn 1 1 α = q t90975 = 6 a tedy s x n q t9 0975 = 173 10 10 6 = 00155 Hledaný oboustranný symetrický 95% interval spolehlivosti v litrech pro střední hodnotu µ je tak x s x q t9 0975, x+ s x = q t9 0975 0486 00155, 0486 + 00155 n n b Otestujeme nulovou hypotézu = 04707, 05017 Page 11
H 0 : µ 05 = µ 0 proti alternativní hypotéze: H 1 : µ < 05 na hladině významnosti α = 005 Opět použijeme statistiku a ZAMÍTACÍ kritérium T = X µ 0 S X n t < q tn 1 α zamítáme H 0 na dané hladině α Realizace testovací statistiky je a kvantil Studentova rozdělení je t = x µ 0 0486 05 n = 10 = 008 s x 173 10 q tn 1 α = q tn 1 1 α = q t9 095 = 183 Protože t = 008< 183 = q t9 005, nulovou hypotézu tedy ZAMÍTÁME V této hospodě bychom si tedy asi pivo dávat nechtěli Doplnění: Na druhé straně, pokud by přišla do této hospody kontrola a chtěla testovat správnou míru, tj hypotézu H 0 : µ = 05 = µ 0 také na hladině α = 005, dojde k jinému závěru: t = 008 6 = q t9 0975 = q tn 1 1 α a tudíž hypotézu H 0 NEZAMÍTNE 1010 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace x = 08, 1, 06, 14, 09 Posud te na hladině významnosti α = 005, zda směrodatná odchylka měření je nejvýše σ 0 = 01 promile alkoholu Předpokládejte, že obsah alkoholu X má normální rozdělení a jednotlivá měření jsou nezávislá Naše veličina X, udávající obsah alkoholu v krvi v promilích, má normální rozdělení Nµ,σ Místo testu směrodatné odchylky σ budeme ekvivalentně testovat rozptyl σ a sice nulovou hypotézu tvaru H 0 : σ 01 = σ 0 Page 1
proti alternativní hypotéze: H 1 : σ > 01 na hladině významnosti α = 005 Tentokrát budeme používat statistiku T = n 1S X σ 0, která má pro případ σ = σ 0 tzv χ -rozdělení s n 1 stupni volnosti Obecněji, teprve veličina σ 0 σ T budemítχ -rozdělenízapředpokladunulovéhypotézy,tj pro0 σ σ 0, budouočekávané hodnoty statistiky T především v intervalu, 1 ve skutečnosti to bude jen interval 0, 1, protože T je nezáporná veličina Kritický obor tak bude W : q χ n 11 α, a kritérium pro ZAMÍTNUTÍ proto bude tvaru t > q χ n 11 α zamítáme H 0 na dané hladině α Dosadíme opět konkrétní hodnoty: s x = 1 n 1 n Realizace testovací statistiky je x = 08+1+06+14+09 5 = 47 5 = 094, x i x = 014 +006 +034 +046 +004 4 = 035 4 = 0088 a hodnota kvantilu je Protože nulovou hypotézu ZAMÍTÁME t = n 1s x σ 0 = 4 0088 01 = 35 q χ n 11 α = q χ 4095 = 949 t = 35 949 = q χ 4095, Zdůvodnění tvaru kritického oboru: Opět si vyznačme závislost X a T na parametru σ jako Kritický obor má být tvaru T σ = n 1S X σ σ 0 W : u 1,, kde požadujeme, aby u 1 R bylo nejmenší takové, aby chyba 1 druhu byla nejvýše α, tj 0 σ σ 0 PT σ W = Pu 1 < T σ α Opět případ σ = σ 0 je za předpokladu H 0 ten nejhorší možný, jak je vidět z následujícího: σ σ 0 T σ = σ σ 0 }{{} 1 P u 1 < T σ P u 1 < n 1S X σ σ n 1S X σ σ n 1S X σ σ }{{} χ rozdělení = 1 F χ n 1 u 1 = P u 1 < T σ0 Page 13
Vidíme tedy, že P u 1 < T σ P u 1 < T σ0 a hledané u 1 tak musí splňovat P u 1 < T σ0 = α tedy a kritický obor je tak skutečně tvaru u 1 = q χ n 1 1 α, W : q χ n 1 1 α, Page 14