Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540 sekund, v jednotlivých případech to bylo 28, 56, 64, 68, 54, 32, 68, 72, 62, 36. Předpokládáme, že doba výroby výlisku má normální rozdělení. Řešení 1 V tomto případě testujeme střední hodnotu a neznáme rozptyl. Použijeme tedy jednovýběrový t-test. Budeme testovat nulovou hypotézu proti jednostranné alternativní hypotéze H 0 : μ = μ 0 = 30, H 1 : μ > μ 0 = 30 Podle charakteru nerovnosti v alternativní hypotéze vidíme, že jde o jednostranný případ. Pro zjištění testovací hodnoty použijeme tabulku kvantilů Studentova t rozdělení t 1 α o n stupních volnosti. Podle teorie použijeme testovou statistiku T = X μ 0 n S Známe počet prvků výběru n = 10 a střední hodnotu výběru. Tou je X = 540 10 = 54 Dále potřebujeme směrodatnou odchylku z výběru S. Vypočteme nejprve rozptyl z výběru. S 2 = 1 10 [(28 54)2 + (56 54) 2 + (64 54) 2 + (68 54) 2 + (54 54) 2 + (32 54) 2 + (68 54) 2 + (72 54) 2 + (62 54) 2 + (36 54) 2 ] = ( 26)2 + 2 2 + 10 2 + 14 2 + 0 2 + ( 22) 2 + 14 2 + 18 2 + 8 2 + ( 18) 2 10 676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 10 10 = 236,8 Odtud směrodatná odchylka výběru je S = 15,38831 Nakonec vypočteme testovou statistiku dle vzorce uvedeného výše 54 30 T = 15,38831 10 = 24 3,162278 = 1,559626 3,162278 = 4,93197 15,38831 V tabulce kvantilů Studentova t rozdělení t 1 α o n stupních volnosti nalezneme hodnotu t 10 1 (1 0,05) = t 9 (1 0,05) = 1,833 Nyní již jen zbývá učinit závěrečné rozhodnutí. Podle teorie na hladině α pak zamítáme hypotézu H 0 a přikloníme se k alternativní hypotéze H 1, pokud (pozor testujeme jednostranný případ) T t n 1 (1 α) Hypotézu H 0 nezamítáme, pokud T < t n 1 (1 α) V našem konkrétním případě tedy platí první z uvedených možností, neboť T = 4,93197 = 4,93197 > 1,833 = t 9 (1 0,05) Proto hypotézu H 0 zamítáme a přikláníme se k hypotéze H 1. d b 1
Příklad 2 Byl proveden náhodný výběr 144 dodaných odlitků. Byla zjištěna jejich průměrná hmotnost x = 344 kg a směrodatná odchylka σ = 52 kg. Chceme testem prokázat, že průměrná hmotnost dodávaných odlitků je větší než 336 kg. Test má být proveden na hladině významnosti α = 0,05. Řešení 2 Formulujeme nulovou hypotézu tedy lze formulovat proti jednostranné alternativní hypotéze. H 0 : μ = 336, H 1 : μ > 336 Vzhledem k tomu, že n = 144 je splněna podmínka dostatečně velkého výběru n 30. Hladina významnosti α = 0,05. Kvantil u 1 α pro pravostranný test najdeme v tabulce kvantilů N(0; 1) rozdělení, u 1 α = 1,645. Máme tedy zadáno μ 0 = 336, X = 344, σ = 52, n = 144, u 1 α = 1,645 Můžeme tedy použít Z-test jednovýběrový test střední hodnoty při známém rozptylu. Podle teorie pro hypotézu H 0 : μ = μ 0 proti alternativní hypotéze H 1 : μ: > μ 0 lze použít testovou statistiku Z = X μ 0 n σ Na hladině α pak zamítáme hypotézu H 0 a přikloníme se k alternativní hypotéze H 1, pokud Z Φ 1 (1 α) Hypotézu H 0 nezamítáme, pokud Z < Φ 1 (1 α) Nyní tedy vypočítáme hodnotu testového statistiky, dosadíme Z = X μ 0 344 336 n = 144 = 8 σ 52 52 12 = 8 13 3 = 24 13 = 1,845154 Při jednostranném testu a dané hladině významnosti je kritický obor dán množinou hodnot vyšších než 1,645. Protože pro hodnotu testového kritéria 1,845154 > 1,645, zamítáme nulovou hypotézu ve prospěch alternativní hypotézy na 5% hladině významnosti. Můžeme tedy s 5% rizikem omylu tvrdit, že průměrná hmotnost přejímaných odlitků je vyšší než 336 kg. Celou situaci lze graficky znázornit tak, jak uvádí obrázek. d b 2
Příklad 3 Chceme ověřit, zda výkon pracovníků v jednom podniku je významně vyšší než v druhém, kde se vyrábí stejný typ výrobků. Je znám rozptyl výkonů v obou podnicích σ 1 2 = 20, σ 2 2 = 18. V obou podnicích byl proveden náhodný výběr o rozsahu n 1 = 60, n 2 = 50 pracovníků a vypočteny průměrné výkony za směnu x 1 = 140, x 2 = 137. Test provedeme na 5% hladině významnosti. Řešení 3 Nulovou hypotézou je předpoklad, že se průměrné výkony pracovníků obou podniků neliší, alternativní hypotéza pak bude, že v prvním podniku je výkon vyšší. H 0 : μ 1 = μ 2, H 1 : μ 1 > μ 2 Hypotézu můžeme přeformulovat takto: H 0 : μ 1 μ 2 = 0, H 1 : μ 1 μ 2 > 0 Je zřejmé, že v úloze jde o dva nezávislé výběry. Pro řešení úlohy tedy použijeme dvouvýběrový t-test. Testovací statistikou bude (jde o jednodušší vyjádření toho, co je v teorii bez snížení stupně výběrů) T = X 1 X 2 0 σ 1 2 + σ 2 2 n 1 n 2 Dosadíme a dostaneme 140 137 0 3 3 T = 20 60 + 18 = = = 3 20 50 + 18 60 1000 + 1080 2080 = 3 208 = 3 52 50 60 50 3000 3000 300 75 3 = 0,693333 = 3 0,832666 = 3,602883 Podle teorie na hladině α zamítáme hypotézu H 0 : μ 1 = μ 2 a přikloníme se k alternativní hypotéze H 1 : μ 1 > μ 2, pokud (nezapomeňme, že jde o jednostranný případ) T t n1 +n 2 2(1 α) Nalezneme tedy v tabulce kvantilů Studentova t rozdělení t 1 α o n stupních volnosti Potřebnou hodnotu (tabulka končí řádky pro 100 a nekonečno, vybereme ten pro 100). t n1 +n 2 2(1 α) = t 60+50 2 (1 0,05) = t 108 (1 0,05) 1,660 Jasně vidíme, že platí T = 3,602883 = 3,602883 > 1,660 t 108 (1 0,05) Protože hodnota testového kritéria převyšuje kritickou hodnotu, zamítáme nulovou hypotézu a považujeme alternativní hypotézu, že v prvním podniku je průměrný výkon za směnu vyšší než v podniku druhém, za prokázanou na zvolené 5% hladině významnosti. d b 3
Příklad 4 Chceme posoudit přesnost dvou různých měřících metod. Bylo provedeno 16 nezávislých měření jistého objektu první metodou a 10 měření druhou metodou. Byly zjištěny následující hodnoty výběrových rozptylů: s 1 2 = 11,843, s 2 2 = 6,475 Máme ověřit na hladině významnosti 5%, zda existuje shoda v přesnosti obou měřících metod. Řešení 4 Vzhledem k tomu, že jde o výsledky měření, můžeme považovat rozdělení obou metod za normální. Obě sady měření proběhly na tomtéž objektu. Jsou tedy závislé. Pro řešení tedy můžeme použít případ párového t-testu (s jediným párem náhodná veličina X 1 je výsledek první sady měření a náhodná veličina Y 1 je výsledek druhé sady měření). O středních hodnotách obou měření nemáme žádnou informaci, můžeme předpokládat, že jsou stejné. V úloze zřetelně jde o porovnání rozptylů obou měření. Přitom je zřejmé, že za přesnější považujeme metodu, která má menší rozptyl. Budeme testovat nulovou hypotézu, že rozptyly jsou stejné proti alternativní hypotéze, že rozptyly se liší, neboli H 0 : σ 1 2 = σ 2 2, H 1 : σ 1 2 > σ 2 2 Je zřejmé, že v tomto případě jde o oboustrannou situaci. Vzhledem k předpokladu stejné střední hodnoty obou sad měření nemůžeme použít testovou statistiku z teorie (dostali bychom nulový čitatel). Jako statistiku tedy volíme zjednodušení standardní statistiky na podíl obou výběrových rozptylů. T = σ 1 2 σ 2 2 Nyní vypočítáme hodnotu této statistiky T = 11,843 6,475 = 1,829035 Kritickou hodnotu nalezneme v tabulce kvantilů Studentova t rozdělení t 1 α 2 o n stupních volnosti t 1 (1 0,05 2 ) = 12,706 Jelikož hodnota testového kritéria je menší než hodnota kritická, nemůžeme na hladině významnosti 5 % hypotézu H 0 zamítnout. Poznámka Pro testování rozptylu normálního rozdělení na nějakou konkrétní hodnotu se standardně používá metoda uvedená v teoretické části. Na tento konkrétní příklad je ale vhodnější použít statistiku na základě F rozdělení, které je zaměřeno na poměr dvou nezávislých veličin a je velmi často používáno na situaci, kdy má být zkoumána rozdílnost dvou rozptylů. Popis tohoto rozdělení je už ale mimo téma předmětu. d b 4
Příklad 5 Byly získány přesné hmotnosti jednotlivých prvků souboru z náhodného výběru (na jednotce hmotnosti nijak nezáleží): 243,2; 244,8; 253,1; 247,5; 251,0; 251,7; 254,0; 252,5; 252,8; 250,1; 247,3; 250,9; 253,2; 252,7 Máme na 5% hladině významnosti prokázat, že a) před seřízením stroje střední hodnota hmotnosti překračovala 250, b) před seřízením stroje překračovala směrodatná odchylka hodnotu 1, Řešení 5a V tomto případě jde o náhodný výběr z normálního rozdělení. Budeme testovat střední hodnotu a přitom neznáme rozptyl. Pro tuto úlohu tedy uplatníme t-test jednovýběrový test střední hodnoty při neznámém rozptylu. Budeme testovat nulovou hypotézu proti jednostranné alternativní hypotéze H 0 : μ = μ 0 = 250, H 1 : μ > μ 0 = 250 Podle charakteru nerovnosti v alternativní hypotéze vidíme, že jde o jednostranný případ. Pro zjištění testovací hodnoty použijeme tabulku kvantilů Studentova t rozdělení t 1 α o n stupních volnosti. Podle teorie použijeme testovou statistiku T = X μ 0 n S Známe počet prvků výběru n = 14. Střední hodnotu výběru si vypočteme. n X = 1 n x i i=1 = 1 (243,2 + 244,8 + 253,1 + 247,5 + 251,0 + 251,7 + 254,0 + 252,5 + 252,8 14 + 250,1 + 247,3 + 250,9 + 253,2 + 252,7) = 1 3504,8 = 250,3429 250,3 14 Dále potřebujeme směrodatnou odchylku z výběru S. Vypočteme nejprve rozptyl z výběru. S 2 = 1 14 [(243,2 250,3)2 + (244,8 250,3) 2 + (253,1 250,3) 2 + (247,5 250,3) 2 + (251,0 250,3) 2 + (251,7 250,3) 2 + (254,0 250,3) 2 + (252,5 250,3) 2 + (252,8 250,3) 2 + (250,1 250,3) 2 + (247,3 250,3) 2 + (250,9 250,3) 2 + (253,2 250,3) 2 + (252,7 250,3) 2 ] = ( 7,1)2 + ( 5,5) 2 + 2,8 2 + ( 2,8) 2 + 0,7 2 + 1,4 2 + 3,7 2 14 + 2,22 + 2,5 2 + ( 0,2) 2 + ( 3,0) 2 + 0,6 2 + 2,9 2 + 2,4 2 14 50,41 + 30,25 + 7,84 + 7,84 + 0,49 + 1,96 + 13,69 + 4,84 + 62,5 + 0,04 + 9 + 0,36 + 8,41 + 5,76 = 14 = 147,14 = 10,51 14 Odtud směrodatná odchylka výběru je S = 10,51 = 3,241913 Nakonec vypočteme testovou statistiku dle vzorce uvedeného výše 250,3 250 T = 3,241913 14 = 0,3 3,741657 = 0,092538 3,741657 = 0,346245 3,241913 V tabulce kvantilů Studentova t rozdělení t 1 α o n stupních volnosti nalezneme hodnotu d b 5
t 14 1 (1 0,05) = t 13 (1 0,05) = 1,771 Nyní již jen zbývá učinit závěrečné rozhodnutí. Podle teorie na hladině α pak zamítáme hypotézu H 0 a přikloníme se k alternativní hypotéze H 1, pokud (testujeme jednostranný případ) T t n 1 (1 α) Hypotézu H 0 nezamítáme, pokud T < t n 1 (1 α) V našem konkrétním případě tedy platí první z uvedených možností, neboť T = 0,346245 = 0,346245 < 1,771 = t 13 (1 0,05) Proto hypotézu H 0 nemůžeme zamítnout. Nulová hypotéza v tomto případě patří do oboru přijetí. Řešení 5b V tomto případě máme testovat hypotézu o hodnotě rozptylu vůči dané hodnotě, v tomto případě konkrétně máme nulovou hypotézu a jednostrannou alternativní hypotézu H 0 : σ 2 = σ 2 0 = 1, H 1 : σ 2 > σ 2 0 = 1 Podle teorie použijeme statistiku (s 2 je výběrový rozptyl) χ 2 (n 1)s2 = σ 2 0 Na hladině α pak zamítáme hypotézu H 0 a přikloníme se k alternativní hypotéze H 1, pokud (pracujeme s jednostrannou alternativní hypotézou) χ 2 2 > χ 1 α (n 1) nebo χ 2 < χ 2 α (n 1) V tomto případě pro nalezení kritických hodnot využíváme tabulku kvantilů χ 2 1 α rozdělení. Výběrový rozptyl s 2 = 10,51 jsme vypočítali v řešení odstavce a tohoto příkladu. Ostatní hodnoty pro výpočet statistiky máme k dispozici přímo. Můžeme tedy dosadit a dostaneme χ 2 (n 1)s2 (14 1) 10,51 13 10,51 = = = = 136,63 = 136,63 σ 2 0 1 1 1 V tabulce kvantilů χ 2 1 α rozdělení nalezneme pro zvolenou hladinu významnosti hodnotu odpovídající n = 14 1 = 13. Tou je 22,36. Zcela zřejmě platí 136,63 > 22,36. Proto můžeme zamítnout nulovou hypotézu a s pravděpodobností 0,95 tvrdit, že variabilita hmotnosti před seřízením byla větší než 1. d b 6
Příklad 6 Je známo, že IQ má normální rozdělení. Za střední hodnotu se považuje IQ 100 bodů. Při testu inteligence, kterého se zúčastnilo 10 náhodně vybraných jedinců, byly naměřeny následující hodnoty IQ 65, 98, 103, 77, 93, 102, 102, 113, 80, 94 Ověřte čistým testem významnosti hypotézu, že ve vybraném vzorku je střední hodnota IQ podprůměrná. Řešení 6 Pro jednovýběrový t-test, neboli test o střední hodnotě normálního rozdělení s neznámým rozptylem, používáme testové kritérium T = X μ 0 n S Toto kritérium má v případě platnosti nulové hypotézy Studentovo rozdělení s n 1 stupni volnosti. Jelikož je v zadání příkladu uvedeno, že lze předpokládat normalitu IQ, nemusíme normalitu ověřovat. Budeme testovat nulovou hypotézu proti jednostranné alternativní hypotéze nastavené dle očekávaného výsledku. H 0 µ = 100, H 1 µ < 100 Průměrné IQ 10 testovaných jedinců je Po dosazení X = 1 n x i X = 1 927 (65 + 98 + 103 + 77 + 93 + 102 + 102 + 113 + 80 + 94) = 10 10 = 92,7 Zjištěné průměrné IQ (92,7) je menší než testovaná hodnota (100), což je v souladu s očekáváním, že IQ výběru jedinců bude nižší než průměrné IQ. Alternativní hypotéza tedy byla zvolena vhodně. Proto, abychom mohli určit pozorovanou hodnotu testového kritéria, musíme vypočítat výběrovou směrodatnou odchylku S. Tu vypočítáme jako odmocninu výběrového rozptylu. S 2 = n i=1 (x i X ) 2 Po dosazení S 2 d b 7 n i=1 n 1 = (65 92,7)2 +(98 92,7) 2 +(103 92,7) 2 +(77 92,7) 2 +(93 92,7) 2 10 1 + (102 92,7)2 +(102 92,7) 2 +(113 92,7) 2 +(80 92,7) 2 +(94 92,7) 2 10 1 = ( 27,7)2 +5,3 2 +10,3 2 +( 15,7) 2 +0,3 2 + 9,3 2 +9,3 2 +20,3 2 +( 12,7) 2 +1,3 2 9 767,29 + 28,9 + 106,09 + 246,49 + 0,09 + 86,49 + 86,49 + 412,09 + 161,29 + 1,69 = 9 = 1896,1 = 210,6778 9 Odtud vypočteme směrodatnou odchylku výběrového souboru S = 210,6778 = 14,51474 Nyní máme všechny hodnoty pro dosazení do testové statistiky
92,7 100 7,3 T = 10 = 3,162278 = 0,50294 3,162278 = 1,59043 14,51474 14,51474 Nyní v tabulce kvantilů Studentova t rozdělení t 1 α o n stupních volnosti nalezneme t n 1 (1 α) = t 10 1 (1 0,05) = t 9 (1 0,05) = 1,833 Vidíme, že T = 1,59043 = 1,59043 < 1,833 = t n 1 (1 α 2 ) Proto podle teorie hypotézu H 0 nezamítáme. S tím souvisí závěr testování, že hypotéza H 0 může platit. Jinak řečeno, rozdíl mezi předpokládanou střední hodnotou IQ a pozorovaným průměrným IQ je statisticky nevýznamný. d b 8
Příklad 7 Předpokládejme, že pevnost betonu je normální náhodná veličina. Norma předepisuje v daných podmínkách a) minimální průměrnou pevnost 25 MPa b) minimální průměrnou pevnost 24 MPa Určete, zda beton vyhovuje normě. Přípustné riziko omylu je maximálně 1 %. Naměřené hodnoty jsou v příkladu 2.1.8. Naměřené hodnoty z příkladu 2.1.8 jsou 27,0 24,7 21,4 24,9 28,2 30,9 27,2 25,0 21,9 22,6 27,0 32,3 25,4 27,7 25,6 26,0 23,8 23,1 25,1 31,0 27,2 22,1 18,9 29,5 18,2 26,7 27,0 25,3 22,2 22,5 20,6 30,3 25,3 25,6 28,1 23,2 23,3 18,6 20,0 25,2 22,2 27,9 25,6 22,9 31,6 27,5 21,6 24,5 19,7 26,6 26,5 24,1 29,6 17,6 27,3 24,5 31,0 25,2 27,6 19,8 23,2 23,8 25,6 28,6 29,1 25,7 23,2 23,6 25,6 27,7 28,7 22,5 19,6 29,1 26,8 26,6 24,3 26,3 24,7 26,3 24,6 26,2 23,7 26,0 28,1 28,2 25,9 23,0 21,0 24,0 24,2 23,5 30,5 29,7 26,9 24,4 26,2 23,8 26,0 27,0 Řešení 7 Máme náhodný výběr rozsahu n = 100 z rozdělení N(μ, σ 2 ). Parametry tohoto rozdělení neznáme. Máme určit na hladině významnosti α = 0,01, zda střední hodnota překračuje 25, respektive 24. Budeme postupovat podle teorie. Naším úkolem je tedy testovat střední hodnotu normálního rozdělení při neznámém rozptylu. Budeme testovat hypotézu H 0 μ = μ 0 proti hypotéze H μ > μ 0 Za testovou statistiku volíme statistiku T = X μ 0 n S Tato statistika má za platnosti μ = μ 0 rozdělení t(n 1). Za kritický obor pro tento jednostranný test na hladině významnosti α volíme množinu W = {t; t > t(n 1; 1 α)} Řešení a V našem příkladu tedy konkrétně budeme testovat hypotézu H 0 μ = 25 proti hypotéze H μ > 25 Při řešení příkladu 2.1.8 jsme nalezli x = 25,37, s = 3,1031265 Můžeme tedy vypočítat realizaci t zvolené testové statistiky T t = x μ 0 25,37 25 n = s 3,1031265 100 = 0,37 3,1031265 10 = 3,7 3,1031265 = 1,192346 Kritický obor pro tento test na hladině významnosti α = 0,01 je po vyhledání v tabulkách množina W = {t; t > t(n 1; 1 α)} = {t; t > t(100 1; 1 0,01)} = {t; t > t(99; 0,99)} = {t; t > 2,326} Protože t W, nelze na hladině významnosti 0,01 zamítnout hypotézu H 0 μ 25. Naměřené hodnoty neumožňují rozhodnout, zda materiál vyhovuje normě. d b 9
Řešení b V našem příkladu tedy konkrétně budeme testovat hypotézu H 0 μ = 24 proti hypotéze H μ > 24 Při řešení příkladu 2.1.8 jsme nalezli x = 25,37, s = 3,1031265 Můžeme tedy vypočítat realizaci t zvolené testové statistiky T t = x μ 0 25,37 24 n = s 3,1031265 100 = 1,37 3,1031265 10 = 13,7 3,1031265 = 4,414902 Kritický obor pro tento test na hladině významnosti α = 0,01 je po vyhledání v tabulkách množina W = {t; t > t(n 1; 1 α)} = {t; t > t(100 1; 1 0,01)} = {t; t > t(99; 0,99)} = {t; t > 2,326} Protože t W, zamítáme na hladině významnosti 0,01 hypotézu H 0 μ = 24 ve prospěch alternativní hypotézy H μ > 24. Lze konstatovat, že materiál vyhovuje normě. d b 10
Příklad 8 Pro určení přesnosti dálkoměru byla desetkrát změřena vzdálenost, jejíž skutečná hodnota je 20 km. Získali jsme následující výsledky v km: 21,1 21,2 20,9 21,0 21,5 21,5 21,0 20,8 20,9 21,0 Zjistěte na hladině významnosti 0,05, zda je přesnost dálkoměru vyjádřená směrodatnou odchylkou menší než 0,5 km. Předpokládáme, že chyba měření je normální náhodná veličina se střední hodnotou 1 km. Řešení 8 Ze zadaných dat vytvoříme výběrový soubor zachycující jednotlivé odchylky v měření. 1,1 1,2 0,9 1,0 1,5 1,5 1,0 0,8 0,9 1,0 Máme náhodný výběr rozsahu n = 10 z rozdělení N(μ = 1, σ 2 = 1). Máme zjistit na hladině významnosti α = 0,05, zda přesnost dálkoměru vyjádřená směrodatnou odchylkou je menší než 0,5. Tomuto požadavku odpovídá situace, zda přesnost dálkoměru vyjádřená rozptylem je menší, než 0,25 na hladině významnosti α = 0,05 (rozptyl je druhou mocninou směrodatné odchylky). Budeme postupovat podle teorie. Naším úkolem je tedy testovat rozptyl normálního rozdělení při známé střední hodnotě. Budeme testovat hypotézu H 0 σ 2 2 σ 0 proti hypotéze H σ 2 2 > σ 0 Za testovou statistiku volíme statistiku T = ns 0 2 σ 2 0 Tato statistika má za platnosti σ 2 2 = σ 0 rozdělení χ 2 (n). Za kritický obor pro tento test volíme množinu W = {t; t > χ 2 (n; 1 α)} V našem příkladu tedy konkrétně budeme testovat hypotézu H 0 σ 2 0,5 2 proti hypotéze H σ 2 > 0,5 2 2 Máme n = 10, μ = 1.Vypočítáme s 0 podle vzorce Po dosazení a krátkém výpočtu dostaneme n s 0 2 = 1 n (x i μ) 2 i=1 s 0 2 = 1 10 [(1,1 1)2 + (1,2 1) 2 + (0,9 1) 2 + (1 1) 2 + (1,5 1) 2 + (1,5 1) 2 + (1 1) 2 + (0,8 1) 2 + (0,9 1) 2 + (1 1) 2 ] = 1 10 [(0,1)2 + (0,2) 2 + ( 0,1) 2 + (0) 2 + (0,5) 2 + (0,5) 2 + (0) 2 + ( 0,2) 2 + ( 0,1) 2 + (0) 2 ] = 1 10 [0,01 + 0,04 + 0,01 + 0 + 0,25 + 0,25 + 0 + 0,04 + 0,01 + 0] = 1 10 0,61 = 0,061 Realizace t zvolené testové statistiky T po dosazení a jednoduchém výpočtu je 10 0,061 t = 0,5 2 = 0,61 0,25 = 2,44 Kritický obor na dané hladině významnosti α = 0,05 je po vyhledání v tabulkách množina W = {t; t > χ 2 (n; 1 α)} = {t; t > χ 2 (10; 1 0,05)} = {t; t > χ 2 (10; 0,95)} = {t; t > 18,31} d b 11
Vzhledem k tomu, že t W, není možno zamítnout nulovou hypotézu na hladině významnosti 0,05. Z toho plyne, že přesnost dálkoměru vyjádřená směrodatnou odchylkou je menší než 0,5 km. Dálkoměr tedy vyhovuje požadavku přesnosti. Riziko omylu je maximálně 5%. d b 12
Příklad 9 Při odběru 30 vzorků posypového materiálu na dálnici byl získán následující soubor poměrných hodnot obsahu určité chemikálie vzhledem k normovanému předpisu: 0,91 1,08 0,72 1,07 1,14 0,62 1,06 1,20 0,76 1,19 0,96 0,73 0,83 0,55 0,79 1,34 0,60 1,19 1,35 1,13 0,67 0,77 0,48 0,83 1,78 2,25 1,21 0,89 0,83 1,07 Předpokládáme, že realizace pochází z normálního rozdělení. Ověřme na hladině významnosti 0,01, zda: a) střední hodnota obsahu je menší než 0,9 b) směrodatná odchylka obsahu je menší než 0,4 Řešení 9 Máme náhodný výběr rozsahu n = 30 z rozdělení N(μ, σ 2 ) jehož parametry neznáme. Máme zjistit na hladině významnosti α = 0,01, zda: a) střední hodnota obsahu je menší než 0,9 b) směrodatná odchylka obsahu je menší než 0,4 Pro obě úlohy budeme postupovat podle teorie. Řešení a Prvním naším úkolem je testovat střední hodnotu normálního rozdělení při neznámém rozptylu. Budeme testovat hypotézu H 0 μ = μ 0 proti hypotéze H μ > μ 0 Za testovou statistiku volíme statistiku T = X μ 0 n S Tato statistika má za platnosti μ = μ 0 rozdělení t(n 1). Za kritický obor pro tento jednostranný test na hladině významnosti α volíme množinu W = {t; t < t(n 1; 1 α)} Konkrétně tedy budeme testovat hypotézu H 0 μ = 0,9 proti hypotéze H μ < 0,9 Vypočítáme střední hodnotu výběru podle vzorce n Dosadíme a vypočteme x = 1 n x i i=1 μ = x = 1 [0,91 + 1,08 + 0,72 + 1,07 + 1,14 + 0,62 + 1,06 + 1,20 + 0,76 + 1,19 + 0,96 + 0,73 30 + 0,83 + 0,55 + 0,79 + 1,34 + 0,60 + 1,19 + 1,35 + 1,13 + 0,67 + 0,77 + 0,48 + 0,83 + 1,78 + 2,25 + 1,21 + 0,89 + 0,83 + 1,07] = 1 30 30 = 1 Výběrový rozptyl vypočteme podle vzorce Dosadíme s 2 = 1 n 1 (x i X ) 2 n i=1 d b 13
s 2 = 1 30 1 [(0,91 1)2 + (1,08 1) 2 + (0,72 1) 2 + (1,07 1) 2 + (1,14 1) 2 + (0,62 1) 2 + (1,06 1) 2 + (1,20 1) 2 + (0,76 1) 2 + (1,19 1) 2 + (0,96 1) 2 + (0,73 1) 2 + (0,83 1) 2 + (0,55 1) 2 + (0,79 1) 2 + (1,34 1) 2 + (0,60 1) 2 + (1,19 1) 2 + (1,35 1) 2 + (1,13 1) 2 + (0,67 1) 2 + (0,77 1) 2 + (0,48 1) 2 + (0,83 1) 2 + (1,78 1) 2 + (2,25 1) 2 + (1,21 1) 2 + (0,89 1) 2 + (0,83 1) 2 + (1,07 1) 2 ] Odtud = 1 29 [( 0,09)2 + (0,08) 2 + ( 0,28) 2 + (0,07) 2 + (0,14) 2 + ( 0,38) 2 + (0,06) 2 + (0,20) 2 + ( 0,24) 2 + (0,19) 2 + ( 0,04) 2 + ( 0,27) 2 + ( 0,17) 2 + ( 0,45) 2 + ( 0,21) 2 + (0,34) 2 + ( 0,40) 2 + (0,19) 2 + (0,35) 2 + (0,13) 2 + ( 0,33) 2 + ( 0,23) 2 + ( 0,52) 2 + ( 0,17) 2 + (0,78) 2 + (1,25) 2 + (0,21) 2 + ( 0,11) 2 + ( 0,17) 2 + (0,07) 2 ] = 1 [0,0081 + 0,0064 + 0,0784 + 0,0049 + 0,0196 + 0,1444 + 0,0036 + 0,04 29 + 0,0576 + 0,0361 + 0,0016 + 0,0729 + 0,0289 + 0,2025 + 0,0441 + 0,1156 + 0,16 + 0,0361 + 0,1225 + 0,0169 + 0,1089 + 0,0529 + 0,2704 + 0,0289 + 0,6084 + 1,5625 + 0,0441 + 0,0121 + 0,0289 + 0,0049] = 1 29 3,9222 = 0,135248 σ = s = σ n 1 = s 2 = 0,135248 = 0,367761 Můžeme tedy vypočítat realizaci t zvolené testové statistiky T t = x μ 0 n = 1 0,9 s 0,367761 30 = 0,1 0,367761 5,477226 = 0,5477226 0,367761 = 1,489343 Kritický obor pro tento test na hladině významnosti α = 0,01 je po vyhledání v tabulkách množina W = {t; t > t(n 1; 1 α)} = {t; t > t(30 1; 1 0,01)} = {t; t > t(29; 0,99)} = {t; t > 2,462} Protože t W, nelze na hladině významnosti 0,01 zamítnout hypotézu H 0 μ = 0,9 ve prospěch alternativní hypotézy. Můžeme tedy na hladině významnosti 0,01 konstatovat, že střední hodnota obsahu je menší než 0,9. Řešení b Druhým naším úkolem je testovat zda směrodatná odchylka obsahu je menší než 0,4. Tento test budeme realizovat prostřednictvím testu, zda rozptyl obsahu je menší než 0,16 (směrodatná odchylka je odmocninou rozptylu). Budeme tedy testovat rozptyl normálního rozdělení při neznámé střední hodnotě. Postupovat budeme podle teorie. Budeme testovat hypotézu H 0 σ 2 2 = σ 0 proti hypotéze H σ 2 2 > σ 0 Za testovou statistiku volíme statistiku (n 1)S2 T = σ 2 0 Tato statistika má za platnosti σ 2 2 = σ 0 rozdělení χ 2 (n). Za kritický obor pro tento test volíme množinu W = {t; t > χ 2 (n 1; 1 α)} V našem příkladu tedy konkrétně budeme testovat hypotézu H 0 σ 2 = 0,4 2 proti hypotéze H σ 2 > 0,4 2 Máme n = 30.Vypočítali jsme s 2 = 0,135248 již v řešení první úlohy d b 14
Realizace t zvolené testové statistiky T po dosazení a jednoduchém výpočtu je (30 1) 0,135248 t = 0,4 2 = 3,9222 0,16 = 24,51375 Kritický obor na dané hladině významnosti α = 0,01 je po vyhledání v tabulkách množina W = {t; t > χ 2 (n 1; 1 α)} = {t; t > χ 2 (30 1; 1 0,01)} = {t; t > χ 2 (29; 0,99)} = {t; t > 49,59} Protože t W, nelze na hladině významnosti 0,01 zamítnout hypotézu H 0 σ 2 0,4 2 ve prospěch alternativní hypotézy. Můžeme tedy na hladině významnosti 0,01 konstatovat, že směrodatná odchylka obsahu je menší než 0,4. d b 15