676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368



Podobné dokumenty
4ST201 STATISTIKA CVIČENÍ Č. 7

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

12. cvičení z PST. 20. prosince 2017

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

2 ) 4, Φ 1 (1 0,005)

STATISTICKÉ TESTY VÝZNAMNOSTI

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

You created this PDF from an application that is not licensed to print to novapdf printer (

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

STATISTICKÉ TESTY VÝZNAMNOSTI

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Testování statistických hypotéz. Obecný postup

Testování statistických hypotéz

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Testování statistických hypotéz

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Ing. Michael Rost, Ph.D.

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Cvičení ze statistiky - 9. Filip Děchtěrenko

Normální (Gaussovo) rozdělení

Jednostranné intervaly spolehlivosti

Příklady na testy hypotéz o parametrech normálního rozdělení

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Stručný úvod do testování statistických hypotéz

PRAVDĚPODOBNOST A STATISTIKA

Normální (Gaussovo) rozdělení

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Testování statistických hypotéz

Testování hypotéz. 4. přednáška

Charakteristika datového souboru

NEPARAMETRICKÉ TESTY

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

12. prosince n pro n = n = 30 = S X

Úvod do analýzy rozptylu

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

Testy statistických hypotéz

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

Testy. Pavel Provinský. 19. listopadu 2013

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Náhodné veličiny, náhodné chyby

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Jednofaktorová analýza rozptylu

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

6. Testování statistických hypotéz. KGG/STG Zimní semestr 6. Testování statistických hypotéz

Cvičení ze statistiky - 8. Filip Děchtěrenko

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Aproximace binomického rozdělení normálním

4EK211 Základy ekonometrie

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Zápočtová práce STATISTIKA I

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Vzorová prezentace do předmětu Statistika

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Statistika pro každého. Párový test Test shody dvou rozptylů Dvouvýběrový t-test Porovnání středních hodnot při nestejných rozptylech

Jednofaktorová analýza rozptylu

Jednovýběrové testy. Komentované řešení pomocí MS Excel

MATEMATIKA III V PŘÍKLADECH

Regresní a korelační analýza

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Test dobré shody v KONTINGENČNÍCH TABULKÁCH

Tomáš Karel LS 2012/2013

15. T e s t o v á n í h y p o t é z

Lineární regrese. Komentované řešení pomocí MS Excel

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

STATISTICKÉ HYPOTÉZY

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Regresní a korelační analýza

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Neparametrické metody

Regrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly:

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

Cvičení 9: Neparametrické úlohy o mediánech

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

KGG/STG Statistika pro geografy

Průzkumová analýza dat

15. T e s t o v á n í h y p o t é z

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

STATISTICKÉ ODHADY Odhady populačních charakteristik

Transkript:

Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540 sekund, v jednotlivých případech to bylo 28, 56, 64, 68, 54, 32, 68, 72, 62, 36. Předpokládáme, že doba výroby výlisku má normální rozdělení. Řešení 1 V tomto případě testujeme střední hodnotu a neznáme rozptyl. Použijeme tedy jednovýběrový t-test. Budeme testovat nulovou hypotézu proti jednostranné alternativní hypotéze H 0 : μ = μ 0 = 30, H 1 : μ > μ 0 = 30 Podle charakteru nerovnosti v alternativní hypotéze vidíme, že jde o jednostranný případ. Pro zjištění testovací hodnoty použijeme tabulku kvantilů Studentova t rozdělení t 1 α o n stupních volnosti. Podle teorie použijeme testovou statistiku T = X μ 0 n S Známe počet prvků výběru n = 10 a střední hodnotu výběru. Tou je X = 540 10 = 54 Dále potřebujeme směrodatnou odchylku z výběru S. Vypočteme nejprve rozptyl z výběru. S 2 = 1 10 [(28 54)2 + (56 54) 2 + (64 54) 2 + (68 54) 2 + (54 54) 2 + (32 54) 2 + (68 54) 2 + (72 54) 2 + (62 54) 2 + (36 54) 2 ] = ( 26)2 + 2 2 + 10 2 + 14 2 + 0 2 + ( 22) 2 + 14 2 + 18 2 + 8 2 + ( 18) 2 10 676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 10 10 = 236,8 Odtud směrodatná odchylka výběru je S = 15,38831 Nakonec vypočteme testovou statistiku dle vzorce uvedeného výše 54 30 T = 15,38831 10 = 24 3,162278 = 1,559626 3,162278 = 4,93197 15,38831 V tabulce kvantilů Studentova t rozdělení t 1 α o n stupních volnosti nalezneme hodnotu t 10 1 (1 0,05) = t 9 (1 0,05) = 1,833 Nyní již jen zbývá učinit závěrečné rozhodnutí. Podle teorie na hladině α pak zamítáme hypotézu H 0 a přikloníme se k alternativní hypotéze H 1, pokud (pozor testujeme jednostranný případ) T t n 1 (1 α) Hypotézu H 0 nezamítáme, pokud T < t n 1 (1 α) V našem konkrétním případě tedy platí první z uvedených možností, neboť T = 4,93197 = 4,93197 > 1,833 = t 9 (1 0,05) Proto hypotézu H 0 zamítáme a přikláníme se k hypotéze H 1. d b 1

Příklad 2 Byl proveden náhodný výběr 144 dodaných odlitků. Byla zjištěna jejich průměrná hmotnost x = 344 kg a směrodatná odchylka σ = 52 kg. Chceme testem prokázat, že průměrná hmotnost dodávaných odlitků je větší než 336 kg. Test má být proveden na hladině významnosti α = 0,05. Řešení 2 Formulujeme nulovou hypotézu tedy lze formulovat proti jednostranné alternativní hypotéze. H 0 : μ = 336, H 1 : μ > 336 Vzhledem k tomu, že n = 144 je splněna podmínka dostatečně velkého výběru n 30. Hladina významnosti α = 0,05. Kvantil u 1 α pro pravostranný test najdeme v tabulce kvantilů N(0; 1) rozdělení, u 1 α = 1,645. Máme tedy zadáno μ 0 = 336, X = 344, σ = 52, n = 144, u 1 α = 1,645 Můžeme tedy použít Z-test jednovýběrový test střední hodnoty při známém rozptylu. Podle teorie pro hypotézu H 0 : μ = μ 0 proti alternativní hypotéze H 1 : μ: > μ 0 lze použít testovou statistiku Z = X μ 0 n σ Na hladině α pak zamítáme hypotézu H 0 a přikloníme se k alternativní hypotéze H 1, pokud Z Φ 1 (1 α) Hypotézu H 0 nezamítáme, pokud Z < Φ 1 (1 α) Nyní tedy vypočítáme hodnotu testového statistiky, dosadíme Z = X μ 0 344 336 n = 144 = 8 σ 52 52 12 = 8 13 3 = 24 13 = 1,845154 Při jednostranném testu a dané hladině významnosti je kritický obor dán množinou hodnot vyšších než 1,645. Protože pro hodnotu testového kritéria 1,845154 > 1,645, zamítáme nulovou hypotézu ve prospěch alternativní hypotézy na 5% hladině významnosti. Můžeme tedy s 5% rizikem omylu tvrdit, že průměrná hmotnost přejímaných odlitků je vyšší než 336 kg. Celou situaci lze graficky znázornit tak, jak uvádí obrázek. d b 2

Příklad 3 Chceme ověřit, zda výkon pracovníků v jednom podniku je významně vyšší než v druhém, kde se vyrábí stejný typ výrobků. Je znám rozptyl výkonů v obou podnicích σ 1 2 = 20, σ 2 2 = 18. V obou podnicích byl proveden náhodný výběr o rozsahu n 1 = 60, n 2 = 50 pracovníků a vypočteny průměrné výkony za směnu x 1 = 140, x 2 = 137. Test provedeme na 5% hladině významnosti. Řešení 3 Nulovou hypotézou je předpoklad, že se průměrné výkony pracovníků obou podniků neliší, alternativní hypotéza pak bude, že v prvním podniku je výkon vyšší. H 0 : μ 1 = μ 2, H 1 : μ 1 > μ 2 Hypotézu můžeme přeformulovat takto: H 0 : μ 1 μ 2 = 0, H 1 : μ 1 μ 2 > 0 Je zřejmé, že v úloze jde o dva nezávislé výběry. Pro řešení úlohy tedy použijeme dvouvýběrový t-test. Testovací statistikou bude (jde o jednodušší vyjádření toho, co je v teorii bez snížení stupně výběrů) T = X 1 X 2 0 σ 1 2 + σ 2 2 n 1 n 2 Dosadíme a dostaneme 140 137 0 3 3 T = 20 60 + 18 = = = 3 20 50 + 18 60 1000 + 1080 2080 = 3 208 = 3 52 50 60 50 3000 3000 300 75 3 = 0,693333 = 3 0,832666 = 3,602883 Podle teorie na hladině α zamítáme hypotézu H 0 : μ 1 = μ 2 a přikloníme se k alternativní hypotéze H 1 : μ 1 > μ 2, pokud (nezapomeňme, že jde o jednostranný případ) T t n1 +n 2 2(1 α) Nalezneme tedy v tabulce kvantilů Studentova t rozdělení t 1 α o n stupních volnosti Potřebnou hodnotu (tabulka končí řádky pro 100 a nekonečno, vybereme ten pro 100). t n1 +n 2 2(1 α) = t 60+50 2 (1 0,05) = t 108 (1 0,05) 1,660 Jasně vidíme, že platí T = 3,602883 = 3,602883 > 1,660 t 108 (1 0,05) Protože hodnota testového kritéria převyšuje kritickou hodnotu, zamítáme nulovou hypotézu a považujeme alternativní hypotézu, že v prvním podniku je průměrný výkon za směnu vyšší než v podniku druhém, za prokázanou na zvolené 5% hladině významnosti. d b 3

Příklad 4 Chceme posoudit přesnost dvou různých měřících metod. Bylo provedeno 16 nezávislých měření jistého objektu první metodou a 10 měření druhou metodou. Byly zjištěny následující hodnoty výběrových rozptylů: s 1 2 = 11,843, s 2 2 = 6,475 Máme ověřit na hladině významnosti 5%, zda existuje shoda v přesnosti obou měřících metod. Řešení 4 Vzhledem k tomu, že jde o výsledky měření, můžeme považovat rozdělení obou metod za normální. Obě sady měření proběhly na tomtéž objektu. Jsou tedy závislé. Pro řešení tedy můžeme použít případ párového t-testu (s jediným párem náhodná veličina X 1 je výsledek první sady měření a náhodná veličina Y 1 je výsledek druhé sady měření). O středních hodnotách obou měření nemáme žádnou informaci, můžeme předpokládat, že jsou stejné. V úloze zřetelně jde o porovnání rozptylů obou měření. Přitom je zřejmé, že za přesnější považujeme metodu, která má menší rozptyl. Budeme testovat nulovou hypotézu, že rozptyly jsou stejné proti alternativní hypotéze, že rozptyly se liší, neboli H 0 : σ 1 2 = σ 2 2, H 1 : σ 1 2 > σ 2 2 Je zřejmé, že v tomto případě jde o oboustrannou situaci. Vzhledem k předpokladu stejné střední hodnoty obou sad měření nemůžeme použít testovou statistiku z teorie (dostali bychom nulový čitatel). Jako statistiku tedy volíme zjednodušení standardní statistiky na podíl obou výběrových rozptylů. T = σ 1 2 σ 2 2 Nyní vypočítáme hodnotu této statistiky T = 11,843 6,475 = 1,829035 Kritickou hodnotu nalezneme v tabulce kvantilů Studentova t rozdělení t 1 α 2 o n stupních volnosti t 1 (1 0,05 2 ) = 12,706 Jelikož hodnota testového kritéria je menší než hodnota kritická, nemůžeme na hladině významnosti 5 % hypotézu H 0 zamítnout. Poznámka Pro testování rozptylu normálního rozdělení na nějakou konkrétní hodnotu se standardně používá metoda uvedená v teoretické části. Na tento konkrétní příklad je ale vhodnější použít statistiku na základě F rozdělení, které je zaměřeno na poměr dvou nezávislých veličin a je velmi často používáno na situaci, kdy má být zkoumána rozdílnost dvou rozptylů. Popis tohoto rozdělení je už ale mimo téma předmětu. d b 4

Příklad 5 Byly získány přesné hmotnosti jednotlivých prvků souboru z náhodného výběru (na jednotce hmotnosti nijak nezáleží): 243,2; 244,8; 253,1; 247,5; 251,0; 251,7; 254,0; 252,5; 252,8; 250,1; 247,3; 250,9; 253,2; 252,7 Máme na 5% hladině významnosti prokázat, že a) před seřízením stroje střední hodnota hmotnosti překračovala 250, b) před seřízením stroje překračovala směrodatná odchylka hodnotu 1, Řešení 5a V tomto případě jde o náhodný výběr z normálního rozdělení. Budeme testovat střední hodnotu a přitom neznáme rozptyl. Pro tuto úlohu tedy uplatníme t-test jednovýběrový test střední hodnoty při neznámém rozptylu. Budeme testovat nulovou hypotézu proti jednostranné alternativní hypotéze H 0 : μ = μ 0 = 250, H 1 : μ > μ 0 = 250 Podle charakteru nerovnosti v alternativní hypotéze vidíme, že jde o jednostranný případ. Pro zjištění testovací hodnoty použijeme tabulku kvantilů Studentova t rozdělení t 1 α o n stupních volnosti. Podle teorie použijeme testovou statistiku T = X μ 0 n S Známe počet prvků výběru n = 14. Střední hodnotu výběru si vypočteme. n X = 1 n x i i=1 = 1 (243,2 + 244,8 + 253,1 + 247,5 + 251,0 + 251,7 + 254,0 + 252,5 + 252,8 14 + 250,1 + 247,3 + 250,9 + 253,2 + 252,7) = 1 3504,8 = 250,3429 250,3 14 Dále potřebujeme směrodatnou odchylku z výběru S. Vypočteme nejprve rozptyl z výběru. S 2 = 1 14 [(243,2 250,3)2 + (244,8 250,3) 2 + (253,1 250,3) 2 + (247,5 250,3) 2 + (251,0 250,3) 2 + (251,7 250,3) 2 + (254,0 250,3) 2 + (252,5 250,3) 2 + (252,8 250,3) 2 + (250,1 250,3) 2 + (247,3 250,3) 2 + (250,9 250,3) 2 + (253,2 250,3) 2 + (252,7 250,3) 2 ] = ( 7,1)2 + ( 5,5) 2 + 2,8 2 + ( 2,8) 2 + 0,7 2 + 1,4 2 + 3,7 2 14 + 2,22 + 2,5 2 + ( 0,2) 2 + ( 3,0) 2 + 0,6 2 + 2,9 2 + 2,4 2 14 50,41 + 30,25 + 7,84 + 7,84 + 0,49 + 1,96 + 13,69 + 4,84 + 62,5 + 0,04 + 9 + 0,36 + 8,41 + 5,76 = 14 = 147,14 = 10,51 14 Odtud směrodatná odchylka výběru je S = 10,51 = 3,241913 Nakonec vypočteme testovou statistiku dle vzorce uvedeného výše 250,3 250 T = 3,241913 14 = 0,3 3,741657 = 0,092538 3,741657 = 0,346245 3,241913 V tabulce kvantilů Studentova t rozdělení t 1 α o n stupních volnosti nalezneme hodnotu d b 5

t 14 1 (1 0,05) = t 13 (1 0,05) = 1,771 Nyní již jen zbývá učinit závěrečné rozhodnutí. Podle teorie na hladině α pak zamítáme hypotézu H 0 a přikloníme se k alternativní hypotéze H 1, pokud (testujeme jednostranný případ) T t n 1 (1 α) Hypotézu H 0 nezamítáme, pokud T < t n 1 (1 α) V našem konkrétním případě tedy platí první z uvedených možností, neboť T = 0,346245 = 0,346245 < 1,771 = t 13 (1 0,05) Proto hypotézu H 0 nemůžeme zamítnout. Nulová hypotéza v tomto případě patří do oboru přijetí. Řešení 5b V tomto případě máme testovat hypotézu o hodnotě rozptylu vůči dané hodnotě, v tomto případě konkrétně máme nulovou hypotézu a jednostrannou alternativní hypotézu H 0 : σ 2 = σ 2 0 = 1, H 1 : σ 2 > σ 2 0 = 1 Podle teorie použijeme statistiku (s 2 je výběrový rozptyl) χ 2 (n 1)s2 = σ 2 0 Na hladině α pak zamítáme hypotézu H 0 a přikloníme se k alternativní hypotéze H 1, pokud (pracujeme s jednostrannou alternativní hypotézou) χ 2 2 > χ 1 α (n 1) nebo χ 2 < χ 2 α (n 1) V tomto případě pro nalezení kritických hodnot využíváme tabulku kvantilů χ 2 1 α rozdělení. Výběrový rozptyl s 2 = 10,51 jsme vypočítali v řešení odstavce a tohoto příkladu. Ostatní hodnoty pro výpočet statistiky máme k dispozici přímo. Můžeme tedy dosadit a dostaneme χ 2 (n 1)s2 (14 1) 10,51 13 10,51 = = = = 136,63 = 136,63 σ 2 0 1 1 1 V tabulce kvantilů χ 2 1 α rozdělení nalezneme pro zvolenou hladinu významnosti hodnotu odpovídající n = 14 1 = 13. Tou je 22,36. Zcela zřejmě platí 136,63 > 22,36. Proto můžeme zamítnout nulovou hypotézu a s pravděpodobností 0,95 tvrdit, že variabilita hmotnosti před seřízením byla větší než 1. d b 6

Příklad 6 Je známo, že IQ má normální rozdělení. Za střední hodnotu se považuje IQ 100 bodů. Při testu inteligence, kterého se zúčastnilo 10 náhodně vybraných jedinců, byly naměřeny následující hodnoty IQ 65, 98, 103, 77, 93, 102, 102, 113, 80, 94 Ověřte čistým testem významnosti hypotézu, že ve vybraném vzorku je střední hodnota IQ podprůměrná. Řešení 6 Pro jednovýběrový t-test, neboli test o střední hodnotě normálního rozdělení s neznámým rozptylem, používáme testové kritérium T = X μ 0 n S Toto kritérium má v případě platnosti nulové hypotézy Studentovo rozdělení s n 1 stupni volnosti. Jelikož je v zadání příkladu uvedeno, že lze předpokládat normalitu IQ, nemusíme normalitu ověřovat. Budeme testovat nulovou hypotézu proti jednostranné alternativní hypotéze nastavené dle očekávaného výsledku. H 0 µ = 100, H 1 µ < 100 Průměrné IQ 10 testovaných jedinců je Po dosazení X = 1 n x i X = 1 927 (65 + 98 + 103 + 77 + 93 + 102 + 102 + 113 + 80 + 94) = 10 10 = 92,7 Zjištěné průměrné IQ (92,7) je menší než testovaná hodnota (100), což je v souladu s očekáváním, že IQ výběru jedinců bude nižší než průměrné IQ. Alternativní hypotéza tedy byla zvolena vhodně. Proto, abychom mohli určit pozorovanou hodnotu testového kritéria, musíme vypočítat výběrovou směrodatnou odchylku S. Tu vypočítáme jako odmocninu výběrového rozptylu. S 2 = n i=1 (x i X ) 2 Po dosazení S 2 d b 7 n i=1 n 1 = (65 92,7)2 +(98 92,7) 2 +(103 92,7) 2 +(77 92,7) 2 +(93 92,7) 2 10 1 + (102 92,7)2 +(102 92,7) 2 +(113 92,7) 2 +(80 92,7) 2 +(94 92,7) 2 10 1 = ( 27,7)2 +5,3 2 +10,3 2 +( 15,7) 2 +0,3 2 + 9,3 2 +9,3 2 +20,3 2 +( 12,7) 2 +1,3 2 9 767,29 + 28,9 + 106,09 + 246,49 + 0,09 + 86,49 + 86,49 + 412,09 + 161,29 + 1,69 = 9 = 1896,1 = 210,6778 9 Odtud vypočteme směrodatnou odchylku výběrového souboru S = 210,6778 = 14,51474 Nyní máme všechny hodnoty pro dosazení do testové statistiky

92,7 100 7,3 T = 10 = 3,162278 = 0,50294 3,162278 = 1,59043 14,51474 14,51474 Nyní v tabulce kvantilů Studentova t rozdělení t 1 α o n stupních volnosti nalezneme t n 1 (1 α) = t 10 1 (1 0,05) = t 9 (1 0,05) = 1,833 Vidíme, že T = 1,59043 = 1,59043 < 1,833 = t n 1 (1 α 2 ) Proto podle teorie hypotézu H 0 nezamítáme. S tím souvisí závěr testování, že hypotéza H 0 může platit. Jinak řečeno, rozdíl mezi předpokládanou střední hodnotou IQ a pozorovaným průměrným IQ je statisticky nevýznamný. d b 8

Příklad 7 Předpokládejme, že pevnost betonu je normální náhodná veličina. Norma předepisuje v daných podmínkách a) minimální průměrnou pevnost 25 MPa b) minimální průměrnou pevnost 24 MPa Určete, zda beton vyhovuje normě. Přípustné riziko omylu je maximálně 1 %. Naměřené hodnoty jsou v příkladu 2.1.8. Naměřené hodnoty z příkladu 2.1.8 jsou 27,0 24,7 21,4 24,9 28,2 30,9 27,2 25,0 21,9 22,6 27,0 32,3 25,4 27,7 25,6 26,0 23,8 23,1 25,1 31,0 27,2 22,1 18,9 29,5 18,2 26,7 27,0 25,3 22,2 22,5 20,6 30,3 25,3 25,6 28,1 23,2 23,3 18,6 20,0 25,2 22,2 27,9 25,6 22,9 31,6 27,5 21,6 24,5 19,7 26,6 26,5 24,1 29,6 17,6 27,3 24,5 31,0 25,2 27,6 19,8 23,2 23,8 25,6 28,6 29,1 25,7 23,2 23,6 25,6 27,7 28,7 22,5 19,6 29,1 26,8 26,6 24,3 26,3 24,7 26,3 24,6 26,2 23,7 26,0 28,1 28,2 25,9 23,0 21,0 24,0 24,2 23,5 30,5 29,7 26,9 24,4 26,2 23,8 26,0 27,0 Řešení 7 Máme náhodný výběr rozsahu n = 100 z rozdělení N(μ, σ 2 ). Parametry tohoto rozdělení neznáme. Máme určit na hladině významnosti α = 0,01, zda střední hodnota překračuje 25, respektive 24. Budeme postupovat podle teorie. Naším úkolem je tedy testovat střední hodnotu normálního rozdělení při neznámém rozptylu. Budeme testovat hypotézu H 0 μ = μ 0 proti hypotéze H μ > μ 0 Za testovou statistiku volíme statistiku T = X μ 0 n S Tato statistika má za platnosti μ = μ 0 rozdělení t(n 1). Za kritický obor pro tento jednostranný test na hladině významnosti α volíme množinu W = {t; t > t(n 1; 1 α)} Řešení a V našem příkladu tedy konkrétně budeme testovat hypotézu H 0 μ = 25 proti hypotéze H μ > 25 Při řešení příkladu 2.1.8 jsme nalezli x = 25,37, s = 3,1031265 Můžeme tedy vypočítat realizaci t zvolené testové statistiky T t = x μ 0 25,37 25 n = s 3,1031265 100 = 0,37 3,1031265 10 = 3,7 3,1031265 = 1,192346 Kritický obor pro tento test na hladině významnosti α = 0,01 je po vyhledání v tabulkách množina W = {t; t > t(n 1; 1 α)} = {t; t > t(100 1; 1 0,01)} = {t; t > t(99; 0,99)} = {t; t > 2,326} Protože t W, nelze na hladině významnosti 0,01 zamítnout hypotézu H 0 μ 25. Naměřené hodnoty neumožňují rozhodnout, zda materiál vyhovuje normě. d b 9

Řešení b V našem příkladu tedy konkrétně budeme testovat hypotézu H 0 μ = 24 proti hypotéze H μ > 24 Při řešení příkladu 2.1.8 jsme nalezli x = 25,37, s = 3,1031265 Můžeme tedy vypočítat realizaci t zvolené testové statistiky T t = x μ 0 25,37 24 n = s 3,1031265 100 = 1,37 3,1031265 10 = 13,7 3,1031265 = 4,414902 Kritický obor pro tento test na hladině významnosti α = 0,01 je po vyhledání v tabulkách množina W = {t; t > t(n 1; 1 α)} = {t; t > t(100 1; 1 0,01)} = {t; t > t(99; 0,99)} = {t; t > 2,326} Protože t W, zamítáme na hladině významnosti 0,01 hypotézu H 0 μ = 24 ve prospěch alternativní hypotézy H μ > 24. Lze konstatovat, že materiál vyhovuje normě. d b 10

Příklad 8 Pro určení přesnosti dálkoměru byla desetkrát změřena vzdálenost, jejíž skutečná hodnota je 20 km. Získali jsme následující výsledky v km: 21,1 21,2 20,9 21,0 21,5 21,5 21,0 20,8 20,9 21,0 Zjistěte na hladině významnosti 0,05, zda je přesnost dálkoměru vyjádřená směrodatnou odchylkou menší než 0,5 km. Předpokládáme, že chyba měření je normální náhodná veličina se střední hodnotou 1 km. Řešení 8 Ze zadaných dat vytvoříme výběrový soubor zachycující jednotlivé odchylky v měření. 1,1 1,2 0,9 1,0 1,5 1,5 1,0 0,8 0,9 1,0 Máme náhodný výběr rozsahu n = 10 z rozdělení N(μ = 1, σ 2 = 1). Máme zjistit na hladině významnosti α = 0,05, zda přesnost dálkoměru vyjádřená směrodatnou odchylkou je menší než 0,5. Tomuto požadavku odpovídá situace, zda přesnost dálkoměru vyjádřená rozptylem je menší, než 0,25 na hladině významnosti α = 0,05 (rozptyl je druhou mocninou směrodatné odchylky). Budeme postupovat podle teorie. Naším úkolem je tedy testovat rozptyl normálního rozdělení při známé střední hodnotě. Budeme testovat hypotézu H 0 σ 2 2 σ 0 proti hypotéze H σ 2 2 > σ 0 Za testovou statistiku volíme statistiku T = ns 0 2 σ 2 0 Tato statistika má za platnosti σ 2 2 = σ 0 rozdělení χ 2 (n). Za kritický obor pro tento test volíme množinu W = {t; t > χ 2 (n; 1 α)} V našem příkladu tedy konkrétně budeme testovat hypotézu H 0 σ 2 0,5 2 proti hypotéze H σ 2 > 0,5 2 2 Máme n = 10, μ = 1.Vypočítáme s 0 podle vzorce Po dosazení a krátkém výpočtu dostaneme n s 0 2 = 1 n (x i μ) 2 i=1 s 0 2 = 1 10 [(1,1 1)2 + (1,2 1) 2 + (0,9 1) 2 + (1 1) 2 + (1,5 1) 2 + (1,5 1) 2 + (1 1) 2 + (0,8 1) 2 + (0,9 1) 2 + (1 1) 2 ] = 1 10 [(0,1)2 + (0,2) 2 + ( 0,1) 2 + (0) 2 + (0,5) 2 + (0,5) 2 + (0) 2 + ( 0,2) 2 + ( 0,1) 2 + (0) 2 ] = 1 10 [0,01 + 0,04 + 0,01 + 0 + 0,25 + 0,25 + 0 + 0,04 + 0,01 + 0] = 1 10 0,61 = 0,061 Realizace t zvolené testové statistiky T po dosazení a jednoduchém výpočtu je 10 0,061 t = 0,5 2 = 0,61 0,25 = 2,44 Kritický obor na dané hladině významnosti α = 0,05 je po vyhledání v tabulkách množina W = {t; t > χ 2 (n; 1 α)} = {t; t > χ 2 (10; 1 0,05)} = {t; t > χ 2 (10; 0,95)} = {t; t > 18,31} d b 11

Vzhledem k tomu, že t W, není možno zamítnout nulovou hypotézu na hladině významnosti 0,05. Z toho plyne, že přesnost dálkoměru vyjádřená směrodatnou odchylkou je menší než 0,5 km. Dálkoměr tedy vyhovuje požadavku přesnosti. Riziko omylu je maximálně 5%. d b 12

Příklad 9 Při odběru 30 vzorků posypového materiálu na dálnici byl získán následující soubor poměrných hodnot obsahu určité chemikálie vzhledem k normovanému předpisu: 0,91 1,08 0,72 1,07 1,14 0,62 1,06 1,20 0,76 1,19 0,96 0,73 0,83 0,55 0,79 1,34 0,60 1,19 1,35 1,13 0,67 0,77 0,48 0,83 1,78 2,25 1,21 0,89 0,83 1,07 Předpokládáme, že realizace pochází z normálního rozdělení. Ověřme na hladině významnosti 0,01, zda: a) střední hodnota obsahu je menší než 0,9 b) směrodatná odchylka obsahu je menší než 0,4 Řešení 9 Máme náhodný výběr rozsahu n = 30 z rozdělení N(μ, σ 2 ) jehož parametry neznáme. Máme zjistit na hladině významnosti α = 0,01, zda: a) střední hodnota obsahu je menší než 0,9 b) směrodatná odchylka obsahu je menší než 0,4 Pro obě úlohy budeme postupovat podle teorie. Řešení a Prvním naším úkolem je testovat střední hodnotu normálního rozdělení při neznámém rozptylu. Budeme testovat hypotézu H 0 μ = μ 0 proti hypotéze H μ > μ 0 Za testovou statistiku volíme statistiku T = X μ 0 n S Tato statistika má za platnosti μ = μ 0 rozdělení t(n 1). Za kritický obor pro tento jednostranný test na hladině významnosti α volíme množinu W = {t; t < t(n 1; 1 α)} Konkrétně tedy budeme testovat hypotézu H 0 μ = 0,9 proti hypotéze H μ < 0,9 Vypočítáme střední hodnotu výběru podle vzorce n Dosadíme a vypočteme x = 1 n x i i=1 μ = x = 1 [0,91 + 1,08 + 0,72 + 1,07 + 1,14 + 0,62 + 1,06 + 1,20 + 0,76 + 1,19 + 0,96 + 0,73 30 + 0,83 + 0,55 + 0,79 + 1,34 + 0,60 + 1,19 + 1,35 + 1,13 + 0,67 + 0,77 + 0,48 + 0,83 + 1,78 + 2,25 + 1,21 + 0,89 + 0,83 + 1,07] = 1 30 30 = 1 Výběrový rozptyl vypočteme podle vzorce Dosadíme s 2 = 1 n 1 (x i X ) 2 n i=1 d b 13

s 2 = 1 30 1 [(0,91 1)2 + (1,08 1) 2 + (0,72 1) 2 + (1,07 1) 2 + (1,14 1) 2 + (0,62 1) 2 + (1,06 1) 2 + (1,20 1) 2 + (0,76 1) 2 + (1,19 1) 2 + (0,96 1) 2 + (0,73 1) 2 + (0,83 1) 2 + (0,55 1) 2 + (0,79 1) 2 + (1,34 1) 2 + (0,60 1) 2 + (1,19 1) 2 + (1,35 1) 2 + (1,13 1) 2 + (0,67 1) 2 + (0,77 1) 2 + (0,48 1) 2 + (0,83 1) 2 + (1,78 1) 2 + (2,25 1) 2 + (1,21 1) 2 + (0,89 1) 2 + (0,83 1) 2 + (1,07 1) 2 ] Odtud = 1 29 [( 0,09)2 + (0,08) 2 + ( 0,28) 2 + (0,07) 2 + (0,14) 2 + ( 0,38) 2 + (0,06) 2 + (0,20) 2 + ( 0,24) 2 + (0,19) 2 + ( 0,04) 2 + ( 0,27) 2 + ( 0,17) 2 + ( 0,45) 2 + ( 0,21) 2 + (0,34) 2 + ( 0,40) 2 + (0,19) 2 + (0,35) 2 + (0,13) 2 + ( 0,33) 2 + ( 0,23) 2 + ( 0,52) 2 + ( 0,17) 2 + (0,78) 2 + (1,25) 2 + (0,21) 2 + ( 0,11) 2 + ( 0,17) 2 + (0,07) 2 ] = 1 [0,0081 + 0,0064 + 0,0784 + 0,0049 + 0,0196 + 0,1444 + 0,0036 + 0,04 29 + 0,0576 + 0,0361 + 0,0016 + 0,0729 + 0,0289 + 0,2025 + 0,0441 + 0,1156 + 0,16 + 0,0361 + 0,1225 + 0,0169 + 0,1089 + 0,0529 + 0,2704 + 0,0289 + 0,6084 + 1,5625 + 0,0441 + 0,0121 + 0,0289 + 0,0049] = 1 29 3,9222 = 0,135248 σ = s = σ n 1 = s 2 = 0,135248 = 0,367761 Můžeme tedy vypočítat realizaci t zvolené testové statistiky T t = x μ 0 n = 1 0,9 s 0,367761 30 = 0,1 0,367761 5,477226 = 0,5477226 0,367761 = 1,489343 Kritický obor pro tento test na hladině významnosti α = 0,01 je po vyhledání v tabulkách množina W = {t; t > t(n 1; 1 α)} = {t; t > t(30 1; 1 0,01)} = {t; t > t(29; 0,99)} = {t; t > 2,462} Protože t W, nelze na hladině významnosti 0,01 zamítnout hypotézu H 0 μ = 0,9 ve prospěch alternativní hypotézy. Můžeme tedy na hladině významnosti 0,01 konstatovat, že střední hodnota obsahu je menší než 0,9. Řešení b Druhým naším úkolem je testovat zda směrodatná odchylka obsahu je menší než 0,4. Tento test budeme realizovat prostřednictvím testu, zda rozptyl obsahu je menší než 0,16 (směrodatná odchylka je odmocninou rozptylu). Budeme tedy testovat rozptyl normálního rozdělení při neznámé střední hodnotě. Postupovat budeme podle teorie. Budeme testovat hypotézu H 0 σ 2 2 = σ 0 proti hypotéze H σ 2 2 > σ 0 Za testovou statistiku volíme statistiku (n 1)S2 T = σ 2 0 Tato statistika má za platnosti σ 2 2 = σ 0 rozdělení χ 2 (n). Za kritický obor pro tento test volíme množinu W = {t; t > χ 2 (n 1; 1 α)} V našem příkladu tedy konkrétně budeme testovat hypotézu H 0 σ 2 = 0,4 2 proti hypotéze H σ 2 > 0,4 2 Máme n = 30.Vypočítali jsme s 2 = 0,135248 již v řešení první úlohy d b 14

Realizace t zvolené testové statistiky T po dosazení a jednoduchém výpočtu je (30 1) 0,135248 t = 0,4 2 = 3,9222 0,16 = 24,51375 Kritický obor na dané hladině významnosti α = 0,01 je po vyhledání v tabulkách množina W = {t; t > χ 2 (n 1; 1 α)} = {t; t > χ 2 (30 1; 1 0,01)} = {t; t > χ 2 (29; 0,99)} = {t; t > 49,59} Protože t W, nelze na hladině významnosti 0,01 zamítnout hypotézu H 0 σ 2 0,4 2 ve prospěch alternativní hypotézy. Můžeme tedy na hladině významnosti 0,01 konstatovat, že směrodatná odchylka obsahu je menší než 0,4. d b 15