Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Podobné dokumenty
2 ) 4, Φ 1 (1 0,005)

= = 2368

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

4ST201 STATISTIKA CVIČENÍ Č. 7

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

12. cvičení z PST. 20. prosince 2017

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Jednostranné intervaly spolehlivosti

Testy. Pavel Provinský. 19. listopadu 2013

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Testování statistických hypotéz

Testování statistických hypotéz. Obecný postup

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

STATISTICKÉ TESTY VÝZNAMNOSTI

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Aproximace binomického rozdělení normálním

Pravděpodobnost a aplikovaná statistika

Charakteristika datového souboru

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

STATISTICKÉ TESTY VÝZNAMNOSTI

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

You created this PDF from an application that is not licensed to print to novapdf printer (

Neparametrické metody

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Ing. Michael Rost, Ph.D.

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

12. prosince n pro n = n = 30 = S X

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Příklady na testy hypotéz o parametrech normálního rozdělení

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

15. T e s t o v á n í h y p o t é z

Přednáška X. Testování hypotéz o kvantitativních proměnných

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Cvičení ze statistiky - 8. Filip Děchtěrenko

prosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina

Testování statistických hypotéz

Cvičení ze statistiky - 9. Filip Děchtěrenko

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

NEPARAMETRICKÉ TESTY

Statistické metody uţívané při ověřování platnosti hypotéz

Jana Vránová, 3. lékařská fakulta UK

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

5 Parametrické testy hypotéz

15. T e s t o v á n í h y p o t é z

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Náhodná veličina a rozdělení pravděpodobnosti

Test dobré shody v KONTINGENČNÍCH TABULKÁCH

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

Tomáš Karel LS 2012/2013

KGG/STG Statistika pro geografy

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Pravděpodobnost a matematická statistika

Zápočtová práce STATISTIKA I

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Statistika. Testování hypotéz statistická indukce Neparametrické testy. Roman Biskup

Vybraná rozdělení náhodné veličiny

Testování hypotéz. 4. přednáška

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Náhodné veličiny, náhodné chyby

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

Jednofaktorová analýza rozptylu

STATISTICKÉ HYPOTÉZY

Úvod do analýzy rozptylu

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

y = 0, ,19716x.

Testování hypotéz Biolog Statistik: Matematik: Informatik:

5. T e s t o v á n í h y p o t é z

HODNOCENÍ VÝKONNOSTI ATRIBUTIVNÍCH ZNAKŮ JAKOSTI. Josef Křepela, Jiří Michálek. OSSM při ČSJ

Dvouvýběrové a párové testy. Komentované řešení pomocí MS Excel

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

Testování statistických hypotéz

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Poznámky k předmětu Aplikovaná statistika, 11. téma

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

Statistika, Biostatistika pro kombinované studium. Jan Kracík

MATEMATIKA III V PŘÍKLADECH

Neparametrické testy

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

PRAVDĚPODOBNOST A STATISTIKA

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Stručný úvod do testování statistických hypotéz

Tomáš Karel LS 2012/2013

Cvičení 9: Neparametrické úlohy o mediánech

Základy počtu pravděpodobnosti a metod matematické statistiky

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Transkript:

Příklad 1 Vyhláška Ministerstva zdravotnictví předpokládala, že doba dojezdu k pacientovi od nahlášení požadavku nepřekročí 17 minut. Hodnoty deseti náhodně vybraných dob příjezdu sanitky k nemocnému byly: 15, 23, 11, 20, 18, 32, 30, 24, 26, 17 Ověřte, zda doba dojezdu sanitky byla delší než vyhláškou požadovaných 17 minut na hladině významnosti 0,05. Řešení 1 Zamyslíme-li se nad analyzovanou veličinou, dospějeme jednoznačně k závěru, že doba dojezdu musí být pravostranně vychýlená. Není tedy správné použít Z-test nebo t-test, protože náhodná veličina doby dojezdu sanitky nemá normální rozdělení. Obdobou jednovýběrového testu hypotézy o střední hodnotě je test znaménkový. Ten je vlastně binomickým testem, který předpokládá, že pravděpodobnost obou možných výsledků pozorování A a B (pod očekávanou hodnotou a nad očekávanou hodnotou) je stejná, tedy p(a) = p(b) = 0,5 Úlohu budeme řešit podle teorie. Máme náhodný výběr 15, 23, 11, 20, 18, 32, 30, 24, 26, 17 ze spojitého rozdělení s mediánem x (není nutné medián počítat). Tento náhodný výběr má počet prvků n = 10. Platí tedy P(X i < x ) = P(X i > x ) = 1 2, i = 1,, n Chceme testovat hypotézu H 0 : x = x 0 proti jednostranné alternativní hypotéze H 1 : x > x 0, kde x 0 = 17 je vyhláškou daná hodnota. Utvoříme rozdíly 15 17, 23 17, 11 17, 20 17, 18 17, 32 17, 30 17, 24 17, 26 17, 17 17 Rozdíly vypočteme 2, +6, 6, +3, +1, +15, +13, +7, +9, 0 V tomto souboru rozdílů vynecháme nulové hodnoty a příslušně snížíme n. Dostaneme tak zkoumaný soubor Y a nyní je n = 9. 2, +6, 6, +3, +1, +15, +13, +7, +9 Počet prvků zkoumaného souboru (v této situaci 9) nelze považovat za velké číslo, proto nemůžeme Y~Bi (9, p = 1 2 ) To znamená, že očekáváme, že zjištěná hodnota Y bude blízko své střední hodnoty 9 2. kritických hodnot pro znaménkový test přesný. V našem konkrétním případu dostáváme α = 0,05, n = 9, k 1 = 1, k 2 = 8 Protože náhodný jev Y nastal ve 2 případech (dvě kladná znaménka) a je tedy v intervalu (1, 8), nemůžeme podle teorie zamítnout nulovou hypotézu. Nepodařilo se tedy prokázat, že doba dojezdu z analyzovaných dat se statisticky významně liší od doby požadované vyhláškou. d b 1

Poznámka Tento příklad velmi dobře ukazuje na obecnou vlastnost neparametrických testů, kterou je skutečnost, že jsou k zjištění rozdílu méně citlivé. Síla neparametrických testů je obecně při stejném počtu pozorování menší, než je síla ekvivalentních testů parametrických (Z-test, t-test a podobně). Zvýšení síly testu dosáhneme zvýšením počtu pozorování. d b 2

Příklad 2 V tabulce jsou uvedena data doby řešení matematického příkladu skupinou 11 studentů před speciálním cvičením zaměřeným na daný typ úloh. V druhém řádku tabulky jsou doby potřebné k řešení obdobného příkladu po praktickém cvičení. Před cvičením 87, 61, 98, 90, 93, 74, 83, 72, 81, 75, 83 Po cvičení 50, 45, 79, 90, 88, 65, 52, 79, 84, 61, 52 Máme prokázat na hladině významnosti 0,05, že výsledky po cvičení jsou lepší než výsledky před cvičením. Řešení 2 Z psychologie víme, že doby řešení úloh po cvičení orientovaném na určitý typ úloh mají levostranně sešikmené rozdělení a použití párového t-testu není tedy teoreticky správné. Proto k nalezení odpovědi na otázku použijeme znaménkový test. Máme tedy n = 11 a sadu dvojic měření. Znaménkem plus označíme ty hodnoty, kdy se po cvičení doba k řešení příkladu zkrátila, znaménkem mínus ty případy, kdy naopak doba potřebná k řešení příkladu byla delší. Dostaneme situaci +37, +16, +19, 0, +5, +9, +31, 7, 3, +14, +31 Pokud je diference v dobách řešení nulová, jde o tzv. svázané hodnoty (ties) a o ně počet analyzovaných údajů snížíme (to nastalo v jednom případu). Dostaneme n = 10 a hodnoty náhodného jevu X +37, +16, +19, +5, +9, +31, 7, 3, +14, +31 Máme soubor hodnot, pro který musí platit P(X i < x ) = P(X i > x ) = 1, i = 1,,10 2 Chceme testovat hypotézu H 0 : x = 0 (schopnost vypočítat úlohu tohoto type se nezlepšila) proti jednostranné alternativní hypotéze H 1 : x > 0 (schopnost vypočítat úlohu tohoto typu se zlepšila). Počet prvků zkoumaného souboru (v této situaci 10) nelze považovat za velké číslo, proto nemůžeme Y~Bi (10, p = 1 2 ) To znamená, že očekáváme, že zjištěná hodnota Y bude blízko své střední hodnoty 10 2. kritických hodnot pro znaménkový test přesný. V našem konkrétním případu dostáváme α = 0,05, n = 10, k 1 = 1, k 2 = 9 Protože náhodný jev Y nastal v 8 případech (osm kladných znaménka) a je tedy v intervalu (1, 9), nemůžeme podle teorie zamítnout nulovou hypotézu. Nepodařilo se tedy prokázat, že dané cvičení vede ke zkrácení doby řešení tohoto druhu příkladů. d b 3

Příklad 3 Je třeba otestovat, jestli léčebný preparát nemění složení krve (počet leukocytů). Preparát byl zkoušen na 10 osobách. Výsledky (dané poměrem leukocytů k jejich počtu dle normy) jsou uvedeny v tabulce. Testujte na hladině významnosti 0,05. Testování bylo provedeno na zdravých jedincích, kteří měli před testováním množství leukocytů odpovídající normě. Výsledky testování byly: 1,06, 1,03, 1,10, 1,00, 1,02, 1,08, 1,06, 1,03, 1,05, 1,09 Řešení 3 O léčebném preparátu není známo, zda jeho užití má z hlediska počtu leukocytů nějaké známé rozdělení, či sešikmení. Proto použití t-testu není teoreticky správné. K nalezení odpovědi na otázku použijeme znaménkový test. Máme tedy n = 10 a sadu měření. Znaménkem plus označíme ty hodnoty, kdy se po aplikaci preparátu množství leukocytů zvýšilo (v tabulce uvedená hodnota je vyšší než 1), znaménkem mínus označíme ty případy, kdy naopak množství leukocytů kleslo. Konkrétně si vypočteme hodnoty x i 1. Dostaneme situaci +0,06, +0,03, +0,10, 0,00, +0,02, +0,08, +0,06, +0,03, +0,05, +0,09 Pokud je nějaká hodnota nulová, počet analyzovaných údajů o ni snížíme (to nastalo v jednom případu). Dostaneme n = 9 a hodnoty náhodného jevu X +0,06, +0,03, +0,10, +0,02, +0,08, +0,06, +0,03, +0,05, +0,09 Máme soubor hodnot, pro který musí platit P(X i < x ) = P(X i > x ) = 1, i = 1,,10 2 Chceme testovat hypotézu H 0 : x = 0 (množství leukocytů zůstalo zachováno) proti jednostranné alternativní hypotéze H 1 : x 0 (množství leukocytů se po aplikaci preparátu změnilo). Počet prvků zkoumaného souboru (v této situaci 9) nelze považovat za velké číslo, proto nemůžeme Y~Bi (9, p = 1 2 ) To znamená, že očekáváme, že zjištěná hodnota Y bude blízko své střední hodnoty 9 2. kritických hodnot pro znaménkový test přesný oboustranný. V našem konkrétním případu dostáváme α = 0,05, n = 9, k 1 = 1, k 2 = 8 Protože náhodný jev Y nastal v 9 případech (devět kladných znaménka) a je tedy mimo interval (1, 8), můžeme podle teorie zamítnout nulovou hypotézu. Podařilo se tedy prokázat, že aplikace daného preparátu způsobí statisticky významnou změnu počtu leukocytů. d b 4

Příklad 4 Příklad 5.2 Jednou za semestr studenti pomocí bodů hodnotí přednášející. K dispozici jsou průměrné výsledky na jednoho studenta za dva roky pro deset náhodně vybraných přednášejících. Posuďte na hladině významnosti 0.05, zda přednášející získali v letošním roce od studentů stejný počet bodů jako v minulém roce. Body jsou uvedeny v tabulce. Body za minulý rok 2.5, 1.5, 3, 3, 1.5, 1.5, 2, 2, 1.5, 3 Body za letošní rok 2, 2, 2.5, 2.5, 2.5, 1, 1, 1.5, 1.5, 2 Řešení 4 Nevíme nic o rozdělení sledované veličiny, kterou je rozdíl v hodnocení v letošním a minulém roce. Víme jen, že hodnocení bylo prováděno jako v české základní škole (1 nejlepší a 5 nejhorší). Z toho důvodu použití t-testu není tedy teoreticky správné. Proto k nalezení odpovědi na otázku použijeme znaménkový test. Máme tedy n = 10 a sadu dvojic hodnocení. Znaménkem plus budou označeny ty hodnoty, kdy se po roce hodnocení zlepšilo, znaménkem mínus ty případy, kdy naopak po roce hodnocení zhoršilo. Nové hodnoty vypočteme tak, že od loňského hodnocení odečteme letošní. Dostaneme situaci +0.5, 0.5, +0.5, +0.5, 1, +0.5, +1, +0.5, 0, +1 Pokud je diference v hodnocení nulová, jde o tzv. svázané hodnoty (ties) a o ně počet analyzovaných údajů snížíme (to nastalo v jednom případu). Dostaneme n = 9 a hodnoty náhodného jevu X +0.5, 0.5, +0.5, +0.5, 1, +0.5, +1, +0.5, +1 Máme soubor hodnot, pro který musí platit P(X i < x ) = P(X i > x ) = 1, i = 1,,9 2 Chceme testovat hypotézu H 0 : x = 0 (hodnocení se nezměnilo) proti oboustranné alternativní hypotéze H 1 : x 0 (hodnocení se změnilo). Počet prvků zkoumaného souboru (v této situaci 9) nelze považovat za velké číslo, proto nemůžeme Y~Bi (9, p = 1 2 ) To znamená, že očekáváme, že zjištěná hodnota Y bude blízko své střední hodnoty 9 2. kritických hodnot pro znaménkový test přesný. V našem konkrétním případu dostáváme α = 0,05, n = 9, k 1 = 1, k 2 = 8 Protože náhodný jev Y nastal v 7 případech (sedm kladných znaménka) a je tedy v intervalu (1, 8), nemůžeme podle teorie zamítnout nulovou hypotézu. Podařilo se tedy prokázat, že hodnocení pedagogů se po jednom roce statisticky významně nezměnilo. d b 5

Příklad 5 Prověřte účinnost nové tréninkové metody, neboli zda nová metoda je lepší než stará. Rozdíl maximálních výsledků skokanského družstva před zavedením nové metody a po třech měsících používání je dán tabulkou. číslo skokana rozdíl výkonů [cm] číslo skokana rozdíl výkonů [cm] 1 +5 9 +4 2-10 10 +12 3 +15 11-3 4-1 12 +7 5 +8 13 +9 6 +21 14-2 7 +7 15 +3 8-6 16 +7 Řešení 5a Máme n = 16 případů. V rámci nich došlo 5 krát ke zhoršení výkonu a 11 krát ke zlepšení. V případě, že nová metoda není lepší, měl by být počet zlepšení a zhoršení stejný. Pokud je lepší, počet zlepšení (kladných znamének) by měl být vyšší. Formulujeme tedy nulovou hypotézu pro nezlepšení a jednostrannou alternativní hypotézu pro zlepšení takto H 0 : x = 0 (nedošlo ke zlepšení) a H 1 : x > 0 (došlo ke zlepšení). Počet zlepšení (kladných znamének) je zřetelně vyšší. Otázkou je, zda rozdíl mezi počtem zlepšení a zhoršení je významný na hladině významnosti 5%? Počet prvků zkoumaného souboru (v této situaci 16) nelze považovat za velké číslo, proto nemůžeme Y~Bi (16, p = 1 2 ) To znamená, že očekáváme, že zjištěná hodnota Y bude blízko své střední hodnoty 16 2. kritických hodnot pro znaménkový test přesný. V našem konkrétním případu dostáváme α = 0,05, n = 16, k 1 = 4, k 2 = 12 Protože náhodný jev Y nastal v 11 případech (jedenáct kladných znaménka) a je tedy v intervalu (4, 12), nemůžeme podle teorie zamítnout nulovou hypotézu. Nepodařilo se tedy prokázat, že nová tréninková metoda je statisticky účinnější, než metoda stará. Řešení 5b Stejný problém budeme řešit ještě jednou. Tentokrát tak, že budeme ignorovat fakt, že n = 16 není příliš velké číslo a k řešení použijeme znaménkový test asymptotický pro velké n. Stanovme si stejné hypotézy H 0 : x = 0 (nedošlo ke zlepšení) a H 1 : x > 0 (došlo ke zlepšení). Teorie praví, že podle Moivrovy-Laplaceovy věty pro velké n platí Y~N(n 2, n 4). Lze tedy konstatovat, že při platnosti H 0 je d b 6

U = Y n 2 2Y n n = n ~N(0,1) 4 Na hladině α zamítáme hypotézu H 0 : x = x 0 a přikloníme se k alternativní hypotéze H 1 : x x 0, pokud U Φ 1 (1 α 2 ) Dosadíme do posledního výrazu a dostaneme 2 11 16 Φ 1 (1 0,05 16 2 ) Úpravou výrazu na levé straně a vyhledáním hodnoty pravé strany v tabulce kvantilů normovaného normálního rozdělení dostaneme 22 16 = 6 = 1,5 1,960 4 4 Nerovnost vpravo není pravdivá. Nemůžeme tedy zamítnout nulovou hypotézu. Ve výsledku můžeme konstatovat, že na dané hladině významnosti není statisticky významný rozdíl výsledků skokanů mezi starou a novou metodou. d b 7

Příklad 6 Házeli jsme dvěma hracími kostkami a) První 120-krát a získali následující výsledky x i 1 2 3 4 5 6 n i 20 22 17 18 19 24 b) Druhou jsme házeli 180-krát a dostali jsme x i 1 2 3 4 5 6 n i 28 36 42 30 27 17 Ověřte na hladině významnosti 0,05, zda jsou kostky falešné. Řešení 6 Výsledky házení poctivou hrací kostkou mají rovnoměrné diskrétní rozdělení. Zda jsou kostky ze zadání falešné, budeme zjišťovat pomocí Pearsonova testu dobré shody. Princip testu spočívá v obou případech v tom, že pozorované (empirické, skutečné) četnosti v jednotlivých třídách se porovnávají s četnostmi očekávanými, stanovenými pro příslušné rozdělení pravděpodobnosti náhodné veličiny. Budeme testovat hypotézu H 0 X~Ro(6), že výsledky házení touto kostkou odpovídají rovnoměrnému diskrétnímu rozdělení. Řešení a Sestavíme tabulku Třída n j p j np j (n j np j ) 2 np j Ω 1 1 20 0,166667 20 0 Ω 2 2 22 0,166667 20 0,2 Ω 3 3 17 0,166667 20 0,45 Ω 4 4 18 0,166667 20 0,2 Ω 5 5 19 0,166667 20 0,05 Ω 6 6 24 0,166667 20 0,8 Součet x 120 1 120 1,7 První sloupec je pro identifikaci jednotlivých tříd. Druhý sloupec uvádí hozené hodnoty v příslušné třídě. Třetí sloupec je pro zadání četnosti výskytu výsledku v realizaci náhodného pokusu. Čtvrtý sloupec je teoretická četnost dle testovaného rozdělení (v tomto případě rovnoměrné diskrétní pro 6 hodnot). Pátý sloupec je součinem teoretické četnosti s celkovým počtem realizovaných pokusů. Poslední šestý sloupec je hodnotou Pearsonovy statistiky pro příslušnou třídu. Poslední řádek je určen pro součty (kontrolní a výsledné). Hodnota vpravo dole je realizací t testové statistiky 6 T = (n j np j ) 2 Konkrétně v našem případě máme j=1 np j d b 8

t = 1,7 Kritický obor W pro Pearsonův test dobré shody na hladině významnosti α = 0,05 je W = {t; t > χ 2 (k m 1; 1 α)} Zde k = 6 je počet tříd, m = 0 je počet neznámých parametrů. Potřebnou hodnotu vyhledáme v tabulkách. W = {t; t > χ 2 (6 0 1; 1 0,05)} = {t; t > χ 2 (5; 0,95)} = {t; t > 11,07} Protože t W, nelze na hladině významnosti 0,05 zamítnout hypotézu H 0 X~Ro(6). Můžeme tedy na hladině významnosti 0,05 konstatovat, že data nedávají dostatek argumentů pro závěr, že hrací kostka je falešná. Řešení b Sestavíme tabulku Třída n j p j np j (n j np j ) 2 np j Ω 1 1 28 0,166667 30 0,133333 Ω 2 2 36 0,166667 30 1,2 Ω 3 3 42 0,166667 30 4,8 Ω 4 4 30 0,166667 30 0 Ω 5 5 27 0,166667 30 0,3 Ω 6 6 17 0,166667 30 5,633333 Součet x 180 1 180 12,06667 První sloupec je pro identifikaci jednotlivých tříd. Druhý sloupec uvádí hozené hodnoty v příslušné třídě. Třetí sloupec je pro zadání četnosti výskytu výsledku v realizaci náhodného pokusu. Čtvrtý sloupec je teoretická četnost dle testovaného rozdělení (v tomto případě rovnoměrné diskrétní pro 6 hodnot). Pátý sloupec je součinem teoretické četnosti s celkovým počtem realizovaných pokusů. Poslední šestý sloupec je hodnotou Pearsonovy statistiky pro příslušnou třídu. Poslední řádek je určen pro součty (kontrolní a výsledné). Hodnota vpravo dole je realizací t testové statistiky 6 T = (n j np j ) 2 j=1 Konkrétně v našem případě máme t = 12,06667 Kritický obor W pro Pearsonův test dobré shody na hladině významnosti α = 0,05 je W = {t; t > χ 2 (k m 1; 1 α)} Zde k = 6 je počet tříd, m = 0 je počet neznámých parametrů. Potřebnou hodnotu vyhledáme v tabulkách. W = {t; t > χ 2 (6 0 1; 1 0,05)} = {t; t > χ 2 (5; 0,95)} = {t; t > 11,07} Protože t W, zamítáme na hladině významnosti 0,05 hypotézu H 0 X~Ro(6). Můžeme tedy na hladině významnosti 0,05 konstatovat, že data dávají dostatek argumentů pro závěr, že hrací kostka je falešná. np j d b 9