Příklad 1 Vyhláška Ministerstva zdravotnictví předpokládala, že doba dojezdu k pacientovi od nahlášení požadavku nepřekročí 17 minut. Hodnoty deseti náhodně vybraných dob příjezdu sanitky k nemocnému byly: 15, 23, 11, 20, 18, 32, 30, 24, 26, 17 Ověřte, zda doba dojezdu sanitky byla delší než vyhláškou požadovaných 17 minut na hladině významnosti 0,05. Řešení 1 Zamyslíme-li se nad analyzovanou veličinou, dospějeme jednoznačně k závěru, že doba dojezdu musí být pravostranně vychýlená. Není tedy správné použít Z-test nebo t-test, protože náhodná veličina doby dojezdu sanitky nemá normální rozdělení. Obdobou jednovýběrového testu hypotézy o střední hodnotě je test znaménkový. Ten je vlastně binomickým testem, který předpokládá, že pravděpodobnost obou možných výsledků pozorování A a B (pod očekávanou hodnotou a nad očekávanou hodnotou) je stejná, tedy p(a) = p(b) = 0,5 Úlohu budeme řešit podle teorie. Máme náhodný výběr 15, 23, 11, 20, 18, 32, 30, 24, 26, 17 ze spojitého rozdělení s mediánem x (není nutné medián počítat). Tento náhodný výběr má počet prvků n = 10. Platí tedy P(X i < x ) = P(X i > x ) = 1 2, i = 1,, n Chceme testovat hypotézu H 0 : x = x 0 proti jednostranné alternativní hypotéze H 1 : x > x 0, kde x 0 = 17 je vyhláškou daná hodnota. Utvoříme rozdíly 15 17, 23 17, 11 17, 20 17, 18 17, 32 17, 30 17, 24 17, 26 17, 17 17 Rozdíly vypočteme 2, +6, 6, +3, +1, +15, +13, +7, +9, 0 V tomto souboru rozdílů vynecháme nulové hodnoty a příslušně snížíme n. Dostaneme tak zkoumaný soubor Y a nyní je n = 9. 2, +6, 6, +3, +1, +15, +13, +7, +9 Počet prvků zkoumaného souboru (v této situaci 9) nelze považovat za velké číslo, proto nemůžeme Y~Bi (9, p = 1 2 ) To znamená, že očekáváme, že zjištěná hodnota Y bude blízko své střední hodnoty 9 2. kritických hodnot pro znaménkový test přesný. V našem konkrétním případu dostáváme α = 0,05, n = 9, k 1 = 1, k 2 = 8 Protože náhodný jev Y nastal ve 2 případech (dvě kladná znaménka) a je tedy v intervalu (1, 8), nemůžeme podle teorie zamítnout nulovou hypotézu. Nepodařilo se tedy prokázat, že doba dojezdu z analyzovaných dat se statisticky významně liší od doby požadované vyhláškou. d b 1
Poznámka Tento příklad velmi dobře ukazuje na obecnou vlastnost neparametrických testů, kterou je skutečnost, že jsou k zjištění rozdílu méně citlivé. Síla neparametrických testů je obecně při stejném počtu pozorování menší, než je síla ekvivalentních testů parametrických (Z-test, t-test a podobně). Zvýšení síly testu dosáhneme zvýšením počtu pozorování. d b 2
Příklad 2 V tabulce jsou uvedena data doby řešení matematického příkladu skupinou 11 studentů před speciálním cvičením zaměřeným na daný typ úloh. V druhém řádku tabulky jsou doby potřebné k řešení obdobného příkladu po praktickém cvičení. Před cvičením 87, 61, 98, 90, 93, 74, 83, 72, 81, 75, 83 Po cvičení 50, 45, 79, 90, 88, 65, 52, 79, 84, 61, 52 Máme prokázat na hladině významnosti 0,05, že výsledky po cvičení jsou lepší než výsledky před cvičením. Řešení 2 Z psychologie víme, že doby řešení úloh po cvičení orientovaném na určitý typ úloh mají levostranně sešikmené rozdělení a použití párového t-testu není tedy teoreticky správné. Proto k nalezení odpovědi na otázku použijeme znaménkový test. Máme tedy n = 11 a sadu dvojic měření. Znaménkem plus označíme ty hodnoty, kdy se po cvičení doba k řešení příkladu zkrátila, znaménkem mínus ty případy, kdy naopak doba potřebná k řešení příkladu byla delší. Dostaneme situaci +37, +16, +19, 0, +5, +9, +31, 7, 3, +14, +31 Pokud je diference v dobách řešení nulová, jde o tzv. svázané hodnoty (ties) a o ně počet analyzovaných údajů snížíme (to nastalo v jednom případu). Dostaneme n = 10 a hodnoty náhodného jevu X +37, +16, +19, +5, +9, +31, 7, 3, +14, +31 Máme soubor hodnot, pro který musí platit P(X i < x ) = P(X i > x ) = 1, i = 1,,10 2 Chceme testovat hypotézu H 0 : x = 0 (schopnost vypočítat úlohu tohoto type se nezlepšila) proti jednostranné alternativní hypotéze H 1 : x > 0 (schopnost vypočítat úlohu tohoto typu se zlepšila). Počet prvků zkoumaného souboru (v této situaci 10) nelze považovat za velké číslo, proto nemůžeme Y~Bi (10, p = 1 2 ) To znamená, že očekáváme, že zjištěná hodnota Y bude blízko své střední hodnoty 10 2. kritických hodnot pro znaménkový test přesný. V našem konkrétním případu dostáváme α = 0,05, n = 10, k 1 = 1, k 2 = 9 Protože náhodný jev Y nastal v 8 případech (osm kladných znaménka) a je tedy v intervalu (1, 9), nemůžeme podle teorie zamítnout nulovou hypotézu. Nepodařilo se tedy prokázat, že dané cvičení vede ke zkrácení doby řešení tohoto druhu příkladů. d b 3
Příklad 3 Je třeba otestovat, jestli léčebný preparát nemění složení krve (počet leukocytů). Preparát byl zkoušen na 10 osobách. Výsledky (dané poměrem leukocytů k jejich počtu dle normy) jsou uvedeny v tabulce. Testujte na hladině významnosti 0,05. Testování bylo provedeno na zdravých jedincích, kteří měli před testováním množství leukocytů odpovídající normě. Výsledky testování byly: 1,06, 1,03, 1,10, 1,00, 1,02, 1,08, 1,06, 1,03, 1,05, 1,09 Řešení 3 O léčebném preparátu není známo, zda jeho užití má z hlediska počtu leukocytů nějaké známé rozdělení, či sešikmení. Proto použití t-testu není teoreticky správné. K nalezení odpovědi na otázku použijeme znaménkový test. Máme tedy n = 10 a sadu měření. Znaménkem plus označíme ty hodnoty, kdy se po aplikaci preparátu množství leukocytů zvýšilo (v tabulce uvedená hodnota je vyšší než 1), znaménkem mínus označíme ty případy, kdy naopak množství leukocytů kleslo. Konkrétně si vypočteme hodnoty x i 1. Dostaneme situaci +0,06, +0,03, +0,10, 0,00, +0,02, +0,08, +0,06, +0,03, +0,05, +0,09 Pokud je nějaká hodnota nulová, počet analyzovaných údajů o ni snížíme (to nastalo v jednom případu). Dostaneme n = 9 a hodnoty náhodného jevu X +0,06, +0,03, +0,10, +0,02, +0,08, +0,06, +0,03, +0,05, +0,09 Máme soubor hodnot, pro který musí platit P(X i < x ) = P(X i > x ) = 1, i = 1,,10 2 Chceme testovat hypotézu H 0 : x = 0 (množství leukocytů zůstalo zachováno) proti jednostranné alternativní hypotéze H 1 : x 0 (množství leukocytů se po aplikaci preparátu změnilo). Počet prvků zkoumaného souboru (v této situaci 9) nelze považovat za velké číslo, proto nemůžeme Y~Bi (9, p = 1 2 ) To znamená, že očekáváme, že zjištěná hodnota Y bude blízko své střední hodnoty 9 2. kritických hodnot pro znaménkový test přesný oboustranný. V našem konkrétním případu dostáváme α = 0,05, n = 9, k 1 = 1, k 2 = 8 Protože náhodný jev Y nastal v 9 případech (devět kladných znaménka) a je tedy mimo interval (1, 8), můžeme podle teorie zamítnout nulovou hypotézu. Podařilo se tedy prokázat, že aplikace daného preparátu způsobí statisticky významnou změnu počtu leukocytů. d b 4
Příklad 4 Příklad 5.2 Jednou za semestr studenti pomocí bodů hodnotí přednášející. K dispozici jsou průměrné výsledky na jednoho studenta za dva roky pro deset náhodně vybraných přednášejících. Posuďte na hladině významnosti 0.05, zda přednášející získali v letošním roce od studentů stejný počet bodů jako v minulém roce. Body jsou uvedeny v tabulce. Body za minulý rok 2.5, 1.5, 3, 3, 1.5, 1.5, 2, 2, 1.5, 3 Body za letošní rok 2, 2, 2.5, 2.5, 2.5, 1, 1, 1.5, 1.5, 2 Řešení 4 Nevíme nic o rozdělení sledované veličiny, kterou je rozdíl v hodnocení v letošním a minulém roce. Víme jen, že hodnocení bylo prováděno jako v české základní škole (1 nejlepší a 5 nejhorší). Z toho důvodu použití t-testu není tedy teoreticky správné. Proto k nalezení odpovědi na otázku použijeme znaménkový test. Máme tedy n = 10 a sadu dvojic hodnocení. Znaménkem plus budou označeny ty hodnoty, kdy se po roce hodnocení zlepšilo, znaménkem mínus ty případy, kdy naopak po roce hodnocení zhoršilo. Nové hodnoty vypočteme tak, že od loňského hodnocení odečteme letošní. Dostaneme situaci +0.5, 0.5, +0.5, +0.5, 1, +0.5, +1, +0.5, 0, +1 Pokud je diference v hodnocení nulová, jde o tzv. svázané hodnoty (ties) a o ně počet analyzovaných údajů snížíme (to nastalo v jednom případu). Dostaneme n = 9 a hodnoty náhodného jevu X +0.5, 0.5, +0.5, +0.5, 1, +0.5, +1, +0.5, +1 Máme soubor hodnot, pro který musí platit P(X i < x ) = P(X i > x ) = 1, i = 1,,9 2 Chceme testovat hypotézu H 0 : x = 0 (hodnocení se nezměnilo) proti oboustranné alternativní hypotéze H 1 : x 0 (hodnocení se změnilo). Počet prvků zkoumaného souboru (v této situaci 9) nelze považovat za velké číslo, proto nemůžeme Y~Bi (9, p = 1 2 ) To znamená, že očekáváme, že zjištěná hodnota Y bude blízko své střední hodnoty 9 2. kritických hodnot pro znaménkový test přesný. V našem konkrétním případu dostáváme α = 0,05, n = 9, k 1 = 1, k 2 = 8 Protože náhodný jev Y nastal v 7 případech (sedm kladných znaménka) a je tedy v intervalu (1, 8), nemůžeme podle teorie zamítnout nulovou hypotézu. Podařilo se tedy prokázat, že hodnocení pedagogů se po jednom roce statisticky významně nezměnilo. d b 5
Příklad 5 Prověřte účinnost nové tréninkové metody, neboli zda nová metoda je lepší než stará. Rozdíl maximálních výsledků skokanského družstva před zavedením nové metody a po třech měsících používání je dán tabulkou. číslo skokana rozdíl výkonů [cm] číslo skokana rozdíl výkonů [cm] 1 +5 9 +4 2-10 10 +12 3 +15 11-3 4-1 12 +7 5 +8 13 +9 6 +21 14-2 7 +7 15 +3 8-6 16 +7 Řešení 5a Máme n = 16 případů. V rámci nich došlo 5 krát ke zhoršení výkonu a 11 krát ke zlepšení. V případě, že nová metoda není lepší, měl by být počet zlepšení a zhoršení stejný. Pokud je lepší, počet zlepšení (kladných znamének) by měl být vyšší. Formulujeme tedy nulovou hypotézu pro nezlepšení a jednostrannou alternativní hypotézu pro zlepšení takto H 0 : x = 0 (nedošlo ke zlepšení) a H 1 : x > 0 (došlo ke zlepšení). Počet zlepšení (kladných znamének) je zřetelně vyšší. Otázkou je, zda rozdíl mezi počtem zlepšení a zhoršení je významný na hladině významnosti 5%? Počet prvků zkoumaného souboru (v této situaci 16) nelze považovat za velké číslo, proto nemůžeme Y~Bi (16, p = 1 2 ) To znamená, že očekáváme, že zjištěná hodnota Y bude blízko své střední hodnoty 16 2. kritických hodnot pro znaménkový test přesný. V našem konkrétním případu dostáváme α = 0,05, n = 16, k 1 = 4, k 2 = 12 Protože náhodný jev Y nastal v 11 případech (jedenáct kladných znaménka) a je tedy v intervalu (4, 12), nemůžeme podle teorie zamítnout nulovou hypotézu. Nepodařilo se tedy prokázat, že nová tréninková metoda je statisticky účinnější, než metoda stará. Řešení 5b Stejný problém budeme řešit ještě jednou. Tentokrát tak, že budeme ignorovat fakt, že n = 16 není příliš velké číslo a k řešení použijeme znaménkový test asymptotický pro velké n. Stanovme si stejné hypotézy H 0 : x = 0 (nedošlo ke zlepšení) a H 1 : x > 0 (došlo ke zlepšení). Teorie praví, že podle Moivrovy-Laplaceovy věty pro velké n platí Y~N(n 2, n 4). Lze tedy konstatovat, že při platnosti H 0 je d b 6
U = Y n 2 2Y n n = n ~N(0,1) 4 Na hladině α zamítáme hypotézu H 0 : x = x 0 a přikloníme se k alternativní hypotéze H 1 : x x 0, pokud U Φ 1 (1 α 2 ) Dosadíme do posledního výrazu a dostaneme 2 11 16 Φ 1 (1 0,05 16 2 ) Úpravou výrazu na levé straně a vyhledáním hodnoty pravé strany v tabulce kvantilů normovaného normálního rozdělení dostaneme 22 16 = 6 = 1,5 1,960 4 4 Nerovnost vpravo není pravdivá. Nemůžeme tedy zamítnout nulovou hypotézu. Ve výsledku můžeme konstatovat, že na dané hladině významnosti není statisticky významný rozdíl výsledků skokanů mezi starou a novou metodou. d b 7
Příklad 6 Házeli jsme dvěma hracími kostkami a) První 120-krát a získali následující výsledky x i 1 2 3 4 5 6 n i 20 22 17 18 19 24 b) Druhou jsme házeli 180-krát a dostali jsme x i 1 2 3 4 5 6 n i 28 36 42 30 27 17 Ověřte na hladině významnosti 0,05, zda jsou kostky falešné. Řešení 6 Výsledky házení poctivou hrací kostkou mají rovnoměrné diskrétní rozdělení. Zda jsou kostky ze zadání falešné, budeme zjišťovat pomocí Pearsonova testu dobré shody. Princip testu spočívá v obou případech v tom, že pozorované (empirické, skutečné) četnosti v jednotlivých třídách se porovnávají s četnostmi očekávanými, stanovenými pro příslušné rozdělení pravděpodobnosti náhodné veličiny. Budeme testovat hypotézu H 0 X~Ro(6), že výsledky házení touto kostkou odpovídají rovnoměrnému diskrétnímu rozdělení. Řešení a Sestavíme tabulku Třída n j p j np j (n j np j ) 2 np j Ω 1 1 20 0,166667 20 0 Ω 2 2 22 0,166667 20 0,2 Ω 3 3 17 0,166667 20 0,45 Ω 4 4 18 0,166667 20 0,2 Ω 5 5 19 0,166667 20 0,05 Ω 6 6 24 0,166667 20 0,8 Součet x 120 1 120 1,7 První sloupec je pro identifikaci jednotlivých tříd. Druhý sloupec uvádí hozené hodnoty v příslušné třídě. Třetí sloupec je pro zadání četnosti výskytu výsledku v realizaci náhodného pokusu. Čtvrtý sloupec je teoretická četnost dle testovaného rozdělení (v tomto případě rovnoměrné diskrétní pro 6 hodnot). Pátý sloupec je součinem teoretické četnosti s celkovým počtem realizovaných pokusů. Poslední šestý sloupec je hodnotou Pearsonovy statistiky pro příslušnou třídu. Poslední řádek je určen pro součty (kontrolní a výsledné). Hodnota vpravo dole je realizací t testové statistiky 6 T = (n j np j ) 2 Konkrétně v našem případě máme j=1 np j d b 8
t = 1,7 Kritický obor W pro Pearsonův test dobré shody na hladině významnosti α = 0,05 je W = {t; t > χ 2 (k m 1; 1 α)} Zde k = 6 je počet tříd, m = 0 je počet neznámých parametrů. Potřebnou hodnotu vyhledáme v tabulkách. W = {t; t > χ 2 (6 0 1; 1 0,05)} = {t; t > χ 2 (5; 0,95)} = {t; t > 11,07} Protože t W, nelze na hladině významnosti 0,05 zamítnout hypotézu H 0 X~Ro(6). Můžeme tedy na hladině významnosti 0,05 konstatovat, že data nedávají dostatek argumentů pro závěr, že hrací kostka je falešná. Řešení b Sestavíme tabulku Třída n j p j np j (n j np j ) 2 np j Ω 1 1 28 0,166667 30 0,133333 Ω 2 2 36 0,166667 30 1,2 Ω 3 3 42 0,166667 30 4,8 Ω 4 4 30 0,166667 30 0 Ω 5 5 27 0,166667 30 0,3 Ω 6 6 17 0,166667 30 5,633333 Součet x 180 1 180 12,06667 První sloupec je pro identifikaci jednotlivých tříd. Druhý sloupec uvádí hozené hodnoty v příslušné třídě. Třetí sloupec je pro zadání četnosti výskytu výsledku v realizaci náhodného pokusu. Čtvrtý sloupec je teoretická četnost dle testovaného rozdělení (v tomto případě rovnoměrné diskrétní pro 6 hodnot). Pátý sloupec je součinem teoretické četnosti s celkovým počtem realizovaných pokusů. Poslední šestý sloupec je hodnotou Pearsonovy statistiky pro příslušnou třídu. Poslední řádek je určen pro součty (kontrolní a výsledné). Hodnota vpravo dole je realizací t testové statistiky 6 T = (n j np j ) 2 j=1 Konkrétně v našem případě máme t = 12,06667 Kritický obor W pro Pearsonův test dobré shody na hladině významnosti α = 0,05 je W = {t; t > χ 2 (k m 1; 1 α)} Zde k = 6 je počet tříd, m = 0 je počet neznámých parametrů. Potřebnou hodnotu vyhledáme v tabulkách. W = {t; t > χ 2 (6 0 1; 1 0,05)} = {t; t > χ 2 (5; 0,95)} = {t; t > 11,07} Protože t W, zamítáme na hladině významnosti 0,05 hypotézu H 0 X~Ro(6). Můžeme tedy na hladině významnosti 0,05 konstatovat, že data dávají dostatek argumentů pro závěr, že hrací kostka je falešná. np j d b 9