Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek a odeslat signál. Vyhodnocení signálů dává u 1 voáka během 0 hodin tyto výsledky: 1,16 1,6 1,77 1,15 1,19 0,93 0,87 1,6 1,7 1,31 1,11 0,73 1,5 1,37 1,45 1,08 0,98 0,83 1,17 1,54. Předpokládete, že odhady časového intervalu maí normální rozdělení. a) Zistěte, zda voák v daných podmínkách odhadue správně hodinový interval. Test proveďte na hladině významnosti α = 0,05. b) Sestrote oboustranný interval spolehlivosti pro střední hodnotu odhadů s rizikem α = 0,05 a komentute srovnání s výsledkem testu. Řešení: a) n = 0, x Ä 1,184, s Ä 0,48, α = 0,05 Hypotéza a alternativa H: μ = 1 A: μ 1 Testové kritérium x μ0 1184, 1 t = n = 0 Ä 3,317 s 0, 48 Kritický obor W 0,05 : t t 0,975 (19) 3,317,093 tzn., že hodnota testového kritéria patří do kritického oboru, nulovou hypotézu H na hladině významnosti α = 0,05 zamítáme, platí alternativní hypotéza. S 95% spolehlivostí lze tvrdit, že odhad hodinového intervalu není správný. b) Oboustranný interval spolehlivosti pro střední hodnotu s s x t0, 975( 19) < μ < x + t0, 975(19) n n 0,48 0,48 1,184,093 < μ < 1,184 +,093 0 0 1,068 < μ < 1,300 Hodnota 1 nepatří do 95% intervalu spolehlivosti pro střední hodnotu. Na základě toho můžeme říct, že odhad hodinového intervalu není s pravděpodobností 95 % správný. Výsledky získané na základě testu a intervalu spolehlivosti sou stené. (Odpovídaící intervaly spolehlivosti e možné používat při testování hypotéz.) Provedený test a intervalový odhad lze snadno provést v našem excelovském pracovním sešitu STAT1: Otevřeme si list 1V normální (ednovýběrový problém předpoklad normální rozdělení) a v horní části listu vybereme proměnnou s90p čas. Ve žlutých buňkách se zobrazí ednoduchý výstup popisné statistiky hodnoty n, x, s a s (0; 1,184; 0,48 a 1
0,06). V této části také vložíme hladinu významnosti α, v našem případě 0,05. V zelených buňkách se budou zobrazovat ednotlivé výsledky statistických analýz viz obr. 1. V části 1 se zobrazí bodové odhady parametrů normálního rozdělení, t. odhad střední hodnoty ˆ μ = x = 1, 184 a odhad rozptylu σˆ = s = 0,06. Navíc se zobrazí i odhad směrodatné odchylky σˆ = s = 0,48 a odhad směrodatné chyby odhadu střední hodnoty estse = s / n = 0,055. Ve. části si můžeme vložit zvolenou velikost přípustné chyby Δ a dostaneme požadovaný minimální rozsah souboru potřebný k tomu, aby velikost přípustné chyby nepřekročila s danou pravděpodobností stanovenou mez. Např. pro zvolenou přípustnou chybu Δ = 0,1 dostaneme minimální rozsah výběru n = 7. Ve 3. části sou uvedené intervalové odhady parametru μ. Zde e právě uvedený i oboustranný interval (1,068; 1,300), který sme v části b) ručního výpočtu také dostali. Konečně 4. část e určená pro testování hypotéz o střední hodnotě. Neprve vložíme hodnotu μ 0 = 1 a dostaneme hodnotu testového kritéria t = 3,317. Dále si mezi nabídnutými alternativami s ohledem na náš řešený problém vybereme alternativu μ μ 0, t. μ 1. V řádku tabulky odpovídaícím této alternativě dostaneme následuící informace: Hodnota testového kritéria padla do kritického oboru (t W 0,05 ); hodnota testového kritéria 3,317 překročila kritickou hodnotu tou e v našem případě Studentův kvantil t 0,975 (19) =,093; p-hodnota = 0,004 e menší než naše hladina významnosti 0,05. To všechno vede k edinému závěru, který e zde uvedený také: hypotéza H se zamítá a alternativa A se přime. Tento závěr se bude interpretovat zcela shodně ako při ručním zpracování: S 95% spolehlivostí není odhad hodinového intervalu správný. Obr. 1: Příklad 90/ odhad času řešený ve STAT1 list 1V-normální
Dvouvýběrové testy 97/1 hmotnost sýru Vážením sme získali údae o přesné hmotnosti balíčků sýrů automaticky balených po 50 g, náhodně vybraných před a po seřízení automatu. Údae o hmotnostech [v gramech] před seřízením: 43, 44,8 53,1 47,5 51,0 51,7 54,0 5,5 5,8 50,1 47,3 50,9 53, 5,7 51,8 45,5 po seřízení: 50,4 50, 51,1 48,9 49,9 50, 5,4 50,8 Na 5% hladině významnosti ověřte, zda se seřízením automatu nezměnila nastavená úroveň hmotnosti. Předpokládete normální rozdělení hmotnosti balíčků. Řešení: Před seřízením: n 1 = 16, x Ä 50,131, Po seřízení: n = 8, y Ä 50,488, s1 Ä 11,465, s 1 Ä 3,386, α = 0,05. s Ä 1,04, s Ä 1,01. Neprve provedeme test o shodě rozptylů. H: σ = A: σ 1 σ 1 σ Testové kriterium s1 11, 465 F = = Ä 11,196 s 1, 04 Kritický obor W 0,05 : F F 0,05 (15; 7) F F 0,975 (15; 7) 11,196 0,304 11,196 4,568 Jelikož 11,196 > 4,568, tzn., že hodnota testového kriteria patří do kritického oboru, hypotézu o shodě rozptylů na hladině významnosti 0,05 tedy zamítáme. V dalších výpočtech budeme předpokládat, že rozptyly obou výběrů sou různé. Nyní přistoupíme k testu o shodě středních hodnot. H: μ 1 = μ A: μ 1 μ Testové kriterium x y 50, 131 50, 488 t = = Ä 0,388 s 11, 465 1, 04 1 s + + n n 16 8 Kritický obor 1 W 0,05 : t t 0,975 (ν*), kde ν* = [k*] a s1 s 11 465 1 04 +,, + 1 k* n n 16 8 = 1 s 1 11 465 1 1 04 1 1 s,, + + 15 16 7 8 1 1 1 1 n n n n Ä 19,504. 3
Protože ν* = [19,504] = 19 (funkce [x] znamená celou část argumentu, např. [3,8] = 3), potom W 0,05 : t t 0,975 (19) 0,388,093 0,388,093 Protože tato nerovnost neplatí, znamená to, že hodnota testového kriteria nepaří do kritického oboru a hypotézu o shodě středních hodnot nemůžeme na hladině významnosti 0,05 zamítnout. Změna úrovně hmotnosti před a po seřízení automatu tedy nebyla prokázána. Také tuto úlohu můžeme pohodlně řešit v našem excelovském pracovním sešitu STAT1: Otevřeme si list V normální (dvouvýběrový problém předpoklad normální rozdělení) a v horní části listu vybereme proměnné s97p1 sýry-před a s97p1 sýry-po. Ve žlutých buňkách se zobrazí ednoduché výstupy popisné statistiky obou souborů hodnoty n 1, x, s 1 a s 1 resp. n, y, s a s (16; 50,131; 3,386 a 11,465 resp. 8; 50,488; 1,01 a 1,04). V této části také vložíme hladinu významnosti α, v našem případě 0,05. V zelených buňkách se budou zobrazovat ednotlivé výsledky statistických analýz viz obr.. Obr. : Příklad 97/1 hmotnost sýru řešený ve STAT1 list V-normální V souladu s teorií testování hypotéz o shodě dvou středních hodnot musíme neprve otestovat 4
shodu obou rozptylů. Výsledky sou v 1. části listu, hodnota testového kritéria e F = 11,195, a pro alternativu σ 1 σ překračue kvantil F 0,975 (15; 7) = 4,568, také p-hodnota = 0,003 e menší než α = 0,05. Tyto výsledky znamenaí, že s 95% pravděpodobností nelze akceptovat shodu rozptylů homoskedasticitu. Budeme předpokládat neshodu rozptylů heteroskedasticitu, tento výsledek e v 1. části listu také zobrazený. Ve. a 3. části listu řeší STAT1 testy hypotéz o shodě středních hodnot, a to za předpokladu shody (. část) resp. neshody (3. část) rozptylů. S ohledem na náš výsledek prvního testu předpoklad heteroskedasticita použieme pro další řešení problému 3. část. Hodnota testového kritéria t = 0,388, stupně volnosti ν* = 19, Studentův kvantil t 0,975 (19) =,093 a p-hodnota = 0,703 vede pro alternativu μ 1 μ k závěru, že shoda středních hodnot μ 1 = μ se nezamítá. To prakticky znamená, že změna úrovně hmotnosti před a po seřízení automatu tedy nebyla prokázána. 3 Testy o tvaru rozdělení Pokud sledueme reálně istou náhodnou veličinu prostřednictvím náhodného výběru, potom ednou ze zásadních informací, které budeme při statistické analýze potřebovat, e informace o rozdělení této náhodné veličiny. Přesněi řečeno budeme rozhodovat, zda náš náhodný výběr pochází z normálního rozdělení, nebo zda normální rozdělení ako teoretický model nebude možné akceptovat. I když tuto informaci už můžeme vysledovat z tabulky rozdělení četností resp. z grafu rozdělení četností, korektněi tuto informaci získáme pomocí testů o normalitě konkrétně pomocí testů o nulové šikmosti a nulové špičatosti resp. C-testu. V některých reálných situacích může být užitečné ověřit, zda náš výběr nepochází z iného než normálního rozdělení, např. z Poissonova rozdělení, logaritmicko-normálního rozdělení apod. K tomu slouží χ -test dobré shody, kterým lze otestovat shodu dat s akýmkoliv rozdělením. 99/3 a 91/9 pneumatiky Byl proveden test životnosti u 80 kusů pneumatik. Výsledky sou uvedeny v tabulce. tisíc km 13 14 15 16 17 18 19 počet 6 6 1 9 4 1 a) Vypočítete koeficienty šikmosti a špičatosti. b) Pomocí testů o nulové šikmosti a nulové špičatosti ověřte, zda výběr pochází z normálního rozdělení. Použite hladinu významnosti 0,05 i 0,01. c) C-testem normality ověřte, zda výběr pochází z normálního rozdělení. Použite také hladinu významnosti 0,05 i 0,01. Řešení: a) Výběrové koeficienty šikmosti a špičatosti určíme v programu STAT1 ako momentové koeficienty a 3 = 0,64 a a 4 = 0,068 viz obr. 1. b) Ověření normality e založené na skutečnosti, že normální rozdělení má nulovou šikmost a současně nulovou špičatost: α 3 = 0 α 4 = 0. Proto použieme tuto neednodušší filozofii, která spočívá pouze ve snaze zamítnout nulovou šikmost nebo zamítnout nulovou špičatost. Pokud by se to podařilo, potom prohlásíme, že výběr z normálního rozdělení nepochází. V opačném případě, tedy když nulovou šikmost ani nulovou špičatost 5
nezamítneme, bude možné normální rozdělení ako model pro popis sledované náhodné veličiny akceptovat. Neprve otestueme nulovou šikmost pro α = 0,05: užieme n = 80 a a 3 = 0,64 H: α 3 = 0 A: α 3 0 a3 0,64 u 3 = = Ä,365, kde D(a 3 ) = D( a 3 ) 0,0696 W 0,05 : u 3 u 0,975,365 1,960 platí H se zamítá 6( n ) = ( n + 1)( n + 3) 6 78 Ä 0,0696 81 83 Výběr tedy pochází z rozdělení, které s 95% spolehlivostí vykazue nenulovou šikmost, to tedy znamená, že normální rozdělení není vhodným modelem pro popis naší náhodné veličiny! V takovém případě test o nulové špičatosti už není potřebné provádět. Nyní otestueme nulovou šikmost pro α = 0,01: užieme n = 80 a a 3 = 0,64 H: α 3 = 0 A: α 3 0 výpočet D(a 3 ) = 0,0696 a u 3 =,365 se nemění W 0,01 : u 3 u 0,995,365,576 neplatí H se nezamítá V tomto případě se s 99% spolehlivostí nepodařila prokázat nenulová šikmost. To tedy znamená, že výběr pochází ze symetrického rozdělení, a o normálním rozdělení musíme rozhodnout pomocí testu o nulové špičatosti pro α = 0,01: užieme n = 80 a a 4 = 0,068 H: α 4 = 0 A: α 4 0 a 6 4 + 0,068 + 6 u 4 = n + 1 81 = Ä 0,01, D( a4 ) 0,49 4n( n )( n 3) 4 80 78 77 kde D(a 4 ) = = ( n + 1) ( n + 3)( n + 5) 81 83 85 W 0,01 : u 4 u 0,995 0,01,576 neplatí H se nezamítá Ä 0,49 S 99% spolehlivostí se nepodařila prokázat ani nenulová špičatost, to tedy znamená, že na hladině významnosti α = 0,01 lze normální rozdělení akceptovat ako vhodný model pro popis sledované veličiny. Dáme-li dohromady naše úvahy, e patrné, že normalita se na hladině významnosti 0,05 zamítá (koeficient šikmosti e nenulový, říkáme také, že e statisticky významný), avšak na hladině významnosti 0,01 e možné považovat data za výběr z normálního rozdělení (oba koeficienty sou statisticky nevýznamné). c) C-test normality e založený na skutečnosti, že součet čtverců normovaných veličin u 3 a u 4 má Pearsonovo rozdělení se dvěma stupni volnosti. Neprve otestueme normalitu pro α = 0,05: užieme u 3 =,365 a u 4 = 0,01 H: X má normální rozdělení A: X nemá normální rozdělení C = u + =,365 + 0,01 Ä 5,593 3 u4 6
W 0,05 : C χ 0,95() 5,593 5,991 neplatí H se nezamítá S 95% spolehlivostí se nepodařilo hypotézu o normálním rozdělení zamítnout, a proto budeme normální rozdělení považovat za vhodný model pro popis naší náhodné veličiny. Dále otestueme normalitu pro α = 0,01: užieme u 3 =,365, u 4 = 0,01 a C = 5,593. H: X má normální rozdělení A: X nemá normální rozdělení W 0,05 : C χ 0,99() 5,593 9,10 neplatí H se nezamítá S 99% spolehlivostí se také nepodařilo hypotézu o normálním rozdělení zamítnout, a proto budeme i v tomto případě normální rozdělení považovat za vhodný model pro popis naší náhodné veličiny. Rozdíly od normality nesou tedy na obou hladinách významnosti statisticky významné. Excelovský pracovní sešit STAT1 nám poskytue základní informace o normalitě na 3 listech, které sou určené pro základní zpracování dat: Popisné charakteristiky, Bodové rozdělení a Intervalové rozdělení. Pod tabulkou s popisnými charakteristikami a grafy se nachází část Ověření normality viz obr. 1. Samostatně e zde provedený test o nulové šikmosti, test o nulové špičatosti (závěr o normalitě si musí uživatel udělat sám!) a C-test o normalitě. Na obr. 1 se týkaí všechny výstupy našeho řešeného příkladu 91/9 pneumatiky, všechny na hladině významnosti 0,05. Obr. 1: Příklad 91/9 pneumatiky řešený ve STAT1 list Popisná statistika 101/15 myčka Po dobu 3 měsíců se v pracovních dnech sledoval počet aut na mycí lince za den. počet aut 1 3 4 5 6 7 8 9 10 počet případů 4 8 11 15 1 5 4 1 Předpokládete, že počet aut na myčce má Poissonovo rozdělení. Je tento předpoklad opodstatněný? Použite χ -test dobré shody a řešte na hladině významnosti 0,05. 7
Řešení: Odhad parametru lambda provedeme pomocí výběrového průměru (pro Poissonovo rozdělení totiž platí E(X) = λ a odhad ˆ λ = x = 5 ). Zformulueme hypotézu a alternativu: H: X má Poissonovo rozdělení s parametrem λ = 5 A: X nemá Poissonovo rozdělení s parametrem λ = 5 Jako testové kriterium použieme statistiku k ( n nπ ) χ =, = 1 nπ která má při platnosti hypotézy Pearsonovo rozdělení s ν = k c 1 stupni volnosti, kde n e rozsah výběrového souboru, k e počet tříd, c e počet neznámých parametrů ověřovaného rozdělení. Potom kritický obor e W α = {χ ; χ χ1 α ( ν ) }. x n četnosti π hodnoty pravděpodobnostní funkce nπ teoretické četnosti nπ sdružené n ( n n 0 0 0,00674 0,43136 1 0,03369,15616 7,97760 6 0,4904 4 0,084 5,39008 3 8 0,14037 8,98368 8,98368 8 0,10771 4 11 0,17547 11,3008 11,3008 11 0,00471 5 15 0,17547 11,3008 11,3008 15 1,6556 6 1 0,146 9,35808 9,35808 1 0,74585 7 5 0,10444 6,68416 6,68416 5 0,4435 8 4 0,0658 4,1779 9 0,0367,318 8,5363 7 0,765 10 a více 1 0,03183,0371 64 1,00000 64,00000 64,00000 64 3,3149 nπ π ) V tabulce e uveden výpočet testové statistiky. V prvním sloupci e uvedený obor hodnot náhodné veličiny s Poissonovým rozdělením, ve druhém sloupci sou empirické četnosti. Ve třetím a čtvrtém sloupci sou pravděpodobnosti (např. z tabulek) a vypočítáme teoretické četnosti. Vzhledem k tomu, že teoretické četnosti v prvních třech a posledních třech třídách sou menší než 5, provedeme eich sloučení; sdružené hodnoty sou uvedené v pátém a šestém sloupci. Sedmý sloupec obsahue ednotlivé vypočítané hodnoty testového kritéria a eich součet = hodnota testového kritéria. Kritický obor pro α = 0,05 e χ χ 0,95(5), tedy 3,315 11,1 (neplatí). Stupně volnosti určíme ze vztahu ν = k c 1 = 7 1 1 = 5. Protože hodnota testového kriteria nepatří do kritického oboru, testovanou hypotézu, že Poissonovo rozdělení s parametrem λ = 5 e vhodným modelem pro popis naší náhodné veličiny počet aut na myčce, nemůžeme na hladině významnosti 0,05 zamítnout. Na obr. e zobrazené srovnání teoretických a empirických četností, ze kterého e vidět, ak empirické četnosti přibližně kopíruí teoretický model, což vizuálně také napovídá, že Poissonův model s parametrem λ = 5 bude možné považovat pro popis naší veličiny ako 8
vhodný. Zobrazený grafický výstup e vytvořený v běžném excelovském prostředí, není součástí programu STAT1. Srovnání teoretických a empirických četností n 16 14 1 10 8 6 4 0 0 1 3 4 5 6 7 8 9 10 11 1 a více počet aut Obr. : Srovnání teoretických a empirických četností 9