VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA STAVEBNÍ HELENA KOUTKOVÁ PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA MODUL GA03 M4 ZÁKLADY TESTOVÁNÍ HYPOTÉZ STUDIJNÍ OPORY PRO STUDIJNÍ PROGRAMY S KOMBINOVANOU FORMOU STUDIA
c Helena Koutková, Brno 2004
Obsah Úvod.................................... 4 1 Podstata testování statistických hypotéz 5 1.1 Statistická hypotéza a její test................... 5 1.2 Proces testování hypotéz...................... 8 1.2.1 Chyby při testování..................... 9 1.2.2 Obecný postup při testování statistických hypotéz.... 13 1.2.3 Výsledky testů a jejich interpretace............ 13 1.3 Kontrolní otázky.......................... 13 1.4 Klíč a výsledky cvičení....................... 15 2 Některé parametrické testy 16 2.1 Testy hypotéz o střední hodnotě normálního rozdělení...... 17 2.1.1 Testy o střední hodnotě při známém rozptylu...... 17 2.1.2 Testy o střední hodnotě při neznámém rozptylu..... 24 2.2 Testy o rozptylu normálního rozdělení............... 28 2.2.1 Testy o rozptylu při známé střední hodnotě........ 28 2.2.2 Testy o rozptylu při neznámé střední hodnotě...... 30 2.3 P-hodnota testu........................... 31 2.4 Souvislost mezi testy hypotéz a intervalovými odhady...... 33 2.5 Kontrolní otázky.......................... 34 2.6 Cvičení................................ 34 2.7 Klíč a výsledky cvičení....................... 36 3 Testy dobré shody 37 3.1 Kontrolní otázky.......................... 48 3.2 Cvičení................................ 48 3.3 Klíč a výsledky cvičení....................... 49 Literatura 51
Úvod Další oblastí statistických metod je testování statistických hypotéz. V minulém modulu jsme předpokládali, že známe typ rozdělení náhodné veličiny X. Realizaci náhodného výběru z X zpracovanou do určité statistiky jsme pak využívali ke konstrukci bodového a intervalového odhadu parametrů rozdělení nebo parametrické funkce. V tomto modulu se budeme naopak zabývat otázkou, jak použít realizaci náhodného výběru z X zpracovanou do určité statistiky k ověřování (testování našich předpokladů (domněnek, hypotéz o hodnotách parametrů rozdělení, resp. parametrických funkcí, typu rozdělení apod. Modul je rozdělen do tří kapitol. Kapitola 1 je určena k zavedení základních pojmů z teorie testování hypotéz a k vysvětlení podstaty testování hypotéz. Tuto kapitolu považuje autorka za nejdůležitější v tomto modulu. Její zvládnutí zaručuje, že pomocí příslušné literatury budete umět testovat hypotézy nejen zde probírané, ale jiné. Kapitola 2 je věnována testům o parametrech normálního rozdělení. Kapitola 3 je zaměřena na testy dobré shody, pomocí kterých ověřujeme hypotézy o typu rozdělení, z něhož výběr pochází. Požadované znalosti K zvládnutí tohoto modulu potřebujete znát základy teorie pravděpodobnosti tak, jak bylo uvedeno v předchozím modulu. Dále potřebujete znát pojmy zavedené v předchozím modulu - a to zejména pojmy: náhodný výběr a jeho realizace, statistika, bodový a intervalový odhad parametrů rozdělení nebo parametrické funkce, bodový a intervalový odhad střední hodnoty a rozptylu normálního rozdělení, výběrová rozdělení - tvrzení 3.1 (ta budeme potřebovat ke konstrukci testů o parametrech normálního rozdělení. Autorka děkuje RNDr. Marii Budíkové, Dr. z PřF MU v Brně a svému kolegovi RNDr. Oldřichu Dlouhému za přečtení textu a cenné připomínky.
Kapitola 1 Podstata testování statistických hypotéz Cíle Cílem této kapitoly je: zavést základní pojmy z teorie testování statistických hypotéz; objasnit proces testování hypotéz; vysvětlit interpretaci výsledků testů. Doba potřebná ke studiu Pro nastudování této kapitoly budete potřebovat minimálně 3 hodiny bez řešení kontrolních otázek. Klíčová slova Statistická hypotéza, parametrické a neparametrické hypotézy, jednoduché a složené hypotézy, nulová hypotéza, alternativní hypotéza, test hypotézy, testová statistika, kritický obor, obor nezamítnutí, chyba prvního druhu, chyba druhého druhu, hladina významnosti testu, síla testu. 1.1 Statistická hypotéza a její test Než se naučíte testovat (ověřovat domněnky (hypotézy, předpoklady o pravděpodobnostním chování náhodné veličiny X, musíte se seznámit se základními pojmy z této oblasti. Definice 1.1: Statistická hypotéza Statistickými hypotézami rozumíme tvrzení o rozdělení náhodných veličin. Statistické hypotézy se mohou např. týkat parametrů rozdělení, parametrických funkcí, tvaru rozdělení apod.
6 Podstata testování statistických hypotéz Pokud se hypotézy týkají hodnot parametrů rozdělení nebo parametrických funkcí, mluvíme o parametrických hypotézách a příslušné testy se rovněž nazývají parametrické. V ostatních případech mluvíme o neparametrických hypotézách a neparametrických testech. Příklad 1.1: Příklady statistických hypotéz jsou např. tvrzení: 1. Náhodná chyba měření nemá systematickou složku. 2. Pravděpodobnost výroby vadného výrobku je 0.01. 3. Počet kazů v běžném metru izolačního materiálu má Poissonovo rozdělení s parametrem 0.2. 4. Zatížení silničního mostu je normální náhodná veličina. 5. Variabilita stogramových balíčků kávy vyjádřená směrodatnou odchylkou je maximálně 1 gram. V příkladu 1.1 je hypotéza 2 parametrická (týká se parametru alternativního rozdělení. Pokud by v případě 1 a 5 byl znám typ rozdělení (např. kdybychom věděli, že sledovaná veličina má normální rozdělení, pak by se opět jednalo o parametrické hypotézy. Ostatní hypotézy nejsou parametrické. Dále dělíme hypotézy na jednoduché a složené. Pokud je hypotéza formulována tak, že jednoznačně určuje rozdělení náhodné veličiny, nazýváme ji jednoduchou hypotézou. Hypotéza, která rozdělení náhodné veličiny jednoznačně nespecifikuje, se nazývá složená hypotéza. Hypotézy 2 a 3 v příkladě 1.1 jsou jednoduché hypotézy, zbývající jsou složené. Při testování hypotéz proti sobě klademe vždy dvě hypotézy. Jednu z nich nazýváme nulová hypotéza a značíme H 0, druhou nazýváme alternativní hypotéza k hypotéze H 0 a značíme H. Definice 1.2: Nulová a alternativní hypotéza Nulová hypotéza H 0 je hypotéza, která je testovaná. Alternativní hypotéza H je hypotéza popírající platnost nulové hypotézy H 0. Alternativní hypotéza nemusí být nutně opačná k hypotéze H 0. Víme-li např. jistě, že náhodná chyba měření X je normální náhodná veličina a domníváme se, že µ = 0, nemusí mít H nutně tvar µ 0. Může se stát, že předem bezpečně víme, že musí platit µ 0. Za této dodatečné informace má pak H tvar: µ > 0. Již známe typy hypotéz, které jsou v matematické statistice uvažovány a teď zbývá přejít k tomu, co rozumíme testem hypotézy.
1.1 Statistická hypotéza a její test 7 Definice 1.3: Test statistické hypotézy Testem statistické hypotézy H 0 rozumíme postup, který na základě realizace náhodného výběru z X vede k zamítnutí nebo nezamítnutí hypotézy H 0. Je-li k hypotéze H 0 stanovena alternativní hypotéza H, mluvíme o testu hypotézy H 0 proti hypotéze H. Na následujícím příkladu objasníme několik základních pojmů z oblasti testování statistických hypotéz. Příklad 1.2: Mějme dvě falešné hrací kostky. Víme, že pravděpodobnost padnutí čísla šest na jedné z nich je 0.1, na druhé 0.5. Na základě pěti hodů jednou kostkou máme rozhodnout, zda jsme si vybrali tu, na které padá šestka častěji, tj. tu kostku, kterou budeme dále nazývat výhodnější. Řešení: Označme p pravděpodobnost jevu, že při jednom hodu vybranou kostkou padne číslo šest. Za nulovou hypotézu H 0 zvolme hypotézu, že námi vybraná kostka je pro nás nevýhodná, za alternativní hypotézu H pak hypotézu, že tato kostka je výhodná. Tj. budeme testovat jednoduchou hypotézu H 0 : p = 0.1 proti jednoduché hypotéze H : p = 0.5. Naše rozhodnutí o zamítnutí, resp. nezamítnutí H 0 chceme udělat na základě pěti hodů vybranou kostkou. Zřejmě p 0.1, 0.5, protože nevíme, kterou kostku jsme si vybrali. Nazvěme hod vybranou kostkou úspěšný, jestliže padne číslo šest. Nechť X i je počet úspěchů v i-tém hodu touto kostkou (i=1,2,...,5. Potom je zřejmě (X 1, X 2,..., X 5 náhodný výběr z rozdělení X A(p, kde p 0.1, 0.5. Statistika T = X 1 + X 2 + + X 5 je pak počet úspěchů v 5-ti hodech vybranou kostkou. Rozhodnutí o zamítnutí, resp. nezamítnutí H 0 založíme tedy na realizaci t statistiky T. Obor hodnot statistiky T je zřejmě množina 0, 1,..., 5. Je třeba připustit, že všechny tyto hodnoty jsou možné, jak při platnosti H 0, tak při platnosti H. Platí-li však H 0, pak zřejmě velké hodnoty statistiky T dostaneme výjimečně a naopak, platí-li H, dostaneme velké hodnoty statistiky T často. Řekněme tedy např., že H 0 zamítneme (tj. přijmeme H, je-li t 2, 3, 4, 5 a H 0 nezamítneme, je-li t 0, 1. Toto rozdělení oboru hodnot statistiky T se jeví rozumné. Můžeme jenom pochybovat, zda hranice mezi oběma částmi oboru hodnot statistiky T byla volena optimálně. Prozkoumejme za tím účelem pravděpodobnost toho, že se při rozhodování o platnosti H 0, resp. H dopustíme omylu. Náhodná veličina T má zřejmě binomické rozdělení Bi(n, p, kde n = 5 a p = 0.1 v případě platnosti H 0, resp. p = 0.5 v případě platnosti H. Tj. statistika T má pravděpodobnostní funkci ( 5 q(t; p = t p t (1 p 5 t pro t = 0, 1,..., 5 0 jinak, kde p = 0.1, resp. p = 0.5 v případě platnosti hypotézy H 0, resp. H.
8 Podstata testování statistických hypotéz I když poměrně vzácně, může i při platnosti H 0 : p = 0.1 nastat případ, že šestka padne alespoň 2-krát. Protože v tomto případě H 0 zamítneme, bude pravděpodobnost, že T 2, 3, 4, 5 při platnosti H 0 : p = 0.1, tj. P ( T 2, 3, 4, 5/p = 0.1, představovat riziko mylného zamítnutí H 0. Platí-li H 0 Bi(5, 0.1 a tedy : p = 0.1 je T P ( T 2, 3, 4, 5/p = 0.1 = 5 ( 5 t 0.1 t 0.9 5 t t=2. = 0.0729 + 0.0081 + 0.0005 + 0.0000 = 0.0815. Riziko mylného zamítnutí H 0 je tedy asi 8%-ní, tj. mýlíme se tímto způsobem v průměru asi v osmi případech ze sta. Stejně tak může nastat případ, že při platnosti H : p = 0.5 dostaneme nízký výsledek, který nás vede k zamítnutí H a přijetí H 0. Riziko takového omylu určíme zcela obdobně: P ( T 0, 1/p = 0.5 = 1 ( 5 t 0.5 t 0.5 5 t = 1 ( 5 t 0.5 5 t=0 t=0. = 0.0313 + 0.1563 =. 0.1876. Vidíme tedy, že riziko mylného nezamítnutí H 0 je téměř 19%-ní - tj. mýlíme se v průměru v asi 19-ti případech ze sta. V právě uvedeném příkladu si zejména všimněme, že přicházely v úvahu dva druhy chyb. Vztah mezi výsledkem testu a realitou a z něj vyplývajících možností chyb můžeme schématicky znázornit tak, jako v tabulce 1.1. Tabulka 1.1: Vztah mezi výsledkem testu a skutečností Skutečnost Rozhodnutí H 0 je pravdivá H 0 není pravdivá H 0 zamítáme mylné zamítnutí H 0 správné rozhodnutí H 0 nezamítáme spravné rozhodnutí mylné nezamítnutí H 0 1.2 Proces testování hypotéz Přejděme nyní k obecnějšímu výkladu principů testování statistických hypotéz. Jak již bylo uvedeno, stojí proti sobě dvě hypotézy týkající se náhodné veličiny X, nulová hypotéza H 0 a alternativní hypotéza H. Své rozhodnutí o zamítnutí H 0 zakládáme na realizaci náhodného výběru (X 1, X 2,..., X n z rozdělení X, přesněji řečeno na realizaci určité statistiky T = T (X 1, X 2,..., X n. Statistiku T nazýváme testová statistika nebo testové kritérium. Lze ji chápat jako
1.2 Proces testování hypotéz 9 míru nesouladu výsledků pokusu s nulovou hypotézou. Obor hodnot statistiky T (tj. výběrový prostor rozdělíme na dvě disjunktní části - jednu z nich označíme W a budeme nazývat kritickým oborem nebo oborem zamítnutí pro test hypotézy H 0, druhou označíme V a nazveme oborem nezamítnutí pro test hypotézy H 0. Testování pak může vést ke dvěma závěrům. Jestliže zjistíme, že pro realizaci t statistiky T platí t W, hypotézu H 0 zamítneme. V opačném případě, kdy t V, tj. t W, hypotézu H 0 nezamítneme. Zavedenou terminologii shrneme do následující definice. Testová statistika, kritický obor, obor nezamít- Definice 1.4: nutí Testová statistika nebo testové kritérium je statistika, kterou použijeme k rozhodování o zamítnutí nebo nezamítnutí hypotézy H 0. Kritický obor nebo obor zamítnutí je množina všech hodnot testové statistiky, které vedou k zamítnutí H 0. Obor nezamítnutí je množina všech hodnot testové statistiky, které vedou k nezamítnutí H 0. Úkol 1.1: Co jsme v příkladu 1.2 zvolili za testovou statistiku, kritický obor a obor nezamítnutí? 1.2.1 Chyby při testování Protože testování provádíme na základě náhodného výběru, můžeme se vlivem náhody při našem rozhodování o zamítání, resp. nezamítání hypotézy H 0 dopustit jedné ze dvou chyb (viz tab. 1.1: Definice 1.5: Chyba prvního a druhého druhu Chyby 1. druhu se dopustíme, jestliže nulová hypotéza H 0 platí, ale na základě testu, tj. na základě výsledku t W, tuto hypotézu zamítáme. Chyby 2. druhu se dopustíme, jestliže nulová hypotéza H 0 neplatí, ale na základě testu, tj. na základě výsledku t W, tuto hypotézu nezamítáme. Úkol 1.2: 1. Označte v tabulce 1.1, které rozhodnutí je chyba 1. druhu a které rozhodnutí je chyba 2. druhu.
10 Podstata testování statistických hypotéz 2. Vraťte se k příkladu 1.2 a formulujte, co tam byla chyba 1. a chyba 2. druhu. Pomocí čeho jsme měřili velikost těchto chyb? Samozřejmě budeme chtít, aby obě chyby byly co nejmenší. Jejich velikost budeme měřit pomocí pravděpodobnosti. Pravděpodobnost chyby 1. druhu je zřejmě P ( T W/H 0 a pravděpodobnost chyby 2. druhu je P (T W/H. Uvědomme si, že pro vyjádření pravděpodobnosti chyby 1. druhu musíme znát rozdělení statistiky T za platnosti hypotézy H 0. Je-li H 0 jednoduchá hypotéza, je rozdělení náhodné veličiny X za platnosti H 0 určeno jednoznačně, a tedy i rozdělení statistiky T za platnosti H 0 je určeno jednoznačně. Tedy pravděpodobnost chyby 1. druhu, tj. P ( T W/H 0, je určena jednoznačně. Je-li H 0 složená hypotéza, není rozdělení náhodné veličiny X za platnosti H 0 určeno jednoznačně, a tedy i rozdělení statistiky T za platnosti H 0 nemusí být určeno jednoznačně. Tedy pravděpodobnost chyby 1. druhu, tj. P ( T W/H 0, nemusí být určena jednoznačně. Podobné úvahy platí pro vyjádření pravděpodobnosti chyby druhého druhu, tj. P ( T W/H. Definice 1.6: Hladina významnosti a síla testu Číslo α, které udává v případě jednoduché nulové hypotézy H 0 pravděpodobnost chyby 1. druhu a v případě složené nulové hypotézy H 0, nejmenší horní hranici pravděpodobnosti chyby 1. druhu, nazýváme hladina významnosti testu hypotézy H 0. Číslo, které udává v případě jednoduché alternativní hypotézy H pravděpodobnost chyby 2. druhu a v případě složené alternativní hypotézy H, nejmenší horní hranici pravděpodobnosti chyby 2. druhu, značíme β. Číslo 1 β se nazývá síla testu. Z výše uvedeného plyne, že α = P ( T W/H 0 v případě jednoduché hypotézy H 0 a v případě složené hypotézy H 0 je V případě složené hypotézy H je α P ( T W/H 0. β P ( T W/H a v případě jednoduché alternativní hypotézy H platí β = P ( T W/H.
1.2 Proces testování hypotéz 11 Požadavek kladený na hladinu významnosti testu α tedy zaručuje, že riziko mylného zamítnutí H 0 je maximálně 100α procentní (mýlíme se tímto způsobem průměrně maximálně v 100α případech ze sta. Podobně definiční požadavek pravděpodobnosti chyby 2. druhu β zaručuje, že riziko mylného přijetí H 0 (v neprospěch H je maximálně 100β procentní. Jak již bylo řečeno, je přirozené požadovat, aby čísla α i β byla co nejmenší. To je ale problém, protože pravděpodobnosti obou chyb spolu souvisí. Z porovnání obou diagramů na obrázku 1.1. je ihned patrné, že za jinak stejných podmínek (nestane-li se nic, co by ovlivnilo rozdělení statistiky T při platnosti H 0, resp. H má snížení pravděpodobnosti chyby 1. druhu za následek zvýšení pravděpodobnosti chyby 2. druhu a naopak. Obrázek 1.1: Vyjádření vztahu mezi pravděpodobnostmi obou druhů chyb při testu jednoduché hypotézy H 0 proti jednoduché hypotéze H. Hustota testové statistiky T za platnosti H 0 [H] je označena f[g]. Úkol 1.3: V příkladu 1.2 jsme testovali proti sobě dvě jednoduché hypotézy o parametru p alternativního rozložení X; totiž hypotézu H 0 : p = 0.1 proti hypotéze H : p = 0.5. K dispozici byl náhodný výběr z X o rozsahu n = 5. Za testovou statistiku jsme zvolili statistiku T = 5 i=1 X i a za kritický obor množinu W = t; t 2, 3, 4, 5.
12 Podstata testování statistických hypotéz Za těchto podmínek jsme zjistili, že α = 0.0815, β = 0.1876. Vypočtěte pravděpodobnosti obou druhů chyb v případě, že: a zmenšíme kritický obor na W 1 = t; t 3, 4, 5 ; b zvětšíme rozsah náhodného výběru dvojnásobně a kritický obor W 2 zvolíme proporcionální původnímu, tj. W 2 = t; t 4, 5,..., 10. Sledujte, jak se tyto pravděpodobnosti budou měnit při změněných podmínkách. Výsledek: a α = 0.0086, β = 0.5000; b α = 0.0128, β = 0.1719. Pozor: V případě b je testová statistika T = 10 i=1 X i, která má rozdělení T Bi(10, p. Všimněte si, že jste v předchozím úkolu snížení pravděpodobnosti chyb obou druhů dosáhli tak, že jste zvětšili rozsah náhodného výběru. (Tím se změnilo rozdělení testové statistiky. Zvětšení rozsahu náhodného výběru však nemusí být vždycky možné (např. realizace náhodného výběru může být již provedena a není možné v ní pokračovat. Ukázali jsme, že kritický obor W nelze obecně volit tak, aby byly současně obě chyby tak malé, jak bychom si přáli. Proto se obvykle trvá jenom na tom, aby hladina významnosti testu α bylo nějaké, předem dané (samozřejmě malé číslo z intervalu (0,1. V technické praxi se nejčastěji volí α = 0.05 nebo α = 0.01. Mluvíme pak o testu hypotézy H 0 na hladině významnosti α. Z možných testů H 0 na dané hladině významnosti α (tj. z možných voleb testové statistiky T a kritického oboru W pak volíme ten, při kterém je β nejmenší. To ale neznamená, že β bude dostatečně malé. Minimalizaci β při pevně zvoleném α můžeme považovat za základní myšlenku volby kritického oboru. Z výše uvedeného vyplývá, že hlavním teoretickým problémem testování hypotéz je vhodná volba testové statistiky T a následné určení jejího rozdělení. Volbou testové statistiky se zabývají rozsáhlejší učebnice matematické statistiky, zde budou pro nejběžnější situace testové statistiky, zajišťující výhodné vlastnosti testu, uvedeny (až na výjimky bez odvození. Když známe testovou statistiku T pro test hypotézy H 0 a její rozdělení, nebývá již obtížné určit kritický obor pro test hypotézy H 0 proti hypotéze H na dané hladině významnosti α. Za kritický obor W zvolíme ty hodnoty testové statistiky T, které svědčí proti H 0 a ve prospěch H - tím rozhodneme o umístění kritického oboru v množině možných hodnot testové statistiky T. Velikost kritického oboru W pak určíme na základě požadavku kladeného na hladinu významnosti testu α. Rozhodneme-li se ponechat stranou všechny teoretické problémy testování hypotéz naznačené výše, můžeme řešení konkrétních úloh různého druhu shrnout do následujícího obecného postupu.
1.3 Kontrolní otázky 13 1.2.2 Obecný postup při testování statistických hypotéz Na základě všeho, co je nám známo o sledované náhodné veličině X a s uvážením zamýšleného rozsahu realizace náhodného výběru z rozdělení X: 1. Formulujeme nulovou hypotézu H 0 a volíme alternativní hypotézu H k hypotéze H 0, volíme hladinu významnosti testu α. 2. Stanovíme (nejčastěji vyhledáme testovou statistiku T pro test nulové hypotézy H 0. Z realizace náhodného výběru z X vypočítáme její realizaci t. 3. Stanovíme (vyhledáme kritický obor W pro test hypotézy H 0 proti hypotéze H na hladině významnosti α. 4. Rozhodneme: - jestliže t W, potom H 0 zamítneme; - jestliže t W, potom H 0 nezamítáme. 1.2.3 Výsledky testů a jejich interpretace V případě zamítnutí nulové hypotézy H 0 přijmeme alternativní hypotézu H (s maximálně 100α procentním rizikem mylného přijetí H v neprospěch H 0. V technické literatuře se v tomto případě často setkáváme s formulací: Výsledky testu jsou statisticky významné na hladině významnosti α. V případě nezamítnutí nulové hypotézy H 0 nelze říci, že hypotézu H 0 přijímáme. Pravděpodobnost chyby druhého druhu může být totiž velká. Test uzavřeme s tím, že se H 0 nepodařilo na základě zjištěných údajů a použitého testu zamítnout. V aplikacích se v tomto případě opět často vyskytuje formulace Výsledky testu nejsou statisticky významné na hladině významnosti α. Lepší by samozřejmě bylo vyjádřit pravděpodobnost chyby 2. druhu. Ta se ale někdy určuje dost obtížně (především v případě složené alternativní hypotézy. Bez znalosti pravděpodobnosti chyby druhého druhu postupujeme často tak, že za alternativní hypotézu H volíme ten výrok o rozdělení X, který chceme prokázat, nebo spíše, jehož potvrzení vede k nějakým závažným opatřením. 1.3 Kontrolní otázky 1. Vysvětlete následující pojmy: nulová hypotéza, alternativní hypotéza, parametrická a neparametrická hypotéza, jednoduchá a složená hypotéza. 2. Co je základem pro testování hypotézy a z čeho vytvoříte kritický obor pro test hypotézy? 3. Jakých chyb se můžeme dopustit při testování hypotéz? 4. Vysvětlete následující pojmy: hladina významnosti testu, síla testu.
14 Podstata testování statistických hypotéz 5. Popište, jaký je obecný postup při testování hypotéz. 6. Jak lze interpretovat výsledky testů? 7. Při soudním procesu stojí proti sobě dvě hypotézy vinen a nevinen. Kterou z nich byste považovali za nulovou a kterou za alternativní? 8. Při současné technologii je pravděpodobnost výroby zmetku p = 0.05. a Po rekonstrukci výrobní linky byla obnovena výroba, ale technologický postup se nezměnil. Na základě náhodného výběru chceme zjistit, zda nedošlo ke změně kvality výroby. b Byly provedeny změny v technologii s cílem zvýšit kvalitu výroby. Na základě náhodného výběru máme posoudit, zda se tyto změny projevily očekávaným způsobem. c Zavedení nové technologie mělo za cíl snížit náklady. Zajímá nás, zda nedošlo ke snížení kvality výroby. Ve všech uvedených případech formulujte nulovou a alternativní hypotézu. Určete, zda se jedná o parametrické nebo neparametrické hypotézy a zda se jedná o jednoduché nebo složené hypotézy. 9. Formulte sami nějakou a parametrickou b neparametrickou hypotézu a k ní alternativní hypotézu. Určete, zda se jedná o jednoduché nebo složené hypotézy. 10. Určete, zda jsou následující tvrzení pravdivá: a Zamítnutí nepravdivé nulové hypotézy je chyba 1. druhu. b Zamítnutí pravdivé nulové hypotézy označujeme jako chybu 2. druhu. c Pokud testem nezamítneme nulovou hypotézu, pak je tato hypotéza pravdivá. d Pokud testem zamítneme nulovou hypotézu, pak je pravdivá alternativní hypotéza. e Jestliže hodnota testové statistiky neleží v kritickém oboru, přijmeme alternativní hypotézu. f Jestliže hodnota testové statistiky leží v kritickém oboru, přijmeme alternativní hypotézu. g Zamítneme-li nulovou hypotézu na hladině významnosti 0.01, pak ji zamítáme i na hladině významnosti 0.05. h Platí: α + β = 1. 11. Doplňte následující věty: a Alternativní hypotéza H... platnost nulové hypotézy. b Obor hodnot testové statistiky se dělí na... obor a obor nezamítnutí.
1.4 Klíč a výsledky cvičení 15 c Chybou 2. druhu se rozumí nezamítnutí... nulové hypotézy. d Nulovou hypotézu..., pokud hodnota testové statistiky leží v kritickém oboru. e Zmenšením pravděpodobnosti chyby 1. druhu se obecně... pravděpodobnost chyby 2. druhu a obráceně. f Pravděpodobnost chyby 1. a 2. druhu lze současně zmenšit, když... rozsah výběru. 1.4 Klíč a výsledky cvičení Otázky: 7. Nulová je nevinen. Pokud nenalezneme dostatečný důvod ji zamítnout, presumpce neviny vyžaduje obviněného považovat za nevinného do té doby, dokud se nepodaří získat přesvědčivé důkazy o jeho vině. Přijmout hypotézu vinen vyžaduje, aby riziko omylu bylo malé. 8. Zajímá nás parametr p alternativního rozdělení. Bude se tedy jednat o parametrické hypotézy. V případě a H 0 : p = 0.05, H : p 0.05; H 0 je jednoduchá, H je složená hypotéza. V případě b H 0 : p 0.05, H : p > 0.5; obě hypotézy jsou složené. V případě c H 0 : p 0.05, H : p < 0.05; obě hypotézy jsou složené. 10. a Ne - zamítnutí nulové nepravdivé hypotézy není chyba. b Ne - zamítnutí pravdivé nulové hypotézy je chyba 1. druhu. c Ne - nulová hypotéza může, ale nemusí být pravdivá. Neznáme riziko mylného přijetí nulové hypotézy. Pouze se nám ji nepodařilo zamítnout. Někdy jsme ale nuceni se chovat, jako by pravdivá byla. d Ano - s rizikem omylu maximálně 100α procent. e Ne - nezamítáme nulovou hypotézu. f Ano. g Ano. h Ne - to by bylo hodně špatné. Jedná se sice o spojité nádoby, ale ne v tomto smyslu. 11. a popírá; b kritický; c nepravdivé; d zamítáme; e zvětšuje; f zvětšíme.
Kapitola 2 Některé parametrické testy Cíle Po přečtení a nastudování této kapitoly budete umět: testovat hypotézy o hodnotách parametrů normálního rozdělení v jednotlivých situacích; princip testování pomocí P -hodnoty testu; testovat hypotézy pomocí intervalových odhadů. Doba potřebná ke studiu Pokud jste pořádně pochopili předchozí kapitolu, měly by Vám stačit 4 hodiny bez řešení příkladů. Klíčová slova Jednovýběrový u-test, jednovýběrový t-test, párový t-test, test o roztylu normálního rozdělení, P-hodnota testu. V minulé kapitole jste se seznámili se základními pojmy a podstatou testování hypotéz. V této kapitole nás budou zajímat parametrické testy. Budeme chtít na základě realizace náhodného výběru z rozdělení X, které je závislé na parametru ϑ Θ, testovat hypotézy o hodnotě parametrické funkce τ(ϑ. V aplikacích se můžeme setkat s následujícími formulacemi hypotéz o parametrické funkci τ(ϑ: A H 0 : τ(ϑ = τ 0, B H 0 : τ(ϑ = τ 0, C H 0 : τ(ϑ = τ 0, H : τ(ϑ > τ 0, H : τ(ϑ < τ 0, H : τ(ϑ = τ 0, kde τ 0 je nějaké předem dané číslo. Alternativní hypotézu v případě A, resp. B nazýváme pravostrannou, resp. levostrannou. K těmto formulacím přistoupíme tehdy, chceme-li prokázat, že odchylka od τ 0 je v jednom směru. V případě C je alternativní hypotéza oboustranná a použijeme ji tehdy, když není třeba vyslovit soud o směru odchylky.
2.1 Testy hypotéz o střední hodnotě normálního rozdělení 17 V případě A a B se častěji setkáváme se situací, kdy je nulová hypotéza opačná k alternativní. Tj. místo formulací hypotéz A a B je častější formulace A s H 0 : τ(ϑ τ 0, B s H 0 : τ(ϑ τ 0, H : τ(ϑ > τ 0, H : τ(ϑ < τ 0, kde jsou nulové hypotézy jistě složené. Poznámka 2.1: Zpravidla lze pro všechny výše uvedené testy stanovit stejnou testovou statistiku T, jejíž rozdělení je za platnosti τ(ϑ = τ 0 určeno jednoznačně, tak, že testy A a A s na hladině významnosti α mají stejné kritické obory, podobně jako testy B a B s. Pouze riziko mylného zamítnutí nulové hypotézy v testu A s, resp. testu B s je maximálně 100α procentní a ne 100α procentní jako v testu A, resp. B. Je-li totiž např. W A kritický obor pro test A na hladině významnosti α, tj. P (T W A /τ(ϑ = τ 0 = α, potom P (T W A /τ(ϑ τ 0 P (T W A /τ(ϑ = τ 0 = α. Můžeme tedy zpravidla místo testu A s uvažovat test A, ačkoliv si nejsme jisti, že platí τ(ϑ τ 0, a místo testu B s uvažovat test B, ačkoliv si nejsme jisti, že platí τ(ϑ τ 0. V této kapitole se omezíme jen na případ normálního rozdělení a jako parametrické funkce nás budou zajímat pouze parametry tohoto rozdělení µ a σ 2 nebo směrodatná odchylka σ. Přepokládejme tedy dále, že (X 1, X 2,..., X n je náhodný výběr z rozdělení X N(µ, σ 2, kde oba nebo některý z parametrů µ, σ 2 neznáme. 2.1 Testy hypotéz o střední hodnotě normálního rozdělení Budou nás zajímat testy o střední hodnotě µ normální náhodné veličiny X. Tj. budeme chtít neznámou střední hodnotu µ porovnávat s nějakým předem daným číslem µ 0. Např. nás může zajímat, zda je střední hodnota délky cihly 290 mm. Protože normální rozdělení má ještě jeden parametr - rozptyl σ 2, mohou nastat dvě situace: - rozptyl σ 2 známe; - rozptyl σ 2 neznáme. Přejděme tedy k první situaci. 2.1.1 Testy o střední hodnotě při známém rozptylu Příklad 2.1: Navrhněte test statistické hypotézy T 1 : H 0 : µ = µ 0 proti hypotéze H : µ > µ 0 T 2 : H 0 : µ = µ 0 proti hypotéze H : µ < µ 0
18 Některé parametrické testy T 3 : H 0 : µ = µ 0 proti hypotéze H : µ = µ 0 na hladině významnosti α. Řešení: Protože nás zajímají testy o střední hodnotě µ náhodné veličiny X, vyjdeme z nejlepšího nestranného odhadu střední hodnoty, tj. statistiky X. Jestliže platí hypotéza H 0 (tj. je-li skutečná střední hodnota náhodné veličiny X rovna číslu µ 0 má náhodná veličina X rozdělení N(µ 0, σ 2. Tedy statistika T = X µ 0 n σ má za platnosti µ = µ 0 rozdělení N(0, 1. (Viz tvrzení 3.1 v předcházejícím modulu. V prospěch hypotézy H 0 budou svědčit ty realizace (x 1, x 2,..., x n náhodného výběru z X, pro které bude realizace x statistiky X blízká číslu µ 0, tj. pro které bude realizace t statistiky T blízká nule. Zvolme tedy statistiku T za testovou statistiku pro test hypotézy H 0 : µ = µ 0. Nyní zbývá určit kritické obory pro jednotlivé uvažované alternativy. 1. V případě testu T 1 budou zřejmě v prospěch hypotézy H svědčit ty realizace (x 1, x 2,..., x n náhodného výběru z X, pro které bude x podstatně větší než číslo µ 0, tj. pro něž x µ 0 bude větší než nějaká kladná konstanta, tj. pro které bude realizace t statistiky T větší než nějaká kladná konstanta k 1. Za kritický obor W 1 pro test T 1 hypotézy H 0 proti hypotéze H lze tedy zvolit množinu W 1 = t; t > k 1, kde k 1 > 0. Číslo k 1 vyberme tak, aby hladina významnosti testu byla α, tj. požadujeme, aby Odtud (viz obrázek 2.1 1 α = P ( T W 1 /H 0 = P ( T > k1 /µ = µ 0. P ( T k 1 /µ = µ 0 = 1 α k1 = u(1 α. Kritickým oborem W 1 pro test hypotézy H 0 proti hypotéze H na hladině významnosti α je tedy množina W 1 = t; t > u(1 α. 2. V prospěch hypotézy H v případě testu T 2 svědčí ty realizace x statistiky X, pro které je x podstatně menší než číslo µ 0, tj. ty realizace t testové statistiky T, které jsou menší než nějaká záporná konstanta k 2. Kritický obor W 2 bude mít tedy tvar W 2 = t; t < k 2. Číslo k 2 opět vybereme na základě požadavku kladeného na hladinu významnosti testu α. Požadujeme, aby α = P ( T W 2 /H 0 = P ( T < k2 /µ = µ 0.
2.1 Testy hypotéz o střední hodnotě normálního rozdělení 19 Obrázek 2.1: Volba kritického oboru pro test hypotézy H 0 : µ = µ 0 rozdělení N(µ, σ 2 se známým rozptylem σ 2 proti hypotéze 1 H : µ > µ 0, 2 H : µ < µ 0, 3 H : µ µ 0 na hladině významnosti α. Odtud (viz obrázek 2.1 2 k 2 = u(α. Vzhledem k tomu, že prakticky volíme α malé číslo (0.01 nebo 0.05, je u(α < 0 a pro práci s tabulkami potřebujeme převodní vztah u(α = u(1 α. Tedy kritický obor W 2 pro test T 2 na hladině významnosti α je W 2 = t; t < u(1 α. 3. V testu T 3 lze zřejmě volit za kritický obor W 3 pro test hypotézy H 0 proti hypotéze H na hladině významnosti α množinu (viz obrázek 2.1 3 W 3 = t; t < u(1 α 2 t > u(1 α 2. V našich úvahách byla nejtěžší volba vhodné testové statistiky pro test nulové hypotézy. Potřebovali jsme totiž, aby byla tato testová statistika rozumná, tj. aby měla vypovídací schopnost o střední hodnotě a zároveň jsme potřebovali znát rozdělení testové statistiky za platnosti nulové hypotézy. Při testu hypotézy H 0 : µ = µ 0 jsme vyšli z bodového odhadu střední hodnoty, tj. statistky X. Rozdělení statistiky X známe. Víme, že je za platnosti hypotézy H 0 normální s parametry µ 0 a σ 2. Tuto statistiku jsme mohli použít za testovou statistiku, což by bylo jistě názornější. V praxi se však jako testové statistiky používají vhodné funkce bodových odhadů, které je snadné porovnat s kvantily některého známého rozdělení. Při našem postupu jsme podstatně využili
20 Některé parametrické testy skutečnost, že nás zajímá test o střední hodnotě normálního rozdělení se známým rozptylem. Volba kritických oborů a jejich určení pro jednotlivé možné alternativy pak byly už velmi snadné. Všechny výše uvedené testy o střední hodnotě normálního rozdělení při známém rozptylu na hladině významnosti α shrnuje následující tvrzení. Tvrzení 2.1: Testy o střední hodnotě při známém rozptylu Je-li (X 1, X 2,..., X n náhodný výběr z rozdělení X N(µ, σ 2 s neznámou střední hodnotou µ a známým rozptylem σ 2 a µ 0 předem dané číslo, potom lze pro testy T 1 : hypotézy H 0 : µ = µ 0 proti hypotéze H : µ > µ 0, T 2 : hypotézy H 0 : µ = µ 0 proti hypotéze H : µ < µ 0, T 3 : hypotézy H 0 : µ = µ 0 proti hypotéze H : µ µ 0 za testovou statistiku volit stejnou statistiku T = X µ 0 n, σ která má za platnosti µ = µ 0 rozdělení N(0, 1. Za kritické obory W i (i = 1, 2, 3 pro testy T i (i = 1, 2, 3 na hladině významnosti α lze postupně volit množiny W 1 = t; t > u(1 α, W 2 = t; t < u(1 α, W 3 = t; t < u(1 α 2 t > u(1 α 2. Jsou-li nulové hypotézy v testech T 1 a T 2 opačné k alternativním, zůstává tvrzení v platnosti. Poznámka 2.2: Jednovýběrové u-testy Testy o střední hodnotě normálního rozdělení při známém rozptylu se nazývají jednovýběrové u-testy podle rozdělení testové statistiky. Tyto testy lze použít i v případě náhodného výběru z rozdělení, které není normální v případě, že je rozsah výběru n > 30. Příklad 2.2: Z náhodného výběru o rozsahu n = 10 výsledků zkoušek krychelné pevnosti betonu třídy B20 z určité výrobny byl zjištěn průměr 28.8 MPa. Z předchozí zkušenosti je známo, že pevnost je normální náhodná veličina se známou směrodatnou odchylkou 2.4 MPa. Na hladině významnosti 0.05 máme ověřit, zda daná výrobna nezmenšila střední krychelnou pevnost 31 MPa. Řešení: Náhodnou veličinou X je zde krychelná pevnost betonu. Předpokládáme, že X N(µ, σ 2, kde σ = 2.4 MPa. Jsou tedy splněny předpoklady tvzení 2.1.
2.1 Testy hypotéz o střední hodnotě normálního rozdělení 21 1. Budeme testovat hypotézu H 0 : µ = 31 MPa proti hypotéze H : µ < 31 MPa na hladině významnosti 0.05. Jedná se o test T 2 z tvrzení 2.1, kde µ 0 = 31 MPa. 2. Za testovou statistiku lze tedy zvolit statistiku T = X µ 0 n. σ Máme dáno µ 0 = 31, σ = 2.4, x = 28.8, n = 10, odtud pro realizaci t testové statistiky T dostaneme t. = 28.8 31. 10 = 2.899. 2.4 3. Kritický obor W pro test H 0 proti H na hladině významnosti α je pak množina W = W 2 = t; t < u(1 α. Pro α = 0.05 je u(1 α = u(0.95 = 1.645 W = t; t < 1.645. 4. Protože t W, zamítáme hypotézu H 0 a přijímáme hypotézu H. Výrobna snížila střední krychelnou pevnost betonu, riziko omylu je maximálně 5%. Úkol 2.1: Odběratel s dodavatelem uzavřeli smlouvu o dodávce pytlů cementu. Při známém rozptylu plnicího stroje σ 2 = 2.5 kg 2 musí být střední hodnota hmotnosti pytlů 50 kg. Pro ověření toho, že plnicí stroj pracuje dobře, bylo náhodně vybráno 40 pytlů a získán aritmetický průměr jejich hmotnosti x = 49.2 kg. Rozhodněte, zda je hmotnost dodávaných pytlů 50 kg. Hladinu významnosti testu volte 0.05. Výsledek: Vzhledem k tomu, že n > 30 a známe σ 2, lze použít tvrzení 2.1. Střední hodnota hmotnosti pytlů není 50 kg. Riziko omylu je 5%. H 0 : µ = 50, H : µ = 50, t = 3.2, W = t; t < 1.960 t > 1.960. Vraťme se zpět k tvrzení 2.1. Tam bylo v souladu z poznámkou 2.1 konstatováno, že tvrzení zůstává v platnosti i v případě, že v testech T 1 a T 2 jsou nulové hypotézy opačné k alternativním. V těchto testech sice zůstávají předpoklady o rozdělení a alternativní hypotézy stejné jako v původních, ale situace je zde složitější než v případě původních testů. Problém je, že nulové hypotézy už nejsou jednoduché, ale složené. Uvažujme např. test T 1s : hypotézy H 0 : µ µ 0 proti hypotéze H : µ > µ 0 na hladině významnosti α. Pokud testovou statistiku pro test T 1s zvolíme stejně jako pro test T 1, bude mít kritický obor W 1s pro test T 1s stejný tvar jako pro
22 Některé parametrické testy test T 1, tj. W 1s = t; t > k, kde k je nějaká kladná konstanta. Lze jenom pochybovat o tom, zda pro test T 1s na hladině významnosti α je skutečně W 1s = W 1, tj. k = u(1 α. Vzhledem k tomu, že H 0 : µ µ 0 je složená hypotéza, ptáme se, zda tj. zda P (T W 1 /µ µ 0 α ( = P (T W 1 /µ = µ 0, (2.1 P ( T > u(1 α/µ µ 0 α. (2.2 Pro zájemce v následujícím příkladu ukážeme, že skutečně vztah (2.2 platí. Příklad 2.3: (pro zájemce Ověřte platnost vztahu (2.2. Řešení: Označme µ takové číslo, pro které platí µ µ 0. Vztah (2.2 platí právě tehdy, když P ( T > u(1 α/µ = µ α pro každé µ µ 0. (2.3 Statistika T = X µ 0 σ n má rozdělení N(0, 1 za platnosti µ = µ0. My počítáme pravděpodobnost za platnosti µ = µ. Je-li µ = µ, nemá rozdělení N(0, 1 statistika T, ale statistika T = X µ σ n. Zřejmě T = X µ 0 σ n = (X µ + (µ µ 0 σ n = T + µ µ 0 n. σ Vyjádřeme tedy pravděpodobnost ve vztahu (2.3 pomocí statistiky T. Dostaneme P ( ( T > u(1 α/µ = µ = P T + µ µ 0 n > u(1 α/µ = µ σ = P ( T > u(1 α µ µ 0 n/µ = µ (2.4 σ Je-li µ µ 0, potom µ µ 0 σ n 0, odtud u(1 α µ µ 0 σ n u(1 α. Tedy pro každé µ µ 0 platí P ( T > u(1 α µ µ 0 ( n/µ = µ P T > u(1 α/µ = µ = α. σ (Nakreslete si obrázek! Odtud a ze vztahu (2.4 dostáváme, že vztah (2.3 a tedy i (2.2 platí. Příklad 2.4: (pro zájemce Byla provedena realizace náhodného výběru z X N(µ, 4 o rozsahu n = 9 a vypočten x = 5.5. a Ověřte, že na základě naměřených dat nelze na hladině významnosti 0.05 rozhodnout o zamítnutí hypotézy H 0 : µ 6. b Určete riziko mylného přijetí hypotézy H 0 v neprospěch hypotézy µ = 7.
2.1 Testy hypotéz o střední hodnotě normálního rozdělení 23 c Určete rozsah n náhodného výběru z X tak, aby riziko mylného přijetí hypotézy H 0 v neprospěch hypotézy µ = 7 bylo maximálně 5%. Řešení: a 1. Budeme testovat hypotézu H 0 : µ 6 proti hypotéze H : µ > 6 na hladině významnosti 0.05. Můžeme použít stejnou testovou statistiku i kritický obor jako v testu T 1 z tvrzení 2.1, kde µ 0 = 6. 2. Testová statistika je statistika T = X µ 0 n. σ Máme µ 0 = 6, σ = 2, n = 9, x = 5.5. Realizace testové statistiky je 3. Kritický obor je množina Pro α = 0.05 je W = W = W 1 = t = 0.75. t; t > u(1 α. t; t > u(0.95 = t; t > 1.645. 4. Protože t W, nezamítáme hypotézu H 0. kde b Máme vypočítat P (T W/µ = 7 = P (T 1.645/µ = 7, (2.5 T = X 6 3. 2 Z tvrzení 2.1 víme, že T má za platnosti µ = 6 rozdělení N(0, 1. Ve vztahu (2.5 počítáme pravděpodobnost za platnosti, že skutečná střední hodnota je 7. Za tohoto předpokladu nemá rozdělení N(0, 1 statistika T, ale statistika Zřejmě T = X 7 2 T = T + 3 2. 3. Vyjádřeme tedy pravděpodobnost ve vztahu (2.5 pomocí statistiky T, dostaneme P ( T 1.645/µ = 7 = P (T + 3 2 1.645/µ = 7 = P (T 0.145/µ = 7 = Φ(0.145 =. 0.60.
24 Některé parametrické testy Riziko mylného přijetí hypotézy µ 6 v neprospěch hypotézy µ = 7 je přibližně 60%. c Máme určit rozsah n výběru z X tak, aby kde P (T W/µ = 7 = P (T 1.645/µ = 7 0.05, (2.6 T = X 6 n. 2 Rozdělení N(0, 1 má za podmínky µ = 7 statistika T = X 7 2 n. Zřejmě T = T + 1 2 n. Vyjádřeme tedy pravděpodobnost ve vztahu (2.6 pomocí statistiky T, dostaneme ( 0.05 P T + 1 n 1.645/µ = 7 2 ( 0.05 P T 1.645 1 n/µ = 7 2 ( 0.05 Φ 1.645 1 n 2 Φ ( u(0.05 ( Φ 1.645 1 n 2 Odtud u(0.05 1.645 1 2 n u(0.95 1.645 1 2 n. 1.645 1.645 1 2 n n 6.58 n 43.2964. Riziko mylného přijetí H 0 : µ 6 v neprospěch µ = 7 bude maximálně 5% v případě rozsahu výběru n 44. 2.1.2 Testy o střední hodnotě při neznámém rozptylu Rozptyl rozdělení, z něhož výběr pochází, obvykle neznáme. Pro testy o střední hodnotě µ normálního rozdělení nelze v tomto případě samozřejmě použít předchozí výsledky z tvrzení 2.1, protože neznáme rozptyl. Uvědomme si ale, že nestranným odhadem skutečné střední hodnoty µ je opět statistika X. Odhadem rozptylu σ 2 je statistika S 2. Statistika T = X µ 0 n S
2.1 Testy hypotéz o střední hodnotě normálního rozdělení 25 má za platnosti µ = µ 0 rozdělení t(n 1 (viz tvrzení 3.1 z předcházejícího modulu. Zvolíme-li tedy T za testovou statistiku, kritické obory pro jednotlivé testy budou analogické kritickým oborům v tvrzení 2.1. Budou se lišit pouze tím, že se v nich budou vyskytovat místo kvantilů rozdělení N(0,1 kvantily rozdělení t(n 1. Výsledky shrnuje tvrzení 2.2. Tvrzení 2.2: Testy o střední hodnotě při neznámém rozptylu Je-li (X 1, X 2,..., X n náhodný výběr z rozdělení X N(µ, σ 2 s neznámou střední hodnotou µ a neznámým rozptylem σ 2 a µ 0 předem dané číslo, potom lze pro testy T 4 : hypotézy H 0 : µ = µ 0 proti hypotéze H : µ > µ 0, T 5 : hypotézy H 0 : µ = µ 0 proti hypotéze H : µ < µ 0, T 6 : hypotézy H 0 : µ = µ 0 proti hypotéze H : µ = µ 0 za testovou statistiku volit stejnou statistiku T = X µ 0 n, S která má za platnosti µ = µ 0 rozdělení t(n 1. Za kritické obory W i (i = 4, 5, 6 pro testy T i (i = 4, 5, 6 na hladině významnosti α lze postupně volit množiny W 4 = t; t > t(n 1; 1 α, W 5 = t; t < t(n 1; 1 α, W 6 = t; t < t(n 1; 1 α 2 t > t(n 1; 1 α 2. Jsou-li nulové hypotézy v testech T 4 a T 5 opačné k alternativním zůstává tvrzení v platnosti. Poznámka 2.3: Jednovýběrové t-testy Testy o střední hodnotě normálního rozdělení při neznámém rozptylu se nazývají jednovýběrové t-testy podle rozdělení testové statistiky. Jednovýběrové t-testy lze stejně jaku u-testy použít i v případě, že se nejedná o normální rozdělení, je-li rozsah výběru větší než 30. Příklad 2.5: Při zkoušce šestnácti náhodně vybraných ocelových tyčí byly zjištěny následující meze kluzu v MPa: 249, 250, 248, 255, 246, 250, 246, 245, 243, 245, 251, 248, 246, 245, 250, 249. Požaduje se, aby střední hodnota meze kluzu byla 250 MPa. Ověřte, zda je tento předpoklad splněn. Přípustné riziko omylu je maximálně 5%. Předpokládejte, že mez kluzu má přibližně normální rozdělení.
26 Některé parametrické testy Řešení: Náhodnou veličinou X je zde mez kluzu oceli. Předpokládáme, že X N(µ, σ 2 a ani jeden z paramterů µ a σ 2 není znám. Jsou tedy splněny předpoklady z tvrzení. 2.2. 1. Budeme testovat hypotézu H 0 : µ = 250 MPa proti hypotéze H : µ 250 MPa na hladině významnosti 0.05. Jedná se o test T 6 z tvrzení 2.2, kde µ 0 = 250 MPa. 2. Za testovou statistiku lze tedy zvolit statistiku Výpočtem dostaneme T = X µ 0 n. S µ = x = 247.875 MPa, σ = s. = 3.008 MPa. Odtud realizace t testové statistiky T je t. = 247.875 250. 16 = 2.826. 3.008 3. Kritický obor W pro test H 0 proti H na hladině významnosti α je pak množina W = W 6 = t; t < t(n 1; 1 α 2 t > t(n 1; 1 α 2. Pro α = 0.05 je t(n 1; 1 α = t(15, 0.975 = 2.131 2 W = t; t < 2.131 t > 2.131. 4. Protože t W, zamítáme hypotézu H 0 a přijímáme hypotézu H. Tedy střední hodnota meze kluzu oceli není rovna 250 MPa, riziko omylu je maximálně 5%. Příklad 2.6: Krychelná pevnost betonu třídy 40 se zkoušela na deseti vzorcích jednak určitou nedestruktivní metodou, jednak destruktivně. Výsledné hodnoty v MPa jsou zapsány v následující tabulce: Vz. Pevnost (x 1i Pevnost (x 2i Vz. Pevnost (x 1i Pevnost (x 2i nedestr. m. destr. m. nedestr. m destr. m 1 51.9 49.1 6 50.3 50.5 2 49.1 48.2 7 52.0 49.0 3 50.5 50.5 8 50.0 51.6 4 49.8 47.1 9 49.9 49.5 5 50.1 50.9 10 50.5 51.0
2.1 Testy hypotéz o střední hodnotě normálního rozdělení 27 Zjistěte, zda se výsledky podle nedestruktivní metody v průměru jen náhodně liší od destruktivních zkoušek. Přípustné riziko omylu je 5%. Řešení: Nechť X 1 [X 2 ] je pevnost betonu měřená nedestruktivní [destruktivní] metodou. Máme testovat hypotézu E(X 1 = E(X 2 proti hypotéze E(X 1 E(X 2 na hladině významnosti 0.05. Označme X = X 1 X 2, potom E(X 1 = E(X 2 právě tehdy, když E(X = 0. 1. Můžeme tedy testovat hypotézu H 0 : E(X = 0 MPa proti hypotéze H : E(X 0 MPa na hladině významnosti 0.05. Realizace náhodného výběru z X je 2.8, 0.9, 0.0, 2.7, -0.8, -0.2, 3.0, -1.6, 0.4, -0.5. 2. Má-li náhodná veličina X normální rozdělení nebo je-li rozsah výběru větší než 30, jsou splněny předpoklady tvrzení 2.2. Celý problém je pak převeden na použití jednovýběrového t-testu. Za testovou statistiku pro test hypotézy H 0 proti hypotéze H pak lze použít statistiku T = X µ 0 n, S kde µ 0 = 0 a n = 10. Postupně dostaneme Odtud µ = x = 0.670 MP a, σ = s = σ n 1. = 1.636 MP a. t =. 0.670 0. 10 = 1.295. 1.636 3. Za kritický obor W lze zvolit množinu W = t; t < t(n 1; 1 α 2 t > t(n 1; 1 α 2. Pro α = 0.05 je t(n 1; 1 α = t(9; 0.975 = 2.262, 2 odtud W = t; t < 2.262 t > 2.262. 4. Protože t W, nebyla na hladině významnosti 0.05 prokázána odlišnost ve výsledcích obou metod. Poznámka 2.4: Párový t-test Jednovýběrový t-test aplikovaný na porovnávání středních hodnot dvou veličin měřených na stejných objektech se nazývá párový t-test.
28 Některé parametrické testy 2.2 Testy o rozptylu normálního rozdělení Dále nás budou zajímat testy o rozptylu σ 2 náhodné veličiny X. Tj. budeme chtít neznámý rozptyl porovnávat s předem daným číslem σ 2 0. Potom mohou nastat podobně jako v odstavci 2.1 dvě situace - střední hodnotu µ známe; - střední hodnotu µ neznáme. Věnujme se opět nejprve prvnímu případu. 2.2.1 Testy o rozptylu při známé střední hodnotě Příklad 2.7: Navrhněte test statistické hypotézy H 0 : σ 2 = σ 2 0 proti hypotéze H : σ 2 < σ 2 0 na hladině významnosti α. Řešení: Protože nás zajímají testy o rozptylu σ 2 náhodné veličiny X, vyjdeme z nestranného odhadu roztylu, když známe střední hodnotu µ, tj. statistiky S 2 0. Jestliže je skutečný rozptyl náhodné veličiny X roven číslu σ 2 0, má náhodná veličina X rozdělení N(µ, σ 2 0. Tedy statistika T = ns2 0 σ0 2 má za podmínky σ 2 = σ0 2 rozdělení χ 2 (n (viz tvrzení 3.1 z předcházejícího modulu. V prospěch hypotézy H 0 budou zřejmě svědčit ty realizace (x 1,..., x n náhodného výběru (X 1,..., X n z rozdělení X, pro které bude realizace s 2 0 statistiky S0 2 blízká číslu σ0, 2 tj. pro které bude s2 0 blízké číslu jedna, tj. pro σ0 2 které bude realizace t statistiky T blízká číslu n (rozsahu výběru. Zvolme tedy T za testovou statistiku pro test hypotézy H 0. Nyní zbývá určit kritický obor pro test hypotézy H 0 proti hypotéze H na hladině významnosti α. V prospěch hypotézy H budou zřejmě svědčit ty realizace s 2 0, které budou dostatečně menší než číslo σ0, 2 tj. ty realizace t testové statistiky T, které budou dostatečně menší než číslo n. Zvolme tedy za kritický obor W pro test hypotézy H 0 proti hypotéze H množinu W = t; t < k, kde k je nějaká kladná konstanta menší než n. Číslo k vybereme tak, aby hladina významnosti testu byla α, tj. aby platilo Odtud (viz obrázek 2.2 α = P ( T W/H 0 = P ( T < k/σ 2 = σ 2 0. k = χ 2 (n;, α. Kritickým oborem W pro test hypotézy H 0 proti hypotéze H na hladině významnosti α je tedy množina W = t; t < χ 2 (n; α.
2.2 Testy o rozptylu normálního rozdělení 29 Obrázek 2.2: Volba kritického oboru W pro test hypotézy H 0 : σ 2 = σ 2 0 rozdělení N(µ, σ 2 se známou střední hodnotou µ proti hypotéze H : σ 2 < σ 2 0 na hladině významnosti α. Úkol 2.2: Navrhněte testy statistické hypotézy H 0 : σ 2 = σ 2 0 pro ostatní možné alternativy. Nakreslete si obrázky. Testy o rozptylu při známé střední hodnotě shrnuje následující tvrzení. Tvrzení 2.3: Testy o rozptylu při známé střední hodnotě Je-li (X 1, X 2,..., X n náhodný výběr z rozdělení X N(µ, σ 2 s neznámým rozptylem σ 2 a známou střední hodnotou µ a σ0 2 předem dané číslo, potom lze pro testy T 7 : hypotézy H 0 : σ 2 = σ0 2 proti hypotéze H : σ 2 > σ0, 2 T 8 : hypotézy H 0 : σ 2 = σ0 2 proti hypotéze H : σ 2 < σ0, 2 T 9 : hypotézy H 0 : σ 2 = σ0 2 proti hypotéze H : σ 2 = σ0 2 za testovou statistiku volit stejnou statistiku T = ns2 0, σ0 2 která má za platnosti σ 2 = σ0 2 rozdělení χ 2 (n. Za kritické obory W i (i = 7, 8, 9 pro testy T i (i = 7, 8, 9 na hladině významnosti α lze postupně volit množiny W 7 = t; t > χ 2 (n; 1 α, W 8 = t; t < χ 2 (n; α, W 9 = t; t < χ 2 (n; α 2 t > χ2 (n; 1 α 2. Jsou-li nulové hypotézy v testech T 7 a T 8 opačné k alternativním, zůstává tvrzení v platnosti. Příklad 2.8: Směrodatná odchylka zařízení na plnění lahví mléka nemá překročit 1 ml. Při kontrole byly zjištěny objemy 10 lahví v l:
30 Některé parametrické testy 1.0155 0.9874 1.0110 0.9952 1.0159 1.0281 0.9893 1.0052 1.0236 0.9871 Předpokládáme, že data pochází z normálního rozdělení se známou střední hodnotou µ = 1 l. Můžeme zařízení považovat za dostatečně přesné s přípustným rizikem omylu 1%? Řešení: Předpokládáme, že objem lahví je normální náhodná veličina se známou střední hodnotou 1 l a zajímá nás rozptyl. Předpoklady z tvrzení 2.3 jsou splněny. 1. Budeme testovat hypotézu H 0 : σ 2 0.01 2 l 2 proti hypotéze H : σ 2 > 0.01 2 l 2 na hladině významnosti 0.01. Můžeme použít test T 7, kde σ 2 0 = 0.01 2. 2. Testová statistika je tedy statistika Máme n = 10, µ = 1, potom T = ns2 0. σ0 2 s 2 0 = 1 10 10 i=1 (x i 1 2. = 2.45 10 4 l 2 = t. = 10 2.45 10 4 0.01 2. = 24.50. 3. Kritický obor W na hladině významnosti α je Pro α = 0.01 a n = 10 je W = t; t > χ 2 (n; 1 α. χ 2 (n; 1 α = χ 2 (10; 0.99 = 23.21 W = t; t > 23.21 4 Vzhledem k tomu, že t W, zamítáne nulovou hypotézu na hladině významnosti 0.01. Zařízení není dostatečně přesné. Riziko omylu je maximálně 1%. 2.2.2 Testy o rozptylu při neznámé střední hodnotě Pro testy o hodnotě rozptylu σ 2 normálního rozdělení nelze opět obecně použít tvrzení 2.3. Odhadem σ 2 při neznámé střední hodnotě je statistika S 2. Statistika (n 1S2 T = σ0 2 má za podmínky σ 2 = σ 2 0 rozdělení χ 2 (n 1 (viz tvrzení 3.1 z předcházejícího modulu. Když zvolíme T za testovou statistiku, pak kritické obory pro jednotlivé testy dostaneme zcela analogicky jako v odstavci 2.2.1. Budeme pracovat s rozdělením χ 2 (n 1 místo s rozdělením χ 2 (n.
2.3 P-hodnota testu 31 Tvrzení 2.4: Testy o rozptylu při neznámé střední hodnotě Je-li (X 1, X 2,..., X n náhodný výběr z rozdělení X N(µ, σ 2 s neznámým rozptylem σ 2 a neznámou střední hodnotou µ a σ0 2 předem dané číslo, potom lze pro testy T 10 : hypotézy H 0 : σ 2 = σ0 2 proti hypotéze H : σ 2 > σ0, 2 T 11 : hypotézy H 0 : σ 2 = σ0 2 proti hypotéze H : σ 2 < σ0, 2 T 12 : hypotézy H 0 : σ 2 = σ0 2 proti hypotéze H : σ 2 σ0 2 za testovou statistiku volit stejnou statistiku T = (n 1S2, σ0 2 která má za platnosti σ 2 = σ0 2 rozdělení χ 2 (n 1. Za kritické obory W i (i = 10, 11, 12 pro testy T i (i = 10, 11, 12 na hladině významnosti α lze postupně volit množiny W 10 = t; t > χ 2 (n 1; 1 α, W 11 = t; t < χ 2 (n 1; α, W 12 = t; t < χ 2 (n 1; α 2 t > χ2 (n 1; 1 α 2. Jsou-li nulové hypotézy v testech T 10 a T 11 opačné k alternativním, zůstává tvrzení v platnosti. Poznámka 2.5: Testy hypotéz o rozptylu normálního rozdělení nelze použít v případě, kdy se nejedná o normální rozdělení. Úkol 2.3: Řešte předchozí příklad za předpokladu, že neznáte skutečnou střední hodnotu. Výsledek: H 0 : σ 2 0.01 2, H : σ 2 > 0.01 2, σ = s. = 0.015, t. = 20.25, W = t; t > 21.67, t W. Nezamítáme H 0. Data nedávají dostatek argumentů pro to, abychom udělali závěr, že zařízení není dostatečně přesné (s rizikem omylu 0.01. 2.3 P-hodnota testu Při klasickém přístupu k tesování hypotéz, kterým jsme se doposud zabývali, je hladina významnosti testu α zvolena předem. Při testování hypotéz se však stále častěji používá postup, při kterém se určí nejmenší hladina, při které bychom ještě hypotézu H 0 zamítli -tzv. P - hodnota testu. Vyjadřuje nejmenší horní hranici pravděpodobnosti počítané za platnosti nulové hypo-
32 Některé parametrické testy tézy, že dostaneme právě naši realizaci t testové statistiky T nebo realizaci ještě více odporující nulové hypotéze. Tak se např. při provedení testů z tvrzení 2.2 vypočítá realizace t testové statistiky T = X µ 0 S a následně P -hodnota testu. V případě pravostranné alternativní hypotézy, tj. v případě testu T 4, svědčí proti nulové hypotéze ty realizace testové statistiky, které jsou větší než nějaká konstanta. Potom P = P (T > t/µ = µ 0. V případě levostranné alternativní hypotézy, tj. v případě testu T 5, dostaneme P = P (T < t/µ = µ 0. V případě oboustranné alternativní hypotézy, tj. v případě testu T 6, dostaneme P 2 = min P (T < t/µ = µ 0, P (T > t/µ = µ 0. Nakreslete si obrázky! Když zamítneme hypotézu H 0 a přijmeme hypotézu H, dopustíme se maximálně 100P procentního omylu. Je-li tedy např. P =0.04, zamítáme H 0 s rizikem omylu maximálně 4%. Tedy hypotézu H 0 na hladině významnosti 0.05 zamítáme a na hladině významnosti 0.01 nezamítáme. K výpočtu P hodnoty testu potřebujeme znát distribuční funkci testové statistiky T za platnosti nulové hypotézy. Vzhledem k tomu, že v běžných statistických tabulkách nejsou tabelovány hodnoty distribučních funkcí (kromě rozdělení N(0, 1, ale kvantily, nejsme v praktických úlohách obecně schopni vypočítat P - hodnotu testu bez použití speciálního software. n Příklad 2.9: Vraťte se k příkladu 2.2 a řešte jej pomocí P -hodnoty testu. Řešení: V příkladu 2.2 jsme testovali hypotézu H 0 : µ = 31MP a proti hypotéze H : µ < 31MP a. Jednalo se o test T 2 z tvrzení 2.1. Hypotézu H 0 jsme zamítli s rizikem omylu 5%. Realizace t testové statistiky T byla t = 2.899. Pro P - hodnotu testu dostáváme P = P (T < 2.899/µ = 31. Testová statistika T má podle tvrzení 2.1 za platnosti µ = 31 rozdělení N(0, 1 s distribuční funkcí Φ. Odtud P = Φ( 2.899 = 1 Φ(2.899. = 1 0.9981 = 0.0019. Tedy hypotézu H 0 zamítáme s maximálním rizikem omylu 0.19%. Úkol 2.4: Řešte úlol 2.1 pomocí P - hodnoty testu. Výsledek: Pro P -hodnotu testu platí P = 0.0014. Hmotnost pytlů cementu není 50kg, riziko omylu je 0.14%.
2.4 Souvislost mezi testy hypotéz a intervalovými odhady 33 Vidíme tedy, že při použití P -hodnoty můžeme získat přesnější závěry o zamítnutí H 0. Z toho důvodu většina statistických programů používá právě P -hodnotu testu, V anglicky psaných výstupech se P -hodnota označuje jako P -value, Sig. level, P a podobně. Pro provedení testů o střední hodnotě a rozptylu normální náhodné veličiny s oběma neznámými parametry můžeme využít např. STATGRAPHICS a to nabídku Describe Numeric Data One-Sample Analysis. 2.4 Souvislost mezi testy hypotéz a intervalovými odhady V předchozím modulu jsme se zabývali intervalovými odhady parametrů rozdělení, v této kapitole jsme se naučili testovat hypotézy o hodnotách těchto parametrů. Oba postupy spolu úzce souvisí. Uvažujme např. test T 11 z tvrzení 2.4 hypotézy H 0 : σ 2 = σ 2 0 proti hypotéze H : σ 2 < σ 2 0 na hladině výnamnosti α. Podle tvrzení 2.4 je testová statistika T = (n 1S2 σ 2 0 a kritický obor je množina W = W 11 = t; t < χ 2 (n 1; α. Hypotézu H 0 zamítneme právě tehdy, když (n 1s 2 σ 2 0 < χ 2 (n 1; α σ 2 0 > σ 2 0 (n 1s2 χ 2 (n 1; α ( (n 1s 2 0; χ 2 (n 1; α Tedy hypotézu H : σ 2 < σ 2 0 přijmeme (s rizikem omylu maximálně 100α%, když σ 2 0 neleží v realizaci 100(1 α% -ního pravostranného intervalového odhadu rozptylu normálního rozdělení s neznámou střední hodnotou µ. Pro test T 10 z tvrzení 2.4 bychom dostali, že hypotézu H : σ 2 > σ 2 0 přijmeme (s rizikem omylu maximálně 100α%, když σ 2 0 neleží v realizaci 100(1 α% -ního levostranného intervalového odhadu rozptylu normálního rozdělení s neznámou střední hodnotou µ. A podobně pro test T 12 z tohoto tvrzení hypotézu
34 Některé parametrické testy H : σ 2 σ 2 0 přijmeme (s rizikem omylu maximálně 100α%, když σ 2 0 neleží v realizaci 100(1 α% -ního oboustranného intervalového odhadu rozptylu normálního rozdělení s neznámou střední hodnotou µ. Při testování hypotéz o parametrech rozdělení jsme tedy místo kritických oborů mohli konstruovat příslušné intervaly spolehlivosti a o zamítnutí nebo nezamítnutí nulové hypotézy H 0 rozhodnout na základě výše naznačeného postupu. Příklad 2.10: Využijte při testování střední hodnoty v příkladu 2.5 postup testování pomocí intervalového odhadu. Řešení V příkladu 2.5 jsme testovali hypotézu H 0 : µ = 250 MPa proti hypotéze H : µ = 250 MPa na hladině významnosti 0.05 o střední hodnotě normálního rozdělení při neznámém rozptylu σ 2. Hypotézu H přijmeme s rizikem omylu 100α% právě tehdy, když µ 0 = 250 neleží v realizaci 100(1 α% - ního oboustranného intervalového odhadu střední hodnoty µ normálního rozdělení s neznámým rozptylem σ 2. Podle kapitoly 3 předchozího modulu dostaneme, že realizace 95 procentního oboustranného intervalového odhadu střední hodnoty µ je v našem případě interval 246.272, 249.478. Protože tento interval neobsahuje hodnotu µ 0 = 250, přijímáme hypotézu H s rizikem omylu 5%. 2.5 Kontrolní otázky 1. Jaké znáte testy o parametrech normálního rozdělení? 2. Jaké předpoklady musí splňovat jednovýběrový a párový t-test? 3. Lze použít testy o parametrech normálního rozdělení i v případě, že náhodný výběr nepochází z normálního rozděleni? 4. Jak testujeme pomocí P - hodnoty testu? 5. Jak testujeme pomocí intervalového odhadu? 2.6 Cvičení 1. Dlouhodobým statistickým šetřením bylo zjištěno, že průměrná rychlost autobusové linky je 40 km/h. Při změně trasy byly zjištěn následující průměrné rychlosti v (km/h: 41, 39, 42, 39, 43, 45, 40, 38. Ověřte na hladině významnosi 0.05, zda změna trasy vede ke zvýšení průměrné rychlosti. 2. Při odběru deseti vzorků posypového materiálu na dálnici byl získán následující soubor poměrných hodnot obsahu určité chemikálie vzhledem
2.6 Cvičení 35 k normovanému předpisu: 0.96, 0.73, 0.83, 0.55, 0.79, 1.34, 0.60, 1.19, 1.35, 1.13. Předpokládáme, že realizace pochází z normálního rozdělení. Ověřte na hladině významnosti 0.05, zda a střední hodnota obsahu je menší než 0.8; b směrodatná odchylka obsahu je menší než 0.2. 3. Pro kontrolu správnosti nastavení měřícího přístroje bylo provedeno 10 zkušebních měření se správnou hodnotou 20. Byly získány tyto výsledky: 20.23, 20.21, 20.19, 20.16, 20.26, 20.22, 20.23, 20.26, 20.23, 20.29. Předpokládáme, že chyba měření má normální rozdělení. Ověřte na hladině významnosti 0.05, zda je chyba měření zatížena systematickou chybou. 4. Měřicí přístroj nevykazuje systematické chyby. Při měření konstantní veličiny jsme zjistili následující chyby měření v mm: Třída n j Třída n j 1. -0.02-0.01 3 3. 0.00 0.01 9 2. -0.01 0.00 10 4. 0.01 0.02 4 Ověřte na hladině významnosti 0.01, zda je přesnost měřicího přístroje vyjádřená směrodatnou odchylkou 0.01 mm. 5. Osm náhodně vybraných domácností v sídlišti mělo v roce 2002 a 2003 spotřebu studené vody v m 3 na osobu: Domácnost 1 2 3 4 5 6 7 8 Spotřeba 2002 (X 1 23 29 10 15 20 21 23 13 Spotřeba 2003 (X 2 25 27 11 14 19 19 24 13 Ověřte na hladině významnosti 0.05, zda došlo u domácností sídliště ke snížení spotřeby studené vody. 6. Při výrobě stěnových panelů se předpokládá, že směrodatná odchylka jejich výšky je 3 mm. Z patnácti náhodně vybraných panelů byla odhadnuta směrodatná odchylka σ = s. = 3.74 mm. Předpokládáme, že výška panelů má přibližně normální rozdělení. Ověřte na hladině významnosti 0.01, zda je směrodatná odchylka skutečně 3 mm pomocí a klasického přístupu k testování hypotéz, b intervalového odhadu, c P-hodnoty testu. 7. Při sledování doby bezporuchového chodu určitého typu zařízení byly zjištěny následující výsledky v hodinách: 210, 65, 51, 174, 63, 263, 61, 72. Předpokládá se, že bezporuchový chod zařízení X má přibližně exponenciální rozdělení s parametry 0 a λ, tj. hustotu g(x = (1/λexp( x/λ pro x 0, pro jiná x je g(x = 0. Ověřte na hladině významnosti 0.05, zda je střední doba bezporuchového chodu zařízení větší než 70 hodin.
36 Některé parametrické testy 2.7 Klíč a výsledky cvičení Cvičení: 1. H 0 : µ 40, H : µ > 40, x = 40.875, s. = 2.357, t. = 1.050, W = t; t > 1.895, t W. Na hladině významnosti 0.05 se nepodařilo prokázat, že změna trasy vede ke zvýšení průměrné rychlosti. 2. x = 0.947, s. = 0.293. a H 0 : µ 0.8, H : µ > 0.8, t. = 1.587, W = t; t > 1.833, t W. Na hladině významnosti 0.05 se nepodařilo prokázat, že je střední hodnota obsahu větší než 0.8. b H 0 : σ 2 0.2 2, H : σ 2 > 0.2 2, t. = 19.316, W = t; t > 16.92, t W. Směrodatná odchylka obsahu je větší než 0.2 s rizikem omylu 5%. 3. H 0 : µ = 20, H : µ 20, x = 20.228, s. = 0.037, t. = 2.393, W = t; t < 2.262 t > 2.262, t W. Měřicí přístroj vykazuje systematické chyby. Riziko omylu je 5%. 4. H 0 : σ 2 = 0.01 2, H : σ 2 = 0.01 2, σ 2 = s 2. 0 = 7.88 10 5, t =. 20.488, W = t; t < 11.16 t > 48.29, t W. Na hladině významnosti 0.01 nezamítáme hypotézu, že je přesnost měřícího přístroje vyjádřená směrodatnou odchylkou 0.01. 5. H 0 : µ = E(X 2 E(X 1 0, H : µ < 0, µ = x = 0.250, σ = s =.. 1.488, t = 0.475, W = t; t < 1.895, t W. Zjištěné údaje nepotvrzují zmenšení spotřeby vody. 6. H 0 : σ 2 = 3 2, H : σ 2 3 2. a t = 21.76, W = t; t < 4.075 t > 31.32, t W. Nezamítáme hypotézu, že je směrodatná odchylka rovna 3 mm. b 3 2.500, 6.932. Hypotézu H 0 nezamítáme. c P = 2(1 P (T < 21.76/σ 2 = 3 2 (0.1, 0.2. P- hodnota testu je větší než 0.01, hypotézu H 0 na hladině významnosti 0.01 nezamítáme, riziko mylného zamítnuti je větší než 10%. 7. Zajímá nás střední hodnota bezporuchového chodu zařízení X. Protože náhodná veličina X nemá normální rozdělení a rozsah výběru je menší než 30, nemůžeme použít testy o střední hodnotě normálního rozdělení. Protože E(X = λ, zajímají nás testy o parametru λ exponenciálního rozdělení. Bodovým odhadem parametru λ je X. V literatuře (např. [12] nalezneme, že statistika T = 2nX λ 0 má za platnosti λ = λ 0 rozdělení χ 2 (2n (v našem případě λ 0 = 70. Testujeme H 0 : λ 70, H : λ > 70. Statistiku T zvolíme za testovou statistiku. Potom W = t; t > χ 2 (2n; 1 α, x = 119.875, t = 27.4, W = t; t > 26.3, t W. Střední doba bezporuchového chodu zařízení je větší než 70 hodin s rizikem omylu maximálně 5%.
Kapitola 3 Testy dobré shody Cíle Po přečtení a nastudování této kapitoly budete umět testovat nulovou hypotézu, že náhodný výběr o dostatečně velkém rozsahu pochází ze stanoveného rozdělení. Doba potřebná ke studiu K nastudování a pochopení této kapitoly budete potřebovat minimálně 3 hodiny. Klíčová slova Pearsonův χ 2 - test dobré shody (čtěte chí-kvadrát. V teorii pravděpodobnosti jsme předpokládali, že známe zákon rozdělení náhodné veličiny X, tj. známe její distribuční funkci, resp. rozdělovací funkci. V matematické statistice jsme pak dosud předpokládali, že známe typ rozdělení až na nějaké parametry ϑ 1, ϑ 2,..., ϑ m. K úplné znalosti rozdělení náhodné veličiny X pak v této situaci stačilo tyto parametry odhadnout. Pokud si však rozdělením, resp. tvarem rozdělení nejsme jisti, je zapotřebí testovat, zda není předpoklad o tvaru rozdělení chybný. Připomeňme v této souvislosti histogram a úsečkový diagram rozdělení četností z kapitoly 1 předchozího modulu. Podle jejich tvaru lze usuzovat na tvar rozdělovací funkce náhodné veličiny X. K tomu je samozřejmě vhodné znát grafy některých důležitých rozdělovacích funkcí, abychom měli histogram, resp. úsečkový diagram s čím srovnávat. Tak např. z histogramu rozdělení relativních četností pevnosti betonu z příkladu 1.5 kapitoly 1 předchozího modulu se lze domnívat, že pevnost betonu bude mít normální a ne např. exponenciální rozdělení. Podobně z úsečkového diagramu rozdělení absolutních četností počtu aut čekajících na zelenou z následujícího příkladu téže kapitoly nebudeme asi usuzavat na to, že má počet aut klasické rozdělení. Ve cvičení k této kapitole budete testovat hypotézu, zda má Poissonovo rozdělení. Tyto tzv. grafické metody však slouží pouze k vytvoření domněnky o tvaru rozdělení. Je-li vytvořena hypotéza (domněnka o tvaru rozdělení náhodné veličiny X, přejdeme
38 Testy dobré shody k některému z testů, kterým tuto hypotézu nezamítneme, resp. zamítneme s dostatečně malým rizikem omylu. Tyto testy nazýváme testy (dobré shody. My se zde budeme zabývat pouze jedním testem shody - a to Pearsonovým χ 2 -testem dobré shody. Je zapotřebí si uvědomit, že hypotézu, vytvořenou z určité realizace náhodného výběru z X, bychom správně měli ještě ověřit na jiné realizaci náhodného výběru z X. Pro použití Pearsonova testu dobré shody je zapotřebí znát jeho podstatu, vyspělejší uživatel statistiky pak může využít nějaký statistický software např. STATGRAPHICS, kde má možnost použít testy dobré shody v případě porovnávání s 22 základními typy rozdělení (viz nabídka Describe Distribution Fitting. Přitom testování je založeno na P -hodnotě testu. My zde provedeme výklad klasického přístupu. Domníváme se, že náhodná veličina X má rozdělovací funkci g(x; ϑ 1,..., ϑ m, kde ϑ 1,..., ϑ m jsou neznámé parametry. Připouštíme i m = 0, tj. že rozdělovací funkce je g(x a nejsou v ní obsaženy žádné neznámé parametry. Je-li m 1, použijeme realizaci (x 1, x 2,..., x n náhodného výběru (X 1, X 2,..., X n z X pro výpočet realizací odhadů parametrů ϑ 1, ϑ 2,..., ϑ m - označme je ϑ 1, ϑ 2,..., ϑ m. Realizace odhadů dosadíme za parametry do rozdělovací funkce g, dostaneme rozdělovací funkci g(x; ϑ 1, ϑ 2,..., ϑ m, která již neobsahuje neznámé parametry. Pearsonův test dobré shody je pak test hypotézy H 0 : X má rozdělovací funkci g(x; ϑ 1, ϑ 2,..., ϑ m proti hypotéze H: X nemá rozdělovací funkci g(x; ϑ 1, ϑ 2,..., ϑ m pro žádný z možných parametrů ϑ 1, ϑ 2,..., ϑ m na hladině významnosti α. Dále budeme stručně psát, že testujeme H 0 : X g(x; ϑ 1, ϑ 2,..., ϑ m proti H : X g(x; ϑ 1, ϑ 2,..., ϑ m. Příklad 3.1: Domníváme se, že náhodná veličina X má rozdělení 1 N(0, 1, 2 N(µ, 1, 3 N(µ, σ 2. V situaci 1 nejsou v rozdělení žádné neznáme parametry, tedy m = 0. V situaci 2 máme jeden neznámý parametr µ, tedy m = 1. Musíme vypočítat realizaci µ odhadu µ. V situaci 3 máme m = 2 a musíme vypočítat realizace µ a σ 2 odhadů parametrů µ a σ 2. Potom bychom v jednotlivých situacích testovali hypotézy 1 H 0 : X N(0, 1 proti H : X N(0, 1, 2 H 0 : X N( µ, 1 proti H : X N(µ, 1 pro žádné µ R, 3 H 0 : X N( µ, σ 2 proti H : X N(µ, σ 2 pro žádné (µ, σ 2 R (0,. V případě zamítnutí hypotézy H 0 v testu 1 nemá veličina X normální rozdělení s parametry 0 a 1, ale může mít normální rozdělení s jinými parametry. V případě zamítnutí hypotézy H 0 v testu 2 nemá veličina X normální rozdělení s rozptylem 1, ale může mít normální rozdělení s rozptylem různým od čísla 1. A v případě zamítnutí hypotézy H 0 v testu 3 nemá veličina X normální rozdělení.
39 Postup při samotném testu je pak následující: Předpokládáme, že platí hypotéza H 0, tj. že náhodná veličina X má rozdělovací funkci g(x; ϑ 1, ϑ 2,..., ϑ m. Obor hodnot náhodné veličiny X rozdělíme do k disjunktních tříd Ω j (j = 1, 2,..., k a to zpravidla následovně: intervalů v případě spojité náhodné veličiny; jednobodových, resp. vícebodových množin obsahujících body oboru hodnot náhodné veličiny X v případě diskrétní náhodné veličiny. Označme N j absolutní četnost třídy Ω j, tj. počet veličin X 1, X 2,..., X n, které nabudou hodnoty z třídy Ω j pro j = 1, 2,..., k. Uvědomme si, že N j je pro každé j náhodnou veličinou. Zřejmě Označme dále N 1 + N 2 + + N k = n. p j = P ( X Ω j /H 0, j = 1, 2,..., k. (3.1 Zdůrazněme, že pravděpodobnosti p j počítáme za předpokladu platnosti hypotézy H 0. Protože Ω 1 Ω 2 Ω k = Ω, platí p 1 + p 2 + + p k = 1. Za testovací kritérium zvolil K. Pearson statistiku T = k (N j np j 2 j=1 np j, (3.2 která má za platnosti hypotézy H 0 při dostatečně velkém rozsahu výběru n přibližně rozdělení χ 2 (k m 1. Dostatečná velikost rozsahu n je zaručena tím, že lze realizaci náhodného výběru z X roztřídit do tříd Ω j tak, že np j 1 pro každé j, (3.3 np j 5 pro alespoň 80% j. (3.4 Pearsonův test dobré shody by se měl tedy používat v případě splnění podmínek (3.3 a (3.4. Zbývá určit kritický obor pro test hypotézy H 0 proti hypotéze H. Kdyby platila hypotéza H 0, pak by pravděpodobnost, že výsledek pokusu X nabude hodnoty ze třídy Ω j, byla p j (viz vztah (3.1. Odhad pravděpodobnosti, že
40 Testy dobré shody výsledek pokusu padne do třídy Ω j, je zřejmě počet příznivých výsledků ku celkovému počtu možných výsledků - tedy náhodná veličina N j /n. Takže v prospěch hypotézy H 0 svědčí ty realizace n j /n veličiny N j /n, které jsou dostatečně blízké číslu p j, tj. pro které n j /n =.. p j, tj. pro které n j = npj pro každé j = 1,..., k. Číslo n j se někdy v této souvislosti nazývá empirická četnost třídy Ω j a číslo np j pak teoretická četnost třídy Ω j. V prospěch hypotézy H 0 svědčí tedy ty realizace t testové statistiky T, které jsou blízké číslu nula. Odtud dostáváme, že kritický obor W pro test hypotézy H 0 proti hypotéze H na hladině významnosti α je množina W = t; t > χ 2 (k m 1; 1 α. (3.5 Vraťme se nyní k výpočtu pravděpodobností p j (j = 1, 2,..., k. V případě spojité náhodné veličiny X je třída Ω j interval. Označme jeho krajní body jako a j 1, a j pro j = 1,..., k. Potom p j = P ( X Ω j /H 0 = P ( aj 1 < X < a j /H 0 = a j a j 1 g(x; ϑ 1, ϑ 2,..., ϑ m dx pro j = 1, 2,..., k. Výhodnější pro výpočty se často jeví vyjádřit nejprve v hypotéze H 0 z hustoty g distribuční funkci G náhodné veličiny X a pak teprve počítat p j. Zřejmě potom G(x; ϑ 1, ϑ 2,..., ϑ m = x g(v; ϑ 1, ϑ 2,..., ϑ m dv, p j = G(a j ; ϑ 1, ϑ 2,..., ϑ m G(a j 1 ; ϑ 1, ϑ 2,..., ϑ m pro j = 1, 2,..., k. V případě diskrétní náhodné veličiny X je Ω j jednobodová nebo vícebodová podmnožina oboru hodnot veličiny X, potom p j = P ( X Ω j /H 0 = x Ω j g(x; ϑ 1, ϑ 2,..., ϑ m pro j = 1, 2,..., k. Příklad 3.2: Při zavádění internetu do domácností se předpokládá zájem 20%. Z 80 náhodně vybraných domácností velkého sídliště projevilo zájem o internet 10. Potvrzuje tento průzkum původní předpoklad? Přípustné riziko omylu je 5 %. Řešení: Označme 0 domácnost nebude mít zájem o internet, X = 1 domácnost bude mít zájem o internet. Máme ověřit, zda P (X = 1 = 0.2. Náhodná veličina X má za tohoto předpokladu alternativní rozdělení s parametrem p = 0.2, tj. pravděpodobnostní
41 funkci 1. Budeme testovat hypotézu 0.8 pro x = 0, g(x = 0.2 pro x = 1, 0 jinak. H 0 : X g(x proti hypotéze H : X g(x na hladině významnosti 0.05. 2. Test hypotézy o parametru p alternativního rozdělení jsme převedli na test o rozdělení náhodné veličiny X. Realizaci náhodného výběru z X máme roztříděnou do k = 2 tříd Ω 1 = 0, Ω 2 = 1 - viz sloupec 2 a 3 tabulky 3.1. Do této tabulky zapisujeme i další výsledky. Budeme chtít použít Pearsonův test dobré shody. Pro výpočet realizace testové statistiky (3.2 a k ověření podmínek použitelnosti testu (3.3 a (3.4 musíme vypočítat teoretické pravděpodobnosti (3.1, tj. p j = P ( X Ω j /H 0 pro j = 1, 2. Platí-li hypotéza H 0, má náhodná veličina X rozdělovací funkci g a tedy p 1 = P (X = 0/H 0 = 0.8, p 2 = P (X = 1/H 0 = 0.2. Odtud pro teoretické četnosti np j dostaneme np 1 = 64, np 2 = 16. Podmínky použitelnosti Pearsonova testu jsou tedy splněny. Vypočítáme realizaci t testové statistiky (3.2, tj. statistiky T = k (N j np j 2 j=1 - výpočty jsou v tabulce 3.1. V posledním řádku tabulky jsou prováděny součty (tam, kde to má smysl jednak pro kontrolu výpočtů (sloupce 3-5 a jednak pro samotný výpočet realizace t testové statistiky T (sloupec 6. Tedy t = 2 j=1 (n j np j 2 np j = np j (70 642 64 = 0.5625 + 2.2500 = 2.8125. + (10 162 16 3. Kritický obor W pro Perasonův test dobré shody na hladině významnosti α je (3.5, tj. W = t; t > χ 2 (k m 1; 1 α. Vzhledem k tomu, že počet tříd je dva (tj. k = 2, v rozdělení g nejsou neznámé parametry (tj. m = 0 a α = 0.05, dostaneme W = t; t > χ 2 (1; 0.95 = t; t > 3.842.
42 Testy dobré shody Tabulka 3.1: Třída n j p j np j (n j np j 2 np j Ω 1 0 70 0.8 64 0.5625 Ω 2 1 10 0.2 16 2.2500 Součet 80 1 80 2.8125 4. Protože t W, hypotézu H 0 na hladině významnosti 0.05 nezamítáme. Výsledky testu nejsou statisticky významné na hladině významnosti 0.05. Data nedávají dostatek argumentů pro to, abychom udělali závěr, že předpokládaný zájem o zavedení internetu do domácností není 20%. Vraťme se ještě k tabulce 3.1. Ve sloupci 5 jsou uvedena čísla np j, tj. teoretické četnosti tříd Ω j, ve sloupci 3 jsou pak uvedeny empirické četnosti n j. Kdyby platila hypotéza H 0, pak by v první třídě mělo být přibližně 64 výsledků a v druhé třídě přibližně 16 výsledků. Tj. za platnosti nulové hypotézy by o internet z 80 domácností nemělo mít zájem přibližně 64 a mělo mít zájem přibližně 16 domácností. Příklad 3.3: Prohlídkou pěti set tabulí skla byly zjištěny tyto počty bublin v jednotlivých tabulích Počet bublin 0 1 2 3 4 a více Počet tabulí 246 181 64 7 2. Ověřte na hladině významnosti 0.05, zda má počet bublin v tabuli skla Poissonovo rozdělení. Řešení: Náhodnou veličinou X je zde počet bublin v tabuli skla. Máme ověřit, zda má náhodná veličina Poissonovo rozdělení. Budeme chtít použít χ 2 test dobré shody. K dispozici máme realizaci náhodného výběru z X o rozsahu n = 500, která byla roztříděna do pěti tříd. V první řadě si uvědomme, že empirická četnost v poslední třídě je velmi malá. Dá se očekávat, že by i teoretická četnost odpovídající této třídě byla velmi malá, a proto sloučíme poslední dvě třídy. Východiskem pro výpočy jsou tedy sloupce 2 a 3 tabulky 3.2. Domníváme-li se, že má náhodná veličina X Poissonovo rozdělení, tj. X P o(λ, neznáme v rozdělovací funkci veličiny X parametr λ, proto jej musíme nejprve odhadnout. Z teorie pravděpodobnosti víme, že E(X = λ, z kapitoly 2 předchozího modulu víme, že nestranným odhadem E(X = λ je X. Vypočítejme tedy z dat v tabulce 3.2 realizaci λ = x tohoto odhadu parametru λ. Dostaneme λ = x = 0.672.
43 Tabulka 3.2: (n Třída Počet bublin n j p j np j np j 2 j Ω 1 0 246 0.511 255.5 0.353 Ω 2 1 181 0.343 171.5 0.526 Ω 3 2 64 0.115 57.5 0.735 Ω 4 3 a více 9 0.031 15.5 2.726 Součet 500 1.000 500.0 4.340 np j 1. Budeme testovat hypotézu H 0 : X P o(0.672 proti hypotéze H : X P o(λ na hladině významnosti 0.05. 2. Předpokládejme tedy, že platí hypotéza H 0, tj. náhodná veličina X má pravděpodobnostní funkci 0.672 x e 0.672 g(x = pro x = 0, 1, 2,..., x! 0 jinak. Pro výpočet testové statistiky χ 2 -testu dobré shody a ověření podmínek jeho použitelnosti potřebujeme vypočítat teoretické pravděpodobnosti (3.1. Postupně dostaneme p 1 = P ( ( 0.672 0 e 0.672 X Ω 1 /H 0 = P X = 0/H0 = g(0 = 0! p 2 = P ( ( 0.672 1 e 0.672 X Ω 2 /H 0 = P X = 1/H0 = g(1 = 1! p 3 = P ( ( 0.672 2 e 0.672 X Ω 3 /H 0 = P X = 2/H0 = g(2 = 2! p 4 = P ( ( ( X Ω 3 /H 0 = P X 3/H0 = 1 P X < 3/H0 = 1 [ P ( X = 0/H 0 + P ( X = 1/H0 + P ( X = 2/H0 ] = 1 [ g(0 + g(1 + g(2 ]. = 0.031.. = 0.511,. = 0.343,. = 0.115, Výsledky jsou uvedeny ve sloupci 4 tabulky 3.2. Ze sloupce 5 téže tabulky plyne, že jsou splněny podmínky použitelnosti χ 2 testu (3.3 a (3.4. Přejděme tedy k výpočtu realizace t testové statistiky (3.2, dostaneme t = 4 j=1 (n j np j 2. (246 255.5 2 (9 15.52 = + + np j 255.5 15.5. = 4.340 (viz součet v posledním sloupci tabulky 3.2.
44 Testy dobré shody 3. Kritický obor W pro χ 2 - test na hladině významnosti α je (3.5, tj. W = t; t > χ 2 (k m 1; 1 α. Máme k = 4, m = 1, α = 0.05, dostaneme W = t; t > χ 2 (2; 0.95 = t; t > 5.992. 4. Protože t W, nezamítáme hypotézu H 0 na hladině významnosti 0.05, tj. nezamítáme hypotézu o shodě s Poissonovým rozdělením. Příklad 3.4: Ověřte na hladině významnosti 0.01, resp. 0.05, zda má náhodná veličina X rozdělovací funkci 3x 2 pro x (0, 1, g(x = 0 jinak. Realizace náhodného výběru z X byla roztříděna následovně: Interval 0.0 0.2 0.2 0.4 0.4 0.6 0.6 0.8 0.8 1.0 Počet výsledků 4 10 16 29 41 Řešení: 1. Budeme testovat hypotézu H 0 : X g(x proti hypotéze H 0 : X g(x na hladině významnosti 0.01, resp. 0.05. 2. Budeme chtít použít χ 2 - test dobré shody. Předpokládejme tedy, že platí hypotéza H 0, tj. náhodná veličina X má hustotu g. K dispozici máme realizaci náhodného výběru z X o rozsahu n = 100, která je roztříděna do pěti intervalů - označme je Ω j (j = 1,..., 5. Nejprve vypočítáme pravděpodobnosti (3.1, tj. p j = P ( X Ω j /H 0 pro j = 1,..., 5. Označme a j 1, a j krajní body intervalu Ω j pro j = 1,..., 5. Potom p j = P ( X Ω j /H 0 = P ( aj 1 < X < a j /H 0 pro j = 1,..., 5. Pravděpodobnosti p j budeme počítat pomocí distribuční funkce G náhodné veličiny X. Postupně dostaneme 0 pro x (, 0, x x G(x = g(v dv = 3v 2 dv = x 3 pro x (0, 1, 0 1 pro x 1,.
45 Potom p j = G(a j G(a j 1 pro j = 1,..., 5. Tedy p 1 = G(a 1 G(a 0 = G(0.2 G(0.0 = 0.008 0.000 = 0.008, p 2 = G(a 2 G(a 1 = G(0.4 G(0.2 = 0.064 0.008 = 0.056,. p 5 = G(a 5 G(a 4 = G(1.0 G(0.8 = 1.000 0.512 = 0.296. Vypočítané hodnoty G(a j v horních hranicích intervalů Ω j jsou ve sloupci 4, hodnoty p j jsou ve sloupci 5 tabulky 3.3. Ze sloupce 6 téže tabulky je patrné, že není splněna první podmínka (3.3 použitelnosti χ 2 - testu shody. Tento nedostatek lze v naší situaci odstranit tak, že sloučíme první a druhou třídu, dostaneme tak prvních šest sloupců v tabulce 3.4. Obecně se to však podařit nemusí. V praxi se pokládá za dostačující, aby byl rozsah výběru větší než 50. Nyní můžeme přistoupit k samotnému provedení χ 2 - testu dobré shody. Tabulka 3.3: Třída a j 1 a j n j G(a j p j np j Ω 1 0.0 0.2 4 0.008 0.008 0.8 Ω 2 0.2 0.4 10 0.064 0.056 5.6 Ω 3 0.4 0.6 16 0.216 0.152 15.2 Ω 4 0.6 0.8 29 0.512 0.296 29.6 Ω 5 0.8 1.0 41 1.000 0.488 48.8 Součet 100 1.000 100.0 Tabulka 3.4: Třída a j 1 a j n j G(a j p j np j (n j np j 2 Ω 1 0.0 0.4 14 0.064 0.064 6.4 9.025 Ω 2 0.4 0.6 16 0.216 0.152 15.2 0.042 Ω 3 0.6 0.8 29 0.512 0.296 29.6 0.012 Ω 4 0.8 1.0 41 1.000 0.488 48.8 1.247 Součet 100 1.000 100.0 10.326 np j
46 Testy dobré shody Realizace t testové statistiky (3.2 je t = + 4 j=1 (n j np j 2 np j = (41 48.82 48.8 (14 6.42 6.4 + (16 15.22 15.2 + (29 29.62 29.6 = 9.025 + 0.042 + 0.012 + 1.247 = 10.326 3. Kritický obor W α pro χ 2 - test na hladině významnosti α je (3.5, tj. W α = t; t > χ 2 (k m 1; 1 α. V hustotě g v hypotéze H 0 nebyly žádné neznámé parametry, tj. m = 0. Realizaci náhodného výběru z X máme přerozdělenou do čtyř tříd, tj. k = 4. Tedy W α = t; t > χ 2 (3; 1 α. Pro α = 0.01 a α = 0.05 dostáváme W 0.01 = t; t > χ 2 (3; 0.99 = W 0.05 = t; t > 11.35, t; t > χ 2 (3; 0.95 = t; t > 7.815. 4. Protože t W 0.01, nezamítáme hypotézu H 0 na hladině významnosti 0.01. Protože t W 0.05, zamítáme hypotézu H 0 na hladině významnosti 0.05. Tedy na této hladině významnosti přijímáme hypotézu H, tj. realizace náhodného výběru nepochází z rozdělení s hustotou g, riziko omylu je 5%. Příklad 3.5: Vraťte se k příkladu 8 ze cvičení kapitoly 1 předchozího modulu a zjistěte, zda je vlhkost stavebního materiálu Hobrex normální náhodná veličina. Přípustné riziko omylu je 5%. Řešení: Náhodnou veličinou X je vlhkost stavebního materiálu Hobrex. Domníváme-li se, že X je normální náhodná veličina, tj. X N(µ, σ 2, neznáme v rozdělovací funkci náhodné veličiny X dva parametry µ a σ 2, které musíme nejprve odhadnout. K dispozici máme realizaci náhodného výběru z X o rozsahu n = 100, která byla roztříděna do pěti tříd Ω j j = 1,..., 5. Realizace µ a σ odhadů µ a σ jste počítali v příkladu 8. Dostali jste 1. Budeme testovat hypotézu µ = x = 22.12 [%], σ = s. = 0.86 [%]. H 0 : X N(22.12, 0.86 2 proti hypotéze H : X N(µ, σ 2 na hladině významnosti 0.05.
47 2. Předpokládejme tedy, že X N(22.12, 0.86 2. K ověření podmínek použitelnosti Pearsonova testu a provedení samotného testu potřebujeme vypočítat pravděpodobnosti (3.1, tj. p j = P ( X Ω j /H 0. Označme opět a j 1, a j krajní body intervalu Ω j pro j = 1,..., 5. Potom p j = P ( a j 1 < X < a j /H 0. Platí-li hypotéza H 0, má veličina X rozdělení N(22.12, 0.86 2. Označme její distribuční funkci F a vyjádřeme ji pomocí distribuční funkce Φ rozdělení N(0, 1, jejíž hodnoty jsou tabelovány. Potom ( x 22.12 X N(22.12, 0.86 2 F (x = Φ. 0.86 Odtud pro j = 1, 2,..., 5 platí p j = P ( a j 1 < X < a j /H 0 = F (aj F (a j 1 ( aj 22.12 ( aj 1 22.12 = Φ Φ. 0.86 0.86 Stačí tedy pomocí tabulek distribuční funkce Φ rozdělení N(0, 1 určit hodnoty distribuční funkce Φ( a j 22.12. Výsledky jsou uvedeny ve 0.68 sloupci 6 tabulky 3.5. Potom ( a1 22.12 ( a1 22.12 p 1 = Φ Φ( = Φ = Φ( 1.59 = 0.0559, 0.86 0.86 ( a2 22.12 ( a1 22.12 p 2 = Φ Φ = Φ( 0.43 Φ( 1.59 0.86 0.86 = 0.3336 0.0559 = 0.2777,. ( a4 22.12 p 5 = Φ( Φ = 1 Φ(2.6 = 1 0.9712 = 0.0288. 0.86 Hodnoty p j jsou uvedeny ve sloupci 6 téže tabulky. Ze sloupce 7 je patrné, že jsou splněny podmínky použitelnosti χ 2 - testu, tj. podmínky (3.3 a (3.4. Ze sloupce 8 dostáváme realizaci t testové statistiky (3.2 χ 2 - testu, tj. 5 (n j np j 2. t = = 0.518. np j j=1 3. Kritický obor W pro χ 2 - test shody na hladině významnosti α je (3.5, tj. W = t; t > χ 2 (k m 1; 1 α. Máme k = 5, m = 2, α = 0.05, dostaneme W = t; t > χ 2 (2; 0.95 = t; t > 5.992. 4. Protože t W, nezamítáme hypotézu H 0 na hladině významnosti 0.05, tj. nezamítáme hypotézu o shodě s normálním rozdělením.
48 Testy dobré shody Tabulka 3.5: Třída a j 1 a j n j a j x s Φ( a j x s p j np j (n j np j 2 np j Ω 1 20.75 5-1.59 0.0559 0.0559 5.59 0.062 Ω 2 20.75 21.75 27-0.43 0.3336 0.2777 27.77 0.021 Ω 3 21.75 22.75 46 0.73 0.7673 0.4337 43.37 0.159 Ω 4 22.75 23.75 20 1.90 0.9712 0.2039 20.39 0.007 Ω 5 23.75 2 1.0000 0.0288 2.88 0.269 Součet 100 1.0000 100.00 0.518 3.1 Kontrolní otázky 1. Jaký je postup při Pearsonově testu dobré shody? 2. Jaké podmínky by měly být splněny pro použití Pearsonova testu dobré shody? 3. Co znamenají čísla k a m ve vztahu (3.5? 4. Proč nelze pro test shody použít statistiku T = k j=1 (N j np j? 3.2 Cvičení 1. Cestovní kancelář předpokládá, že ze zákazníků, kteří mají zájem o pobytový zájezd u moře, bude mít 25% zájem pouze o snídani, 50% o polopenzi a 10% o plnou penzi. Pro ověření tohoto předpokladu náhodně vybrali 100 zájemců o tento druh zájezdu a zjistili, že 20 má zájem pouze o snídani, 46 o polopenzi a 9 o plnou penzi. Můžeme na hladině významnosti 0.05, resp. 0.01 považovat předpoklad cestovní kanceláře za správný? 2. Při parlamentních volbách získaly dvě nejsilnější strany 30% a 20% hlasů, zbytek byl rozdělen mezi ostatní strany. Při volbách do obecního zastupitelstva v jedné obci získaly tyto strany postupně 1400 a 900 z 5000 odevzdaných hlasů. Ověřte na hladině významnosti 0.05, zda rozdělení hlasů při místních volbách odpovídá výsledkům při parlamentních volbách. 3. Posuďte charakter následujících úloh a řešte je: a Je známo, že 50% výrobků je I. jakosti, 40% výrobků je II. jakosti a 10% výrobků je vadných. Jaká je pravděpodobnost, že z 60 náhodně vybraných výrobků budou 3 vadné? b Z 60 náhodně vybraných výrobků bylo 28 I. jakosti, 29 II. jakosti a 3 vadné.
3.3 Klíč a výsledky cvičení 49 1. V jakém rozmezí lze očekávat s pravděpodobností 0.95 podíl vadných výrobků? 2. Lze tvrdit, že podíl vadných výrobků je 10%? Přípustné riziko omylu je 5%. 3. Má výrobce pravdu, když tvrdí, že 50% výrobků je I. jakosti, 40% výrobků je II. jakosti a zbývající nevyhovující? 4. Ověřte na hladině významnosti 0.05, zda realizace náhodného výběru roztříděná do následující tabulky pochází z rozdělení s hustotou f(x = a(1 + x 2 pro x ( 1, 1 a f(x = 0 pro jiná x. Interval -1.0-0.5-0.5 0.0 0.0 0.5 0.5 1.0 Četnost 20 4 7 21 5. Předpokládáme, že u 42 náhodně vybraných elektronických prvků určitého typu byla změřena životnost (v hodinách a výsledky byly roztříděny do následující tabulky: Doba 0 1000 1000 2000 2000 3000 3000 4000 4000 5000 5000 6000 Četnost 13 17 5 3 3 1 Ověřte na hladině významnosti 0.01, zda lze životnost tohoto typu prvků považovat za náhodnou veličinu s exponenciálním rozdělením. 6. Máme ověřit na hladině významnosti 0.05, zda jsou okamžiky vzniku zmetků při výrobě rovnoměrně rozděleny během osmihodinové pracovní doby. Za tím účelem byl určitou dobu sledován vznik zmetků během této pracovní doby, výsledkem byly okamžiky vzniku 80 zmetků. Tyto okamžiky byly roztříděny do osmi 1-hodinových intervalů a zjistily se následující četnosti: Hodina 1 2 3 4 5 6 7 8 Četnost 10 15 20 10 8 7 5 5 7. Zjistěte, zda lze pro pevnost betonu v příkladě 1.5 kapitoly 1 předchozího modulu použít model normálního rozdělení. Přípustné riziko omylu je 1%. 8. Ověřte na hladině významnosti 0.05, zda se počet aut čekajících na zelenou v příkladu 1.4 kapitoly 1 předchozího modulu řídí Poissonovým rozdělením. 3.3 Klíč a výsledky cvičení Otázky: 4. Protože T = 0. Cvičení:
50 Testy dobré shody. 1. t = 8.087, W 0.01 = t; t > 11.35, W 0.05 = t; t > 7.815. Na hladině významnosti 0.05, resp. 0.01 zjištěné údaje dávají, resp. nedávají dostatek argumentů, abychom udělali závěr, že předpoklad cestovní kanceláře je nesprávný. 2. t. = 32.667, W = t; t > 5.992. Rozdělení hlasů při místních volbách neodpovídá rozdělení hlasů při parlamentních volbách. Riziko omylu je 5%. 3. a Tato úloha je pravděpodobnostní. Je-li X počet vadných výrobků mezi 60 výrobky, potom X Bi(n = 60, p = 0.1, odtud P (X = 3 = 0.084. Z 60 náhodně vybraných výrobků budou 3 vadné s pravděpodobností 0.084. b Všechny úlohy jsou z oblasti matematické statistiky. 1. Jde o konstukci 95 procentního inervalového odhadu parametru p (střední hodnoty alternativního rozdělení. Vzhledem k tomu, že n > 30, lze použít inervalový odhad střední hodnoty rozdělení N(µ, σ 2. Dostaneme x = 0.05, s =. 0.286, 0 p 0.106. 2. Jde o úlohu testování hypotéz o parametru p alternativního rozdělení. Vzhledem k tomu, že 0.1 0, 0.106, na hladině významnosti 0.05 nezamítáme hypotézu, že podíl vadných výrobků je 10%. 3. Jedná se o test hypotézy o rozdělení náhodné veličiny, tj. testy. shody. Protože t = 2.675, W = t; t > 5.992, nezamítáme hypotézu, že výrobce má pravdu. 4. Konstanta a v tomto případě není parametrem rozdělení, ale na základě vlastností hustoty dostaneme a = 3/8. Potom H 0 : X f(x = (3/8(1 + x 2 pro x ( 1, 1, f(x = 0 pro jiné x, H: X f(x, t. = 8.613, W = t; t > 7.815. Realizace náhodného výběru nepochází z rozdělení s hustotou f. Riziko omylu je 5%. 5. Náhodná veličina X má exponenciální rozdělení s parametrem λ, jestliže má distribuční funkci F (x = 1 exp( x pro x 0, F (x = 0 pro jiná λ x. Platí E(X = λ, odtud λ = x =. 1762, t =. 5.956, W = t; t > 9.21. Nezamítáme shodu s exponenciálním rozdělením. 6. H 0 : X Ro(0, 8 f(x = 1 pro x 0, 8, f(x = 0 pro jiná x, t = 18.8, W = t; t > 14.07. Okamžiky vzniku zmetků během osmihodinové pracovní doby nejsou rovnoměrně rozděleny. Riziko omylu je 5% 7. Z příkladu 1.8 předchozího modulu máme x. = 29.650, s. = 2.517, potom t. = 0.013, W = t; t > 9.210. Nezamítáme shodu s normálním rozdělením. 8. λ. = 4.05, t. = 5.840, W = t; t > 14.07. Nezamítáme shodu s Poissonovým rozdělením.
Literatura [1] Anděl, J.: Statistické metody. MATFYZPRESS Praha 1993. [2] Cyhelský, L., Hustopecký, J., Závodský, P.: Příklady k teorii statistiky. SNTL/ALFA Praha 1978. [3] Friedrich, V.: Statistika 1 - vysokoškolská učebnice pro DS. EF ZU Plzeň 2002. [4] Hátle, J., Likeš, J.: Základy počtu pravděpodobnosti a matematické statistiky. SNTL/ALFA Praha 1972. [5] Hebák, P., Kahounová, J.: Počet pravděpodobnosti v příkladech. SNTL Praha 1988. [6] Jarušková, D., Hála, M.: Pravděpodobnost a matematická statistika 12. ČVUT Praha 2000. [7] Jarušková, D.: Matematická statistika 12. ČVUT Praha 1995. [8] Koutková, H., Moll, I.: Úvod do pravděpodobnosti a matematické statistiky. VUT Brno 2001. [9] Koutková, H., Dlouhý, O.: Sbírka příkladů z pravděpodobnosti a matematické statistiky. VUT Brno 2002. [10] Křivý, J.: Základy matematické statistiky. Ostrava 1983. [11] Likeš, J., Laga, J.: Základní statistické tabulky. SNTL Praha 1978. [12] Likeš, J., Machek, J.: Matematická statistika. Matematika pro vysoké školy technické. Sešit XI. SNTL Praha 1981. [13] Novovičová, J.: Pravděpodobnost a matematická statistika 12. ČVUT Praha. 1999. [14] Škrášek, J., Tichý, Z.: Základy aplikované matematiky III. SNTL Praha 1990. [15] Vorlíček, M., Holický M., Špačková, M.: Pravděpodobnost a matematická statistika pro inženýry. VUT Praha 1979. [16] Walpole, R. E., Myers, R. H.: Probability and Statistics for Engineers and Scientists. MACMILLAN PUBLISHING COMPANY New York 1990.