PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA

Rozměr: px
Začít zobrazení ze stránky:

Download "PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA"

Transkript

1 VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA STAVEBNÍ HELENA KOUTKOVÁ PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA MODUL GA03 M4 ZÁKLADY TESTOVÁNÍ HYPOTÉZ STUDIJNÍ OPORY PRO STUDIJNÍ PROGRAMY S KOMBINOVANOU FORMOU STUDIA

2 c Helena Koutková, Brno 2004

3 Obsah Úvod Podstata testování statistických hypotéz Statistická hypotéza a její test Proces testování hypotéz Chyby při testování Obecný postup při testování statistických hypotéz Výsledky testů a jejich interpretace Kontrolní otázky Klíč a výsledky cvičení Některé parametrické testy Testy hypotéz o střední hodnotě normálního rozdělení Testy o střední hodnotě při známém rozptylu Testy o střední hodnotě při neznámém rozptylu Testy o rozptylu normálního rozdělení Testy o rozptylu při známé střední hodnotě Testy o rozptylu při neznámé střední hodnotě P-hodnota testu Souvislost mezi testy hypotéz a intervalovými odhady Kontrolní otázky Cvičení Klíč a výsledky cvičení Testy dobré shody Kontrolní otázky Cvičení Klíč a výsledky cvičení Literatura 51

4 Úvod Další oblastí statistických metod je testování statistických hypotéz. V minulém modulu jsme předpokládali, že známe typ rozdělení náhodné veličiny X. Realizaci náhodného výběru z X zpracovanou do určité statistiky jsme pak využívali ke konstrukci bodového a intervalového odhadu parametrů rozdělení nebo parametrické funkce. V tomto modulu se budeme naopak zabývat otázkou, jak použít realizaci náhodného výběru z X zpracovanou do určité statistiky k ověřování (testování našich předpokladů (domněnek, hypotéz o hodnotách parametrů rozdělení, resp. parametrických funkcí, typu rozdělení apod. Modul je rozdělen do tří kapitol. Kapitola 1 je určena k zavedení základních pojmů z teorie testování hypotéz a k vysvětlení podstaty testování hypotéz. Tuto kapitolu považuje autorka za nejdůležitější v tomto modulu. Její zvládnutí zaručuje, že pomocí příslušné literatury budete umět testovat hypotézy nejen zde probírané, ale jiné. Kapitola 2 je věnována testům o parametrech normálního rozdělení. Kapitola 3 je zaměřena na testy dobré shody, pomocí kterých ověřujeme hypotézy o typu rozdělení, z něhož výběr pochází. Požadované znalosti K zvládnutí tohoto modulu potřebujete znát základy teorie pravděpodobnosti tak, jak bylo uvedeno v předchozím modulu. Dále potřebujete znát pojmy zavedené v předchozím modulu - a to zejména pojmy: náhodný výběr a jeho realizace, statistika, bodový a intervalový odhad parametrů rozdělení nebo parametrické funkce, bodový a intervalový odhad střední hodnoty a rozptylu normálního rozdělení, výběrová rozdělení - tvrzení 3.1 (ta budeme potřebovat ke konstrukci testů o parametrech normálního rozdělení. Autorka děkuje RNDr. Marii Budíkové, Dr. z PřF MU v Brně a svému kolegovi RNDr. Oldřichu Dlouhému za přečtení textu a cenné připomínky.

5 Kapitola 1 Podstata testování statistických hypotéz Cíle Cílem této kapitoly je: zavést základní pojmy z teorie testování statistických hypotéz; objasnit proces testování hypotéz; vysvětlit interpretaci výsledků testů. Doba potřebná ke studiu Pro nastudování této kapitoly budete potřebovat minimálně 3 hodiny bez řešení kontrolních otázek. Klíčová slova Statistická hypotéza, parametrické a neparametrické hypotézy, jednoduché a složené hypotézy, nulová hypotéza, alternativní hypotéza, test hypotézy, testová statistika, kritický obor, obor nezamítnutí, chyba prvního druhu, chyba druhého druhu, hladina významnosti testu, síla testu. 1.1 Statistická hypotéza a její test Než se naučíte testovat (ověřovat domněnky (hypotézy, předpoklady o pravděpodobnostním chování náhodné veličiny X, musíte se seznámit se základními pojmy z této oblasti. Definice 1.1: Statistická hypotéza Statistickými hypotézami rozumíme tvrzení o rozdělení náhodných veličin. Statistické hypotézy se mohou např. týkat parametrů rozdělení, parametrických funkcí, tvaru rozdělení apod.

6 6 Podstata testování statistických hypotéz Pokud se hypotézy týkají hodnot parametrů rozdělení nebo parametrických funkcí, mluvíme o parametrických hypotézách a příslušné testy se rovněž nazývají parametrické. V ostatních případech mluvíme o neparametrických hypotézách a neparametrických testech. Příklad 1.1: Příklady statistických hypotéz jsou např. tvrzení: 1. Náhodná chyba měření nemá systematickou složku. 2. Pravděpodobnost výroby vadného výrobku je Počet kazů v běžném metru izolačního materiálu má Poissonovo rozdělení s parametrem Zatížení silničního mostu je normální náhodná veličina. 5. Variabilita stogramových balíčků kávy vyjádřená směrodatnou odchylkou je maximálně 1 gram. V příkladu 1.1 je hypotéza 2 parametrická (týká se parametru alternativního rozdělení. Pokud by v případě 1 a 5 byl znám typ rozdělení (např. kdybychom věděli, že sledovaná veličina má normální rozdělení, pak by se opět jednalo o parametrické hypotézy. Ostatní hypotézy nejsou parametrické. Dále dělíme hypotézy na jednoduché a složené. Pokud je hypotéza formulována tak, že jednoznačně určuje rozdělení náhodné veličiny, nazýváme ji jednoduchou hypotézou. Hypotéza, která rozdělení náhodné veličiny jednoznačně nespecifikuje, se nazývá složená hypotéza. Hypotézy 2 a 3 v příkladě 1.1 jsou jednoduché hypotézy, zbývající jsou složené. Při testování hypotéz proti sobě klademe vždy dvě hypotézy. Jednu z nich nazýváme nulová hypotéza a značíme H 0, druhou nazýváme alternativní hypotéza k hypotéze H 0 a značíme H. Definice 1.2: Nulová a alternativní hypotéza Nulová hypotéza H 0 je hypotéza, která je testovaná. Alternativní hypotéza H je hypotéza popírající platnost nulové hypotézy H 0. Alternativní hypotéza nemusí být nutně opačná k hypotéze H 0. Víme-li např. jistě, že náhodná chyba měření X je normální náhodná veličina a domníváme se, že µ = 0, nemusí mít H nutně tvar µ 0. Může se stát, že předem bezpečně víme, že musí platit µ 0. Za této dodatečné informace má pak H tvar: µ > 0. Již známe typy hypotéz, které jsou v matematické statistice uvažovány a teď zbývá přejít k tomu, co rozumíme testem hypotézy.

7 1.1 Statistická hypotéza a její test 7 Definice 1.3: Test statistické hypotézy Testem statistické hypotézy H 0 rozumíme postup, který na základě realizace náhodného výběru z X vede k zamítnutí nebo nezamítnutí hypotézy H 0. Je-li k hypotéze H 0 stanovena alternativní hypotéza H, mluvíme o testu hypotézy H 0 proti hypotéze H. Na následujícím příkladu objasníme několik základních pojmů z oblasti testování statistických hypotéz. Příklad 1.2: Mějme dvě falešné hrací kostky. Víme, že pravděpodobnost padnutí čísla šest na jedné z nich je 0.1, na druhé 0.5. Na základě pěti hodů jednou kostkou máme rozhodnout, zda jsme si vybrali tu, na které padá šestka častěji, tj. tu kostku, kterou budeme dále nazývat výhodnější. Řešení: Označme p pravděpodobnost jevu, že při jednom hodu vybranou kostkou padne číslo šest. Za nulovou hypotézu H 0 zvolme hypotézu, že námi vybraná kostka je pro nás nevýhodná, za alternativní hypotézu H pak hypotézu, že tato kostka je výhodná. Tj. budeme testovat jednoduchou hypotézu H 0 : p = 0.1 proti jednoduché hypotéze H : p = 0.5. Naše rozhodnutí o zamítnutí, resp. nezamítnutí H 0 chceme udělat na základě pěti hodů vybranou kostkou. Zřejmě p 0.1, 0.5, protože nevíme, kterou kostku jsme si vybrali. Nazvěme hod vybranou kostkou úspěšný, jestliže padne číslo šest. Nechť X i je počet úspěchů v i-tém hodu touto kostkou (i=1,2,...,5. Potom je zřejmě (X 1, X 2,..., X 5 náhodný výběr z rozdělení X A(p, kde p 0.1, 0.5. Statistika T = X 1 + X X 5 je pak počet úspěchů v 5-ti hodech vybranou kostkou. Rozhodnutí o zamítnutí, resp. nezamítnutí H 0 založíme tedy na realizaci t statistiky T. Obor hodnot statistiky T je zřejmě množina 0, 1,..., 5. Je třeba připustit, že všechny tyto hodnoty jsou možné, jak při platnosti H 0, tak při platnosti H. Platí-li však H 0, pak zřejmě velké hodnoty statistiky T dostaneme výjimečně a naopak, platí-li H, dostaneme velké hodnoty statistiky T často. Řekněme tedy např., že H 0 zamítneme (tj. přijmeme H, je-li t 2, 3, 4, 5 a H 0 nezamítneme, je-li t 0, 1. Toto rozdělení oboru hodnot statistiky T se jeví rozumné. Můžeme jenom pochybovat, zda hranice mezi oběma částmi oboru hodnot statistiky T byla volena optimálně. Prozkoumejme za tím účelem pravděpodobnost toho, že se při rozhodování o platnosti H 0, resp. H dopustíme omylu. Náhodná veličina T má zřejmě binomické rozdělení Bi(n, p, kde n = 5 a p = 0.1 v případě platnosti H 0, resp. p = 0.5 v případě platnosti H. Tj. statistika T má pravděpodobnostní funkci ( 5 q(t; p = t p t (1 p 5 t pro t = 0, 1,..., 5 0 jinak, kde p = 0.1, resp. p = 0.5 v případě platnosti hypotézy H 0, resp. H.

8 8 Podstata testování statistických hypotéz I když poměrně vzácně, může i při platnosti H 0 : p = 0.1 nastat případ, že šestka padne alespoň 2-krát. Protože v tomto případě H 0 zamítneme, bude pravděpodobnost, že T 2, 3, 4, 5 při platnosti H 0 : p = 0.1, tj. P ( T 2, 3, 4, 5/p = 0.1, představovat riziko mylného zamítnutí H 0. Platí-li H 0 Bi(5, 0.1 a tedy : p = 0.1 je T P ( T 2, 3, 4, 5/p = 0.1 = 5 ( 5 t 0.1 t t t=2. = = Riziko mylného zamítnutí H 0 je tedy asi 8%-ní, tj. mýlíme se tímto způsobem v průměru asi v osmi případech ze sta. Stejně tak může nastat případ, že při platnosti H : p = 0.5 dostaneme nízký výsledek, který nás vede k zamítnutí H a přijetí H 0. Riziko takového omylu určíme zcela obdobně: P ( T 0, 1/p = 0.5 = 1 ( 5 t 0.5 t t = 1 ( 5 t t=0 t=0. = = Vidíme tedy, že riziko mylného nezamítnutí H 0 je téměř 19%-ní - tj. mýlíme se v průměru v asi 19-ti případech ze sta. V právě uvedeném příkladu si zejména všimněme, že přicházely v úvahu dva druhy chyb. Vztah mezi výsledkem testu a realitou a z něj vyplývajících možností chyb můžeme schématicky znázornit tak, jako v tabulce 1.1. Tabulka 1.1: Vztah mezi výsledkem testu a skutečností Skutečnost Rozhodnutí H 0 je pravdivá H 0 není pravdivá H 0 zamítáme mylné zamítnutí H 0 správné rozhodnutí H 0 nezamítáme spravné rozhodnutí mylné nezamítnutí H Proces testování hypotéz Přejděme nyní k obecnějšímu výkladu principů testování statistických hypotéz. Jak již bylo uvedeno, stojí proti sobě dvě hypotézy týkající se náhodné veličiny X, nulová hypotéza H 0 a alternativní hypotéza H. Své rozhodnutí o zamítnutí H 0 zakládáme na realizaci náhodného výběru (X 1, X 2,..., X n z rozdělení X, přesněji řečeno na realizaci určité statistiky T = T (X 1, X 2,..., X n. Statistiku T nazýváme testová statistika nebo testové kritérium. Lze ji chápat jako

9 1.2 Proces testování hypotéz 9 míru nesouladu výsledků pokusu s nulovou hypotézou. Obor hodnot statistiky T (tj. výběrový prostor rozdělíme na dvě disjunktní části - jednu z nich označíme W a budeme nazývat kritickým oborem nebo oborem zamítnutí pro test hypotézy H 0, druhou označíme V a nazveme oborem nezamítnutí pro test hypotézy H 0. Testování pak může vést ke dvěma závěrům. Jestliže zjistíme, že pro realizaci t statistiky T platí t W, hypotézu H 0 zamítneme. V opačném případě, kdy t V, tj. t W, hypotézu H 0 nezamítneme. Zavedenou terminologii shrneme do následující definice. Testová statistika, kritický obor, obor nezamít- Definice 1.4: nutí Testová statistika nebo testové kritérium je statistika, kterou použijeme k rozhodování o zamítnutí nebo nezamítnutí hypotézy H 0. Kritický obor nebo obor zamítnutí je množina všech hodnot testové statistiky, které vedou k zamítnutí H 0. Obor nezamítnutí je množina všech hodnot testové statistiky, které vedou k nezamítnutí H 0. Úkol 1.1: Co jsme v příkladu 1.2 zvolili za testovou statistiku, kritický obor a obor nezamítnutí? Chyby při testování Protože testování provádíme na základě náhodného výběru, můžeme se vlivem náhody při našem rozhodování o zamítání, resp. nezamítání hypotézy H 0 dopustit jedné ze dvou chyb (viz tab. 1.1: Definice 1.5: Chyba prvního a druhého druhu Chyby 1. druhu se dopustíme, jestliže nulová hypotéza H 0 platí, ale na základě testu, tj. na základě výsledku t W, tuto hypotézu zamítáme. Chyby 2. druhu se dopustíme, jestliže nulová hypotéza H 0 neplatí, ale na základě testu, tj. na základě výsledku t W, tuto hypotézu nezamítáme. Úkol 1.2: 1. Označte v tabulce 1.1, které rozhodnutí je chyba 1. druhu a které rozhodnutí je chyba 2. druhu.

10 10 Podstata testování statistických hypotéz 2. Vraťte se k příkladu 1.2 a formulujte, co tam byla chyba 1. a chyba 2. druhu. Pomocí čeho jsme měřili velikost těchto chyb? Samozřejmě budeme chtít, aby obě chyby byly co nejmenší. Jejich velikost budeme měřit pomocí pravděpodobnosti. Pravděpodobnost chyby 1. druhu je zřejmě P ( T W/H 0 a pravděpodobnost chyby 2. druhu je P (T W/H. Uvědomme si, že pro vyjádření pravděpodobnosti chyby 1. druhu musíme znát rozdělení statistiky T za platnosti hypotézy H 0. Je-li H 0 jednoduchá hypotéza, je rozdělení náhodné veličiny X za platnosti H 0 určeno jednoznačně, a tedy i rozdělení statistiky T za platnosti H 0 je určeno jednoznačně. Tedy pravděpodobnost chyby 1. druhu, tj. P ( T W/H 0, je určena jednoznačně. Je-li H 0 složená hypotéza, není rozdělení náhodné veličiny X za platnosti H 0 určeno jednoznačně, a tedy i rozdělení statistiky T za platnosti H 0 nemusí být určeno jednoznačně. Tedy pravděpodobnost chyby 1. druhu, tj. P ( T W/H 0, nemusí být určena jednoznačně. Podobné úvahy platí pro vyjádření pravděpodobnosti chyby druhého druhu, tj. P ( T W/H. Definice 1.6: Hladina významnosti a síla testu Číslo α, které udává v případě jednoduché nulové hypotézy H 0 pravděpodobnost chyby 1. druhu a v případě složené nulové hypotézy H 0, nejmenší horní hranici pravděpodobnosti chyby 1. druhu, nazýváme hladina významnosti testu hypotézy H 0. Číslo, které udává v případě jednoduché alternativní hypotézy H pravděpodobnost chyby 2. druhu a v případě složené alternativní hypotézy H, nejmenší horní hranici pravděpodobnosti chyby 2. druhu, značíme β. Číslo 1 β se nazývá síla testu. Z výše uvedeného plyne, že α = P ( T W/H 0 v případě jednoduché hypotézy H 0 a v případě složené hypotézy H 0 je V případě složené hypotézy H je α P ( T W/H 0. β P ( T W/H a v případě jednoduché alternativní hypotézy H platí β = P ( T W/H.

11 1.2 Proces testování hypotéz 11 Požadavek kladený na hladinu významnosti testu α tedy zaručuje, že riziko mylného zamítnutí H 0 je maximálně 100α procentní (mýlíme se tímto způsobem průměrně maximálně v 100α případech ze sta. Podobně definiční požadavek pravděpodobnosti chyby 2. druhu β zaručuje, že riziko mylného přijetí H 0 (v neprospěch H je maximálně 100β procentní. Jak již bylo řečeno, je přirozené požadovat, aby čísla α i β byla co nejmenší. To je ale problém, protože pravděpodobnosti obou chyb spolu souvisí. Z porovnání obou diagramů na obrázku 1.1. je ihned patrné, že za jinak stejných podmínek (nestane-li se nic, co by ovlivnilo rozdělení statistiky T při platnosti H 0, resp. H má snížení pravděpodobnosti chyby 1. druhu za následek zvýšení pravděpodobnosti chyby 2. druhu a naopak. Obrázek 1.1: Vyjádření vztahu mezi pravděpodobnostmi obou druhů chyb při testu jednoduché hypotézy H 0 proti jednoduché hypotéze H. Hustota testové statistiky T za platnosti H 0 [H] je označena f[g]. Úkol 1.3: V příkladu 1.2 jsme testovali proti sobě dvě jednoduché hypotézy o parametru p alternativního rozložení X; totiž hypotézu H 0 : p = 0.1 proti hypotéze H : p = 0.5. K dispozici byl náhodný výběr z X o rozsahu n = 5. Za testovou statistiku jsme zvolili statistiku T = 5 i=1 X i a za kritický obor množinu W = t; t 2, 3, 4, 5.

12 12 Podstata testování statistických hypotéz Za těchto podmínek jsme zjistili, že α = , β = Vypočtěte pravděpodobnosti obou druhů chyb v případě, že: a zmenšíme kritický obor na W 1 = t; t 3, 4, 5 ; b zvětšíme rozsah náhodného výběru dvojnásobně a kritický obor W 2 zvolíme proporcionální původnímu, tj. W 2 = t; t 4, 5,..., 10. Sledujte, jak se tyto pravděpodobnosti budou měnit při změněných podmínkách. Výsledek: a α = , β = ; b α = , β = Pozor: V případě b je testová statistika T = 10 i=1 X i, která má rozdělení T Bi(10, p. Všimněte si, že jste v předchozím úkolu snížení pravděpodobnosti chyb obou druhů dosáhli tak, že jste zvětšili rozsah náhodného výběru. (Tím se změnilo rozdělení testové statistiky. Zvětšení rozsahu náhodného výběru však nemusí být vždycky možné (např. realizace náhodného výběru může být již provedena a není možné v ní pokračovat. Ukázali jsme, že kritický obor W nelze obecně volit tak, aby byly současně obě chyby tak malé, jak bychom si přáli. Proto se obvykle trvá jenom na tom, aby hladina významnosti testu α bylo nějaké, předem dané (samozřejmě malé číslo z intervalu (0,1. V technické praxi se nejčastěji volí α = 0.05 nebo α = Mluvíme pak o testu hypotézy H 0 na hladině významnosti α. Z možných testů H 0 na dané hladině významnosti α (tj. z možných voleb testové statistiky T a kritického oboru W pak volíme ten, při kterém je β nejmenší. To ale neznamená, že β bude dostatečně malé. Minimalizaci β při pevně zvoleném α můžeme považovat za základní myšlenku volby kritického oboru. Z výše uvedeného vyplývá, že hlavním teoretickým problémem testování hypotéz je vhodná volba testové statistiky T a následné určení jejího rozdělení. Volbou testové statistiky se zabývají rozsáhlejší učebnice matematické statistiky, zde budou pro nejběžnější situace testové statistiky, zajišťující výhodné vlastnosti testu, uvedeny (až na výjimky bez odvození. Když známe testovou statistiku T pro test hypotézy H 0 a její rozdělení, nebývá již obtížné určit kritický obor pro test hypotézy H 0 proti hypotéze H na dané hladině významnosti α. Za kritický obor W zvolíme ty hodnoty testové statistiky T, které svědčí proti H 0 a ve prospěch H - tím rozhodneme o umístění kritického oboru v množině možných hodnot testové statistiky T. Velikost kritického oboru W pak určíme na základě požadavku kladeného na hladinu významnosti testu α. Rozhodneme-li se ponechat stranou všechny teoretické problémy testování hypotéz naznačené výše, můžeme řešení konkrétních úloh různého druhu shrnout do následujícího obecného postupu.

13 1.3 Kontrolní otázky Obecný postup při testování statistických hypotéz Na základě všeho, co je nám známo o sledované náhodné veličině X a s uvážením zamýšleného rozsahu realizace náhodného výběru z rozdělení X: 1. Formulujeme nulovou hypotézu H 0 a volíme alternativní hypotézu H k hypotéze H 0, volíme hladinu významnosti testu α. 2. Stanovíme (nejčastěji vyhledáme testovou statistiku T pro test nulové hypotézy H 0. Z realizace náhodného výběru z X vypočítáme její realizaci t. 3. Stanovíme (vyhledáme kritický obor W pro test hypotézy H 0 proti hypotéze H na hladině významnosti α. 4. Rozhodneme: - jestliže t W, potom H 0 zamítneme; - jestliže t W, potom H 0 nezamítáme Výsledky testů a jejich interpretace V případě zamítnutí nulové hypotézy H 0 přijmeme alternativní hypotézu H (s maximálně 100α procentním rizikem mylného přijetí H v neprospěch H 0. V technické literatuře se v tomto případě často setkáváme s formulací: Výsledky testu jsou statisticky významné na hladině významnosti α. V případě nezamítnutí nulové hypotézy H 0 nelze říci, že hypotézu H 0 přijímáme. Pravděpodobnost chyby druhého druhu může být totiž velká. Test uzavřeme s tím, že se H 0 nepodařilo na základě zjištěných údajů a použitého testu zamítnout. V aplikacích se v tomto případě opět často vyskytuje formulace Výsledky testu nejsou statisticky významné na hladině významnosti α. Lepší by samozřejmě bylo vyjádřit pravděpodobnost chyby 2. druhu. Ta se ale někdy určuje dost obtížně (především v případě složené alternativní hypotézy. Bez znalosti pravděpodobnosti chyby druhého druhu postupujeme často tak, že za alternativní hypotézu H volíme ten výrok o rozdělení X, který chceme prokázat, nebo spíše, jehož potvrzení vede k nějakým závažným opatřením. 1.3 Kontrolní otázky 1. Vysvětlete následující pojmy: nulová hypotéza, alternativní hypotéza, parametrická a neparametrická hypotéza, jednoduchá a složená hypotéza. 2. Co je základem pro testování hypotézy a z čeho vytvoříte kritický obor pro test hypotézy? 3. Jakých chyb se můžeme dopustit při testování hypotéz? 4. Vysvětlete následující pojmy: hladina významnosti testu, síla testu.

14 14 Podstata testování statistických hypotéz 5. Popište, jaký je obecný postup při testování hypotéz. 6. Jak lze interpretovat výsledky testů? 7. Při soudním procesu stojí proti sobě dvě hypotézy vinen a nevinen. Kterou z nich byste považovali za nulovou a kterou za alternativní? 8. Při současné technologii je pravděpodobnost výroby zmetku p = a Po rekonstrukci výrobní linky byla obnovena výroba, ale technologický postup se nezměnil. Na základě náhodného výběru chceme zjistit, zda nedošlo ke změně kvality výroby. b Byly provedeny změny v technologii s cílem zvýšit kvalitu výroby. Na základě náhodného výběru máme posoudit, zda se tyto změny projevily očekávaným způsobem. c Zavedení nové technologie mělo za cíl snížit náklady. Zajímá nás, zda nedošlo ke snížení kvality výroby. Ve všech uvedených případech formulujte nulovou a alternativní hypotézu. Určete, zda se jedná o parametrické nebo neparametrické hypotézy a zda se jedná o jednoduché nebo složené hypotézy. 9. Formulte sami nějakou a parametrickou b neparametrickou hypotézu a k ní alternativní hypotézu. Určete, zda se jedná o jednoduché nebo složené hypotézy. 10. Určete, zda jsou následující tvrzení pravdivá: a Zamítnutí nepravdivé nulové hypotézy je chyba 1. druhu. b Zamítnutí pravdivé nulové hypotézy označujeme jako chybu 2. druhu. c Pokud testem nezamítneme nulovou hypotézu, pak je tato hypotéza pravdivá. d Pokud testem zamítneme nulovou hypotézu, pak je pravdivá alternativní hypotéza. e Jestliže hodnota testové statistiky neleží v kritickém oboru, přijmeme alternativní hypotézu. f Jestliže hodnota testové statistiky leží v kritickém oboru, přijmeme alternativní hypotézu. g Zamítneme-li nulovou hypotézu na hladině významnosti 0.01, pak ji zamítáme i na hladině významnosti h Platí: α + β = Doplňte následující věty: a Alternativní hypotéza H... platnost nulové hypotézy. b Obor hodnot testové statistiky se dělí na... obor a obor nezamítnutí.

15 1.4 Klíč a výsledky cvičení 15 c Chybou 2. druhu se rozumí nezamítnutí... nulové hypotézy. d Nulovou hypotézu..., pokud hodnota testové statistiky leží v kritickém oboru. e Zmenšením pravděpodobnosti chyby 1. druhu se obecně... pravděpodobnost chyby 2. druhu a obráceně. f Pravděpodobnost chyby 1. a 2. druhu lze současně zmenšit, když... rozsah výběru. 1.4 Klíč a výsledky cvičení Otázky: 7. Nulová je nevinen. Pokud nenalezneme dostatečný důvod ji zamítnout, presumpce neviny vyžaduje obviněného považovat za nevinného do té doby, dokud se nepodaří získat přesvědčivé důkazy o jeho vině. Přijmout hypotézu vinen vyžaduje, aby riziko omylu bylo malé. 8. Zajímá nás parametr p alternativního rozdělení. Bude se tedy jednat o parametrické hypotézy. V případě a H 0 : p = 0.05, H : p 0.05; H 0 je jednoduchá, H je složená hypotéza. V případě b H 0 : p 0.05, H : p > 0.5; obě hypotézy jsou složené. V případě c H 0 : p 0.05, H : p < 0.05; obě hypotézy jsou složené. 10. a Ne - zamítnutí nulové nepravdivé hypotézy není chyba. b Ne - zamítnutí pravdivé nulové hypotézy je chyba 1. druhu. c Ne - nulová hypotéza může, ale nemusí být pravdivá. Neznáme riziko mylného přijetí nulové hypotézy. Pouze se nám ji nepodařilo zamítnout. Někdy jsme ale nuceni se chovat, jako by pravdivá byla. d Ano - s rizikem omylu maximálně 100α procent. e Ne - nezamítáme nulovou hypotézu. f Ano. g Ano. h Ne - to by bylo hodně špatné. Jedná se sice o spojité nádoby, ale ne v tomto smyslu. 11. a popírá; b kritický; c nepravdivé; d zamítáme; e zvětšuje; f zvětšíme.

16 Kapitola 2 Některé parametrické testy Cíle Po přečtení a nastudování této kapitoly budete umět: testovat hypotézy o hodnotách parametrů normálního rozdělení v jednotlivých situacích; princip testování pomocí P -hodnoty testu; testovat hypotézy pomocí intervalových odhadů. Doba potřebná ke studiu Pokud jste pořádně pochopili předchozí kapitolu, měly by Vám stačit 4 hodiny bez řešení příkladů. Klíčová slova Jednovýběrový u-test, jednovýběrový t-test, párový t-test, test o roztylu normálního rozdělení, P-hodnota testu. V minulé kapitole jste se seznámili se základními pojmy a podstatou testování hypotéz. V této kapitole nás budou zajímat parametrické testy. Budeme chtít na základě realizace náhodného výběru z rozdělení X, které je závislé na parametru ϑ Θ, testovat hypotézy o hodnotě parametrické funkce τ(ϑ. V aplikacích se můžeme setkat s následujícími formulacemi hypotéz o parametrické funkci τ(ϑ: A H 0 : τ(ϑ = τ 0, B H 0 : τ(ϑ = τ 0, C H 0 : τ(ϑ = τ 0, H : τ(ϑ > τ 0, H : τ(ϑ < τ 0, H : τ(ϑ = τ 0, kde τ 0 je nějaké předem dané číslo. Alternativní hypotézu v případě A, resp. B nazýváme pravostrannou, resp. levostrannou. K těmto formulacím přistoupíme tehdy, chceme-li prokázat, že odchylka od τ 0 je v jednom směru. V případě C je alternativní hypotéza oboustranná a použijeme ji tehdy, když není třeba vyslovit soud o směru odchylky.

17 2.1 Testy hypotéz o střední hodnotě normálního rozdělení 17 V případě A a B se častěji setkáváme se situací, kdy je nulová hypotéza opačná k alternativní. Tj. místo formulací hypotéz A a B je častější formulace A s H 0 : τ(ϑ τ 0, B s H 0 : τ(ϑ τ 0, H : τ(ϑ > τ 0, H : τ(ϑ < τ 0, kde jsou nulové hypotézy jistě složené. Poznámka 2.1: Zpravidla lze pro všechny výše uvedené testy stanovit stejnou testovou statistiku T, jejíž rozdělení je za platnosti τ(ϑ = τ 0 určeno jednoznačně, tak, že testy A a A s na hladině významnosti α mají stejné kritické obory, podobně jako testy B a B s. Pouze riziko mylného zamítnutí nulové hypotézy v testu A s, resp. testu B s je maximálně 100α procentní a ne 100α procentní jako v testu A, resp. B. Je-li totiž např. W A kritický obor pro test A na hladině významnosti α, tj. P (T W A /τ(ϑ = τ 0 = α, potom P (T W A /τ(ϑ τ 0 P (T W A /τ(ϑ = τ 0 = α. Můžeme tedy zpravidla místo testu A s uvažovat test A, ačkoliv si nejsme jisti, že platí τ(ϑ τ 0, a místo testu B s uvažovat test B, ačkoliv si nejsme jisti, že platí τ(ϑ τ 0. V této kapitole se omezíme jen na případ normálního rozdělení a jako parametrické funkce nás budou zajímat pouze parametry tohoto rozdělení µ a σ 2 nebo směrodatná odchylka σ. Přepokládejme tedy dále, že (X 1, X 2,..., X n je náhodný výběr z rozdělení X N(µ, σ 2, kde oba nebo některý z parametrů µ, σ 2 neznáme. 2.1 Testy hypotéz o střední hodnotě normálního rozdělení Budou nás zajímat testy o střední hodnotě µ normální náhodné veličiny X. Tj. budeme chtít neznámou střední hodnotu µ porovnávat s nějakým předem daným číslem µ 0. Např. nás může zajímat, zda je střední hodnota délky cihly 290 mm. Protože normální rozdělení má ještě jeden parametr - rozptyl σ 2, mohou nastat dvě situace: - rozptyl σ 2 známe; - rozptyl σ 2 neznáme. Přejděme tedy k první situaci Testy o střední hodnotě při známém rozptylu Příklad 2.1: Navrhněte test statistické hypotézy T 1 : H 0 : µ = µ 0 proti hypotéze H : µ > µ 0 T 2 : H 0 : µ = µ 0 proti hypotéze H : µ < µ 0

18 18 Některé parametrické testy T 3 : H 0 : µ = µ 0 proti hypotéze H : µ = µ 0 na hladině významnosti α. Řešení: Protože nás zajímají testy o střední hodnotě µ náhodné veličiny X, vyjdeme z nejlepšího nestranného odhadu střední hodnoty, tj. statistiky X. Jestliže platí hypotéza H 0 (tj. je-li skutečná střední hodnota náhodné veličiny X rovna číslu µ 0 má náhodná veličina X rozdělení N(µ 0, σ 2. Tedy statistika T = X µ 0 n σ má za platnosti µ = µ 0 rozdělení N(0, 1. (Viz tvrzení 3.1 v předcházejícím modulu. V prospěch hypotézy H 0 budou svědčit ty realizace (x 1, x 2,..., x n náhodného výběru z X, pro které bude realizace x statistiky X blízká číslu µ 0, tj. pro které bude realizace t statistiky T blízká nule. Zvolme tedy statistiku T za testovou statistiku pro test hypotézy H 0 : µ = µ 0. Nyní zbývá určit kritické obory pro jednotlivé uvažované alternativy. 1. V případě testu T 1 budou zřejmě v prospěch hypotézy H svědčit ty realizace (x 1, x 2,..., x n náhodného výběru z X, pro které bude x podstatně větší než číslo µ 0, tj. pro něž x µ 0 bude větší než nějaká kladná konstanta, tj. pro které bude realizace t statistiky T větší než nějaká kladná konstanta k 1. Za kritický obor W 1 pro test T 1 hypotézy H 0 proti hypotéze H lze tedy zvolit množinu W 1 = t; t > k 1, kde k 1 > 0. Číslo k 1 vyberme tak, aby hladina významnosti testu byla α, tj. požadujeme, aby Odtud (viz obrázek α = P ( T W 1 /H 0 = P ( T > k1 /µ = µ 0. P ( T k 1 /µ = µ 0 = 1 α k1 = u(1 α. Kritickým oborem W 1 pro test hypotézy H 0 proti hypotéze H na hladině významnosti α je tedy množina W 1 = t; t > u(1 α. 2. V prospěch hypotézy H v případě testu T 2 svědčí ty realizace x statistiky X, pro které je x podstatně menší než číslo µ 0, tj. ty realizace t testové statistiky T, které jsou menší než nějaká záporná konstanta k 2. Kritický obor W 2 bude mít tedy tvar W 2 = t; t < k 2. Číslo k 2 opět vybereme na základě požadavku kladeného na hladinu významnosti testu α. Požadujeme, aby α = P ( T W 2 /H 0 = P ( T < k2 /µ = µ 0.

19 2.1 Testy hypotéz o střední hodnotě normálního rozdělení 19 Obrázek 2.1: Volba kritického oboru pro test hypotézy H 0 : µ = µ 0 rozdělení N(µ, σ 2 se známým rozptylem σ 2 proti hypotéze 1 H : µ > µ 0, 2 H : µ < µ 0, 3 H : µ µ 0 na hladině významnosti α. Odtud (viz obrázek k 2 = u(α. Vzhledem k tomu, že prakticky volíme α malé číslo (0.01 nebo 0.05, je u(α < 0 a pro práci s tabulkami potřebujeme převodní vztah u(α = u(1 α. Tedy kritický obor W 2 pro test T 2 na hladině významnosti α je W 2 = t; t < u(1 α. 3. V testu T 3 lze zřejmě volit za kritický obor W 3 pro test hypotézy H 0 proti hypotéze H na hladině významnosti α množinu (viz obrázek W 3 = t; t < u(1 α 2 t > u(1 α 2. V našich úvahách byla nejtěžší volba vhodné testové statistiky pro test nulové hypotézy. Potřebovali jsme totiž, aby byla tato testová statistika rozumná, tj. aby měla vypovídací schopnost o střední hodnotě a zároveň jsme potřebovali znát rozdělení testové statistiky za platnosti nulové hypotézy. Při testu hypotézy H 0 : µ = µ 0 jsme vyšli z bodového odhadu střední hodnoty, tj. statistky X. Rozdělení statistiky X známe. Víme, že je za platnosti hypotézy H 0 normální s parametry µ 0 a σ 2. Tuto statistiku jsme mohli použít za testovou statistiku, což by bylo jistě názornější. V praxi se však jako testové statistiky používají vhodné funkce bodových odhadů, které je snadné porovnat s kvantily některého známého rozdělení. Při našem postupu jsme podstatně využili

20 20 Některé parametrické testy skutečnost, že nás zajímá test o střední hodnotě normálního rozdělení se známým rozptylem. Volba kritických oborů a jejich určení pro jednotlivé možné alternativy pak byly už velmi snadné. Všechny výše uvedené testy o střední hodnotě normálního rozdělení při známém rozptylu na hladině významnosti α shrnuje následující tvrzení. Tvrzení 2.1: Testy o střední hodnotě při známém rozptylu Je-li (X 1, X 2,..., X n náhodný výběr z rozdělení X N(µ, σ 2 s neznámou střední hodnotou µ a známým rozptylem σ 2 a µ 0 předem dané číslo, potom lze pro testy T 1 : hypotézy H 0 : µ = µ 0 proti hypotéze H : µ > µ 0, T 2 : hypotézy H 0 : µ = µ 0 proti hypotéze H : µ < µ 0, T 3 : hypotézy H 0 : µ = µ 0 proti hypotéze H : µ µ 0 za testovou statistiku volit stejnou statistiku T = X µ 0 n, σ která má za platnosti µ = µ 0 rozdělení N(0, 1. Za kritické obory W i (i = 1, 2, 3 pro testy T i (i = 1, 2, 3 na hladině významnosti α lze postupně volit množiny W 1 = t; t > u(1 α, W 2 = t; t < u(1 α, W 3 = t; t < u(1 α 2 t > u(1 α 2. Jsou-li nulové hypotézy v testech T 1 a T 2 opačné k alternativním, zůstává tvrzení v platnosti. Poznámka 2.2: Jednovýběrové u-testy Testy o střední hodnotě normálního rozdělení při známém rozptylu se nazývají jednovýběrové u-testy podle rozdělení testové statistiky. Tyto testy lze použít i v případě náhodného výběru z rozdělení, které není normální v případě, že je rozsah výběru n > 30. Příklad 2.2: Z náhodného výběru o rozsahu n = 10 výsledků zkoušek krychelné pevnosti betonu třídy B20 z určité výrobny byl zjištěn průměr 28.8 MPa. Z předchozí zkušenosti je známo, že pevnost je normální náhodná veličina se známou směrodatnou odchylkou 2.4 MPa. Na hladině významnosti 0.05 máme ověřit, zda daná výrobna nezmenšila střední krychelnou pevnost 31 MPa. Řešení: Náhodnou veličinou X je zde krychelná pevnost betonu. Předpokládáme, že X N(µ, σ 2, kde σ = 2.4 MPa. Jsou tedy splněny předpoklady tvzení 2.1.

21 2.1 Testy hypotéz o střední hodnotě normálního rozdělení Budeme testovat hypotézu H 0 : µ = 31 MPa proti hypotéze H : µ < 31 MPa na hladině významnosti Jedná se o test T 2 z tvrzení 2.1, kde µ 0 = 31 MPa. 2. Za testovou statistiku lze tedy zvolit statistiku T = X µ 0 n. σ Máme dáno µ 0 = 31, σ = 2.4, x = 28.8, n = 10, odtud pro realizaci t testové statistiky T dostaneme t. = = Kritický obor W pro test H 0 proti H na hladině významnosti α je pak množina W = W 2 = t; t < u(1 α. Pro α = 0.05 je u(1 α = u(0.95 = W = t; t < Protože t W, zamítáme hypotézu H 0 a přijímáme hypotézu H. Výrobna snížila střední krychelnou pevnost betonu, riziko omylu je maximálně 5%. Úkol 2.1: Odběratel s dodavatelem uzavřeli smlouvu o dodávce pytlů cementu. Při známém rozptylu plnicího stroje σ 2 = 2.5 kg 2 musí být střední hodnota hmotnosti pytlů 50 kg. Pro ověření toho, že plnicí stroj pracuje dobře, bylo náhodně vybráno 40 pytlů a získán aritmetický průměr jejich hmotnosti x = 49.2 kg. Rozhodněte, zda je hmotnost dodávaných pytlů 50 kg. Hladinu významnosti testu volte Výsledek: Vzhledem k tomu, že n > 30 a známe σ 2, lze použít tvrzení 2.1. Střední hodnota hmotnosti pytlů není 50 kg. Riziko omylu je 5%. H 0 : µ = 50, H : µ = 50, t = 3.2, W = t; t < t > Vraťme se zpět k tvrzení 2.1. Tam bylo v souladu z poznámkou 2.1 konstatováno, že tvrzení zůstává v platnosti i v případě, že v testech T 1 a T 2 jsou nulové hypotézy opačné k alternativním. V těchto testech sice zůstávají předpoklady o rozdělení a alternativní hypotézy stejné jako v původních, ale situace je zde složitější než v případě původních testů. Problém je, že nulové hypotézy už nejsou jednoduché, ale složené. Uvažujme např. test T 1s : hypotézy H 0 : µ µ 0 proti hypotéze H : µ > µ 0 na hladině významnosti α. Pokud testovou statistiku pro test T 1s zvolíme stejně jako pro test T 1, bude mít kritický obor W 1s pro test T 1s stejný tvar jako pro

22 22 Některé parametrické testy test T 1, tj. W 1s = t; t > k, kde k je nějaká kladná konstanta. Lze jenom pochybovat o tom, zda pro test T 1s na hladině významnosti α je skutečně W 1s = W 1, tj. k = u(1 α. Vzhledem k tomu, že H 0 : µ µ 0 je složená hypotéza, ptáme se, zda tj. zda P (T W 1 /µ µ 0 α ( = P (T W 1 /µ = µ 0, (2.1 P ( T > u(1 α/µ µ 0 α. (2.2 Pro zájemce v následujícím příkladu ukážeme, že skutečně vztah (2.2 platí. Příklad 2.3: (pro zájemce Ověřte platnost vztahu (2.2. Řešení: Označme µ takové číslo, pro které platí µ µ 0. Vztah (2.2 platí právě tehdy, když P ( T > u(1 α/µ = µ α pro každé µ µ 0. (2.3 Statistika T = X µ 0 σ n má rozdělení N(0, 1 za platnosti µ = µ0. My počítáme pravděpodobnost za platnosti µ = µ. Je-li µ = µ, nemá rozdělení N(0, 1 statistika T, ale statistika T = X µ σ n. Zřejmě T = X µ 0 σ n = (X µ + (µ µ 0 σ n = T + µ µ 0 n. σ Vyjádřeme tedy pravděpodobnost ve vztahu (2.3 pomocí statistiky T. Dostaneme P ( ( T > u(1 α/µ = µ = P T + µ µ 0 n > u(1 α/µ = µ σ = P ( T > u(1 α µ µ 0 n/µ = µ (2.4 σ Je-li µ µ 0, potom µ µ 0 σ n 0, odtud u(1 α µ µ 0 σ n u(1 α. Tedy pro každé µ µ 0 platí P ( T > u(1 α µ µ 0 ( n/µ = µ P T > u(1 α/µ = µ = α. σ (Nakreslete si obrázek! Odtud a ze vztahu (2.4 dostáváme, že vztah (2.3 a tedy i (2.2 platí. Příklad 2.4: (pro zájemce Byla provedena realizace náhodného výběru z X N(µ, 4 o rozsahu n = 9 a vypočten x = 5.5. a Ověřte, že na základě naměřených dat nelze na hladině významnosti 0.05 rozhodnout o zamítnutí hypotézy H 0 : µ 6. b Určete riziko mylného přijetí hypotézy H 0 v neprospěch hypotézy µ = 7.

23 2.1 Testy hypotéz o střední hodnotě normálního rozdělení 23 c Určete rozsah n náhodného výběru z X tak, aby riziko mylného přijetí hypotézy H 0 v neprospěch hypotézy µ = 7 bylo maximálně 5%. Řešení: a 1. Budeme testovat hypotézu H 0 : µ 6 proti hypotéze H : µ > 6 na hladině významnosti Můžeme použít stejnou testovou statistiku i kritický obor jako v testu T 1 z tvrzení 2.1, kde µ 0 = Testová statistika je statistika T = X µ 0 n. σ Máme µ 0 = 6, σ = 2, n = 9, x = 5.5. Realizace testové statistiky je 3. Kritický obor je množina Pro α = 0.05 je W = W = W 1 = t = t; t > u(1 α. t; t > u(0.95 = t; t > Protože t W, nezamítáme hypotézu H 0. kde b Máme vypočítat P (T W/µ = 7 = P (T 1.645/µ = 7, (2.5 T = X Z tvrzení 2.1 víme, že T má za platnosti µ = 6 rozdělení N(0, 1. Ve vztahu (2.5 počítáme pravděpodobnost za platnosti, že skutečná střední hodnota je 7. Za tohoto předpokladu nemá rozdělení N(0, 1 statistika T, ale statistika Zřejmě T = X 7 2 T = T Vyjádřeme tedy pravděpodobnost ve vztahu (2.5 pomocí statistiky T, dostaneme P ( T 1.645/µ = 7 = P (T /µ = 7 = P (T 0.145/µ = 7 = Φ(0.145 =

24 24 Některé parametrické testy Riziko mylného přijetí hypotézy µ 6 v neprospěch hypotézy µ = 7 je přibližně 60%. c Máme určit rozsah n výběru z X tak, aby kde P (T W/µ = 7 = P (T 1.645/µ = , (2.6 T = X 6 n. 2 Rozdělení N(0, 1 má za podmínky µ = 7 statistika T = X 7 2 n. Zřejmě T = T n. Vyjádřeme tedy pravděpodobnost ve vztahu (2.6 pomocí statistiky T, dostaneme ( 0.05 P T + 1 n 1.645/µ = 7 2 ( 0.05 P T n/µ = 7 2 ( 0.05 Φ n 2 Φ ( u(0.05 ( Φ n 2 Odtud u( n u( n n n 6.58 n Riziko mylného přijetí H 0 : µ 6 v neprospěch µ = 7 bude maximálně 5% v případě rozsahu výběru n Testy o střední hodnotě při neznámém rozptylu Rozptyl rozdělení, z něhož výběr pochází, obvykle neznáme. Pro testy o střední hodnotě µ normálního rozdělení nelze v tomto případě samozřejmě použít předchozí výsledky z tvrzení 2.1, protože neznáme rozptyl. Uvědomme si ale, že nestranným odhadem skutečné střední hodnoty µ je opět statistika X. Odhadem rozptylu σ 2 je statistika S 2. Statistika T = X µ 0 n S

25 2.1 Testy hypotéz o střední hodnotě normálního rozdělení 25 má za platnosti µ = µ 0 rozdělení t(n 1 (viz tvrzení 3.1 z předcházejícího modulu. Zvolíme-li tedy T za testovou statistiku, kritické obory pro jednotlivé testy budou analogické kritickým oborům v tvrzení 2.1. Budou se lišit pouze tím, že se v nich budou vyskytovat místo kvantilů rozdělení N(0,1 kvantily rozdělení t(n 1. Výsledky shrnuje tvrzení 2.2. Tvrzení 2.2: Testy o střední hodnotě při neznámém rozptylu Je-li (X 1, X 2,..., X n náhodný výběr z rozdělení X N(µ, σ 2 s neznámou střední hodnotou µ a neznámým rozptylem σ 2 a µ 0 předem dané číslo, potom lze pro testy T 4 : hypotézy H 0 : µ = µ 0 proti hypotéze H : µ > µ 0, T 5 : hypotézy H 0 : µ = µ 0 proti hypotéze H : µ < µ 0, T 6 : hypotézy H 0 : µ = µ 0 proti hypotéze H : µ = µ 0 za testovou statistiku volit stejnou statistiku T = X µ 0 n, S která má za platnosti µ = µ 0 rozdělení t(n 1. Za kritické obory W i (i = 4, 5, 6 pro testy T i (i = 4, 5, 6 na hladině významnosti α lze postupně volit množiny W 4 = t; t > t(n 1; 1 α, W 5 = t; t < t(n 1; 1 α, W 6 = t; t < t(n 1; 1 α 2 t > t(n 1; 1 α 2. Jsou-li nulové hypotézy v testech T 4 a T 5 opačné k alternativním zůstává tvrzení v platnosti. Poznámka 2.3: Jednovýběrové t-testy Testy o střední hodnotě normálního rozdělení při neznámém rozptylu se nazývají jednovýběrové t-testy podle rozdělení testové statistiky. Jednovýběrové t-testy lze stejně jaku u-testy použít i v případě, že se nejedná o normální rozdělení, je-li rozsah výběru větší než 30. Příklad 2.5: Při zkoušce šestnácti náhodně vybraných ocelových tyčí byly zjištěny následující meze kluzu v MPa: 249, 250, 248, 255, 246, 250, 246, 245, 243, 245, 251, 248, 246, 245, 250, 249. Požaduje se, aby střední hodnota meze kluzu byla 250 MPa. Ověřte, zda je tento předpoklad splněn. Přípustné riziko omylu je maximálně 5%. Předpokládejte, že mez kluzu má přibližně normální rozdělení.

26 26 Některé parametrické testy Řešení: Náhodnou veličinou X je zde mez kluzu oceli. Předpokládáme, že X N(µ, σ 2 a ani jeden z paramterů µ a σ 2 není znám. Jsou tedy splněny předpoklady z tvrzení Budeme testovat hypotézu H 0 : µ = 250 MPa proti hypotéze H : µ 250 MPa na hladině významnosti Jedná se o test T 6 z tvrzení 2.2, kde µ 0 = 250 MPa. 2. Za testovou statistiku lze tedy zvolit statistiku Výpočtem dostaneme T = X µ 0 n. S µ = x = MPa, σ = s. = MPa. Odtud realizace t testové statistiky T je t. = = Kritický obor W pro test H 0 proti H na hladině významnosti α je pak množina W = W 6 = t; t < t(n 1; 1 α 2 t > t(n 1; 1 α 2. Pro α = 0.05 je t(n 1; 1 α = t(15, = W = t; t < t > Protože t W, zamítáme hypotézu H 0 a přijímáme hypotézu H. Tedy střední hodnota meze kluzu oceli není rovna 250 MPa, riziko omylu je maximálně 5%. Příklad 2.6: Krychelná pevnost betonu třídy 40 se zkoušela na deseti vzorcích jednak určitou nedestruktivní metodou, jednak destruktivně. Výsledné hodnoty v MPa jsou zapsány v následující tabulce: Vz. Pevnost (x 1i Pevnost (x 2i Vz. Pevnost (x 1i Pevnost (x 2i nedestr. m. destr. m. nedestr. m destr. m

27 2.1 Testy hypotéz o střední hodnotě normálního rozdělení 27 Zjistěte, zda se výsledky podle nedestruktivní metody v průměru jen náhodně liší od destruktivních zkoušek. Přípustné riziko omylu je 5%. Řešení: Nechť X 1 [X 2 ] je pevnost betonu měřená nedestruktivní [destruktivní] metodou. Máme testovat hypotézu E(X 1 = E(X 2 proti hypotéze E(X 1 E(X 2 na hladině významnosti Označme X = X 1 X 2, potom E(X 1 = E(X 2 právě tehdy, když E(X = Můžeme tedy testovat hypotézu H 0 : E(X = 0 MPa proti hypotéze H : E(X 0 MPa na hladině významnosti Realizace náhodného výběru z X je 2.8, 0.9, 0.0, 2.7, -0.8, -0.2, 3.0, -1.6, 0.4, Má-li náhodná veličina X normální rozdělení nebo je-li rozsah výběru větší než 30, jsou splněny předpoklady tvrzení 2.2. Celý problém je pak převeden na použití jednovýběrového t-testu. Za testovou statistiku pro test hypotézy H 0 proti hypotéze H pak lze použít statistiku T = X µ 0 n, S kde µ 0 = 0 a n = 10. Postupně dostaneme Odtud µ = x = MP a, σ = s = σ n 1. = MP a. t = = Za kritický obor W lze zvolit množinu W = t; t < t(n 1; 1 α 2 t > t(n 1; 1 α 2. Pro α = 0.05 je t(n 1; 1 α = t(9; = 2.262, 2 odtud W = t; t < t > Protože t W, nebyla na hladině významnosti 0.05 prokázána odlišnost ve výsledcích obou metod. Poznámka 2.4: Párový t-test Jednovýběrový t-test aplikovaný na porovnávání středních hodnot dvou veličin měřených na stejných objektech se nazývá párový t-test.

28 28 Některé parametrické testy 2.2 Testy o rozptylu normálního rozdělení Dále nás budou zajímat testy o rozptylu σ 2 náhodné veličiny X. Tj. budeme chtít neznámý rozptyl porovnávat s předem daným číslem σ 2 0. Potom mohou nastat podobně jako v odstavci 2.1 dvě situace - střední hodnotu µ známe; - střední hodnotu µ neznáme. Věnujme se opět nejprve prvnímu případu Testy o rozptylu při známé střední hodnotě Příklad 2.7: Navrhněte test statistické hypotézy H 0 : σ 2 = σ 2 0 proti hypotéze H : σ 2 < σ 2 0 na hladině významnosti α. Řešení: Protože nás zajímají testy o rozptylu σ 2 náhodné veličiny X, vyjdeme z nestranného odhadu roztylu, když známe střední hodnotu µ, tj. statistiky S 2 0. Jestliže je skutečný rozptyl náhodné veličiny X roven číslu σ 2 0, má náhodná veličina X rozdělení N(µ, σ 2 0. Tedy statistika T = ns2 0 σ0 2 má za podmínky σ 2 = σ0 2 rozdělení χ 2 (n (viz tvrzení 3.1 z předcházejícího modulu. V prospěch hypotézy H 0 budou zřejmě svědčit ty realizace (x 1,..., x n náhodného výběru (X 1,..., X n z rozdělení X, pro které bude realizace s 2 0 statistiky S0 2 blízká číslu σ0, 2 tj. pro které bude s2 0 blízké číslu jedna, tj. pro σ0 2 které bude realizace t statistiky T blízká číslu n (rozsahu výběru. Zvolme tedy T za testovou statistiku pro test hypotézy H 0. Nyní zbývá určit kritický obor pro test hypotézy H 0 proti hypotéze H na hladině významnosti α. V prospěch hypotézy H budou zřejmě svědčit ty realizace s 2 0, které budou dostatečně menší než číslo σ0, 2 tj. ty realizace t testové statistiky T, které budou dostatečně menší než číslo n. Zvolme tedy za kritický obor W pro test hypotézy H 0 proti hypotéze H množinu W = t; t < k, kde k je nějaká kladná konstanta menší než n. Číslo k vybereme tak, aby hladina významnosti testu byla α, tj. aby platilo Odtud (viz obrázek 2.2 α = P ( T W/H 0 = P ( T < k/σ 2 = σ 2 0. k = χ 2 (n;, α. Kritickým oborem W pro test hypotézy H 0 proti hypotéze H na hladině významnosti α je tedy množina W = t; t < χ 2 (n; α.

29 2.2 Testy o rozptylu normálního rozdělení 29 Obrázek 2.2: Volba kritického oboru W pro test hypotézy H 0 : σ 2 = σ 2 0 rozdělení N(µ, σ 2 se známou střední hodnotou µ proti hypotéze H : σ 2 < σ 2 0 na hladině významnosti α. Úkol 2.2: Navrhněte testy statistické hypotézy H 0 : σ 2 = σ 2 0 pro ostatní možné alternativy. Nakreslete si obrázky. Testy o rozptylu při známé střední hodnotě shrnuje následující tvrzení. Tvrzení 2.3: Testy o rozptylu při známé střední hodnotě Je-li (X 1, X 2,..., X n náhodný výběr z rozdělení X N(µ, σ 2 s neznámým rozptylem σ 2 a známou střední hodnotou µ a σ0 2 předem dané číslo, potom lze pro testy T 7 : hypotézy H 0 : σ 2 = σ0 2 proti hypotéze H : σ 2 > σ0, 2 T 8 : hypotézy H 0 : σ 2 = σ0 2 proti hypotéze H : σ 2 < σ0, 2 T 9 : hypotézy H 0 : σ 2 = σ0 2 proti hypotéze H : σ 2 = σ0 2 za testovou statistiku volit stejnou statistiku T = ns2 0, σ0 2 která má za platnosti σ 2 = σ0 2 rozdělení χ 2 (n. Za kritické obory W i (i = 7, 8, 9 pro testy T i (i = 7, 8, 9 na hladině významnosti α lze postupně volit množiny W 7 = t; t > χ 2 (n; 1 α, W 8 = t; t < χ 2 (n; α, W 9 = t; t < χ 2 (n; α 2 t > χ2 (n; 1 α 2. Jsou-li nulové hypotézy v testech T 7 a T 8 opačné k alternativním, zůstává tvrzení v platnosti. Příklad 2.8: Směrodatná odchylka zařízení na plnění lahví mléka nemá překročit 1 ml. Při kontrole byly zjištěny objemy 10 lahví v l:

30 30 Některé parametrické testy Předpokládáme, že data pochází z normálního rozdělení se známou střední hodnotou µ = 1 l. Můžeme zařízení považovat za dostatečně přesné s přípustným rizikem omylu 1%? Řešení: Předpokládáme, že objem lahví je normální náhodná veličina se známou střední hodnotou 1 l a zajímá nás rozptyl. Předpoklady z tvrzení 2.3 jsou splněny. 1. Budeme testovat hypotézu H 0 : σ l 2 proti hypotéze H : σ 2 > l 2 na hladině významnosti Můžeme použít test T 7, kde σ 2 0 = Testová statistika je tedy statistika Máme n = 10, µ = 1, potom T = ns2 0. σ0 2 s 2 0 = i=1 (x i 1 2. = l 2 = t. = = Kritický obor W na hladině významnosti α je Pro α = 0.01 a n = 10 je W = t; t > χ 2 (n; 1 α. χ 2 (n; 1 α = χ 2 (10; 0.99 = W = t; t > Vzhledem k tomu, že t W, zamítáne nulovou hypotézu na hladině významnosti Zařízení není dostatečně přesné. Riziko omylu je maximálně 1% Testy o rozptylu při neznámé střední hodnotě Pro testy o hodnotě rozptylu σ 2 normálního rozdělení nelze opět obecně použít tvrzení 2.3. Odhadem σ 2 při neznámé střední hodnotě je statistika S 2. Statistika (n 1S2 T = σ0 2 má za podmínky σ 2 = σ 2 0 rozdělení χ 2 (n 1 (viz tvrzení 3.1 z předcházejícího modulu. Když zvolíme T za testovou statistiku, pak kritické obory pro jednotlivé testy dostaneme zcela analogicky jako v odstavci Budeme pracovat s rozdělením χ 2 (n 1 místo s rozdělením χ 2 (n.

31 2.3 P-hodnota testu 31 Tvrzení 2.4: Testy o rozptylu při neznámé střední hodnotě Je-li (X 1, X 2,..., X n náhodný výběr z rozdělení X N(µ, σ 2 s neznámým rozptylem σ 2 a neznámou střední hodnotou µ a σ0 2 předem dané číslo, potom lze pro testy T 10 : hypotézy H 0 : σ 2 = σ0 2 proti hypotéze H : σ 2 > σ0, 2 T 11 : hypotézy H 0 : σ 2 = σ0 2 proti hypotéze H : σ 2 < σ0, 2 T 12 : hypotézy H 0 : σ 2 = σ0 2 proti hypotéze H : σ 2 σ0 2 za testovou statistiku volit stejnou statistiku T = (n 1S2, σ0 2 která má za platnosti σ 2 = σ0 2 rozdělení χ 2 (n 1. Za kritické obory W i (i = 10, 11, 12 pro testy T i (i = 10, 11, 12 na hladině významnosti α lze postupně volit množiny W 10 = t; t > χ 2 (n 1; 1 α, W 11 = t; t < χ 2 (n 1; α, W 12 = t; t < χ 2 (n 1; α 2 t > χ2 (n 1; 1 α 2. Jsou-li nulové hypotézy v testech T 10 a T 11 opačné k alternativním, zůstává tvrzení v platnosti. Poznámka 2.5: Testy hypotéz o rozptylu normálního rozdělení nelze použít v případě, kdy se nejedná o normální rozdělení. Úkol 2.3: Řešte předchozí příklad za předpokladu, že neznáte skutečnou střední hodnotu. Výsledek: H 0 : σ , H : σ 2 > , σ = s. = 0.015, t. = 20.25, W = t; t > 21.67, t W. Nezamítáme H 0. Data nedávají dostatek argumentů pro to, abychom udělali závěr, že zařízení není dostatečně přesné (s rizikem omylu P-hodnota testu Při klasickém přístupu k tesování hypotéz, kterým jsme se doposud zabývali, je hladina významnosti testu α zvolena předem. Při testování hypotéz se však stále častěji používá postup, při kterém se určí nejmenší hladina, při které bychom ještě hypotézu H 0 zamítli -tzv. P - hodnota testu. Vyjadřuje nejmenší horní hranici pravděpodobnosti počítané za platnosti nulové hypo-

32 32 Některé parametrické testy tézy, že dostaneme právě naši realizaci t testové statistiky T nebo realizaci ještě více odporující nulové hypotéze. Tak se např. při provedení testů z tvrzení 2.2 vypočítá realizace t testové statistiky T = X µ 0 S a následně P -hodnota testu. V případě pravostranné alternativní hypotézy, tj. v případě testu T 4, svědčí proti nulové hypotéze ty realizace testové statistiky, které jsou větší než nějaká konstanta. Potom P = P (T > t/µ = µ 0. V případě levostranné alternativní hypotézy, tj. v případě testu T 5, dostaneme P = P (T < t/µ = µ 0. V případě oboustranné alternativní hypotézy, tj. v případě testu T 6, dostaneme P 2 = min P (T < t/µ = µ 0, P (T > t/µ = µ 0. Nakreslete si obrázky! Když zamítneme hypotézu H 0 a přijmeme hypotézu H, dopustíme se maximálně 100P procentního omylu. Je-li tedy např. P =0.04, zamítáme H 0 s rizikem omylu maximálně 4%. Tedy hypotézu H 0 na hladině významnosti 0.05 zamítáme a na hladině významnosti 0.01 nezamítáme. K výpočtu P hodnoty testu potřebujeme znát distribuční funkci testové statistiky T za platnosti nulové hypotézy. Vzhledem k tomu, že v běžných statistických tabulkách nejsou tabelovány hodnoty distribučních funkcí (kromě rozdělení N(0, 1, ale kvantily, nejsme v praktických úlohách obecně schopni vypočítat P - hodnotu testu bez použití speciálního software. n Příklad 2.9: Vraťte se k příkladu 2.2 a řešte jej pomocí P -hodnoty testu. Řešení: V příkladu 2.2 jsme testovali hypotézu H 0 : µ = 31MP a proti hypotéze H : µ < 31MP a. Jednalo se o test T 2 z tvrzení 2.1. Hypotézu H 0 jsme zamítli s rizikem omylu 5%. Realizace t testové statistiky T byla t = Pro P - hodnotu testu dostáváme P = P (T < 2.899/µ = 31. Testová statistika T má podle tvrzení 2.1 za platnosti µ = 31 rozdělení N(0, 1 s distribuční funkcí Φ. Odtud P = Φ( = 1 Φ( = = Tedy hypotézu H 0 zamítáme s maximálním rizikem omylu 0.19%. Úkol 2.4: Řešte úlol 2.1 pomocí P - hodnoty testu. Výsledek: Pro P -hodnotu testu platí P = Hmotnost pytlů cementu není 50kg, riziko omylu je 0.14%.

33 2.4 Souvislost mezi testy hypotéz a intervalovými odhady 33 Vidíme tedy, že při použití P -hodnoty můžeme získat přesnější závěry o zamítnutí H 0. Z toho důvodu většina statistických programů používá právě P -hodnotu testu, V anglicky psaných výstupech se P -hodnota označuje jako P -value, Sig. level, P a podobně. Pro provedení testů o střední hodnotě a rozptylu normální náhodné veličiny s oběma neznámými parametry můžeme využít např. STATGRAPHICS a to nabídku Describe Numeric Data One-Sample Analysis. 2.4 Souvislost mezi testy hypotéz a intervalovými odhady V předchozím modulu jsme se zabývali intervalovými odhady parametrů rozdělení, v této kapitole jsme se naučili testovat hypotézy o hodnotách těchto parametrů. Oba postupy spolu úzce souvisí. Uvažujme např. test T 11 z tvrzení 2.4 hypotézy H 0 : σ 2 = σ 2 0 proti hypotéze H : σ 2 < σ 2 0 na hladině výnamnosti α. Podle tvrzení 2.4 je testová statistika T = (n 1S2 σ 2 0 a kritický obor je množina W = W 11 = t; t < χ 2 (n 1; α. Hypotézu H 0 zamítneme právě tehdy, když (n 1s 2 σ 2 0 < χ 2 (n 1; α σ 2 0 > σ 2 0 (n 1s2 χ 2 (n 1; α ( (n 1s 2 0; χ 2 (n 1; α Tedy hypotézu H : σ 2 < σ 2 0 přijmeme (s rizikem omylu maximálně 100α%, když σ 2 0 neleží v realizaci 100(1 α% -ního pravostranného intervalového odhadu rozptylu normálního rozdělení s neznámou střední hodnotou µ. Pro test T 10 z tvrzení 2.4 bychom dostali, že hypotézu H : σ 2 > σ 2 0 přijmeme (s rizikem omylu maximálně 100α%, když σ 2 0 neleží v realizaci 100(1 α% -ního levostranného intervalového odhadu rozptylu normálního rozdělení s neznámou střední hodnotou µ. A podobně pro test T 12 z tohoto tvrzení hypotézu

34 34 Některé parametrické testy H : σ 2 σ 2 0 přijmeme (s rizikem omylu maximálně 100α%, když σ 2 0 neleží v realizaci 100(1 α% -ního oboustranného intervalového odhadu rozptylu normálního rozdělení s neznámou střední hodnotou µ. Při testování hypotéz o parametrech rozdělení jsme tedy místo kritických oborů mohli konstruovat příslušné intervaly spolehlivosti a o zamítnutí nebo nezamítnutí nulové hypotézy H 0 rozhodnout na základě výše naznačeného postupu. Příklad 2.10: Využijte při testování střední hodnoty v příkladu 2.5 postup testování pomocí intervalového odhadu. Řešení V příkladu 2.5 jsme testovali hypotézu H 0 : µ = 250 MPa proti hypotéze H : µ = 250 MPa na hladině významnosti 0.05 o střední hodnotě normálního rozdělení při neznámém rozptylu σ 2. Hypotézu H přijmeme s rizikem omylu 100α% právě tehdy, když µ 0 = 250 neleží v realizaci 100(1 α% - ního oboustranného intervalového odhadu střední hodnoty µ normálního rozdělení s neznámým rozptylem σ 2. Podle kapitoly 3 předchozího modulu dostaneme, že realizace 95 procentního oboustranného intervalového odhadu střední hodnoty µ je v našem případě interval , Protože tento interval neobsahuje hodnotu µ 0 = 250, přijímáme hypotézu H s rizikem omylu 5%. 2.5 Kontrolní otázky 1. Jaké znáte testy o parametrech normálního rozdělení? 2. Jaké předpoklady musí splňovat jednovýběrový a párový t-test? 3. Lze použít testy o parametrech normálního rozdělení i v případě, že náhodný výběr nepochází z normálního rozděleni? 4. Jak testujeme pomocí P - hodnoty testu? 5. Jak testujeme pomocí intervalového odhadu? 2.6 Cvičení 1. Dlouhodobým statistickým šetřením bylo zjištěno, že průměrná rychlost autobusové linky je 40 km/h. Při změně trasy byly zjištěn následující průměrné rychlosti v (km/h: 41, 39, 42, 39, 43, 45, 40, 38. Ověřte na hladině významnosi 0.05, zda změna trasy vede ke zvýšení průměrné rychlosti. 2. Při odběru deseti vzorků posypového materiálu na dálnici byl získán následující soubor poměrných hodnot obsahu určité chemikálie vzhledem

35 2.6 Cvičení 35 k normovanému předpisu: 0.96, 0.73, 0.83, 0.55, 0.79, 1.34, 0.60, 1.19, 1.35, Předpokládáme, že realizace pochází z normálního rozdělení. Ověřte na hladině významnosti 0.05, zda a střední hodnota obsahu je menší než 0.8; b směrodatná odchylka obsahu je menší než Pro kontrolu správnosti nastavení měřícího přístroje bylo provedeno 10 zkušebních měření se správnou hodnotou 20. Byly získány tyto výsledky: 20.23, 20.21, 20.19, 20.16, 20.26, 20.22, 20.23, 20.26, 20.23, Předpokládáme, že chyba měření má normální rozdělení. Ověřte na hladině významnosti 0.05, zda je chyba měření zatížena systematickou chybou. 4. Měřicí přístroj nevykazuje systematické chyby. Při měření konstantní veličiny jsme zjistili následující chyby měření v mm: Třída n j Třída n j Ověřte na hladině významnosti 0.01, zda je přesnost měřicího přístroje vyjádřená směrodatnou odchylkou 0.01 mm. 5. Osm náhodně vybraných domácností v sídlišti mělo v roce 2002 a 2003 spotřebu studené vody v m 3 na osobu: Domácnost Spotřeba 2002 (X Spotřeba 2003 (X Ověřte na hladině významnosti 0.05, zda došlo u domácností sídliště ke snížení spotřeby studené vody. 6. Při výrobě stěnových panelů se předpokládá, že směrodatná odchylka jejich výšky je 3 mm. Z patnácti náhodně vybraných panelů byla odhadnuta směrodatná odchylka σ = s. = 3.74 mm. Předpokládáme, že výška panelů má přibližně normální rozdělení. Ověřte na hladině významnosti 0.01, zda je směrodatná odchylka skutečně 3 mm pomocí a klasického přístupu k testování hypotéz, b intervalového odhadu, c P-hodnoty testu. 7. Při sledování doby bezporuchového chodu určitého typu zařízení byly zjištěny následující výsledky v hodinách: 210, 65, 51, 174, 63, 263, 61, 72. Předpokládá se, že bezporuchový chod zařízení X má přibližně exponenciální rozdělení s parametry 0 a λ, tj. hustotu g(x = (1/λexp( x/λ pro x 0, pro jiná x je g(x = 0. Ověřte na hladině významnosti 0.05, zda je střední doba bezporuchového chodu zařízení větší než 70 hodin.

36 36 Některé parametrické testy 2.7 Klíč a výsledky cvičení Cvičení: 1. H 0 : µ 40, H : µ > 40, x = , s. = 2.357, t. = 1.050, W = t; t > 1.895, t W. Na hladině významnosti 0.05 se nepodařilo prokázat, že změna trasy vede ke zvýšení průměrné rychlosti. 2. x = 0.947, s. = a H 0 : µ 0.8, H : µ > 0.8, t. = 1.587, W = t; t > 1.833, t W. Na hladině významnosti 0.05 se nepodařilo prokázat, že je střední hodnota obsahu větší než 0.8. b H 0 : σ , H : σ 2 > 0.2 2, t. = , W = t; t > 16.92, t W. Směrodatná odchylka obsahu je větší než 0.2 s rizikem omylu 5%. 3. H 0 : µ = 20, H : µ 20, x = , s. = 0.037, t. = 2.393, W = t; t < t > 2.262, t W. Měřicí přístroj vykazuje systematické chyby. Riziko omylu je 5%. 4. H 0 : σ 2 = , H : σ 2 = , σ 2 = s 2. 0 = , t = , W = t; t < t > 48.29, t W. Na hladině významnosti 0.01 nezamítáme hypotézu, že je přesnost měřícího přístroje vyjádřená směrodatnou odchylkou H 0 : µ = E(X 2 E(X 1 0, H : µ < 0, µ = x = 0.250, σ = s = , t = 0.475, W = t; t < 1.895, t W. Zjištěné údaje nepotvrzují zmenšení spotřeby vody. 6. H 0 : σ 2 = 3 2, H : σ a t = 21.76, W = t; t < t > 31.32, t W. Nezamítáme hypotézu, že je směrodatná odchylka rovna 3 mm. b , Hypotézu H 0 nezamítáme. c P = 2(1 P (T < 21.76/σ 2 = 3 2 (0.1, 0.2. P- hodnota testu je větší než 0.01, hypotézu H 0 na hladině významnosti 0.01 nezamítáme, riziko mylného zamítnuti je větší než 10%. 7. Zajímá nás střední hodnota bezporuchového chodu zařízení X. Protože náhodná veličina X nemá normální rozdělení a rozsah výběru je menší než 30, nemůžeme použít testy o střední hodnotě normálního rozdělení. Protože E(X = λ, zajímají nás testy o parametru λ exponenciálního rozdělení. Bodovým odhadem parametru λ je X. V literatuře (např. [12] nalezneme, že statistika T = 2nX λ 0 má za platnosti λ = λ 0 rozdělení χ 2 (2n (v našem případě λ 0 = 70. Testujeme H 0 : λ 70, H : λ > 70. Statistiku T zvolíme za testovou statistiku. Potom W = t; t > χ 2 (2n; 1 α, x = , t = 27.4, W = t; t > 26.3, t W. Střední doba bezporuchového chodu zařízení je větší než 70 hodin s rizikem omylu maximálně 5%.

37 Kapitola 3 Testy dobré shody Cíle Po přečtení a nastudování této kapitoly budete umět testovat nulovou hypotézu, že náhodný výběr o dostatečně velkém rozsahu pochází ze stanoveného rozdělení. Doba potřebná ke studiu K nastudování a pochopení této kapitoly budete potřebovat minimálně 3 hodiny. Klíčová slova Pearsonův χ 2 - test dobré shody (čtěte chí-kvadrát. V teorii pravděpodobnosti jsme předpokládali, že známe zákon rozdělení náhodné veličiny X, tj. známe její distribuční funkci, resp. rozdělovací funkci. V matematické statistice jsme pak dosud předpokládali, že známe typ rozdělení až na nějaké parametry ϑ 1, ϑ 2,..., ϑ m. K úplné znalosti rozdělení náhodné veličiny X pak v této situaci stačilo tyto parametry odhadnout. Pokud si však rozdělením, resp. tvarem rozdělení nejsme jisti, je zapotřebí testovat, zda není předpoklad o tvaru rozdělení chybný. Připomeňme v této souvislosti histogram a úsečkový diagram rozdělení četností z kapitoly 1 předchozího modulu. Podle jejich tvaru lze usuzovat na tvar rozdělovací funkce náhodné veličiny X. K tomu je samozřejmě vhodné znát grafy některých důležitých rozdělovacích funkcí, abychom měli histogram, resp. úsečkový diagram s čím srovnávat. Tak např. z histogramu rozdělení relativních četností pevnosti betonu z příkladu 1.5 kapitoly 1 předchozího modulu se lze domnívat, že pevnost betonu bude mít normální a ne např. exponenciální rozdělení. Podobně z úsečkového diagramu rozdělení absolutních četností počtu aut čekajících na zelenou z následujícího příkladu téže kapitoly nebudeme asi usuzavat na to, že má počet aut klasické rozdělení. Ve cvičení k této kapitole budete testovat hypotézu, zda má Poissonovo rozdělení. Tyto tzv. grafické metody však slouží pouze k vytvoření domněnky o tvaru rozdělení. Je-li vytvořena hypotéza (domněnka o tvaru rozdělení náhodné veličiny X, přejdeme

38 38 Testy dobré shody k některému z testů, kterým tuto hypotézu nezamítneme, resp. zamítneme s dostatečně malým rizikem omylu. Tyto testy nazýváme testy (dobré shody. My se zde budeme zabývat pouze jedním testem shody - a to Pearsonovým χ 2 -testem dobré shody. Je zapotřebí si uvědomit, že hypotézu, vytvořenou z určité realizace náhodného výběru z X, bychom správně měli ještě ověřit na jiné realizaci náhodného výběru z X. Pro použití Pearsonova testu dobré shody je zapotřebí znát jeho podstatu, vyspělejší uživatel statistiky pak může využít nějaký statistický software např. STATGRAPHICS, kde má možnost použít testy dobré shody v případě porovnávání s 22 základními typy rozdělení (viz nabídka Describe Distribution Fitting. Přitom testování je založeno na P -hodnotě testu. My zde provedeme výklad klasického přístupu. Domníváme se, že náhodná veličina X má rozdělovací funkci g(x; ϑ 1,..., ϑ m, kde ϑ 1,..., ϑ m jsou neznámé parametry. Připouštíme i m = 0, tj. že rozdělovací funkce je g(x a nejsou v ní obsaženy žádné neznámé parametry. Je-li m 1, použijeme realizaci (x 1, x 2,..., x n náhodného výběru (X 1, X 2,..., X n z X pro výpočet realizací odhadů parametrů ϑ 1, ϑ 2,..., ϑ m - označme je ϑ 1, ϑ 2,..., ϑ m. Realizace odhadů dosadíme za parametry do rozdělovací funkce g, dostaneme rozdělovací funkci g(x; ϑ 1, ϑ 2,..., ϑ m, která již neobsahuje neznámé parametry. Pearsonův test dobré shody je pak test hypotézy H 0 : X má rozdělovací funkci g(x; ϑ 1, ϑ 2,..., ϑ m proti hypotéze H: X nemá rozdělovací funkci g(x; ϑ 1, ϑ 2,..., ϑ m pro žádný z možných parametrů ϑ 1, ϑ 2,..., ϑ m na hladině významnosti α. Dále budeme stručně psát, že testujeme H 0 : X g(x; ϑ 1, ϑ 2,..., ϑ m proti H : X g(x; ϑ 1, ϑ 2,..., ϑ m. Příklad 3.1: Domníváme se, že náhodná veličina X má rozdělení 1 N(0, 1, 2 N(µ, 1, 3 N(µ, σ 2. V situaci 1 nejsou v rozdělení žádné neznáme parametry, tedy m = 0. V situaci 2 máme jeden neznámý parametr µ, tedy m = 1. Musíme vypočítat realizaci µ odhadu µ. V situaci 3 máme m = 2 a musíme vypočítat realizace µ a σ 2 odhadů parametrů µ a σ 2. Potom bychom v jednotlivých situacích testovali hypotézy 1 H 0 : X N(0, 1 proti H : X N(0, 1, 2 H 0 : X N( µ, 1 proti H : X N(µ, 1 pro žádné µ R, 3 H 0 : X N( µ, σ 2 proti H : X N(µ, σ 2 pro žádné (µ, σ 2 R (0,. V případě zamítnutí hypotézy H 0 v testu 1 nemá veličina X normální rozdělení s parametry 0 a 1, ale může mít normální rozdělení s jinými parametry. V případě zamítnutí hypotézy H 0 v testu 2 nemá veličina X normální rozdělení s rozptylem 1, ale může mít normální rozdělení s rozptylem různým od čísla 1. A v případě zamítnutí hypotézy H 0 v testu 3 nemá veličina X normální rozdělení.

39 39 Postup při samotném testu je pak následující: Předpokládáme, že platí hypotéza H 0, tj. že náhodná veličina X má rozdělovací funkci g(x; ϑ 1, ϑ 2,..., ϑ m. Obor hodnot náhodné veličiny X rozdělíme do k disjunktních tříd Ω j (j = 1, 2,..., k a to zpravidla následovně: intervalů v případě spojité náhodné veličiny; jednobodových, resp. vícebodových množin obsahujících body oboru hodnot náhodné veličiny X v případě diskrétní náhodné veličiny. Označme N j absolutní četnost třídy Ω j, tj. počet veličin X 1, X 2,..., X n, které nabudou hodnoty z třídy Ω j pro j = 1, 2,..., k. Uvědomme si, že N j je pro každé j náhodnou veličinou. Zřejmě Označme dále N 1 + N N k = n. p j = P ( X Ω j /H 0, j = 1, 2,..., k. (3.1 Zdůrazněme, že pravděpodobnosti p j počítáme za předpokladu platnosti hypotézy H 0. Protože Ω 1 Ω 2 Ω k = Ω, platí p 1 + p p k = 1. Za testovací kritérium zvolil K. Pearson statistiku T = k (N j np j 2 j=1 np j, (3.2 která má za platnosti hypotézy H 0 při dostatečně velkém rozsahu výběru n přibližně rozdělení χ 2 (k m 1. Dostatečná velikost rozsahu n je zaručena tím, že lze realizaci náhodného výběru z X roztřídit do tříd Ω j tak, že np j 1 pro každé j, (3.3 np j 5 pro alespoň 80% j. (3.4 Pearsonův test dobré shody by se měl tedy používat v případě splnění podmínek (3.3 a (3.4. Zbývá určit kritický obor pro test hypotézy H 0 proti hypotéze H. Kdyby platila hypotéza H 0, pak by pravděpodobnost, že výsledek pokusu X nabude hodnoty ze třídy Ω j, byla p j (viz vztah (3.1. Odhad pravděpodobnosti, že

40 40 Testy dobré shody výsledek pokusu padne do třídy Ω j, je zřejmě počet příznivých výsledků ku celkovému počtu možných výsledků - tedy náhodná veličina N j /n. Takže v prospěch hypotézy H 0 svědčí ty realizace n j /n veličiny N j /n, které jsou dostatečně blízké číslu p j, tj. pro které n j /n =.. p j, tj. pro které n j = npj pro každé j = 1,..., k. Číslo n j se někdy v této souvislosti nazývá empirická četnost třídy Ω j a číslo np j pak teoretická četnost třídy Ω j. V prospěch hypotézy H 0 svědčí tedy ty realizace t testové statistiky T, které jsou blízké číslu nula. Odtud dostáváme, že kritický obor W pro test hypotézy H 0 proti hypotéze H na hladině významnosti α je množina W = t; t > χ 2 (k m 1; 1 α. (3.5 Vraťme se nyní k výpočtu pravděpodobností p j (j = 1, 2,..., k. V případě spojité náhodné veličiny X je třída Ω j interval. Označme jeho krajní body jako a j 1, a j pro j = 1,..., k. Potom p j = P ( X Ω j /H 0 = P ( aj 1 < X < a j /H 0 = a j a j 1 g(x; ϑ 1, ϑ 2,..., ϑ m dx pro j = 1, 2,..., k. Výhodnější pro výpočty se často jeví vyjádřit nejprve v hypotéze H 0 z hustoty g distribuční funkci G náhodné veličiny X a pak teprve počítat p j. Zřejmě potom G(x; ϑ 1, ϑ 2,..., ϑ m = x g(v; ϑ 1, ϑ 2,..., ϑ m dv, p j = G(a j ; ϑ 1, ϑ 2,..., ϑ m G(a j 1 ; ϑ 1, ϑ 2,..., ϑ m pro j = 1, 2,..., k. V případě diskrétní náhodné veličiny X je Ω j jednobodová nebo vícebodová podmnožina oboru hodnot veličiny X, potom p j = P ( X Ω j /H 0 = x Ω j g(x; ϑ 1, ϑ 2,..., ϑ m pro j = 1, 2,..., k. Příklad 3.2: Při zavádění internetu do domácností se předpokládá zájem 20%. Z 80 náhodně vybraných domácností velkého sídliště projevilo zájem o internet 10. Potvrzuje tento průzkum původní předpoklad? Přípustné riziko omylu je 5 %. Řešení: Označme 0 domácnost nebude mít zájem o internet, X = 1 domácnost bude mít zájem o internet. Máme ověřit, zda P (X = 1 = 0.2. Náhodná veličina X má za tohoto předpokladu alternativní rozdělení s parametrem p = 0.2, tj. pravděpodobnostní

41 41 funkci 1. Budeme testovat hypotézu 0.8 pro x = 0, g(x = 0.2 pro x = 1, 0 jinak. H 0 : X g(x proti hypotéze H : X g(x na hladině významnosti Test hypotézy o parametru p alternativního rozdělení jsme převedli na test o rozdělení náhodné veličiny X. Realizaci náhodného výběru z X máme roztříděnou do k = 2 tříd Ω 1 = 0, Ω 2 = 1 - viz sloupec 2 a 3 tabulky 3.1. Do této tabulky zapisujeme i další výsledky. Budeme chtít použít Pearsonův test dobré shody. Pro výpočet realizace testové statistiky (3.2 a k ověření podmínek použitelnosti testu (3.3 a (3.4 musíme vypočítat teoretické pravděpodobnosti (3.1, tj. p j = P ( X Ω j /H 0 pro j = 1, 2. Platí-li hypotéza H 0, má náhodná veličina X rozdělovací funkci g a tedy p 1 = P (X = 0/H 0 = 0.8, p 2 = P (X = 1/H 0 = 0.2. Odtud pro teoretické četnosti np j dostaneme np 1 = 64, np 2 = 16. Podmínky použitelnosti Pearsonova testu jsou tedy splněny. Vypočítáme realizaci t testové statistiky (3.2, tj. statistiky T = k (N j np j 2 j=1 - výpočty jsou v tabulce 3.1. V posledním řádku tabulky jsou prováděny součty (tam, kde to má smysl jednak pro kontrolu výpočtů (sloupce 3-5 a jednak pro samotný výpočet realizace t testové statistiky T (sloupec 6. Tedy t = 2 j=1 (n j np j 2 np j = np j ( = = ( Kritický obor W pro Perasonův test dobré shody na hladině významnosti α je (3.5, tj. W = t; t > χ 2 (k m 1; 1 α. Vzhledem k tomu, že počet tříd je dva (tj. k = 2, v rozdělení g nejsou neznámé parametry (tj. m = 0 a α = 0.05, dostaneme W = t; t > χ 2 (1; 0.95 = t; t >

42 42 Testy dobré shody Tabulka 3.1: Třída n j p j np j (n j np j 2 np j Ω Ω Součet Protože t W, hypotézu H 0 na hladině významnosti 0.05 nezamítáme. Výsledky testu nejsou statisticky významné na hladině významnosti Data nedávají dostatek argumentů pro to, abychom udělali závěr, že předpokládaný zájem o zavedení internetu do domácností není 20%. Vraťme se ještě k tabulce 3.1. Ve sloupci 5 jsou uvedena čísla np j, tj. teoretické četnosti tříd Ω j, ve sloupci 3 jsou pak uvedeny empirické četnosti n j. Kdyby platila hypotéza H 0, pak by v první třídě mělo být přibližně 64 výsledků a v druhé třídě přibližně 16 výsledků. Tj. za platnosti nulové hypotézy by o internet z 80 domácností nemělo mít zájem přibližně 64 a mělo mít zájem přibližně 16 domácností. Příklad 3.3: Prohlídkou pěti set tabulí skla byly zjištěny tyto počty bublin v jednotlivých tabulích Počet bublin a více Počet tabulí Ověřte na hladině významnosti 0.05, zda má počet bublin v tabuli skla Poissonovo rozdělení. Řešení: Náhodnou veličinou X je zde počet bublin v tabuli skla. Máme ověřit, zda má náhodná veličina Poissonovo rozdělení. Budeme chtít použít χ 2 test dobré shody. K dispozici máme realizaci náhodného výběru z X o rozsahu n = 500, která byla roztříděna do pěti tříd. V první řadě si uvědomme, že empirická četnost v poslední třídě je velmi malá. Dá se očekávat, že by i teoretická četnost odpovídající této třídě byla velmi malá, a proto sloučíme poslední dvě třídy. Východiskem pro výpočy jsou tedy sloupce 2 a 3 tabulky 3.2. Domníváme-li se, že má náhodná veličina X Poissonovo rozdělení, tj. X P o(λ, neznáme v rozdělovací funkci veličiny X parametr λ, proto jej musíme nejprve odhadnout. Z teorie pravděpodobnosti víme, že E(X = λ, z kapitoly 2 předchozího modulu víme, že nestranným odhadem E(X = λ je X. Vypočítejme tedy z dat v tabulce 3.2 realizaci λ = x tohoto odhadu parametru λ. Dostaneme λ = x =

43 43 Tabulka 3.2: (n Třída Počet bublin n j p j np j np j 2 j Ω Ω Ω Ω 4 3 a více Součet np j 1. Budeme testovat hypotézu H 0 : X P o(0.672 proti hypotéze H : X P o(λ na hladině významnosti Předpokládejme tedy, že platí hypotéza H 0, tj. náhodná veličina X má pravděpodobnostní funkci x e g(x = pro x = 0, 1, 2,..., x! 0 jinak. Pro výpočet testové statistiky χ 2 -testu dobré shody a ověření podmínek jeho použitelnosti potřebujeme vypočítat teoretické pravděpodobnosti (3.1. Postupně dostaneme p 1 = P ( ( e X Ω 1 /H 0 = P X = 0/H0 = g(0 = 0! p 2 = P ( ( e X Ω 2 /H 0 = P X = 1/H0 = g(1 = 1! p 3 = P ( ( e X Ω 3 /H 0 = P X = 2/H0 = g(2 = 2! p 4 = P ( ( ( X Ω 3 /H 0 = P X 3/H0 = 1 P X < 3/H0 = 1 [ P ( X = 0/H 0 + P ( X = 1/H0 + P ( X = 2/H0 ] = 1 [ g(0 + g(1 + g(2 ]. = = 0.511,. = 0.343,. = 0.115, Výsledky jsou uvedeny ve sloupci 4 tabulky 3.2. Ze sloupce 5 téže tabulky plyne, že jsou splněny podmínky použitelnosti χ 2 testu (3.3 a (3.4. Přejděme tedy k výpočtu realizace t testové statistiky (3.2, dostaneme t = 4 j=1 (n j np j 2. ( ( = + + np j = (viz součet v posledním sloupci tabulky 3.2.

44 44 Testy dobré shody 3. Kritický obor W pro χ 2 - test na hladině významnosti α je (3.5, tj. W = t; t > χ 2 (k m 1; 1 α. Máme k = 4, m = 1, α = 0.05, dostaneme W = t; t > χ 2 (2; 0.95 = t; t > Protože t W, nezamítáme hypotézu H 0 na hladině významnosti 0.05, tj. nezamítáme hypotézu o shodě s Poissonovým rozdělením. Příklad 3.4: Ověřte na hladině významnosti 0.01, resp. 0.05, zda má náhodná veličina X rozdělovací funkci 3x 2 pro x (0, 1, g(x = 0 jinak. Realizace náhodného výběru z X byla roztříděna následovně: Interval Počet výsledků Řešení: 1. Budeme testovat hypotézu H 0 : X g(x proti hypotéze H 0 : X g(x na hladině významnosti 0.01, resp Budeme chtít použít χ 2 - test dobré shody. Předpokládejme tedy, že platí hypotéza H 0, tj. náhodná veličina X má hustotu g. K dispozici máme realizaci náhodného výběru z X o rozsahu n = 100, která je roztříděna do pěti intervalů - označme je Ω j (j = 1,..., 5. Nejprve vypočítáme pravděpodobnosti (3.1, tj. p j = P ( X Ω j /H 0 pro j = 1,..., 5. Označme a j 1, a j krajní body intervalu Ω j pro j = 1,..., 5. Potom p j = P ( X Ω j /H 0 = P ( aj 1 < X < a j /H 0 pro j = 1,..., 5. Pravděpodobnosti p j budeme počítat pomocí distribuční funkce G náhodné veličiny X. Postupně dostaneme 0 pro x (, 0, x x G(x = g(v dv = 3v 2 dv = x 3 pro x (0, 1, 0 1 pro x 1,.

45 45 Potom p j = G(a j G(a j 1 pro j = 1,..., 5. Tedy p 1 = G(a 1 G(a 0 = G(0.2 G(0.0 = = 0.008, p 2 = G(a 2 G(a 1 = G(0.4 G(0.2 = = 0.056,. p 5 = G(a 5 G(a 4 = G(1.0 G(0.8 = = Vypočítané hodnoty G(a j v horních hranicích intervalů Ω j jsou ve sloupci 4, hodnoty p j jsou ve sloupci 5 tabulky 3.3. Ze sloupce 6 téže tabulky je patrné, že není splněna první podmínka (3.3 použitelnosti χ 2 - testu shody. Tento nedostatek lze v naší situaci odstranit tak, že sloučíme první a druhou třídu, dostaneme tak prvních šest sloupců v tabulce 3.4. Obecně se to však podařit nemusí. V praxi se pokládá za dostačující, aby byl rozsah výběru větší než 50. Nyní můžeme přistoupit k samotnému provedení χ 2 - testu dobré shody. Tabulka 3.3: Třída a j 1 a j n j G(a j p j np j Ω Ω Ω Ω Ω Součet Tabulka 3.4: Třída a j 1 a j n j G(a j p j np j (n j np j 2 Ω Ω Ω Ω Součet np j

46 46 Testy dobré shody Realizace t testové statistiky (3.2 je t = + 4 j=1 (n j np j 2 np j = ( ( ( ( = = Kritický obor W α pro χ 2 - test na hladině významnosti α je (3.5, tj. W α = t; t > χ 2 (k m 1; 1 α. V hustotě g v hypotéze H 0 nebyly žádné neznámé parametry, tj. m = 0. Realizaci náhodného výběru z X máme přerozdělenou do čtyř tříd, tj. k = 4. Tedy W α = t; t > χ 2 (3; 1 α. Pro α = 0.01 a α = 0.05 dostáváme W 0.01 = t; t > χ 2 (3; 0.99 = W 0.05 = t; t > 11.35, t; t > χ 2 (3; 0.95 = t; t > Protože t W 0.01, nezamítáme hypotézu H 0 na hladině významnosti Protože t W 0.05, zamítáme hypotézu H 0 na hladině významnosti Tedy na této hladině významnosti přijímáme hypotézu H, tj. realizace náhodného výběru nepochází z rozdělení s hustotou g, riziko omylu je 5%. Příklad 3.5: Vraťte se k příkladu 8 ze cvičení kapitoly 1 předchozího modulu a zjistěte, zda je vlhkost stavebního materiálu Hobrex normální náhodná veličina. Přípustné riziko omylu je 5%. Řešení: Náhodnou veličinou X je vlhkost stavebního materiálu Hobrex. Domníváme-li se, že X je normální náhodná veličina, tj. X N(µ, σ 2, neznáme v rozdělovací funkci náhodné veličiny X dva parametry µ a σ 2, které musíme nejprve odhadnout. K dispozici máme realizaci náhodného výběru z X o rozsahu n = 100, která byla roztříděna do pěti tříd Ω j j = 1,..., 5. Realizace µ a σ odhadů µ a σ jste počítali v příkladu 8. Dostali jste 1. Budeme testovat hypotézu µ = x = [%], σ = s. = 0.86 [%]. H 0 : X N(22.12, proti hypotéze H : X N(µ, σ 2 na hladině významnosti 0.05.

47 47 2. Předpokládejme tedy, že X N(22.12, K ověření podmínek použitelnosti Pearsonova testu a provedení samotného testu potřebujeme vypočítat pravděpodobnosti (3.1, tj. p j = P ( X Ω j /H 0. Označme opět a j 1, a j krajní body intervalu Ω j pro j = 1,..., 5. Potom p j = P ( a j 1 < X < a j /H 0. Platí-li hypotéza H 0, má veličina X rozdělení N(22.12, Označme její distribuční funkci F a vyjádřeme ji pomocí distribuční funkce Φ rozdělení N(0, 1, jejíž hodnoty jsou tabelovány. Potom ( x X N(22.12, F (x = Φ Odtud pro j = 1, 2,..., 5 platí p j = P ( a j 1 < X < a j /H 0 = F (aj F (a j 1 ( aj ( aj = Φ Φ Stačí tedy pomocí tabulek distribuční funkce Φ rozdělení N(0, 1 určit hodnoty distribuční funkce Φ( a j Výsledky jsou uvedeny ve 0.68 sloupci 6 tabulky 3.5. Potom ( a ( a p 1 = Φ Φ( = Φ = Φ( 1.59 = , ( a ( a p 2 = Φ Φ = Φ( 0.43 Φ( = = ,. ( a p 5 = Φ( Φ = 1 Φ(2.6 = = Hodnoty p j jsou uvedeny ve sloupci 6 téže tabulky. Ze sloupce 7 je patrné, že jsou splněny podmínky použitelnosti χ 2 - testu, tj. podmínky (3.3 a (3.4. Ze sloupce 8 dostáváme realizaci t testové statistiky (3.2 χ 2 - testu, tj. 5 (n j np j 2. t = = np j j=1 3. Kritický obor W pro χ 2 - test shody na hladině významnosti α je (3.5, tj. W = t; t > χ 2 (k m 1; 1 α. Máme k = 5, m = 2, α = 0.05, dostaneme W = t; t > χ 2 (2; 0.95 = t; t > Protože t W, nezamítáme hypotézu H 0 na hladině významnosti 0.05, tj. nezamítáme hypotézu o shodě s normálním rozdělením.

48 48 Testy dobré shody Tabulka 3.5: Třída a j 1 a j n j a j x s Φ( a j x s p j np j (n j np j 2 np j Ω Ω Ω Ω Ω Součet Kontrolní otázky 1. Jaký je postup při Pearsonově testu dobré shody? 2. Jaké podmínky by měly být splněny pro použití Pearsonova testu dobré shody? 3. Co znamenají čísla k a m ve vztahu (3.5? 4. Proč nelze pro test shody použít statistiku T = k j=1 (N j np j? 3.2 Cvičení 1. Cestovní kancelář předpokládá, že ze zákazníků, kteří mají zájem o pobytový zájezd u moře, bude mít 25% zájem pouze o snídani, 50% o polopenzi a 10% o plnou penzi. Pro ověření tohoto předpokladu náhodně vybrali 100 zájemců o tento druh zájezdu a zjistili, že 20 má zájem pouze o snídani, 46 o polopenzi a 9 o plnou penzi. Můžeme na hladině významnosti 0.05, resp považovat předpoklad cestovní kanceláře za správný? 2. Při parlamentních volbách získaly dvě nejsilnější strany 30% a 20% hlasů, zbytek byl rozdělen mezi ostatní strany. Při volbách do obecního zastupitelstva v jedné obci získaly tyto strany postupně 1400 a 900 z 5000 odevzdaných hlasů. Ověřte na hladině významnosti 0.05, zda rozdělení hlasů při místních volbách odpovídá výsledkům při parlamentních volbách. 3. Posuďte charakter následujících úloh a řešte je: a Je známo, že 50% výrobků je I. jakosti, 40% výrobků je II. jakosti a 10% výrobků je vadných. Jaká je pravděpodobnost, že z 60 náhodně vybraných výrobků budou 3 vadné? b Z 60 náhodně vybraných výrobků bylo 28 I. jakosti, 29 II. jakosti a 3 vadné.

49 3.3 Klíč a výsledky cvičení V jakém rozmezí lze očekávat s pravděpodobností 0.95 podíl vadných výrobků? 2. Lze tvrdit, že podíl vadných výrobků je 10%? Přípustné riziko omylu je 5%. 3. Má výrobce pravdu, když tvrdí, že 50% výrobků je I. jakosti, 40% výrobků je II. jakosti a zbývající nevyhovující? 4. Ověřte na hladině významnosti 0.05, zda realizace náhodného výběru roztříděná do následující tabulky pochází z rozdělení s hustotou f(x = a(1 + x 2 pro x ( 1, 1 a f(x = 0 pro jiná x. Interval Četnost Předpokládáme, že u 42 náhodně vybraných elektronických prvků určitého typu byla změřena životnost (v hodinách a výsledky byly roztříděny do následující tabulky: Doba Četnost Ověřte na hladině významnosti 0.01, zda lze životnost tohoto typu prvků považovat za náhodnou veličinu s exponenciálním rozdělením. 6. Máme ověřit na hladině významnosti 0.05, zda jsou okamžiky vzniku zmetků při výrobě rovnoměrně rozděleny během osmihodinové pracovní doby. Za tím účelem byl určitou dobu sledován vznik zmetků během této pracovní doby, výsledkem byly okamžiky vzniku 80 zmetků. Tyto okamžiky byly roztříděny do osmi 1-hodinových intervalů a zjistily se následující četnosti: Hodina Četnost Zjistěte, zda lze pro pevnost betonu v příkladě 1.5 kapitoly 1 předchozího modulu použít model normálního rozdělení. Přípustné riziko omylu je 1%. 8. Ověřte na hladině významnosti 0.05, zda se počet aut čekajících na zelenou v příkladu 1.4 kapitoly 1 předchozího modulu řídí Poissonovým rozdělením. 3.3 Klíč a výsledky cvičení Otázky: 4. Protože T = 0. Cvičení:

50 50 Testy dobré shody. 1. t = 8.087, W 0.01 = t; t > 11.35, W 0.05 = t; t > Na hladině významnosti 0.05, resp zjištěné údaje dávají, resp. nedávají dostatek argumentů, abychom udělali závěr, že předpoklad cestovní kanceláře je nesprávný. 2. t. = , W = t; t > Rozdělení hlasů při místních volbách neodpovídá rozdělení hlasů při parlamentních volbách. Riziko omylu je 5%. 3. a Tato úloha je pravděpodobnostní. Je-li X počet vadných výrobků mezi 60 výrobky, potom X Bi(n = 60, p = 0.1, odtud P (X = 3 = Z 60 náhodně vybraných výrobků budou 3 vadné s pravděpodobností b Všechny úlohy jsou z oblasti matematické statistiky. 1. Jde o konstukci 95 procentního inervalového odhadu parametru p (střední hodnoty alternativního rozdělení. Vzhledem k tomu, že n > 30, lze použít inervalový odhad střední hodnoty rozdělení N(µ, σ 2. Dostaneme x = 0.05, s = , 0 p Jde o úlohu testování hypotéz o parametru p alternativního rozdělení. Vzhledem k tomu, že 0.1 0, 0.106, na hladině významnosti 0.05 nezamítáme hypotézu, že podíl vadných výrobků je 10%. 3. Jedná se o test hypotézy o rozdělení náhodné veličiny, tj. testy. shody. Protože t = 2.675, W = t; t > 5.992, nezamítáme hypotézu, že výrobce má pravdu. 4. Konstanta a v tomto případě není parametrem rozdělení, ale na základě vlastností hustoty dostaneme a = 3/8. Potom H 0 : X f(x = (3/8(1 + x 2 pro x ( 1, 1, f(x = 0 pro jiné x, H: X f(x, t. = 8.613, W = t; t > Realizace náhodného výběru nepochází z rozdělení s hustotou f. Riziko omylu je 5%. 5. Náhodná veličina X má exponenciální rozdělení s parametrem λ, jestliže má distribuční funkci F (x = 1 exp( x pro x 0, F (x = 0 pro jiná λ x. Platí E(X = λ, odtud λ = x =. 1762, t = , W = t; t > Nezamítáme shodu s exponenciálním rozdělením. 6. H 0 : X Ro(0, 8 f(x = 1 pro x 0, 8, f(x = 0 pro jiná x, t = 18.8, W = t; t > Okamžiky vzniku zmetků během osmihodinové pracovní doby nejsou rovnoměrně rozděleny. Riziko omylu je 5% 7. Z příkladu 1.8 předchozího modulu máme x. = , s. = 2.517, potom t. = 0.013, W = t; t > Nezamítáme shodu s normálním rozdělením. 8. λ. = 4.05, t. = 5.840, W = t; t > Nezamítáme shodu s Poissonovým rozdělením.

51 Literatura [1] Anděl, J.: Statistické metody. MATFYZPRESS Praha [2] Cyhelský, L., Hustopecký, J., Závodský, P.: Příklady k teorii statistiky. SNTL/ALFA Praha [3] Friedrich, V.: Statistika 1 - vysokoškolská učebnice pro DS. EF ZU Plzeň [4] Hátle, J., Likeš, J.: Základy počtu pravděpodobnosti a matematické statistiky. SNTL/ALFA Praha [5] Hebák, P., Kahounová, J.: Počet pravděpodobnosti v příkladech. SNTL Praha [6] Jarušková, D., Hála, M.: Pravděpodobnost a matematická statistika 12. ČVUT Praha [7] Jarušková, D.: Matematická statistika 12. ČVUT Praha [8] Koutková, H., Moll, I.: Úvod do pravděpodobnosti a matematické statistiky. VUT Brno [9] Koutková, H., Dlouhý, O.: Sbírka příkladů z pravděpodobnosti a matematické statistiky. VUT Brno [10] Křivý, J.: Základy matematické statistiky. Ostrava [11] Likeš, J., Laga, J.: Základní statistické tabulky. SNTL Praha [12] Likeš, J., Machek, J.: Matematická statistika. Matematika pro vysoké školy technické. Sešit XI. SNTL Praha [13] Novovičová, J.: Pravděpodobnost a matematická statistika 12. ČVUT Praha [14] Škrášek, J., Tichý, Z.: Základy aplikované matematiky III. SNTL Praha [15] Vorlíček, M., Holický M., Špačková, M.: Pravděpodobnost a matematická statistika pro inženýry. VUT Praha [16] Walpole, R. E., Myers, R. H.: Probability and Statistics for Engineers and Scientists. MACMILLAN PUBLISHING COMPANY New York 1990.

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

4ST201 STATISTIKA CVIČENÍ Č. 7

4ST201 STATISTIKA CVIČENÍ Č. 7 4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné

Více

Ing. Michael Rost, Ph.D.

Ing. Michael Rost, Ph.D. Úvod do testování hypotéz, jednovýběrový t-test Ing. Michael Rost, Ph.D. Testovaná hypotéza Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru, např. o parametru Θ, pak takovéto tvrzení

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 11. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 27 Obsah 1 Testování statistických hypotéz 2

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz. Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení

Více

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný

Více

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. 1 Statistické odhady Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. Odhad lze provést jako: Bodový odhad o Jedna číselná hodnota Intervalový

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1 Testování statistických hypotéz Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky Statistickou hypotézou rozumíme hypotézu o populaci (základním souboru) např.: Střední hodnota základního souboru je rovna 100.

Více

2 ) 4, Φ 1 (1 0,005)

2 ) 4, Φ 1 (1 0,005) Příklad 1 Ze zásilky velkého rozsahu byl náhodně vybrán soubor obsahující 1000 kusů. V tomto souboru bylo zjištěno 26 kusů nekvalitních. Rozhodněte, zda je možné s 99% jistotou tvrdit, že zásilka obsahuje

Více

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11 Příklad 1 Vyhláška Ministerstva zdravotnictví předpokládala, že doba dojezdu k pacientovi od nahlášení požadavku nepřekročí 17 minut. Hodnoty deseti náhodně vybraných dob příjezdu sanitky k nemocnému byly:

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA STATISTICKÉ TESTOVÁNÍ HYPOTÉZ 22.11.2016 Opakování: CLV příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců

Více

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

t-test, Studentův párový test Ing. Michael Rost, Ph.D. Testování hypotéz: dvouvýběrový t-test, Studentův párový test Ing. Michael Rost, Ph.D. Úvod do problému... Již známe jednovýběrový t-test, při kterém jsme měli k dispozici pouze jeden výběr. Můžeme se

Více

Testování hypotéz. 4. přednáška 6. 3. 2010

Testování hypotéz. 4. přednáška 6. 3. 2010 Testování hypotéz 4. přednáška 6. 3. 2010 Základní pojmy Statistická hypotéza Je tvrzení o vlastnostech základního souboru, o jehož pravdivosti se chceme přesvědčit. Předem nevíme, zda je pravdivé nebo

Více

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,

Více

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu,

Více

Náhodné veličiny, náhodné chyby

Náhodné veličiny, náhodné chyby Náhodné veličiny, náhodné chyby Máme náhodnou veličinu X, jejíž vlastnosti zkoumáme. Pokud známe její rozložení (např. z nějaké dřívější studie) nebo alespoň předpokládáme znalost rozložení, můžeme ji

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,

Více

7.1. Podstata testu statistické hypotézy

7.1. Podstata testu statistické hypotézy 7. TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ 7.1. Podstata testu statistické hypotézy Statistická hypotéza určitý předpoklad o parametrech nebo tvaru rozdělení zkoumaného st. znaku. Testování hypotéz proces ověřování

Více

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě

Více

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz proces, kterým rozhodujeme, zda přijmeme nebo zamítneme nulovou hypotézu

Více

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testování hypotéz na základě jednoho a dvou výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/004. Testování hypotéz Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru,

Více

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Zpracování dat v edukačních vědách - Testování hypotéz Kamila Fačevicová Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Obsah seminářů 5.11. Úvod do matematické

Více

5 Parametrické testy hypotéz

5 Parametrické testy hypotéz 5 Parametrické testy hypotéz 5.1 Pojem parametrického testu (Skripta str. 95-96) Na základě výběru srovnáváme dvě tvrzení o hodnotě určitého parametru θ rozdělení f(x, θ). První tvrzení (které většinou

Více

STATISTICKÉ TESTY VÝZNAMNOSTI

STATISTICKÉ TESTY VÝZNAMNOSTI STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená

Více

STATISTICKÉ HYPOTÉZY

STATISTICKÉ HYPOTÉZY STATISTICKÉ HYPOTÉZY ZÁKLADNÍ POJMY Bodové/intervalové odhady Maruška řešila hodnoty parametrů (průměr, rozptyl atd.) Zde bude Maruška dělat hypotézy (předpoklady) ohledně parametrů Z.S. Výsledek nebude

Více

Cvičení ze statistiky - 8. Filip Děchtěrenko

Cvičení ze statistiky - 8. Filip Děchtěrenko Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly

Více

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat Testování hypotéz testujeme (většinou) tvrzení o parametru populace tvrzení je nutno předem zformulovat najít odpovídající test, podle kterého se na základě informace z výběrového souboru rozhodneme, zda

Více

Aproximace binomického rozdělení normálním

Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Příklad Sybilla a Kassandra tvrdí, že mají telepatické schopnosti, a chtějí to dokázat následujícím pokusem: V jedné

Více

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek

Více

STATISTICKÉ TESTY VÝZNAMNOSTI

STATISTICKÉ TESTY VÝZNAMNOSTI STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená

Více

Testy statistických hypotéz

Testy statistických hypotéz Testy statistických hypotéz Statistická hypotéza je jakýkoliv předpoklad o rozdělení pravděpodobnosti jedné nebo několika náhodných veličin. Na základě náhodného výběru, který je reprezentativním vzorkem

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D. Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost

Více

Testy. Pavel Provinský. 19. listopadu 2013

Testy. Pavel Provinský. 19. listopadu 2013 Testy Pavel Provinský 19. listopadu 2013 Test a intervalový odhad Testy a intervalové odhady - jsou vlastně to samé. Jiný je jen úhel pohledu. Lze přecházet od jednoho k druhému. Například: Při odvozování

Více

Charakteristika datového souboru

Charakteristika datového souboru Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex

Více

Testování statistických hypotéz. Obecný postup

Testování statistických hypotéz. Obecný postup poznámky k MIII, Tomečková I., poslední aktualizace 9. listopadu 016 9 Testování statistických hypotéz Obecný postup (I) Vyslovení hypotézy O datech vyslovíme doměnku, kterou chceme ověřit statistickým

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

Jednostranné intervaly spolehlivosti

Jednostranné intervaly spolehlivosti Jednostranné intervaly spolehlivosti hledáme jen jednu z obou mezí Princip: dle zadání úlohy hledáme jen dolní či jen horní mez podle oboustranného vzorce s tou změnou, že výraz 1-α/2 ve vzorci nahradíme

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními

Více

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr StatSoft Intervalový odhad Dnes se budeme zabývat neodmyslitelnou součástí statistiky a to intervaly v nejrůznějších podobách. Toto téma je také úzce spojeno s tématem testování hypotéz, a tedy plynule

Více

12. cvičení z PST. 20. prosince 2017

12. cvičení z PST. 20. prosince 2017 1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. 1 Záznam epidemiologických dat Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly

Více

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457. 0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti

Více

STATISTICKÉ ODHADY Odhady populačních charakteristik

STATISTICKÉ ODHADY Odhady populačních charakteristik STATISTICKÉ ODHADY Odhady populačních charakteristik Jak stanovit charakteristiky rozložení sledované veličiny v základní populaci? Populaci většinou nemáme celou k dispozici, musíme se spokojit jen s

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Epidemiologické ukazatele Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly

Více

MATEMATIKA III V PŘÍKLADECH

MATEMATIKA III V PŘÍKLADECH VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA STROJNÍ MATEMATIKA III V PŘÍKLADECH Cvičení 12 Testování hypotéz Mgr. Petr Otipka Ostrava 2013 Mgr. Petr Otipka Vysoká škola báňská Technická univerzita

Více

5. T e s t o v á n í h y p o t é z

5. T e s t o v á n í h y p o t é z 5. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Stručný úvod do testování statistických hypotéz

Stručný úvod do testování statistických hypotéz Stručný úvod do testování statistických hypotéz 1. Formulujeme hypotézu (předpokládáme, že pozorovaný jev je pouze náhodný). 2. Zvolíme hladinu významnosti testu a, tj. riziko, s nímž jsme ochotni se smířit.

Více

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup Statistika Testování hypotéz statistická indukce Úvod do problému Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 21. února 2012 Statistika by Birom

Více

Cvičení ze statistiky - 9. Filip Děchtěrenko

Cvičení ze statistiky - 9. Filip Děchtěrenko Cvičení ze statistiky - 9 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Inferenční statistika Konfidenční intervaly Z-test Postup při testování hypotéz

Více

Úvod do analýzy rozptylu

Úvod do analýzy rozptylu Úvod do analýzy rozptylu Párovým t-testem se podařilo prokázat, že úprava režimu stravování a fyzické aktivity ve vybrané škole měla vliv na zlepšené hodnoty HDLcholesterolu u školáků. Pro otestování jsme

Více

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu

Více

Náhodné (statistické) chyby přímých měření

Náhodné (statistické) chyby přímých měření Náhodné (statistické) chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně

Více

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 Opakování t- vs. neparametrické Wilcoxonův jednovýběrový test Opakování

Více

Poznámky k předmětu Aplikovaná statistika, 9.téma

Poznámky k předmětu Aplikovaná statistika, 9.téma Poznámky k předmětu Aplikovaná statistika, 9téma Princip testování hypotéz, jednovýběrové testy V minulé hodině jsme si ukázali, jak sestavit intervalové odhady pro některé číselné charakteristiky normálního

Více

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.) Lékařská biofyzika, výpočetní technika I Biostatistika Josef Tvrdík (doc. Ing. CSc.) Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace úterý 4. až 5.4 hod. http://www.osu.cz/~tvrdik

Více

Náhodné chyby přímých měření

Náhodné chyby přímých měření Náhodné chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně pravděpodobná.

Více

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests) Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich

Více

PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA

PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA STAVEBNÍ HELENA KOUTKOVÁ PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA MODUL GA03 M3 ZÁKLADY TEORIE ODHADU STUDIJNÍ OPORY PRO STUDIJNÍ PROGRAMY S KOMBINOVANOU FORMOU STUDIA

Více

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin EuroMISE Centrum Kontakt: Literatura: Obecné informace Zvárová, J.: Základy statistiky pro biomedicínskéobory I. Vydavatelství

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých

Více

8. Normální rozdělení

8. Normální rozdělení 8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, 2 ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) 2 e 2 2, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá

Více

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.) Lékařská biofyzika, výpočetní technika I Biostatistika Josef Tvrdík (doc. Ing. CSc.) Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace úterý 14.10 až 15.40 hod. http://www1.osu.cz/~tvrdik

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie ZS 2015/16 Cvičení 1: Opakování ze statistiky LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Z čeho studovat 1) Z KNIHY Krkošková,

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Statistika, Biostatistika pro kombinované studium. Jan Kracík Statistika, Biostatistika pro kombinované studium Letní semestr 2014/2015 Tutoriál č. 6: ANOVA Jan Kracík jan.kracik@vsb.cz Obsah: Testování hypotéz opakování ANOVA Testování hypotéz (opakování) Testování

Více

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu) Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu) Frank Wilcoxon (1892 1965): Americký statistik a chemik Nechť X 1,..., X n je náhodný výběr ze

Více

Diskrétní náhodná veličina

Diskrétní náhodná veličina Lekce Diskrétní náhodná veličina Výsledek náhodného pokusu může být vyjádřen slovně to vede k zavedení pojmu náhodného jevu Výsledek náhodného pokusu můžeme někdy vyjádřit i číselně, což vede k pojmu náhodné

Více

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak. 8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) e, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá normované

Více

Jana Vránová, 3. lékařská fakulta UK

Jana Vránová, 3. lékařská fakulta UK Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace

Více

ÚSTAV MATEMATIKY A DESKRIPTIVNÍ GEOMETRIE. Matematika 0A4. Cvičení, letní semestr DOMÁCÍ ÚLOHY. Jan Šafařík

ÚSTAV MATEMATIKY A DESKRIPTIVNÍ GEOMETRIE. Matematika 0A4. Cvičení, letní semestr DOMÁCÍ ÚLOHY. Jan Šafařík Vysoké učení technické v Brně Stavební fakulta ÚSTAV MATEMATIKY A DESKRIPTIVNÍ GEOMETRIE Matematika 0A4 Cvičení, letní semestr DOMÁCÍ ÚLOHY Jan Šafařík Brno c 200 (1) 120 krát jsme házeli hrací kostkou.

Více

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin EuroMISE Centrum I. ÚVOD vv této přednášce budeme hovořit o jednovýběrových a dvouvýběrových testech týkajících se střední hodnoty

Více

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0. 11 cvičení z PSI 12-16 prosince 2016 111 (Test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota 0 1 2 3 4 5 6 pozorovaná četnost 29 15

Více

HODNOCENÍ VÝKONNOSTI ATRIBUTIVNÍCH ZNAKŮ JAKOSTI. Josef Křepela, Jiří Michálek. OSSM při ČSJ

HODNOCENÍ VÝKONNOSTI ATRIBUTIVNÍCH ZNAKŮ JAKOSTI. Josef Křepela, Jiří Michálek. OSSM při ČSJ HODNOCENÍ VÝKONNOSTI ATRIBUTIVNÍCH ZNAKŮ JAKOSTI Josef Křepela, Jiří Michálek OSSM při ČSJ Červen 009 Hodnocení způsobilosti atributivních znaků jakosti (počet neshodných jednotek) Nechť p je pravděpodobnost

Více

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel: NÁHODNÁ ČÍSLA TYPY GENERÁTORŮ, LINEÁRNÍ KONGRUENČNÍ GENERÁTORY, TESTY NÁHODNOSTI, VYUŽITÍ HODNOT NÁHODNÝCH VELIČIN V SIMULACI CO JE TO NÁHODNÉ ČÍSLO? Náhodné číslo definujeme jako nezávislé hodnoty z rovnoměrného

Více

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1 PRAVDĚPODOBNOST A STATISTIKA Neparametrické testy hypotéz čast 1 Neparametrické testy hypotéz - úvod Neparametrické testy statistických hypotéz se používají v případech, kdy neznáme rozdělení pozorované

Více

Neparametrické metody

Neparametrické metody Neparametrické metody Dosud jsme se zabývali statistickými metodami, které zahrnovaly předpoklady o rozdělení dat. Zpravidla jsme předpokládali normální rozdělení. Např. Grubbsův test odlehlých hodnot

Více

Zápočtová práce STATISTIKA I

Zápočtová práce STATISTIKA I Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru

Více

Pravděpodobnost a matematická statistika

Pravděpodobnost a matematická statistika Pravděpodobnost a matematická statistika Příklady k přijímacím zkouškám na doktorské studium 1 Popisná statistika Určete aritmetický průměr dat, zadaných tabulkou hodnot x i a četností n i x i 1 2 3 n

Více

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X Náhodný vektor Náhodný vektor zatím jsme sledovali jednu náhodnou veličinu, její rozdělení a charakteristiky často potřebujeme vyšetřovat vzájemný vztah několika náhodných veličin musíme sledovat jejich

Více

5. Náhodná veličina. 2. Házíme hrací kostkou dokud nepadne šestka. Náhodná veličina nabývá hodnot z posloupnosti {1, 2, 3,...}.

5. Náhodná veličina. 2. Házíme hrací kostkou dokud nepadne šestka. Náhodná veličina nabývá hodnot z posloupnosti {1, 2, 3,...}. 5. Náhodná veličina Poznámka: Pro popis náhodného pokusu jsme zavedli pojem jevového pole S jako množiny všech možných výsledků a pravděpodobnost náhodných jevů P jako míru výskytů jednotlivých výsledků.

Více

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Obecný postup 1. Určení statistické hypotézy 2. Určení hladiny chyby 3. Výpočet

Více

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické

Více

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) = Základní rozdělení pravděpodobnosti Diskrétní rozdělení pravděpodobnosti. Pojem Náhodná veličina s Binomickým rozdělením Bi(n, p), kde n je přirozené číslo, p je reálné číslo, < p < má pravděpodobnostní

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ Má-li analytický výsledek objektivně vypovídat o chemickém složení vzorku, musí splňovat určitá kriteria: Mezinárodní metrologický slovník (VIM 3),

Více

y = 0, ,19716x.

y = 0, ,19716x. Grafické ověřování a testování vybraných modelů 1 Grafické ověřování empirického rozdělení Při grafické analýze empirického rozdělení vycházíme z empirické distribuční funkce F n (x) příslušné k náhodnému

Více

31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě

31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě 31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě Motto Statistika nuda je, má však cenné údaje. strana 3 Statistické charakteristiky Charakteristiky polohy jsou kolem ní seskupeny ostatní hodnoty

Více

Příklad datového souboru. Pravděpodobnost vs. statistika. Formální definice. Teorie odhadu

Příklad datového souboru. Pravděpodobnost vs. statistika. Formální definice. Teorie odhadu Pravděpodobnost vs. statistika Teorie pravděpodobnosti pracuje s jednou nebo více teoretickými náhodnými veličinami, jejichž rozdělení je známo Statistika odvozovali jsme charakteristiky těchto rozdělení

Více

Přednáška VII. Úvod do testování hypotéz

Přednáška VII. Úvod do testování hypotéz Přednáška VII. Úvod do testování hypotéz Principy a pojmy testování hypotéz, chyba I. a II. druhu P hodnota a její interpretace Síla testu a souvislost s velikostí vzorku Statistická versus klinická/biologická

Více