6. Testování statistických hypotéz. KGG/STG Zimní semestr 6. Testování statistických hypotéz

6. Testování statistických

Testování statistických Princip: Ověř ěřování určit itého předpokladu p zjišťujeme, zda zkoumaný výběr r pochází ze základnz kladního souboru, který mám určit ité rozdělen lení zjišťujeme, zda dva výběry pocházej zejí z téhož základního souboru

Testování statistických Obecný postup: 1. Zvolíme hladinu významnosti 2. Formulujeme nulovou u 3. Zvolíme vhodné testovací kritérium rium 4. Vypočteme velikost testovacího kritéria ria 5. Porovnáme tuto hodnotu s kritickou hodnotou 6. Vyslovíme závěrz

Hladina významnosti - p Pravděpodobnost, že e náhodnn hodná odchylka překrop ekročí danou hodnotu tzv. kritickou hodnotu. Volíme ji co nejnižší ší,, zpravidla p = 0,05 (5 %) nebo p = 0,01 (1 %). Odchylky, které se vyskytují s pravděpodobnost podobností menší ší, než je hladina významnosti, označujeme za statisticky významné na zvolené hladině významnosti.

Statistická a - každý předpoklad p o neznámé vlastnosti základního souboru Nulová a H 0 - prověř ěřovaná a - speciáln lní a o charakteristikách základního souboru

Test významnosti - způsob ověř ěřování stanovených Zjednodušen eně: Nulová a je negací pracovní y, pro jejíž ověř ěření byl daný pokus (nebo pozorování) ) uspořádán

Testovací kritérium rium Volba: Závisí na povaze řešeného problému. Každé testovací kritérium rium mám své určit ité rozdělen lení (t-rozd rozdělení, chí kvadrát rozdělen lení,, F-rozdF rozdělení..). Ve statistických tabulkách jsou uvedeny kritické hodnoty testovacích ch kritéri rií pro nejčast astěji používan vané hladiny významnosti a pro různr zné rozsahy výběru (tzv. stupně volnosti).

Závěr r testování - 1 O platnosti testované y rozhodneme po porovnání vypočten tené hodnoty testovacího kritéria ria s kritickou hodnotou z tabulek. Je-li vypočten tené kritérium rium většív než kritická hodnota, obecně nastává případ, pad, který jsme očeko ekávali s nepatrnou pravděpodobnost podobností (tzn. 5 nebo 1 %). Usuzujeme, že e takový případ pad je téměřt nemožný ný a že e testovaná odchylka nemá charakter náhodný. n Zamítáme me nulovou u a vyslovujeme závěr, z že e na zvolené hladině významnosti je rozdíl l mezi testovanými charakteristikami statisticky významný.

Závěr r testování - 2 Je-li vypočten tené testovací kritérium rium menší než tabulková kritická hodnota, nastal případ, p pad, který očeko ekáváme s pravděpodobnost podobností 1 p (tedy s pravděpodobnost podobností 95 nebo 99 %), tedy s takovou pravděpodobnost podobností, že e jeho výskyt můžeme považovat ovat za téměřt jistý. Usuzujeme, že e rozdíl mezi testovanými charakteristikami není a nezamítáme me nulovou u. Na zvolené hladině významnosti není rozdíl l statisticky významný.

2 χ - test - posuzujeme, jak se rozložen ení četností pozorovaného souboru liší od základnz kladního souboru - jde o test shody Princip: - empirické hodnoty zjištěné ze statistického šetření - teoretické (oček ekávané) ) hodnoty - hodnotíme rozdíly mezi četnostmi pozorovanými a teoretickými

2 χ - test Testovací kritérium: rium: - má chí kvadrát rozdělen lení s k 1 stupni volnosti - kritické hodnoty chí kvadrát rozdělen lení najdeme v tabulkách

Příklad - 1 Testování shody teoretického a empirického rozdělen lení : Zadání: Rozhodněte, zda rozdělen lení počtu dětíd v okrese A podle jednotlivých měsícům odpovídá rozložen ení v celém m státě:

Příklad - 1 Nulová a: Výběrov rové rozdělen lení počtu dětíd narozených v okrese A je typickým reprezentantem souboru všech narozených dětíd v ČR R v daném m roce.

Příklad - 1 A ČR (%) ej % tj kritérum 1 8,39 87 8,52 2 7,91 90 8,81 3 9,02 92 9,01 4 9,03 89 8,72 5 9,15 93 9,11 6 8,64 81 7,93 7 8,45 80 7,84 8 8,04 81 7,93 9 8,28 79 7,74 10 7,93 83 8,13 11 7,41 76 7,44 12 7,75 90 8,81 100 1021 100

Příklad klad - 1 4,1609 1021 100 1021 100 1,4939 79,13 8,81 90 7,75 12 0,0016 75,66 7,44 76 7,41 11 0,0511 80,97 8,13 83 7,93 10 0,3629 84,54 7,74 79 8,28 9 0,0144 82,09 7,93 81 8,04 8 0,4563 86,27 7,84 80 8,45 7 0,5900 88,21 7,93 81 8,64 6 0,0019 93,42 9,11 93 9,15 5 0,1108 92,20 8,72 89 9,03 4 0,0001 92,09 9,01 92 9,02 3 1,0569 80,76 8,81 90 7,91 2 0,0209 85,66 8,52 87 8,39 1 tj % ej kritérum A ČR (%)

Příklad - 1 Kritická hodnota z tabulek (11 stupˇnů volnosti): 19,7 Hodnota kritéria: ria: 4,16 Tedy odlišnosti ve třett etí a pátém p m sloupci nejsou statisticky významné. Přijímáme me nulovou u.

Příklad - 2 Testujeme shodu empirického rozdělen lení průměrných rných ročních teplot na stanici Praha Klementinum s rozdělen lením m normáln lním.

Nulová a: Příklad - 2 Existuje shoda mezi empirickým a teoretickým rozdělen lením.

Příklad - 2 Třída ej tj kritérum 1 5 2,90 2 9 8,60 3 20 19,90 4 32 33,10 5 34 41,90 6 44 40,60 7 39 28,40 8 8 15,30 9 8 6,20 10 1 1,80 200 90

Příklad - 2 Třída ej tj kritérum 1 5 2,90 1,5207 2 9 8,60 0,0186 3 20 19,90 0,0005 4 32 33,10 0,0366 5 34 41,90 1,4895 6 44 40,60 0,2847 7 39 28,40 3,9563 8 8 15,30 3,4830 9 8 6,20 0,5226 10 1 1,80 0,3556 200 200 11,67

Příklad - 2 Kritická hodnota z tabulek (9 stupňů volnosti): 16,9 Hodnota kritéria: ria: 11,67 Přijímáme me nulovou u, tzn. existuje shoda mezi četnostmi empirickými a teoretickými.

F - test - testujeme významnost rozdílu mezi dvěma rozptyly - Testovací kritérium: rium: poměr r odhadů dvou rozptylů základního souboru, odhady se provádí z výběrových rozptylů - do čitatele dosazujeme hodnotu většív

F - test Postup: - zvolit hladinu významnosti - odhadnout rozptyly - vypočítat testovací kritérium rium - určit počet stupňů volnosti a najít t hodnotu F p/2 - hodnoty porovnat a vyslovit závěrz

t - test Použit ití: - testování rozdílu výběrov rového průměru ru a známého průměru ru základnz kladního souboru - testování rozdílu dvou výběrových průměrů, jestliže e F-testem F jsme ověř ěřily rovnost rozptylů - testování rozdílu dvou výběrových průměrů, jestliže e F-testem F jsme ověř ěřily nerovnost rozptylů

Příklad - 3 Na základz kladě denních amplitud teploty vzduchu dvou stanic určete významnost rozdílu jejich rozptylů a průměrů pomocí F-testu a t-testu. t testu.

Příklad klad - 3 7,4 8,2 31 7,8 8,1 30 8,3 7,0 15 9,8 8,6 29 10,7 9,3 14 11,5 10,2 28 11,6 10,5 13 9,3 9,8 27 9,3 7,1 12 7,8 7,0 26 9,0 9,2 11 6,9 8,1 25 9,2 8,9 10 11,7 10,3 24 7,7 7,2 9 5,5 4,5 23 6,2 6,0 8 7,0 4,7 22 1,7 1,3 7 17,2 11,1 21 9,4 10,3 6 14,4 12,7 20 12,1 11,2 5 7,1 7,1 19 9,1 8,9 4 7,4 2,4 18 6,7 8,1 3 12,2 10,7 17 9,9 12,2 2 13,6 14,0 16 15,0 13,3 1 xi2 xi1 xi2 xi1

Příklad - 3 Aritmetický průměr r 1: 8,6 C Aritmetický průměr r 2: 9,4 C Rozptyl 1: 11,26 Rozptyl 2: 10,47

Příklad - 3 Hodnota kritéria: ria: F = 1,0755 Kritická hodnota (30 a 30 stupňů volnosti, F p/2 /2): 2,07 Testovaný rozdíl l můžm ůžeme považovat ovat za náhodný. n Na hladině významnosti p = 0,05 není rozdíl statisticky významný.

Příklad - 3 Testování aritmetických průměrů: t = 23,9350 kritická hodnota (60 stupňů volnosti): 2,000 Tzn. zamítáme me nulovou u. Mezi sledovanými průměry ry je statisticky významný rozdíl.