6. Testování statistických hypotéz. KGG/STG Zimní semestr 6. Testování statistických hypotéz

Podobné dokumenty
You created this PDF from an application that is not licensed to print to novapdf printer (

5. Odhady parametrů. KGG/STG Zimní semestr

= = 2368

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

charakteristiky KGG/STG Zimní semestr Základní statistické charakteristiky, Teoretická rozdělení 1

4ST201 STATISTIKA CVIČENÍ Č. 7

Normální (Gaussovo) rozdělení

12. cvičení z PST. 20. prosince 2017

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Normální (Gaussovo) rozdělení

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Stručný úvod do testování statistických hypotéz

Testování hypotéz. 4. přednáška

Testy. Pavel Provinský. 19. listopadu 2013

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

PRAVDĚPODOBNOST A STATISTIKA. Testování hypotéz o rozdělení

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

Náhodné veličiny, náhodné chyby

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Test dobré shody v KONTINGENČNÍCH TABULKÁCH

STATISTICKÉ TESTY VÝZNAMNOSTI

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

STATISTICKÉ TESTY VÝZNAMNOSTI

Testování statistických hypotéz

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Aproximace binomického rozdělení normálním

Tomáš Karel LS 2012/2013

Příklad: Test nezávislosti kategoriálních znaků

INDUKTIVNÍ STATISTIKA

Statistické metody uţívané při ověřování platnosti hypotéz

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

PRAVDĚPODOBNOST A STATISTIKA

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

15. T e s t o v á n í h y p o t é z

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Testování statistických hypotéz

TECHNICKÁ UNIVERZITA V LIBERCI

Přednáška X. Testování hypotéz o kvantitativních proměnných

KGG/STG Statistika pro geografy

Příklady na testy hypotéz o parametrech normálního rozdělení

15. T e s t o v á n í h y p o t é z

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování statistických hypotéz

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

TECHNICKÁ UNIVERZITA V LIBERCI

Úvod do analýzy rozptylu

5. T e s t o v á n í h y p o t é z

Jednofaktorová analýza rozptylu

6. T e s t o v á n í h y p o t é z

Testy statistických hypotéz

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření

STATISTICKÉ ODHADY Odhady populačních charakteristik

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Ing. Michael Rost, Ph.D.

2 ) 4, Φ 1 (1 0,005)

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Jana Vránová, 3. lékařská fakulta UK

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)

STATISTICKÉ HYPOTÉZY

Charakteristika datového souboru

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

na za átku se denuje náhodná veli ina

ADDS cviceni. Pavlina Kuranova

Protokol č. 1. Tloušťková struktura. Zadání:

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

LEKCE 6 ZÁKLADY TESTOVÁNÍ HYPOTÉZ

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

4EK211 Základy ekonometrie

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Pravděpodobnost a aplikovaná statistika

1. (18 bod ) Náhodná veli ina X je po et rub p i 400 nezávislých hodech mincí. a) Pomocí ƒeby²evovy nerovnosti odhadn te pravd podobnost

Testování statistických hypotéz. Obecný postup

Vzorová prezentace do předmětu Statistika

Toolboxy analýzy a modelování stochastických systémů

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Odhady parametrů základního souboru. Cvičení 6 Statistické metody a zpracování dat 1 (podzim 2016) Brno, říjen listopad 2016 Ambrožová Klára

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Neparametrické metody

Testování hypotéz Biolog Statistik: Matematik: Informatik:

Pravděpodobnost, náhoda, kostky

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Technická univerzita v Liberci

Transkript:

6. Testování statistických

Testování statistických Princip: Ověř ěřování určit itého předpokladu p zjišťujeme, zda zkoumaný výběr r pochází ze základnz kladního souboru, který mám určit ité rozdělen lení zjišťujeme, zda dva výběry pocházej zejí z téhož základního souboru

Testování statistických Obecný postup: 1. Zvolíme hladinu významnosti 2. Formulujeme nulovou u 3. Zvolíme vhodné testovací kritérium rium 4. Vypočteme velikost testovacího kritéria ria 5. Porovnáme tuto hodnotu s kritickou hodnotou 6. Vyslovíme závěrz

Hladina významnosti - p Pravděpodobnost, že e náhodnn hodná odchylka překrop ekročí danou hodnotu tzv. kritickou hodnotu. Volíme ji co nejnižší ší,, zpravidla p = 0,05 (5 %) nebo p = 0,01 (1 %). Odchylky, které se vyskytují s pravděpodobnost podobností menší ší, než je hladina významnosti, označujeme za statisticky významné na zvolené hladině významnosti.

Statistická a - každý předpoklad p o neznámé vlastnosti základního souboru Nulová a H 0 - prověř ěřovaná a - speciáln lní a o charakteristikách základního souboru

Test významnosti - způsob ověř ěřování stanovených Zjednodušen eně: Nulová a je negací pracovní y, pro jejíž ověř ěření byl daný pokus (nebo pozorování) ) uspořádán

Testovací kritérium rium Volba: Závisí na povaze řešeného problému. Každé testovací kritérium rium mám své určit ité rozdělen lení (t-rozd rozdělení, chí kvadrát rozdělen lení,, F-rozdF rozdělení..). Ve statistických tabulkách jsou uvedeny kritické hodnoty testovacích ch kritéri rií pro nejčast astěji používan vané hladiny významnosti a pro různr zné rozsahy výběru (tzv. stupně volnosti).

Závěr r testování - 1 O platnosti testované y rozhodneme po porovnání vypočten tené hodnoty testovacího kritéria ria s kritickou hodnotou z tabulek. Je-li vypočten tené kritérium rium většív než kritická hodnota, obecně nastává případ, pad, který jsme očeko ekávali s nepatrnou pravděpodobnost podobností (tzn. 5 nebo 1 %). Usuzujeme, že e takový případ pad je téměřt nemožný ný a že e testovaná odchylka nemá charakter náhodný. n Zamítáme me nulovou u a vyslovujeme závěr, z že e na zvolené hladině významnosti je rozdíl l mezi testovanými charakteristikami statisticky významný.

Závěr r testování - 2 Je-li vypočten tené testovací kritérium rium menší než tabulková kritická hodnota, nastal případ, p pad, který očeko ekáváme s pravděpodobnost podobností 1 p (tedy s pravděpodobnost podobností 95 nebo 99 %), tedy s takovou pravděpodobnost podobností, že e jeho výskyt můžeme považovat ovat za téměřt jistý. Usuzujeme, že e rozdíl mezi testovanými charakteristikami není a nezamítáme me nulovou u. Na zvolené hladině významnosti není rozdíl l statisticky významný.

2 χ - test - posuzujeme, jak se rozložen ení četností pozorovaného souboru liší od základnz kladního souboru - jde o test shody Princip: - empirické hodnoty zjištěné ze statistického šetření - teoretické (oček ekávané) ) hodnoty - hodnotíme rozdíly mezi četnostmi pozorovanými a teoretickými

2 χ - test Testovací kritérium: rium: - má chí kvadrát rozdělen lení s k 1 stupni volnosti - kritické hodnoty chí kvadrát rozdělen lení najdeme v tabulkách

Příklad - 1 Testování shody teoretického a empirického rozdělen lení : Zadání: Rozhodněte, zda rozdělen lení počtu dětíd v okrese A podle jednotlivých měsícům odpovídá rozložen ení v celém m státě:

Příklad - 1 Nulová a: Výběrov rové rozdělen lení počtu dětíd narozených v okrese A je typickým reprezentantem souboru všech narozených dětíd v ČR R v daném m roce.

Příklad - 1 A ČR (%) ej % tj kritérum 1 8,39 87 8,52 2 7,91 90 8,81 3 9,02 92 9,01 4 9,03 89 8,72 5 9,15 93 9,11 6 8,64 81 7,93 7 8,45 80 7,84 8 8,04 81 7,93 9 8,28 79 7,74 10 7,93 83 8,13 11 7,41 76 7,44 12 7,75 90 8,81 100 1021 100

Příklad klad - 1 4,1609 1021 100 1021 100 1,4939 79,13 8,81 90 7,75 12 0,0016 75,66 7,44 76 7,41 11 0,0511 80,97 8,13 83 7,93 10 0,3629 84,54 7,74 79 8,28 9 0,0144 82,09 7,93 81 8,04 8 0,4563 86,27 7,84 80 8,45 7 0,5900 88,21 7,93 81 8,64 6 0,0019 93,42 9,11 93 9,15 5 0,1108 92,20 8,72 89 9,03 4 0,0001 92,09 9,01 92 9,02 3 1,0569 80,76 8,81 90 7,91 2 0,0209 85,66 8,52 87 8,39 1 tj % ej kritérum A ČR (%)

Příklad - 1 Kritická hodnota z tabulek (11 stupˇnů volnosti): 19,7 Hodnota kritéria: ria: 4,16 Tedy odlišnosti ve třett etí a pátém p m sloupci nejsou statisticky významné. Přijímáme me nulovou u.

Příklad - 2 Testujeme shodu empirického rozdělen lení průměrných rných ročních teplot na stanici Praha Klementinum s rozdělen lením m normáln lním.

Nulová a: Příklad - 2 Existuje shoda mezi empirickým a teoretickým rozdělen lením.

Příklad - 2 Třída ej tj kritérum 1 5 2,90 2 9 8,60 3 20 19,90 4 32 33,10 5 34 41,90 6 44 40,60 7 39 28,40 8 8 15,30 9 8 6,20 10 1 1,80 200 90

Příklad - 2 Třída ej tj kritérum 1 5 2,90 1,5207 2 9 8,60 0,0186 3 20 19,90 0,0005 4 32 33,10 0,0366 5 34 41,90 1,4895 6 44 40,60 0,2847 7 39 28,40 3,9563 8 8 15,30 3,4830 9 8 6,20 0,5226 10 1 1,80 0,3556 200 200 11,67

Příklad - 2 Kritická hodnota z tabulek (9 stupňů volnosti): 16,9 Hodnota kritéria: ria: 11,67 Přijímáme me nulovou u, tzn. existuje shoda mezi četnostmi empirickými a teoretickými.

F - test - testujeme významnost rozdílu mezi dvěma rozptyly - Testovací kritérium: rium: poměr r odhadů dvou rozptylů základního souboru, odhady se provádí z výběrových rozptylů - do čitatele dosazujeme hodnotu většív

F - test Postup: - zvolit hladinu významnosti - odhadnout rozptyly - vypočítat testovací kritérium rium - určit počet stupňů volnosti a najít t hodnotu F p/2 - hodnoty porovnat a vyslovit závěrz

t - test Použit ití: - testování rozdílu výběrov rového průměru ru a známého průměru ru základnz kladního souboru - testování rozdílu dvou výběrových průměrů, jestliže e F-testem F jsme ověř ěřily rovnost rozptylů - testování rozdílu dvou výběrových průměrů, jestliže e F-testem F jsme ověř ěřily nerovnost rozptylů

Příklad - 3 Na základz kladě denních amplitud teploty vzduchu dvou stanic určete významnost rozdílu jejich rozptylů a průměrů pomocí F-testu a t-testu. t testu.

Příklad klad - 3 7,4 8,2 31 7,8 8,1 30 8,3 7,0 15 9,8 8,6 29 10,7 9,3 14 11,5 10,2 28 11,6 10,5 13 9,3 9,8 27 9,3 7,1 12 7,8 7,0 26 9,0 9,2 11 6,9 8,1 25 9,2 8,9 10 11,7 10,3 24 7,7 7,2 9 5,5 4,5 23 6,2 6,0 8 7,0 4,7 22 1,7 1,3 7 17,2 11,1 21 9,4 10,3 6 14,4 12,7 20 12,1 11,2 5 7,1 7,1 19 9,1 8,9 4 7,4 2,4 18 6,7 8,1 3 12,2 10,7 17 9,9 12,2 2 13,6 14,0 16 15,0 13,3 1 xi2 xi1 xi2 xi1

Příklad - 3 Aritmetický průměr r 1: 8,6 C Aritmetický průměr r 2: 9,4 C Rozptyl 1: 11,26 Rozptyl 2: 10,47

Příklad - 3 Hodnota kritéria: ria: F = 1,0755 Kritická hodnota (30 a 30 stupňů volnosti, F p/2 /2): 2,07 Testovaný rozdíl l můžm ůžeme považovat ovat za náhodný. n Na hladině významnosti p = 0,05 není rozdíl statisticky významný.

Příklad - 3 Testování aritmetických průměrů: t = 23,9350 kritická hodnota (60 stupňů volnosti): 2,000 Tzn. zamítáme me nulovou u. Mezi sledovanými průměry ry je statisticky významný rozdíl.