Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1



Podobné dokumenty
Pravděpodobnost a aplikovaná statistika

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

4ST201 STATISTIKA CVIČENÍ Č. 7

Ing. Michael Rost, Ph.D.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Testování statistických hypotéz

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Testování statistických hypotéz

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz Biolog Statistik: Matematik: Informatik:

You created this PDF from an application that is not licensed to print to novapdf printer (

Testy statistických hypotéz

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Testy. Pavel Provinský. 19. listopadu 2013

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

5 Parametrické testy hypotéz

PRAVDĚPODOBNOST A STATISTIKA

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Testování statistických hypotéz

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Cvičení ze statistiky - 8. Filip Děchtěrenko

STATISTICKÉ HYPOTÉZY

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Náhodné veličiny, náhodné chyby

Testování hypotéz. 4. přednáška

Normální (Gaussovo) rozdělení

= = 2368

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

7.1. Podstata testu statistické hypotézy

Statistické metody uţívané při ověřování platnosti hypotéz

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

Charakteristika datového souboru

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření

STATISTICKÉ TESTY VÝZNAMNOSTI

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Vysoká škola ekonomická v Praze

12. cvičení z PST. 20. prosince 2017

Normální (Gaussovo) rozdělení

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Aproximace binomického rozdělení normálním

STATISTICKÉ TESTY VÝZNAMNOSTI

15. T e s t o v á n í h y p o t é z

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

Testování statistických hypotéz. Obecný postup

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

Stručný úvod do testování statistických hypotéz

Zápočtová práce STATISTIKA I

Jednofaktorová analýza rozptylu

ÚVOD DO TESTOVÁNÍ HYPOTÉZ. Martina Litschmannová

VYUŽITÍ SIMULACE PŘI MODELOVÁNÍ PROVOZU NA SVÁŽNÉM PAHRBKU SEŘAĎOVACÍ STANICE

Jednostranné intervaly spolehlivosti

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

ADDS cviceni. Pavlina Kuranova

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Stručný úvod do vybraných zredukovaných základů statistické analýzy dat

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Matematika III. 3. prosince Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

4EK211 Základy ekonometrie

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Tomáš Karel LS 2012/2013

Cvičení ze statistiky - 9. Filip Děchtěrenko

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Pravděpodobnost a matematická statistika

Národníinformačnístředisko pro podporu jakosti

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Řešení: máme diskrétní N.V. vzdělání bez maturity, s maturitou, vysokoškoláci, PhD.

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

KGG/STG Statistika pro geografy

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

2 ) 4, Φ 1 (1 0,005)

Porovnání dvou výběrů

Test dobré shody v KONTINGENČNÍCH TABULKÁCH

15. T e s t o v á n í h y p o t é z

Transkript:

Testování statistických hypotéz Ing. Michal Dorda, Ph.D. 1

Úvodní poznámky Statistickou hypotézou rozumíme hypotézu o populaci (základním souboru) např.: Střední hodnota základního souboru je rovna 100. Střední hodnota prvního základního souboru se rovná střední hodnotě druhého základního souboru. Statistické hypotézy dělíme na parametrické a neparametrické hypotézy. Ing. Michal Dorda, Ph.D. 2

Úvodní poznámky Parametrická hypotéza je hypotéza o parametrech rozdělení základního souboru, zde patří: Hypotézy o parametru jednoho základního souboru o střední hodnotě, mediánu, rozptylu atd. Hypotézy o parametrech dvou základních souborů (srovnávací testy) rovnost středních hodnot, rovnost rozptylů atd. Hypotézy o parametrech tří a více základních souborů. Ing. Michal Dorda, Ph.D. 3

Úvodní poznámky Neparametrickáhypotéza je hypotéza o jiných vlastnostech základního souboru (tvar rozdělení, závislost proměnných atd.) Statistické testy dělíme na parametrickéa neparametrické testy. Parametrickým testem rozumíme takový test, pro jehož odvození je nutno specifikovat typ rozdělení, případně jeho parametry. Nejčastěji se setkáváme s předpokladem normality dat. Ing. Michal Dorda, Ph.D. 4

Úvodní poznámky Neparametrickýmtestem rozumíme takový test, pro jehož odvození není nutno specifikovat typ rozdělení. Při testování hypotéz proti sobě stojí 2 hypotézy nulová a alternativní hypotéza. Nulová hypotéza H 0 vyjadřuje tvrzení o základním souboru, které je bráno jako předpoklad při testování (rovnovážný stav) Ing. Michal Dorda, Ph.D. 5

Úvodní poznámky Alternativní hypotéza H 1 (resp. H A ) stojí proti nulové hypotéze a představuje porušení rovnovážného stavu. Rozlišujeme 3 typy alternativních hypotéz: Levostranná alternativní hypotéza. Pravostranná alternativní hypotéza. Oboustranná alternativní hypotéza. Ing. Michal Dorda, Ph.D. 6

Úvodní poznámky Testování hypotéz je založeno na následujícím principu: Pokud výběrový soubor neukáže na statisticky významný rozpor s nulovou hypotézou, pak nesmíme nulovou hypotézu zamítnout. Jelikož na základě chování výběrového souboru (tedy pouze vzorku populace) usuzujeme o chování celé populace (základního souboru), můžeme se při rozhodování dopustit chyby. Ing. Michal Dorda, Ph.D. 7

Úvodní poznámky Výsledek testu Platí H 0 Platí H A Platí H 0 Správné rozhodnutí, pravděpodobnost 1 α (spolehlivost testu) Chyba I. druhu, pravděpodobnost α(hladina významnosti) Skutečnost Platí H A Chyba II. druhu, pravděpodobnost β Správné rozhodnutí, pravděpodobnost 1 β(síla testu) Ing. Michal Dorda, Ph.D. 8

Úvodní poznámky Snahou je samozřejmě minimalizovat obě chyby, což však není možné, neboť snížením β vzroste αa naopak. Při statistickém testování hypotéz se volí hodnota α(nejčastěji 0,05 nebo 0,01), neboť chyba I. druhu je významnější než chyba II. druhu. Chybu II. druhu lze snížit volbou vhodného testu nebo zvětšením rozsahu výběrového souboru. Ing. Michal Dorda, Ph.D. 9

Klasický test Při klasickém testu hypotéz postupujeme v několika krocích: 1) Formulace nulové a alternativní hypotézy. 2) Volba testové statistiky a jejího rozdělení při platnosti nulové hypotézy (tzv. nulové rozdělení). Testová statistika a její nulové rozdělení je dána pro konkrétní test. Ing. Michal Dorda, Ph.D. 10

Klasický test 3) Sestrojení kritického oboru a oboru přijetí obor všech možných hodnot testové statistiky rozdělíme na dva disjunktní obory obor přijetí (takové hodnoty testové statistiky svědčící pro nezamítnutí nulové hypotézy) a kritický obor (takové hodnoty testové statistiky, které svědčí pro zamítnutí nulové hypotézy). Hranice mezi obory se nazývá kritická hodnota testu (x krit ). Kritický obor je tak velký, aby pravděpodobnost, že testová statistika leží v kritickém oboru při předpokladu platnosti nulové hypotézy, byla rovna α. Ing. Michal Dorda, Ph.D. 11

Levostranná alternativní hypotéza α Klasický test f(x) 1 α Obor přijetí Kritická hodnota testu 0 x Kritický obor Ing. Michal Dorda, Ph.D. 12

Klasický test f(x) Pravostranná alternativní hypotéza 1 α α Obor přijetí 0 x Kritická hodnota testu Kritický obor Ing. Michal Dorda, Ph.D. 13

Oboustranná alternativní hypotéza Klasický test f(x) 1 α α α 2 2 Obor přijetí Kritická hodnota testu 0 x Kritická hodnota testu Kritický obor Ing. Michal Dorda, Ph.D. 14

Klasický test 4) Výpočet pozorované hodnoty testové statistiky x obs. 5) Formulace závěru testu: leží-li x obs v oboru přijetí, potom nezamítáme nulovou hypotézu. leží-li x obs v kritickém oboru, potom zamítáme nulovou hypotézu ve prospěch alternativní hypotézy. Ing. Michal Dorda, Ph.D. 15

Pearsonůvχ 2 test dobré shody Testů statistických hypotéz existuje celá řada. My se zaměříme na test umožňující otestovat, že data získaná náhodným výběrem pocházejí z populace řídící se určitým teoretickým rozdělením s příslušnými parametry. K tomuto slouží Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D. 16

Pearsonůvχ 2 test dobré shody Tento test slouží k testování nulové hypotézy v obecném tvaru: Náhodný výběr pochází z konkrétního rozdělení pravděpodobnosti s konkrétními parametry. Alternativní hypotéza neguje nulovou hypotézu: Náhodný výběr nepochází z konkrétního rozdělení pravděpodobnosti s konkrétními parametry. Neznáme-li parametry příslušného rozdělení, je nutno je na základě náhodného výběru odhadnout, např. pomocí metody maximální věrohodnosti. Ing. Michal Dorda, Ph.D. 17

Pearsonůvχ 2 test dobré shody Pro testovou statistiku G platí: G ( ) k 2 n = i n π 0, i 2 χk h kde: n π i= 1 0, i 1, k počet tříd, n rozsah souboru, n i počet pozorování v i-té třídě (pozorované četnosti), n π 0,i teoretické (očekávané) četnosti, h počet odhadovaných parametrů rozdělení. Ing. Michal Dorda, Ph.D. 18

Pearsonůvχ 2 test dobré shody Aby bylo nulové rozdělení dobře aproximováno rozdělením χ 2, je třeba, aby byly teoretické četnosti ve všech třídách větší než 5. Není-li tento předpoklad pro všechny třídy splněn, je nutno příslušné třídy vhodně sloučit (toto má za následek pokles stupňů volnosti rozdělení χ 2 ). Ing. Michal Dorda, Ph.D. 19

Pearsonůvχ 2 test dobré shody f(x) 1-α α S rostoucí hodnotou testové statistiky roste rozpor naměřených dat s nulovou hypotézou, od určité hodnoty (Kritická hodnota testu) je tento rozpor statisticky významný, zamítneme tedy nulovou hypotézu. 0 Kritická hodnota testu Obor přijetí Kritický obor x Ing. Michal Dorda, Ph.D. 20