TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Podobné dokumenty
Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování statistických hypotéz

12. TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

Testování statistických hypotéz

4ST201 STATISTIKA CVIČENÍ Č. 7

12. cvičení z PST. 20. prosince 2017

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Testy statistických hypotéz

You created this PDF from an application that is not licensed to print to novapdf printer (

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

PRAVDĚPODOBNOST A STATISTIKA

4EK211 Základy ekonometrie

Testování hypotéz. 4. přednáška

Charakteristika datového souboru

Náhodné veličiny, náhodné chyby

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Cvičení ze statistiky - 8. Filip Děchtěrenko

STATISTICKÉ HYPOTÉZY

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Jana Vránová, 3. lékařská fakulta UK

Pravděpodobnost a aplikovaná statistika

Ing. Michael Rost, Ph.D.

= = 2368

Normální (Gaussovo) rozdělení

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Testování statistických hypotéz

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování statistických hypotéz. Obecný postup

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

7.1. Podstata testu statistické hypotézy

Testování hypotéz Biolog Statistik: Matematik: Informatik:

Statistické metody uţívané při ověřování platnosti hypotéz

Testy. Pavel Provinský. 19. listopadu 2013

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

INDUKTIVNÍ STATISTIKA

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

KGG/STG Statistika pro geografy

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Intervalové Odhady Parametrů II Testování Hypotéz

MATEMATIKA III V PŘÍKLADECH

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

Normální (Gaussovo) rozdělení

STATISTICKÉ TESTY VÝZNAMNOSTI

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Stručný úvod do testování statistických hypotéz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Cvičení ze statistiky - 9. Filip Děchtěrenko

Aproximace binomického rozdělení normálním

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Příklady na testy hypotéz o parametrech normálního rozdělení

5. T e s t o v á n í h y p o t é z

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.

Kontingenční tabulky, korelační koeficienty

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

Tomáš Karel LS 2012/2013

Regresní a korelační analýza

Jednostranné intervaly spolehlivosti

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

12. prosince n pro n = n = 30 = S X

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Jednofaktorová analýza rozptylu

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Tomáš Karel LS 2012/2013

Zápočtová práce STATISTIKA I

Jednofaktorová analýza rozptylu

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

TECHNICKÁ UNIVERZITA V LIBERCI

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Neparametrické metody

6. Testování statistických hypotéz. KGG/STG Zimní semestr 6. Testování statistických hypotéz

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

5 Parametrické testy hypotéz

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Transkript:

TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu, k posuzování významnosti změn, které byly způsobeny například změnou technologie, změnou způsobu měření, opravou přístroje apod. Ač formulace úloh toho typu se liší od formulace úlohy o odhadech parametrů, jde zpravidla vždy o řešení inverzní úlohy o intervalovém odhadu. STATISTICKÁ HYPOTÉZA je tvrzení, které se týká neznámé vlastnosti rozdělení pravděpodobnosti náhodné proměnné (i vícerozměrné) nebo jejích parametrů. Hypotéza, jejíž platnost ověřujeme, se nazývá nulová hypotéza H 0. Proti nulové hypotéze stavíme alternativní hypotézu H 1. Ta může být buď oboustranná nebo jednostranná. Pak i testy jsou buď oboustranné nebo jednostranné. Hypotézy se mohu týkat pouze neznámých číselných parametrů rozložení náhodné veličiny, pak jde o testy parametrické. Ostatní typy jsou testy neparametrické. Statistické testy jsou postupy, jimiž prověřujeme platnost nulové hypotézy. Na základě nich pak hypotézu buď přijmeme nebo odmítneme. Testovací kritérium je náhodná veličina závislá na náhodném výběru (též nazývaná statistika) mající vztah k nulové hypotéze. Jednostranné a oboustranné testy se od sebe rozlišují z hlediska alternativní hypotézy, kterou stavíme proti prověřované nulové hypotéze a která může být dvojího druhu, jak plyne z tohoto příkladu: Nechť nulová hypotéza předpokládá, že A = B. V případě, že tuto hypotézu zamítneme, je buď A B, nebo A > B (resp. A < B). a) V prvém případě (A B) nebereme zřetel na znaménko rozdílu A - B, takže může být buďa - B < 0 nebo A - B > 0. V těchto případech používáme oboustranný test. b) V druhém případě, kdy proti hypotéze A = B klademe možnost A > B (resp. A < B), používáme jednostranných testů.

Pro kritické hodnoty testovacího kritéria a p, b p platí: P a X b p p p 1 Tyto hodnoty oddělují interval prakticky možných hodnot (interval spolehlivosti, konfidenční interval) <a p, b p > od kritických intervalů, v nichž se hodnoty veličiny X vyskytují s pravděpodobností p, které říkáme hladina významnosti. Nejčastěji volíme p = 0,01 nebo p = 0,05. Pro oboustranné odhady volíme: p P X ap P X bp, pro jednostranné buď P X a 0, P X b p nebo p p p p P X a p, P X b 0. Porovnání hodnoty testovacího kritéria s jeho kritickými hodnotami slouží k rozhodnutí o výsledku testu. Musíme si uvědomit, že nemůžeme mluvit o dokazování správnosti či nesprávnosti zvolené hypotézy - to není v možnostech statistické indukce. Závěr testu pouze rozhodne mezi dvěmi možnostmi: hypotézu přijímáme (zamítáme alternativní hypotézu), leží-li pozorovaná hodnota testovacího kritéria v intervalu prakticky možných hodnot. Znamená to, že rozdíl mezi pozorovanou a teoretickou hodnotou testovacího kritéria je vysvětlitelný na dané hladině významnosti p náhodností výběru. hypotézu zamítáme (přijímáme alternativní hypotézu), leží-li pozorovaná hodnota testovacího kritéria v kritickém oboru. Rozdíly považujeme za statisticky významné na zvolené hladině významnosti p, tzn., že se nedají vysvětlit pouze náhodností výběru. Příklady otázek, na které se dá odpovídat pomocí výsledků příslušných statistických testů: Má základní soubor (ZS) předpokládanou střední hodnotu? Mají dva soubory stejnou disperzi? Mají dva soubory stejnou střední hodnotu? Můžeme předpokládat, že dva výběry pocházejí z téhož ZS? Má ZS předpokládané rozdělení? atd.

DOPORUČENÝ POSTUP PŘI TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ Formulace výzkumné otázky ve formě nulové a alternativní statistické hypotézy Zvolení přijatelné úrovně chyby rozhodování (volba hladiny významnosti p) Volba testovacího kritéria Výpočet hodnoty testovacího kritéria Určení kritických hodnot testovacího kritéria Doporučení ( přijmutí (nezamítnutí) nebo zamítnutí nulové hypotézy H 0 ) Poznámka Hladina významnosti je pravděpodobnost, že se zamítne nulová hypotéza, ačkoliv ona platí. Pochopitelně se tato hodnota volí velmi malá, jak již bylo řečeno, nejčastěji 0,01 či 0,05 nebo 0,01. Poznámka Jestliže test neindikuje zamítnutí nulové hypotézy H 0, je nesprávné přijmout nulovou hypotézu jako definitivně pravdivou. Správně můžeme pouze prohlásit, že není dostatek dokladů pro zamítnutí nulové hypotézy (viz shrnutí níže). Poznámka Netvrďme, že data ukazují, že teorie platí/neplatí. Správnější je říct, že data podporují nebo nepodporují rozhodnutí o zamítnutí platnosti nulové hypotézy. TEST JAKO ROZHODOVÁNÍ Při testování hypotéz mohou nastat čtyři možnosti, které popisuje následující tabulka: Závěr testu Závěr soudu Obžalovaný je nevinen Obžalovaný je vinen Skutečnost Existují tedy dvě možnosti chyby: H 0 platí H 0 neplatí H 0 platí správný chyba I.druhu H 0 neplatí chyba II.druhu správný Skutečnost Obžalovaný je nevinen Obžalovaný je vinen správný chyba II. druhu chyba I. druhu správný chyba I. druhu - nulová hypotéza platí, ale zamítne se; chyba II. druhu - nulová hypotéza neplatí, ale přijme se.

Pravděpodobnost chyby I. druhu je podmíněná pravděpodobnost, že zamítneme nulovou hypotézu za předpokladu, že platí - označujeme p - viz výše. Pravděpodobnost chyby II. druhu je podmíněná pravděpodobnost, že nezamítneme nulovou hypotézu za předpokladu, že neplatí, označujeme p 0 : P(chyba I. druhu H 0 platí) = p P(chyba II. druhu H 1 neplatí) = p 0 Konvenční hodnoty pro p 0 jsou 0, nebo 0,1. Někdy můžeme také mluvit o opačných jevech k chybě I. a II. druhu, tzn. o podmíněné pravděpodobnosti, že neuděláme chybu I.druhu (spolehlivost testu) nebo že neuděláme chybu II. druhu. Síla testu odpovídá hodnotě (1 - p 0 ). Jedná se tedy o podmíněnou pravděpodobnost, že správně odhalíme testem neplatnost nulové hypotézy: P(neuděláme chybu I. druhu H 0 platí) = 1 - p = spolehlivost P(neuděláme chybu II. druhu H 1 neplatí) = 1 - p 0 = síla testu Cílem při testování nulové hypotézy je omezit úrovně pravděpodobnosti chyb I. a II. druhu. Jinými slovy - usilujeme o maximalizaci spolehlivosti a síly testu. SHRNUTÍ PŘEDCHOZÍCH POZNATKŮ Pravděpodobnost chyby I. druhu = hladina významnosti p volíme. Pravděpodobnost chyby II. druhu nevolíme a neznáme, víme pouze, že s pravděpodobností chyby I. druhu tvoří spojené nádoby, s rostoucí jednou hodnotou druhá klesá a naopak. Zamítneme-li tedy při testování nulovou hypotézu, můžeme se dopustit chyby I.druhu, jejíž pravděpodobnost známe, víme tedy s jakou chybou pracujeme. Pokud ale nulovou hypotézu nezamítneme, je možné, že se dopustíme chyby II.druhu, tudíž nevíme s jakou pracujeme chybou! Velikost hodnoty hladiny významnosti volíme podle toho, která z chyb (I., II.) má pro nás fatálnější následky. V mnoha případech však nevíme zcela přesně, která chyba je pro nás důležitější. Dále: VYBRANÉ STATISTICKÉ TESTY:

TEST VÝZNAMNOSTI ROZDÍLU DVOU ROZPTYLŮ (F-TEST) Jsou dány dva výběry o rozsazích n 1, n s rozptyly s 1, s, vybrané ze dvou základních souborů s rozděleními N( 1 ; 1 ) a N( ; ). H 0 : 1 = Alternativní hypotéza: H 1 : 1 n1 n 1. 1 S1 F n n1 1. S má Fisherovo-Snedecorovo rozdělení F(n 1-1, n - 1). Jestliže F F n 1, n 1, zamítáme hypotézu H 0 p 1 (přijímáme H 1 ). Indexy 1, volíme tak, aby testovací kritérium F > 1! Poznámka V případě, že bychom chtěli prokázat hypotézu H 0 proti hypotéze H 1 : 1 >, použili bychom kritickou hodnotu F p (n 1-1,n - 1), podobně jako u následujících testů. TEST VÝZNAMNOSTI ROZDÍLU DVOU VÝBĚROVÝCH PRŮMĚRŮ (T-TEST) Jsou dány dva výběry o rozsazích n 1, n se středními hodnotami m 1, m a disperzemi s 1, s, které pocházejí ze dvou základních souborů s rozděleními N( 1 ; 1 ) a N( ; ). H 0 : 1 = Alternativní hypotéza: H 1 : 1 a) jestliže můžeme předpokládat 1 = (prověříme F-testem), volíme testovací kritérium: T m m 1 n. s n. s 1 1. n. n. n n 1 1 n n 1, které má Studentovo rozdělení t(n 1 + n - ). Jestliže T > t p, zamítneme H 0. b) jestliže předpokládáme 1 (prověříme F-testem), volíme testovací kritérium: m m. 1. 1 1 T n1 n n 1. s1 n1 1. s které má rozdělení, složené ze dvou Studentových rozdělení. Kritické hodnoty určíme podle vzorce: n 1. s1. t pn1 1 n1 1. s. t pn 1 t p n 1. s n 1. s 1 1 Jestliže T > t p (n 1 + n - ), zamítneme H 0., Poznámka t-test používáme např. k ověřování následujících hypotéz: Pocházejí dva vzorky z téhož základního souboru? Nedopustili jsme se při dvou měřeních, jejichž výsledkem bylo určení dvou středních hodnot m 1, m, systematických chyb? Poznámka Má určitý faktor vliv na zkoumaný argument? Zde zkoumáme dva vzorky - jeden při působení daného faktoru, druhý bez jeho působení.

TEST VÝZNAMNOSTI ROZDÍLU M - 0 Je dán výběr ze základního souboru s rozdělením N(; ) o rozsahu n se střední hodnotou m a disperzí s. H 0 : = 0 Alternativní hypotéza: H 1 : 0 m T 0. n 1 s má Studentovo rozdělení t(n - 1). Jestliže T > t p (n - 1), zamítáme hypotézu H 0 (přijímáme H 1 ). Poznámka Volíme-li alternativní hypotézu H 1 : > 0, pak hodnotu testovacího kritéria srovnáváme s kritickou hodnotou t p (n - 1). STUDENTŮV TEST PRO PÁROVANÉ HODNOTY Ze dvou normálně rozložených základních souborů s parametry μ 1, σ 1 a μ, σ byly vybrány dva výběry se stejnými rozsahy n. Přitom každému prvku prvého výběru x 1i odpovídá právě jeden prvek druhého výběru x i. Vznikly tedy páry (x 1i ; x i ), i = 1,... n. H 0 : μ 1 = μ, což lze jinak zapsat: d = 0, když d je střední hodnota rozdílů d i = x 1i - x i, tedy: x x 1i i i d x1 x 0 n Alternativní hypotéza: H 1 : μ 1 μ nebo tedy: d 0. d. n1 t s d (s d je směrodatná odchylka hodnot d i ) Veličina t má Studentovo rozložení s n - 1 stupni volnosti t(n - 1). Jestliže t > t p (n - 1), zamítneme hypotézu H 0.

PEARSONŮV TEST DOBRÉ SHODY - Χ TEST PRO JEDEN VÝBĚR Nechť výsledky pozorování jsou roztříděny do k skupin a v každé skupině je zjištěna skupinová četnost n ej (četnosti experimentální). Uvažujme určité rozdělení, které budeme považovat za model pro náš výběr. Pro každou třídu určíme teoretické, modelové, očekávané četnosti n oj (j = 1,...,k). H 0 : Základní soubor má očekávané rozložení, tzn. že četnosti n ej a n oj (j = 1,...,k) se liší pouze náhodně. k j1 n ej noj n oj Tato veličina má Pearsonovo rozložení χ s ν = k - s - 1 stupni volnosti. Veličina s značí počet parametrů očekávaného rozložení odhadnutých na základě výběru. Jestliže χ > χ p (k - s - 1), zamítneme hypotézu H 0. Poznámka K výpočtu počtu tříd můžeme využít například Sturgesovo pravidlo: n 13,3 log N Poznámka Při použití tohoto testu se vyžaduje splnění těchto podmínek: - všechny očekávané třídní četnosti mají být větší než 1, - nejvýš 0 % očekávaných třídních četností může být menších než 5, - nedoporučuje se volit počet tříd větší než 0. Poznámka Nejsou-li splněny, lze přikročit k sloučení sousedních tříd v nezbytném rozsahu. Pozn. ke stupňům volnosti: Ověřujeme-li např. normalitu základního souboru, je s rovno, protože teoretické normální rozložení se stanovuje na základě odhadu střední hodnoty a disperze výběru, tedy na základě dvou charakteristik. TEST LINEÁRNÍ NEZÁVISLOSTI V ZÁKLADNÍM SOUBORU Dvojrozměrný základní soubor má normální rozložení a korelační koeficient ρ. Náhodný výběr z tohoto souboru má rozsah n a koeficient korelace r. ρ = 0 r t. n 1 r Tato veličina má Studentovo rozložení s n - stupni volnosti t(n - ). t t n, zamítneme H 0. Jestliže p Poznámka Odmítnutí nulové hypotézy znamená připuštění alternativní hypotézy, že mezi složkami náhodné veličiny je korelace, složky nejsou lineárně nezávislé.

TEST NEZÁVISLOSTI KVALITATIVNÍCH ZNAKŮ Máme k dispozici n nezávislých opakování experimentu se dvěma kvalitativními znaky A a B. Znak A má r možných kategorií hodnot, značených A 1, A,, A r, znak B má s možných kategorií hodnot B 1, B,, B s. Výsledek celého složeného experimentu lze shrnout do kontingenční tabulky: Kategorie znaku A / B B 1 B B s Součet A 1 n 11 n 1 n 1s n 1. A n 1 n n s n. A r n r1 n r n rs n r. Součet n.1 n. n.s n V tabulce značí n ij počet experimentů, při kterých znak A nabývá hodnoty (kategorie) A i a znak B hodnoty B j. Symbolem n i. značíme celkový počet opakování, při kterých se vyskytla i-tá kategorie znaku A, symbolem n j. značíme celkový počet opakování, při kterých se vyskytla j-tá kategorie znaku B. Nulová hypotéza H 0 : Kvalitativní znaky A a B jsou nezávislé. r s n ij G n 1 i 1 j 1 nn i.. j má Chi-kvadrát rozdělení s df =(r -1)(s -1) stupni volnosti. Hypotézu H 0 o nezávislosti znaků A a B zamítáme na hladině významnosti α, když hodnota statistiky G padne do kritického oboru C 1 df ;