TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Podobné dokumenty
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

PRAVDĚPODOBNOST A STATISTIKA

4ST201 STATISTIKA CVIČENÍ Č. 7

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

= = 2368

Testování statistických hypotéz

Aproximace binomického rozdělení normálním

Testování statistických hypotéz

Testování statistických hypotéz

STATISTICKÉ HYPOTÉZY

Ing. Michael Rost, Ph.D.

5 Parametrické testy hypotéz

Testy statistických hypotéz

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

STATISTICKÉ TESTY VÝZNAMNOSTI

Stručný úvod do testování statistických hypotéz

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Cvičení ze statistiky - 8. Filip Děchtěrenko

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz. 4. přednáška

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Testy. Pavel Provinský. 19. listopadu 2013

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

Náhodné veličiny, náhodné chyby

Normální (Gaussovo) rozdělení

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování statistických hypotéz. Obecný postup

Normální (Gaussovo) rozdělení

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

12. prosince n pro n = n = 30 = S X

STATISTICKÉ TESTY VÝZNAMNOSTI

Neparametrické metody

2 ) 4, Φ 1 (1 0,005)

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Jednostranné intervaly spolehlivosti

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Pravděpodobnost a aplikovaná statistika

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Charakteristika datového souboru

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

Zápočtová práce STATISTIKA I

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.

12. cvičení z PST. 20. prosince 2017

You created this PDF from an application that is not licensed to print to novapdf printer (

Základní statistické metody v rizikovém inženýrství

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Cvičení ze statistiky - 9. Filip Děchtěrenko

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

15. T e s t o v á n í h y p o t é z

Statistické metody uţívané při ověřování platnosti hypotéz

prosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

4EK211 Základy ekonometrie

Neparametrické testy

Jednofaktorová analýza rozptylu

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Co je to statistika? Úvod statistické myšlení. Základy statistického hodnocení výsledků zkoušek. Petr Misák

Testování hypotéz Biolog Statistik: Matematik: Informatik:

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

STATISTICKÉ ZJIŠŤOVÁNÍ

Matematika III. 3. prosince Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

5. T e s t o v á n í h y p o t é z

I. D i s k r é t n í r o z d ě l e n í

Jana Vránová, 3. lékařská fakulta UK

15. T e s t o v á n í h y p o t é z

p(x) = P (X = x), x R,

Tomáš Karel LS 2012/2013

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

7.1. Podstata testu statistické hypotézy

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

ROZDĚLENÍ NÁHODNÝCH VELIČIN

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Návrh a vyhodnocení experimentu

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

Ranní úvahy o statistice

Jednovýběrové testy. Komentované řešení pomocí MS Excel

STATISTICKÉ ODHADY Odhady populačních charakteristik

Transkript:

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě údajů zjištěných z náhodného výběru objektivně předepisuje rozhodnutí, má-li být ověřovaná hypotéza zamítnuta či nikoliv

DRUHY HYPOTÉZ Pro každý test musíme formulovat nulovou a alternativní hypotézu: Testovaná hypotéza se nazývá nulová hypotéza (H 0 ). Předpokládáme, že platí, pokud nemáme k dispozici dostatečný statistický důkaz její neplatnosti. Pokud zamítneme platnost nulové hypotézy, předpokládáme, že platí alternativní hypotéza (H 1 ).

DRUHY HYPOTÉZ Hypotézy se mohou formulovat jako oboustranné nebo jako jednostranné. Oboustranná hypotéza: H 0 : μ = 50 H 1 : μ 50 všechny ostatní možnosti odpovídají platnosti H 1 50 pouze zde platí H 0 Jednostranná hypotéza: H 0 : μ 50 H 1 : μ > 50 zde platí H 0 zde platí H 1 50 (H 0 : μ 50 H 1 : μ < 50)

TESTOVÉ KRITÉRIUM Testy statistických hypotéz jsou obecně založeny na testovém kritériu (náhodná veličina, jejíž rozdělení je známo pro případ platnosti i neplatnosti nulové hypotézy). toto je rozdělení testového kritéria pro nulovou hypotézu toto je rozdělení testového kritéria pro alternativní hypotézu (je to stejná náhodná veličina jako u nulové hypotézy, jen s jinými parametry)

TESTOVÉ KRITÉRIUM Obor možných hodnot testového kritéria je rozdělen na dvěčásti obor nezamítnutí (přijetí) a obor zamítnutí (nepřijetí) testované hypotézy. Obor zamítnutí je ta část všech možných hodnot testového kritéria, kde je vysoce nepravděpodobné, že by testové kritérium mohlo nabýt tyto hodnoty (za předpokladu, že platí nulová hypotéza). Hranice oborů tvoří kritický bod (kritická hodnota), což je kvantil testového kritéria určený na základě hladiny významnosti α.

TESTOVÉ KRITÉRIUM Konkrétní hodnota testového kritéria je výběrová statistika vypočítaná přímo z měřených dat (z výběru). Pokud tato hodnota padne do oboru nezamítnut tnutí ( přijetí í ), je testovaná (nulová) ) hypotéza nezamítnuta ( přijata( ijata ). Pokud tato hodnota padne do oboru zamítnut tnutí (nepřijet ijetí), je testovaná (nulová) ) hypotéza zamítnuta (nepřijata). V tom případě dále pracujeme s předpokladem, že platí alternativní hypotéza.

TESTOVÉ KRITÉRIUM PRO OBOUSTRANNÝ TEST hustota pravděpodobnosti náhodné veličiny, která funguje jako testové kritérium obor zamítnutí (nepřijetí) obor nezamítnutí (přijetí) obor zamítnutí (nepřijetí) α/2 α/2 a α/2 b α/2 dolní kritický bod horní kritický bod

TESTOVÉ KRITÉRIUM PRO JEDNOSTRANNÝ TEST obor nezamítnutí (přijetí) b α α horní kritický bod obor zamítnutí (nepřijetí) obor zamítnutí (nepřijetí) α obor nezamítnutí (přijetí) a α dolní kritický bod

OBECNÝ POSTUP TESTU formulace nulové hypotézy (H 0 ) a alternativní hypotézy (H 1 ). volba hladiny významnosti α volba druhu testu a testového kritéria určení kritického oboru (oboru nepřijetí) testového kritéria na základě jejího rozdělení pravděpodobnosti a hladiny významnosti rozhodnutí o výsledku testu, tj. zda zamítnout nulovou hypotézu (jestliže vypočítaná hodnota testového kritéria padne do oboru nepřijetí), nezamítnout nulovou hypotézu (jestliže vypočítaná hodnota testového kritéria padne do oboru přijetí). Říkáme, že výsledek testu je významný (signifikantní) na hladině významnosti α, pokud jeho rozhodnutí vede k zamítnutí nulové hypotézy na základě výpočtu s využitím zvolené hodnoty α.

POSTUP TESTOVÁNÍ NA PŘÍKLADU Úloha: Byla prověřována správnost měření výškoměru. Byla 15 x změřena výška, jejíž hodnota je přesně známa (μ 0 = 20 m). Z výsledků měření se získal průměr měřených výšek = 19,2 m se směrodatnou odchylkou S = 1,1 m. Stanovte, zda-li výškoměr měří správně. formulace H 0 a H 1 : H 0 : Výškoměr měří správně. H 0 : μ = μ 0 (výběrový soubor o parametrech a S 2 pochází ze základního souboru s rozdělením N(μ,σ 2), přičemž parametr μ se rovná normované hodnotě μ 0 ).

POSTUP TESTOVÁNÍ NA PŘÍKLADU H 1 : Výškoměr neměří správně. H 1 : μ μ 0 (výběrový soubor o parametrech a S 2 pochází ze základního souboru s rozdělením N(μ,σ 2), přičemž parametr μ se nerovná normované hodnotě μ 0 ). stanovení hladiny významnosti α: Hladinu významnosti stanovíme na 0.05, tj. pro zamítnut tnutí nulové hypotézy potřebujeme pravděpodobnost podobnost nejméně 1 - α = 0.95.

POSTUP TESTOVÁNÍ NA PŘÍKLADU výběr r typu testu (testového kritéria) ria) vzhledem k charakteru úlohy dané formulací hypotéz z vybereme test středn ední hodnoty pro jeden výběr,, který testuje námi n zvolené hypotézy. Testové kritérium je t=(x-μ ) 0 n-1 S 15-1 t = (19,2-20) = -2,72 1,1 Pro tento test jako testové kritérium používáme t-rozdělení a jeho konkrétní vypočítaná hodnota pro naše zadání je 2,72. Tuto hodnotu budeme porovnávat k kritickými mezemi.

POSTUP TESTOVÁNÍ NA PŘÍKLADU stanovení kritické hodnoty Vzhledem k tomu, že pracujeme (podle formulace hypotéz a typu úlohy) s oboustranným testem, musíme zvolit 2 kritické hodnoty, tj. dolní a horní. Studentovo t-rozdělení je symetrické kolem 0, stačí nám tedy určit jednu hodnotu a použít ji s kladným i záporným znaménkem. Využijeme funkce Excelu =TINV (0,05;14), kde 0,05 je hodnota α (a funkce automaticky vrátí hodnoty pro oboustranný interval, tj. vlastně pro α = 0,025). Hodnota 14 je počet stupňů volnosti (n- 1)=15-1. Výsledná hodnota je 2,145. Tím jsou určeny kritické meze 2,145 a +2,145.

POSTUP TESTOVÁNÍ NA PŘÍKLADU rozhodnutí o výsledku testu Kritická hodnota 2,145 je menší než vypočítaná hodnota testového kritéria 2,72, znamená to, že 2,72 padlo do oboru nepřijetí tedynulovou hypotézu zamítáme. Závěr r testu: Výškom koměr r neměř ěří správn vně.. Odchylka naměř ěřených hodnot od správn vné hodnoty je statisticky významná.

POSTUP TESTOVÁNÍ NA PŘÍKLADU hodnota testového kriteria 2,72 obor nezamítnutí pro α = 0,01 kritický obor pro α = 0,01/2 = 0,005 kritický obor pro α = 0,01/2 = 0,005 obor nezamítnutí pro α = 0,05-2,98-2,145 0 2,145 2,98 t kritický obor pro α = 0,05/2 = 0,025 kritický obor pro α = 0,05/2 = 0,025

p-spočtená HODNOTA HLADINY VÝZNAMNOSTI p-hodnota je pravděpodobnost, že získáme stejné nebo extrémnější testové kritérium než je vypočítané, za předpokladu, že ve skutečnosti platí nulová hypotéza. p<α α p>α p < α Η 0 zamítáme p > α Η 0 nezamítáme obor zamítnutí kritický bod obor nezamítnutí 1-p maximální pravděpodobnost, se kterou můžeme zamítnout H 0

p HODNOTA (jednostranný test) hodnota testového kritéria p-hodnota α

p-hodnota (oboustranný test) p/2 α/2 α/2 p/2

p-hodnota p-hodnota závisí na: rozdílu mezi skutečnou a testovanou hypotézou (hodnotou, ) velikosti výběru Skutečná Testovaná hodnota (k) konstanta (k 0 ) n t t krit p 99 100 10 0.300 2.262 0.771 99 100 100 0.995 1.984 0.322 99 100 1000 3.161 1.962 0.002 99 100 20 0.436 2.093 0.668 97 100 20 1.308 2.093 0.207 95 100 20 2.179 2.093 0.042 90 100 20 4.359 2.093 0.000

p-hodnota Je nutné rozlišovat mezi statistickou významností (danou p - hodnotou) a reálnou (ekologickou, ekonomickou, sociální, ) významností!! Praktická (reálná) důležitost pozorovaného rozdílu H 0 - H 1 Statistická významnost (podle p) nevýznamná významná nedůležitý n v pořádku n příliš velké důležitý n příliš malé n v pořádku apriorní (před pokusem dělaná) analýza síly testu!!

p-hodnota (statistická x reálná významnost) 10 velikost efektu 8 6 4 2 0-2 -4 velikost reálně důležitého efektu (rozdílu H 0 a H 1 ) Případ 1 Případ 2 Případ 3 Případ 4 Případ 5

CHYBA I. A II. DRUHU Chyba I. druhu (α) pravděpodobnost, že test zamítne hypotézu, která ve skutečnosti platí. Chyba II. druhu (β) pravděpodobnost, že test NEzamítne hypotézu, která ve skutečnosti NEplatí. Síla testu (1- β) pravděpodobnost, že test správně odmítne hypotézu, která ve skutečnosti neplatí.

CHYBA I. A II. DRUHU H 0 VE SKUTEČ NOSTI platí neplatí H 0 PODLE ROZDHODNUTÍ TESTU platí neplatí činím e správné rozhodnutí P = 1 - alfa dopouštíme se chyby I. druhu alfa dopouštíme se chyby II. druhu beta činím e správné rozhodnutí S = 1 - beta

CHYBA I. A II. DRUHU testové kritérium pro případ platnosti H 0 kritická hodnota testové kritérium rium pro případ p pad neplatnosti H 0 chyba II. druhu (β)( chyba I. druhu (α) Síla testu (1-β)

CHYBA II. DRUHU Chybu II. druhu (β) nelze určit apriorně před testem jako chybu I. druhu (α). Je nutno ji vypočítat a slouží především k výpočtu síly testu (S = 1 - β). Vycházíme z podmíněné pravděpodobnosti β= P(t<C H 0 neplatí) kde t je hodnota testového kritéria C je kritický bod

CHYBA II. DRUHU - VÝPOČET formulace H 0 a H 1 : H 0 : μ = 60 H 1 : μ = 65; n = 100, σ = 20 stanovení kritického bodu C: C σ 20 C=μ 0 + z α = 60 +1,645 = 63,29 n 10 C = 63,29 α = 0,05 μ 0 = 60 β=? μ 1 = 65

CHYBA II. DRUHU - VÝPOČET Výpočet pravděpodobnosti podobnosti odpovídaj dající hodnotě β x μ C μ 63, 29 65 < = < = < = n n 20 / 10 σ σ 1 1 P P Z P(Z 0,855) 0,1963 C = 63,29 α = 0,05 μ 0 = 60 β=0,196 μ 1 = 65

CHYBA II. DRUHU - VÝPOČET formulace H 0 a H 1 pro jednostranný test: H 0 : μ = 60 H 1 : μ >60 Hodnota parametru Chyba II. druhu Síla testu 61 0,8739 0,1261 62 0,7405 0,2595 63 0,5577 0,4423 64 0,3613 0,6387 65 0,1963 0,8037 66 0,0877 0,9123 67 0,0318 0,9682 68 0,0092 0,9908 69 0,0021 0,9979 síla testu 1,2000 1,0000 0,8000 0,6000 0,4000 0,2000 0,0000 61 62 63 64 65 66 67 68 69 skutečná hodnota parametru základního souboru

FAKTORY OVLIVŇUJÍCÍ SÍLU TESTU Síla testu závisí na následujících faktorech: odchylka mezi hodnotou testovaného parametru v nulové hypotéze a skutečnou hodnotou parametru velikost efektu variabilita (směrodatné odchylce nebo rozptylu) základního souboru velikost výběrového souboru na hladina významnosti α typ testu

FAKTORY OVLIVŇUJÍCÍ SÍLU TESTU S ES α σ n

ÚČEL ANALÝZY SÍLY TESTU před provedením pokusu (apriorní analýza) zjišťujeme potřebnou velikost výběru známe (zadáváme) - chybu I. druhu (alfa) - požadovanou sílu testu (1 - beta) - velikost efektu, kterou potřebujeme detekovat

ÚČEL ANALÝZY SÍLY TESTU po provedení pokusu (aposteriorní analýza) zjišťujeme skutečnou sílu testu známe (zadáváme) - chybu I. druhu (alfa) - velikost výběru (N) - velikost efektu

Metodické problémy testování je nutné vždy apriorně určovat chybu I. druhu? jaký je rozdíl mezi statistickou a reálnou významností testu? za předpokladu, že kontroluji chybu I. druhu, nakolik je průkazné nezamítnutí nulové hypotézy? jakou velikost výběru potřebuji, abych prokázal efekt určité velikosti (tj. určitý rozdíl mezi nulovou a alternativní hypotézou)?

Musíme vždy vycházet z chyby I. druhu? Předem ( napevno ) se určuje vždy ta chyba, jejíž důsledky považujeme za vážnější (důležitější): určíme chybu I. druhu, dopočítáme chybu II. druhu určíme chybu II. druhu, dopočítáme chybu I. druhu kompromisní -určíme vzájemný poměr závažnosti důsledků obou chyb a počítáme obě

TYPY TESTŮ STATISTICKÉ TESTY PARAMETRICKÉ mají vyšší sílu vyžadují splnění určitých podmínek NEPARAMETRICKÉ nižší síla testu vyžadují pouze spojité rozdělení vhodné při velmi malých výběrech PRO JEDEN VÝBĚR H0: P = K PRO DVA VÝBĚRY H0: P1 = P2 PRO VÍCE VÝBĚRŮ H0: P1 = P2 =...=Pk PRO JEDEN VÝBĚR PRO DVA VÝBĚRY PRO VÍCE VÝBĚRŮ

Testování hypotéz I Hypotéza: předpoklad o rozdělení a jeho parametrech (H) Testování: rozhodnutí o H na základě informací z výběru H 0 : základní (bázová) hypotéza H A : alternativní (přijatá, když nelze přijmout H 0 ) Testovací statistika: T(x 1,...x n ) f(t) H a : μ > μ H 0 0: μ = μ 0 H a : μ μ A 0 A C C C

Souvislosti testů s IS: H 0 (α = 0.05) H A H A α = 0.05 Testování hypotéz II Chyba prvního druhu [α]: H 0 platí, ale nebyla testem přijata Chyba druhého druhu [β]: H 0 neplatí, ale byla testem přijata f(t) H 0 β α H A A R T 1-α α F β 1-β

σ 2 : neznámé Test o střední hodnotě Nulová hypotéza: Testová statistika: Alternativní Hypotéza H H H a a a : μ > μ0 : μ< μ0 : μ μ 0 t H0 : μ = μ 0 x μ = 0 s/ n Oblast zamítnutí buď t t t t α, n 1 t t α/2, n 1 α, n 1 nebo t t α/2, n 1

Testy normální data