Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

Podobné dokumenty
Statistika. Testování hypotéz statistická indukce Neparametrické testy. Roman Biskup

Statistika. Testování hypotéz - statistická indukce Parametrické testy. Roman Biskup

7.1. Podstata testu statistické hypotézy

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Ing. Michael Rost, Ph.D.

Testování statistických hypotéz

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Pravděpodobnost a aplikovaná statistika

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Testování hypotéz o parametrech regresního modelu

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Testování hypotéz o parametrech regresního modelu

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

PRAVDĚPODOBNOST A STATISTIKA

Statistika. Základní pojmy a cíle statistiky. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Testy statistických hypotéz

STATISTICKÉ HYPOTÉZY

Testování statistických hypotéz

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Základy teorie pravděpodobnosti

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

4ST201 STATISTIKA CVIČENÍ Č. 7

Statistická analýza jednorozměrných dat

Testování statistických hypotéz

Matematika III. 3. prosince Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Základy teorie pravděpodobnosti

Základy teorie pravděpodobnosti

Náhodné veličiny, náhodné chyby

Cvičení ze statistiky - 8. Filip Děchtěrenko

Jednofaktorová analýza rozptylu

Testování hypotéz. 4. přednáška

Jednostranné intervaly spolehlivosti

Stručný úvod do testování statistických hypotéz

Normální (Gaussovo) rozdělení

4EK211 Základy ekonometrie

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

KGG/STG Statistika pro geografy

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

Charakteristika datového souboru

12. cvičení z PST. 20. prosince 2017

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Ranní úvahy o statistice

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Aproximace binomického rozdělení normálním

ÚVOD DO TESTOVÁNÍ HYPOTÉZ. Martina Litschmannová

Neparametrické metody

Intervalové Odhady Parametrů II Testování Hypotéz

Úvod do testování hypotéz

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Testování statistických hypotéz. Obecný postup

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Přednáška VII. Úvod do testování hypotéz

Základy počtu pravděpodobnosti a metod matematické statistiky

Zápočtová práce STATISTIKA I

7. Analýza rozptylu.

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Test dobré shody v KONTINGENČNÍCH TABULKÁCH

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

15. T e s t o v á n í h y p o t é z

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

STATISTICKÉ TESTY VÝZNAMNOSTI

= = 2368

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

Normální (Gaussovo) rozdělení

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

Příklad datového souboru. Pravděpodobnost vs. statistika. Formální definice. Teorie odhadu

15. T e s t o v á n í h y p o t é z

Pravděpodobnost a matematická statistika

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření

Testy. Pavel Provinský. 19. listopadu 2013

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

y = 0, ,19716x.

Testování hypotéz Biolog Statistik: Matematik: Informatik:

Tomáš Karel LS 2012/2013

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Transkript:

Statistika Testování hypotéz statistická indukce Úvod do problému Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 21. února 2012 Statistika by Birom Statistika Testování hypotéz 1 / 11

Obsah Nulová a alternativní hypotéza Chyby testování Průkaznost hypotéz Logické dělení testů Statistika by Birom Statistika Testování hypotéz 2 / 11

Nulová a alternativní hypotéza Myšlenka testování hypotéz = způsob ověřování domněnek o statistickém souboru: 1. typu (zákona) rozdělení; 2. parametrech rozdělení a charakteristik souboru: µ, σ 2, σ, λ, x,...; 3. shodě dvou a více rozdělení; 4. shodě parametrů rozdělení a charakteristik dvou a více souboru. Myšlenka testování hypotéz Dvojice vzájemně se vylučujících se hypotéz H 0 Nulová hypotéza; hypotéza, která má být zamítnuta, matematické vyjádření hypotézy obsahuje =, nic se nestalo, zamítnutí má vážnější důsledky H A Alternativní hypotéza (H 1 ); hypotéza, která má být prokázána, matematické vyjádření hypotézy neobsahuje =, něco se stalo, zamítnutí nemá tak vážné důsledky. za platnosti H0 se pomocí matematické statistiky odvodí tzv. testové kritérium T (testová statistika) to je (přesně nebo asymptoticky) náhodnou veličinou se známým rozdělením, z možných hodnot, kterých může testové kritérium T nabývat, část svědčí pro nulovou hypotézu (obor nezamítnutí K c ) a část pro její zamítnutí (kritický obor K), body oddělující obor nezamítnutí a kritický obor se nazývají kritické hodnoty a jsou jimi kvantily příslušných rozdělení. Statistika by Birom Statistika Testování hypotéz 3 / 11

Chyby testování Možné chyby testování Výsledek Skutečnost testování H 0 H A H 0 H 0 H 0 H 0 H A H A H A H 0 H A H A Výsledek Skutečnost testování H 0 H A H 0 T K c H 0 T K c H A H A T K H 0 T K H A správný výsledek (H 0 H 0, H A H A ) nesprávný výsledek chyba prvního druhu (HA H 0) nulová hypotéza byla zamítnutá ačkoliv byla správná (alternativní hypotéza neplatí) chyba druhého druhu (H0 H A ) nulová hypotéza nebyla zamítnutá ačkoliv byla chybná (platí alternativní hypotéza) Statistika by Birom Statistika Testování hypotéz 4 / 11

Chyby testování Pravděpodobnosti chyb testování Výsledek Skutečnost testování H 0 H A H 0 P(H 0 H 0) P(H 0 H A ) H A P(H A H 0) P(H A H A ) pravděpodobnosti nesprávných výsledků pravděpodobnost chyby prvního druhu P(HA H 0) = α tzv. hladina významnosti pravděpodobnost chyby druhého druhu P(H0 H A ) = β správný výsledek pravděpodobnost, že nenastane chyba prvního druhu P(H0 H 0) = 1 α tzv. spolehlivost testu pravděpodobnost, že nenastane chyba druhého druhu P(HA H A ) = 1 β tzv. síla testu Statistika by Birom Statistika Testování hypotéz 5 / 11

Chyby testování Požadavky na testy Požadavky na testy: maximalizovat spolehlivost a sílu testu, tj. minimalizovat chybu prvního a druhého druhu. Pod kontrolou (prostřednictvím hladiny významnosti) držíme chybu prvního druhu. Statistika by Birom Statistika Testování hypotéz 6 / 11

Průkaznost hypotéz Průkaznost hypotéz Metafora o hypotézách před soudem Nulová hypotéza před soudem (alternativní samozřejmě také) H 0 nulová hypotéza jde za mříže (alternativní je nevinná), H A nulová hypotéza je nevinná (alternativní je odsouzena). Práce obhájce nulové hypotézy shromažďuje důkazy o nevině nulové hypotézy a důkazy o vině alternativní hypotézy. Práce žalobce nulové hypotézy shromažďuje důkazy o vině nulové hypotézy a důkazy o nevině alternativní hypotézy. Práce soudce dá pouze na obhájce: odsoudit alternativní hypotézu, pokud tak neučiní, nemůže prokázat vinu nulové dá pouze na žalobce: odsoudit nulovou hypotézu, pokud tak neučiní, nemůže prokázat vinu alternativní Testování hypotéz (testové kritérium)= Soudce, jenž se rozhoduje pouze na základě práce obhájce (Vychází z neviny nulové hypotézy). Statistika by Birom Statistika Testování hypotéz 7 / 11

Průkaznost hypotéz Průkaznost hypotéz Reálný dopad T K c Nulová hypotéza se nezamítá... nulovou hypotézu nelze prokázat (potvrdit, přijmou,... ), to znamená, že s (1 α) 100 % může, ale nemusí platit. Nepodařilo se prokázat alternativní hypotézu... Vše s předem zvolenou chybou α. Říká se: Nepodařilo se prokázat alternativní hypotézu na hladině významnosti α, nebo nelze zamítnout nulovou hypotézu na hladině významnosti α. T K Nulová hypotéza se zamítá, to znamená, že s (1 α) 100 % neplatí. Podařilo se prokázat alternativní hypotézu... Vše s předem zvolenou chybou α. Říká se: Alternativní hypotéza byla prokázána na hladině významnosti α, nebo nulovou hypotézu byla zamítnuta na hladině významnosti α. Statistika by Birom Statistika Testování hypotéz 8 / 11

Logické dělení testů Logické dělení testů Dle objektu testování: parametrické testy, neparametrické testy. Dle počtu uvažovaných souborů (k): jeden, dva, více než dva. Dle vztahu mezi soubory (pro dva a více): nezávislé soubory statistické jednotky napříč výběrovými soubory nemají vzájemnou souvislost (provázanost) závislé soubory statistické jednotky napříč výběrovými soubory mají vzájemnou souvislost (provázanost) opakované pozorování, společný vlastník, stejné podmínky měření; pozorování napříč skupinami tvoří k-tice (pro dva výběry páry), Dle vyrovnanosti počtu pozorování ve souborech (pro dva a více): vyvážený pokusný plán n1 = n 2 = = n k, nevyvážený pokusný plán Statistika by Birom Statistika Testování hypotéz 9 / 11

Logické dělení testů Výběrové statistiky (kvantitativní znak) značení I Jeden soubor: Výběr ze základního souboru (populace): X1, X 2,..., realizace náhodného výběru z homogenní populace: x 1, x 2,..., x n...................................................n, x, s 2 Dva soubory: Výběr ze dvou základních souborů (populací), které jsou stejně rozdělené X 11, X 12,... a X 21, X 22,... a liší se v jednom (alternativním) faktoru realizace dvou náhodných výběrů z homogenní populace: x 11, x 12,..., x 1n1.............................................. n 1, x 1, s1 2 x 21, x 22,..., x 2n2.............................................. n 2, x 2, s2 2 Výběr z více než dvou základních souborů (populací): Více než dva základní soubory (populace), které jsou stejně rozdělené Y 11, Y 12,... a Y 21, Y 22,...,... Y k1, Y k2,... a liší se v jednom (kategorionálním) faktoru realizace k náhodných výběrů z homogenní populace: Statistika by Birom Statistika Testování hypotéz 10 / 11

Logické dělení testů Výběrové statistiky (kvantitativní znak) značení II ȳ = 1 n k n i i=1 j=1 j=1 i n i výběr ȳ i s 2 i 1 n 1 y 11, y 12,..., y 1n1 ȳ 1 s1 2 2 n 2 y 21, y 22,..., y 2n1 ȳ 2 s2 2. k n k y k1, y k2,..., y knk ȳ k s k 2 n ȳ sc 2 y ij, s 2 c = 1 n 1 ȳ i = 1 n i y ij, si 2 = 1 n i n i 1 ȳ = 1 n k i=1 ȳ i n i s 2 c 1 n k k n i (y ij ȳ ) 2 i=1 j=1 n i j=1 (y ij ȳ i ) 2, pro i = 1,..., j k (n i 1)si 2 = sr 2? i=1 Statistika by Birom Statistika Testování hypotéz 11 / 11