Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Podobné dokumenty
Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Testování statistických hypotéz. Obecný postup

Testování statistických hypotéz

Aproximace binomického rozdělení normálním

Testování statistických hypotéz

Ing. Michael Rost, Ph.D.

Testování statistických hypotéz

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

2 ) 4, Φ 1 (1 0,005)

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testy statistických hypotéz

PRAVDĚPODOBNOST A STATISTIKA

4ST201 STATISTIKA CVIČENÍ Č. 7

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Stručný úvod do testování statistických hypotéz

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Normální (Gaussovo) rozdělení

You created this PDF from an application that is not licensed to print to novapdf printer (

Testování hypotéz. 4. přednáška

Testy. Pavel Provinský. 19. listopadu 2013

Cvičení ze statistiky - 8. Filip Děchtěrenko

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

Normální (Gaussovo) rozdělení

Neparametrické metody

Náhodné veličiny, náhodné chyby

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

12. cvičení z PST. 20. prosince 2017

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Jednostranné intervaly spolehlivosti

= = 2368

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Příklady na testy hypotéz o parametrech normálního rozdělení

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

15. T e s t o v á n í h y p o t é z

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

STATISTICKÉ HYPOTÉZY

Statistika, Biostatistika pro kombinované studium. Jan Kracík

STATISTICKÉ TESTY VÝZNAMNOSTI

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

15. T e s t o v á n í h y p o t é z

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Statistické metody uţívané při ověřování platnosti hypotéz

NEPARAMETRICKÉ TESTY

5. T e s t o v á n í h y p o t é z

4EK211 Základy ekonometrie

Matematika III. 3. prosince Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

5 Parametrické testy hypotéz

Neparametrické testy

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

diskriminaci žen letní semestr = výrok, o jehož pravdivosti chceme rozhodnout tvrzení o populaci, o jehož platnosti rozhodujeme

AKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A

7.1. Podstata testu statistické hypotézy

Příklad datového souboru. Pravděpodobnost vs. statistika. Formální definice. Teorie odhadu

Přednáška VII. Úvod do testování hypotéz

prosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina

12. prosince n pro n = n = 30 = S X

TECHNICKÁ UNIVERZITA V LIBERCI

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

ANALÝZA DAT V R 5. ZÁKLADNÍ STATISTICKÉ TESTY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Základní statistické metody v rizikovém inženýrství

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Technická univerzita v Liberci

ÚVOD DO TESTOVÁNÍ HYPOTÉZ. Martina Litschmannová

Charakteristika datového souboru

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

PRAVDĚPODOBNOST A STATISTIKA. Testování hypotéz o rozdělení

Statistika. Testování hypotéz statistická indukce Neparametrické testy. Roman Biskup

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Matematická statistika. Testy v. v binomickém. Test pravděpodobnosti. Test homogenity dvou. Neparametrické testy. statistika. Testy v.

Transkript:

Testování hypotéz testujeme (většinou) tvrzení o parametru populace tvrzení je nutno předem zformulovat najít odpovídající test, podle kterého se na základě informace z výběrového souboru rozhodneme, zda tvrzení přijímáme nebo zamítneme.

Testování hypotéz SKUTEČNOST (nám neznámá) NAŠE ROZHODNUTÍ: H : nezamítáme H : zamítáme Tvrzení H je pravdivé SPRÁVNÉ CHYBA I. druhu Tvrzení H je nepravdivé CHYBA II. druhu SPRÁVNÉ

Abychom z výběru mohli usuzovat o populaci: jasně vymezit (definovat) populaci, o níž chceme vědět dosud nepoznané pravdy zařídit, aby výběr tuto populaci opravdu reprezentoval (náhodný výběr jedinců z populace, všichni stejnou šanci) mít dostatečný rozsah výběru (počet řádků ve výběrovém souboru) ~ kvalita nových pravd

Náhodný výběr v matematické statistice n náhodných veličin jsou nezávislé všechny mají stejné rozdělení mat. statistika nám říká, jaké úsudky o celé populaci můžeme udělat z náhodného výběru výběrový soubor je realizací náhodného výběru, z toho spočítáme hodnoty výběrových charakteristik

Testování hypotéz SKUTEČNOST (nám neznámá) NAŠE ROZHODNUTÍ: H : nezamítáme H : zamítáme Tvrzení H je pravdivé SPRÁVNÉ CHYBA I. druhu Tvrzení H je nepravdivé CHYBA II. druhu SPRÁVNÉ

Hladina významnosti α pravděpodobnost chyby I. druhu Nezamítnutím H neprokážeme pravdivost tvrzení. Zvolíme-li hladinu významnosti α nízkou ( benevolentní soud, prohřešek musí být velký, aby odsoudil), je větší riziko neoprávněného nezamítnutí nulové hypotézy ( nepotrestaný viník ).

Normální rozdělení s parametry µ, sigma ^

Jednovýběrový t-test Máme náhodný výběr n nezávislých náhodných veličin normálně rozdělených, tj. Xi ~ N( µσ, ), i =,,, n Testujeme H, že střední hodnota µ je rovna nějaké dané hodnotě µ. proti alternativě H, že µ µ (oboustranná alternativa) Za platnosti nulové hypotézy má statistika T rozdělení podle následujícího vztahu T = X s/ µ n ~ t n

Jednovýběrový t-test část H: µ = µ H: µ µ Testová statistika T = X s/ Hladina významnosti α kritický obor µ n ~ t n

Kritický obor t -rozdělení f (x) p / p / x (, ( /) [ ( /), n α n α ) W t t +

Praktický příklad - klinická studie Cíle výzkumu: posoudit, zda léčení pacientům pomáhá tzn., zda vysoké hodnoty se léčením snížily a nízké hodnoty zvýšily chceme získat takové tvrzení o celé populaci, ne jen o 6 sledovaných objektech ve výběrovém souboru

Vstupní data x začátek, x po půl roce 4 36 8 6 6 4 5 36 9 5 3 3 7 4 3 35 33 7 8 3 3 3 7 5 38 4 6 4 4 5 4 3 9 5 4 6 3 3 4 7 5 3 5 4 9 4 5 5 8 34 4 6 8 4 8 39 38 7 5 3 3 6 6 8 63 37 8 6 9 5 3 3 3 5 4 3 4 5 46 55 3 4 3 35 5 3 36 3 83 7 33 38 3 4 Inko Inko Vref Vref Qmax Qmax F F ID

Formulace našeho problému: Výzkumná hypotéza: Léčení pomáhá (má vliv) Statistická hypotéza H Léčení nemá vliv analogie presumpce neviny Zamítnutí H znamená potvrzení výzkumné hypotézy

Párový t-test Jednovýběrový t-test, ale pro rozdíly x x: T p = s D D / n

Výsledky párových t-testů: prum_dif s_dif t p F -.6 4.5 -.986.66 QMAX -.3 8. -.555.587 Vref 5.3 86.5.36.34 Inko -.38 3. -,83,87

Kritický obor t -rozdělení f (x) p / p / x (, ( /) [ ( /), n α n α ) W t t +

Rozdíly x-x ID 3 4 5 6 7 8 9 3 4 5 6 průměr Inko - - - - - -3 - - - - -.38

INKO - histogram

INKO histogram, ID=6 vypuštěno

Párový t-test n=6 d6 d sd t p - -,4 3, -,83,87 n=5, ID=6 vypuštěno d6 d sd t p miss -,7, -,47,7 Paradox větší rozdíl není významný, menší rozdíl je významný Nebyly splněny předpoklady normální rozdělení

Alternativy párového t-testu Jednovýběrový Wilcoxonův test založen na pořadí odchylek Znaménkový (binomický) test založen na počtu kladných nebo záporných změn

prum_dif smodch_dif z p Inko*) -.38 3..374.8 *) Byl užit párový Wilcoxonův test, hodnota z-statistiky s korekcí na spojitost je vyznačena kurzívou, podobně i dosažená úroveň významnosti ve sloupci p.

Binomické rozdělení model hodu n mincemi, na každé padne lev s pravděpodobností p, pravděpodobnost, že na n mincích padne k lvů n PY ( = k) = p k ( p) k n k

Pravděpodobnostní funkce binomického rozdělení n =, p =,5

Rozdíly x-x ID 3 4 5 6 7 8 9 3 4 5 6 Inko - - - - - -3 - - - -

Binomický (znaménkový) test počet + : počet : počet : 4 (nebere se v úvahu) H: p =.5 H: p >.5 (jednostranná alternativa) Testové kriterium: počet Z binomického rozdělení se spočítá pravděpodobnost, že za platnosti H dosáhneme nebo větší, tj. nebo

= = = = = = z k n n z k n k n n z k k k n k n k n z P Z ) ( n = z = P(Z>=) = P(Z<=) =.93 Zamítáme H.