Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Podobné dokumenty
Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Testování statistických hypotéz. Obecný postup

Ing. Michael Rost, Ph.D.

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Testování statistických hypotéz

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Aproximace binomického rozdělení normálním

2 ) 4, Φ 1 (1 0,005)

Testování statistických hypotéz

Testování hypotéz. 4. přednáška

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Testy statistických hypotéz

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

PRAVDĚPODOBNOST A STATISTIKA

Testy. Pavel Provinský. 19. listopadu 2013

Testování statistických hypotéz

Normální (Gaussovo) rozdělení

Stručný úvod do testování statistických hypotéz

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

4ST201 STATISTIKA CVIČENÍ Č. 7

Cvičení ze statistiky - 8. Filip Děchtěrenko

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Neparametrické metody

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

12. cvičení z PST. 20. prosince 2017

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Normální (Gaussovo) rozdělení

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Statistika, Biostatistika pro kombinované studium. Jan Kracík

= = 2368

TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření

You created this PDF from an application that is not licensed to print to novapdf printer (

Příklady na testy hypotéz o parametrech normálního rozdělení

4EK211 Základy ekonometrie

Jednostranné intervaly spolehlivosti

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

15. T e s t o v á n í h y p o t é z

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Náhodné veličiny, náhodné chyby

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

Statistické metody uţívané při ověřování platnosti hypotéz

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

Neparametrické testy

STATISTICKÉ TESTY VÝZNAMNOSTI

Intervalové Odhady Parametrů II Testování Hypotéz

Tomáš Karel LS 2012/2013

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

STATISTICKÉ HYPOTÉZY

Jana Vránová, 3. lékařská fakulta UK

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

5 Parametrické testy hypotéz

ANALÝZA DAT V R 5. ZÁKLADNÍ STATISTICKÉ TESTY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

15. T e s t o v á n í h y p o t é z

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Cvičení 10. Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

5. T e s t o v á n í h y p o t é z

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Intervalové Odhady Parametrů

TECHNICKÁ UNIVERZITA V LIBERCI

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

AKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A

Matematická statistika. Testy v. v binomickém. Test pravděpodobnosti. Test homogenity dvou. Neparametrické testy. statistika. Testy v.

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Přednáška X. Testování hypotéz o kvantitativních proměnných

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Matematika III. 3. prosince Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Jednofaktorová analýza rozptylu

12. prosince n pro n = n = 30 = S X

Přednáška VII. Úvod do testování hypotéz

diskriminaci žen letní semestr = výrok, o jehož pravdivosti chceme rozhodnout tvrzení o populaci, o jehož platnosti rozhodujeme

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

Statistika. Testování hypotéz statistická indukce Neparametrické testy. Roman Biskup

NEPARAMETRICKÉ TESTY

Transkript:

Lékařská biofyzika, výpočetní technika I Biostatistika Josef Tvrdík (doc. Ing. CSc.) Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace úterý 4. až 5.4 hod. http://www.osu.cz/~tvrdik

Přednáška 4 Testování hypotéz Testování statistických hypotéz Párové testy příklad ze života Reálná klinická data

Abychom z výběru mohli usuzovat o populaci: jasně vymezit (definovat) populaci, o níž chceme vědět dosud nepoznané pravdy zařídit, aby výběr tuto populaci opravdu reprezentoval (náhodný výběr jedinců z populace, všichni stejnou šanci) mít dostatečný rozsah výběru (počet řádků ve výběrovém souboru) ~ kvalita nových pravd

Náhodný výběr v matematické statistice n náhodných veličin jsou nezávislé všechny mají stejné rozdělení mat. statistika nám říká, jaké úsudky o celé populaci můžeme udělat z náhodného výběru výběrový soubor je realizací náhodného výběru, z toho spočítáme hodnoty výběrových charakteristik

Vstupní data x začátek, x po půl roce 4 36 8 6 6 4 5 36 9 5 3 3 7 4 3 35 33 7 8 3 3 3 7 5 38 4 6 4 4 5 4 3 9 5 4 6 3 3 4 7 5 3 5 4 9 4 5 5 8 34 4 6 8 4 8 39 38 7 5 3 3 6 6 8 63 37 8 6 9 5 3 3 3 5 4 3 4 5 46 55 3 4 3 35 5 3 36 3 83 7 33 38 3 4 Inko Inko Vref Vref Qmax Qmax F F ID

Cíle výzkumu posoudit, zda léčení pacientům pomáhá tzn., zda vysoké hodnoty se léčením snížily, případně nízké hodnoty zvýšily, záleží na měřené veličině chceme získat takové tvrzení o celé populaci, ne jen o 6 sledovaných pacientech

Rozdíly x-x -.38 5.3 -.3 -.6 průměr - 8-4 6-5 - 8 4 4 - - - 3 - -4-3 - 3-4 -5 - -3-9 9-3 5-6 - 8-7 - -4 6-55 9-3 5-6 4-3 -9 3-5 -4-3 -5 - Inko Vref Qmax F ID

Testování hypotéz testujeme (většinou) tvrzení o parametru populace tvrzení je nutno předem zformulovat najít odpovídající test, podle kterého se na základě informace z výběrového souboru, zda tvrzení přijímáme nebo zamítneme.

Formulace našeho problému: Výzkumná hypotéza: Léčení pomáhá (má vliv) Statistická hypotéza H Léčení nemá vliv analogie presumpce neviny Zamítnutí H znamená potvrzení výzkumné hypotézy

Testování hypotéz SKUTEČNOST (nám neznámá) NAŠE ROZHODNUTÍ: H : nezamítáme H : zamítáme Tvrzení H je pravdivé SPRÁVNÉ CHYBA I. druhu Tvrzení H je nepravdivé CHYBA II. druhu SPRÁVNÉ

Normální rozdělení s parametry µ, sigma ^

Studentovo t -rozdělení

Jednovýběrový t-test Máme náhodný výběr n nezávislých náhodných veličin normálně rozdělených, tj. Xi ~ N( µσ, ), i =,,, n Testujeme H, že střední hodnota µ je rovna nějaké dané hodnotě µ. proti alternativě H, že µ µ (oboustranná alternativa) Za platnosti nulové hypotézy má statistika T rozdělení podle následujícího vztahu T = X s/ µ n ~ t n

Jednovýběrový t-test část H: µ = µ H: µ µ Testová statistika T = X s/ Hladina významnosti α kritický obor µ n ~ t n

Kritický obor t -rozdělení f (x) p / p / x (, ( /) [ ( /), n α n α ) W t t +

Párový t-test Jednovýběrový t-test, ale pro rozdíly x x: T p = s D D / n

Výsledky párových t-testů: prum_dif s_dif t p F -.6 4.5 -.986.66 QMAX -.3 8. -.555.587 Vref 5.3 86.5.36.34 Inko -.38 3. -,83,87

Kritický obor t -rozdělení f (x) p / p / x (, ( /) [ ( /), n α n α ) W t t +

Rozdíly x-x ID 3 4 5 6 7 8 9 3 4 5 6 průměr Inko - - - - - -3 - - - - -.38

INKO - histogram

INKO histogram, ID=6 vypuštěno

Párový t-test n=6 d6 d sd t p - -,4 3, -,83,87 n=5, ID=6 vypuštěno d6 d sd t p miss -,7, -,47,7 Paradox větší rozdíl není významný, menší rozdíl je významný Nebyly splněny předpoklady normální rozdělení

Alternativy párového t-testu Jednovýběrový Wilcoxonův test založen na pořadí odchylek Znaménkový (binomický) test založen na počtu kladných nebo záporných změn

prum_dif smodch_dif z p Inko*) -.38 3..374.8 *) Rozdíly hodnot veličiny INKO po a před léčbou silně porušovaly předpoklad normálního rozdělení, což vylučovalo využití párového t-testu. Proto byl užit párový Wilcoxonův test, hodnota z-statistiky s korekcí na spojitost ve sloupci t je vyznačena kurzívou, podobně i dosažená úroveň významnosti ve sloupci p.

Binomické rozdělení model hodu n mincemi, na každé padne lev s pravděpodobností p, pravděpodobnost, že na n mincích padne k lvů n PY ( = k) = p k ( p) k n k

Pravděpodobnostní funkce binomického rozdělení n =, p =,5

Rozdíly x-x ID 3 4 5 6 7 8 9 3 4 5 6 Inko - - - - - -3 - - - -

Binomický (znaménkový) test počet + : počet : počet : 4 (nebere se v úvahu) H: p =.5 H: p >.5 (jednostranná alternativa) Testové kriterium: počet Z binomického rozdělení se spočítá pravděpodobnost, že za platnosti H dosáhneme nebo větší, tj. nebo

= = = = = = z k n n z k n k n n z k k k n k n k n z P Z ) ( n = z = P(Z>=) = P(Z<=) =.93 Zamítáme H.