Statistické metody v medicíně II. - p-hodnota

Podobné dokumenty
Využití a zneužití statistických metod v medicíně

7.1. Podstata testu statistické hypotézy

Ranní úvahy o statistice

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Ing. Michael Rost, Ph.D.

Jana Vránová, 3. lékařská fakulta UK

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

Přednáška VII. Úvod do testování hypotéz

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Cvičení ze statistiky - 9. Filip Děchtěrenko

Statistika. Testování hypotéz statistická indukce Neparametrické testy. Roman Biskup

Testování hypotéz a měření asociace mezi proměnnými

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie

LIMITY APLIKACE STATISTICKÝCH TESTŮ VÝZNAMNOSTI V PEDAGOGICKÉM VÝZKUMU: SEMINÁŘ PRO NESTATISTIKY

Stav a možná implementace DRG v zásadních otázkách

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Pearsonův korelační koeficient

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Cvičení ze statistiky - 8. Filip Děchtěrenko

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Testy. Pavel Provinský. 19. listopadu 2013

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

HODNOCENÍ VÝKONNOSTI ATRIBUTIVNÍCH ZNAKŮ JAKOSTI. Josef Křepela, Jiří Michálek. OSSM při ČSJ

Úvod do problematiky měření

Statistické testování hypotéz II

ZX510 Pokročilé statistické metody geografického výzkumu. Téma: Měření síly asociace mezi proměnnými (korelační analýza)

Fisherův exaktní test

P-value. Alžběta Gardlo, Karel Hron Laboratoř metabolomiky Ústav molekulární a translační medicíny, UPOL a FNOL

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Pokročilejší metody: výběr. Začínáme otázkami na povahu vysvětlované proměnné a končíme otázkami na povahu vysvětlujících proměnných

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Testování statistických hypotéz. Obecný postup

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Statistická a věcná významnost. Statistická významnost. Historie hypotézy a testů. Hypotézy a statistické testy.

TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření

Testování statistických hypotéz

ÚVOD DO TESTOVÁNÍ HYPOTÉZ. Martina Litschmannová

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Testování uživatelského rozhraní

Statistická analýza jednorozměrných dat

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

K otázce pokrytí publikační aktivity českých vysokých škol v bibliografických bázích dat

STATISTICKÉ HYPOTÉZY

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013

AKTIVNÍ ZAPOJOVÁNÍ STUDENTŮ DO VÝUKY STATISTIKY A PSYCHOMETRIE: ZKUŠENOSTI Z USA

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Testování hypotéz o parametrech regresního modelu

ZAMYŠLENÍ NAD KOMUNIKOVÁNÍM STATISTIKY V

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Testování hypotéz o parametrech regresního modelu

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Návrh a vyhodnocení experimentu

Pravděpodobnost a aplikovaná statistika

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

STATISTICKÉ TESTY VÝZNAMNOSTI

Statistické metody uţívané při ověřování platnosti hypotéz

Zápočtová práce STATISTIKA I

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

5 Parametrické testy hypotéz

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

4EK211 Základy ekonometrie

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.

Ilustrační příklad odhadu LRM v SW Gretl

Vzorová prezentace do předmětu Statistika

S E M E S T R Á L N Í

Jednostranné intervaly spolehlivosti

Technická univerzita v Liberci

Testování statistických hypotéz

PRAVDĚPODOBNOST A STATISTIKA

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Úvod do testování hypotéz

STATISTIKA VĚDA O USUZOVÁNÍ NA ZÁKLADĚ DAT. Patrícia Martinková Ústav informatiky AV ČR

Návrhy dalších možností statistického zpracování aktualizovaných dat

Testování statistických hypotéz

Aproximace binomického rozdělení normálním

STATISTICKÉ ODHADY Odhady populačních charakteristik

TECHNICKÁ UNIVERZITA V LIBERCI

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

INDUKTIVNÍ STATISTIKA

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

PRAVDĚPODOBNOST A STATISTIKA 1

Testy statistických hypotéz

Transkript:

Statistické metody v medicíně II. - p-hodnota Martin Hynek Gennet, Centre for Fetal Medicine, Prague EuroMISE Centre, First Faculty of Medicine of Charles University in Prague

p-hodnota p-value (p-level) dosažená hladina významnosti P statistická významnost při testování hypotéz

p-hodnota široce rozšířený, ale velmi záludný koncept, velmi často špatně chápán a interpretován, často kritizován P Nutné pro : publikace, granty porozumění odborné literatuře

p-hodnota 12 z 14 článků 5 z 10 článků

Testování hypotéz velmi rozšířený koncept v medicíně porovnávání (typu léčby, metod, skupin) efekt

Testování hypotéz velmi rozšířený koncept v medicíně porovnávání (typu léčby, metod, skupin) efekt

Testování hypotéz velmi rozšířený koncept v medicíně porovnávání (typu léčby, metod, skupin) efekt

Testování hypotéz velmi rozšířený koncept v medicíně porovnávání (typu léčby, metod, skupin) efekt

Testování hypotéz nulový efekt => nulová hypotéza H 0 rozdíl existuje => alternativní hypotéza H A

Testování hypotéz nulový efekt => nulová hypotéza H 0 rozdíl existuje => alternativní hypotéza H A? jak extrémní je to rozdíl?

Testování hypotéz nulový efekt => nulová hypotéza H 0 rozdíl existuje => alternativní hypotéza H A p = 0,03112

Testování hypotéz hladina významnosti α = 0,05 (5%) p < α p > α H 0 H A H 0 H A p = 0,03112

Testování hypotéz p-hodnota = pravděpodobnost, s jakou bychom mohli obdržet pozorovaná data nebo data extrémnější (více odporující nulové hypotéze), za předpokladu, že nulová hypotéza je pravdivá čím nižší p, tím je H 0 neudržitelnější čím vyšší p, tím méně lze H 0 zamítnout α 0,001 0,05 0,2 H 0 statisticky signifikantní rozdíl H A statisticky nesignifikantní rozdíl

Testování hypotéz p-hodnota = pravděpodobnost, s jakou bychom mohli obdržet pozorovaná data nebo data extrémnější (více odporující nulové hypotéze), za předpokladu, že nulová hypotéza je pravdivá CAVE!! p není pravděpodobnost platnosti nulové hypotézy p = 0,03 neznamená že pravděpodobnost H 0 je 3% a pravděpodobnost H A je 97%

Nepochopení a úskalí a p-hodnoty navzdory všudypřítomnosti p-hodnoty je tento koncept velmi hojně kritizovaný únor 2015 Journal of Basic and Applied Social Psychology editoři vykázali testování hypotéz a p-hodnotu z časopisu plyne z nepochopení a špatného použití

Nepochopení a úskalí a p-hodnoty p-hodnota není pravděpodobnost, že nulová hypotéza je pravdivá ani že alternativní hypotéza je nepravdivá? jaká tato pravděpodobnost vlastně je

Nepochopení a úskalí a p-hodnoty p-hodnota není pravděpodobnost že nulová hypotéza je pravdivá ani že alternativní hypotéza je nepravdivá? jaká tato pravděpodobnost vlastně je Sellke et al., Amer Stat, 2001

Nepochopení a úskalí a p-hodnoty p-hodnota není pravděpodobnost, že při opakování experimentu dospějeme ke stejnému závěru Nuzzo et al., Scient Amer, 2015

Nepochopení a úskalí a p-hodnoty p-hodnota se týká pouze nulové hypotézy neříká absolutně nic o platnosti alternativní hypotézy počítám p-hodnotu, která se týká H 0, ale to, co mě zajímá je H A!!! nesmyslnost alternativní hypotézy nebo existence více alternativních hypotéz

Nepochopení a úskalí a p-hodnoty hladina významnosti α není určena p-hodnotou historická konvence α = 0,05 dichotomizace signifikantní vs. nesignifikantní vždy uvádět přesnou p-hodnotu - dlouhodobě argumentováno, že takto arbitrárně stanovená meze zpomaluje vědecký pokrok a má škodlivý vliv na odbornou literaturu (Anderson 2000, Berkson 2006, Cohen 1994, Hubbard and Lindsey 2008, Johnstone 1986, Smedslund 2006)

jednoznačný publikační bias ve prospěch studií se signifikantním závěrem!!

Nepochopení a úskalí a p-hodnoty p > 0,05 failed to reach statistical significance

Nepochopení a úskalí a p-hodnoty Freiman et al. analyzovali 71 studií, kde p > 0,1 a spočítali konfidenční intervaly v téměř polovině studií byly výsledky kompatibilní s 50% terapeutickým efektem

Nepochopení a úskalí a p-hodnoty p-hodnota nic neříká o velikosti pozorovaného efektu 1. léčba 2. léčba 3. léčba p=0,02 p=0,002 p=0,02 studie s AIDS vakcínou v Thajsku 2009 p=0,039!! ale 95% konfidenční interval 1-52%

Testování hypotéz p-hodnota = pravděpodobnost, s jakou bychom mohli obdržet pozorovaná data nebo data extrémnější (více odporující nulové hypotéze), za předpokladu, že nulová hypotéza je pravdivá CAVE!! p není pravděpodobnost platnosti nulové hypotézy p = 0,03 neznamená že pravděpodobnost H 0 je 3% a pravděpodobnost H A je 97%

FOUR keypoints for using p-value testování hypotéz a p-hodnota jsou užitečné nástroje a poskytují důležité informace, ale nikdy ne samostatně (nástroje deskriptivní statistiky) nutnost správné interpretace signifikantní výsledky musí být vždy potvrzeny z opakovaných studií, abychom jim mohli věřit abychom zhodnotili kvalitu studie, je nutné se dívat na celý všechny její dílčí kroky a ne jen na p- hodnotu

Děkuji za pozornost