P-value. Alžběta Gardlo, Karel Hron Laboratoř metabolomiky Ústav molekulární a translační medicíny, UPOL a FNOL

Podobné dokumenty
Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

STATISTICKÉ TESTY VÝZNAMNOSTI

Stručný úvod do testování statistických hypotéz

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testy statistických hypotéz

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Jednostranné intervaly spolehlivosti

Ing. Michael Rost, Ph.D.

Testování statistických hypotéz

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Neparametrické testy

= = 2368

4ST201 STATISTIKA CVIČENÍ Č. 7

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze

Testování hypotéz Biolog Statistik: Matematik: Informatik:

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Statistika, Biostatistika pro kombinované studium. Jan Kracík

STATISTICKÉ TESTY VÝZNAMNOSTI

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Cvičení ze statistiky - 9. Filip Děchtěrenko

Neparametrické metody

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Ranní úvahy o statistice

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Testování hypotéz. 4. přednáška

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Normální (Gaussovo) rozdělení

KORELACE. Komentované řešení pomocí programu Statistica

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testy nezávislosti kardinálních veličin

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

You created this PDF from an application that is not licensed to print to novapdf printer (

Testování statistických hypotéz. Obecný postup

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

NEPARAMETRICKÉ TESTY

Normální (Gaussovo) rozdělení

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Úvod do analýzy rozptylu

Příklad datového souboru. Pravděpodobnost vs. statistika. Formální definice. Teorie odhadu

Cvičení ze statistiky - 8. Filip Děchtěrenko

ADDS cviceni. Pavlina Kuranova

Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

diskriminaci žen letní semestr = výrok, o jehož pravdivosti chceme rozhodnout tvrzení o populaci, o jehož platnosti rozhodujeme

12. cvičení z PST. 20. prosince 2017

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

Statistické metody uţívané při ověřování platnosti hypotéz

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Vybrané partie z biostatistiky

Pravděpodobnost a aplikovaná statistika

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

4EK211 Základy ekonometrie

Uni- and multi-dimensional parametric tests for comparison of sample results

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Seminář 6 statistické testy

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Statistické metody v medicíně II. - p-hodnota

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

, Brno Hanuš Vavrčík Základy statistiky ve vědě

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Aplikovaná statistika v R - cvičení 2

Charakteristika datového souboru

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Národníinformačnístředisko pro podporu jakosti

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

ANALÝZA DAT V R 5. ZÁKLADNÍ STATISTICKÉ TESTY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

2 ) 4, Φ 1 (1 0,005)

Vysoká škola ekonomická v Praze

STATISTICKÉ ODHADY Odhady populačních charakteristik

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Transkript:

P-value Alžběta Gardlo, Karel Hron alzbetagardlo@gmail.com Laboratoř metabolomiky Ústav molekulární a translační medicíny, UPOL a FNOL Přírodovědecká fakulta UPOL 18.11. 2015

Obsah 1 Úvod 2 Testování statistických hypotéz 3 Praktický příklad 4 Problémy s p-value 5 Závěr

Co je P-value? Užívá se při testování statistických hypotéz souvisí s danou hypotézou. Velmi často spojována s t-testem. Lze vyčíslit pro jakýkoliv test závisí na použitém testu. Velmi často užívané bez dalších znalostí. Lze použít pro parametrické i neparametrické testy.

Testování statistických hypotéz Souvisí s tzv. distribuční funkcí náhodné veličiny: Rozdělení pravděpodobností statistického znaku závisí na neznámém parametru, o kterém víme, že patří do nějakého parametrického prostoru. Na základě n nezávislých pozorování se můžeme domnívat, že daný parametr má určité vlastnosti. Formulujeme tzv. nulovou hypotézu H 0 a alternativu H 1 (nebo H A ). Ty se formulují na tzv. hladině α (0, 1). Nejčastěji α = 0.05, 0.025, 0.01. O hypotéze můžeme rozhodnout dvěma způsoby: H 0 se zamítá ve prospěch alternativy, H 0 nelze zamítnout.

Testování statistických hypotéz - chyby Eistují dva druhy chyb - tzv. chyba 1. a 2. druhu: H 0 je správná H 0 je chybná H 0 zamítneme chyba 1. druhu správné rozhodnutí H 0 nezamítneme správné rozhodnutí chyba 2. druhu Chceme, aby byla chyba 1. druhu = α. Chyba 2. druhu je minimální.

Testovací statistiky Hypotézy se počítají na základě celé řady statistik. Jednovýběrový t-test, dvouvýběrový t-test, párový t-test - je zde předpoklad normálního rozdělení (velmi často není splněno, případně můžeme použít nějakou transformaci). Neparametrické testy (pracují s pořadími hodnot v jednotlivých výběrech) - např. Wilcoonův test.

Testovací statistiky Normalita dat není často splněna je dobré na začátku udělat test normality: Srovnání histogramu s hustotou normálního rozdělení. Q-Q plot Shapiro-Wilk test Normal Q Q Plot Sample Quantiles 6 2 2 4 6 3 2 1 0 1 2 3 Theoretical Quantiles

Testovací statistiky - problémy, které mohou nastat Např. dvouvýběrový t-test: X n Ȳ m mn(m + n 2) T =. (n 1)S 2 n + (m 1)Sm 2 n + m kde n a m jsou rozsahy výběrů, X n (resp. Ȳ m ) je aritmetický průměr 1. výběru (resp. 2. výběru), S 2 jsou příslušné rozptyly. Aritmetický průměr není robustní: 1 = 1, 2, 3, 4, 5, 6, 7, 8, 9, 10; 1 = 5.5, 2 = 1, 2, 3, 4, 5, 6, 7, 8, 9, 100; 2 = 14.5. Již jedna odlehlá hodnota může zkreslit celou statistiku. Pokud je n nebo m velké, násobí se statistika velkým číslem umělé navýšení.

Testovací statistika - dvouvýběrový t-test X n = 34, Ȳ m = 34.5, S 2 n = 1.8, S 2 m = 1.7, n a m se mění: T test Test statistics Quantile Test statistics 1.0 1.5 2.0 2.5 3.0 3.5 Quantities (10,10) (25,10) (20,15) (25,25) (100,10) (25,100) (50,50) (100,100) (150,150) (200,200)

P-value Pomáhá nám při rozhodování o hypotéze. P-value: Nejmenší hladina, při které bychom ještě hypotézu zamítli. Pravděpodobnost spočítaná za platnosti H 0, že dostaneme právě naši hodnotu testové statistiky nebo hodnotu ještě více odporující testované hypotéze. Testová statistika má za platnosti H 0 dané rozdělení pravděpodobnosti. Je-li p-value menší nebo rovna α, zamítáme nulovou hypotézu na hladině α.

U vod Testova nı hypote z Pr ı klad Proble my Za ve r P-value p-value > α Nulovou hypotézu nelze zamítnout. p-value α Alz be ta Gardlo, Karel Hron 0 testová statistika P-value 18.11. 2015

U vod Testova nı hypote z Pr ı klad Proble my Za ve r P-value p-value < α Nulovou hypotézu zamítáme. α p-value 0 testová statistika Alz be ta Gardlo, Karel Hron P-value 18.11. 2015

Praktický příklad Zadání: Máme dány rozbory krve 10 pacientů a 10 zdravých kontrol. Ve vzorcích měříme 50 metabolitů. Chceme vědět, jestli se od sebe liší hodnoty jednotlivých metabolitů mezi pacienty a kontrolami (např. chceme najít nějaký marker nemoci). Vzorek/Met Arg Phe C18 C4... Pac1 39 800 1 907 000 53 600 6 090 000 Pac2 35 300 2 010 500 45 700 7 430 000 Pac3 88 000 1 920 300 62 500 7 160 000. Kon8 55 200 200 000 52 800 8 280 000 Kon9 12 200 210 400 37 800 8 060 000 Kon10 16 800 230 900 51 200 7 360 000

Praktický příklad Řešení: 1 Musí se řešit pro každý metabolit zvlášt. 2 Test normality: H 0 : rozdělení daného metabolitu je normální. H 1 : rozdělení není normální. Např. pro C4 vychází p = 0.078. Porovnáme p s α = 0.05. Platí tedy p > α nelze zamítnout H 0 nelze zamítnout, že rozdělení C4 je normální. 3 Test normality vyšel pro všechny metabolity můžeme použít parametrické testy.

Praktický příklad Řešení: 4 Porovnáváme dva výběry, které jsou na sobě nezávislé použijeme dvouvýběrový t-test: 5 H 0 : průměrná hodnota pro daný metabolit pro pacienty je stejná jako pro kontroly. H 1 : průměr kontrol a pacientů se liší. 6 Např. pro phenylalanin (Phe) vyšlo p = 0.03. Při porovnání s α = 0.05 platí p < α zamítáme H 0 průměrná hodnota phenylalaninu ve vzorcích pacientů se liší od vzorků kontrol phenylalanin by mohl být jeden z markerů (je třeba ještě porovnat s dalšími metodami - např. PCA, rozdíly v boplotech).

Problémy s p-value P-value definoval Ronald Fisher roku 1920, ovšem nezamýšlel jeho použití jako definitivní test. P-value má pouze udávat informaci o tom, zda je eperiment dobře nastavený. Problémy s opakovatelností eperimentů bylo dokázáno, že řada dříve publikovaných studíı (založených na p-value) je nepravdivá. Má to být pouze jedna část v rozhodovacím procesu, postup, který nám dává základní informaci o datech. P-value pouze sumarizuje data na základě nulové hypotézy. Nemůže rozhodovat o skutečné realitě.

Problémy s p-value Další vliv má například rozsah výběru - čím víc pozorování, tím menší p-value (díky tomu, jak je konstruována testová statistika). P-hacking - zkoušíme tolik různých hypotéz a kombinací dat, až nám to vyjde, tak, jak chceme. Někteří lidé často průběžně kontrolují data. Některá p-value vychází signifikantní pouze díky šumu v datech. Když je p-value dostatečně malé, napovídá to tomu, že výběry pocházejí z různých populací. P-value pouze napovídá, nikoliv dokazuje. Už nic neřekne o tom, jak velký rozdíl mezi těmito skupinami ve skutečnosti je. Ani jestli statistická signifikance souvisí s biologickou signifikancí.

U vod Testova nı hypote z Pr ı klad Proble my Za ve r Proble my s p-value Je tr eba vys etr ovat i mnohorozme rnou strukturu dat. Score 2 Pr i pouz itı p-value se nemusı uka zat rozdı ly, ktere jsou v mnohorozme rne struktur e: Score 1 Alz be ta Gardlo, Karel Hron P-value 18.11. 2015

Problémy s p-value - možná řešení Bayesův vzorec: teorie spojená s výpočty pravděpodobnosti. Použití několika metod na data a následné porovnání výsledků (PCA, PLSDA, OPLSDA, boploty, fold-change). Zveřejňovat všechny podrobnosti o datech - abychom se vyhnuli P-hackingu (Annesley and Boyd, 2014). Dvoustupňová analýza: Místo toho, abychom prováděli několik studíı v jednom a všechny publikovali zaráz, je lepší je vytvářet a publikovat postupně (Nuzzo, 2014). Zveřejňovat data v databázích.

Problémy s p-value - možná řešení Oprostit se od požadavku, že mi jedno magické číslo (p-value) odpoví na všechny otázky. Používat i eplorativní mnohorozměrné metody (např. PCA), které následně vyhodnotí kvalifikovaný odborník. Současný trend: upouštění od standardní statistické inference založené na p-value. Možná je na čase zkusit poslat do časopisu článek, ve kterém nepoužíváme žádné p-value. (K. Hron, 13.11.2015)

Návrhy na budoucí diskusi Nedoporučuje se používat za každou cenu transformace a parametrické testy místo neparametrických. Transformaci neprovádíme proto, abychom dostali normalitu, ale proto, abychom dostali data do měřítka, které je podmínkou pro použití určitých statistických metod. Co je můj výběrový prostor? Jak předzpracovat data? Jaké použít transformace?

Závěr P-value je spojené s testováním statistických hypotéz. Testy jsou parametrické a neparametrické - musíme mezi nimi rozlišovat. Je třeba pracovat s p-value s opatrností. Je lepší jej používat v kombinaci s jinými metodami a výsledky následně porovnat.

Literatura Otyepka M., Banáš P., Otyepková E.: Základy zpracování dat. skripta kurzu Základy zpracování dat PřF UPOL, 2007. Varmuza K., Filzmoser P.: Introduction to multivariate statistical analysis in chemometrics. Taylor & Francis, 2008. Budíková M., Králová M., Maroš B.: Průvodce základními statistickými metodami. Grada, 2010. Nuzzo R.: Statistical errors. Nature 506, 2014, 150-152. Annesley T. M., Boyd J. C.: The P-value: probable does not mean practical. Clinical Chemistry 60 (7), 2014, 1021-1023.

DĚKUJI ZA POZORNOST.