Ranní úvahy o statistice

Podobné dokumenty
Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Jana Vránová, 3. lékařská fakulta UK

Testování statistických hypotéz

Testování statistických hypotéz

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Ing. Michael Rost, Ph.D.

Testy statistických hypotéz

Cvičení ze statistiky - 8. Filip Děchtěrenko

STATISTICKÉ ODHADY Odhady populačních charakteristik

Aproximace binomického rozdělení normálním

Stručný úvod do testování statistických hypotéz

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

Charakteristika datového souboru

Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II.

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

STATISTICKÉ TESTY VÝZNAMNOSTI

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

Náhodné veličiny, náhodné chyby

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Přednáška VII. Úvod do testování hypotéz

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Normální (Gaussovo) rozdělení

Jednofaktorová analýza rozptylu

Návrh a vyhodnocení experimentu

Pravděpodobnost a aplikovaná statistika

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Intervalové Odhady Parametrů II Testování Hypotéz

Testování statistických hypotéz

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Zápočtová práce STATISTIKA I

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

ÚVOD DO TESTOVÁNÍ HYPOTÉZ. Martina Litschmannová

4EK211 Základy ekonometrie

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy

Normální (Gaussovo) rozdělení

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

Statistické metody v medicíně II. - p-hodnota

Úvod do testování hypotéz

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Tomáš Karel LS 2012/2013

Metodologie pro Informační studia a knihovnictví 2

Opakování: Nominální proměnná více hodnotová odpověď.

Pravděpodobnost a matematická statistika

STATISTICKÉ TESTY VÝZNAMNOSTI

Testování hypotéz. 4. přednáška

4EK211 Základy ekonometrie

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Číselné charakteristiky

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Testování hypotéz a měření asociace mezi proměnnými

Statistická a věcná významnost. Statistická významnost. Historie hypotézy a testů. Hypotézy a statistické testy.

Intervalové Odhady Parametrů

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Statistické testování hypotéz II

Statistická analýza jednorozměrných dat

Statistické metody uţívané při ověřování platnosti hypotéz

Základy teorie pravděpodobnosti

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Statistika, Biostatistika pro kombinované studium. Jan Kracík

LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR

Manuál pro zaokrouhlování

I. D i s k r é t n í r o z d ě l e n í

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

TECHNICKÁ UNIVERZITA V LIBERCI

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

p(x) = P (X = x), x R,

Cvičení ze statistiky - 9. Filip Děchtěrenko

KGG/STG Statistika pro geografy

Testy. Pavel Provinský. 19. listopadu 2013

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

INDUKTIVNÍ STATISTIKA

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Jednofaktorová analýza rozptylu

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

4ST201 STATISTIKA CVIČENÍ Č. 7

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

7.1. Podstata testu statistické hypotézy

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Transkript:

Ranní úvahy o statistice Neúplný návod ke čtení statistických výsledků Dušan Merta květen 2016

Co nás čeká 1 Základní pojmy 2 Testování hypotéz 3 Confidence interval 4 Odds ratio 2 / 26

Základní pojmy Základní pojmy 3 / 26

Základní pojmy míry polohy průměr, medián, modus, směrodatná odchylka, rozptyl, IQR,... Základní pojmy 4 / 26

Základní pojmy míry polohy průměr, medián, modus, směrodatná odchylka, rozptyl, IQR,... s = 1 N (x i x) N 1 2 i=1 Základní pojmy 4 / 26

Základní pojmy míry polohy průměr, medián, modus, směrodatná odchylka, rozptyl, IQR,... rozložení Základní pojmy 4 / 26

Základní pojmy míry polohy průměr, medián, modus, směrodatná odchylka, rozptyl, IQR,... rozložení Základní pojmy 4 / 26

Základní pojmy míry polohy průměr, medián, modus, směrodatná odchylka, rozptyl, IQR,... rozložení Základní pojmy 4 / 26

Základní pojmy míry polohy průměr, medián, modus, směrodatná odchylka, rozptyl, IQR,... rozložení Základní pojmy 4 / 26

Testování hypotéz Nulová a alternativní hypotéza Hladina významnosti Chyba I. a II. druhu Testování hypotéz 5 / 26

Nulová a alternativní hypotéza většinou porovnáváme dvě skupiny číselně vyjádřené srovnání efekt rozdíl průměrné tělesné výšky mužů a žen neexistence rozdílu mezi skupinami (nulový efekt) nulová hypotéza většinou nám jde o prokázání opaku Průměr tělesné výšky mužů a žen je stejný. existence rozdílu (nenulový efekt) alternativní hypotéza Průměr tělesné výšky mužů a žen se liší. ukážeme jak nepravděpodobná je nulová hypotéza a tím prokážeme alternativní Testování hypotéz Nulová a alternativní hypotéza 6 / 26

Nulová a alternativní hypotéza většinou porovnáváme dvě skupiny číselně vyjádřené srovnání efekt rozdíl průměrné tělesné výšky mužů a žen neexistence rozdílu mezi skupinami (nulový efekt) nulová hypotéza většinou nám jde o prokázání opaku Průměr tělesné výšky mužů a žen je stejný. existence rozdílu (nenulový efekt) alternativní hypotéza Průměr tělesné výšky mužů a žen se liší. ukážeme jak nepravděpodobná je nulová hypotéza a tím prokážeme alternativní Testování hypotéz Nulová a alternativní hypotéza 6 / 26

Nulová a alternativní hypotéza většinou porovnáváme dvě skupiny číselně vyjádřené srovnání efekt rozdíl průměrné tělesné výšky mužů a žen neexistence rozdílu mezi skupinami (nulový efekt) nulová hypotéza většinou nám jde o prokázání opaku Průměr tělesné výšky mužů a žen je stejný. existence rozdílu (nenulový efekt) alternativní hypotéza Průměr tělesné výšky mužů a žen se liší. ukážeme jak nepravděpodobná je nulová hypotéza a tím prokážeme alternativní Testování hypotéz Nulová a alternativní hypotéza 6 / 26

Nulová a alternativní hypotéza většinou porovnáváme dvě skupiny číselně vyjádřené srovnání efekt rozdíl průměrné tělesné výšky mužů a žen neexistence rozdílu mezi skupinami (nulový efekt) nulová hypotéza většinou nám jde o prokázání opaku Průměr tělesné výšky mužů a žen je stejný. existence rozdílu (nenulový efekt) alternativní hypotéza Průměr tělesné výšky mužů a žen se liší. ukážeme jak nepravděpodobná je nulová hypotéza a tím prokážeme alternativní Testování hypotéz Nulová a alternativní hypotéza 6 / 26

Hladina významnosti (p-value, p-level) závěry o celé populaci děláme na základě populačního výběru Hladina významnosti (p-value, p-level) pravděpodobnost s jakou dostaneme pozorovaný (nebo větší) rozdíl (efekt) při platnosti nulové hypotézy (tj. náhodou ) obvykle vyjadřujeme v procentech (p = 5%) nebo lépe desetinným číslem (p = 0, 05) co je statisticky významné je věcí dohody obvykle p < 0, 05 nebo p < 0, 01 závisí na typu dat, velikosti výběru, velikosti efektu, rozložení dat Testování hypotéz Hladina významnosti 7 / 26

Hladina významnosti (p-value, p-level) závěry o celé populaci děláme na základě populačního výběru Hladina významnosti (p-value, p-level) pravděpodobnost s jakou dostaneme pozorovaný (nebo větší) rozdíl (efekt) při platnosti nulové hypotézy (tj. náhodou ) obvykle vyjadřujeme v procentech (p = 5%) nebo lépe desetinným číslem (p = 0, 05) co je statisticky významné je věcí dohody obvykle p < 0, 05 nebo p < 0, 01 závisí na typu dat, velikosti výběru, velikosti efektu, rozložení dat Testování hypotéz Hladina významnosti 7 / 26

Hladina významnosti (p-value, p-level) závěry o celé populaci děláme na základě populačního výběru Hladina významnosti (p-value, p-level) pravděpodobnost s jakou dostaneme pozorovaný (nebo větší) rozdíl (efekt) při platnosti nulové hypotézy (tj. náhodou ) obvykle vyjadřujeme v procentech (p = 5%) nebo lépe desetinným číslem (p = 0, 05) co je statisticky významné je věcí dohody obvykle p < 0, 05 nebo p < 0, 01 závisí na typu dat, velikosti výběru, velikosti efektu, rozložení dat Testování hypotéz Hladina významnosti 7 / 26

Hladina významnosti (p-value, p-level) závěry o celé populaci děláme na základě populačního výběru Hladina významnosti (p-value, p-level) pravděpodobnost s jakou dostaneme pozorovaný (nebo větší) rozdíl (efekt) při platnosti nulové hypotézy (tj. náhodou ) obvykle vyjadřujeme v procentech (p = 5%) nebo lépe desetinným číslem (p = 0, 05) co je statisticky významné je věcí dohody obvykle p < 0, 05 nebo p < 0, 01 závisí na typu dat, velikosti výběru, velikosti efektu, rozložení dat Testování hypotéz Hladina významnosti 7 / 26

Hladina významnosti (p-value, p-level) závěry o celé populaci děláme na základě populačního výběru Hladina významnosti (p-value, p-level) pravděpodobnost s jakou dostaneme pozorovaný (nebo větší) rozdíl (efekt) při platnosti nulové hypotézy (tj. náhodou ) obvykle vyjadřujeme v procentech (p = 5%) nebo lépe desetinným číslem (p = 0, 05) co je statisticky významné je věcí dohody obvykle p < 0, 05 nebo p < 0, 01 závisí na typu dat, velikosti výběru, velikosti efektu, rozložení dat Testování hypotéz Hladina významnosti 7 / 26

Hladina významnosti Historické souvislosti pozdní 20. léta RONALD FISHER Neymanův přístup dětský a hrozivý pro intelektuální svobodu západu. EGON PEARSON, JERZY NEYMAN Fisherova práce horší než neužitečná. Testování hypotéz Historické souvislosti 8 / 26

Hladina významnosti (p-value, p-level) závisí na typu dat, velikosti výběru, velikosti efektu, rozložení dat Testování hypotéz Příklady 9 / 26

Hladina významnosti (p-value, p-level) závisí na typu dat, velikosti výběru, velikosti efektu, rozložení dat N = 2000, 180cm, 167cm Testování hypotéz Příklady 9 / 26

Hladina významnosti (p-value, p-level) závisí na typu dat, velikosti výběru, velikosti efektu, rozložení dat N = 2000, 180cm, 167cm n = 12, 185cm, 170cm p = 0, 01 Testování hypotéz Příklady 9 / 26

Hladina významnosti (p-value, p-level) závisí na typu dat, velikosti výběru, velikosti efektu, rozložení dat N = 2000, 180cm, 167cm n = 12, 185cm, 170cm p = 0, 01 n = 18, 182cm, 165cm p = 0, 001 Testování hypotéz Příklady 9 / 26

Hladina významnosti (p-value, p-level) závisí na typu dat, velikosti výběru, velikosti efektu, rozložení dat N = 2000, 180cm, 167cm n = 207, 181cm, 167cm p 10 16 n = 192, 180cm, 167cm p 10 16 Testování hypotéz Příklady 9 / 26

Hladina významnosti p = 0, 05 Co to znamená? Pravděpodobnost 5%, že při platnosti nulové hypotézy naměříme rozdíl (efekt) jako jsme získali (nebo dokonce větší) pouhou náhodou. Co to neznamená? 95% jistotu, že výsledek je správně. Že statisticky významný efekt má reálný (klinický) význam. Že pokud máme 20 výsledků s p = 0, 05, je jeden z nich náhodný. (Pravděpodobnost toho je 64%.) Testování hypotéz Co to znamená a neznamená? 10 / 26

Hladina významnosti p = 0, 05 Co to znamená? Pravděpodobnost 5%, že při platnosti nulové hypotézy naměříme rozdíl (efekt) jako jsme získali (nebo dokonce větší) pouhou náhodou. Co to neznamená? 95% jistotu, že výsledek je správně. Že statisticky významný efekt má reálný (klinický) význam. Že pokud máme 20 výsledků s p = 0, 05, je jeden z nich náhodný. (Pravděpodobnost toho je 64%.) Testování hypotéz Co to znamená a neznamená? 10 / 26

Hladina významnosti p = 0, 05 Co to znamená? Pravděpodobnost 5%, že při platnosti nulové hypotézy naměříme rozdíl (efekt) jako jsme získali (nebo dokonce větší) pouhou náhodou. Co to neznamená? 95% jistotu, že výsledek je správně. Že statisticky významný efekt má reálný (klinický) význam. Že pokud máme 20 výsledků s p = 0, 05, je jeden z nich náhodný. (Pravděpodobnost toho je 64%.) Testování hypotéz Co to znamená a neznamená? 10 / 26

Hladina významnosti p = 0, 05 Co to znamená? Pravděpodobnost 5%, že při platnosti nulové hypotézy naměříme rozdíl (efekt) jako jsme získali (nebo dokonce větší) pouhou náhodou. Co to neznamená? 95% jistotu, že výsledek je správně. Že statisticky významný efekt má reálný (klinický) význam. Že pokud máme 20 výsledků s p = 0, 05, je jeden z nich náhodný. (Pravděpodobnost toho je 64%.) Testování hypotéz Co to znamená a neznamená? 10 / 26

Hladina významnosti p = 0, 05 Co to znamená? Pravděpodobnost 5%, že při platnosti nulové hypotézy naměříme rozdíl (efekt) jako jsme získali (nebo dokonce větší) pouhou náhodou. Co to neznamená? 95% jistotu, že výsledek je správně. Že statisticky významný efekt má reálný (klinický) význam. Že pokud máme 20 výsledků s p = 0, 05, je jeden z nich náhodný. (Pravděpodobnost toho je 64%.) Testování hypotéz Co to znamená a neznamená? 10 / 26

Hladina významnosti p = 0, 05 Co to znamená? Pravděpodobnost 5%, že při platnosti nulové hypotézy naměříme rozdíl (efekt) jako jsme získali (nebo dokonce větší) pouhou náhodou. Co to neznamená? 95% jistotu, že výsledek je správně. Že statisticky významný efekt má reálný (klinický) význam. Že pokud máme 20 výsledků s p = 0, 05, je jeden z nich náhodný. (Pravděpodobnost toho je 64%.) P 20 = 1 0, 95 20 = 0, 64 Testování hypotéz Co to znamená a neznamená? 10 / 26

1 Nature, Vol 506, 13. února 2014

Chyba I. a II. druhu Chyba I. druhu získáme významný výsledek a zamítneme nulovou hypotézu, která ve skutečnosti platí její pravděpodobnost: α p α Zachytíme efekt, který ve skutečnosti neexistuje. Chyba II. druhu získáme nevýznamný výsledek, přestože nulová hypotéza ve skutečnosti neplatí její pravděpodobnost: β síla testu: 1 β Nezachytíme efekt, který ve skutečnosti existuje. Testování hypotéz Chyba I. a II. druhu 12 / 26

Chyba I. a II. druhu Chyba I. druhu získáme významný výsledek a zamítneme nulovou hypotézu, která ve skutečnosti platí její pravděpodobnost: α p α Zachytíme efekt, který ve skutečnosti neexistuje. Chyba II. druhu získáme nevýznamný výsledek, přestože nulová hypotéza ve skutečnosti neplatí její pravděpodobnost: β síla testu: 1 β Nezachytíme efekt, který ve skutečnosti existuje. Testování hypotéz Chyba I. a II. druhu 12 / 26

Chyba I. a II. druhu Chyba I. druhu získáme významný výsledek a zamítneme nulovou hypotézu, která ve skutečnosti platí její pravděpodobnost: α p α Zachytíme efekt, který ve skutečnosti neexistuje. Chyba II. druhu získáme nevýznamný výsledek, přestože nulová hypotéza ve skutečnosti neplatí její pravděpodobnost: β síla testu: 1 β Nezachytíme efekt, který ve skutečnosti existuje. Testování hypotéz Chyba I. a II. druhu 12 / 26

Chyba I. a II. druhu Chyba I. druhu získáme významný výsledek a zamítneme nulovou hypotézu, která ve skutečnosti platí její pravděpodobnost: α p α Zachytíme efekt, který ve skutečnosti neexistuje. Chyba II. druhu získáme nevýznamný výsledek, přestože nulová hypotéza ve skutečnosti neplatí její pravděpodobnost: β síla testu: 1 β Nezachytíme efekt, který ve skutečnosti existuje. Testování hypotéz Chyba I. a II. druhu 12 / 26

Chyba I. a II. druhu rozhodnutí nezamítneme H 0 (nevýznamný výsledek) zamítneme H 0 (významný výsledek) skutečnost H 0 platí H 0 neplatí správně chyba II. druhu pravděpodobnost β chyba I. druhu pravděpodobnost α správně Testování hypotéz Chyba I. a II. druhu 13 / 26

Chyba I. druhu (α) Chyba II. druhu (β) Testování hypotéz Chyba I. a II. druhu 14 / 26

Confidence interval CI průměru při normálním rozdělení CI rozdílu průměrů dvou skupin Confidence interval 15 / 26

Interval spolehlivosti (confidence interval) průměr, medián,... (obecně míry polohy) pro celou populaci odhadujeme na základě průměru, mediánu,... výběru z populace pokud zvolíme jiný výběr, dostaneme jiný výsledek interval spolehlivosti určuje rozsah, do kterého se se zvolenou jistotou (obvykle 95%) trefí průměr, medián,... spočtený z našeho výběru závisí na rozložení dat, velikosti výběru, zvolené pravděpodobnosti dá se použít jako jiný způsob vyjádření statistické významnosti našeho výsledku 95%CI p = 0, 05 19 z 20 výběrů (v pravděpodobnostním smyslu) bude mít průměr ve vypočteném intervalu Confidence interval Definice 16 / 26

Interval spolehlivosti (confidence interval) průměr, medián,... (obecně míry polohy) pro celou populaci odhadujeme na základě průměru, mediánu,... výběru z populace pokud zvolíme jiný výběr, dostaneme jiný výsledek interval spolehlivosti určuje rozsah, do kterého se se zvolenou jistotou (obvykle 95%) trefí průměr, medián,... spočtený z našeho výběru závisí na rozložení dat, velikosti výběru, zvolené pravděpodobnosti dá se použít jako jiný způsob vyjádření statistické významnosti našeho výsledku 95%CI p = 0, 05 19 z 20 výběrů (v pravděpodobnostním smyslu) bude mít průměr ve vypočteném intervalu Confidence interval Definice 16 / 26

Interval spolehlivosti (confidence interval) průměr, medián,... (obecně míry polohy) pro celou populaci odhadujeme na základě průměru, mediánu,... výběru z populace pokud zvolíme jiný výběr, dostaneme jiný výsledek interval spolehlivosti určuje rozsah, do kterého se se zvolenou jistotou (obvykle 95%) trefí průměr, medián,... spočtený z našeho výběru závisí na rozložení dat, velikosti výběru, zvolené pravděpodobnosti dá se použít jako jiný způsob vyjádření statistické významnosti našeho výsledku 95%CI p = 0, 05 19 z 20 výběrů (v pravděpodobnostním smyslu) bude mít průměr ve vypočteném intervalu Confidence interval Definice 16 / 26

Interval spolehlivosti (confidence interval) průměr, medián,... (obecně míry polohy) pro celou populaci odhadujeme na základě průměru, mediánu,... výběru z populace pokud zvolíme jiný výběr, dostaneme jiný výsledek interval spolehlivosti určuje rozsah, do kterého se se zvolenou jistotou (obvykle 95%) trefí průměr, medián,... spočtený z našeho výběru závisí na rozložení dat, velikosti výběru, zvolené pravděpodobnosti dá se použít jako jiný způsob vyjádření statistické významnosti našeho výsledku 95%CI p = 0, 05 19 z 20 výběrů (v pravděpodobnostním smyslu) bude mít průměr ve vypočteném intervalu Confidence interval Definice 16 / 26

Interval spolehlivosti (confidence interval) průměr, medián,... (obecně míry polohy) pro celou populaci odhadujeme na základě průměru, mediánu,... výběru z populace pokud zvolíme jiný výběr, dostaneme jiný výsledek interval spolehlivosti určuje rozsah, do kterého se se zvolenou jistotou (obvykle 95%) trefí průměr, medián,... spočtený z našeho výběru závisí na rozložení dat, velikosti výběru, zvolené pravděpodobnosti dá se použít jako jiný způsob vyjádření statistické významnosti našeho výsledku 95%CI p = 0, 05 19 z 20 výběrů (v pravděpodobnostním smyslu) bude mít průměr ve vypočteném intervalu Confidence interval Definice 16 / 26

Interval spolehlivosti (confidence interval) Normální rozdělení a CI průměru Confidence interval CI průměru při normálním rozdělení 17 / 26

Interval spolehlivosti (confidence interval) Rozdíl průměrů Významný rozdíl Nevýznamný rozdíl 181 cm, 167 cm, p = 2, 2 10 16 = 14 cm (95% CI: 11, 6-16, 0) neobsahuje nulu P-ha 180 cm, OV 181 cm, p = 0, 48 = 1 cm (95% CI: 2, 1-1, 0) obsahuje nulu Confidence interval CI rozdílu průměrů dvou skupin 18 / 26

Interval spolehlivosti (confidence interval) Rozdíl průměrů Významný rozdíl Nevýznamný rozdíl 181 cm, 167 cm, p = 2, 2 10 16 = 14 cm (95% CI: 11, 6-16, 0) neobsahuje nulu P-ha 180 cm, OV 181 cm, p = 0, 48 = 1 cm (95% CI: 2, 1-1, 0) obsahuje nulu Confidence interval CI rozdílu průměrů dvou skupin 18 / 26

Interval spolehlivosti (confidence interval) Rozdíl průměrů Významný rozdíl Nevýznamný rozdíl 181 cm, 167 cm, p = 2, 2 10 16 = 14 cm (95% CI: 11, 6-16, 0) neobsahuje nulu P-ha 180 cm, OV 181 cm, p = 0, 48 = 1 cm (95% CI: 2, 1-1, 0) obsahuje nulu Confidence interval CI rozdílu průměrů dvou skupin 18 / 26

Odds ratio Šance a pravděpodobnost Čtyřpolní tabulka Odds ratio 19 / 26

Podíl šancí (odds ratio) Šance a pravděpodobnost šance daného jevu vyjadřujeme např. jako 1 : 3 pravděpodobnost jevu je potom 1 1+3 = 1 4 O(A) = P(A) P( A) = P(A) = O(A) 1 + O(A) P(A) 1 P(A) v medicíně používáme obvykle podíl šancí odds ratio (OR) např. šance na nádor plic (jev A) u kuřáka (jev B) k šanci na nádor plic u nekuřáka (jev B) OR = O(A B) O(A B) Odds ratio Šance a pravděpodobnost 20 / 26

Podíl šancí (odds ratio) Šance a pravděpodobnost šance daného jevu vyjadřujeme např. jako 1 : 3 pravděpodobnost jevu je potom 1 1+3 = 1 4 O(A) = P(A) P( A) = P(A) = O(A) 1 + O(A) P(A) 1 P(A) v medicíně používáme obvykle podíl šancí odds ratio (OR) např. šance na nádor plic (jev A) u kuřáka (jev B) k šanci na nádor plic u nekuřáka (jev B) OR = O(A B) O(A B) Odds ratio Šance a pravděpodobnost 20 / 26

Podíl šancí (odds ratio) Šance a pravděpodobnost šance daného jevu vyjadřujeme např. jako 1 : 3 pravděpodobnost jevu je potom 1 1+3 = 1 4 O(A) = P(A) P( A) = P(A) = O(A) 1 + O(A) P(A) 1 P(A) v medicíně používáme obvykle podíl šancí odds ratio (OR) např. šance na nádor plic (jev A) u kuřáka (jev B) k šanci na nádor plic u nekuřáka (jev B) OR = O(A B) O(A B) Odds ratio Šance a pravděpodobnost 20 / 26

Podíl šancí (odds ratio) Šance a pravděpodobnost šance daného jevu vyjadřujeme např. jako 1 : 3 pravděpodobnost jevu je potom 1 1+3 = 1 4 O(A) = P(A) P( A) = P(A) = O(A) 1 + O(A) P(A) 1 P(A) v medicíně používáme obvykle podíl šancí odds ratio (OR) např. šance na nádor plic (jev A) u kuřáka (jev B) k šanci na nádor plic u nekuřáka (jev B) OR = O(A B) O(A B) Odds ratio Šance a pravděpodobnost 20 / 26

Podíl šancí (odds ratio) Šance a pravděpodobnost šance daného jevu vyjadřujeme např. jako 1 : 3 pravděpodobnost jevu je potom 1 1+3 = 1 4 O(A) = P(A) P( A) = P(A) = O(A) 1 + O(A) P(A) 1 P(A) v medicíně používáme obvykle podíl šancí odds ratio (OR) např. šance na nádor plic (jev A) u kuřáka (jev B) k šanci na nádor plic u nekuřáka (jev B) OR = O(A B) O(A B) Odds ratio Šance a pravděpodobnost 20 / 26

Podíl šancí (odds ratio) Šance a pravděpodobnost šance daného jevu vyjadřujeme např. jako 1 : 3 pravděpodobnost jevu je potom 1 1+3 = 1 4 O(A) = P(A) P( A) = P(A) = O(A) 1 + O(A) P(A) 1 P(A) v medicíně používáme obvykle podíl šancí odds ratio (OR) např. šance na nádor plic (jev A) u kuřáka (jev B) k šanci na nádor plic u nekuřáka (jev B) OR = O(A B) O(A B) Odds ratio Šance a pravděpodobnost 20 / 26

Podíl šancí (odds ratio) tabulka Čtyřpolní onemocnění Ano Ne OR = A C B D = A D C B expozice Ano A C Ne B D OR má svoji p i CI! stejný princip u šance na výléčení při léčbě / bez léčby a pod. Odds ratio Čtyřpolní tabulka 21 / 26

Podíl šancí (odds ratio) Příklady onemocnění Ano Ne onemocnění Ano Ne expozice Ano 5 3 Ne 2 6 expozice Ano 20 12 Ne 8 24 p = 0, 14 OR = 5 (95% CI: 0, 6 42, 8) obsahuje 1 p = 0, 003 OR = 5 (95% CI: 1, 7 14, 6) neobsahuje 1 Odds ratio Příklady 22 / 26

Podíl šancí (odds ratio) Příklady onemocnění Ano Ne onemocnění Ano Ne expozice Ano 5 3 Ne 2 6 expozice Ano 20 12 Ne 8 24 p = 0, 14 OR = 5 (95% CI: 0, 6 42, 8) obsahuje 1 p = 0, 003 OR = 5 (95% CI: 1, 7 14, 6) neobsahuje 1 Odds ratio Příklady 22 / 26

Podíl šancí (odds ratio) Interpretace A snižuje riziko B, D zvyšují riziko C statisticky nevýznamný Odds ratio Interpretace 23 / 26

Literatura JANA ZVÁROVÁ: Biomedicínská statistika I. Karolinum (2011) SARAH BOSLAUGH & PAUL ANDREW WATTERS: Statistics in a Nutshell O Reilly (2008) REGINA NUZZO: Statistical Errors Nature, Vol. 506 (Feb 13, 2014) 150-152 R CORE TEAM: R: A language and environment for statistical computing R Foundation for Statistical Computing, Vienna, Austria. URL https://www.r-project.org/ XKCD:http://www.xkcd.com/ LAT E X 2ε Literatura 24 / 26

Příště uvidíte Příště uvidíte 25 / 26

Ke stažení http://dusanmerta.eu/prezentace