Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

Podobné dokumenty
analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Testování statistických hypotéz

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Aproximace binomického rozdělení normálním

Jana Vránová, 3. lékařská fakulta UK

Testování statistických hypotéz

PRAVDĚPODOBNOST A STATISTIKA

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Testy. Pavel Provinský. 19. listopadu 2013

Ing. Michael Rost, Ph.D.

Testy statistických hypotéz

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

4ST201 STATISTIKA CVIČENÍ Č. 7

Testování statistických hypotéz. Obecný postup

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Testování statistických hypotéz

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Stručný úvod do testování statistických hypotéz

Normální (Gaussovo) rozdělení

Test dobré shody v KONTINGENČNÍCH TABULKÁCH

Náhodné veličiny, náhodné chyby

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Cvičení ze statistiky - 8. Filip Děchtěrenko

Normální (Gaussovo) rozdělení

Statistika, Biostatistika pro kombinované studium. Jan Kracík

2 ) 4, Φ 1 (1 0,005)

= = 2368

Charakteristika datového souboru

12. cvičení z PST. 20. prosince 2017

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.

Ranní úvahy o statistice

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

5 Parametrické testy hypotéz

Testování hypotéz Biolog Statistik: Matematik: Informatik:

TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření

ÚVOD DO TESTOVÁNÍ HYPOTÉZ. Martina Litschmannová

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

7.1. Podstata testu statistické hypotézy

6. Testování statistických hypotéz. KGG/STG Zimní semestr 6. Testování statistických hypotéz

You created this PDF from an application that is not licensed to print to novapdf printer (

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

Testování hypotéz. 4. přednáška

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

TECHNICKÁ UNIVERZITA V LIBERCI

Statistické metody uţívané při ověřování platnosti hypotéz

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Přednáška VII. Úvod do testování hypotéz

Přednáška X. Testování hypotéz o kvantitativních proměnných

Základy biostatistiky (MD710P09) ak. rok 2007/2008

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Základy biostatistiky (MD710P09) ak. rok 2008/2009

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

Úkol 1.: Testování nezávislosti nominálních veličin V roce 1950 zkoumali Yule a Kendall barvu očí a vlasů u 6800 mužů.

Jednofaktorová analýza rozptylu

STATISTICKÉ TESTY VÝZNAMNOSTI

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

Epidemiologické metody

STATISTICKÉ HYPOTÉZY

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

KORELACE. Komentované řešení pomocí programu Statistica

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Statistická analýza jednorozměrných dat

Pravděpodobnost a aplikovaná statistika

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

Zápočtová práce STATISTIKA I

Cvičení ze statistiky - 9. Filip Děchtěrenko

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

KGG/STG Statistika pro geografy

Metodologie pro Informační studia a knihovnictví 2

Technická univerzita v Liberci

12. prosince n pro n = n = 30 = S X

Tomáš Karel LS 2012/2013

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Testování hypotéz o kvalitativních proměnných

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Transkript:

Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Epidemiologické ukazatele Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly c d c+d Celkem a+c b+d n Exponovaní Neexponovaní Incidence exponovaných Incidence neexponovaných a I E = a + c I b = N b + d Incidenci většinou přepočítáváme na 1 000, 10 000 nebo 100 000 osob. 1 3 Záznam epidemiologických dat Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly c d c+d Celkem a+c b+d n Exponovaní Neexponovaní a, b, c, d... pozorované (absolutní) četnosti v jednotlivých skupinách Epidemiologické ukazatele Relativní riziko I RR = I odhaduje sílu asociace mezi rizikovým faktorem a nemocí vyjadřuje, kolikrát častěji se může nemoc vyvinout v populaci exponovaných ve srovnání s populací neexponovaných E N n = a + b + c + d 4

Epidemiologické ukazatele Atributivní riziko AR = I E I N část incidence exponované populace, která může být vysvětlena pouze přítomností rizikového faktoru umožňuje odhalit stupeň maximálního poklesu výskytu onemocnění u exponované populace v případě, že umíme odstranit vliv rizikového faktoru Volba hladiny významnosti - hladina významnosti souvisí s chybami, kterých se při rozhodnutí můžeme dopustit: Rozhodnutí Nezamítneme H0 (nevýznamný výsledek) Zamítneme H0 (významný výsledek) H0 platí Správné rozhodnutí Chyba I. druhu (α) Skutečnost H1 platí Chyba II. druhu (β) Správné rozhodnutí - hladina významnosti (a) je předepsaná hodnota, kterou pravděpodobnost chyby I. druhu nesmí překročit 5 Obvykle a = 0,05 (zamítáme na 5% hladině - významný výsledek) nebo a = 0,01 (zamítáme na hladině 1% - vysoce významný výsledek) 7 Příklad Chceme ověřit, zda progresivní polyartritida (PAP) souvisí s výskytem antigenu HLA-DR4. Domníváme se, že ano (to je naše medicínská hypotéza). Sestavíme tedy nulovou a alternativní hypotézu (nezapomeňte, že nulovou hypotézu volíme opačně, než je dokazované tvrzení). Tedy: H 0 : PAP nesouvisí s výskytem HLA-DR4 H 1 : PAP souvisí s výskytem HLA-DR4 6 Sběr r dat -tato fáze je velmi důležitá a měla by být konzultována se statistikem -sebraný vzorek dat musí být objektivní, reprezentativní a dostatečně velký Př. (pokračování): Nasbíraná data pozorované četnosti ve čtyřpolní tabulce Antigen HLA-DR4 Výskyt PAP Ano Ne Celkem Ano 46 8 74 Ne 50 184 34 Celkem 96 1 308 8

Volba vhodného testu Rozhodnutí o platnosti nebo neplatnosti hypotézy činíme na základě aplikace vhodného statistického testu. Každý statistický test je charakterizován testovou statistikou - funkcí, která ze sesbíraných dat "vytvoří" jedno číslo. Př.: = ( pozorovaná četnost - očekávaná četnost) očekávaná četnost ~ ( df ) Příklad (pokračov ování) Výpočet očeko ekávaných hodnot: Antigen HLA-DR4 Výskyt PAP Ano Ne Celkem Ano 46 8 74 Ne 50 184 34 Celkem 96 1 308 Výskyt antigenu je rozdělen v poměru 96:1. V případě platnosti hypotézy nezávislosti obou znaků očekáváme, že ve stejném poměru budou rozděleny i skupiny s PAP a bez PAP. Tedy pro skupinu (PAP-Ano, HLA-DR4-Ano): Očekávaný počet = 96/308. 74 = 3 9 11 Krok 5: Výpočet hodnoty testové statistiky Sesbíraná data je třeba zpracovat a dosadit do předpisu testové statistiky. Naměř ěřené a očeko ekávané hodnoty Antigen HLA-DR4 Výskyt PAP Ano Ne Celkem Ano 46 8 74 3 51 Ne 50 184 34 73 161 Celkem 96 1 308 Červeně jsou vyznačeny četnosti očekávané v případě, že platí hypotéza nezávislosti. Po dosazení: = 43,61 10 1

Krok 5: Určen ení kritické hodnoty Po dosazení naměřených hodnot do testové statistiky zamítáme hypotézu, pokud výsledná hodnota přesáhne jistou mez, nazývanou kritická hodnota.? Jak tuto hodnotu určit? Kritickou hodnotou testu je takové číslo, které testová statistika překročí v případě, že nulová hypotéza je pravdivá, s pravděpodobností nejvýše α. P H 0 ( T k α ) α Statistická a klinická významnost Statistická významnost Je-li statistický test zamítnut (významný) na předepsané hladině α (hladina významnosti). Klinická významnost Je-li efekt významný z hlediska klinické praxe (např. překročení prahové hodnoty). G Pojmy statistické a klinické významnosti bývají často ztotožňovány. Toto ztotožnění je však třeba provádět opatrně, neboť bývá nepřesné. Kritické hodnoty jsou tabelovány. 13 15 Příklad (dokončen ení) Kontingenční tabulky Testová statistika: Testové kriterium: Rozhodnutí: H 0 zamítáme na hladině 5% = 43,61 1 α ( 1) = 3, 84 = 43,61 3,84 = 1 0,05 ( 1) Zjistili jsme významnou souvislost mezi výskytem antigenu HLA-DR4 a PAP na 5% hladině. - kontingenční tabulky slouží ke studování vztahů mezi dvěma znaky Kontingenční tabulka r x s: Znak Znak 1 Kategorie 1... Kategorie s Kategorie 1 n 11... n 1s n1............ Kategorie r n r1... n rs nr n 1... n s n 14 - kontingenční tabulka typu x se nazývá čtyřpolní tabulka 16

Test hypotézy o shodnosti struktur -test shodnosti pravděpodobnostní struktury nějakého znaku za různých podmínek Př.: Stejná věková struktura pacientů ve dvou nemocnicích. -tzv. -test dobré shody použitý na kontingenční tabulku Příklad (dokončen ení) H 0 : H 1 : Pravděpodobnosti skupin jsou v jednotlivých krajích stejné. Nulová hypotéza neplatí. Testová statistika: 3 4 n ij = n n ~ = n n i= 1 j= 1 i.. j (( 3-1. )( 4 1) ) ( 6) Testové kriterium: 1 0,05 ( 6) 17 Rozhodnutí: = 10,45 < 1,59 = 1 0,05 ( 6) H 0 tedy nelze zamítnout na 5% hladině. 19 Příklad Studie percentuálních zastoupení krevních skupin ve třech krajích severního Skotska. Je ve všech krajích stejné percentuelní zastoupení krevních skupin? Oblast A B 0 AB Celkem Eskdale 33 6 56 5 100 Annadale 54 14 5 5 15 Nithdale 98 35 115 5 53 Celkem 185 55 3 15 478 Dosažen ená hladina významnosti Alternativní postup při rozhodnutí o platnosti či neplatnosti hypotézy: Určíme pravděpodobnost p, s jakou bychom mohli obdržet pozorovaná data nebo data stejně nebo více odporující nulové hypotéze za předpokladu, že je nulová hypotéza pravdivá, tato hodnota se nazývá dosažená hladina významnosti.! Čím menší p, tím méně důvěryhodné je H 0. Pro účely statistické analýzy volíme hladinu významnosti α a zamítneme H 0, je-li: p <α 18 0

McNemarův test Máme náhodný n výběr r 18 pacientů,, kteří byli léčeni l dvěma různými r antihypertenzivy A, B. Každý pacient dostával po dobu jednoho měsíce m léka A a po odeznění jeho případných padných účinků po dobu jednoho měsíce lék l k B. Výsledek byl klasifikován jako úspěch nebo neúsp spěch. Pravidla statistického rozhodování hladina testu α : pravděpodobnost podobnost chyby 1. druhu, tj.. zamítnut tnutí platné nulové hypotézy kritický obor : výsledky pokusu, při p i nichž se zamítá nulová hypotéza síla testu (1-β):: pravděpodobnost podobnost zamítnut tnutí nulové hypotézy, jestliže e nulová hypotéza neplatí kritický obor i hladina testu se volí před pokusem, nezávisle na jeho výsledku 1 3 Obecný postup při p i testování hypotéz Formulujeme nulovou hypotézu H 0 a alternativu H 1. Zvolíme hladinu významnosti α. Získáme data. Vybereme vhodný statistický test. Spočteme hodnotu testového kritéria. ria. Najdeme v tabulkách příslup slušnou kritickou hodnotu. Provedeme statistické rozhodování následujícím způsobem: Je-li hodnota testového kritéria ria většív než kritická hodnota, zamítneme nulovou hypotézu H 0 ve prospěch alternativy H 1 na hladině významnosti α. Dosažen ená hladina testu Hladinu testu α volíme předem p (nesmí záviset na datech) Dosažen ená hladina ( p value ) je nejmenší hladina, na které bychom při p i daných datech nulovou hypotézu zamítli Dosažen ená hladina ( p value ) je pravděpodobnost podobnost našeho výsledku a všech v výsledků ještě méně podporujících ch nulovou hypotézu Jednoduché pravidlo: p value < α H 0 zamítáme me 4

815 Obecné schéma statistického rozhodování Skutečnost Rozhodnutí H 0 platí H 0 neplatí H 0 zamítnout chyba 1. druhu a správně H 0 nezamítnout správně chyba. druhu b 5 Chyba 1.a. druhu (α,( β) H 0 x H 1 H 0 H 1 b a 6