Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 76



Podobné dokumenty
Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

Zváry [1], nebo z knihy, jejíž autorkou je prof. Zvárová [2]. Publikace těchto dvou. z knihy [2].

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

= = 2368

4ST201 STATISTIKA CVIČENÍ Č. 7

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

Normální (Gaussovo) rozdělení

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Jana Vránová, 3. lékařská fakulta UK

PRAVDĚPODOBNOST A STATISTIKA

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Jednostranné intervaly spolehlivosti

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Stručný úvod do vybraných zredukovaných základů statistické analýzy dat

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Charakteristika datového souboru

Testování statistických hypotéz

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

STATISTIKA VĚDA O USUZOVÁNÍ NA ZÁKLADĚ DAT. Patrícia Martinková Ústav informatiky AV ČR

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Normální (Gaussovo) rozdělení

Příklady na testy hypotéz o parametrech normálního rozdělení

Zápočtová práce STATISTIKA I

Aplikovaná statistika v R - cvičení 2

Cvičení ze statistiky - 9. Filip Děchtěrenko

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Kontingenční tabulky, korelační koeficienty

STATISTICKÉ ODHADY Odhady populačních charakteristik

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

12. cvičení z PST. 20. prosince 2017

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013

Kontingenční tabulky, korelační koeficienty

Lineární regrese. Komentované řešení pomocí MS Excel

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Testování statistických hypotéz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Cvičení ze statistiky - 8. Filip Děchtěrenko

Pravděpodobnost a matematická statistika

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Porovnání dvou výběrů

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

KGG/STG Statistika pro geografy

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

, Brno Hanuš Vavrčík Základy statistiky ve vědě

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

Náhodná veličina a rozdělení pravděpodobnosti

INDUKTIVNÍ STATISTIKA

Základy popisné statistiky

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

Statistické metody uţívané při ověřování platnosti hypotéz

Testování statistických hypotéz

Analýza dat na PC I.

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Informační technologie a statistika 1

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

STATISTICKÉ TESTY VÝZNAMNOSTI

Vybrané partie z biostatistiky

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Vzorová prezentace do předmětu Statistika

Základy biostatistiky

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

2 ) 4, Φ 1 (1 0,005)

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Základy pravděpodobnosti a statistiky. Popisná statistika

6. Lineární regresní modely

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

Praktická statistika. Petr Ponížil Eva Kutálková

Popisná statistika. Statistika pro sociology

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Úvod do analýzy rozptylu

15. T e s t o v á n í h y p o t é z

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Transkript:

1 / 76 Méně než minimum ze statistiky Michaela Šedová KPMS MFF UK Principy medicíny založené na důkazech a základy vědecké přípravy

Příklad Studie syndromu náhodného úmrtí dětí. Dvě skupiny: Děti, které byly nalezeny téměř mrtvé, bez známek života. Všechna další vyšetření negativní, zotavily se během několika dnů.... téměř ztracené Normální děti LTV... dlouhodobá proměnlivost tepové frekvence (rozdíl mezi min. a max. hodnotami novorozenecké tepové frekvence). Téměř 5.0, 7.0, 7.67, 8.17, 8.33, 8.83, 9.17, 9.33, 9.33, ztracené 9.67, 11.0,11.67, 13.33, 13.83, 14.17, 15.17, 15.50, 17.33, 18.0, 20.60, 21.17, 22.33, 22.67, 23.00, 24.67 Normální 11.33, 13.67, 14.33, 17.33, 17.83, 19.0, 20.67, 22.33, 27.83, 29.0, 31.17, 31.33, 32.0, 32.5, 35.0 Liší se téměř ztracené děti od normálních z hlediska LTV? 2 / 76

Statistika 3 / 76 Rozlišení LTV mezi skupinami není jednoznačné: téměř ztracené děti : (5,00 24,67) normální děti: (11,33 35,00) Liší se alespoň v průměru? (13,70 resp. 23,69) Je tento rozdíl pouze náhodný, nebo zde existuje nějaké systematické posunutí?

Statistika 4 / 76 Popisná (deskriptivní) Určitým způsobem popisuje nebo shrnuje data, která máme Popisné chrakteristiky (průměr, medián,... ), grafy (histogram, krabicový diagram, bodový graf,... ) Omezuje svá tvrzení na daná data, nečiní si nárok zobecňovat, dělat závěry Induktivní Na základě dat se snaží zobecnit pozorování na větší soubor, populaci Pracuje s náhodou, odhady, testy Velkou roli zde hraje správná interpretace Ve většině prací se setkáme s obojím.

Měřítko 5 / 76 Na statistických jednotkách sledujeme jejich vlastnosti - hodnoty znaků ve zvoleném měřítku Kvalitativní (zpravidla vyjádřené slovem, znakem,... ) nula-jedničkové (jev nastal/nenastal, pacient přežil/nepřežil) nominální (několik kategorií, např. krevní skupina, pohlaví - faktor) ordinální (kategorie jsou jistým způsobem řezené, např. bolest je silná, mírná, žádná) Kvantitativní (vyjádřené číslem) intervalové (spojité, nabývají hodnoty z nějakého intervalu, např. výška, LTV) diskrétní (ordinální, počet pacientů, kteří navštíví ambulanci během jednoho dne)

Pravděpodobnost I 6 / 76 Náhodný pokus - pokus, jehož výsledek není předem určený Náhodný jev - výsledek náhodného pokusu Pravděpodobnost náhodného jevu A, P(A) - míra častosti výskytu jevu A, naděje, že nastane 0 P(A) 1

Pravděpodobnost II 7 / 76 Klasická definice pravděpodobnosti n stejně pravděpodobných elementárních jevů ω 1, ω 2,..., ω n z toho m elementárních jevů příznivých jevu A P(A) = m n Např. hod kostkou A... padne sudé číslo Elementární jevy: padne 1,2,3,4,5,6, všechny s pravděpodobností 1 6 P(A) = 3 6 = 1 2 Ovšem máme-li spojitý znak, tato definice nestačí. Potřebujeme obecnější koncept.

Náhodná veličina 8 / 76 Číselně vyjádřený výsledek náhodného pokusu. Teoretický pojem. Nevíme výsledek, známe jenom možné hodnoty a jejich pravděpodobnosti (rozdělení). Např. náhodná veličina je LTV obecně. Její realizace: naměříme ji u konkrétního dítěte. Populace (nekonečná) Náhodná veličina X Příště Výběr Výběr pozorování x 1,... x n Výběr Jiná pozorování x 1,... x n

Rozdělení náhodné veličiny 9 / 76 Diskrétní Model pro počty případů Dané pravděpodobnosti hodnot Např. P(nově narozené dítě je chlapec)=0,52, P(nově narozené dítě je dívka)=0,48 Spojité Např. Normální (Gaussovo), X N(µ, σ 2 ) f(x) 0.0 0.1 0.2 0.3 0.4 4 2 0 2 4 x

Normální rozdělení 10 / 76 Tzv. Gaussova křivka je hustota (vyjádřena přesným matematickým vzorcem) Určuje s jakou pravděpodobností může náhodná veličina X nabýt hodnoty z daného intervalu To je dáno plochou pod křivkou f(x) 0.0 0.1 0.2 0.3 0.4 4 3 2 1 0 1 2 3 4 x

Normální rozdělení II Má dva parametry Střední hodnota µ - určuje bod, kolem kterého je tato hustota symetrická Rozptyl σ 2 - určuje jak moc jsou hodnoty rozpýlené kolem tohoto bodu N(0,1) N(1,1) N(0,2) f(x) 0.0 0.1 0.2 0.3 0.4 4 2 0 2 4 x f(x) 0.0 0.1 0.2 0.3 0.4 4 2 0 2 4 x f(x) 0.0 0.1 0.2 0.3 0.4 4 2 0 2 4 x 11 / 76

Jiná spojitá rozdělení 12 / 76 Avšak normální rozdělení není zdaleka jediné spojité rozdělení. Rovnomìrné, Ro[0,1] Exponenciální, Exp(1) f(x) 0.0 1.0 2.0 f(x) 1 0 µ 1 2 0 µ 2 4 6 8 0.0 0.4 0.8 a) b) Studentovo, 5 st. volnosti χ 2, 5 st. volnosti f(x) 0.0 0.2 4 2 0 2 4 c) f(x) 0.00 0.10 0 5 10 15 20 d)

Charakteristiky rozdělení 13 / 76 Střední hodnota (expectation, mean value) Diskrétní rozdělení Vážený průměr - váhy pravděpodobnosti, s jakými nabýváme daných hodnot Spojité rozdělení Funkci vah plní hustota µ = EX = x 1 p 1 + x 2 p 2 + + x n p n EX = xf (x)dx

Charakteristiky rozdělení II 14 / 76 Rozptyl (variance) Lze říci, že je to průměrná druhá mocnina odchylky hodnot od střední hodnoty Diskrétní rozdělení σ 2 = var (X ) = E(X EX ) 2. σ 2 = var (X ) = (x 1 µ) 2 p 1 + (x 2 µ) 2 p 2 + + (x n µ) 2 p n. σ... směrodatná odchylka (standard deviation, SD), něco jiného než směrodatná chyba (standard error, SE), viz dále

Jiná spojitá rozdělení 15 / 76 Rovnomìrné, Ro[0,1] Exponenciální, Exp(1) f(x) 0.0 1.0 2.0 f(x) 1 0 µ 1 2 0 µ 2 4 6 8 0.0 0.4 0.8 a) b) Studentovo, 5 st. volnosti χ 2, 5 st. volnosti f(x) 0.0 0.2 4 2 0 2 4 c) f(x) 0.00 0.10 0 5 10 15 20 d)

Další charakteristiky 16 / 76 Kvantily Medián x... číslo, které oddělí polovinu možných hodnot P(X x) = 1 2 Kvartily... čísla, která oddělí čtvrtiny možných hodnot Dolní kvartil q 1... P(X q 1 ) = 1 4 Horní kvartil q 3... P(X q 3 ) = 3 4 Decily (desetiny), percentily (setiny)

Popisná statistika 17 / 76 Shrnuje to, co máme v datech. První, ne však jediný krok k tomu, abychom mohli něco usoudit o dané náhodné veličině. Míry polohy Průměr x = x 1 + x 2 + + x n n (Výběrový) medián... prostřední hodnota { x[ n+1 x = 2 ] n liché 1 2 (x [ n 2 ] + x [ n 2 +1] ) n sudé, (Výběrové) kvartily... analogicky

Grafické znázornění dat 18 / 76 Krabicový diagram (boxplot) Znázornění rozdělení spojité veličiny Medián... příčka obdélníka Horní resp. dolní kvartil - kratší strany obdélníka Tykadla - od kvartilu k minimu resp. maximu, pokud není odlehlé Odlehlé pozorování - je dál, než zpravidla 3 2 (q 3 q 1 ) 5 10 15 20

Krabicový diagram 19 / 76 Příklad Znázornění dat o LTV pro téměř ztracené děti. Nevykreslovat jednotlivá pozorování (zvlášt u objemnějších dat nepřehledné), ale krabicový diagram. LTV 5 10 15 20 25 Bodový graf LTV Krabicový diagram 5 10 15 20 25

Grafické znázornění dat Histogram - znázornění intervalových četností spojité veličiny Rozmezí všech možných hodnot (osa x) rozdělíme na malé intervaly, ke každému spočítáme, kolik pozorování do něj padne, to vyneseme na osu y Data: 1.48, 1.11 1.00, 0.62, 0.59, 0.55, 0.51 0.48, 0.39, 0.28, 0.26, 0.18 0.00, 0.06, 0.24, 0.24 0.68, 0.97 1.29, 1.45 Histogram of x Frequency 0 1 2 3 4 5 1.5 1.0 0.5 0.0 0.5 1.0 1.5 x 20 / 76

Histogram Druhá možnost: vynést na osu y relativní četnosti (počet pozorování v intervalu dělený celk. počtem pozorování). Při dostatečném počtu pozorování aproximuje hustotu rozdělení Data z rozdělení N(0, 1). Histogram of x Histogram of x Frequency 0 5 10 15 20 Density 0.0 0.2 0.4 2 1 0 1 2 2 1 0 1 2 21 / 76

Další grafy 22 / 76 Bar plot Grafické znázorněné četností (počtů hodnot) kvalitativního znaku Příklad Zjistili jsme krevní skupinu ve vzorku 100 pacientů. 0 A B AB 28 36 27 9

Induktivní statistika 23 / 76 Snažíme se zobecnit to, co pozorujeme na konkrétních stat. jednotkách. Odhadnout parametry (vlastnosti) rozdělení náhodné veličiny. Odhadem střední hodnoty je zpravidla průměr Odhadem rozptylu je zpravidla výběrový rozptyl atd. Kdybychom však daný pokus opakovali, dostaneme určitě jiný průměr, tj. jiný odhad střední hodnoty. Proto nás zajímá přesnost našeho bodového odhadu, tj. představa, jak jsme nanejvýš daleko od skutečné střední hodnoty.

Odhad střední hodnoty Sledujeme náhodnou veličinu, která má v populaci rozdělení X N(23, 8 2 ). 3 náhodné výběry o rozsahu 10, 50 a 1000. Histogram of x1 Density 0.00 0.06 5 10 15 20 25 30 35 40 x1 Histogram of x2 Density 0.00 0.04 5 10 15 20 25 30 35 40 x2 Histogram of x3 Density 0.00 0.03 5 10 15 20 25 30 35 40 x3 24 / 76

25 / 76 Průměr: x 1 = 20, 17 x 2 = 22, 69 x 3 = 23, 14 Průměr je tedy také náhodná veličina... Naštěstí známe její vlastnosti: Je-li X N(µ, σ 2 ) a máme-li výběr o velikosti n X N(µ, σ2 n ) Průměr kolísá kolem skutečné střední hodnoty µ, je jejím odhadem. Známe-li jenom průměr, moc to nepomůže, protože nevíme, jak daleko je tento odhad od skutečné střední hodnoty. σ n... směrodatná chyba (standard error, SE), SD průměru

Interval spolehlivosti 26 / 76 Kromě bodového odhadu střední hodnoty vhodné uvádět i intervalový odhad. Interval, který pokryje skutečnou střední hodnotu s předem stanovenou pravděpodobností Většinou se volí 95 % nebo 90 %, případně 99 %. Lze ukázat, že 95% interval spolehlivosti je ( x 1, 96 σ n, x + 1, 96 σ n ). z = 1, 96 kritická hodnota standardizovaného normálního rozdělení

Kritická hodnota Kritická hodnota standardizovaného normálního rozdělení, tj. 97,5% kvantil. z = 1, 96 f(x) 0.0 0.1 0.2 0.3 0.4 95% 2.5% 2.5% 4 3 2 1 0 1 2 3 4 x 27 / 76

Interval spolehlivosti 28 / 76 Směrodatnou odchylku však většinou neznáme, nahrazujeme ji proto odhadem s. Lze ukázat, že 95% interval spolehlivosti pak je x ± t(n 1) s n t(n 1)... kritická hodnota studentova rozdělení o n 1 stupních volnosti. Studentovo rozdělení... podobné normálnímu, pro větší n (> 100) téměř identické.

Příklad 29 / 76 Intervalové odhady v předchozím příkladě vyšly následovně: 1.výběr: (15,28, 25,07) 2.výběr: (20,55, 24,82) 3.výběr: (22,64, 23,64) Čím více pozorování, tím užší interval spolehlivosti (přesnější odhad) Čím menší směrodatná odchylka, tím užší interval spolehlivosti (přesnější odhad) Čím menší přesnost požadujeme, tím...?

Testování hypotéz 30 / 76 Nulová hypotéza Formulujeme hypotézu o hodnotě parametru (často právě o střední hodnotě). Např. Střední hodnota LTV u téměř ztracených dětí je stejná jako u zdravých. Zpravidla je to opak toho, co chceme ukázat. Alternativní hypotéza Je doplňkem nulové. Tj. žádná jiná hodnota parametru (než která je obsažena v těchto dvou hypotézách) nepřichází v úvahu. Např. Střední hodnoty LTV u téměř ztracených dětí a u zdravých se liší.

Možná rozhodnutí 31 / 76 Hypotézu otestujeme na datech. Avšak musíme ohlídat náhodu. Předem si stanovíme hladinu testu α, tedy pravděpodobnost, se kterou si dovolíme udělat chybný závěr. Většinou α = 5 %. Rozhodnutí Skutečnost H 0 zamítneme H 0 nezamítneme H 0 platí Chyba 1. druhu (α) Správné rozhodnutí H 0 neplatí Správné rozhodnutí Chyba 2. druhu (β) Nemůžeme minimalizovat obě (jsou proti sobě). Proto fixujeme α, tradičně α = 5 %, β už je tím dané. Sílu testu (1 β) můžeme ovlivnit velikostí výběru.

Logika testování 32 / 76 Test Předpokládáme, že platí H 0. Z dat spočítáme testovou statistiku (např. průměr). Spočítáme pravděpodobnost, že bychom za H 0 pozorovali naše data nebo data stejně či více extrémní.... dosažená hladina významnosti, p hodnota Pokud p hodnota α, H 0 zamítáme, jinak H 0 nezamítáme.

Jednovýběrový t-test 33 / 76 H 0 : µ = µ 0 H 1 : µ µ 0 Testová statistika T = X µ 0 s n Velké hodnoty T vypovídají proti H 0 : Porovnáme s kritickou hodnotou. Zamítáme, je-li T > t n 1 ( α 2 ). Pro velké n nahrazujeme t n 1 ( α 2 ) kvantilem normálního rozdělení z( α 2 ). Předpoklady rozdělení sledované veličiny je blízké normálnímu nezávislá pozorování

Jednovýběrový t-test Příklad Naměřili jsme LTV pouze u téměř ztracených dětí. Předpokládejme, že víme, že střední hodnota LTV u zdravých dětí je 23. Je možné říci, že se téměř ztracené děti z hlediska LTV liší od normálních? H 0 : µ = 23 H 1 : µ 23 T = 13, 7 23 5,82 26 = 8, 13 T < t 25 (0, 025) = 2, 06 zamítáme H 0. Software, publikace: uvádí se p-hodnota, v tomto případě p = 1, 7 10 8 < 0, 001. Lepší, než uvést pouze výsledek testu. Dává představu, jak daleko jsme od kritické hodnoty. 34 / 76

Jednostranný t-test 35 / 76 Předpokládejme však, že bychom už předem veděli, že téměř ztracené děti rozhodně nemohou mít LTV větší než děti zdravé. H 0 : µ = µ 0 H 1 : µ < µ 0 Testová statistika stejná T = X µ 0 s, n avšak sledujeme pouze, o kolik je průměr menší než střední hodnota. Malé hodnoty T vypovídají proti H 0 ; zamítáme, je-li T < t n 1 (α). Předpoklady stejné jako u oboustranného t-testu. Je silnější, protože reflektuje apriorní informaci. Ta ale musí být podložená. Nelze nejprve zjistit hodnotu T statistiky, a potom volit typ t-testu.

Dvouvýběrový t-test 36 / 76 Příklad Naměřili jsme LTV u skupiny téměř ztracených dětí a u skupiny normálních dětí. Je možné říci, že se LTV v těchto dvou skupinách v průměru liší? H 0 : µ A = µ B H 1 : µ A µ B Testová statistika T = X A X B var( X A X B ) = X A X B na n B s n A + n B Velké hodnoty T vypovídají proti H 0. Porovnáme s kritickou hodnotou. Zamítáme, je-li T > t na +n B 2( α 2 ).

Dvouvýběrový t-test 37 / 76 Předpoklady Nezávislá pozorování (mezi skupinami i uvnitř skupin) Rozdělení sledované veličiny je v každé skupině blízké normálnímu V obou skupinách je shodný rozptyl Pokud tyto předpoklady nejsou splněny, nelze t-test použít! Je nutné použít jiné nástroje, např. existuje úprava t-testu, která nevyžaduje shodnost rozptylů.

Dvouvýběrový t-test Příklad Naměřili jsme LTV u skupiny téměř ztracených dětí a u skupiny normálních dětí. Je možné říci, že se LTV v těchto dvou skupinách v průměru liší? H 0 : µ A = µ B H 1 : µ A µ B x A = 13,70 x B = 23,69 T = 4, 62 T < t 39 (0, 025) = 2, 02 zamítáme H 0. p = 4, 09 10 5 < 0, 001 Pozn.: Dvouvýběrový t-test má také jednostrannou a oboustrannou verzi. 38 / 76

Párový t-test Příklad U každého z pacientů byl zjištěn krevní tlak před podáním a dvě hodiny po podání farmaka. Ovlivňuje podání farmaka krevní tlak? Naměřené hodnoty před: 206, 205, 205, 198, 191, 185,186, 172, 168, 165, 158 Naměřené hodnoty po: 187, 178, 202, 197, 173, 167, 184, 166, 155, 125, 162 H 0 : µ pred = µ po H 1 : µ pred µ po X pred = 185, 36 Xpo = 172, 36 Použijeme dvouvýběrový t-test: p-hodnota=0,07 39 / 76

Párový t-test Příklad U každého z pacientů byl zjištěn krevní tlak před podáním a dvě hodiny po podání farmaka. Ovlivňuje podání farmaka krevní tlak? Naměřené hodnoty před: 206, 205, 205, 198, 191, 185,186, 172, 168, 165, 158 Naměřené hodnoty po: 187, 178, 202, 197, 173, 167, 184, 166, 155, 125, 162 H 0 : µ pred = µ po H 1 : µ pred µ po X pred = 185, 36 Xpo = 172, 36 Použijeme dvouvýběrový t-test: p-hodnota=0,07 CHYBA! 40 / 76

Párový t-test 41 / 76 Pozorování před a po závislá (dvojice měření na jednom jedinci). Záležitost designu studie. Definujeme rozdíly D i = Pred i Po i, na ně použijeme jednovýběrový t-test. H 0 : µ d = µ pred µ po = 0 H 1 : µ d = µ pred µ po 0 X d 0 n s d = 13 0 = 3, 29, 13,09 11 p-hodnota = 0, 004 zamítáme H 0

ANOVA Příklad 20 pacientů, kteří podstoupili operaci srdce, bylo náhodně rozděleno do tří skupin. 50% oxidu dusného a 50% kyslíkové směsi 24 hodin 50% oxidu dusného a 50% kyslíkové směsi během operace a 35 50% kyslíku 24 hodin? Koncentrace soli kyseliny listové v červených krvinkách? 42 / 76

ANOVA 43 / 76 Bodový graf koncentrace soli kyseliny listové v jednotlivých skupinách Koncentrace 200 250 300 350 1 2 3 skupina

ANOVA 44 / 76 První nápad: Porovnat všechny dvojice dvouvýběrovými t-testy. Skupina 1 vs Skupina 2 Skupina 1 vs Skupina 3 Skupina 2 vs Skupina 3

ANOVA 45 / 76 První nápad: Porovnat všechny dvojice dvouvýběrovými t-testy. Skupina 1 vs Skupina 2 Skupina 1 vs Skupina 3 Skupina 2 vs Skupina 3 Problém: Má-li každý test pravděpodobnost chybného pozitivního výsledku 5 %, výsledná pravděpodobnost, že dostaneme alespoň jeden chybný pozitivní výsledek je větší než 5 % (cca 14 %). Pozn.: Problém mnohonásobného testování je obecnější...

ANOVA 46 / 76 H 0 : µ 1 = µ 2 = µ 3 H 1 : neplatí H 0 (Alespoň jedna skupina se liší) Testová statistika porovnává variabilitu mezi skupinami a variabilitu uvnitř skupin. F = Velké hodnoty F svědčí proti H 0. Předpoklady: variabilita mezi skupinami variabilita uvnitř skupin. nezávislá pozorování (mezi skupinami i uvnitř skupin) rozdělení sledované veličiny je v každé skupině blízké normálnímu ve všech skupinách je shodný rozptyl

ANOVA Příklad 20 pacientů, kteří podstoupili operaci srdce, bylo náhodně rozděleno do tří skupin. 50% oxidu dusného a 50% kyslíkové směsi 24 hodin 50% oxidu dusného a 50% kyslíkové směsi během operace a 35 50% kyslíku 24 hodin? Koncentrace soli kyseliny listové v červených krvinkách? p-hodnota= 0,015 zamítáme H 0. Která skupina se však liší od které? 47 / 76

Bonferroniho korekce 48 / 76 Která skupina se však liší od které? Provedeme porovnání všech dvojic skupin dvouvýběrovým t-testem. Avšak použijeme Bonferroniho korekci - za signifikantní považujeme výsledek, kdy je. p < α počet skupin Skupina 1 vs Skupina 2: p = 0, 006 < 0, 0167 Skupina 1 vs Skupina 3: p = 0, 095 > 0, 0167 Skupina 2 vs Skupina 3: p = 0, 368 > 0, 0167 Významný rozdíl je mezi průměry skupin 1 a 2, ale ne mezi ostatními.

ANOVA 49 / 76 Bodový graf koncentrace soli kyseliny listové v jednotlivých skupinách Koncentrace 200 250 300 350 1 2 3 skupina

Wilcoxonův test 50 / 76 Neparametrická analogie t-testu. Použijeme, pokud není splněn předpoklad o normálním rozdělení dat (ale spojité). H 0 : Medián x = 0 H 1 : Medián x 0 Postup Určíme pořadí R + i hodnot X i. Určíme součet těch pořadí, kde bylo X i > 0, označíme jej W. Položíme Z = W n(n + 1)/4 n(n + 1)(2n + 1)/24

Neparametrické analogie parametrických testů 51 / 76 rozdělení normální spojité parametr střední hodnota medián jeden jednovýběrový jednovýběrový výběr t-test Wilcoxon výběr dvojic párový t-test Wilcoxon dva nezávislé dvouvýběrový Mann-Whitney výběry t-test (Kolmogorov-Smirnov) k nezávislých analýza rozptylu Kruskal-Wallis výběrů (ANOVA)

Analýza kategoriálních dat Příklad Ve vyšetřované populaci jsou krevní skupiny 0, A, B a AB v poměru 35 %, 35 %, 20 % a 10 %. Ve vzorku pacientů byly počty osob s krevními skupinami po řadě 28, 36, 27, 9. Lze považovat tento výběr za reprezentativní vzhledem k výskytu krevních skupin? Zde testujeme rozdělení kategorického znaku. 52 / 76

Analýza kategoriálních dat 53 / 76 H 0 : Kategorický znak má předpokládané rozdělení. H 1 : Kategorický znak nemá předpokládané rozdělení. Testová statistika porovnává napozorované četnosti (N 1, N 2,..., N k ) jednotlivých kategorií (je jich k) s teoretickými. Teoretické pravděpodobnosti: π 1, π 2,..., π k Teoretické četnosti pro n pozorování: nπ 1, nπ 2,..., nπ k χ 2 = (N 1 n π 1 ) 2 n π 1 + (N 2 n π 2 ) 2 n π 2 + + (N k n π k ) 2 n π k Velké hodnoty mluví proti H 0. Testovou statistiku porovnáváme s kritickou hodnotou χ 2 k 1 (α).

Test dobré shody Příklad Ve vyšetřované populaci jsou krevní skupiny 0, A, B a AB v poměru 35 %, 35 %, 20 % a 10 %. Ve vzorku pacientů byly počty osob s krevními skupinami po řadě 28, 36, 27, 9. Lze považovat tento výběr za reprezentativní vzhledem k výskytu krevních skupin? χ 2 = (28 35)2 35 + (36 35)2 35 + (27 20)2 20 + (9 10)2 35 = 3, 98 p-hodnota=0,24 nezamítáme H 0. 54 / 76

Nezávislost dvou kategorických znaků Příklad Očkování proti chřipce se účastnilo 460 dospělých. 240 dostalo očkovací látku, 220 placebo. Chřipkou onemocnělo 20 z očkovací skupiny a 80 z kontrolní skupiny. Je to dostatečný důkaz o tom, že je očkovací látka účinná? Sestavíme kontingenční tabulku Chřipka Očkování Placebo Celkem Ano 20 80 100 Ne 220 140 360 Celkem 240 220 460 55 / 76

Nezávislost dvou kategorických znaků 56 / 76 H 0 : Dva znaky jsou na sobě nezávislé. H 1 : Dva znaky nejsou nezávislé. Testová statistika porovnává napozorované četnosti v kontingenční tabulce (r s) s očekávanými: Očekávaná četnost = součet v řádku součet ve sloupci celkový počet pozorování χ 2 = (pozorovaná četnost očekávaná četnost) 2 očekávaná četnost Velké hodnoty mluví proti H 0. Testovou statistiku porovnáváme s kritickou hodnotou χ 2 (r 1)(s 1) (α).

Nezávislost dvou kategorických znaků 57 / 76 Chřipka Očkování Placebo Celkem Ano 20 80 100 Ne 220 140 360 Celkem 240 220 460 χ 2 = (20 52, 2)2 + 52, 2 (80 47, 8)2 + 47, 8 (220 187, 8)2 (140 172, 2)2 + 187, 8 172, 2 p-hodnota= 7, 63 10 13 < 0, 001 zamítáme H 0.!Tento test je možné použít jsou-li všechny napozorované četnosti 5!

Korelace 58 / 76 Závislost znaků kategorický vs spojitý kategorický vs kategorický spojitý vs spojitý

Korelace 59 / 76 Kovariance... zobecnění rozptylu cov(x, Y ) = E(X µ X )(Y µ Y ). Pearsonův korelační koeficient ( X µx ρ X,Y = cov, Y µ ) Y = cov(x, Y ). σ Y var X var Y σ X... normovaná kovariance Výběrový korelační koeficient r XY = 1 ρ X,Y 1 (Xi X )(Y i Ȳ ) (Xi X ) 2 (Y i Ȳ )2.

Korelační koeficient 60 / 76 Vyjadřuje míru lineární závislosti.

Co korelace je/není 61 / 76 Nemá kategorie ANO/NE (korelují/nekorelují) - je to míra korelace Vyjadřuje míru lineární závislosti, na jiné není citlivý Lineární závislost nepopíše (nedá rovnici pro přímku) Nezachycuje složitější formy závislosti (více veličin) Test: H 0 : ρ XY = 0 H 1 : ρ XY 0 Možno použít pro normálně rozdělené náhodné veličiny. Neparametrická analogie: Spearmanův korelační koeficient (založen na pořadí)

Regrese 62 / 76 Odhadne rovnici pro přímku v případě lineární závislosti.

Kde korelace nestačí Příklad U mladých mužů vyšetřujeme závislost procenta tuku na výšce. Avšak procento tuku závisí zajisté i na hmotnosti. 63 / 76

Kde korelace nestačí 64 / 76 Zkoumat závislost procenta tuku na výšce bez uvážení hmotnosti postrádá smysl (ve většině případů). Při zkoumání závislosti procenta tuku na výšce adjustujeme na hmotnost Jak při dané hmotnosti závisí procento tuku na výšce? Hmotnost je matoucí (confounding) proměnná.

Kde korelace nestačí 65 / 76 Regrese se pokouší najít rovnici: V našem příkladě Výsledek EY = β 0 + β 1 x 1 + + β p x p, E tuk = β 0 + β 1 výška + β 2 hmotnost. E tuk = 11, 327 0, 262 výška + 0, 624 hmotnost, S rostoucí výškou při dané hmotnosti klesá procento tuku. Konkrétně: při pevně stanovené hmotnosti s každým centimetrem je procento tuku o 0,262 menší.

Zavádějící faktor (confounding) 66 / 76 Vztah mezi konzumací kávy a rakovinou plic u žen Studie případů a kontrol (nemocnice na Bulovce) Poměr šancí (odds ratio): Pití kávy Onemocnění Celkem Ano Ne Denně 221 653 874 Zřídka 61 193 254 Celkem 282 846 1128 ÔR = 221 653 61 193 = 1, 7 Interval spolehlivosti pro ÔR: (0, 76; 1, 51)

Avšak musíme vzít v úvahu vliv kouření. Kouření má vliv na výskyt rakoviny plic Osoby, které pijí kávu, také často kouří Kuřačky Pití kávy Onemocnění Celkem Ano Ne Denně 189 305 494 Zřídka 36 41 77 Celkem 225 346 571 ÔR = 0, 71 int.spol. (0, 42; 1, 18) Nekuřačky Pití kávy Onemocnění Celkem Ano Ne Denně 32 348 380 Zřídka 25 152 177 Celkem 57 500 557 ÔR = 0, 56 int.spol. (0, 31; 1, 02) Sumární poměr šancí: 0,64 67 / 76

68 / 76 Kouření je asociováno s rakovinou. Kouření Případy Kontroly Celkem Ano 225 346 571 Ne 57 500 557 Celkem 282 846 1128 ÔR = 5, 70 (4, 08; 8, 00) Kouření je asociováno s pitím kávy. Pití kávy Kouření Denně Zřídka Celkem Ano 305 41 346 Ne 348 152 500 Celkem 653 193 846 ÔR = 3, 25 (2, 18; 4, 85)

Simpsonův paradox 69 / 76 Šance výskytu rakoviny plic v závislosti na konzumaci kávy při současné kontrole vlivu kouření a bez kontroly

Slováček, L.: Transplantace krvetvorných buněk a kvalita života. Triton, 2008 70 / 76

71 / 76

Časté chyby v používání statistiky (příklady) 72 / 76 Nevhodný nebo nepromyšlený design studie, malá velikost výběru (malá síla) Špatné rozdělení do skupin (randomizace, nevhodná kontrolní skupina), matoucí faktory Non-response, vyloučení ze studie Použití nevhodného přístupu/testu pro danou hypotézu Nesplnění předpokladů pro použití testu (parametrické testy, např. ANOVA) Mnohonásobné testování Data torturing ( If you torture your data long enough, they will tell you whatever you want to hear. ) Nedostačující prezentace výsledků, chybné interpretace...

Plánování studie 73 / 76 Nelze sesbírat data, a potom teprve hledat, jaké metody analýzy použít. Při plánování studie je mimo jiné třeba: Formulovat na základě medicínské hypotézy hypotézu statistickou Navrhnout efektivní design studie Určit optimální velikost výběru Naplánovat vlastní statistickou analýzu (apriori)

Sběr dat 74 / 76 Malá studie: např. Excel Velká studie: speciální software Ulehčení práce, vyvarování se chybám, překlepům

Měření 75 / 76 Lépe několik konkrétních znaků, které opravdu potřebujeme znát, než desítky měření (odvádí pozornost) Problém chybějících pozorování ( děravá data někdy téměř nepoužitelná) Forma záznamu (kódování), přesnost,...

Literatura 76 / 76 Zvára, K.: Biostatistika. Karolinum, Praha, 2003 Zvárová, J.: Základy statistiky pro biomedicínské obory. Karolinum, Praha, 2002