1 / 76 Méně než minimum ze statistiky Michaela Šedová KPMS MFF UK Principy medicíny založené na důkazech a základy vědecké přípravy
Příklad Studie syndromu náhodného úmrtí dětí. Dvě skupiny: Děti, které byly nalezeny téměř mrtvé, bez známek života. Všechna další vyšetření negativní, zotavily se během několika dnů.... téměř ztracené Normální děti LTV... dlouhodobá proměnlivost tepové frekvence (rozdíl mezi min. a max. hodnotami novorozenecké tepové frekvence). Téměř 5.0, 7.0, 7.67, 8.17, 8.33, 8.83, 9.17, 9.33, 9.33, ztracené 9.67, 11.0,11.67, 13.33, 13.83, 14.17, 15.17, 15.50, 17.33, 18.0, 20.60, 21.17, 22.33, 22.67, 23.00, 24.67 Normální 11.33, 13.67, 14.33, 17.33, 17.83, 19.0, 20.67, 22.33, 27.83, 29.0, 31.17, 31.33, 32.0, 32.5, 35.0 Liší se téměř ztracené děti od normálních z hlediska LTV? 2 / 76
Statistika 3 / 76 Rozlišení LTV mezi skupinami není jednoznačné: téměř ztracené děti : (5,00 24,67) normální děti: (11,33 35,00) Liší se alespoň v průměru? (13,70 resp. 23,69) Je tento rozdíl pouze náhodný, nebo zde existuje nějaké systematické posunutí?
Statistika 4 / 76 Popisná (deskriptivní) Určitým způsobem popisuje nebo shrnuje data, která máme Popisné chrakteristiky (průměr, medián,... ), grafy (histogram, krabicový diagram, bodový graf,... ) Omezuje svá tvrzení na daná data, nečiní si nárok zobecňovat, dělat závěry Induktivní Na základě dat se snaží zobecnit pozorování na větší soubor, populaci Pracuje s náhodou, odhady, testy Velkou roli zde hraje správná interpretace Ve většině prací se setkáme s obojím.
Měřítko 5 / 76 Na statistických jednotkách sledujeme jejich vlastnosti - hodnoty znaků ve zvoleném měřítku Kvalitativní (zpravidla vyjádřené slovem, znakem,... ) nula-jedničkové (jev nastal/nenastal, pacient přežil/nepřežil) nominální (několik kategorií, např. krevní skupina, pohlaví - faktor) ordinální (kategorie jsou jistým způsobem řezené, např. bolest je silná, mírná, žádná) Kvantitativní (vyjádřené číslem) intervalové (spojité, nabývají hodnoty z nějakého intervalu, např. výška, LTV) diskrétní (ordinální, počet pacientů, kteří navštíví ambulanci během jednoho dne)
Pravděpodobnost I 6 / 76 Náhodný pokus - pokus, jehož výsledek není předem určený Náhodný jev - výsledek náhodného pokusu Pravděpodobnost náhodného jevu A, P(A) - míra častosti výskytu jevu A, naděje, že nastane 0 P(A) 1
Pravděpodobnost II 7 / 76 Klasická definice pravděpodobnosti n stejně pravděpodobných elementárních jevů ω 1, ω 2,..., ω n z toho m elementárních jevů příznivých jevu A P(A) = m n Např. hod kostkou A... padne sudé číslo Elementární jevy: padne 1,2,3,4,5,6, všechny s pravděpodobností 1 6 P(A) = 3 6 = 1 2 Ovšem máme-li spojitý znak, tato definice nestačí. Potřebujeme obecnější koncept.
Náhodná veličina 8 / 76 Číselně vyjádřený výsledek náhodného pokusu. Teoretický pojem. Nevíme výsledek, známe jenom možné hodnoty a jejich pravděpodobnosti (rozdělení). Např. náhodná veličina je LTV obecně. Její realizace: naměříme ji u konkrétního dítěte. Populace (nekonečná) Náhodná veličina X Příště Výběr Výběr pozorování x 1,... x n Výběr Jiná pozorování x 1,... x n
Rozdělení náhodné veličiny 9 / 76 Diskrétní Model pro počty případů Dané pravděpodobnosti hodnot Např. P(nově narozené dítě je chlapec)=0,52, P(nově narozené dítě je dívka)=0,48 Spojité Např. Normální (Gaussovo), X N(µ, σ 2 ) f(x) 0.0 0.1 0.2 0.3 0.4 4 2 0 2 4 x
Normální rozdělení 10 / 76 Tzv. Gaussova křivka je hustota (vyjádřena přesným matematickým vzorcem) Určuje s jakou pravděpodobností může náhodná veličina X nabýt hodnoty z daného intervalu To je dáno plochou pod křivkou f(x) 0.0 0.1 0.2 0.3 0.4 4 3 2 1 0 1 2 3 4 x
Normální rozdělení II Má dva parametry Střední hodnota µ - určuje bod, kolem kterého je tato hustota symetrická Rozptyl σ 2 - určuje jak moc jsou hodnoty rozpýlené kolem tohoto bodu N(0,1) N(1,1) N(0,2) f(x) 0.0 0.1 0.2 0.3 0.4 4 2 0 2 4 x f(x) 0.0 0.1 0.2 0.3 0.4 4 2 0 2 4 x f(x) 0.0 0.1 0.2 0.3 0.4 4 2 0 2 4 x 11 / 76
Jiná spojitá rozdělení 12 / 76 Avšak normální rozdělení není zdaleka jediné spojité rozdělení. Rovnomìrné, Ro[0,1] Exponenciální, Exp(1) f(x) 0.0 1.0 2.0 f(x) 1 0 µ 1 2 0 µ 2 4 6 8 0.0 0.4 0.8 a) b) Studentovo, 5 st. volnosti χ 2, 5 st. volnosti f(x) 0.0 0.2 4 2 0 2 4 c) f(x) 0.00 0.10 0 5 10 15 20 d)
Charakteristiky rozdělení 13 / 76 Střední hodnota (expectation, mean value) Diskrétní rozdělení Vážený průměr - váhy pravděpodobnosti, s jakými nabýváme daných hodnot Spojité rozdělení Funkci vah plní hustota µ = EX = x 1 p 1 + x 2 p 2 + + x n p n EX = xf (x)dx
Charakteristiky rozdělení II 14 / 76 Rozptyl (variance) Lze říci, že je to průměrná druhá mocnina odchylky hodnot od střední hodnoty Diskrétní rozdělení σ 2 = var (X ) = E(X EX ) 2. σ 2 = var (X ) = (x 1 µ) 2 p 1 + (x 2 µ) 2 p 2 + + (x n µ) 2 p n. σ... směrodatná odchylka (standard deviation, SD), něco jiného než směrodatná chyba (standard error, SE), viz dále
Jiná spojitá rozdělení 15 / 76 Rovnomìrné, Ro[0,1] Exponenciální, Exp(1) f(x) 0.0 1.0 2.0 f(x) 1 0 µ 1 2 0 µ 2 4 6 8 0.0 0.4 0.8 a) b) Studentovo, 5 st. volnosti χ 2, 5 st. volnosti f(x) 0.0 0.2 4 2 0 2 4 c) f(x) 0.00 0.10 0 5 10 15 20 d)
Další charakteristiky 16 / 76 Kvantily Medián x... číslo, které oddělí polovinu možných hodnot P(X x) = 1 2 Kvartily... čísla, která oddělí čtvrtiny možných hodnot Dolní kvartil q 1... P(X q 1 ) = 1 4 Horní kvartil q 3... P(X q 3 ) = 3 4 Decily (desetiny), percentily (setiny)
Popisná statistika 17 / 76 Shrnuje to, co máme v datech. První, ne však jediný krok k tomu, abychom mohli něco usoudit o dané náhodné veličině. Míry polohy Průměr x = x 1 + x 2 + + x n n (Výběrový) medián... prostřední hodnota { x[ n+1 x = 2 ] n liché 1 2 (x [ n 2 ] + x [ n 2 +1] ) n sudé, (Výběrové) kvartily... analogicky
Grafické znázornění dat 18 / 76 Krabicový diagram (boxplot) Znázornění rozdělení spojité veličiny Medián... příčka obdélníka Horní resp. dolní kvartil - kratší strany obdélníka Tykadla - od kvartilu k minimu resp. maximu, pokud není odlehlé Odlehlé pozorování - je dál, než zpravidla 3 2 (q 3 q 1 ) 5 10 15 20
Krabicový diagram 19 / 76 Příklad Znázornění dat o LTV pro téměř ztracené děti. Nevykreslovat jednotlivá pozorování (zvlášt u objemnějších dat nepřehledné), ale krabicový diagram. LTV 5 10 15 20 25 Bodový graf LTV Krabicový diagram 5 10 15 20 25
Grafické znázornění dat Histogram - znázornění intervalových četností spojité veličiny Rozmezí všech možných hodnot (osa x) rozdělíme na malé intervaly, ke každému spočítáme, kolik pozorování do něj padne, to vyneseme na osu y Data: 1.48, 1.11 1.00, 0.62, 0.59, 0.55, 0.51 0.48, 0.39, 0.28, 0.26, 0.18 0.00, 0.06, 0.24, 0.24 0.68, 0.97 1.29, 1.45 Histogram of x Frequency 0 1 2 3 4 5 1.5 1.0 0.5 0.0 0.5 1.0 1.5 x 20 / 76
Histogram Druhá možnost: vynést na osu y relativní četnosti (počet pozorování v intervalu dělený celk. počtem pozorování). Při dostatečném počtu pozorování aproximuje hustotu rozdělení Data z rozdělení N(0, 1). Histogram of x Histogram of x Frequency 0 5 10 15 20 Density 0.0 0.2 0.4 2 1 0 1 2 2 1 0 1 2 21 / 76
Další grafy 22 / 76 Bar plot Grafické znázorněné četností (počtů hodnot) kvalitativního znaku Příklad Zjistili jsme krevní skupinu ve vzorku 100 pacientů. 0 A B AB 28 36 27 9
Induktivní statistika 23 / 76 Snažíme se zobecnit to, co pozorujeme na konkrétních stat. jednotkách. Odhadnout parametry (vlastnosti) rozdělení náhodné veličiny. Odhadem střední hodnoty je zpravidla průměr Odhadem rozptylu je zpravidla výběrový rozptyl atd. Kdybychom však daný pokus opakovali, dostaneme určitě jiný průměr, tj. jiný odhad střední hodnoty. Proto nás zajímá přesnost našeho bodového odhadu, tj. představa, jak jsme nanejvýš daleko od skutečné střední hodnoty.
Odhad střední hodnoty Sledujeme náhodnou veličinu, která má v populaci rozdělení X N(23, 8 2 ). 3 náhodné výběry o rozsahu 10, 50 a 1000. Histogram of x1 Density 0.00 0.06 5 10 15 20 25 30 35 40 x1 Histogram of x2 Density 0.00 0.04 5 10 15 20 25 30 35 40 x2 Histogram of x3 Density 0.00 0.03 5 10 15 20 25 30 35 40 x3 24 / 76
25 / 76 Průměr: x 1 = 20, 17 x 2 = 22, 69 x 3 = 23, 14 Průměr je tedy také náhodná veličina... Naštěstí známe její vlastnosti: Je-li X N(µ, σ 2 ) a máme-li výběr o velikosti n X N(µ, σ2 n ) Průměr kolísá kolem skutečné střední hodnoty µ, je jejím odhadem. Známe-li jenom průměr, moc to nepomůže, protože nevíme, jak daleko je tento odhad od skutečné střední hodnoty. σ n... směrodatná chyba (standard error, SE), SD průměru
Interval spolehlivosti 26 / 76 Kromě bodového odhadu střední hodnoty vhodné uvádět i intervalový odhad. Interval, který pokryje skutečnou střední hodnotu s předem stanovenou pravděpodobností Většinou se volí 95 % nebo 90 %, případně 99 %. Lze ukázat, že 95% interval spolehlivosti je ( x 1, 96 σ n, x + 1, 96 σ n ). z = 1, 96 kritická hodnota standardizovaného normálního rozdělení
Kritická hodnota Kritická hodnota standardizovaného normálního rozdělení, tj. 97,5% kvantil. z = 1, 96 f(x) 0.0 0.1 0.2 0.3 0.4 95% 2.5% 2.5% 4 3 2 1 0 1 2 3 4 x 27 / 76
Interval spolehlivosti 28 / 76 Směrodatnou odchylku však většinou neznáme, nahrazujeme ji proto odhadem s. Lze ukázat, že 95% interval spolehlivosti pak je x ± t(n 1) s n t(n 1)... kritická hodnota studentova rozdělení o n 1 stupních volnosti. Studentovo rozdělení... podobné normálnímu, pro větší n (> 100) téměř identické.
Příklad 29 / 76 Intervalové odhady v předchozím příkladě vyšly následovně: 1.výběr: (15,28, 25,07) 2.výběr: (20,55, 24,82) 3.výběr: (22,64, 23,64) Čím více pozorování, tím užší interval spolehlivosti (přesnější odhad) Čím menší směrodatná odchylka, tím užší interval spolehlivosti (přesnější odhad) Čím menší přesnost požadujeme, tím...?
Testování hypotéz 30 / 76 Nulová hypotéza Formulujeme hypotézu o hodnotě parametru (často právě o střední hodnotě). Např. Střední hodnota LTV u téměř ztracených dětí je stejná jako u zdravých. Zpravidla je to opak toho, co chceme ukázat. Alternativní hypotéza Je doplňkem nulové. Tj. žádná jiná hodnota parametru (než která je obsažena v těchto dvou hypotézách) nepřichází v úvahu. Např. Střední hodnoty LTV u téměř ztracených dětí a u zdravých se liší.
Možná rozhodnutí 31 / 76 Hypotézu otestujeme na datech. Avšak musíme ohlídat náhodu. Předem si stanovíme hladinu testu α, tedy pravděpodobnost, se kterou si dovolíme udělat chybný závěr. Většinou α = 5 %. Rozhodnutí Skutečnost H 0 zamítneme H 0 nezamítneme H 0 platí Chyba 1. druhu (α) Správné rozhodnutí H 0 neplatí Správné rozhodnutí Chyba 2. druhu (β) Nemůžeme minimalizovat obě (jsou proti sobě). Proto fixujeme α, tradičně α = 5 %, β už je tím dané. Sílu testu (1 β) můžeme ovlivnit velikostí výběru.
Logika testování 32 / 76 Test Předpokládáme, že platí H 0. Z dat spočítáme testovou statistiku (např. průměr). Spočítáme pravděpodobnost, že bychom za H 0 pozorovali naše data nebo data stejně či více extrémní.... dosažená hladina významnosti, p hodnota Pokud p hodnota α, H 0 zamítáme, jinak H 0 nezamítáme.
Jednovýběrový t-test 33 / 76 H 0 : µ = µ 0 H 1 : µ µ 0 Testová statistika T = X µ 0 s n Velké hodnoty T vypovídají proti H 0 : Porovnáme s kritickou hodnotou. Zamítáme, je-li T > t n 1 ( α 2 ). Pro velké n nahrazujeme t n 1 ( α 2 ) kvantilem normálního rozdělení z( α 2 ). Předpoklady rozdělení sledované veličiny je blízké normálnímu nezávislá pozorování
Jednovýběrový t-test Příklad Naměřili jsme LTV pouze u téměř ztracených dětí. Předpokládejme, že víme, že střední hodnota LTV u zdravých dětí je 23. Je možné říci, že se téměř ztracené děti z hlediska LTV liší od normálních? H 0 : µ = 23 H 1 : µ 23 T = 13, 7 23 5,82 26 = 8, 13 T < t 25 (0, 025) = 2, 06 zamítáme H 0. Software, publikace: uvádí se p-hodnota, v tomto případě p = 1, 7 10 8 < 0, 001. Lepší, než uvést pouze výsledek testu. Dává představu, jak daleko jsme od kritické hodnoty. 34 / 76
Jednostranný t-test 35 / 76 Předpokládejme však, že bychom už předem veděli, že téměř ztracené děti rozhodně nemohou mít LTV větší než děti zdravé. H 0 : µ = µ 0 H 1 : µ < µ 0 Testová statistika stejná T = X µ 0 s, n avšak sledujeme pouze, o kolik je průměr menší než střední hodnota. Malé hodnoty T vypovídají proti H 0 ; zamítáme, je-li T < t n 1 (α). Předpoklady stejné jako u oboustranného t-testu. Je silnější, protože reflektuje apriorní informaci. Ta ale musí být podložená. Nelze nejprve zjistit hodnotu T statistiky, a potom volit typ t-testu.
Dvouvýběrový t-test 36 / 76 Příklad Naměřili jsme LTV u skupiny téměř ztracených dětí a u skupiny normálních dětí. Je možné říci, že se LTV v těchto dvou skupinách v průměru liší? H 0 : µ A = µ B H 1 : µ A µ B Testová statistika T = X A X B var( X A X B ) = X A X B na n B s n A + n B Velké hodnoty T vypovídají proti H 0. Porovnáme s kritickou hodnotou. Zamítáme, je-li T > t na +n B 2( α 2 ).
Dvouvýběrový t-test 37 / 76 Předpoklady Nezávislá pozorování (mezi skupinami i uvnitř skupin) Rozdělení sledované veličiny je v každé skupině blízké normálnímu V obou skupinách je shodný rozptyl Pokud tyto předpoklady nejsou splněny, nelze t-test použít! Je nutné použít jiné nástroje, např. existuje úprava t-testu, která nevyžaduje shodnost rozptylů.
Dvouvýběrový t-test Příklad Naměřili jsme LTV u skupiny téměř ztracených dětí a u skupiny normálních dětí. Je možné říci, že se LTV v těchto dvou skupinách v průměru liší? H 0 : µ A = µ B H 1 : µ A µ B x A = 13,70 x B = 23,69 T = 4, 62 T < t 39 (0, 025) = 2, 02 zamítáme H 0. p = 4, 09 10 5 < 0, 001 Pozn.: Dvouvýběrový t-test má také jednostrannou a oboustrannou verzi. 38 / 76
Párový t-test Příklad U každého z pacientů byl zjištěn krevní tlak před podáním a dvě hodiny po podání farmaka. Ovlivňuje podání farmaka krevní tlak? Naměřené hodnoty před: 206, 205, 205, 198, 191, 185,186, 172, 168, 165, 158 Naměřené hodnoty po: 187, 178, 202, 197, 173, 167, 184, 166, 155, 125, 162 H 0 : µ pred = µ po H 1 : µ pred µ po X pred = 185, 36 Xpo = 172, 36 Použijeme dvouvýběrový t-test: p-hodnota=0,07 39 / 76
Párový t-test Příklad U každého z pacientů byl zjištěn krevní tlak před podáním a dvě hodiny po podání farmaka. Ovlivňuje podání farmaka krevní tlak? Naměřené hodnoty před: 206, 205, 205, 198, 191, 185,186, 172, 168, 165, 158 Naměřené hodnoty po: 187, 178, 202, 197, 173, 167, 184, 166, 155, 125, 162 H 0 : µ pred = µ po H 1 : µ pred µ po X pred = 185, 36 Xpo = 172, 36 Použijeme dvouvýběrový t-test: p-hodnota=0,07 CHYBA! 40 / 76
Párový t-test 41 / 76 Pozorování před a po závislá (dvojice měření na jednom jedinci). Záležitost designu studie. Definujeme rozdíly D i = Pred i Po i, na ně použijeme jednovýběrový t-test. H 0 : µ d = µ pred µ po = 0 H 1 : µ d = µ pred µ po 0 X d 0 n s d = 13 0 = 3, 29, 13,09 11 p-hodnota = 0, 004 zamítáme H 0
ANOVA Příklad 20 pacientů, kteří podstoupili operaci srdce, bylo náhodně rozděleno do tří skupin. 50% oxidu dusného a 50% kyslíkové směsi 24 hodin 50% oxidu dusného a 50% kyslíkové směsi během operace a 35 50% kyslíku 24 hodin? Koncentrace soli kyseliny listové v červených krvinkách? 42 / 76
ANOVA 43 / 76 Bodový graf koncentrace soli kyseliny listové v jednotlivých skupinách Koncentrace 200 250 300 350 1 2 3 skupina
ANOVA 44 / 76 První nápad: Porovnat všechny dvojice dvouvýběrovými t-testy. Skupina 1 vs Skupina 2 Skupina 1 vs Skupina 3 Skupina 2 vs Skupina 3
ANOVA 45 / 76 První nápad: Porovnat všechny dvojice dvouvýběrovými t-testy. Skupina 1 vs Skupina 2 Skupina 1 vs Skupina 3 Skupina 2 vs Skupina 3 Problém: Má-li každý test pravděpodobnost chybného pozitivního výsledku 5 %, výsledná pravděpodobnost, že dostaneme alespoň jeden chybný pozitivní výsledek je větší než 5 % (cca 14 %). Pozn.: Problém mnohonásobného testování je obecnější...
ANOVA 46 / 76 H 0 : µ 1 = µ 2 = µ 3 H 1 : neplatí H 0 (Alespoň jedna skupina se liší) Testová statistika porovnává variabilitu mezi skupinami a variabilitu uvnitř skupin. F = Velké hodnoty F svědčí proti H 0. Předpoklady: variabilita mezi skupinami variabilita uvnitř skupin. nezávislá pozorování (mezi skupinami i uvnitř skupin) rozdělení sledované veličiny je v každé skupině blízké normálnímu ve všech skupinách je shodný rozptyl
ANOVA Příklad 20 pacientů, kteří podstoupili operaci srdce, bylo náhodně rozděleno do tří skupin. 50% oxidu dusného a 50% kyslíkové směsi 24 hodin 50% oxidu dusného a 50% kyslíkové směsi během operace a 35 50% kyslíku 24 hodin? Koncentrace soli kyseliny listové v červených krvinkách? p-hodnota= 0,015 zamítáme H 0. Která skupina se však liší od které? 47 / 76
Bonferroniho korekce 48 / 76 Která skupina se však liší od které? Provedeme porovnání všech dvojic skupin dvouvýběrovým t-testem. Avšak použijeme Bonferroniho korekci - za signifikantní považujeme výsledek, kdy je. p < α počet skupin Skupina 1 vs Skupina 2: p = 0, 006 < 0, 0167 Skupina 1 vs Skupina 3: p = 0, 095 > 0, 0167 Skupina 2 vs Skupina 3: p = 0, 368 > 0, 0167 Významný rozdíl je mezi průměry skupin 1 a 2, ale ne mezi ostatními.
ANOVA 49 / 76 Bodový graf koncentrace soli kyseliny listové v jednotlivých skupinách Koncentrace 200 250 300 350 1 2 3 skupina
Wilcoxonův test 50 / 76 Neparametrická analogie t-testu. Použijeme, pokud není splněn předpoklad o normálním rozdělení dat (ale spojité). H 0 : Medián x = 0 H 1 : Medián x 0 Postup Určíme pořadí R + i hodnot X i. Určíme součet těch pořadí, kde bylo X i > 0, označíme jej W. Položíme Z = W n(n + 1)/4 n(n + 1)(2n + 1)/24
Neparametrické analogie parametrických testů 51 / 76 rozdělení normální spojité parametr střední hodnota medián jeden jednovýběrový jednovýběrový výběr t-test Wilcoxon výběr dvojic párový t-test Wilcoxon dva nezávislé dvouvýběrový Mann-Whitney výběry t-test (Kolmogorov-Smirnov) k nezávislých analýza rozptylu Kruskal-Wallis výběrů (ANOVA)
Analýza kategoriálních dat Příklad Ve vyšetřované populaci jsou krevní skupiny 0, A, B a AB v poměru 35 %, 35 %, 20 % a 10 %. Ve vzorku pacientů byly počty osob s krevními skupinami po řadě 28, 36, 27, 9. Lze považovat tento výběr za reprezentativní vzhledem k výskytu krevních skupin? Zde testujeme rozdělení kategorického znaku. 52 / 76
Analýza kategoriálních dat 53 / 76 H 0 : Kategorický znak má předpokládané rozdělení. H 1 : Kategorický znak nemá předpokládané rozdělení. Testová statistika porovnává napozorované četnosti (N 1, N 2,..., N k ) jednotlivých kategorií (je jich k) s teoretickými. Teoretické pravděpodobnosti: π 1, π 2,..., π k Teoretické četnosti pro n pozorování: nπ 1, nπ 2,..., nπ k χ 2 = (N 1 n π 1 ) 2 n π 1 + (N 2 n π 2 ) 2 n π 2 + + (N k n π k ) 2 n π k Velké hodnoty mluví proti H 0. Testovou statistiku porovnáváme s kritickou hodnotou χ 2 k 1 (α).
Test dobré shody Příklad Ve vyšetřované populaci jsou krevní skupiny 0, A, B a AB v poměru 35 %, 35 %, 20 % a 10 %. Ve vzorku pacientů byly počty osob s krevními skupinami po řadě 28, 36, 27, 9. Lze považovat tento výběr za reprezentativní vzhledem k výskytu krevních skupin? χ 2 = (28 35)2 35 + (36 35)2 35 + (27 20)2 20 + (9 10)2 35 = 3, 98 p-hodnota=0,24 nezamítáme H 0. 54 / 76
Nezávislost dvou kategorických znaků Příklad Očkování proti chřipce se účastnilo 460 dospělých. 240 dostalo očkovací látku, 220 placebo. Chřipkou onemocnělo 20 z očkovací skupiny a 80 z kontrolní skupiny. Je to dostatečný důkaz o tom, že je očkovací látka účinná? Sestavíme kontingenční tabulku Chřipka Očkování Placebo Celkem Ano 20 80 100 Ne 220 140 360 Celkem 240 220 460 55 / 76
Nezávislost dvou kategorických znaků 56 / 76 H 0 : Dva znaky jsou na sobě nezávislé. H 1 : Dva znaky nejsou nezávislé. Testová statistika porovnává napozorované četnosti v kontingenční tabulce (r s) s očekávanými: Očekávaná četnost = součet v řádku součet ve sloupci celkový počet pozorování χ 2 = (pozorovaná četnost očekávaná četnost) 2 očekávaná četnost Velké hodnoty mluví proti H 0. Testovou statistiku porovnáváme s kritickou hodnotou χ 2 (r 1)(s 1) (α).
Nezávislost dvou kategorických znaků 57 / 76 Chřipka Očkování Placebo Celkem Ano 20 80 100 Ne 220 140 360 Celkem 240 220 460 χ 2 = (20 52, 2)2 + 52, 2 (80 47, 8)2 + 47, 8 (220 187, 8)2 (140 172, 2)2 + 187, 8 172, 2 p-hodnota= 7, 63 10 13 < 0, 001 zamítáme H 0.!Tento test je možné použít jsou-li všechny napozorované četnosti 5!
Korelace 58 / 76 Závislost znaků kategorický vs spojitý kategorický vs kategorický spojitý vs spojitý
Korelace 59 / 76 Kovariance... zobecnění rozptylu cov(x, Y ) = E(X µ X )(Y µ Y ). Pearsonův korelační koeficient ( X µx ρ X,Y = cov, Y µ ) Y = cov(x, Y ). σ Y var X var Y σ X... normovaná kovariance Výběrový korelační koeficient r XY = 1 ρ X,Y 1 (Xi X )(Y i Ȳ ) (Xi X ) 2 (Y i Ȳ )2.
Korelační koeficient 60 / 76 Vyjadřuje míru lineární závislosti.
Co korelace je/není 61 / 76 Nemá kategorie ANO/NE (korelují/nekorelují) - je to míra korelace Vyjadřuje míru lineární závislosti, na jiné není citlivý Lineární závislost nepopíše (nedá rovnici pro přímku) Nezachycuje složitější formy závislosti (více veličin) Test: H 0 : ρ XY = 0 H 1 : ρ XY 0 Možno použít pro normálně rozdělené náhodné veličiny. Neparametrická analogie: Spearmanův korelační koeficient (založen na pořadí)
Regrese 62 / 76 Odhadne rovnici pro přímku v případě lineární závislosti.
Kde korelace nestačí Příklad U mladých mužů vyšetřujeme závislost procenta tuku na výšce. Avšak procento tuku závisí zajisté i na hmotnosti. 63 / 76
Kde korelace nestačí 64 / 76 Zkoumat závislost procenta tuku na výšce bez uvážení hmotnosti postrádá smysl (ve většině případů). Při zkoumání závislosti procenta tuku na výšce adjustujeme na hmotnost Jak při dané hmotnosti závisí procento tuku na výšce? Hmotnost je matoucí (confounding) proměnná.
Kde korelace nestačí 65 / 76 Regrese se pokouší najít rovnici: V našem příkladě Výsledek EY = β 0 + β 1 x 1 + + β p x p, E tuk = β 0 + β 1 výška + β 2 hmotnost. E tuk = 11, 327 0, 262 výška + 0, 624 hmotnost, S rostoucí výškou při dané hmotnosti klesá procento tuku. Konkrétně: při pevně stanovené hmotnosti s každým centimetrem je procento tuku o 0,262 menší.
Zavádějící faktor (confounding) 66 / 76 Vztah mezi konzumací kávy a rakovinou plic u žen Studie případů a kontrol (nemocnice na Bulovce) Poměr šancí (odds ratio): Pití kávy Onemocnění Celkem Ano Ne Denně 221 653 874 Zřídka 61 193 254 Celkem 282 846 1128 ÔR = 221 653 61 193 = 1, 7 Interval spolehlivosti pro ÔR: (0, 76; 1, 51)
Avšak musíme vzít v úvahu vliv kouření. Kouření má vliv na výskyt rakoviny plic Osoby, které pijí kávu, také často kouří Kuřačky Pití kávy Onemocnění Celkem Ano Ne Denně 189 305 494 Zřídka 36 41 77 Celkem 225 346 571 ÔR = 0, 71 int.spol. (0, 42; 1, 18) Nekuřačky Pití kávy Onemocnění Celkem Ano Ne Denně 32 348 380 Zřídka 25 152 177 Celkem 57 500 557 ÔR = 0, 56 int.spol. (0, 31; 1, 02) Sumární poměr šancí: 0,64 67 / 76
68 / 76 Kouření je asociováno s rakovinou. Kouření Případy Kontroly Celkem Ano 225 346 571 Ne 57 500 557 Celkem 282 846 1128 ÔR = 5, 70 (4, 08; 8, 00) Kouření je asociováno s pitím kávy. Pití kávy Kouření Denně Zřídka Celkem Ano 305 41 346 Ne 348 152 500 Celkem 653 193 846 ÔR = 3, 25 (2, 18; 4, 85)
Simpsonův paradox 69 / 76 Šance výskytu rakoviny plic v závislosti na konzumaci kávy při současné kontrole vlivu kouření a bez kontroly
Slováček, L.: Transplantace krvetvorných buněk a kvalita života. Triton, 2008 70 / 76
71 / 76
Časté chyby v používání statistiky (příklady) 72 / 76 Nevhodný nebo nepromyšlený design studie, malá velikost výběru (malá síla) Špatné rozdělení do skupin (randomizace, nevhodná kontrolní skupina), matoucí faktory Non-response, vyloučení ze studie Použití nevhodného přístupu/testu pro danou hypotézu Nesplnění předpokladů pro použití testu (parametrické testy, např. ANOVA) Mnohonásobné testování Data torturing ( If you torture your data long enough, they will tell you whatever you want to hear. ) Nedostačující prezentace výsledků, chybné interpretace...
Plánování studie 73 / 76 Nelze sesbírat data, a potom teprve hledat, jaké metody analýzy použít. Při plánování studie je mimo jiné třeba: Formulovat na základě medicínské hypotézy hypotézu statistickou Navrhnout efektivní design studie Určit optimální velikost výběru Naplánovat vlastní statistickou analýzu (apriori)
Sběr dat 74 / 76 Malá studie: např. Excel Velká studie: speciální software Ulehčení práce, vyvarování se chybám, překlepům
Měření 75 / 76 Lépe několik konkrétních znaků, které opravdu potřebujeme znát, než desítky měření (odvádí pozornost) Problém chybějících pozorování ( děravá data někdy téměř nepoužitelná) Forma záznamu (kódování), přesnost,...
Literatura 76 / 76 Zvára, K.: Biostatistika. Karolinum, Praha, 2003 Zvárová, J.: Základy statistiky pro biomedicínské obory. Karolinum, Praha, 2002