Základy biostatistiky

Základy biostatistiky Veřejné zdravotnictví 3.LF UK Viktor Hynčica

Úvod se statistikou se setkáváme denně ankety proč se statistika začala používat ve zdravotnictví skupinový přístup k léčení celé populace převedení individuelní zdravotní péče na péči o zdraví celé společnosti podpora a ochrana zdraví preventivní funkce mediciny nutno pracovat s jevy charakterizovanými hromadnou povahou je potřeba metoda studia hromadných jevů - k tomu slouží statistika

Historie statistiky starověk soupis národního bohatství statistika ve funkci výkaznictví sociálněekonomických ukazatelů Český statistický úřad ročenka 17.stol. pravděpodobnost ovlivnila statistiku B.Pascal, Bernoulli, Laplace, Poisson 1900 vzniká matematická statistika první práce Pearson, Yule, R.A.Fisher

Matematická statistika Věda zabývající se studiem hromadných náhodných jevů - hromadná pozorování, výsledky opakovaných pokusů plánování, sběr, zpracování, analýza a využití pro předpovědi a rozhodování Užití v medicině, biologii - biostatistika Cílem matematické statistiky - popis populace jako celku, analýza obecných vztahů Hromadné náhodné jevy onemocnění na chřipku, přežívání, Statistika umožňuje na základě výsledků pozorování formulovat obecné závěry oproštěné od subjektivních pohledů Spolehlivost či nespolehlivost se vyjadřuje pomocí pravděpodobnosti

Základní statistické pojmy Deskriptivní statistika Uspořádání souboru pozorování Popis a účelná sumarizace Vyjádření výsledků pomocí tabulek a grafů Výpočet charakteristik Induktivní statistika Poskytuje metody,které umožňují z empirických poznatků formulovat obecné závěry Induktivní myšlení x deduktivní myšlení

Základní soubor x výběrový soubor Úplné, vyčerpávající šetření není potřeba indukce - sčítání lidu Většinou úplné šetření není možné ekonomické důvody, rozsáhlost zákl.souboru (nekonečný), praktické důvody. výběrový soubor Musí být reprezentativní každý prvek základního souboru má stejnou šanci dostat se do výběru Opak selektivní výběrový soubor

Náhodný výběr Reprezentativní výběr byl pořízen metodou náhodného výběru Náhodný výběr prostý Systematický Stratifikovaný Metody náhodného výběru Metodami induktivní statistiky lze získat správná tvrzení pouze tehdy, jestliže datový soubor pochází z náhodného výběru

Induktivní statistika Odhad průměru veličiny v populaci Populace základní soubor µ x výběr

Základní soubor - populace Je tvořen objekty, prvky, jedinci jednotky statistického šetření Konečný nebo nekonečný rozsah Musí být přesně vymezen jednoznačná pravidla určující který objekt do základního souboru patří a který ne Úspěch statistického šetření spočívá v přesném vymezení základního souboru ZNAKY - vlastnosti sledované na objektech základního souboru Znaky určující Znaky zkoumané

Kvalitativní Typy sledovaných znaků Alternativní ano-ne Nominální nelze uspořádat Ordinální je možno uspořádat Kvantitativní Spojité výška, váha, tlak Diskrétní počty

Nominální veličiny svobodná vdaná rozvedená vdova 350 300 250 200 = n i +. n = n1 + n2 + n3 n4 150 100 50 0 svobodná vdaná rozvedená vdova

Ordinální veličiny vyšší střední vyučen četnost kumulativní četnost základní 0 20 40 60 80 100 %

Spojité kvantitativní veličiny Míry, váhy, je možno porovnávat rozdíly velké množství různých hodnot teoreticky je možno měřit s libovolnou přesností 1500 2000 2500 3000 3500 4000 4500 5000 1500

Celočíselné kvantitativní veličiny Počty, nejmenší přesnost s kterou je možno měřit je 1 (½ jedince nemá smysl) počty onemocnění horních cest dýchacích v prvých třech letech věku

Průběh - 4 etapy: Statistické šetření - použití statistiky v praxi 1. Cíl výzkumu-definice problému - plán statistického šetření 2. Sběr dat 3. Zpracování dat 4. Analýza a formulace závěrů

Plánování statistických pokusů Etapa výzkumnéčinnosti, jejímž cílem je získat data, která lze zpracovat statistickými metodami Vymezit znaky zkoumané, určující Vymezení základního souboru, výběru - rozsah Ujasnit povahu znaků, jednotná metodika měření, klasifikace kvalitativních znaků Homogennost pozorování Strukturní nehomogennost Vyloučení subjektivních vlivů slepé pokusy

Statistické srovnání Základní metoda statistického šetření 100 nemocných stratifikace 50 50 randomizace Veličiny: zkoumané ovlivňující rušivé známé neznámé Lék A Lék B?? Statistické srovnání Zkoumáme efekt ovlivňujících veličin na zkoumané a eliminujeme efekt rušivých veličin

Zpracování dat deskriptivní metody Popisné metody Přehledné uspořádání dat statistické třídění Grafické znázornění Výpočet statistických ukazatelů Statistické třídění Rozdělení souboru dat do skupin-tříd podle určených třídících znaků Jednostupňové, vícestupňové (kombinační) Umožní poznat v hrubých rysech strukturu a rozložení znaků Znaky sloužící za podklad třídění musí vyjadřovat podstatu zkoumaného jevu

Třídění kvalitativního znaku jednostupňové dvoustupňové

Třídění spojitého znaku Měření vitální kapacity plic u souboru 90-ti mužů ve věku 40-50 let

Vytřídění naměřených hodnot do tabulky Třídní intervaly, četnosti: absolutní, relativní

Grafické znázornění rozložení

Výpočet ukazatelů relativní ukazatelé Pro časové, územní srovnání kvalitativních údajů Strukturální extenzitní ukazatelé charakterizují rozčlenění souboru podle určitého znaku Frekvenční- intenzitní ukazatelé vyjadřujíčastost výskytu jevu Indexy - s pevným či pohyblivým základem k posouzení vývoje nějakého ukazatele v čase

Strukturální ukazatelé abs četnost _ jevu rozsah _ souboru. N = 100 procento N N = 1000 promile Frekvenční ukazatelé Nemocnost, úmrtnost, porodnost, rozvodovost.. poč. nemocných celk. poč. obyvatel 100.000

Použití indexů

Standardizace (nemocnosti) - Nutná v případě, že četnost výskytu jevu je závislá na dalším znaku, jehož rozložení v porovnávaných souborech značně rozdílné > > > > > <

Přímá standardizace Známe relativní nemocnosti v porovnávaných souborech Volíme určitou populaci - standardní populace Přepočteme, kolik by ve standardu onemocnělo lidí za předpokladu nemocností v porovnávaných souborech 19.25 > 17.61

Nepřímá standardizace Známe věkové rozložení v porovnávaných souborech Známe celkové nemocnosti (nestandardizované) Ze standardu známe nemocnosti ve věkových třídách a celkovou nemocnost 17.93 / 9.35 * 10.45 = 20.1 > 17.93 / 15.68 * 15.3 = 17.44

Ukazatelé polohy střední hodnoty Data : x 1, x 2, x 3, x 4, x 5.. x n Aritmetický průměr Medián Modus x med 1 x = N N i= 1 x i Prostřední pozorovaná hodnota Nejčastější hodnota Geometrický průměr x geom N 1 = exp N = N xi i= 1 N i= 1 ln( x i ) Percentil x 25 % Taková hodnota, že zvolené procento Je menší než tato hodnota Kvantil, decil, kvantil, kvartil, tercil

Ukazatelé rozptýlenosti µ xi x x i x µ x i Rozptyl 1 N 2 s = 1 x i x i µ x N 1 i= 1 N 2 ( ) i= 1 ( ) 2 Směrodatná odchylka Střední chyba průměru S. D. = s = s S. E. = S. D. N 2 x i x

Další statistické charakteristiky Variační koeficient Šikmost S. D. 1 N x ( x x) i ( S. D. ) 3 3 Špičatost 1 N ( x x) i ( S. D. ) 4 4 3

Úvod do pravděpodobnosti Prostředek k popisu náhody matematizování statistiky Všechny statistické výroky mají pravděpodobnostní charakter Hlavní pojmy v teorii pravděpodobnosti náhodný pokus, náhodný jev Pravděpodobnost kvantitativní charakteristika míra častosti výskytu jevu Klasická pravděpodobnost Náhodný pokus - n možných výsledku elementární jevy Náhodný jev A - jakákoliv množina elementárních jevů Pravděpodobnost P(A) = m / n m počet elementárních jevů příznivých jevu A n - počet všech elementárních jevů

Vlastnosti pravděpodobnosti 1 ) ( 0 A P P(A) = 1. jev jistý P(A) = 0. jev nemožný ) ( ) ( ) ( B P A P B A P + = Υ ) ( ) ( ) ( ) ( B A P B P A P B A P Ι Υ + = Věta o sčítání Disjunktní jevy