Využití statistických metod v medicíně (teorie informace pro aplikace VaV, vícerozměrné metody, atd.)



Podobné dokumenty
Poznámky k předmětu Aplikovaná statistika, 9.téma

6. T e s t o v á n í h y p o t é z

Biostatistika a matematické metody epidemiologie- stručné studijní texty

Matematická statistika

Regresní a korelační analýza

1. Alternativní rozdělení A(p) (Bernoulli) je diskrétní rozdělení, kdy. p(0) = P (X = 0) = 1 p, p(1) = P (X = 1) = p, 0 < p < 1.

KOMBINATORIKA, PRAVDĚPODOBNOST, STATISTIKA. Charakteristiky variability. Mgr. Jakub Němec. VY_32_INOVACE_M4r0120

Analýza výsledků testu čtenářské gramotnosti v PRO /11

a) Základní informace o souboru Statistika: Základní statistika a tabulky: Popisné statistiky: Detaily

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více

Drsná matematika IV 7. přednáška Jak na statistiku?

KGG/STG Statistika pro geografy

(Auto)korelační funkce Statistické vyhodnocování exp. dat M. Čada ~ cada

Hledání závislostí technologických a nákladových charakteristik při tavení oceli na elektrických obloukových pecích

Organizační pokyny k přednášce. Matematická statistika. Přehled témat. Co je statistika?

Teoretická rozdělení

UNIVERSITA PALACKÉHO V OLOMOUCI PŘÍRODOVĚDECKÁ FAKULTA. KATEDRA MATEMATICKÉ ANALÝZY A APLIKACÍ MATEMATIKY školní rok 2009/2010 BAKALÁŘSKÁ PRÁCE

NEPARAMETRICKÉ TESTY

Kapitola 11. Vzdálenost v grafech Matice sousednosti a počty sledů

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

Semestrální projekt. do předmětu Statistika. Vypracoval: Adam Mlejnek Oponenti: Patrik Novotný Jakub Nováček Click here to buy 2

SYSTÉM TECHNICKO-EKONOMICKÉ ANALÝZY VÝROBY TEKUTÉHO KOVU - CESTA KE SNIŽOVÁNÍ NÁKLADŮ

Přednáška 5. Výběrová šetření, Exploratorní analýza

= = 2368

4ST201 STATISTIKA CVIČENÍ Č. 8

Některé zákony rozdělení pravděpodobnosti. 1. Binomické rozdělení

Univerzita Pardubice Fakulta Ekonomicko- správní. Testy hypotéz s využitím programu MS EXCEL. Tomáš Borůvka

1. Pravděpodobnost a statistika (MP leden 2010)

Analýza rozptylu. Statistika II. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Modely diskrétní náhodné veličiny. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Charakteristiky kategoriálních veličin. Absolutní četnosti (FREQUENCY)

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

PROTOKOL. č. C2858c. Masarykova univerzita PF Ústav chemie Chemie konzervování a restaurování 1 POPIS PRAKTICKÉHO CVIČENÍ. 1.

Prognóza poruchovosti vodovodních řadů pomocí aplikace Poissonova rozdělení náhodné veličiny

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Zápočtová práce STATISTIKA I

VŠB Technická univerzita Ostrava BIOSTATISTIKA

Základy teorie pravděpodobnosti

12. TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

Tomáš Karel LS 2012/2013

Analýza a vyhodnocení. zdravotního stavu. obyvatel. města TŘEBÍČ. Zdravá Vysočina, o.s. ve spolupráci se Státním zdravotním ústavem

MEZINÁRODNÍ AUDITORSKÝ STANDARD ISA 530 VÝBĚR VZORKŮ

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Zpracování a vyhodnocování analytických dat

Mendelova zemědělská a lesnická univerzita v Brně Institut celoživotního vzdělávání Fakulta regionálního rozvoje a mezinárodních studií

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Za hranice nejistoty(2)

23. Matematická statistika

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

4ST201 STATISTIKA CVIČENÍ Č. 7

Testování statistických hypotéz

Pro bodový odhad při základním krigování by soustava rovnic v maticovém tvaru vypadala následovně:

Statistika. Program R. popisná (deskriptivní) statistika popis konkrétních dat. induktivní (konfirmatorní) statistika. popisná statistika

VŠB Technická univerzita Ostrava

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

PROJEKT DO STATISTIKY PRŮZKUM V TECHNICKÉ MENZE

SRG Přírodní škola, o.p.s. Orientace v Přírodě. Bez kompasu

Funkce zadané implicitně

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

Analýza rozptylu. Přednáška STATISTIKA II - EKONOMETRIE. Jiří Neubauer

Matice se v některých publikacích uvádějí v hranatých závorkách, v jiných v kulatých závorkách. My se budeme držet zápisu s kulatými závorkami.

Mendelova zemědělská a lesnická univerzita v Brně

Normální (Gaussovo) rozdělení

Rozptyl. Pozn.: rozptyl je nezávislý na posunu hustoty pravděpodobnosti na ose x, protože Var(X) mi určuje jen šířku rozdělení.

Pravděpodobnost a statistika

Charakteristika datového souboru

Dodatek č. 3 ke školnímu vzdělávacímu programu. Strojírenství. (platné znění k )

Základy genetiky populací

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

FAKULTA STAVEBNÍ VUT V BRNĚ PŘIJÍMACÍ ŘÍZENÍ DO MNSP STAVEBNÍ INŽENÝRSTVÍ PRO AKADEMICKÝ ROK

STATISTICKÉ ODHADY Odhady populačních charakteristik

Finanční. matematika pro každého. f inance. 8. rozšířené vydání. věcné a matematické vysvětlení základních finančních pojmů

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

Spolehlivost a provozní vlastnosti kondenzátorů

STP022 PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA

Vícekriteriální hodnocení variant metody

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

MSI LS 2006/2007 Ing. Pavla Hošková, Ph.D., 2. test

populace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

VYSOK A ˇ SKOLA POLYTECHNICK A JIHLAVA Katedra matematiky Statistick a anal yza a ˇ casov e ˇ rady v pˇ r ıkladech Stanislava Dvoˇ r akov a 2015

SYLABUS PŘEDNÁŠKY 6a Z INŽENÝRSKÉ GEODÉZIE (Polohové vytyčovací sítě) 4. ročník bakalářského studia studijní program G studijní obor G

Inkluze, inkluzivní vzdělávání

DESIGN HALOGENOVÝCH VÝBOJEK

Sborníky technické harmonizace 2009

Analýza přežití čertic a čertů

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Řešení. Označme po řadě F (z) Odtud plyne, že

A0M15EZS Elektrické zdroje a soustavy ZS 2011/2012 cvičení 1. Jednotková matice na hlavní diagonále jsou jedničky, všude jinde nuly

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

+ ω y = 0 pohybová rovnice tlumených kmitů. r dr dt. B m. k m. Tlumené kmity

Tématické celky { kontrolní otázky.

Simulace systému hromadné obsluhy Nejčastější chyby v semestrálních pracích

Dynamické metody pro predikci rizika

Testy statistických hypotéz

Transkript:

Operační program Vzdělávání pro konkurenceschopnost Masarykova univerzita Brno Využití statistických metod v medicíně (teorie informace pro aplikace VaV, vícerozměrné metody, atd.) doc. RNDr. PhMr. Karel Volenec, CSc. doc. Ing. Josef Hanuš, CSc. Ing. Milan Lázníček Hradec Králové 2011

Masarykova univerzita Brno ve spolupráci s výrobcem zdravotnické techniky ELLA-CS, s.r.o. Využití statistických metod v medicíně (teorie informace pro aplikace VaV, vícerozměrné metody, atd.) Skripta pro projekt operačního programu Vzdělávání pro konkurenceschopnost, Vzdělávání pracovníků VaV MU a VFU Brno v endoskopických vyšetřovacích technikách a endoskopicky asistované miniinvazivní chirurgii s využitím nových materiálů Karel Volenec

Obsah Úvod... 3 1 Popisná statistika... 4 1.1 Střední hodnoty... 4 Aritmetický průměr... 4 Vážený aritmetický průměr... 5 Medián:... 6 Modus:... 7 1.2 Míry variability:... 8 Rozptyl:... 8 Směrodatná odchylka souboru:... 9 2 Práce se statistickými soubory...11 2.1 Gaussovo rozdělení... 11 2.2 T-test... 13 Jednovýběrový t-test... 14 Párový t-test... 14 Dvouvýběrový t-test... 14 2.3 Kaplan-Meierova metoda... 15 2.4 Parametrické testy:... 17 2.5 Neparametrické testy:... 18 2.6 Stanovení velikosti souboru... 18 2.7 Rozdělení chyb:... 20 Závěr...22 Seznam doporučené literatury...23 2

Úvod Před autory textu byl postaven na jedné straně jednoduchý úkol, neboť v oboru statistického zpracování dat v medicíně existuje řada fundovaných učebnic. Na druhé straně zde bylo očekávání, že se podaří transformovat některé obtížnější části do zcela srozumitelné podoby tak, aby i těm, kteří se s tímto oborem rozloučili na úrovní prvního semestru studie medicíny, tato problematika nebyla zcela cizí. Po zvážení všech alternativ byla zvolena metoda praktických ukázek při řešení jednoduchých případů a zvláště je ukazováno na chybné použití postupů, kde je statistiky využíváno a to zcela chybně. Bohužel, tímto nedostatkem oplývá i řada prestižních publikací a teprve postupně se daří alespoň některé nejhorší případy eliminovat na úrovni redakčních rad odborných časopisů tím, že jsou některé metody přímo jednoznačně vyžadovány. Za mnoho let praxe jsme se dokonce setkali i se záměrným zneužitím těchto postupů tak, aby byla poškozena z důvodu konkurence protistrana. Protože autorům není známa detailní úroveň znalostí potenciálních čtenářů, volí metodu krátkého zopakování výkladu jednotlivých pojmů tak, aby byly jednoznačně popsány, a hned jsou uvedeny praktické aplikace z praxe i s příklady naprosto nesprávného použití. Mezi velmi vhodné postupy by autoři textu doporučili vždy konzultovat odpovídající metodu statistického hodnocení výsledků s příslušnými odborníky a tak zabránit devalvaci jinak metodicky správně naměřených hodnot z hlediska interpretace při srovnání s kontrolními skupinami. 3

1 Popisná statistika Mezi základní statistické charakteristiky patří: a) charakteristiky polohy (nazýváme je středními hodnotami), b) charakteristiky variability (rozptýlenosti) informují nás o rozptýlení jednotlivých měřených hodnot kolem jejich středních hodnot. 1.1 Střední hodnoty Mezi nejpoužívanější střední hodnoty počítáme aritmetický průměr (vážený), modus, medián. Aritmetický průměr x.. aritmetický průměr N počet naměřených veličin x i.... naměřené hodnoty Použití aritmetického průměru patří mezi nejznámější prohřešky, které si jen můžeme představit. Tento parametr bychom měli použít skutečně jen tehdy, kdy jsme si jednoznačně jisti, že jej lze zvláště z hlediska četnosti měřených dat použít. Odstrašujícím příkladem budiž následující příklad: Student měl ověřit průměrnou hodnotu systolického a diastolického tlaku u skupiny studentů ve věku 18-23 let a seniorů ve věku 70-75 let. V prvé skupině byli dva hypertoničtí studenti a v druhé skupině byla většina respondentů léčena antihypertenzivy. Měření bylo provedeno u 10 respondentů. Závěr: Student zobecnil porovnáním průměrných hodnot tlaků měření na konstatování, že se obě skupiny neliší a v průběhu věku se tlak významně nemění. 4

I když měření tonometrem bylo provedeno technicky správně, závěry byly naprosto chybné. Nebyly srovnány odpovídající skupiny respondentů a nebyl zvolen dostatečný počet respondentů. Vážený aritmetický průměr (z několika dílčích průměrů) x.. vážený aritmetický průměr (jako aritmetický průměr) Vážený průměr zobecňuje aritmetický průměr a poskytuje charakteristiku statistického souboru v případě, že hodnoty v tomto souboru mají různou důležitost, různou váhu. Používá se zejména při počítání celkového aritmetického průměru souboru složeného z více podsouborů. Pro výpočet váženého průměru potřebujeme jednak hodnoty, jejichž průměr chceme spočítat, a zároveň jejich váhy. Máme-li soubor n hodnot a k nim odpovídající váhy je vážený průměr dán vzorcem či Zde si na příkladu popíšeme nevhodnost použití aritmetického průměru a větší vypovídací schopnost váženého průměru. 5

Řekněme, že škola má dvě třídy, jednu s 20 studenty a druhou s 32. Bodové ohodnocení v každé třídě při jednom testu bylo: Třída A 62, 67, 71, 74, 76, 77, 78, 79, 79, 80, 80, 81, 81, 82, 83, 84, 86, 89, 93, 98. Třída B 80, 81, 82, 83, 84, 85, 86, 87, 87, 88, 88, 89, 89, 89, 90, 90, 90, 90, 91, 91, 91, 92, 92, 93, 93, 94, 95, 96, 97, 98, 99, 100. Aritmetický průměr bodů ve třídě A je 80, ve třídě B je 90. Když spočítáme aritmetický průměr 80 a 90, dostaneme 85. Toto ovšem není aritmetický průměr bodů všech studentů. K jeho určení potřebujeme spočítat součet všech bodů a vydělit počtem všech studentů, tedy: Nebo si můžeme pomoci váženým průměrem a spočítat vážený průměr průměrů bodů obou tříd použitím počtu studentů jako vah: Nyní jsme již nepotřebovali znát, k spočtení aritmetického průměru všech bodů, jednotlivé známky, stačily nám pouze aritmetické průměry a počty studentů v jednotlivých třídách. Medián: Medián (označován Me nebo ) je hodnota, jež dělí řadu podle velikosti seřazených výsledků na dvě stejně početné poloviny. Medián patří ve statistice mezi míry centrální tendence. Platí, že nejméně 50 % hodnot je menších nebo rovných a nejméně 50 % hodnot je větších nebo rovných mediánu. Pro nalezení mediánu daného souboru stačí hodnoty seřadit podle velikosti a vzít hodnotu, která se nalézá uprostřed seznamu. Pokud má soubor sudý počet prvků, obvykle se za medián označuje aritmetický průměr hodnot na místech n/2 a n/2+1. Obecně se za medián dá označit více čísel. V už zmíněném případě sudého počtu prvků neexistuje jedinečná střední hodnota. Platí však, že polovina hodnot je 6

menší nebo rovna a polovina prvků je větší nebo rovna, ať už se za medián zvolí libovolné z obou prostředních čísel. Totéž dokonce platí i pro libovolné číslo, jehož velikost leží mezi těmito dvěma čísly. Proto se jako medián takového souboru může vzít libovolné z obou prostředních čísel i libovolné z čísel mezi nimi. Základní výhodou mediánu jako statistického ukazatele je fakt, že není ovlivněn extrémními hodnotami. Proto se často používá v případě šikmých rozdělení, u kterých aritmetický průměr dává obvykle nevhodné výsledky. Např. u souboru { 1, 2, 2, 3, 9 } je medián (stejně jako modus) roven dvěma, což je zřetelně vhodnější ukazatel převažující tendence než aritmetický průměr, který je zde roven 3,4. Proto by bylo chybou zde aritmetický průměr použít. Medián je také odhad střední hodnoty, který minimalizuje absolutní chybu. U předchozího příkladu je tato chyba při použití mediánu rovna 1 + 0 + 0 + 1 + 7 = 9, zatímco při použití aritmetického průměru by byla rovna 2,4 + 1,4 + 1,4 + 0,4 + 5,6 = 11,2. To znamená, že číslo m, které minimalizuje výraz E( X m ), je mediánem rozdělení náhodné veličiny X. Modus: Modus náhodné veličiny X (označováno jako Mod(X), Mo, nebo ) je hodnota, která se v daném statistickém souboru vyskytuje nejčastěji (je to hodnota znaku s největší relativní četností). Představuje jakousi typickou hodnotu sledovaného souboru a jeho určení předpokládá roztřídění souboru podle obměn znaku. Definice: Modus diskrétní náhodné veličiny je taková hodnota, která pro všechny hodnoty xi náhodné veličiny X splňuje podmínku. Vlastnosti: Modus nemusí být rozdělením pravděpodobnosti určen jednoznačně (tzn., že se stejnou nejvyšší frekvencí se může vyskytovat více hodnot). Rozdělení pravděpodobnosti s jedním modem se nazývají jednovrcholová (unimodální). 7

Mezi aritmetickým průměrem, mediánem a modem unimodálních rozdělení četností existují určité vztahy, které charakterizují tvar rozdělení četností. U zcela symetrických jednovrcholových četností platí vztah:, tj. aritmetický průměr, medián a modus jsou si rovny. Čím bude rozdělení četností asymetričtější, tím více se budou tyto tři střední hodnoty od sebe odlišovat. Výhodou modu je, že ho lze snadno použít i pro nečíselná data, kde např. aritmetický průměr použít nelze. Např. modus souboru { jablko, pomeranč, hruška, pomeranč, jablko, jablko, hruška } je jablko. 1.2 Míry variability: Mezi charakteristiky nebo míry variability řadíme: variační rozpětí, průměrnou odchylku, rozptyl, směrodatnou odchylku a variační koeficient. Pro účely těchto skript bude postačující definice rozptylu a směrodatné odchylky. Ostatní charakteristiky se dají nalézt v obecné statistické literatuře. Rozptyl: Rozptyl (označován, též střední kvadratická odchylka, střední kvadratická fluktuace, variance nebo také disperze) se používá v teorii pravděpodobnosti a statistice. Je to druhý centrální moment náhodné veličiny. Jedná se o charakteristiku variability rozdělení pravděpodobnosti náhodné veličiny, která vyjadřuje variabilitu rozdělení souboru náhodných hodnot kolem její střední hodnoty. Rozptyl náhodné veličiny X se označuje σ 2 (X), S 2 (X), D(X) nebo var(x). Rozptyl je definován jako střední hodnota kvadrátů odchylek od střední hodnoty. Odchylku od střední hodnoty, která má rozměr stejný jako náhodná veličina, zachycuje směrodatná odchylka. Pro diskrétní náhodnou veličinu jej můžeme definovat vztahem 8

, kde x i jsou hodnoty, kterých může náhodná veličina X nabývat (s pravděpodobnostmi p i ) a E(X) je střední hodnota veličiny X. Směrodatná odchylka souboru: Směrodatná odchylka (označována σ) je v teorii pravděpodobnosti a statistice často používanou mírou statistické disperze (rozptylu). Jedná se o kvadratický průměr odchylek hodnot znaku od jejich aritmetického průměru. Zhruba řečeno, vypovídá o tom, jak moc se od sebe navzájem liší typické případy v souboru zkoumaných čísel. Je-li malá, jsou si prvky souboru většinou navzájem podobné, a naopak velká směrodatná odchylka signalizuje velké vzájemné odlišnosti. Pomocí pravidel 1σ a 2σ (viz níže) lze přibližně určit, jak daleko jsou čísla v souboru vzdálená od průměru, resp. hodnoty náhodné veličiny vzdálené od střední hodnoty. Směrodatná odchylka je nejužívanější míra variability. Směrodatná odchylka je značená řeckým písmenem σ, a obvykle se definuje jako odmocnina z rozptylu náhodné veličiny X, tzn.. Pravidlo 1σ a 2σ Jedná se o empirické pravidlo, jehož platnost závisí na konkrétním případu, proto je formulováno obecně. Lze je však velmi dobře použít pro základní orientaci v rozložení hodnot souboru nebo náhodné veličiny. Jde-li o náhodnou veličinu, pak pravděpodobnost, že se hodnota náhodné veličiny bude od střední hodnoty lišit nejvýše o jednu směrodatnou odchylku, je výrazně vyšší než 0,5 (za předpokladu normálního rozdělení je to 68%); 9

pravděpodobnost, že se hodnota bude lišit nejvýše o dvě směrodatné odchylky, je velmi vysoká (při normálním rozdělení cca 95%). Ve většině případů je nutné, aby byla zahrnuta směrodatná odchylka výběrového souboru do hodnocení. Někdy se jako popisná statistika použije pouze průměr a to pro vypovídací schopnost daného jevu většinou není dostačující. Je potřeba uvést velikost souboru a směrodatnou odchylku. Při hodnocení určitého jevu by se měla objevit informace (při uvedeném průměru), kolik pacientů je v souboru tzn. i celkovou velikost souboru a je potřeba uvést i směrodatnou odchylku. Tím si odvodíme, jaká je variabilita v daném souboru. 10

2 Práce se statistickými soubory Ve statistických šetřeních pracujeme často s výběry. Výběr tvoří pouze určitou část základního souboru. Naším úkolem je, abychom na základě výsledků zjištěných výběrovým šetřením, usoudili na poměry v základním souboru. Metody, jimiž takové informace získáváme, označujeme souhrnně jako metody statistické indukce. Statistická indukce znamená zobecnění závěrů, získaných zpracováním a analýzou omezeného počtu pozorování (výběru) na celý základní soubor. Symboly užívané u základního souboru a u výběru: Pojem Náhodný výběr Základní soubor (charakteristiky) (parametry) Rozsah n N Aritmetický průměr x µ Rozptyl s 2 2 Směrodatná odchylka s Známe-li vlastnosti (charakteristiky) výběru, snažíme se vypočítat odhadnout z těchto vlastností parametry základního souboru. Protože, zejména při malém rozsahu výběru, jsou příslušné charakteristiky, které jsme zjistili na základě výběru, zatíženy výběrovou náhodnou chybou, provádíme příslušný odhad pro základní soubor. 2.1 Gaussovo rozdělení Též normální rozdělení, Gaussova distribuce nebo Laplace-Gaussovo rozdělení je jedno z nejdůležitějších rozdělení pravděpodobnosti spojité náhodné veličiny. Normální rozdělení pravděpodobnosti s parametry μ a σ 2, pro a σ2 > 0, je pro definováno hustotou pravděpodobnosti ve tvaru Gaussovy funkce 11

Normální rozdělení se většinou značí. Rozdělení bývá označováno jako normované (nebo standardizované) normální rozdělení. Normované normální rozdělení má tedy hustotu pravděpodobnosti Grafy hustot normálního rozdělení s různými charakteristikami (µ, σ) Řadu v přírodě i společnosti se vyskytujících náhodných dějů lze dobře modelovat právě normálním rozdělením, např. rozložení IQ nebo výšky v populaci, rozložení vitální kapacity nebo třeba velikost chyby měření. Některá další rozdělení se při dostatečně velkém vzorku ke Gaussově distribuci číselně blíží, takže lze využít tabelovaných hodnot Gaussova rozdělení např. k výpočtu problémů modelovatelných binomickým rozdělením. Jiná rozdělení lze na normální poměrně snadno transformovat, např. tzv. lognormální rozdělení popisující stáří bílých krvinek v periferní krvi. 12

V souvislosti s normálním rozdělením jsou často zmiňovány náhodné chyby, např. chyby měření, způsobené velkým počtem neznámých a vzájemně nezávislých příčin. Proto bývá normální distribuce také označována jako zákon chyb. Podle tohoto zákona se také řídí rozdělení některých fyzikálních a technických veličin. 2.2 T-test Princip t-testu Pokud náhodný výběr pochází z normálního rozdělení, pak výběrový průměr má také normální rozdělení se stejnou střední hodnotou. Rozdíl výběrového průměru a střední hodnoty normovaný pomocí skutečného rozptylu by pak měl normální rozdělení s nulovou střední hodnotou a jednotkovým rozptylem. Skutečný rozptyl však neznáme. Pokud jej nahradíme odhadem pomocí výběrového rozptylu, dostaneme T rozdělení, které je podobné normálnímu rozdělení. T-test je metodou matematické statistiky, která umožňuje ověřit některou z následujících hypotéz: 1. zda normální rozdělení, z něhož pochází určitý náhodný výběr, má určitou konkrétní střední hodnotu, přičemž rozptyl je neznámý 2. zda dvě normální rozdělení mající stejný (byť neznámý) rozptyl, z nichž pocházejí dva nezávislé náhodné výběry, mají stejné střední hodnoty (resp. rozdíl těchto středních hodnot je roven určitému danému číslu). V prvním případě může být náhodný výběr tvořen buď jednotlivými hodnotami (pak se jedná o jednovýběrový t-test), anebo dvojicemi hodnot, u nichž se zkoumají jejich rozdíly (pak se jedná o párový t-test). Ve druhém případě jde o dvouvýběrový t-test. V praxi se t-test často používá k porovnání, zda se výsledky měření na jedné skupině významně liší od výsledků měření na druhé skupině. 13

Jednovýběrový t-test Označme jednotlivé hodnoty náhodného výběru jako x 1,x 2,...,x n, výběrový průměr jako a výběrový rozptyl jako S 2. Test testuje hypotézu, že střední hodnota normálního rozdělení, z něhož výběr pochází, se rovná μ 0. Platí-li hypotéza, má náhodná veličina T rozdělení s (n-1) stupni volnosti. Hypotézu zamítáme, je-li T příliš velké nebo příliš malé (výběrový průměr se příliš liší od očekávané střední hodnoty). Konkrétně se T porovná s kritickou hodnotou T rozdělení pro předem stanovenou hladinu významnosti. Párový t-test Párový t-test se od jednovýběrového liší pouze v tom, že náhodný výběr poskytuje dvojice hodnot (y 1,z 1 ),(y 2,z 2 ),...,(y n,z n ), přičemž uvnitř každé dvojice nemusí jít o nezávislé veličiny. V párovém t-testu ověřujeme, zda rozdíl středních hodnot rozdělení pro veličiny y a rozdělení pro veličiny z je roven určitému číslu (často nule). Položíme-li x i = y i z i a označíme-li μ 0 jako číslo, kterému se má rovnat rozdíl středních hodnot, můžeme párový test zcela převést na případ jednovýběrového t-testu. Dvouvýběrový t-test Označme jednotlivé hodnoty prvního náhodného výběru jako x 1,x 2,...,x n, výběrový průměr jako a výběrový rozptyl jako. Obdobně označme jednotlivé hodnoty druhého náhodného výběru jako y 1,y 2,...,y m, výběrový průměr jako a výběrový rozptyl jako. Oba výběry musejí být vzájemně nezávislé. Nakonec označme δ číslo, které se má rovnat rozdílu středních hodnot μ 1 μ 2 (jak již bylo řečeno, často δ = 0). 14

Potom veličina má za platnosti hypotézy, že se rozdíl středních hodnot rovná δ, T rozdělení o n+m-2 stupních volnosti. Hypotéza se tedy zamítá v případě, že veličina T překročí kritickou hodnotu T rozdělení o uvedeném počtu stupňů volnosti. Pozn. Předpoklad, že oba výběry pocházejí z normálního rozdělení, nemusí být za každou cenu dodržen. T-test totiž pracuje s průměry obou výběrů, a ty již při rozsahu výběru v řádu desítek mají přibližně normální rozdělení. Pokud je rozsah výběru (resp. obou výběrů) velký (v řádu stovek a víc), lze místo kritických hodnot T rozdělení použít kritické hodnoty normálního rozdělení. 2.3 Kaplan-Meierova metoda V medicíně používáme běžně jako kritérium hodnocení léčebné metody dobu, po kterou jí navozený výsledek vydrží. V této souvislosti je zcela zásadní definovat přesně, co je to selhání léčby, což je jednoduché například v onkologii, kdy datum úmrtí společně s datem zahájení terapie vymezují jednoznačně časový interval výsledku, který označujeme jako dobu přežití ("survival time"). Protože není možné z pragmatických důvodů vyčkávat na selhání posledního pacienta ve sledovaném souboru, navrhli Kaplan s Meierem výpočet odhadu pravděpodobnosti přežití v kterémkoliv okamžiku v průběhu studie. Cílem je vytěžit maximum relevantních informací v době, kdy část sledovaných dat ještě není k dispozici. Kaplan-Meierův přístup byl však navržen k odhadu pravděpodobnosti výskytu jisté události, u níž se předpokládá, že se vyskytne při dostatečně dlouhé době sledování u všech pacientů ve studii. Typickým příkladem je právě úmrtí pacienta u malignit. Avšak někteří pacienti mohou být ze sledování ztraceni ještě před ukončením studie, a to proto, že se u nich vyskytla jiná než sledovaná událost, která svou přítomností vylučuje následný výskyt události sledované nebo významně mění následnou pravděpodobnost vzniku sledované události. Tyto jiné události než sledované se nazývají 15

alternativní události ("competing events"). Není třeba se přesvědčovat o tom, že jde o zcela běžnou situaci. V medicínské statistice typická aplikace může zahrnovat rozdělení pacientů do kategorií, např. na ty s profilem genotypu A a s profilem genotypu B. Na grafu jsou znázorněni pacienti genotypu B, kteří umírají mnohem rychleji, než pacienti s genotypem A. Po dvou letech téměř 80% pacientů genotypu A stále přežívá, ale naživu je již méně než polovina pacientů genotypu B. Dalším příkladem může být rozdělení pacientů na skupinu léčenou a neléčenou daným léčivem (obdobné jako v předchozím příkladu). Příklad Kaplan-Meierova grafu pro dvě skupiny pacientů a jejich dobu přežití. Nechť S(t) je pravděpodobnost že jedinec z populace bude mít délku přežití překračující dobu t. Nechť je doba dožití pro vzorek z populace o velikosti N: Každému t i odpovídá n i, počet jedinců "s rizikem" právě před dobou t i, a d i počet úmrtní v čase t i. Všimněte si, že intervaly mezi jednotlivými měřeními nejsou jednotné. 16

Kaplan Meierův odhad je neparametrické maximum pravděpodobnosti odhadu S(t). Je to výsledek rovnice: Kde n i je počet přeživších před časem t i. Jak vyplývá z Kaplan-Meierova grafu, hodnoty jsou uvedeny v procentech. Avšak v Kaplan-Mayer pravděpodobnosti procentní! Velkou chybou je srovnávat procenta a Kaplan-Meierovu pravděpodobnost v procentech musí se uvést buď oboje v prostých procentech, nebo oba výsledky formou procentní pravděpodobnosti Kapalan-Meier. Je velkým prohřeškem, když se tyto výsledky vzájemně zaměňují a míchají. 2.4 Parametrické testy: Mnohdy je nejlepším způsobem analýzy a zveřejnění výsledků použití intervalů spolehlivosti, protože v rámci takto zveřejněných výsledků je zdůrazněn vliv nejistoty a neurčitosti. Často používaný statistický přístup je však též statistické testování hypotéz. Většina statistických hypotéz zahrnuje porovnání různých způsobů léčby, metod či skupin, nebo případů. Statistické hypotézy jsou jednoduše a jednoznačně formulované domněnky o populaci, jejichž pravdivost lze ověřovat (testovat) pomocí výběrů. Typickou statistickou hypotézou je tvrzení, že průměr bílkovinného séra je stejný pro muže i ženy, nebo že dvě léčby bolesti hlavy jsou stejně efektivní. Formulování nulové a alternativní hypotézy Pokud budeme tedy testovat hypotézy statistickými metodami, musíme na začátku práce formulovat 2 hypotézy: 1. Nulová hypotéza H 0 je tvrzení o populaci (parametru populace), o jehož platnosti chceme rozhodnout (není rozdíl, nezávisí, má dané rozdělení ); 17

Nulová hypotéza je obvykle opakem toho co chceme výzkumem dokázat (koresponduje s tvrzení, že efekt je nulový) 2. Alternativní hypotéza H 1 vymezuje situaci, do jaké se dostaneme, když neplatí H 0 (nepřipouštíme tedy situace, že by existovala daná možnost buď platí H 0 nebo neplatí H 0, ale pak platí H 1 ). 2.5 Neparametrické testy: Při neparametrickém testu testujeme jinou hypotézu o rozdělení základního souboru, než je hypotéza o jeho parametru. Jejich řešení nezávisí na typu rozdělení základního souboru, takže na rozdíl od parametrických testů výsledky nejsou závislé na tom, zda jsme model rozdělení volili správně v souladu se skutečným rozdělením základního souboru. Můžeme je pak použít i pro silně nenormální rozdělení, kdy parametrické testy předpokládající normální rozdělení selhávají. Další výhodou je i to, že řada z nich je schopna testovat nejen rozdělení číselných hodnot znaků (stejně jako parametrické), ale i rozdělení hodnot slovních znaků, především ordinálních, tj. rozlišujících dle relací většímenší, lepší-horší, atp. (např. pořadové testy). Některé neparametrické testy jsou dokonce použitelné pro hodnoty nominálních znaků, tj. zařazujících jen do skupin (např. znaménkový test rozlišující řazení do dvou alternativních skupin). Neparametrické testy mají tedy širší použití než parametrické. Jejich nevýhodou je, že mají menší sílu než analogické testy parametrické (menší pravděpodobnost, že odhalí situaci, kdy neplatí nulová hypotéza). Pro dosažení stejné síly musíme pak použít větší počet naměřených hodnot, než by byl nutný při parametrickém testu. 2.6 Stanovení velikosti souboru Je zásadní stanovit počet sledovaných prvků (velikost souboru) pro to, aby měl vyjádřený výsledek požadovanou míru vypovídací schopnosti/korektnosti. 18

Odhad potřebného rozsahu náhodného výběru a) pro průměr V praxi jsme často postaveni před úkol, jak velký má být náhodný výběr, abychom dostali hodnotu výběrového průměru s určitou, předem stanovenou přesností. Podle vztahu vyčteme příslušnou hodnotu následovně: Požadovanou přesnost výběrového průměru označíme - D. Budeme ji definovat jako polovinu intervalu spolehlivosti, tedy odkud určíme potřebné n:. Za D dosazujeme zvolenou hodnotu požadované přesnosti výběrového průměru. Za u α hodnotu 1,96 při 95% intervalu spolehlivosti, nebo hodnotu 2,58 při 99% intervalu spolehlivosti (někdy místo u α značíme t α a bereme hodnoty t pro α stupňů volnosti). Za dosazujeme odhad směrodatné odchylky základního souboru. Protože tento odhad není vždy znám, uchylujeme se v praxi k nahrazení tohoto parametru známým rozptylem z jiných podobných pokusů, z předvýzkumů a podobně. Příklad: Na základě jiných šetření známe rozptyl 1,50. Pro výběrový průměr požadujeme přesnost D=0,1 (měrných jednotek) při 95% spolehlivosti výsledku. Dosazením dostaneme: Výsledek: Abychom splnili uvedené požadavky, stačí, vybereme-li 864 jednotek. 19

b) pro relativní četnost: Chceme-li odhadnout potřebný rozsah náhodného výběru pro podíly, které mají binomické rozdělení četností a označíme-li opět požadovanou přesnost symbolem D, pak při 95% spolehlivosti výsledku platí: Odkud určíme požadovanou hodnotu n: Příklad: Pro výběrový podíl (procento) požadujeme přesnost D=0,1 při 95% spolehlivosti výsledku (p=q=0,5). Dostaneme n=96. Výsledek: Stačí tedy vybrat 96 jednotek, abychom splnily uvedené předpoklady. U procentního vyjádření daného sledovaného znaku se musí počítat s tím (v praxi se ustálilo), že se nedá počítat s prvky méně než deseti. Aby mělo procentní vyjádření vypovídací schopnost alespoň do určité míry. Optimální počet prvků u procentního vyjádření je nejlépe více než 30 prvků. Studentovo rozdělení počítá se souborem minimálně šesti prvků. Dalším případem je stanovení velikosti 1 souboru a chci znát pravděpodobnost, že hodnota sledovaného znaku se bude pohybovat v rámci určitého intervalu například od 2σ od střední hodnoty. Zde mohu říci, že sledovaná veličina se v tomto intervalu bude pohybovat s pravděpodobností 95%, což je pro většinu vyjádření dostačují a nepotřebuji již pravděpodobnost např. 99%. 2.7 Rozdělení chyb: Při všech měřeních (Statistické zpracování výsledků a naměřených dat) vznikají chyby, jimiž jsou výsledky zatíženy. Chyby se dělí: 1. náhodné - vyskytují se nepravidelně, lze je statisticky vyhodnotit 2. systematické - lze je předvídat a vypočítat, provést korekci výsledku Uvedení dalších chyb při statistickém vyjádření: 20

Aby bylo možné některé výsledné hodnoty srovnávat je potřeba vnímat rozdělení v rámci skupin, a četnosti ve skupině. Např. mám dvě skupiny každá o jiné velikosti a jiné četnosti hodnot ve skupině. I kdyby byl vypočítán aritmetický průměr v obou skupinách stejný, nemohu o těchto skupinách udělat závěr, že se obě skupiny neliší, právě díky jinak velkým skupinám s jinými četnostmi. Dalším zločinem s nakládání se statistickými výsledky je neodhalení chyby. Je třeba rozumět, co to jsou chyby. Není možné seškrtnout nejvyšší a nejnižší hodnoty (toto se může dělat např. při soutěži v krasobruslení), ale ve statistice v medicíně se to dělat nesmí, jelikož by to mohlo zakrýt chybu. Musíme se ujistit, zda jsou tyto krajní hodnoty jevem a potom musí být zahrnuty do výpočtu, nebo jestli je to chybový prvek a ten potom může být pro výpočet ze souboru odstraněn. Jinak se musí uvést všechny prvky výběru. Statistická významnost: v medicíně stačí nejčastěji statistická významnost na 95% hladině významnosti. Nemá smysl, vzhledem k biologické variabilitě, aby nabyla hodnota 99% hladiny významnosti, nebo aby byla vyšší. 21

Závěr Z výše uvedeného vyplývá, že jakékoli shrnutí činnosti do sdělovaného výsledku je statistickým úkonem. Měli bychom proto vždy dbát na to, abychom jednotlivá data nezkreslili deklarovanou souhrnnou informací, která by ve svém důsledku mohla devalvovat naše i mnohaletá úsilí v prezentované oblasti. Proto je třeba k vytváření souhrnů přistupovat s náležitou opatrností a se snahou, vyvarovat se chyb, na které bylo poukázáno. Statistika je rozsáhlý soubor teoretických přístupů, který v těchto skriptech nebyl, a ani nemohl být, vůbec postihnut. Je proto na místě konstatovat, že v případě hlubších statistických rozborů získaných dat, bude vhodné seznámení se s příslušným teoretickým základem, k vyvarování se chyb z neznalosti. 22

Seznam doporučené literatury 1. DRDKOVÁ S. Základy statistiky ve zdravotnictví. 1. vyd. SPN, Praha 1988 2. ENGLER V. Stručné základy zdravotnické statistiky pro posluchače LFH UK. 1. vyd. SPN, Praha 1989 3. HINDLS R., HRONOVÁ S., SEGER J. Statistika pro ekonomy. 4. vyd. Professional publishing, Praha 2003. ISBN 80-86419-52-5. Odkazy: 1. http://www.wikipedia.cz 2. http://users.prf.jcu.cz/sima/analyticka_chemie/statistika.htm 3. http://cs.wikipedia.org/wiki/ 4. http://vfu-www.vfu.cz/stat/fvl/cviceni/studentuv_t.htm 5. http://en.wikipedia.org/wiki/kaplan%e2%80%93meier_estimator 23

Název: Využití statistických metod v medicíně (teorie informace pro aplikace VaV, vícerozměrné metody, atd.) V programu: Vzdělávání pro konkurenceschopnost: Vzdělávání pracovníků VaV MU a VFU Brno v endoskopických vyšetřovacích technikách a endoskopicky asistované miniinvazivní chirurgii s využitím nových materiálů První vydání Zpracoval : doc. RNDr. PhMr. Karel Volenec, CSc. Editor: Ing. Jiří Tilhon Počet listů : 25 Vydavatel : Masarykova Univerzita Hradec Králové, Počet výtisků : Tiskem : Vlastním Práce neprošla jazykovou ani grafickou úpravou.