Srovnatelnost skupin pacientů v observačních a klinických studiích Bakalářská práce
|
|
- Milan Havel
- před 10 lety
- Počet zobrazení:
Transkript
1 MASARYKOVA UNIVERZITA PŘÍRODOVĚDECKÁ FAKULTA STUDIJNÍ PROGRAM: EXPERIMENTÁLNÍ BIOLOGIE Srovnatelnost skupin pacientů v observačních a klinických studiích Bakalářská práce Adéla Šenková VEDOUCÍ PRÁCE: RND RNDR. TOMÁŠ PAVLÍK, PH.D. BRNO 2013
2 Bibliografický záznam Autor: Název práce: Studijní program: Adéla Šenková Přírodovědecká fakulta, Masarykova univerzita Institut biostatistiky a analýz LF a PřF MU Centrum pro výzkum toxických látek v prostředí Srovnatelnost skupin pacientů v observačních a klinických studiích Experimentální biologie Studijní obor: Matematická biologie Vedoucí práce: RNDr. Tomáš Pavlík, Ph.D. Akademický rok: 2012/2013 Počet stran: 44 Klíčová slova: Analýza přežití; Observační studie; Cenzorování; Kaplanův-Meierův odhad funkce přežití; Coxův regresní model
3 Bibliographic Entry Author: Title of Thesis: Degree programme: Adéla Šenková Faculty of Science, Masaryk University Institute of Biostatistics and Analyses MU Research Centre for Toxic Compounds in the Environment Comparability of patient groups in observational and clinical studies Experimental Biology Field of Study: Computational Biology Supervisor: RNDr. Tomáš Pavlík, Ph.D. Academic Year: 2012/2013 Number of Pages: 44 Keyword: Survival analysis; Observational study; Censoring; Kaplan-Meier estimator; Cox regression model
4 Abstrakt Tato bakalářská práce se věnuje srovnatelnosti skupin pacientů v observačních a klinických studiích, neboť právě srovnatelnost skupin je zásadní pro korektní interpretaci výsledků. V observačních studiích, na rozdíl od klinických studií, není prováděna randomizace, tedy náhodné rozdělení pacientů do skupin, a proto mohou mít pacienti léčení různými postupy různé charakteristiky. Následné srovnání výsledků jejich léčby pomocí jednoduchých statistických metod může být zavádějící. Cílem této bakalářské práce je aplikace jednoduchých statistických metod a modelů na data z Národního onkologického registru a zjištění, zda jsou analýzy prováděné pomocí hodnocení přežití podle jedné proměnné reprezentativní a jejich výsledky srovnatelné nebo ne. K dosažení tohoto cíle používám Kaplanův-Meierův odhad funkce přežití a Coxův regresní model. Abstract This thesis is focused on comparability of patient groups in observational and clinical studies because comparability is essential for correct interpretation of study result. Unlike clinical studies, randomization cannot be used in observational studies that can lead to different characteristic in patients treated with different procedures. Thus, the comparison of treatment results with simple statistical methods may lead to confounding and bias. The aim of this thesis is to apply simple statistical methods and models on data from the Czech National Cancer Registry and to present, whether results gained from simple analysis with one variable are sufficient and comparable or not. The Kaplan-Meier estimator and Cox regression model were used to claim this aim.
5
6
7 Poděkování Na tomto místě bych chtěla poděkovat vedoucímu mé práce panu RNDr. Tomáši Pavlíkovi, Ph.D. za cenné rady při vypracovávání práce. Dále také děkuji všem, kteří mi umožnili studium na vysoké škole a byli mi v jeho průběhu oporou. Prohlášení Prohlašuji, že jsem svoji bakalářskou práci vypracovala samostatně s využitím informačních zdrojů, které jsou v práci citovány. Brno 21. května 2013 Adéla Šenková
8 Obsah 1. Úvod Klinické a observační studie Kohortová studie Studie případů a kontrol Průřezová studie Analýza přežití Cenzorování Funkce přežití Riziková funkce Kaplanův-Meierův odhad funkce přežití Coxův regresní model Věrohodnostní funkce Částečná věrohodnost Interpretace modelu Odhad základního rizika a pravděpodobnosti přežití Propensity skóre Logistická regrese Instrumentální proměnná Karcinom plic Aplikace na data Alimta Kaplanův-Meierův odhad Coxův model Tarceva Kaplanův-Meierův odhad Coxův model Diskuze Závěr Seznam literatury Internetové zdroje
9 1. Úvod Klinické a observační studie jsou základem medicíny založené na důkazech. Podstatou medicíny založené na důkazech je moderní lékařské rozhodování, které spojuje nejlepší poznatky z klinického výzkumu, dále klinické zkušenosti lékaře a očekávání pacienta. Při vyhodnocení výsledků klinického výzkumu je většinou naším cílem srovnání dvou a více skupin pacientů, přičemž srovnatelnost srovnávaných skupin je považována za klíčovou, nicméně ne vždy je jí v dané studii věnována dostatečná pozornost. Hlavním cílem této práce je ověřit, zda jsou srovnávané skupiny pacientů stran hodnocení přežití srovnatelné nebo ne. Následným cílem je ukázat, zda jsou analýzy přežití prováděné pomocí hodnocení dle jedné proměnné reprezentativní nebo zdaje pohled na přežití dle jedné proměnné je nekorektní. V této práci používám jako zástupce jednorozměrné analýzy Kaplanův-Meierův odhad funkce přežití a dále Coxův regresní model, jakožto ukázku vícerozměrné analýzy. K aplikaci výše uvedených metod byla vybrána onkologická diagnóza karcinomu plic, což je jedno z nejčastějších onkologických onemocnění v České republice. Data použitá pro zpracování této práce pochází z Národního onkologického registru ČR a ke zpracování byla poskytnuta v anonymizované podobě Institutem biostatistiky a analýz. 10
10 2. Klinické a observační studie V medicíně rozlišujeme dva základní typy studií observační a klinické studie. V klinické studii výzkumník zjišťuje efekt expozice pomocí náhodného přiřazení experimentální a standardní léčby vybranému vzorku studijních subjektů. V observační studii může výzkumník pouze pozorovat efekt expozice, neovlivňuje její přiřazování studijním subjektům. Proto jsou observační studie mnohem více náchylné k problémům týkajícím se metodologických postupů. Existuje několik důvodů, proč nejsou všechny studie prováděny jako klinické. Základním problémem je zajištění etické stránky experimentů s humánními subjekty. Ty mohou být prováděny pouze za dodržení tří podmínek: 1. Všechny léčebné postupy jsou neškodné nebo pacientům přináší prospěch. 2. Standardní léčba daného onemocnění neexistuje a subjekty souhlasí s randomizací. 3. Výzkumník má možnost kontrolovat průběh randomizace a průběh dané léčebné metody. Pokud tyto podmínky nejsou splněny, považujeme léčbu za neetickou a upřednostňujeme observační studii. Dalším důvodem k použití observační studie je velká časová i finanční náročnost klinických studií. V observačních studiích se používají tři základní typy experimentů kohortové studie (kohort design), studie případů a kontrol (case-control design) a průřezové studie (cross sectional design). Kohortové a průřezové studie jsou prospektivní studie. To znamená, že data sbíráme průběžně se sledováním pacienta, nedíváme se zpět do zdravotnické dokumentace. Naproti tomu studie případů a kontrol je retrospektivní studie, kde vycházíme od onemocnění a vracíme se nazpět k jeho příčině, sledujeme zde předchozí výskyt potenciálních rizikových faktorů. 2.1 Kohortová studie V kohortové studii jsou vymezeny skupiny osob, takzvané kohorty. Ty jsou vymezovány na základě faktoru, o kterém se předpokládá, že by mohl souviset se sledovaným onemocněním. Zpravidla jsou definovány dvě skupiny, exponovaná a neexponovaná, která hraje roli skupiny kontrolní. V době zahájení studie nesmí být žádný hodnocený subjekt nakažen sledovanou nemocí. Obě kohorty jsou následně sledovány po určitou dobu a je porovnáván výskyt sledovaného onemocnění v obou skupinách. Existují dva typy kohortové studie uzavřená a otevřená. V uzavřené studii se zjistí konkrétní počet účastníků, kteří jsou v určitých časových intervalech sledováni a to až do stanoveného data ukončení studie. U otevřené studie je populace dynamická, lidé do studie přicházejí a odcházejí. 2.2 Studie případů a kontrol V této studii je porovnávána skupina případů, což je skupina osob se sledovaným onemocněním, se skupinou jedinců, kteří danou nemoc v době provádění studie nemají, s takzvanými kontrolami. Následně je sledován výskyt potenciálních rizikových faktorů pro danou nemoc v minulosti u obou skupin. Určení obou skupin, případů i kontrol, musí být provedeno precizně, například na základě histologického vyšetření. Je třeba také identifikovat další faktory, jako je například věk, které ovlivní výběr jedinců do skupiny. Nejobtížnější částí studie případů a kontrol je výběr kontrol. Cílem je vybrat jedince tak, 11
11 aby byli co nejvíce podobni případům až na skutečnost, že nejsou nakaženi sledovaným onemocněním. 2.3 Průřezová studie Tato studie sleduje výskyt onemocnění a výskyt rizikových faktorů ke stejnému časovému okamžiku. Průřezová studie nám umožňuje odhadnout procento nemocných a také procento osob s rizikovým faktorem. Dovoluje nám testovat vztah mezi výskytem rizikových faktorů a výskytem nemoci, avšak zpravidla bez možnosti určit, zda expozice předcházela nemoci či naopak. Je vhodná ke studiu časově nezávislých expozic, jako jsou genetické znaky či krevní skupiny. Výsledky asociační analýzy mezi expozicí a onemocněním u časově nezávislých expozic mohou být totiž interpretovány jako příčinné souvislosti. 12
12 3. Analýza přežití Analýza přežití se používá k popisu dat, která se týkají času přežití, čili času od vstupní události (počáteční bod) do výskytu sledované události (koncový bod), a jejich následné analýze. Vstupní událost může být například vstup jedince do studie, začátek léčby, narození, či začátek onemocnění. Za koncový bod považujeme například úmrtí jedince, návrat příznaků nemoci nebo uzdravení pacienta. Jako čas přežití budeme označovat dobu od vstupu jedince do studie do jeho úmrtí. 3.1 Cenzorování Na data přežití lze aplikovat mnoho analytických metod, ale pouze za předpokladu, že se sledovaná událost objeví u všech jedinců. Na konci sledování je však obvyklé, že se událost u několika lidí nevyskytla, a proto je skutečný čas přežití neznámý. Tento fenomén se nazývá cenzorování a může vzniknout následujícími způsoby: (a) do času uzavření studie se u pacienta neprojevila sledovaná událost, (b) pacient byl v průběhu studie ztracen ze sledování, (c) u pacienta se vyskytla jiná událost, která zabránila dalšímu sledování. Událost u jedince může nastat až po konci sledovaného období. Tato situace se nazývá cenzorování zprava. Cenzorování se může také objevit, pokud sledujeme přítomnost určitého stavu, u kterého nevíme, kdy začal. Toto nazýváme cenzorování zleva. Jako příklad vezmeme studii, která zkoumá návrat příznaků rakoviny po operativním odstranění primárního tumoru. Pacienti byli vyšetřeni tři měsíce po operaci. Data těch, u nichž již došlo k návratu onemocnění, jsou cenzorována zleva, protože skutečný čas do návratu nemoci byl kratší než ony tři měsíce. Dalším typem cenzorování je intervalové cenzorování. Jedinec je sledován jen v určitých okamžicích a ne v průběhu celé studie. Událost proto může nastat mezi jednotlivými kontrolami. Příkladem je sledování příznaků nemoci u pacientů při pravidelných lékařských prohlídkách. Při pozitivním nálezů může lékař konstatovat, že k projevu došlo někdy v období od poslední prohlídky, což mohlo být hned den po ní, ale také až v den pozitivního nálezu. Příklad cenzorování je uveden na obrázku 1. Vidíme zde studii, které se zúčastnili 4 pacienti. Písmeno A znamená, že pacient je v době ukončení studie naživu, D že zemřel a písmeno L značí, že pacient byl ztracen ze sledování. Cenzorování zprava vidíme u pacientů 1, 3 a 4. Pacienti 1 a 4 jsou na konci studie stále naživu, čili sledovaná událost (zde úmrtí) u nich do konce studie nenastala. Pacient 3 byl v průběhu studie ztracen ze sledování, proto neznáme jeho stav na konci studie. Nakonec máme pacienta 2, u kterého se vyskytla pozorovaná událost v době studie. Jedná se tedy o necenzorovaný čas přežití. V praxi se nejčastěji vyskytuje cenzorování zprava, proto nadále budeme popisovat metody hodnocení dat cenzorovaných zprava. 13
13 Obrázek 1: Příklad cenzorování 3.2 Funkce přežití Čas přežití jedince reprezentuje náhodná veličina T. Jelikož se jedná o čas, může nabývat pouze nezáporných hodnot. Písmenem t pak označíme konkrétní hodnotu náhodné veličiny T. Funkce přežití, standardně označovaná jako S(t), představuje pravděpodobnost, že jedinec přežije od času zahájení sledování do daného času t. Uvažujeme nezápornou náhodnou veličinu T spojitého typu představující dobu do výskytu události. Její distribuční funkce je definována jako ( )= ( < ) (3.1) a udává pravděpodobnost, že doba přežití jedince je menší než t, neboli pravděpodobnost, že jedinec v čase t už nežije (vyskytla se u něho sledovaná událost). Hustota pravděpodobnosti náhodné veličiny T, f(t), je pak definována jako ( )= ( ). (3.2) Funkce přežití udává pravděpodobnost, že doba přežití jedince je větší nebo rovna t, a je definována vztahem ( )= ( )=1 ( ). (3.3) Funkce přežití tedy udává pravděpodobnost, že jedinec bude v čase t naživu. Obecněji udává pravděpodobnost, že se v intervalu (0, t) sledovaná událost nevyskytne. Při spojitém rozdělení náhodné veličiny T je funkce přežití S(t) spojitá a ryze klesající. Vztah hustoty a funkce přežití lze popsat jako ( )= ( ). (3.4) 14
14 3.3 Riziková funkce Je-li distribuční funkce spojitá funkce s hustotou f(t), lze definovat rizikovou funkci h(t). Riziková funkce nám udává, jak se v čase mění míra rizika, že dojde ke sledované události. Jinak řečeno jde o okamžitou míru výskytu sledované události. S pomocí rizikové funkce tedy můžeme hodnotit, ve kterém časovém intervalu je riziko nastání události největší a ve kterém nejmenší. Vztah mezi funkcí přežití a rizikovou funkcí vypadá následovně h( )= log ( ). (3.5) Pointou vztahů mezi hustotou, funkcí přežití a rizikovou funkcí je, že pokud známe jednu z nich, lze zbývající jednoznačně dopočítat. Místo rizikové funkce se často používá tzv. kumulativní riziková funkce, kterou značíme H(t). Je definována jako ( )= h( ) = log ( ). (3.6) 15
15 4. Kaplanův-Meierův odhad funkce přežití Základním krokem v analýze dat popisujících dobu přežití je jejich prezentace, ať už grafická či numerická. K tomu slouží zejména metody pro odhad funkce přežití. Data mohou být popsána například neparametrickými metodami, které nevyžadují znalost pravděpodobnostního rozložení doby přežití. Mezi tyto metody patří také Kaplanův- Meierův odhad funkce přežití, což je neparametrická metoda, která poskytuje odhad funkce přežití v každém časovém úseku, ve kterém došlo ke sledované události. K sestrojení Kaplanova-Meierova odhadu funkce přežití nejprve rozdělíme dobu sledování do časových intervalů. Každý z těchto intervalů obsahuje alespoň jedno úmrtí, přičemž se čas úmrtí bere jako začátek jednotlivých intervalů. Obecně předpokládejme, že máme n jedinců, u kterých sledujeme časy přežití, které označíme jako t 1, t 2,, t n. Může se zde vyskytnout několik jedinců se stejnou dobou přežití, popřípadě u některých pozorování mohlo nastat cenzorování zprava. Předpokládejme tedy, že existuje r různých časů úmrtí mezi těmito jedinci, kde r je menši nebo rovno n. Doby přežití uspořádáme vzestupně, j-tý čas úmrtí označíme jako t j pro j = 1, 2,, r a dostáváme r uspořádaných časů úmrtí, t 1 < t 2 < < t r. Počet jedinců, kteří jsou naživu před časem t j, označíme n j pro j = 1, 2,, r. Počet jedinců, kteří zemřou v čase t j označíme d j pro j = 1, 2,, r. Máme tedy n j jedinců, kteří jsou naživu před časem t j, a d j úmrtí v čase t j. Pravděpodobnost, že jedinec zemře v daném časovém intervalu, lze odhadnout výrazem. (4.1) Odpovídající pravděpodobnost, že jedinec daný interval přežije, lze odhadnout jako. (4.2) Pravděpodobnost přežití v čase t j, tedy S(t j ), lze vypočítat pomocí pravděpodobnosti přežití v čase t j 1 a S(t j 1) následovně = 1. (4.3) Grafem funkce přežití odhadnuté Kaplanovou-Meierovou metodou je schodovitá funkce, kde mezi každými dvěma sousedními časy úmrtí je funkce konstantní a v jednotlivých časech úmrtí funkce klesá. 16
16 Tabulka 1: Data pro výpočet Kaplanova-Meierova odhadu funkce přežití Počet Čas přežití pacientů v Počet úmrtí Počet Kaplanova-Meierova funkce (týdny) cenzorování přežití, S(t) riziku *(1-1/10) = 0,9 3* S(2)*(1-0/9) = 0, S(3)*(1-1/8) = 0, S(5)*(1-1/7) = 0, S(7)*(1-1/6) = 0, * S(9)*(1-0/5) = 0, S(10)*(1-1/4) = 0, * S(12)*(1-0/3) = 0, S(14)*(1-1/2) = 0, * S(15)*(1-0/1) = 0, Tabulka 1 obsahuje záznam o deseti pacientech. V prvním sloupečku je uveden čas přežití v týdnech, kde cenzorované časy jsou označeny hvězdičkou. Počet pacientů, kteří jsou naživu těsně před časem události, je uveden v druhém sloupci. Například počet pacientů naživu těsně před časem 2 je 10 pacientů. Pravděpodobnost úmrtí pacienta v čase 2 je 1/10. Takže pravděpodobnost, že pacient do této doby přežije je 1 (1/10). Tyto údaje nám již dovolují provést Kaplanův-Meierův odhad funkce přežití, který je uveden v posledním sloupci. Graf této funkce je zobrazen na obrázku 2. Obrázek 2: Kaplanův-Meierův odhad funkce přežití 1,0 Funkce přežívání Ukončené Cenzorované 0,9 0,8 0,7 Podíl žijících pacientů 0,6 0,5 0,4 0,3 0,2 0,1 0, Čas přežívání (týdny) 17
17 5. Coxův regresní model V roce 1972 Cox představil regresní model, který se dnes široce používá v analýze cenzorovaných dat o přežití. Pokud se model používá k analýze pacientů v klinické studii, dovoluje nám odhadnout efekt léčby v přítomnosti dalších proměnných. Regrese se používá k vyjádření vztahu mezi dvěma či více proměnnými. Zjišťujeme vztah mezi závislými proměnnými (např. výška dětí) na základě vysvětlující proměnné (např. věk dítěte). Pokud máme více než jednu vysvětlující proměnnou (např. výška otce), používá se metoda násobné regrese. Coxova metoda je podobná vícenásobné regresi, ale závislou proměnnou je riziková funkce. Coxův model je statistická metoda, pomocí které zjišťujeme vztah mezi přežitím pacienta a různými vysvětlujícími proměnnými. Poskytuje nám odhad efektu sledované proměnné na přežití po adjustaci na další vysvětlující proměnné. Výsledný model z Coxovy regresní analýzy lze sumarizovat rovnicí pro riziko výskytu sledované události v čase jako funkci vysvětlujících proměnných. Při interpretaci Coxova modelu hrají roli regresní koeficienty modelu. Pozitivní regresní koeficient odpovídající vysvětlující proměnné znamená, že riziko je v přítomnosti této proměnné větší, a proto je prognóza horší. Negativní regresní koeficient znamená lepší prognózu pro pacienta s výskytem dané proměnné. Nechť N je počet jedinců ve studii. Coxův model předpokládá, že riziková funkce pro výskyt sledované události pro jedince i s vektorem proměnných x i = (x 1i, x 2i,, x ki ) je ve tvaru (, )= ( ) exp( ), (5.1) pro i = 1,, N (Marubini a Valsecchi, 1995), kde λ 0 (t) je základní riziková funkce a koeficienty β jsou regresní koeficienty. Předpokládáme, že proměnné jsou v čase konstantní, což můžeme, pokud za proměnné považujeme léčbu, pohlaví či věk. Pomocí dvou výrazů ověříme, že riziko (5.1) závisí na čase i na proměnných: první výraz, λ 0 (t), je pouze funkce času, která je ponechána libovolná, ale stejná pro všechny subjekty; druhým výrazem je lineární prediktor, který závisí na proměnných jedince jen přes vektory β regresních koeficientů. Coxův model není plně parametrický, protože není zcela specifikována forma λ 0 (t). Tento model je ale semiparametrický, protože pracuje s parametry ve formě regresních koeficientů. Jednou ze základních vlastností Coxova modelu je, že poměr rizik není závislý na λ 0 (t): (, ) (, ) = ( ) exp( ) ( ) exp( ) =exp ( ). (5.2) To je důvod, proč se model (5.1) označuje jako regresní model proporcionálního rizika. Předpokládá, že riziko výskytu sledované události jakýchkoliv dvou jedinců je v čase proporcionální, což je dáno tím, že poměr (5.2) nezávisí na čase. Předpoklad proporcionálního rizika by měl být v případě použití Coxova modelu otestován. 18
18 Předpoklad proporcionálního rizika otestujeme nejjednodušeji tak, že porovnáváme dvě skupiny bez ostatních proměnných. Nejjednodušší zkouškou je vykreslit si dohromady Kaplanovy-Meierovy křivky. Předpoklad proporcionálního rizika je porušen, pokud se tyto křivky překříží. Pro malé soubory dat, kde může být velké množství chyb spojených s křivkou přežití, je možné, že se křivky budou křížit, i když splňují předpoklad proporcionálního rizika. Více sofistikovaná metoda pro ověření proporcionality je založená na komplementárním log-log grafu. Touto metodou získáme graf, kde proti sobě stojí logaritmus negativního logaritmu odhadované funkce přežití a logaritmus času přežití. Pokud je riziko proporcionální v rámci skupin, dostaneme paralelní křivky. Pokud vztah (5.1) převedeme na logaritmický, získáme ln (, ) ln (, )= ( ). (5.3) To nám ukazuje, že model předpokládá konstantní rozdíl mezi logaritmy rizik. Pokud v (5.2) vezmeme dva jedince, kteří mají vektor proměnných x a 0, poměr jejich rizik je (, ) (, ) = ( )exp ( ) =exp( ). ( ) (5.4) To nám ukazuje, že λ 0 (t) může být brána jako riziková funkce jedince, který má všechny proměnné rovné nule. Z tohoto důvodu je λ 0 (t) označována jako základní riziko (Marubini a Valsecchi, 1995). Druhým předpokladem Coxova modelu (5.1) je, že nezávislé proměnné ovlivňují riziko multiplikativním způsobem, jak je ukázáno v (5.2) a (5.4), nebo ekvivalentně, že nezávislé proměnné ovlivňují logaritmus rizika aditivním způsobem, ukázáno v (5.3). Cox dále navrhl metodu pro odhad koeficientů β, která je nezávislá na λ 0 (t). Tato metoda je založena na formulaci tzv. částečné věrohodnosti. 5.1 Věrohodnostní funkce Metoda maximální věrohodnosti je statistická metoda, která se používá pro odhad parametrů na základě pozorovaných dat. Nechť X je náhodná veličina, x = (x 1,, x n ) jsou její realizace a f(x, θ) je hustota pravděpodobnosti, kde θ je neznámý parametr. Pak funkci (, )= (,,, )= (, ) (5.5) nazýváme věrohodnostní funkce. Věrohodnostní funkce vyjadřuje, jak moc je pravděpodobné, že pozorovaná data pocházejí z rozdělení s hustotou f(x,θ) (Aldrich, 1997). Při použití metody maximální věrohodnosti pro odhad θ hledáme maximum věrohodnostní funkce L(x, θ) vzhledem k θ. Pomocí metody maximální věrohodnosti se snažíme najít hodnotu parametru, pro kterou nabývá věrohodnostní rovnice svého maxima. Při hledání tohoto maxima se častěji pracuje s logaritmem věrohodnostní funkce 19
19 log (, )=log (,,, )= log (, ). (5.6) Jestliže pro všechny možné hodnoty parametru θ existuje hodnota taková, že platí, (, ), (5.7) nazýváme maximálně věrohodným odhadem. Abychom mohli použít věrohodnostní funkci v analýze cenzorovaných dat přežití, musíme ji upravit. Je vhodné použít dvojici proměnných (t i, c i ), kde c je indikátor cenzorování a t doba přežití. Máme dva typy pacientů. Ty, u nichž je doba přežití úplná a ty, u nichž došlo k cenzorování. V prvním případě, kdy c i = 1, bude věrohodnostní funkce obsahovat pravděpodobnost výskytu sledované události tak, jak je uvedeno výše. Ve druhém případě, kdy c i = 0, vyjádříme věrohodnostní funkci pomocí hodnoty funkce přežití. Obecný tvar věrohodnostní funkce pro cenzorovaná data tedy je (, ),,(, ), = (, ) (, ), (5.8) kde θ je parametr zvoleného rozdělení pravděpodobnosti. 5.2 Částečná věrohodnost Předpokládejme, že máme datový soubor s n pozorováními a k odlišnými časy událostí. Nejprve tyto časy setřídíme, čímž dostaneme t 1 < t 2 < < t k, kde t i označuje čas selhání pro i-tého jedince. Pro cenzorovaná pozorování definujeme δ i, které bude rovno 0 pro případy cenzorované zprava a 1 pro necenzorované případy. Funkci částečné věrohodnosti získáme z podmíněné pravděpodobnosti selhání v čase t i, která je dána počtem případů v riziku selhání v čase t i. Ptáme se tedy, jaká je pravděpodobnost, že se událost objevila u i-tého jedince z rizikového vzorku o velikosti n, za podmínky, že událost nastala. Definujeme R(t i ) jako počet případů v riziku v čase t i, což je náš rizikový soubor. Potom pravděpodobnost, že j-tý případ selže v čase T i je dán = ( ) = ( ), (5.9) kde suma ve jmenovateli je součet přes všechny jedince v rizikovém souboru. Když vezmeme výsledek podmíněné pravděpodobnosti v (5.9), získáme tím funkci částečné věrohodnosti = ( ) (5.10) 20
20 s korespondující log-věrohodnostní funkcí log = log. ( ) (5.11) Maximalizováním log-věrohodnosti v (5.11) můžeme získat odhad koeficientů β. 5.3 Interpretace modelu Výsledný model z Coxovy regresní analýzy představuje rovnici pro riziko jako funkci vysvětlujících proměnných. Tabulka 2: Data pro Coxův regresní model Proměnná Regresní Standardní p- 95% IS pro poměr Poměr rizik koeficient chyba hodnota rizik Dolní Horní Věk Pohlaví (0 = žena, = muž) Histologie Histologie (1) Histologie (2) Histologie (3) Skupina (0 = kontrolní, 1 = léčená) Výsledky Coxova modelu jsou ukázány v tabulce 2. Zajímá nás statistická významnost. Pokud interval spolehlivosti zahrnuje jedničku, výsledek není statisticky významný a p-hodnota přesáhne hodnotu 0,05. Statisticky nevýznamné proměnné bereme, jakoby neměly vliv na riziko. Pozitivní znaménko u regresního koeficientu znamená, že pro subjekty s větší hodnotou této proměnné je riziko větší, a proto prognóza horší. Z tabulky 2 vidíme, že histologie (2) a (3) jsou spojené s horším přežitím, zatímco mužské pohlaví je asociováno s lepším přežitím. Individuální regresní koeficient je interpretovatelný velmi jednoduše. Poznamenejme, že pacienti buď byli léčeni (zakódováno jako 1) nebo ne (zakódováno jako 0). Poměr rizik pro léčenou skupinu se vypočítá jako exp (-0,090) = 0,914. To znamená, že riziko pro léčené pacienty je o 9% nižší než pro referenční skupinu, tedy neléčené pacienty. Mezi přežitím nepředpokládáme rozdíl z toho důvodu, že p-hodnota 0,404 není statisticky významná a 95% interval spolehlivosti pro poměr rizik zahrnuje 1. Na závěr tedy řekneme, že neexistuje průkazný rozdíl v celkovém přežití mezi léčenými pacienty a těmi v kontrolní skupině. 21
21 5.4 Odhad základního rizika a pravděpodobnosti přežití Popis odhadnuté pravděpodobnosti přežití se často používá k prezentaci výsledků studie. Při použití Coxova modelu máme odhad regresních koeficientů. Dále ale potřebujeme odhadnout funkci základního rizika λ 0 (t), nebo ekvivalentně funkci kumulativního rizika Λ 0 (t). K odhadu Λ 0 (t) lze použít vztah navržený Breslowem (1974). Na základě předpokladu, že riziková funkce je konstantní mezi každým párem po sobě následujících pozorovaných časů přežití, Breslow odvodil maximálně věrohodný odhad Λ 0 (t). Dále předpokládal, že cenzorovaná pozorování, která se objeví mezi časy t (j) a t (j+1), jsou cenzorována v t (j) a t 0 = 0 je bráno jako počátek pozorování. Odhad λ 0 (t) v intervalu (t (j-1), t (j) ] je dán vztahem =, h exp ( ) (5.12) kde h j = t (j) t (j-1) je časový interval mezi dvěma po sobě následujícími časy přežití. Výraz pro je poměr mezi počtem událostí a váženým počtem člověko-časových jednotek v riziku sledované události, kde každý jedinec v souboru R j přispívá vahou exp (βx j ) pro časový interval h j. Hrubý odhad Λ 0 (t (j) ) Λ 0 (t (j-1) ) je h j. Sečtením takových hodnot přes všechny t (j) t získáme Breslowův odhad kumulativní základní rizikové funkce v čase t ( )=. exp ( ) ( ) (5.13) Odhad kumulativního základního rizika je schodovitá funkce (Marubini a Valsecchi, 1995). 22
22 6. Propensity skóre V roce 1938 Rosenbaum a Rubin definovali tzv. propensity skóre, což je podmíněná pravděpodobnost přiřazení určitého druhu léčby pacientovi na základě pozorovaných proměnných. Propensity skóre lze vnímat jako metodu vážení, protože v závislosti na něm je rozdělení základních měřených proměnných podobné mezi léčenými a neléčenými subjekty. To znamená, že v souboru subjektů se stejným propensity skóre bude rozdělení pozorovaných proměnných stejné mezi léčenými a neléčenými subjekty. Propensity skóre je metoda s cílem eliminovat zkreslení, což je hlavní problém u nerandomizovaných, zejména observačních studií. V observačních studiích se rozdělení proměnných mezi léčenými skupinami značně liší a metody založené na propensity skóre mají za cíl eliminovat tyto rozdíly. Tato metoda poskytuje jednoduchý výstup, který shrne všechny informace z vysvětlujících proměnných jako je vážnost choroby nebo úmrtnost. Předpokladem analýzy propensity skóre je, že můžeme provést objektivní porovnání výsledků léčby mezi subjekty s podobnými propensity skóre. Propensity skóre může být odhadnuto pro každý subjekt pomocí modelu logistické regrese, kde je léčba označena jako závislá proměnná. Při výpočtu je nejprve každému pacientovi přiděleno propensity skóre. Faktory, které pravděpodobně ovlivňují pouze výběr léčby, ale ne výsledek, by v odhadu propensity skóre neměly být zahrnuty. Metodicky lze použít čtyři postupy: 1. stratifikace, která rozdělí pacienty do homogenních podskupin na základě jejich propensity skóre; 2. párování, které v základě spáruje pacienty se stejným nebo skoro stejným propensity skóre v rámci léčebných ramen; 3. adjustace proměnných, kde je propensity skóre zahrnuto jako další proměnná, která se přidává k léčbě v regresním modelu; 4. přidělování vah, které přidělí pacientům různé váhy na základě jejich propensity skóre. Cílem všech těchto přístupů je vytvořit co nejpodobnější vzorky léčených a neléčených pacientů. 6.1 Logistická regrese Logistická regrese je metoda zabývající se problematikou odhadu pravděpodobnosti určitého jevu (závisle proměnné) na základě známých skutečností (nezávisle proměnné), které mohou ovlivnit výskyt jevu. Zjišťujeme závislost mezi dichotomickou veličinou Y, která nabývá hodnoty 0, pokud jev nenastal, nebo hodnoty 1, pokud jev nastal a v nejjednodušším případě jednou nezávislou veličinou X. Nechť p(x) značí podmíněnou pravděpodobnost výskytu sledovaného jevu při dané hodnotě veličiny X = x: (Zvárová a kol., 2003). ( =1 = )= ( ) (6.1) ( =0 = )=1 ( ) (6.2) 23
7 Regresní modely v analýze přežití
7 Regresní modely v analýze přežití Předpokládané výstupy z výuky: 1. Student rozumí významu regresního modelování dat o přežití 2. Student dokáže definovat pojmy poměr rizik a základní riziková funkce
2 Hlavní charakteristiky v analýze přežití
2 Hlavní charakteristiky v analýze přežití Předpokládané výstupy z výuky: 1. Student umí definovat funkci přežití, rizikovou funkci a kumulativní rizikovou funkci a zná funkční vazby mezi nimi 2. Student
8 Coxův model proporcionálních rizik I
8 Coxův model proporcionálních rizik I Předpokládané výstupy z výuky: 1. Student umí formulovat Coxův model proporcionálních rizik 2. Student rozumí významu regresních koeficientů modelu 3. Student zná
Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy
Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy Relativní riziko a poměr šancí Princip korelace dvou náhodných veličin Korelační koeficienty Pearsonůva Spearmanův Korelace a kauzalita
RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 8 Jak analyzovat přežití pacientů.
VÝBĚR A JEHO REPREZENTATIVNOST
VÝBĚR A JEHO REPREZENTATIVNOST Induktivní, analytická statistika se snaží odhadnout charakteristiky populace pomocí malého vzorku, který se nazývá VÝBĚR neboli VÝBĚROVÝ SOUBOR. REPREZENTATIVNOST VÝBĚRU:
RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných
4 Parametrické odhady
4 Parametrické odhady Předpokládané výstupy z výuky: 1. Student zná základní rozdělení pravděpodobnosti dat přežití 2. Student rozumí principu odhadu funkce přežití a rizikové funkce s využitím metody
Hodnocení a modelování populačních dat na příkladu epidemiologie vážných chorob: I. Analýza dat, princip predikcí.
Hodnocení a modelování populačních dat na příkladu epidemiologie vážných chorob: I. Analýza dat, princip predikcí. Úvod do matematické biologie Tomáš Pavlík & O. Májek, L. Dušek, J. Mužík, E. Gelnarová,
Současné trendy v epidemiologii nádorů se zaměřením na Liberecký kraj
Institut biostatistiky a analýz, Lékařská a přírodovědecká fakulta, Masarykova univerzita, Brno Současné trendy v epidemiologii nádorů se zaměřením na Mužík J. Epidemiologie nádorů v ČR Epidemiologická
Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1
Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu
TULUNG - AVASTIN. Klinický registr pacientů s nemalobuněčným karcinomem plic. Stav registru k datu 26. 3. 2012
TULUNG - AVASTIN Klinický registr pacientů s nemalobuněčným karcinomem plic Stav registru k datu 26. 3. 2012 Management projektu: Analýza dat: Technické zajištění: Mgr. Karel Hejduk, Ing. Petr Brabec Mgr.
CEBO: (Center for Evidence Based Oncology) Incidence Kostních příhod u nádorů prsu PROJEKT IKARUS. Neintervenční epidemiologická studie
CEBO: (Center for Evidence Based Oncology) Incidence Kostních příhod u nádorů prsu PROJEKT Neintervenční epidemiologická studie PROTOKOL PROJEKTU Verze: 4.0 Datum: 26.09.2006 Strana 2 PROTOKOL PROJEKTU
Jednofaktorová analýza rozptylu
I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých
TULUNG - AVASTIN. Klinický registr pacientů s nemalobuněčným karcinomem plic. Stav registru k datu 17. 9. 2012
TULUNG - AVASTIN Klinický registr pacientů s nemalobuněčným karcinomem plic Stav registru k datu 17. 9. 2012 Management projektu: Analýza dat: Technické zajištění: Mgr. Karel Hejduk, Ing. Petr Brabec Mgr.
Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II
Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické
Jana Vránová, 3. lékařská fakulta, UK Praha
Jana Vránová, 3. lékařská fakulta, UK Praha Byla navržena v 60tých letech jako alternativa k metodě nejmenších čtverců pro případ, že vysvětlovaná proměnná je binární Byla především používaná v medicíně
Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)
Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich
Epidemiologické metody
6. SEMINÁŘ RIZIKA Epidemiologické metody Posuzování vztahů mezi nemocemi a jejich příčinami a podmínkami vzniku. Důležitou roli zde má statistika poskytuje metody pro měření asociace mezi jevy Pro posouzení
Rozbor léčebné zátěže Thomayerovy nemocnice onkologickými pacienty a pilotní prezentace výsledků péče
Rozbor léčebné zátěže Thomayerovy nemocnice onkologickými pacienty a pilotní prezentace výsledků péče Výstupy analýzy dat zdravotnického zařízení a Národního onkologického registru ČR Prof. MUDr. Jitka
Lékový registr ALIMTA
Lékový registr Pravidelný report Maligní pleurální mezoteliom (MPM) Stav registru k datu 19. 10. 2015 Pneumoonkologická centra zapojená v projektu Alimta 1. FN Brno Jihlavská 20, 625 00 Brno - Bohunice
BRONCHOGENNÍ KARCINOM
Nádory plic, pleury a mediastina: BRONCHOGENNÍ KARCINOM Jiří Ferda, Eva Ferdová, Hynek Mírka, Boris Kreuzberg Klinika zobrazovacích metod LFUK a FN v Plzni Epidemiologie Nejčastější malignita v celosvětovém
KGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení
Hodnocení populačního přežití pacientů diagnostikovaných s C20 v ČR Projekt Diagnóza C20 - vzdělávání, výzkum a lékařská praxe
Hodnocení populačního přežití pacientů diagnostikovaných s C20 v ČR Projekt Diagnóza C20 - vzdělávání, výzkum a lékařská praxe CZ.2.17/1.1.00/32257 Motivace a cíle přednášky 1. Srovnání 5letého přežití
CORECT - VECTIBIX. Klinický registr pacientů s metastatickým kolorektálním karcinomem. Stav registru k datu
CORECT - VECTIBIX Klinický registr pacientů s metastatickým kolorektálním karcinomem Stav registru k datu 26. 3. 2012 Management projektu: Analýza dat: Technické zajištění: Mgr. Karel Hejduk, Ing. Petr
Jana Vránová, 3. lékařská fakulta UK
Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace
Regresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení
2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků
Epidemiologická onkologická data v ČR a jejich využití
Institut biostatistiky a analýz Lékařská a Přírodovědecká fakulta Masarykova univerzita, Brno Současné trendy v epidemiologii nádorů se zaměřením na Mužík J. Epidemiologická onkologická data v ČR a jejich
Regresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
Motivace. Náhodný pokus, náhodný n jev. Pravděpodobnostn. podobnostní charakteristiky diagnostických testů, Bayesův vzorec
Pravděpodobnostn podobnostní charakteristiky diagnostických testů, Bayesův vzorec Prof.RND.Jana Zvárov rová,, DrSc. Motivace V medicíně má mnoho problémů pravěpodobnostní charakter prognóza diagnoza účinnost
AVDAT Klasický lineární model, metoda nejmenších
AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i
Počty pacientů v lékových registrech ČOS
Počty pacientů v lékových registrech ČOS Průběžná zpráva - stav k říjnu 2010 Registry: Herceptin, Avastin, Tarceva, Erbitux, Renis, Alimta, Lapatinib R.Vyzula, L.Dušek Celkový přehled stavu registrů validní
TARCEVA klinický registr
TARCEVA klinický registr Karcinom pankreatu Stav k datu 10. 10. 2011 Analýza dat: Mgr. Zbyněk Bortlíček Informační technologie: RNDr. Daniel Klimeš, Ph.D. Management projektu: Ing. Petr Brabec, Mgr. Karel
analýzy dat v oboru Matematická biologie
INSTITUT BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Komplexní přístup k výuce analýzy dat v oboru Matematická biologie Tomáš Pavlík, Daniel Schwarz, Jiří Jarkovský,
Hodnocení segmentu centrové léčby z dat plátců zdravotní péče. Společné pracoviště ÚZIS ČR a IBA MU
Hodnocení segmentu centrové léčby z dat plátců zdravotní péče Společné pracoviště ÚZIS ČR a IBA MU Realita současné české medicíny: úspěšné výsledky léčby = podstatné prodlužování doby života pacienta
TARCEVA klinický registr
TARCEVA klinický registr Karcinom pankreatu Stav k datu 10. 4. 2011 Registr Tarceva je podporován výzkumným ý grantem firmy Roche. Česká onkologická společnost Institut biostatistiky a analýz Stav registru
Statistická teorie učení
Statistická teorie učení Petr Havel Marek Myslivec přednáška z 9. týdne 1 Úvod Představme si situaci výrobce a zákazníka, který si u výrobce objednal algoritmus rozpoznávání. Zákazník dodal experimentální
Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)
VYBRANÉ TESTY NEPARAMETRICKÝCH HYPOTÉZ TESTY DOBRÉ SHODY Název testu Předpoklady testu Testová statistika Nulové rozdělení test dobré shody Očekávané četnosti, alespoň 80% očekávaných četností >5 ( ) (p
10. Předpovídání - aplikace regresní úlohy
10. Předpovídání - aplikace regresní úlohy Regresní úloha (analýza) je označení pro statistickou metodu, pomocí nichž odhadujeme hodnotu náhodné veličiny (tzv. závislé proměnné, cílové proměnné, regresandu
STATISTICKÉ ODHADY Odhady populačních charakteristik
STATISTICKÉ ODHADY Odhady populačních charakteristik Jak stanovit charakteristiky rozložení sledované veličiny v základní populaci? Populaci většinou nemáme celou k dispozici, musíme se spokojit jen s
Odhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
Lékový registr ALIMTA
Lékový registr Pravidelný report Maligní pleurální mezoteliom (MPM) Stav registru k datu 31. 3. 2014 Pneumoonkologická centra zapojená v projektu Alimta 1. FN Brno Jihlavská 20, 625 00 Brno - Bohunice
1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou
Oficiální výsledky Národního programu mamografického screeningu v roce 2016
Oficiální výsledky Národního programu mamografického screeningu v roce 2016 Jan Daneš, Miroslava Skovajsová, Helena Bartoňková Analýza dat: Ondřej Májek, Ondřej Ngo, Markéta Kněžínková, Daniel Klimeš,
10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.
0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti
jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.
Parametrické metody odhadů z neúplných výběrů 2 1 Metoda maximální věrohodnosti pro cenzorované výběry 11 Náhodné cenzorování Při sledování složitých reálných systémů často nemáme možnost uspořádat experiment
Léčebné predikce u karcinomu prsu pro rok 2013 chystané novinky
Léčebné predikce u karcinomu prsu pro rok 2013 chystané novinky Prof. MUDr. Jitka Abrahámová, DrSc Onkologická klinika TN a 1. LF UK KOC (NNB + VFN + TN) St Gallén 2011 Rozsah onemocnění T, N, M ER, PgR
Odhady - Sdružené rozdělení pravděpodobnosti
Odhady - Sdružené rozdělení pravděpodobnosti 4. listopadu 203 Kdybych chtěl znát maximum informací o náhodné veličině, musel bych znát všechny hodnoty, které mohou padnout, a jejich pravděpodobnosti. Tedy
Analýzy pro Kraj Vysočina
Příloha č. 10 zprávy ČOS: Podklady pro plánování nákladů léčebné péče v onkologii - analýzy dostupných populačních dat v ČR Analýzy pro Kraj Vysočina Koncept zprávy, metodika výpočtů a celkové populační
7. Rozdělení pravděpodobnosti ve statistice
7. Rozdělení pravděpodobnosti ve statistice Statistika nuda je, má však cenné údaje, neklesejte na mysli, ona nám to vyčíslí Jednou z úloh statistiky je odhad (výpočet) hodnot statistického znaku x i,
Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně
Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný
Analýzy pro Hlavní město Praha
Příloha č. 01 zprávy ČOS: Podklady pro plánování nákladů léčebné péče v onkologii - analýzy dostupných populačních dat v ČR Analýzy pro Hlavní město Praha Koncept zprávy, metodika výpočtů a celkové populační
Analýzy pro Zlínský kraj
Příloha č. 13 zprávy ČOS: Podklady pro plánování nákladů léčebné péče v onkologii - analýzy dostupných populačních dat v ČR Analýzy pro Zlínský kraj Koncept zprávy, metodika výpočtů a celkové populační
Analýzy pro Plzeňský kraj
Příloha č. 04 zprávy ČOS: Podklady pro plánování nákladů léčebné péče v onkologii - analýzy dostupných populačních dat v ČR Analýzy pro Plzeňský kraj Koncept zprávy, metodika výpočtů a celkové populační
Analýzy pro Liberecký kraj
Příloha č. 07 zprávy ČOS: Podklady pro plánování nákladů léčebné péče v onkologii - analýzy dostupných populačních dat v ČR Analýzy pro Liberecký kraj Koncept zprávy, metodika výpočtů a celkové populační
Analýzy pro Jihočeský kraj
Příloha č. 0 zprávy ČOS: Podklady pro plánování nákladů léčebné péče v onkologii - analýzy dostupných populačních dat v ČR Analýzy pro Jihočeský kraj Koncept zprávy, metodika výpočtů a celkové populační
Analýzy pro Středočeský kraj
Příloha č. 02 zprávy ČOS: Podklady pro plánování nákladů léčebné péče v onkologii - analýzy dostupných populačních dat v ČR Analýzy pro Středočeský kraj Koncept zprávy, metodika výpočtů a celkové populační
Analýzy pro Olomoucký kraj
Příloha č. 12 zprávy ČOS: Podklady pro plánování nákladů léčebné péče v onkologii - analýzy dostupných populačních dat v ČR Analýzy pro Olomoucký kraj Koncept zprávy, metodika výpočtů a celkové populační
Analýzy pro Moravskoslezský kraj
Příloha č. 14 zprávy ČOS: Podklady pro plánování nákladů léčebné péče v onkologii - analýzy dostupných populačních dat v ČR Analýzy pro Moravskoslezský kraj Koncept zprávy, metodika výpočtů a celkové populační
R.A. Burger, 1 M.F. Brady, 2 J. Rhee, 3 M.A. Sovak, 3 H. Nguyen, 3 M.A. Bookman 4
NEZÁVISLÉ RADIOLOOGICKÉ HODNOCENÍ STUDIE FÁZE III GOG218 S BEVACIZUMABEM (BEV) V PRIMÁRNÍ LÉČBĚ POKROČILÉHO EPITELOVÉHO NÁDORU VAJEČNÍKŮ, PRIMÁRNÍHO NÁDORU PERITONEA NEBO VEJCOVODŮ. R.A. Burger, 1 M.F.
ProGastrin-Releasing Peptide (ProGRP) u nemocných s malobuněčným karcinomem plic
ProGastrin-Releasing Peptide (ProGRP) u nemocných s malobuněčným karcinomem plic FONS Symposium klinické biochemie Pardubice, 23.9. 25.9.202 M. Tomíšková, J. Skřičková, I. Klabenešová, M. Dastych 2 Klinika
Analýzy pro Karlovarský kraj
Příloha č. 05 zprávy ČOS: Podklady pro plánování nákladů léčebné péče v onkologii - analýzy dostupných populačních dat v ČR Analýzy pro Karlovarský kraj Koncept zprávy, metodika výpočtů a celkové populační
MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci
MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým
Přednáška II. Vztah pravděpodobnosti, statistiky a biostatistiky
řednáška II. Vztah pravděpodobnosti, statistiky a biostatistiky Statistika vychází z pravděpodobnosti odmíněná pravděpodobnost, Bayesův vzorec Senzitivita, specificita, prediktivní hodnoty Frekventistická
Patologie a klasifikace karcinomu prostaty, Gleasonův systém. MUDr. Marek Grega. Ústav patologie a molekulární medicíny 2. LF UK a FN v Motole
Patologie a klasifikace karcinomu prostaty, Gleasonův systém MUDr. Marek Grega Ústav patologie a molekulární medicíny 2. LF UK a FN v Motole Nádory prostaty v z každé buňky, která vytváří komplexní uspořádání
MÍRY ZÁVISLOSTI (KORELACE A REGRESE)
zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky
Úvod do analýzy rozptylu
Úvod do analýzy rozptylu Párovým t-testem se podařilo prokázat, že úprava režimu stravování a fyzické aktivity ve vybrané škole měla vliv na zlepšené hodnoty HDLcholesterolu u školáků. Pro otestování jsme
CHOVÁNÍ SILOFUNKCÍ TESTŮ V COXOVĚ MODELU PROPORCIONÁLNÍCH RIZIK
CHOVÁNÍ SILOFUNKCÍ TESTŮ V COXOVĚ MODELU PROPORCIONÁLNÍCH RIZIK Aneta Andrášiková 1, Eva Fišerová 1, Silvie Bělašková 2 1 Univerzita Palackého v Olomouci, PřF, KMaAM 2 Fakultní nemocnice u sv. Anny v Brně,
Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.
Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní
Ilustrační příklad odhadu LRM v SW Gretl
Ilustrační příklad odhadu LRM v SW Gretl Podkladové údaje Korelační matice Odhad lineárního regresního modelu (LRM) Verifikace modelu PEF ČZU Praha Určeno pro posluchače předmětu Ekonometrie Needitovaná
EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy
EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy Ekonometrická analýza proces, skládající se z následujících fází: a) specifikace b) kvantifikace c) verifikace d) aplikace Postupné zpřesňování jednotlivých
NEMALOBUNĚČNÝ KARCINOM PLIC Nemalobuněčný karcinom (výskyt v %) Muži Ženy
NEMALOBUNĚČNÝ KARCINOM PLIC Nemalobuněčný karcinom (výskyt v %) Muži Ženy spinocelulární karcinom 40 20 prof. MUDr. Jana Skřičková, CSc., MUDr. Marcela Tomíšková, MUDr. Jana Kaplanová, Klinika nemocí plicních
Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů
Inferenční statistika - úvod z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů Pravděpodobnost postupy induktivní statistiky vycházejí z teorie pravděpodobnosti pravděpodobnost, že
Hrudní chirurgie na Chirurgické klinice 1. LF a FTNsP a chirurgická léčba karcinomu plic
Hrudní chirurgie na Chirurgické klinice 1. LF a FTNsP a chirurgická léčba karcinomu plic Chirurgická klinika 1.LF a FTNsP Přednosta: Doc. MUDr. V. Visokai, PhD. Hytych V., Vernerová A., Horažďovský P.,
KOLOREKTÁLNÍ KARCINOM: VÝZVA PRO ZDRAVÝ ŽIVOTNÍ STYL, SCREENING A ORGANIZACI LÉČEBNÉ PÉČE
KOLOREKTÁLNÍ KARCINOM: VÝZVA PRO ZDRAVÝ ŽIVOTNÍ STYL, SCREENING A ORGANIZACI LÉČEBNÉ PÉČE Brno, 29. května 2015: Moravská metropole se již počtvrté stává hostitelem mezinárodní konference Evropské dny
SPRÁVNÁ INTERPRETACE INDIKÁTORŮ KVALITY MAMOGRAFICKÉHO SCREENINGU. Májek, O., Svobodník, A., Klimeš, D.
SPRÁVNÁ INTERPRETACE INDIKÁTORŮ KVALITY MAMOGRAFICKÉHO SCREENINGU Májek, O., Svobodník, A., Klimeš, D. Smysl indikátorů kvality Statisticky významné snížení úmrtnosti lze očekávat až po delší době, posouzení
Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.
Střední hodnota a rozptyl náhodné veličiny, vybraná rozdělení diskrétních a spojitých náhodných veličin, pojem kvantilu Ing. Michael Rost, Ph.D. Príklad Předpokládejme že máme náhodnou veličinu X která
RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 4 Jak a kdy použít parametrické a
Registr Herceptin Karcinom prsu
I. Primární diagnostika Registr Herceptin Karcinom prsu Vstupní parametry Rok narození Věk Kód zdravotní pojišťovny (výběr) o 111 o 201 o 205 o 207 o 209 o 211 o 213 o 217 o 222 Datum stanovení diagnózy
Cvičení 12: Binární logistická regrese
Cvičení 12: Binární logistická regrese Příklad: V roce 2014 konalo státní závěrečné zkoušky bakalářského studia na jisté fakultě 167 studentů. U každého studenta bylo zaznamenáno jeho pohlaví (0 žena,
Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.
Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost
CZ.1.07/1.5.00/34.0527
Projekt: Příjemce: Digitální učební materiály ve škole, registrační číslo projektu CZ.1.07/1.5.00/34.0527 Střední zdravotnická škola a Vyšší odborná škola zdravotnická, Husova 3, 371 60 České Budějovice
Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.
Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení
INDUKTIVNÍ STATISTIKA
10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ
RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 3 Jak a kdy použít parametrické a
Mikromorfologická diagnostika bronchogenního karcinomu z pohledu pneumologické cytodiagnostiky
Mikromorfologická diagnostika bronchogenního karcinomu z pohledu pneumologické cytodiagnostiky P. Žáčková Pneumologická klinika 1. LFUK Thomayerova nemocnice Úvod a definice Každá buňka obsahuje informace
Nové predikce počtu pacientů
INSTITUT BIOSTATISTIKY A ANALÝZ Přírodovědecká a Lékařská fakulta, Masarykova univerzita, Brno, Česká republika Nové predikce počtu pacientů a informační novinky 11.9. 9 CO ISRegistration Information System
Biologická léčba karcinomu prsu. Prof. MUDr. Jitka Abrahámová, DrSc. Onkologická klinika 1.LF UK a TN KOC (NNB+VFN+TN)
Biologická léčba karcinomu prsu Prof. MUDr. Jitka Abrahámová, DrSc. Onkologická klinika 1.LF UK a TN KOC (NNB+VFN+TN) Cílená léčba Ca prsu Trastuzumab (HercepNn) AnN HER2 neu pronlátka LapaNnib (Tyverb)
JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica
JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu
Normální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký
Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup
Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009
AVDAT Nelineární regresní model
AVDAT Nelineární regresní model Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Nelineární regresní model Ey i = f (x i, β) kde x i je k-členný vektor vysvětlujících proměnných
Induktivní statistika. z-skóry pravděpodobnost
Induktivní statistika z-skóry pravděpodobnost normální rozdělení Z-skóry umožňují najít a popsat pozici každé hodnoty v rámci rozdělení hodnot a také srovnávání hodnot pocházejících z měření na rozdílných
ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.
ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz PŘEHLED TESTŮ rozdělení normální spojité alternativní / diskrétní
Analýza dat na PC I.
CENTRUM BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Analýza dat na PC I. Popisná analýza v programu Statistica IBA výuka Základní popisná statistika Popisná statistika
Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina
Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi
Registr Avastin Nemalobuněčný karcinom plic
Registr Avastin Nemalobuněčný karcinom plic Formulář: Vstupní parametry Rok narození Věk Pohlaví Kouření o Kuřák o Bývalý kuřák o Nekuřák Hmotnost pacienta v době diagnózy (kg) Hmotnost pacienta v době