Hodnocení a modelování populačních dat na příkladu epidemiologie vážných chorob: I. Analýza dat, princip predikcí. Úvod do matematické biologie Tomáš Pavlík & O. Májek, L. Dušek, J. Mužík, E. Gelnarová, J. Koptíková, & panel expertů ČOS.
Motivace Epidemiologie nádorových onemocnění je standardně popisována pomocí klasických charakteristik incidence a prevalence. Pro plánování onkologické zátěže zdravotnických zařízení je však jejich použití omezené. Chceme dospět k odhadu počtu potenciálně léčených pacientů.
Cíle Cíl České onkologické společnosti a VZP: Prediktivní odhady nákladů onkologické péče v ČR zahrnutí do zdravotně pojistného plánu Cíl IBA: Vytvoření odpovídajícího modelu pro odhad počtu potenciálně léčených onkologických pacientů v ČR na základě dostupných dat = populačních dat).
Definice pojmů Incidence je počet nových případů zhoubných novotvarů v populaci v určitém časovém intervalu např. rok), tento počet může být vztažen na 0 000 obyvatel dané populace. Prevalence sumarizuje počet všech žijících pacientů, kteří kdykoliv v minulosti prodělali dané onemocnění. Návratem onemocnění budeme rozumět opětovný výskyt onemocnění po určité době cca rok) od primární terapie. Biologická terapie je léčba, která je schopná cíleně atakovat nádorové buňky a s pomocí imunitního systému zastavit jejich růst nebo je případně ničit.
Model přehled Data Národního onkologického registru Incidence Prevalence Počet pacientů s návratem onemocnění Počet potenciálně léčených pacientů
Model detail Historie data NOR 00 00 00 00 0 Predikovaný rok 0 Čas Známá incidence I II V I II V I II V I II V I II V
Model detail Historie data NOR 00 00 00 00 0 Predikovaný rok 0 Čas Známá incidence I II V I II V I II V I II V I II V I II V. Incidence
Model detail Historie data NOR 00 00 00 00 0 Predikovaný rok 0 Čas Známá incidence I II V I II V I II V I II V I II V I II V Pravděpodobnost přežití z minulých let. Počet pacientů diagnostikovaných v minulosti a žijících v roce 0. Incidence
Model detail Historie data NOR 00 00 00 00 0 Predikovaný rok 0 Čas Známá incidence I II V I II V I II V I II V I II V I II V Pravděpodobnost přežití z minulých let. Počet pacientů diagnostikovaných v minulosti a žijících v roce 0. Prevalence. Incidence
Model detail Historie data NOR 00 00 00 00 0 Predikovaný rok 0 Čas Známá incidence I II V I II V I II V I II V I II V I II V Pravděpodobnost přežití z minulých let. Počet pacientů diagnostikovaných v minulosti a žijících v roce 0. Prevalence. Incidence Pravděpodobnost návratu onemocnění Podíl skutečně léčených pacientů Podíl skutečně léčených pacientů. Počet potenciálně léčených pacientů v roce 0
Další klíčové prvky modelu Stratifikace dle stadia onemocnění míra závažnosti onemocnění. Zohlednění věku při diagnóze zásadní faktor ovlivňující výhled pacienta. Zohlednění demografického vývoje ČR počet nádorů je ovlivňován i stárnutím populace.
Značení incidence pacientů diagnostikovaných ve věku a, ve stadiu s v roce y i. pravděpodobnost přežití i let od diagnózy u pacientů diagnostikovaných ve věku a, ve stadiu s. prevalence pacientů diagnostikovaných ve věku a, ve stadiu s v roce y. pravděpodobnost návratu onemocnění po i letech od diagnózy u pacientů diagnostikovaných ve věku a, ve stadiu s. pravděpodobnost nasazení protinádorové léčby u pacienta věku a, ve stadiu s v roce y.
Odhad incidence nově diagnostikovaných pacientů
Model detail Historie data NOR 00 00 00 00 0 Predikovaný rok 0 Čas Známá incidence I II V I II V I II V I II V I II V I II V Pravděpodobnost přežití z minulých let. Počet pacientů diagnostikovaných v minulosti a žijících v roce 0. Prevalence. Incidence Pravděpodobnost návratu onemocnění Podíl skutečně léčených pacientů Podíl skutečně léčených pacientů. Počet potenciálně léčených pacientů v roce 0
Úkoly. Z časové řady nově diagnostikovaných ZN v jednotlivých letech predikovat stav v roce 0.. Vzhledem ke zpoždění v hlášení dat Národního onkologického registru je nutné predikovat i incidenci v předchozích letech.. Doplnit odhady mírou jejich variability: % intervalem spolehlivosti.
Řešení Použití zobecněného lineárního modelu Vysvětlující proměnné čas a věk při diagnóze Dvě linkovací funkce Logaritmus pro klesající trend: Identita pro rostoucí trend: Problém overdisperze Variabilita daná Poissonovým rozdělením je podhodnocena Nutná korekce odhadu variability disperzním parametrem.
Odhad počtu žijících pacientů diagnostikovaných v minulosti
Model detail Historie data NOR 00 00 00 00 0 Predikovaný rok 0 Čas Známá incidence I II V I II V I II V I II V I II V I II V Pravděpodobnost přežití z minulých let. Počet pacientů diagnostikovaných v minulosti a žijících v roce 0. Prevalence. Incidence Pravděpodobnost návratu onemocnění Podíl skutečně léčených pacientů Podíl skutečně léčených pacientů. Počet potenciálně léčených pacientů v roce 0
Úkoly. Na základě odhadu x letého přežití onkologických pacientů a zaznamenané případně odhadnuté) incidence odhadnout počet pacientů s historií nádorového onemocnění žijících v daném roce.. Doplnit odhady mírou jejich variability: % intervalem spolehlivosti.
Řešení Odhad pomocí konvoluce funkce incidence a funkce přežití Použití zaznamenaných i odhadnutých hodnot incidence Použití adekvátních odhadů funkce přežití
Adekvátní odhady funkce přežití? Modely přežití se zohledněním časových období vedou k odhadu funkce přežití se skoky. Modifikace výpočtu přežití metoda moving window.
Princip našeho moving window 0 0 000 00 00 00 00 0 0 000 00 00 00 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Odhad pravděpodobnosti x-letého přežití metodou Life-table Čas Rok diagnózy S i) i=,, S i) i=,, S i) i=,, S i) i=,, S i) i=,, S 000 i) i=,, ) ) ) ) ) ), ), ), ), ) ) ), ), ), ), ) ) ) ) ) ) ) ) ) i S i S i S i S i S median SE i S SE w Y t i w Y t i S i S i S i S i S median i S t t t t t M M t t t t t = = = S) S) S) S) S) S) S) S) S0) S) S) S) S) S) S) S) S) S) S) S) S) S) S) S) S) S) S) S) S) S) S) S) S) S) S) S) S0) S) S) S) S) S) S) S) S) S) S) S) S) S) S) S) S) S) S) S) kde t je počáteční rok diagnózy definující kohortu pacientů. Y M je rok ukončení sledování v populačním registru. w je počet kalendářních let definujících kohortu, tzn. šířka moving window let). i je index určující pravděpodobnost přežití i let od diagnózy.
Odhad pravděpodobnosti návratu onemocnění
Model detail Historie data NOR 00 00 00 00 0 Predikovaný rok 0 Čas Známá incidence I II V I II V I II V I II V I II V I II V Pravděpodobnost přežití z minulých let. Počet pacientů diagnostikovaných v minulosti a žijících v roce 0. Prevalence. Incidence Pravděpodobnost návratu onemocnění Podíl skutečně léčených pacientů Podíl skutečně léčených pacientů. Počet potenciálně léčených pacientů v roce 0
Úkoly. Odhadnout pravděpodobnost, že pacienta žijícího x let od diagnózy postihne návrat onemocnění NO) ne všichni žijící pacienti musí být daný rok nutně léčeni. O NO lze mluvit až po roce od diagnózy.. Uvážit různé formy NO zde terminální a ne terminální terminal & non terminal cancer recurrence).
Řešení Nelze použití údaje o vývoji stadia onemocnění v čase, protože neexistují. Nutné použití zástupných informací. Ne terminální NO použití informací o stavu žije/nežije) a léčbě léčen/neléčen) pacienta v čase dostupné z tzv. kontrolních hlášení). Stav žije se záznamem o protinádorové léčbě indikují NTNO. Terminální NO použití informací o úmrtí na diagnózu. Záznam o úmrtí na danou onkologickou diagnózu indikuje fakt, že pacient prošel terminálním stadiem onemocnění TNO).
Odhad pravděpodobnosti podání protinádorové léčby
Model detail Historie data NOR 00 00 00 00 0 Predikovaný rok 0 Čas Známá incidence I II V I II V I II V I II V I II V I II V Pravděpodobnost přežití z minulých let. Počet pacientů diagnostikovaných v minulosti a žijících v roce 0. Prevalence. Incidence Pravděpodobnost návratu onemocnění Podíl skutečně léčených pacientů Podíl skutečně léčených pacientů. Počet potenciálně léčených pacientů v roce 0
Úkol. Odhadnout pravděpodobnost, že nově diagnostikovaný pacient nebo pacient s návratem onemocnění bude v daném roce skutečně léčen.. Tedy odhadnout, jak se v ČR vyvíjí podíl skutečně léčených pacientů dle stadia onemocnění a věku.
Řešení Použití zobecněného lineárního modelu Vysvětlující proměnné čas a věk při diagnóze Linkovací funkce Logit link tedy logistická regrese
Aplikace modelu: predikce počtu pacientů s CRC pro rok 0
Data Národní onkologický registr pacienti s kolorektálním karcinomem ICD codes C C0) primárně diagnostikovaných pacientů od roku Bez DCO a pacientů diagnostikovaných při pitvě Stadia: III, III, IV Věkové kategorie: let, 0 let, let a 0 let Časová období:, 0 a 00
Predikce incidence CRC pro rok 0 0 0 0 Data NOR: Predikce: Stadium III Stadium III Stadium IV Horní % IS Bodový odhad Dolní % IS Počet nově diagnostikovaných pacientů na 0 000 obyvatel 0 000 00 00 00 00 00 00 00 00 00 0 0 Roky
Odhady přežití pacientů s CRC v ČR Stadium I II Stadium III Stadium IV Přežití let 0 let let 0 let let 0 let let 0 let let 0 let let 0 let leté % % % % % 0% % % 0% % % % leté % % 0% % % % % % % % % % leté 0% % % % % % % % % % % % leté % % % % % 0% % % % % % % leté % % % % % % % 0% % % % 0% 0leté 0% % % 0% % % % 0% % 0% 0% 0% 0leté 0% % 0% 0% % % 0% 0% % 0% 0% 0%
Pravděpodobnost návratu onemocnění pro stadia III Ne terminální NO Terminální NO 0% 0% Pravděpodobnost NTNO 0% 0% 0% 0% % Pravděpodobnost TNO 0% 0% 0% 0% % 0% 0% Ukončené roky od diagnózy Ukončené roky od diagnózy Legenda: let 0 let let 0 let
Pravděpodobnost návratu onemocnění pro stadium III Ne terminální NO Terminální NO 0% 0% Pravděpodobnost NTNO 0% 0% 0% 0% % Pravděpodobnost TNO 0% 0% 0% 0% % 0% 0% Ukončené roky od diagnózy Ukončené roky od diagnózy Legenda: let 0 let let 0 let
Pravděpodobnost návratu onemocnění pro stadium IV Ne terminální NO Terminální NO 0% 0% Pravděpodobnost NTNO 0% 0% 0% 0% % Pravděpodobnost TNO 0% 0% 0% 0% % 0% 0% Ukončené roky od diagnózy Ukončené roky od diagnózy Legenda: let 0 let let 0 let
Odhad počtu potenciálně léčených pacientů pro rok 0 Stadium při diagnóze Počet potenciálně léčených pacientů vzhledem ke stadiu při diagnóze Nově diagnostikovaní pacienti Ne terminální NO Terminální NO Celkem Stadium III ) ) ) 0 ) Stadium III 0 ) 0 ) 0) 0 ) Stadium IV ) 0 ) ) 0) Všechna stadia 0 ) ) ) ) Předpokládané stadium v roce 0 Počet potenciálně léčených pacientů vzhledem kpředpokládanému rozsahu onemocnění v roce 0 Nově diagnostikovaní pacienti Ne terminální NO Terminální NO Celkem Stadium III ) ) ) Stadium III 0 ) 0 ) ) Stadium IV ) 0 ) ) ) Všechna stadia 0 ) ) ) )
Děkuji za pozornost