Jiří Jarkovský (jarkovsky@iba.muni.cz) Institut biostatistiky a analýz, Lékařská a přírodovědecká fakulta, Masarykova univerzita
Telemedicína a individuální časové řady pacientů Telemedicína Vzdálený monitoring pacientů Produkce individuálních časových řad pacientů Statistická analýza těchto řad a jejich použití pro rozhodování Specifické odvětví statistiky longitudinální analýza dat a metody vycházející z analýzy přežití a zobecněných lineárních modelů 2
Individuální časové řady pacientů - otázky Na jaké otázky můžeme získat odpověď z individuálních časových řad pacientů? Predikce Lze z vybraného úseku časové řady predikovat její další vývoj? Lze z vybraného úseku časové řady predikovat výskyt nežádoucí události? Lze měřením v průběhu sledování zpřesnit predikce analýzy přežití???? Čas Čas Čas Riziková typologie pacientů Lze definovat typické průběhy časové řady se vztahem k prognóze nebo léčebnému schématu? Hledání známých vzorů Lze v časové řadě nalézt časové vzory odpovídající známým průběhům choroby? A B C D 3
Individuální časové řady pacientů - problémy Analýza individuálních časových řad Samostatné odvětví statistiky tzv. longitudinální analýza dat Problematický typ dat Nestejná délka časových řad jednotlivých pacientů Různé mezery v časových řadách Měření v různých časových intervalech Různá souslednost událostí nebo léčby u jednotlivých pacientů Různý časový posun efektu událostí/léčebných postupů Různé přístupy respektující charakteristiku dat a položené hypotézy Čas 4
Individuální časové řady pacientů příklady analýzy Příklad 1: Biochemický profil pacientů po kardiogenním/septickém šoku Hypotéza: Možnost využít časový průběh biochemických ukazatelů pro prognózu? Problémy: Velmi různorodá délka časové řady Časná úmrtí pacientů Chybějící údaje Příklad 2: Rehospitalizace a úmrtí po srdečním selhání Hypotéza: Lze pomocí informací o rehospitalizacích zpřesnit prognózu pacientů po srdečním selhání? Problémy: Nutnost konsekutivních záznamů a dostatečného follow-up Aplikace analýzy přežití a cenzorování Příklad 3: Vývoj onemocnění a reakce na léčbu u pacientů s revmatoidní artritidou Hypotéza Lze identifikovat response/nonresponse na léčbu z individuální časové řady pacientů? Problémy: Různé sekvence léčby u pacientů Chybějící údaje a údaje s nestejnými časovými rozestupy 5
Příklad 1: Biochemický profil pacientů po kardiogenním/septickém šoku Přijato k publikaci v Experimental & Clinical Cardiology Hypotéza: Možnost využít časový průběh biochemických ukazatelů pro prognózu? Problémy: Velmi různorodá délka časové řady Časná úmrtí pacientů Chybějící údaje
Vstupní data a jejich problémy Sada biochemických parametrů měřena při přijetí, 12 a 24 hodin, 3, 5, 6, 7 dní a při propuštění u pacientů s CS, SS a STEMI 400 000 350 000 * * 25 th percentile Median 75 th percentile 300 000 ST2 250 000 200 000 150 000 100 000 50 000 0 I II III IV V VI VII VIII Vzhledem k velké mortalitě u CS a SS je řada časových řad pacientů velmi krátká Analyzovat pouze pacienty s kompletními časovými řadami? Analyzovat pouze vstupní údaje veškerých pacientů? 7
Řešení analýzy (přijato k publikaci v Experimental & Clinical Cardiology) Vzhledem k velké mortalitě u CS a SS je řada časových řad pacientů velmi krátká Analyzovat pouze pacienty s kompletními časovými řadami? Výhody: Význam pro chování biochemických ukazatelů u přeživších pacientů typologie jejich individuálních křivek jako prediktor dlouhodobé prognózy Nevýhody: Selekční bias, kdy z analýzy odstraňujeme pacienty zemřelé za hospitalizace Analyzovat pouze vstupní údaje veškerých pacientů? Výhody: využití pro predikci časných úmrtí během hospitalizace použita ROC analýza pro detekci optimálních cut-offs a logistická regrese pro modelování Nevýhody: využita pouze část dostupných individuálních časových řad Alternativy Aplikovat Coxův model proporcionálních rizik s časově závislými prediktory (biochemické ukazatele v jednotlivých časech) 8
Příklad 2: Rehospitalizace a úmrtí po srdečním selhání Prezentováno na konferenci International Society for Clinical Biostatistics 2012: Risk factors of rehospitalisation and death for acute heart failure using multistate survival models Jiří Jarkovský, Simona Littnerová, Jiří Pařenica, Marián Felsoci, Roman Miklík, Jindřich Špinar Hypotéza: Lze pomocí informací o rehospitalizacích zpřesnit prognózu pacientů po srdečním selhání? Problémy: Nutnost konsekutivních záznamů a dostatečného follow-up Aplikace analýzy přežití a cenzorování
Introduction Heart failure is one of the most common cause of death in the developed countries The diagnosis has poor prognosis up to 70% of patients die within 5 years after 1 st hospitalization (and hospitalization mortality range approx. 5-15%) Incidence of heart failure is increasing due to life prolongation Heart failure is associated with costs accounting for 1-2% of healthcare expenditures Classification of patients according their risk of death and/or rehospitalisation is an important task for improvement of the medical care for these patients Our aim is: Analyze risk of death and/or rehospitalisation in the period of two years after 1 st hospitalization for HF analýza vycházející z dlouhodobého sledování pacientů poskytuje detailní informace o jejich vývoji a prognóze The analysis was computed on fully consecutive patients who survived 1st hospitalization for HF from University Hospital Brno (N=608 patients) nutná podmínka dostatečně dlouhého sledování omezuje velikost dostupných datových souborů 10
Overall and event free survival Survival data Rehospitalisation data Patients with rehospitalisation (%) 0 5 10 15 20 25 2nd (N=120) 19.7 3rd (N=39) 4th (N=18) 5th (N=7) 3.0 1.2 6.4 Occurrence of 2 nd hospitalization after 1 st HF hospitalization included in the model 2 years time window with rehospitalisation follow-up 6th (N=4) 7th (N=2) 0.7 0.3 8th (N=1) 0.2 9th (N=1) 0.2 Model aimed on death or 2 nd hospitalization in 2 years following 1 st hospitalization for HF. 11
Methodology R 2.14.2 with mstate library (Data preparation, estimation and prediction in multistate models) followed by Cox proportional hazards model was used for the analysis Markov model with five transitions was developed for total N=608 consecutive patients The influence of 90 patients characteristics (sociodemography and clinical status, comorbidities, biochemical characteristics, HF severity) at 1 st hospitalisation for HF on risk of given transitions was analyzed At home after surviving 1 st HF 2 Rehospital isation with HF 4 At home after surviving 2 st HF 1 Deceased 3 Deceased during rehospitali sation 5 Deceased 1 2 3 4 5 Transitions 12
Survival between transitions At home after surviving 1 st HF (N=608) N=608 (all patients) 1 N=608 (all patients) N=103 (patients surviving rehospitalisation for HF) 1 2 3 4 5 Mortality at home after primary hospitalization Rehospitalisation Mortality during rehospitalisation Discharge from rehospitalisation to home Mortality at home after rehospitalisation N= 120 2 3 4 N=17 N=103 (14.2%) (85.8%) 5 13
Model for survival of patients after 1st hospitalisation HR (95% CI) for multivariate model 0 1 2 3 4 Occurrence of risk factor (%) 0% 25% 50% 75% 100% Glomerular filtration < 40 No PCI/CABG during hospitalisation Age > 70 yrs 41.1 61.2 78.1 Peripheral arterial disease 10.9 Valvular heart disease 10.4 Anemia 31.7 COPD 15.3 EF < 35 % 36.4 The variables related to cardiovascular system and influencing renal functions together with age of patients form the model for prediction of patients survival The next step is the development of simple score for patients stratification and clinical characteristics of these patients 14
Risk stratification of patients for combined endpoint Risk score 1 2 3 4 5 % 20 15 10 5 2.5 3.9 10.5 13.0 16.9 16.115.0 12.8 5.6 2.6 1.0 1 2 3 4 5 N=103 N=182 N=98 N=91 N=134 0 0 1 2 3 4 5 6 7 8 9 10 Number of risk factors Patients profile No PCI/CABG during hospitalisation Age > 70 Potassium > 4 Glomerular filtration < 40 DM Leg edema EF < 35 ACSI in history Anemia Stroke in history COPD Peripheral arterial disease Valvular heart disease 0 50 100 35.9 25.2 18.4 5.8 17.5 3.9 14.6 5.8 3.9 5.8 6.8 1.0 2.9 0 50 100 75.8 54.4 49.5 20.9 26.4 27.5 35.2 17.6 16.5 9.3 11.5 3.8 8.2 0 50 100 88.8 70.4 62.2 42.9 38.8 37.8 42.9 34.7 31.6 18.4 15.3 5.1 11.2 0 50 100 92.3 75.8 70.3 59.3 57.1 49.5 37.4 47.3 44.0 20.9 18.7 15.4 12.1 0 50 100 96.3 81.3 78.4 82.1 69.4 68.7 49.3 59.7 65.7 41.0 24.6 29.1 17.2 15
Conclusions The model for death without rehospitalisation contains Glomerular filtration, No PCI/CABG during hospitalisation, Age,Peripheral arterial disease, Valvular heart disease, Anemia, COPD and Ejection fraction The model for rehospitalisation contains Valvular heart disease, Ejection fraction, Glomerular filtration, ACS in history, Potassium, Stroke in history, DM and Leg edema, Combined model for any event (death or rehospitalisation) was also computed as an combination of particular models whereas both models share most of their risk factors; Nevertheless in case of high difference in number of risk factors interpretation of risk of one of events (death or rehospitalisation) is possible The developed models provide risk stratification of patients after 1 st hospitalization for heart failure based on routinely measured and available parameters Výhoda: Analýza poskytuje model prognózy zahrnující různé události a změny charakteristik pacienta v čase Nevýhoda: Nutná podmínka dostatečně dlouhého sledování Nutná aplikace vícestavových modelů přežití a přežití s časově závislými prediktory, které nejsou rutinně dostupné v běžných SW 16
Příklad 3: Vývoj onemocnění a reakce na léčbu u pacientů s revmatoidní artritidou Projekt s participací institutu biostatistiky a analýz MU využívající telemedicínský sběr dat individuálních časových řad pacientů Hypotéza: Lze identifikovat response/nonresponse na léčbu z individuální časové řady pacientů? Problémy: Různé sekvence léčby u pacientů Chybějící údaje a údaje s nestejnými časovými rozestupy
Projekt Dynamického monitorování pacientů s revmatoidní artritidou Výzkumná databáze pro hodnocení stavu a výsledků léčby u pacientů s revmatoidní artritidou Pro usnadnění zadávání možnost vyplnění záznamu kvality života pacientem pomocí tabletu 18
Popis individuální časové řady pacienta ve formě karty generované z databáze Vizualizuje vývoj konkrétního pacienta v čase (ukázka) 19
Analýza získaných dat Hodnocení vývoje kvality života v závislosti na vstupních charakteristikách a průběhu léčby T0 (N=1391) T10 (N=1355) T54 (N=1214) HAQ 3.0 p 1) <0.001 p 1) <0.001 p 1) <0.001 2.5 2.0 1.5 1.0 0.5 0.0 Kvartily DAS28 1) p-hodnota Kruskal Wallis testu. Analýza ovlivňujících faktorů kvality života v jednotlivých časových bodech Výhoda: jednoduchý výpočet a přímočará interpretace Nevýhoda: různý počet záznamů v jednotlivých časových bodech nutno kontrolovat riziko selekčního biasu Alternativa - GEE: General Estimating Equations typ lineárních modelů umožňující zpracovat hodnoty závislé v čase v současnosti příprava publikace 20
Shrnutí Telemedicína dálkové sledování stavu pacientů > do budoucna významný zdroj dat pro statistickou analýzu Využití pro prognózu stavu pacientů > nezbytné statistické zpracování a tvorba modelů > nezbytná exaktní definice hypotézy, které determinuje způsob statistického zpracování Statistické nástroje pro zpracování existují > longitudinální analýza dat > multistavová analýza přežití > analýza přežití s časově závislými prediktory > mixed effects modely a další složitější lineární modely > shluková analýza a další vícerozměrné techniky 21
jarkovsky@iba.muni.cz DĚKUJI ZA POZVÁNÍ A POZORNOST 22