H O D N O C E N Í E F E K T U O N K O L O G I C K É L É

50 Anal za pfieïití v hodnocení v sledkû onkologické péãe: moïnosti a limity. Du ek L, Pavlík T., Koptíková J., MuÏík J., Gelnarová E., Vyzula R., Îaloudík J. Institut biostatistiky a anal z, Masarykova univerzita, Brno; MasarykÛv onkologick ústav, Brno Shrnutí Anal za pfieïití je jednou z nejãastûji pouïívan ch statistick ch metod v onkologii. PfieÏití je obecnû povaïováno za základní cílov parametr ( end-point ) vypovídající o v sledcích léãby a o celkové obtíïnosti onkologick ch onemocnûní. Hodnocení rûzn ch parametrû pfieïití dominuje v klinick ch studiích i v populaãních registrech. V tomto pfiíspûvku bychom chtûli ãásteãnû pfiipomenout metodiky hodnocení pfieïití se zvlá tním dûrazem na anal zu pfieïití z populaãních dat. Z hodnocení rûzn ch meto- 95

dik jednoznaãnû vypl vá, Ïe anal za pfieïití má v kaïdé své podobû znaãné limity a v sledky musí b t velmi opatrnû pouïívány a interpretovány. Tyto skuteãnosti lze struãnû shrnout ve dvou hlavních bodech. 1) PfieÏití je sice velmi podstatn m cílov m parametrem klinick ch hodnocení, není ale parametrem jedin m. Pro komplexní hodnocení v sledkû a kvality onkologické péãe je nutné zapojit i fiadu dal ích mûfiítek, které se vztahují k vlastnímu prûbûhu a v sledku jednotliv ch fází léãebné péãe, tj. v skyt komplikací, toxicita související s terapií, dodrïení léãebn ch reïimû, léãebná odpovûì. Pokud by hodnocení kvality a v sledkû péãe stálo pouze na vyhodnocení celkového pfieïití, pak by se u fiady diagnóz a ménû pokroãil ch stadií onemocnûní tato data vztahovala k minulosti, neboè medián pfieïití ãasto pfiesahuje 10, 15 i více let. Anal za celkového pfieïití nadto vyïaduje dlouhodobá data od dostateãnû velkého poãtu pacientû, takïe práci novû zaloïen ch center nebo center zab vajících se ménû ãast mi diagnózami by takto lo hodnotit jen obtíïnû. 2) Jsou li údaje o pfieïití ãerpány z populaãních dat, tj. z populaãních registrû typu ãeského Národního onkologického registru, musí b t v místních podmínkách interpretovány velmi opatrnû. VÏdy musí jít o v poãty demograficky standardizované, tedy vztaïené na konkrétní populaãní situaci v hodnocené jednotce. Pfii takov ch hodnoceních musíme kalkulovat s chybou populaãních dat, omezenou interpretaãní hodnotou celkového pfieïití (viz bod 1) i s rozdílnou velikostí hodnocen ch subpopulací. Z tûchto dûvodû nelze doporuãit vyuïívání populaãních odhadû celkového pfieïití pro vzájemné srovnávání v sledkû mal ch organizaãních jednotek, napfiíklad konkrétních nemocnic. Naopak doporuãujeme v poãet tzv. populaãních standardû pfieïití, tedy hodnot získan ch z populaãních dat pro celou populaci. Tyto demograficky standardizované odhady pak mohou slouïit k sebehodnocení dílãích jednotek, regionû i zdravotnick ch zafiízení, za pfiedpokladu Ïe tyto dodrïí metodiku v poãtu na sv ch vlastních datech. Standardní hodnocení pfieïití metodou dle Kaplan-Meiera Má-li b t dokumentace onkologického pacienta úplná, musí obsahovat data o dosaïeném pfieïití. Sledování pfieïití je i v znamn m cílov m parametrem onkologick ch klinick ch studií. Anal za pfieïití je velk m tématem, jehoï ucelen v klad pfiesahuje moïnosti tohoto textu, je zde tedy pouze krátce pojednáno o terminologii a analytick ch pfiístupech. Obecnû anal za pfieïití znamená sledování doby pfieïití vybrané skupiny pacientû v ãase, kdy postupnû ub vá Ïijících jedincû. Standardní parametrizace je zaloïena na hodnocení mediánu pfieïití, kter je v pfiesné definici roven ãasu, kdy pfieïití dosahuje 50% subjektû hodnocení. Jin m vyjádfiením je stanovení podílu subjektû, ktefií dosáhli urãité doby pfieïití nejãastûji je takto v procentech pfiípadû hodnoceno pûtileté nebo desetileté pfieïití. PfieÏití je parametr, jehoï sledování je závislé na ãase. Sledování se ale nemusí t kat pouze doby do úmrtí pacienta, je takto moïno sledovat dobu do nastání jakéhokoli jevu (zhor ení stavu, relaps, progrese, atd.). Obecnû jsou anal zy tohoto typu naz vány time-to-event analyses, neboè po urãitou dobu sledování (tzv. follow-up time ) zaznamenáváme postupnû rostoucí poãet hodnocen ch událostí (tzv. events ). Definici v znamn ch parametrû hodnocen ch anal zou pfieïití v onkologii pfiiná í tabulka 1. V závislosti na typu onkologické diagnózy a klinickém stadiu onemocnûní mûïe ov em doba sledování nutná pro zachycení vût ího poãtu událostí pfiedstavovat mûsíce aï roky, ale mûïe pfiekroãit i deset let. Dostáváme se tak do problému s prûbûïn m hodnocením pfieïití, neboè rozhodneme-li se hodnotit pfieïití v nûjakém konkrétním bodû, nebude ãas nastání hodnocené události znám pro v echny zafiazené subjekty. V konkrétním ãase trvání studie získáváme jednak subjekty, u kter ch jiï událost probûhla a její ãas je znám, a subjekty bez události, dále pokraãující ve studii. Doba sledování pfiípadû bez události je k datu anal zy brána jako cenzorovaná ( censored times, censored points ) a tyto body nemûní tvar kfiivky pfieïití. Smyslem anal zy pfieïití je získat odhad pravdûpodobnosti pfieïití v ãase, tedy vyhodnotit podíl pfieïívajících jako funkci ãasu. Standardní matematickou procedurou odhadu pfieïití je anal za dle Kaplan-Meiera, jejíï v stup v podobû kfiivky pfieïití je v eobecnû znám. Právû metoda Kaplan-Meiera je maximálnû vûrohodn m odhadem funkce pfieïití cenzorovan ch dat a mûla by b t pro prûbûïné hodnocení klinick ch dat pouïívána jako standard. Podrobnûji se lze o anal ze pfieïití informovat napfiíklad v uãebnici Altman (1991). PfieÏití lze srovnávat u rûzn ch experimentálních skupin nebo v rámci jednoho souboru pacientû pfii tfiídûní na podskupiny. V druhém pfiípadû hovofiíme o tzv. stratifikaci souboru aostratifikované anal ze pfieïití. Parametr dûlící soubor pacientû na podskupiny je naz ván stratifikaãní faktor. Mezi v znamné stratifikaãní faktory urãující v sledné pfieïití v onkologii patfií zejména: vûk a pohlaví pacienta TNM klasifikace nádoru, klinické stadium, markery biologické povahy nádoru (proliferace, apoptóza, angiogeneze, metastatick potenciál), genetické markery v znamné léãebné úkony (napfi. transplantace kostní dfienû) dosaïená léãebná odpovûì 96

Parametr Definice Celkové pfieïití (overall survival, OS) âasov interval mezi datem diagnózy a datem smrtí. Îijící pacienti jsou cenzorováni k datu poslední kontroly. Anal za mûïe b t dle okolností omezena pouze na pacienty s urãitou pfiíãinou smrti. Bezpfiíznakové pfieïití (disease-free survival, relapse-free survival, DFS) Doba do progrese (progression-free interval, time to progression, TTP) âasov interval mezi datem dosaïení kompletní remise a prvním projevem dal í aktivity nemoci (relaps) nebo úmrtím. Hodnocení se t ká pouze pacientû, ktefií dosáhli kompletní remise onemocnûní. Pacienti v kompletní remisi, ktefií zemfiou pfied projevem aktivity choroby, jsou hodnoceni k datu úmrtí. Smrt je tû pfied relapsem je v tomto parametru brána jako projevená událost a ovlivàuje profil pfieïití. Îijící pacienti bez pfiíznakû nemoci jsou cenzorováni k datu poslední kontroly. âasov interval mezi datem ukonãení konkrétní fáze léãby a datem následné progrese onemocnûní. Pacienti, ktefií zemfiou pfied projevem progrese jsou cenzorováni k datu úmrtí. Îijící pacienti bez progrese onemocnûní jsou cenzorováni k datu poslední kontroly. Pfii hodnocení TTP nemusí pacient Ïít zcela bez pfiíznakû choroby, mûïe b t napfiíklad ve stavu stabilizovaného onemocnûní. Parametr je ãasto vyuïíván pro hodnocení v sledkû léãby pokroãil ch stádií onemocnûní nebo léãby relapsû, kde je následná progrese relativnû pravdûpodobná. Interval pfieïití bez pfiíznakû nemoci (disease free interval, DFI) Jak koli time-to-event interval (event-free survival, EFS) âasov interval mezi dosaïením kompletní remise a relapsem. T ká se pouze pacientû v kompletní remisi. Pacienti, ktefií zemfiou pfied projevem relapsu jsou cenzorováni k datu úmrtí. Îijící pacienti bez pfiíznakû nemoci jsou cenzorováni k datu poslední kontroly. Protokolárnû specifické parametry pfieïití, které definují rûzné události ( events ) ve v voji pacienta. Pfii definici je tfieba dbát na zpûsob zafiazení pacientû zemfiel ch bez projevu této události, pfii zafiazení smrti jako platné události pûjde o hodnocení pfie- Ïití (EFS), pfii cenzorování smrti pûjde o hodnocení ãasového intervalu k dané události. Sumarizované ãasové intervaly Doba trvání kompletní remise Doba trvání odpovûdi âasov interval mezi dosaïením kompletní remise a projevem aktivity nemoci (relaps). Tato charakteristika je vyhodnocována pouze pro pacienty, ktefií po urãité léãebné fázi dosáhli kompletní remise. V pfiípadû celkového hodnocení pacienta, kter pro el více fázemi léãby, je moïné hodnotit sumární dobu setrvání v kompletní remisi. Stejn parametr jako doba trvání kompletní remise, je pouze definiãnû roz ífien na pacienty s kompletní i ãásteãnou remisí onemocnûní. V e uvedené definice obsahují jako vstup pro v poãet buì datum diagnózy, datum ukonãení urãité fáze léãby nebo datum dosaïení kompletní remise. RÛzné typy parametrû pfieïití takto pokr vají rûzné etapy moïného v voje pacienta. Pfii hodnocení pfieïití v rámci klinické studie je stav pacienta na vstupu i typ anal zy dán protokolem a jako vstupní bod je vïdy bráno datum randomizace pacienta (u randomizovan ch studií) nebo obecnûji datum zafiazení pacienta do studie. Tabulka 1. Základní typy parametrû hodnocen ch anal zou pfieïití v onkologii 97

Hodnocení pfieïití onkologick ch pacientû z populaãních dat Pfiedchozí odstavce byly vûnovány popisu metodiky hodnocení pfieïití s typick m v stupem v podobû kfiivky pfieïití. Tato metodika je vhodná pfiedev ím pro srovnávací anal zy pfieïití v klinick ch experimentech, kde umíme garantovat plnou srovnatelnost skupin. To z hlediska anal zy pfieïití znamená srovnatelnost: charakteristik hodnocen ch pacientû velikosti srovnávan ch souborû doby sledování poãtu (podílu) tzv. cenzorovan ch bodû Metodiku dle Kaplan-Meiera lze aplikovat i na populaãní data, tedy na údaje o pfieïití pacientû z populaãních (národních) registrû. Tyto v stupy v ak generují obraz pfieïití, kter má následující interpretaãní problémy: 1. Jde o popis pfieïití dosahovaného v dané skupinû pacientû, odhad je ale ovlivàovan velikostí skupiny a dobou, po kterou je skupina sledována. Tento ãasov rámec urãuje, do jaké míry bude odhad celkového pfieïití smyslupln. Málo ãetné diagnózy ãasto nemohou b t v nûkter ch skupinách hodnoceny z dûvodu malého poãtu záznamû. Velk m problémem je pfiedev ím srovnání pfieïití dvou skupin pacientû rûzné velikosti a rûzné doby sledování. 2. Obraz pfieïití mûfien na srovnávan ch subpopulacích pacientû nesouvisí pouze s léãbou, ale je urãován fiadou dal ích faktorû, napfiíklad vûkem pacientû. Vzájemná srovnatelnost souborû je tak ovlivàována charakteristikami pacientû, které se nemusí nutnû vzájemnû shodovat. Pfiímoãaré srovnávání kfiivek pfieïití mûïe b t bez populaãní standardizace velmi zavádûjící. 3. Celkové pfieïití patfií mezi parametry, které oznaãujeme za tzv. integrující. Tím je fieãeno, Ïe odráïí rûznorodé vlivy, které nesouvisí jen s kvalitou léãebné péãe. Zvlá tû u ãasn ch stadií fiady diagnóz dosahuje medián pfieïití mnoha let a vztahuje se tak k pacientûm, ktefií byli léãeni podle jin ch pravidel neï v souãasnosti. Tento fakt mûïe ovlivnit interpretaci dlouhodob ch trendû. Obr. 1. Metodické schéma hodnocení 10-ti letého pfieïití kohortní anal zou a anal zou period 98

Z v e uvedeného vypl vá, Ïe pro anal zu pfieïití z populaãních dat potfiebujeme více robustní metodiku neï pfiímoãaré odhady mediánu pfieïití. Takové anal zy lze provádût v pfiedem plánovan ch klinick ch studiích, kde je zaruãena srovnatelnost vzorkû, u populaãních dat se musíme bohuïel pot kat s v raznû vût í heterogenitou. Vliv náhodn ch ãasov ch fluktuací ãásteãnû fie í odhady x-letého pfieïití (typicky 5-, 10-, 20-letého). V stup je uvádûn v procentech pacientû, ktefií dosáhli hranice x-letého pfie- Ïití. Následující odstavce definují metody vhodné pro tyto populaãní odhady. 1. Podíl pacientû doïívajících se urãité doby pfieïití se oznaãuje jako odhad absolutního x-letého pfieïití. Potfiebnou populaãní standardizaci zavádí váïení tûchto odhadû v hodnocené subpopulaci (kohortû) v relaci ke stavu celkové populace, tedy v poãet tzv. relativního x-letého pfieïití. V poãet vztahuje x-leté pfieïití ve vybrané skupinû pacientû k pfieïití dosahovanému v tom samém období v normální populaci, která odpovídá skupinû pacientû vûkem i pomûrem pohlaví (tzv. matched population ). Ke konkrétnímu v poãtu lze doporuãit metodu dle Hakulinena a v sledn odhad relativního pfieïití dále doplnit ukazatelem variability. Relativní pfieïití je tedy populaãnû váïen m odhadem pfieïití dané kohorty pacientû. 2. BûÏnou metodou v poãtu x-letého absolutního nebo relativního pfieïití je tzv. kohortní anal za. Pojem se vztahuje ke zpûsobu, kter m anal za vymezuje kohortu pacientû pro odhad x-letého pfieïití. Napfiíklad 5ti-leté pfieïití hodnocené pro období 2000-2002 je odhadováno z dat sledování pacientû diagnostikovan ch zpûtnû v letech 1995 1997. Analyzovaná kohorta pacientû je tedy definována retrospektivnû dle data diagnózy a vrací tak v stupy anal zy zpût, coï je zvlá tû patrné u 10ti a více letého pfieïití (Obrázek 1 a 2). V stup metody tak ne zcela dostateãnû reaguje na zmûny v ãase, napfi. v dûsledku v voje diagnostiky nebo léãebn ch moïností. Obr. 2. Metodické schéma hodnocení 5-ti letého pfieïití na pfiíkladu období 1995-2004 3. e ením více reagujícím na ãasovû aktuálnûj í data mûïe b t nedávno validovaná anal za ãasov ch period ( period analysis ) (Brenner a kol, 1996). Zatímco kohortní anal za kalkuluje x-leté pfieïití na kohortû pacientû diagnostikovan ch x let zpûtnû, anal za period naopak zapoãítává data pouze ze sledování v daném recentním období, tedy vãetnû posledního roku, ke kterému je pfieïití kalkulováno. Pro pacienty diagnostikované v roce 2000-2002 je moïné odhadnout pfieïití 1 rok po diagnóze, pacienti z let 1998-2000 pfiispívají k posouzení pfieïití 2 roky od diagnózy atd. (Obrázek 1 2). Tato metoda mûïe pomoci u dat, kde se pfieïití v znamnû mûní v dûsledku v voje diagnosticko-léãebn ch postupû. 4. Kompromisem mezi ponûkud extrémními pfiístupy kohortní anal zy a anal zy period je tzv. kompletní anal za. âasov rámec pro v poãet zahrnuje v echny diagnostikované roky vãetnû tûch recentních, kompletní anal za se tedy z tohoto pohledu chová podobnû jako anal za period. Na rozdíl od ní, ale neomezuje ãasov rámec zleva a zahrnuje i data z prûbûïného sledování dfiíve diagnostikovan ch pacientû (Obrázek 1 a 2). JelikoÏ tento postup nevrací ãasov rámec striktnû x let zpût 99

a zároveà zahrnuje i v sledky recentních sledování, b vá v literatufie ãasto oznaãován za objektivnûj í a pfiesnûj í neï jiné postupy. V otázce hodnocení pfieïití na základû populaãních dat tedy není metodick ch pochyb. Standardní metodika dle Kaplana a Meiera mûïe b t aplikována pouze pro srovnávání pfieïití skupin pacientû pouze jsou-li tyto skupiny pfiibliïnû stejnû velké a jsou-li sledovány po pfiibliïnû stejnou dobu. Jakmile mají b t v sledky populaãnû zobecnûny, je nezbytn odhad absolutního a relativního x-letého pfieïití. Odhad relativního pfieïití je jiï sám o sobû populaãnû standardizován a ukazuje, zda u dané skupiny pacientû nedochází ke zv ené mortalitû oproti celkové populaci. Rozvaha nad interpretací referenãního hodnocení pfieïití z rûzn ch zdravotnick ch zafiízení Hodnocení pfieïití je v souãasnosti diskutováno jako nástroj hodnocení v sledkû a kvality péãe v rûzn ch zdravotnick ch zafiízeních. Dle v e uvedeného rozboru je moïné doporuãit tzv. kompletní anal zu relativního pfieïití a tzv. anal zu period, která umoïàuje v poãet i se zapojením aktuálních dat daného kalendáfiního roku. Ani tyto postupy ale nejsou pau álnû pouïitelné a mají fiadu interpretaãních omezení: Na úrovni jednotliv ch nemocnic musíme pfieïití analyzovat vïdy v rámci diagnostick ch skupin zhoubn ch nádorû. V literatufie je sice vyuïívána i anal za onkologick ch pacientû jako celku, ta v ak slouïí k pouze popisu populaãní zátûïe demografick ch skupin. U nemocnic by takov pfiístup vedl k nekontrolovatelnému zkreslení v dûsledku rûzné zátûïe rûzn mi diagnózami. Charakteristiky pacientû, ktefií ve vybraném zdravotnickém zafiízení vstupují do referenãního srovnávání, vytváfiejí tzv. case-mix. Tyto parametry musí b t provûfieny, aby nedo lo k zkreslení v dûsledku nereprezentativního v skytu nûjakého faktoru. Jednak je nutné se pfiesvûdãit zda kohorta pacientû odpovídá v základních charakteristikách referenãnímu souboru a dále musí b t provûfien vliv jednotliv ch charakteristik na pfieïití. Dal ím problémem anal z uvnitfi nemocnic je interpretace zmûn v pfieïití v posledních letech. Tyto zmûny mohou pfiedstavovat fluktuace v dûsledku mûnícího se spektra pfiicházejících pacientû, mohou ale také odráïet v znamn kvalitativní v voj. To se t ká pfiedev ím zlep ování diagnostick ch moïností vedoucí k v raznûj ímu záchytu ãasn ch stadií zhoubn ch nádorû. Aãkoli jde o pozitivní trend, mûïe tímto docházet ke zkreslení informací o pfieïití jiï diagnostikovan ch pacientû. Dokonalej í diagnostika mûïe ke zkreslení pfiispût jednak dfiívûj ím záchytem onemocnûní, aniï by se tím fakticky prodlouïilo skuteãné pfieïití pacientû, dále selektivním záchytem pomalu rostoucích nebo skryt ch a nebolestiv ch zhoubn ch nádorû, které by jinak nebyly vûbec zachyceny. V literatufie jsou tyto jevy popisovány jako led-time bias, length-time bias a overdiagnosis bias. Hodnocení relativního pfieïití mûïe u nûkter ch ménû nebezpeãn ch diagnóz vést i k hodnotám > 100%, napfiíklad jako dûsledek zv ené lékafiské péãe. Onkologiãtí pacienti dále mohou vést zdravûj í Ïivot a pfiirozenû u kohort pacientû z jednotliv ch nemocnic nelze vylouãit ani vliv mal ch ãísel. Tento jev b vá ovlivàován i zpûsobem diagnostiky, protoïe ne v echny diagnostické techniky rovnomûrnû zasahují celou populaci. Pfiedev ím záchyt malignit ve screeningov ch programech mûïe b t kumulován v uvûdomûlej í, sociálnû lépe situované ãásti populace, která se do preventivních programû více zapojuje a obecnû má niï í mortalitu neï celková populace. Populaãní referenãní hodnoty pfieïití mohou b t dále zkresleny i faktory souvisejícími s biologií nádorû. Proliferaãní schopnosti, metastatick potenciál, chemorezistence, genetická konstituce nádoru v echny tyto faktory hrají pfii hodnocení konkrétních zdravotnick ch zafiízení vût í roli neï na populaãní úrovni a se zmen ující se velikostí vzorku jejich vliv je - tû narûstá. Tedy i pfii práci s velmi korektnû nastaven m referenãním standardem, mûïe b t rozdíl v pfieïití urãité skupiny pacientû ovlivnûn rozdûlením tûchto prognosticky v znamn ch parametrû. Literatura 1. Altman, D.G. (1991) Practical Statistics for Medical Research. 611p., Chapman and Hall, London. 2. Brenner H., Gefeller O. (1996) An alternative approach to monitoring cancer patient survival. Cancer, 78, 2001-2004. 3. Du ek L., Îaloudík J. (Eds.). Hodnocení zdravotnick ch technologií v onkologii. Klinická onkologie 17 Supplement 2004, 104 s. ISSN 0862 495 X. 4. Hakulinen T., Abeywickrama K.H.(1985) A computer program package for relative survival analysis. Comput. Programs Biomed.,19, 197 207. Metodika anal zy populaãních onkologick ch dat je vyvíjena v rámci projektu SVOD podporovaného ministerstvem zdravotnictví âr. Práce je dále podpofiena v zkumn m zámûrem MOÚ s názvem Funkãní diagnostika zhoubn ch nádorû podporovan m MZd âr. 100