3 Neparametrcké ohay Přepokláané výstupy z výuky: 1. Stuent zná výhoy a nevýhoy neparametrckých ohaů funkce přežtí. Stuent e schopen sestrot Kaplanův-Meerův oha funkce přežtí 3. Stuent e schopen sestrot oha funkce přežtí pomocí metoy úmrtnostních tabulek 4. Stuent e schopen sestrot Nelsonův-Aalenův oha kumulatvní rzkové funkce 5. Stuent okáže uveené neparametrcké ohay oplnt 100(1-α)% ntervalem spolehlvost Neparametrcké metoy v analýze přežtí přestavuí v současné obě nepoužívaněší nástroe pro honocení at o přežtí. Tato kaptola prezentue hlavní neparametrcké metoy pro oha klíčových funkcí v analýze přežtí funkce přežtí a kumulatvní rzkové funkce a hlavních číselných charakterstk meánu přežtí a průměrné élky přežtí. Prezentovány sou metoy pro konstrukc ntervalů spolehlvost. 3.1 Parametrcké a neparametrcké ohay Statstcké metoy lze obecně rozělt na záklaě ech přepoklau o charakteru pozorovaných at na parametrcké a neparametrcké. Parametrcké metoy (parametrc survval analyss) vyžauí specfkac konkrétního rozělení náhoné velčny T, zatímco neparametrcké metoy (nonparametrc survval analyss) žáné zvláštní přepoklay ohleně rozělení pravěpoobnost náhoné velčny T nevyžauí. V přípaě mecínských aplkací e znalost konkrétního rozělení velčny T velm omezená, což společně s enouchostí použtí ční neparametrcké metoy šroce používaným v analýze přežtí. Na ruhou stranu znalost rozělení pravěpoobnost náhoné velčny T e vžy výhoná, neboť použtí parametrckých meto e většnou enoušší a př korektně specfkovaném rozělení přesněší. Pomínka korektní specfkace rozělení pravěpoobnost e však nesmírně ůležtá. Poku totž přepoklááme pravěpoobnostní chování stuované cílové populace le určtého rozělení, ale ve skutečnost tento přepokla splněn není, e špatně specfkace celého statstckého moelu, což vee k zaváěícím výslekům a nenterpretovatelným závěrům. V analýze přežtí efnueme eště alší skupnu meto označovanou ako semparametrcké (semparametrc survval analyss). Jená se o moelovací přístupy, které nesou plně parametrcké, protože nevyžauí přepokla o znalost rozělení velčny T, ncméně akožto moely s parametry, respektve regresním koefcenty pracuí. Neznáměší semparametrckou metoou e tzv. Coxův regresní moel proporconálních rzk, který e blíže vysvětlen v kaptole 8. 3. Kaplanův-Meerův oha funkce přežtí Neznáměším a nepoužívaněším neparametrckým ohaem funkce přežtí, který se stal stanarem pro honocení přežtí v klnckých stuích e Kaplanův-Meerův oha funkce 1
přežtí (Kaplan-Meer estmator) [1]. Myšlenka výpočtu e enouchá, aby byl subekt v čase t bez sleované uálost (aby se např. pacent s náorovým onemocněním ožl času, nesmí se u ně uálost vyskytnout v žáném čase t * takovém, pro něž platí, že t * < t. Abychom tey mohl ohanout pravěpoobnost, že u aného subektu se o času t nevyskytne sleovaná uálost, musíme ohanout opovíaící pravěpoobnost také pro všechny časy t *, které času t přecházeí. Přepokláeme n různých časů přežtí takových, že t 1 < t < < t n < t. Pak pravěpoobnost přežtí bez výskytu sleované uálost až o času t, S(, lze vyářt pomocí vztahu (3.1) Abychom získal oha S(, e třeba specfkovat enotlvé komponenty rovnce (3.1). Vzhleem k tomu, že nemáme k spozc nou vstupní nformac než pozorované honoty, můžeme pravěpoobnost přežtí aného času vyářt pouze s pomocí úaů o úmrtí v aném čase. Obecně lze tey psát 1, (3.) ke e počet sleovaných uálostí zaznamenaných v čase t a e počet subektů v rzku výskytu sleované uálost v čase t, což e počet subektů, kteří bez sleované uálost přečkal čas t 1. Funkc přežtí pak můžeme ohanout pomocí vztahu. (3.3) Př ohau pravěpoobností přežtí enotlvých časů t e třeba aekvátně zohlent cenzorování. Cenzorované časy přežtí totž nelze honott steně ako kompletní pozorování, neboť nepřspívaí k, ale zároveň e nelze z honocení vyřat. Kaplanův-Meerův oha pracue s cenzorováním tak, že tato pozorování vypaávaí ze skupny subektů v rzku hne po zaznamenaném čase cenzorování. Je-l tey čas t cenzorovaný a platí, že t < t < t +1, pak aný subekt e v čase t započítán o skupny subektů v rzku ( ), ale v násleuícím pozorovaném čase výskytu sleované uálost t +1 ho ž o skupny v rzku ( +1 ) nezahrnueme. Výslený vzorec pro Kaplanův-Meerův oha funkce přežtí lze tey enouchou úpravou vztahu (3.3) zapsat ako 1. (3.4) Praktcky počítáme výše uveený součn pouze přes kompletní časy přežtí, ncméně teoretcky ho lze efnovat přes všechny pozorované časy přežtí s tím, že cenzorované časy přežtí k ohau přspívaí pouze prostřenctvím, neboť pro cenzorované časy e = 0.
3..1 Greenwooův vzorec Pro konstrukc 100(1 α)% ntervalu spolehlvost pro oha potřebueme získat eho rozptyl, tey var. Vzhleem k tomu, že oha e án ako součn, e vhoněší ho neříve zlogartmovat a převést tak na součet enotlvých ohaů. Dále lze ukázat, že korelace enotlvých ohaů a e nulová, což nám umožňue použít enouché pravlo pro počítání s rozptylem náhoné velčny. Výše uveené vee ke vztahu var ( ln Sˆ( ) = var ( ) ln = var ln = var( ln( )). (3.5) t t t K ovození rozptylu logartmu lze využít fakt, že maxmálně věrohoným ohaem pravěpoobnost p e číslo 1 / a tzv. elta metou (elta metho) []. Dostáváme tak oha rozptylu logartmu ve tvaru var ( ln( p )) ˆ 1 = p ˆ 1 var( ) = = ( ). (3.6) Dosaíme-l tento vztah zpět o (3.5) a použeme-l znovu elta metou, získáme výslený oha rozptylu S ˆ(, který e označován ako tzv. Greenwooův vzorec (Greenwoo s formula) [3], ve tvaru ( Sˆ( ) = ( Sˆ( ) var. (3.7) t ( ) Greenwooův vzorec e stanarem pro oha varablty Kaplanova-Meerova ohau funkce přežtí a e mplementován ve většně ostupných softwarů, které umožňuí analýzu přežtí. Exstuí však alternatvní ohay, se kterým se můžeme v lteratuře softwarech setkat, příklaem e oha le autorů Peto a kol. [4], kteří navrhl oha rozptylu Sˆ ( ve tvaru var 1, (3.8) ke n t e počet subektů v rzku v čase t. Tento oha byl navržen pro časy, ky se S ˆ( blíží honotám 1 nebo 0 a př nchž by oha pomocí Greenwooova vzorce mohl skutečnou varabltu pohonocovat [5]. 3
3.. 100(1 α)% nterval spolehlvost pro Kaplanův-Meerův oha Nepoužívaněším postupem pro konstrukc 100(1 α)% ntervalu spolehlvost pro oha S ˆ( e využtí aproxmace normálním rozělením, kterou nám umožňue platnost centrální lmtní věty. Za přepoklau, že aproxmace normálním rozělením e korektní (pomínky obré aproxmace souvsí přeevším s ostatečným množstvím subektů zahrnutých o analýzy), můžeme zkonstruovat 100(1 α)% nterval spolehlvost pro Kaplanův-Meerův oha pravěpoobnost přežtí v čase t násleuícím způsobem ( S( z var( Sˆ( ); Sˆ( z var( Sˆ( ))) ˆ 1 α / + 1 α / t, (3.9) ke z (1 α ) označue 100(1 α )% kvantl stanarzovaného normálního rozělení. Výhoou tohoto vyáření e eho výpočetní enouchost a ostupnost, nevýhoou e eho symetre. V blízkost honot 1 a 0 e totž symetrcký nterval spolehlvost pro oha funkce přežtí nevhoný, neboť přpouští honoty přežtí větší než 1 nebo naopak honoty záporné. Z praktckých ůvoů se tak častě používá konstrukce 100(1 α)% ntervalu spolehlvost s využtím transformace ohau S ˆ( na honoty z ntervalu (-, ). Ta nám totž umožní se vyhnout výše uveeným komplkacím. Příklaem e použtí komplementární logartmcké transformace, př níž transformueme oha funkce přežtí ako lnln, (3.10) což s využtím elta metoy pro ovození rozptylu výrazu (3.10), varlnln, a po aplkac pravel pro počítání s mocnnam vee na výslený tvar 100(1 α)% ntervalu spolehlvost pro S ˆ( ve tvaru 1/, 1/. (3.11) 3. Oha funkce přežtí metoou úmrtnostních tabulek Záklaní myšlenka ohau funkce přežtí pomocí metoy úmrtnostních tabulek e stená ako v přípaě Kaplanova-Meerova ohau, opět vyařueme oha S ˆ( ako součn pomíněných pravěpoobností opovíaících určtým časovým ntervalům. Na rozíl o Kaplanova-Meerova ohau, ke byly časové ntervaly určeny pozorovaným honotam časů přežtí, v přípaě metoy úmrtnostních tabulek pracueme s přeem efnovanou saou J časových ntervalů. Ty mohou být stanoveny lbovolně, ncméně většnou logcky vycházeí z pomínek aných expermentem nebo stuí. V populační analýze přežtí onkologckých pacentů se napříkla nečastě používaí enoleté ntervaly a zaímá nás většnou pětleté (5 ntervalů) nebo esetleté (10 ntervalů) přežtí. Vzhleem k tomu, že pracueme s elším časovým ntervaly, nám pro oha S ˆ( stačí pouze agregovaná ata, tey souhrnné úae pro enotlvé časové ntervaly. Označme počet sleovaných uálostí v tém ntervalu, ke = 1,, J, ále označme počet subektů v rzku výskytu sleované uálost na začátku ntervalu a nakonec c označme počet 4
subektů s časem přežtí cenzorovaným v průběhu tého ntervalu. Pravěpoobnost přežtí tého časového ntervalu pak můžeme ohanout pomocí výrazu = 1, (3.1) c což vee k ohau pravěpoobnost přežtí bez sleované uálost až o konce ntervalu J, S ˆ( J ), ve tvaru Sˆ ( J ) =. (3.13) J J = 1 c = 1 = 1 Z uveeného vztahu e vět, že cenzorované časy přežtí přímo ovlvňuí výpočet ohau funkce přežtí a to tak, že v kažém ntervalu oečítáme o počtu vstupuících subektů polovnu počtu cenzorovaných subektů. Tento postup přepokláá rovnoměrné cenzorování v průběhu celého ntervalu, polovna z c subektů e cenzorovaná v první polovně ntervalu a polovna z c subektů e cenzorovaná v ruhé polovně ntervalu. Počet subektů s uálostí tak vztahueme k počtu subektů v rzku uprostře ntervalu. 3.3 Nelsonův-Aalenův oha kumulatvní rzkové funkce Nelsonův-Aalenův oha e záklaní neparametrckou metoou ohau kumulatvní rzkové funkce [6], která steně ako Kaplanův-Meerův oha pracue pouze se souborem n pozorovaných honot časů přežtí takových, že t 1 < t < < t n < t. Pak Nelsonův-Aalenův oha kumulatvní rzkové funkce v čase t má tvar H ˆ ( =, (3.14) t ke steně ako v přípaě Kaplanova-Meerova ohau funkce přežtí značí počet sleovaných uálostí zaznamenaných v čase t a e počet subektů v rzku výskytu sleované uálost v čase t. Opět tey platí, že suma e počítána přes všechny pozorované časy přežtí, cenzorované časy ale k výslenému ohau přspívaí pouze prostřenctvím, neboť pro cenzorované časy přežtí e rovno nule. Aalen v roce 1978 [7] ále ovol rozptyl Nelsonova-Aalenova ohau kumulatvní rzkové funkce ve tvaru var, (3.15) který můžeme použít pro konstrukc ntervalu spolehlvost pro Nelsonův-Aalenův oha kumulatvní rzkové funkce. Označíme-l z (1 α ) honotu 100(1 α )% kvantlu 5
stanarzovaného normálního rozělení, pak lze 100(1 α)% nterval spolehlvost vyářt ako nterval var, var. (3.16) 3.4 Breslowův oha funkce přežtí V kaptole sme kromě efnce záklaních charakterstk náhoné velčny T ukázal ech vzáemné vazby. Hlavní z nch e vztah (.11) efnuící výpočet funkce přežtí pomocí kumulatvní rzkové funkce, S( = exp[h(]. Právě tohoto vztahu využívá Breslowův oha funkce přežtí, který využívá neparametrckého Nelsonova-Aalenova ohau kumulatvní rzkové funkce pro oha funkce přežtí. Breslowův oha funkce přežtí e tey án vztahem expexp, (3.17) ke a sou opět počet uálostí a počet subektů v rzku sleované uálost v čase t. Pro konstrukc ntervalu spolehlvost Breslowova ohau funkce přežtí opět potřebueme eho rozptyl, který e v tomto přípaě án vztahem var. (3.18) Problémy k řešení: 1. Jak vypaá Kaplanův-Meerův oha funkce přežtí v přípaě, že žáný z časů přežtí není cenzorován? [Výsleek: ]. Zkuste ovot rozptyl logartmu pomocí elta metoy. [Výsleek: varln ] Použtá lteratura: 1. Kaplan EL, Meer P. Nonparametrc estmaton from ncomplete observatons. Journal of Amercan Statstcal Assocaton, 1958; 58, 457 481.. oríguez, G. Lecture Notes on Generalze Lnear Moels. 007. Avalable at http://ata.prnceton.eu/wws509/notes/ 3. Greenwoo M. The Errors of Samplng of the Survvorshp Table, vol. 33 of eports on Publc Health an Mecal Subects, 196. Lonon: Her Maesty's Statonery Offce. 6
4. Peto, Pke MC, Armtage P, Breslow NE, Cox D, Howar SV, Mantel N, McPherson K, Peto J, Smth PG. Desgn an analyss of ranomze clncal trals requrng prolonge observaton of each patent. II. Analyss an examples. Brtsh Journal of Cancer, 1977; 35(1):1 39. 5. Collet D. Moellng Survval Data n Mecal esearch. 003, Chapman & Hall/CC, Lonon. 6. Nelson W. Theory an applcatons of hazar plottng for censore falure ata. Technometrcs, 197; 14:945-966. 7. Aalen O. Nonparametrc nference for a famly of countng processes. Ann. Statst, 1978; 6:701-76. Doporučená lteratura: 1. Marubn E, Vasecch MG. Analysng Survval Data from Clncal Trals an Observatonal Stues. 1995, John Wley & Sons, Chchester, Unte Kngom.. Klen JP, Moeschberger ML. Survval Analyss: Technques for Censore an Truncate Data. 003, Sprnger, New York. 7