3 Neparametrické odhady

Podobné dokumenty
Předpokládáme vlny, které jsou časově nestabilní z hlediska fáze. Jako model zvolíme vlnu kdy se fáze mění skokem, ale je konstantní během doby

Neparametrické metody

Přijímací zkouška na navazující magisterské studium 2015

Pružnost a plasticita II

MATEMATICKÁ STATISTIKA 1, CVIČENÍ (NMSA331) Poslední úprava dokumentu: 17. listopadu 2016

8 Coxův model proporcionálních rizik I

UNIVERZITA KARLOVA V PRAZE Přírodovědecká fakulta

2 Hlavní charakteristiky v analýze přežití

PRAVDĚPODOBNOSTNÍ PŘÍSTUP K HODNOCENÍ DRÁTKOBETONOVÝCH SMĚSÍ. Petr Janas 1 a Martin Krejsa 2

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA STAVEBNÍ BAKALÁŘSKÁ PRÁCE

Pružnost a plasticita II

Téma 5: Parametrická rozdělení pravděpodobnosti spojité náhodné veličiny

Využití logistické regrese pro hodnocení omaku

4.5.5 Magnetické působení rovnoběžných vodičů s proudem

Jednokriteriální rozhodování za rizika a nejistoty

Postup při měření rychlosti přenosu dat v mobilních sítích dle standardu LTE (Metodický postup)

Téma 7, modely podloží

Průřezové charakteristiky základních profilů.

Teoretické modely diskrétních náhodných veličin

Metoda konečných prvků 3 - nelineární úlohy

Vypracoval Datum Hodnocení. V celé úloze jsme používali He-Ne laser s vlnovou délkou λ = 632, 8 nm. Paprsek jsme nasměrovali

Inovace v predikci tržeb podle Porterových vlivů odvětví

REGRESNÍ ANALÝZA. 13. cvičení

STACIONÁRNÍ MAGNETICKÉ POLE

1. POLOVODIČOVÉ TEPLOMĚRY

ELEKTŘINA A MAGNETIZMUS Řešené úlohy a postupy: Ampérův zákon

ANALÝZA VLIVU DEMOGRAFICKÝCH FAKTORŮ NA SPOKOJENOST ZÁKAZNÍKŮ VE VYBRANÉ LÉKÁRNĚ S VYUŽITÍM LOGISTICKÉ REGRESE

ENÁ ŽELEZOBETONOVÁ DESKA S VELKÝM UŽITNÝM ZATÍŽENÍM

Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky. Bakalářská práce. Zpracování výsledků vstupních testů z matematiky

6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu

VŠB - Technická univerzita Ostrava Fakulta elektrotechniky a informatiky Katedra aplikované matematiky. Diplomová práce Michal Běloch

ina ina Diskrétn tní náhodná veličina může nabývat pouze spočetně mnoha hodnot (počet aut v náhodně vybraná domácnost, výsledek hodu kostkou)

Metodika pro vyjádření cílové hodnoty obsahu hotově balených výrobků deklarovaných dle objemu

STATICKY NEURČITÉ RÁMOVÉ KONSTRUKCE S PODDAJNOU PODPOROU SILOVÁ METODA

Transformace dat a počítačově intenzivní metody

Regresní a korelační analýza

Iterační výpočty. Dokumentace k projektu pro předměty IZP a IUS. 22. listopadu projekt č. 2

F (x, h(x)) T (g)(x) = g(x)

PRAVDĚPODOBNOSTNÍ POSUDEK OCELOVÉHO RÁMU METODOU IMPORTANCE SAMPLING

Teoretické modely diskrétních náhodných veličin

Úloha II.E... čočkování

Vedení vvn a vyšší parametry vedení

1. Určení vlnové délka světla pomocí difrakční mřížky

Metody teorie spolehlivosti

Porovnání GUM a metody Monte Carlo

Aplikace Li-Ma metody na scintigrafické vyšetření příštítných tělísek. P. Karhan, P. Fiala, J. Ptáček

ANALÝZA ROZPTYLU (Analysis of Variance ANOVA)

Jiří Militky Škály měření Nepřímá měření Teorie měření Kalibrace

Gibbsova a Helmholtzova energie. Def. Gibbsovy energie G. Def. Helmholtzovy energie A

3 VYBRANÉ MODELY NÁHODNÝCH VELIČIN. 3.1 Náhodná veličina

7. STATISTICKÝ SOUBOR S JEDNÍM ARGUMENTEM

ANALÝZA RIZIKA A CITLIVOSTI JAKO SOUČÁST STUDIE PROVEDITELNOSTI 1. ČÁST

SHIFT-SHARE ANALÝZA PRODUKTIVITY PRÁCE # Úvod

Solventnost II. Standardní vzorec pro výpočet solventnostního kapitálového požadavku. Iva Justová

POROVNÁNÍ MEZI SKUPINAMI

Obsah. Příloha (celkový počet stran přílohy 13) Závěrečná zpráva o výsledcích experimentu shodnosti ZČB 2013/2

Korelační energie. Celkovou elektronovou energii molekuly lze experimentálně určit ze vztahu. E vib. = E at. = 39,856, E d

ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha

STATISTIKA PRO NELÉKAŘSKÉ ZDRAVOTNICKÉ OBORY

Zlomky závěrečné opakování

Aplikace simulačních metod ve spolehlivosti

Vícekriteriální rozhodování. Typy kritérií

Zpráva o průběhu přijímacího řízení pro akademický rok

Monte Carlo metody Josef Pelikán CGG MFF UK Praha.

Zakřivený nosník. Rovinně zakřivený nosník v rovinné úloze geometrie, reakce, vnitřní síly. Stavební statika, 1.ročník bakalářského studia

Statistická šetření a zpracování dat.

Předpokládáme ideální chování, neuvažujeme autoprotolýzu vody ve smyslu nutnosti číselného řešení simultánních rovnováh. CH3COO

Experimentální identifikace regulovaných soustav

MODELOVÁNÍ A SIMULACE

POUŽITÍ METODY PERT PŘI ŘÍZENÍ PROJEKTŮ

Úloha č. 1 pomůcky Šíření tepla v ustáleném stavu základní vztahy

Validation of the selected factors impact on the insured accident

POHYB SPLAVENIN. 8 Přednáška

PŘÍSPĚVEK K NEJISTOTÁM VÝSLEDKŮ MĚŘENÍ

SÍŤOVÁ ANALÝZA. Základní pojmy síťové analýzy. u,. Sjednocením množin { u, u,..., 2. nazýváme grafem G.

Klasifikace a predikce. Roman LUKÁŠ

Statistická energetická analýza (SEA)

Grafické řešení úloh LP se dvěma neznámými

Čísla a aritmetika. Řádová čárka = místo, které odděluje celou část čísla od zlomkové.

2 TESTOVÁNÍ HYPOTÉZ. RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevil jsem pravdu! ale raději: Objevil jsem jednu z pravd! Chalil Gibran

Energie elektrického pole

Testy statistických hypotéz

6. ZÁSOBOVÁNÍ 6.1. BILANCE MATERIÁLU 6.2. PROPOČTY SPOTŘEBY MATERIÁLU

STATISTIKA (pro navazující magisterské studium)

Modely pro přežití s možností vyléčení

M ATERIÁLOVÉ MODELY PRO ČASOVĚ ZÁVISLOU ANALÝZU

9. Měření kinetiky dohasínání fluorescence ve frekvenční doméně

Lupa, mikroskop

( ) ( ) ( ) Vzdálenost bodu od přímky II. Předpoklady: 7312

C Charakteristiky silničních motorových vozidel

VY_42_Inovace_24_MA_2.04_Množiny ve slovních úlohách pracovní list

Využití nástrojů GIS při analýze vztahů socio-ekonomických faktorů a úrovně sociální péče

VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE FAKULTA INFORMATIKY A STATISTIKY BAKALÁŘSKÁ PRÁCE Radka Luštincová

Přemysl Žiška, Pravoslav Martinek. Katedra teorie obvodů, ČVUT Praha, Česká republika. Abstrakt

MODELOVÁNÍ TLAKOVÝCH ZTRÁT KAPILÁRNÍCH ROHOŽÍ

NELINEÁRNÍ DYNAMICKÁ ANALÝZA KONSTRUKCE ZATÍŽENA SEISMICKÝMI ÚČINKY NONLINEAR DYNAMIC ANALYSIS OF STRUCTURES WITH SEISMIC LOADS

Vlastnosti konstrukcí. Součinitel prostupu tepla

FORANA. 1. Úvod. 2 Vznik akustického signálu řeči v mluvidlech. Pavel GRILL 1, Jana TUČKOVÁ 2

Varianta A. Příklad 1 (25 bodů) Funkce f je dána předpisem

Stavový model a Kalmanův filtr

Transkript:

3 Neparametrcké ohay Přepokláané výstupy z výuky: 1. Stuent zná výhoy a nevýhoy neparametrckých ohaů funkce přežtí. Stuent e schopen sestrot Kaplanův-Meerův oha funkce přežtí 3. Stuent e schopen sestrot oha funkce přežtí pomocí metoy úmrtnostních tabulek 4. Stuent e schopen sestrot Nelsonův-Aalenův oha kumulatvní rzkové funkce 5. Stuent okáže uveené neparametrcké ohay oplnt 100(1-α)% ntervalem spolehlvost Neparametrcké metoy v analýze přežtí přestavuí v současné obě nepoužívaněší nástroe pro honocení at o přežtí. Tato kaptola prezentue hlavní neparametrcké metoy pro oha klíčových funkcí v analýze přežtí funkce přežtí a kumulatvní rzkové funkce a hlavních číselných charakterstk meánu přežtí a průměrné élky přežtí. Prezentovány sou metoy pro konstrukc ntervalů spolehlvost. 3.1 Parametrcké a neparametrcké ohay Statstcké metoy lze obecně rozělt na záklaě ech přepoklau o charakteru pozorovaných at na parametrcké a neparametrcké. Parametrcké metoy (parametrc survval analyss) vyžauí specfkac konkrétního rozělení náhoné velčny T, zatímco neparametrcké metoy (nonparametrc survval analyss) žáné zvláštní přepoklay ohleně rozělení pravěpoobnost náhoné velčny T nevyžauí. V přípaě mecínských aplkací e znalost konkrétního rozělení velčny T velm omezená, což společně s enouchostí použtí ční neparametrcké metoy šroce používaným v analýze přežtí. Na ruhou stranu znalost rozělení pravěpoobnost náhoné velčny T e vžy výhoná, neboť použtí parametrckých meto e většnou enoušší a př korektně specfkovaném rozělení přesněší. Pomínka korektní specfkace rozělení pravěpoobnost e však nesmírně ůležtá. Poku totž přepoklááme pravěpoobnostní chování stuované cílové populace le určtého rozělení, ale ve skutečnost tento přepokla splněn není, e špatně specfkace celého statstckého moelu, což vee k zaváěícím výslekům a nenterpretovatelným závěrům. V analýze přežtí efnueme eště alší skupnu meto označovanou ako semparametrcké (semparametrc survval analyss). Jená se o moelovací přístupy, které nesou plně parametrcké, protože nevyžauí přepokla o znalost rozělení velčny T, ncméně akožto moely s parametry, respektve regresním koefcenty pracuí. Neznáměší semparametrckou metoou e tzv. Coxův regresní moel proporconálních rzk, který e blíže vysvětlen v kaptole 8. 3. Kaplanův-Meerův oha funkce přežtí Neznáměším a nepoužívaněším neparametrckým ohaem funkce přežtí, který se stal stanarem pro honocení přežtí v klnckých stuích e Kaplanův-Meerův oha funkce 1

přežtí (Kaplan-Meer estmator) [1]. Myšlenka výpočtu e enouchá, aby byl subekt v čase t bez sleované uálost (aby se např. pacent s náorovým onemocněním ožl času, nesmí se u ně uálost vyskytnout v žáném čase t * takovém, pro něž platí, že t * < t. Abychom tey mohl ohanout pravěpoobnost, že u aného subektu se o času t nevyskytne sleovaná uálost, musíme ohanout opovíaící pravěpoobnost také pro všechny časy t *, které času t přecházeí. Přepokláeme n různých časů přežtí takových, že t 1 < t < < t n < t. Pak pravěpoobnost přežtí bez výskytu sleované uálost až o času t, S(, lze vyářt pomocí vztahu (3.1) Abychom získal oha S(, e třeba specfkovat enotlvé komponenty rovnce (3.1). Vzhleem k tomu, že nemáme k spozc nou vstupní nformac než pozorované honoty, můžeme pravěpoobnost přežtí aného času vyářt pouze s pomocí úaů o úmrtí v aném čase. Obecně lze tey psát 1, (3.) ke e počet sleovaných uálostí zaznamenaných v čase t a e počet subektů v rzku výskytu sleované uálost v čase t, což e počet subektů, kteří bez sleované uálost přečkal čas t 1. Funkc přežtí pak můžeme ohanout pomocí vztahu. (3.3) Př ohau pravěpoobností přežtí enotlvých časů t e třeba aekvátně zohlent cenzorování. Cenzorované časy přežtí totž nelze honott steně ako kompletní pozorování, neboť nepřspívaí k, ale zároveň e nelze z honocení vyřat. Kaplanův-Meerův oha pracue s cenzorováním tak, že tato pozorování vypaávaí ze skupny subektů v rzku hne po zaznamenaném čase cenzorování. Je-l tey čas t cenzorovaný a platí, že t < t < t +1, pak aný subekt e v čase t započítán o skupny subektů v rzku ( ), ale v násleuícím pozorovaném čase výskytu sleované uálost t +1 ho ž o skupny v rzku ( +1 ) nezahrnueme. Výslený vzorec pro Kaplanův-Meerův oha funkce přežtí lze tey enouchou úpravou vztahu (3.3) zapsat ako 1. (3.4) Praktcky počítáme výše uveený součn pouze přes kompletní časy přežtí, ncméně teoretcky ho lze efnovat přes všechny pozorované časy přežtí s tím, že cenzorované časy přežtí k ohau přspívaí pouze prostřenctvím, neboť pro cenzorované časy e = 0.

3..1 Greenwooův vzorec Pro konstrukc 100(1 α)% ntervalu spolehlvost pro oha potřebueme získat eho rozptyl, tey var. Vzhleem k tomu, že oha e án ako součn, e vhoněší ho neříve zlogartmovat a převést tak na součet enotlvých ohaů. Dále lze ukázat, že korelace enotlvých ohaů a e nulová, což nám umožňue použít enouché pravlo pro počítání s rozptylem náhoné velčny. Výše uveené vee ke vztahu var ( ln Sˆ( ) = var ( ) ln = var ln = var( ln( )). (3.5) t t t K ovození rozptylu logartmu lze využít fakt, že maxmálně věrohoným ohaem pravěpoobnost p e číslo 1 / a tzv. elta metou (elta metho) []. Dostáváme tak oha rozptylu logartmu ve tvaru var ( ln( p )) ˆ 1 = p ˆ 1 var( ) = = ( ). (3.6) Dosaíme-l tento vztah zpět o (3.5) a použeme-l znovu elta metou, získáme výslený oha rozptylu S ˆ(, který e označován ako tzv. Greenwooův vzorec (Greenwoo s formula) [3], ve tvaru ( Sˆ( ) = ( Sˆ( ) var. (3.7) t ( ) Greenwooův vzorec e stanarem pro oha varablty Kaplanova-Meerova ohau funkce přežtí a e mplementován ve většně ostupných softwarů, které umožňuí analýzu přežtí. Exstuí však alternatvní ohay, se kterým se můžeme v lteratuře softwarech setkat, příklaem e oha le autorů Peto a kol. [4], kteří navrhl oha rozptylu Sˆ ( ve tvaru var 1, (3.8) ke n t e počet subektů v rzku v čase t. Tento oha byl navržen pro časy, ky se S ˆ( blíží honotám 1 nebo 0 a př nchž by oha pomocí Greenwooova vzorce mohl skutečnou varabltu pohonocovat [5]. 3

3.. 100(1 α)% nterval spolehlvost pro Kaplanův-Meerův oha Nepoužívaněším postupem pro konstrukc 100(1 α)% ntervalu spolehlvost pro oha S ˆ( e využtí aproxmace normálním rozělením, kterou nám umožňue platnost centrální lmtní věty. Za přepoklau, že aproxmace normálním rozělením e korektní (pomínky obré aproxmace souvsí přeevším s ostatečným množstvím subektů zahrnutých o analýzy), můžeme zkonstruovat 100(1 α)% nterval spolehlvost pro Kaplanův-Meerův oha pravěpoobnost přežtí v čase t násleuícím způsobem ( S( z var( Sˆ( ); Sˆ( z var( Sˆ( ))) ˆ 1 α / + 1 α / t, (3.9) ke z (1 α ) označue 100(1 α )% kvantl stanarzovaného normálního rozělení. Výhoou tohoto vyáření e eho výpočetní enouchost a ostupnost, nevýhoou e eho symetre. V blízkost honot 1 a 0 e totž symetrcký nterval spolehlvost pro oha funkce přežtí nevhoný, neboť přpouští honoty přežtí větší než 1 nebo naopak honoty záporné. Z praktckých ůvoů se tak častě používá konstrukce 100(1 α)% ntervalu spolehlvost s využtím transformace ohau S ˆ( na honoty z ntervalu (-, ). Ta nám totž umožní se vyhnout výše uveeným komplkacím. Příklaem e použtí komplementární logartmcké transformace, př níž transformueme oha funkce přežtí ako lnln, (3.10) což s využtím elta metoy pro ovození rozptylu výrazu (3.10), varlnln, a po aplkac pravel pro počítání s mocnnam vee na výslený tvar 100(1 α)% ntervalu spolehlvost pro S ˆ( ve tvaru 1/, 1/. (3.11) 3. Oha funkce přežtí metoou úmrtnostních tabulek Záklaní myšlenka ohau funkce přežtí pomocí metoy úmrtnostních tabulek e stená ako v přípaě Kaplanova-Meerova ohau, opět vyařueme oha S ˆ( ako součn pomíněných pravěpoobností opovíaících určtým časovým ntervalům. Na rozíl o Kaplanova-Meerova ohau, ke byly časové ntervaly určeny pozorovaným honotam časů přežtí, v přípaě metoy úmrtnostních tabulek pracueme s přeem efnovanou saou J časových ntervalů. Ty mohou být stanoveny lbovolně, ncméně většnou logcky vycházeí z pomínek aných expermentem nebo stuí. V populační analýze přežtí onkologckých pacentů se napříkla nečastě používaí enoleté ntervaly a zaímá nás většnou pětleté (5 ntervalů) nebo esetleté (10 ntervalů) přežtí. Vzhleem k tomu, že pracueme s elším časovým ntervaly, nám pro oha S ˆ( stačí pouze agregovaná ata, tey souhrnné úae pro enotlvé časové ntervaly. Označme počet sleovaných uálostí v tém ntervalu, ke = 1,, J, ále označme počet subektů v rzku výskytu sleované uálost na začátku ntervalu a nakonec c označme počet 4

subektů s časem přežtí cenzorovaným v průběhu tého ntervalu. Pravěpoobnost přežtí tého časového ntervalu pak můžeme ohanout pomocí výrazu = 1, (3.1) c což vee k ohau pravěpoobnost přežtí bez sleované uálost až o konce ntervalu J, S ˆ( J ), ve tvaru Sˆ ( J ) =. (3.13) J J = 1 c = 1 = 1 Z uveeného vztahu e vět, že cenzorované časy přežtí přímo ovlvňuí výpočet ohau funkce přežtí a to tak, že v kažém ntervalu oečítáme o počtu vstupuících subektů polovnu počtu cenzorovaných subektů. Tento postup přepokláá rovnoměrné cenzorování v průběhu celého ntervalu, polovna z c subektů e cenzorovaná v první polovně ntervalu a polovna z c subektů e cenzorovaná v ruhé polovně ntervalu. Počet subektů s uálostí tak vztahueme k počtu subektů v rzku uprostře ntervalu. 3.3 Nelsonův-Aalenův oha kumulatvní rzkové funkce Nelsonův-Aalenův oha e záklaní neparametrckou metoou ohau kumulatvní rzkové funkce [6], která steně ako Kaplanův-Meerův oha pracue pouze se souborem n pozorovaných honot časů přežtí takových, že t 1 < t < < t n < t. Pak Nelsonův-Aalenův oha kumulatvní rzkové funkce v čase t má tvar H ˆ ( =, (3.14) t ke steně ako v přípaě Kaplanova-Meerova ohau funkce přežtí značí počet sleovaných uálostí zaznamenaných v čase t a e počet subektů v rzku výskytu sleované uálost v čase t. Opět tey platí, že suma e počítána přes všechny pozorované časy přežtí, cenzorované časy ale k výslenému ohau přspívaí pouze prostřenctvím, neboť pro cenzorované časy přežtí e rovno nule. Aalen v roce 1978 [7] ále ovol rozptyl Nelsonova-Aalenova ohau kumulatvní rzkové funkce ve tvaru var, (3.15) který můžeme použít pro konstrukc ntervalu spolehlvost pro Nelsonův-Aalenův oha kumulatvní rzkové funkce. Označíme-l z (1 α ) honotu 100(1 α )% kvantlu 5

stanarzovaného normálního rozělení, pak lze 100(1 α)% nterval spolehlvost vyářt ako nterval var, var. (3.16) 3.4 Breslowův oha funkce přežtí V kaptole sme kromě efnce záklaních charakterstk náhoné velčny T ukázal ech vzáemné vazby. Hlavní z nch e vztah (.11) efnuící výpočet funkce přežtí pomocí kumulatvní rzkové funkce, S( = exp[h(]. Právě tohoto vztahu využívá Breslowův oha funkce přežtí, který využívá neparametrckého Nelsonova-Aalenova ohau kumulatvní rzkové funkce pro oha funkce přežtí. Breslowův oha funkce přežtí e tey án vztahem expexp, (3.17) ke a sou opět počet uálostí a počet subektů v rzku sleované uálost v čase t. Pro konstrukc ntervalu spolehlvost Breslowova ohau funkce přežtí opět potřebueme eho rozptyl, který e v tomto přípaě án vztahem var. (3.18) Problémy k řešení: 1. Jak vypaá Kaplanův-Meerův oha funkce přežtí v přípaě, že žáný z časů přežtí není cenzorován? [Výsleek: ]. Zkuste ovot rozptyl logartmu pomocí elta metoy. [Výsleek: varln ] Použtá lteratura: 1. Kaplan EL, Meer P. Nonparametrc estmaton from ncomplete observatons. Journal of Amercan Statstcal Assocaton, 1958; 58, 457 481.. oríguez, G. Lecture Notes on Generalze Lnear Moels. 007. Avalable at http://ata.prnceton.eu/wws509/notes/ 3. Greenwoo M. The Errors of Samplng of the Survvorshp Table, vol. 33 of eports on Publc Health an Mecal Subects, 196. Lonon: Her Maesty's Statonery Offce. 6

4. Peto, Pke MC, Armtage P, Breslow NE, Cox D, Howar SV, Mantel N, McPherson K, Peto J, Smth PG. Desgn an analyss of ranomze clncal trals requrng prolonge observaton of each patent. II. Analyss an examples. Brtsh Journal of Cancer, 1977; 35(1):1 39. 5. Collet D. Moellng Survval Data n Mecal esearch. 003, Chapman & Hall/CC, Lonon. 6. Nelson W. Theory an applcatons of hazar plottng for censore falure ata. Technometrcs, 197; 14:945-966. 7. Aalen O. Nonparametrc nference for a famly of countng processes. Ann. Statst, 1978; 6:701-76. Doporučená lteratura: 1. Marubn E, Vasecch MG. Analysng Survval Data from Clncal Trals an Observatonal Stues. 1995, John Wley & Sons, Chchester, Unte Kngom.. Klen JP, Moeschberger ML. Survval Analyss: Technques for Censore an Truncate Data. 003, Sprnger, New York. 7