Neparametrické odhady podmíněné rizikové funkce

Podobné dokumenty
Ústav matematiky a statistiky Masarykova univerzita Brno. workshopy Finanční matematika v praxi III Matematické modely a aplikace Podlesí

Odhady Parametrů Lineární Regrese

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

2016 Česká republika ŽENY (aktuální k )

Česká republika - ŽENY

NEPARAMETRICKÉ BAYESOVSKÉ ODHADY V KOZIOLOVĚ-GREENOVĚ MODELU NÁHODNÉHO CENZOROVÁNÍ. Michal Friesl

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

PRAVDĚPODOBNOST A STATISTIKA. Odhady parametrů Postačující statistiky

15. T e s t o v á n í h y p o t é z

n = 2 Sdružená distribuční funkce (joint d.f.) n. vektoru F (x, y) = P (X x, Y y)

Pravděpodobnost a statistika (BI-PST) Cvičení č. 7

Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I

Výběrové charakteristiky a jejich rozdělení

Základy teorie odhadu parametrů bodový odhad

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

BAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni

PRAVDĚPODOBNOST A STATISTIKA

7 Regresní modely v analýze přežití

8 Coxův model proporcionálních rizik I

Primitivní funkce a Riemann uv integrál Lineární algebra Taylor uv polynom Extrémy funkcí více prom ˇenných Matematika III Matematika III Program

AVDAT Náhodný vektor, mnohorozměrné rozdělení

Základy teorie pravděpodobnosti

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový.

4 Parametrické odhady

Charakterizace rozdělení

Markov Chain Monte Carlo. Jan Kracík.

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc.

Odhad stavu matematického modelu křižovatek

Modely selektivní interakce a jejich aplikace

Pravděpodobnost a statistika I KMA/K413

Téma 22. Ondřej Nývlt

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

MATEMATICKÁ STATISTIKA

Numerické integrace některých nediferencovatelných funkcí

8. Normální rozdělení

PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

2 Hlavní charakteristiky v analýze přežití

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

Pravděpodobnost a statistika (BI-PST) Cvičení č. 9

5. B o d o v é o d h a d y p a r a m e t r ů

Pojistná matematika. Úmrtnostní tabulky, komutační čísla a jejich použití. Silvie Kafková

AVDAT Klasický lineární model, metoda nejmenších

Přijímací zkouška na navazující magisterské studium 2017

PRAVDĚPODOBNOST A STATISTIKA

Statistika II. Jiří Neubauer

15. T e s t o v á n í h y p o t é z

5. T e s t o v á n í h y p o t é z

PRAVDĚPODOBNOST A STATISTIKA

ODHADY NÁVRATOVÝCH HODNOT

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Řešení. Označme po řadě F (z) Odtud plyne, že

Odhad spolehlivosti kolejových obvodů z nekompletních cenzorovaných dat

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

Přednáška. Další rozdělení SNP. Limitní věty. Speciální typy rozdělení. Další rozdělení SNP Limitní věty Speciální typy rozdělení

1 Klasická pravděpodobnost. Bayesův vzorec. Poslední změna (oprava): 11. května 2018 ( 6 4)( 43 2 ) ( 49 6 ) 3. = (a) 1 1 2! + 1 3!

LWS při heteroskedasticitě

NMSA202 PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA POZNÁMKY O ZKOUŠCE

Matematika 5 FSV UK, ZS Miroslav Zelený

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

AVDAT Nelineární regresní model

KGG/STG Statistika pro geografy

Definice spojité náhodné veličiny zjednodušená verze

Regresní analýza 1. Regresní analýza

Tomáš Karel LS 2012/2013

Základy matematické analýzy

VŠB Technická univerzita Ostrava

Přijímací zkouška na navazující magisterské studium 2014

Lineární algebra : Lineární (ne)závislost


Základy počtu pravděpodobnosti a metod matematické statistiky

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Bayesovské metody. Mnohorozměrná analýza dat

Interpolace, ortogonální polynomy, Gaussova kvadratura

NÁHODNÁ VELIČINA. 3. cvičení

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Kapitola 2: Spojitost a limita funkce 1/20

10. N á h o d n ý v e k t o r

14. B o d o v é o d h a d y p a r a m e t r ů

6. T e s t o v á n í h y p o t é z

a způsoby jejího popisu Ing. Michael Rost, Ph.D.

Praktická statistika. Petr Ponížil Eva Kutálková

Kapacita jako náhodná veličina a její měření. Ing. Igor Mikolášek, Ing. Martin Bambušek Centrum dopravního výzkumu, v. v. i.

Kapitola 11: Lineární diferenciální rovnice 1/15

Diferenˇcní rovnice Diferenciální rovnice Matematika IV Matematika IV Program

(1) Limity. Kristýna Kuncová. Matematika B2 18/19. Kristýna Kuncová (1) Limity 1 / 27

Martin Otava Parametrické regresní modely v analýze

Algoritmy komprese dat

PRAVDĚPODOBNOST A STATISTIKA

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

)(x 2 + 3x + 4),

Intervalová data a výpočet některých statistik

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

AVDAT Mnohorozměrné metody, metody klasifikace

Analýza přežití Základy analýzy klinických dat: Analýza přežití

OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE DIFERENCIÁLNÍ ROVNICE 1.ŘÁDU

Transkript:

Ústav matematiky a statistiky Přírodovědecká fakulta Masarykova univerzita Finanční matematika v praxi III a Matematické modely a aplikace 3.-6. září 2013

Obsah 1 Analýza přežití Funkce přežití a riziková funkce Předpoklady 2 Jádrové odhady rizikové funkce Volba vyhlazovacího parametru 3 Podmíněná riziková funkce Coxův model proporcionálního rizika Jádrové odhady podmíněné rizikové funkce 4 5

Analýza přežití Analýza přežití Funkce přežití a riziková funkce Předpoklady Čas přežití T (čas od počáteční události do koncové události) Cenzorování (levostranné, intervalové, pravostranné) T 1, T 2,..., T n nezávislé a stejně rozdělené časy přežití s distribuční funkcí F C 1, C 2,..., C n nezávislé a stejně rozdělené časy cenzorování s distribuční funkcí G (X i, δ i ), kde X i = min(t i, C i ) a δ i = I Ti C i X 1, X 2,..., X n nezávislé a stejně rozdělené časy sledování s distribuční funkcí L splňující L(x) = 1 (1 F (x))(1 G(x))

Otázky v analýze přežití Analýza přežití Funkce přežití a riziková funkce Předpoklady 1 Jaká je pravděpodobnost přežití např. po 5 letech? Kdy je největší riziko úmrtí? 2 Je rozdíl v přežití např. mezi ženami a muži? 3 Jak závisí přežití např. na věku?

Funkce přežití a riziková funkce Analýza přežití Funkce přežití a riziková funkce Předpoklady Funkce přežití F (x) = P(T x) = 1 F (x) Kaplan-Meierův odhad funkce přežití F (x) = i:x (i ) <x ( n i ) δ(i ) n i + 1 kde X (i) značí i-té pozorování seřazených X 1, X 2,..., X n a δ (i) je odpovídající indikátor cenzorování Riziková funkce λ(x) x = P(x T < x + x T x) λ(x) = f (x) F (x)

Funkce přežití a riziková funkce Analýza přežití Funkce přežití a riziková funkce Předpoklady Kumulativní riziková funkce Λ(x) = x 0 λ(u)du Nelson-Aalenův odhad ˆΛ n (x) = X (i ) x δ (i) n i + 1

Předpoklady Analýza přežití Funkce přežití a riziková funkce Předpoklady 1 [0, T ] interval, pro který L(T ) < 1 2 λ C 2 [0, T ] 3 K reálná funkce splňující podmínky 1 K Lip[ 1, 1] 2 supp(k) = [ 1, 1], K( 1) = K(1) = 0 3 1 0 j = 1, x j K(x)dx = 1 j = 0, 1 β 2 0 j = 2. Taková funkce se nazývá jádro řádu 2 4 {h(n)} nenáhodná posloupnost kladných čísel splňující lim h(n) = 0, lim h(n)n = n n

Jádrové odhady rizikové funkce Jádrové odhady rizikové funkce Volba vyhlazovacího parametru λ(t) = f (t) F (t) and L(x) = F (x)g(x) λ(x) = G(x)f (x) L(x) = r(x) L(x) r(x) hustota úmrtí, L(x) funkce přežití pozorovaných časů ˆλ(x) = ˆr(x) ˆλ 1 (x) = ˆλ 2 (x) = L(x) 1 n nh i=1 δ i K 1 L n(x) 1 nh n i=1 δ i K ( ) x Xi h ( x Xi h 1 1 n n i=1 W ( x Xi h ) ), where W (x) = x K(t)dt

Jádrové odhady rizikové funkce Jádrové odhady rizikové funkce Volba vyhlazovacího parametru Konvoluce jádra K s Nelson-Aalenovým odhadem ˆλ 3 (x) = 1 ( ) x u K dˆλ n (u) = h h = 1 n ( ) x X(i) δ (i) K h h n i + 1 i=1

Volba vyhlazovacího parametru Jádrové odhady rizikové funkce Volba vyhlazovacího parametru Metoda křížového ověřování ĥcv = arg min h Hn CV (h) CV (h) = 0 ˆλ 2 (x)dx 2 1 n n i=1 ˆλ i (X i ) (1 L n (X i )) δ i Metoda maximální věrohodnosti ĥml = arg max h Hn ML(h) n ML(h) = ˆλ i (X i ) δ i F i (X i ) i=1 iterační metoda, plug-in metoda,...

Podmíněná riziková funkce Podmíněná riziková funkce Coxův model proporcionálního rizika Jádrové odhady podmíněné rizikové funkce (X i, δ i, Y i ), kde X i = min(t i, C i ), δ i = I Ti C i a Y i je vektor kovariát λ(x y) x = P(x T < x + x T x, Y = y) λ(x y) = f (x y) G(x y)f (x y) = = r(x y) F (x y) L(x y) L(x y) Λ(x y) = x 0 λ(u y)du

Coxův model proporcionálního rizika Podmíněná riziková funkce Coxův model proporcionálního rizika Jádrové odhady podmíněné rizikové funkce λ(x y) = λ 0 (x) exp(βy), kde λ 0 (x) je základní riziko a β je parametr Poměr riziko: λ(x y) λ(x y ) = λ 0(x) exp(βy) λ 0 (x) exp(βy ) = exp(β(y y )) β maximalizace věrohodnostní funkce

Podmíněná riziková funkce Coxův model proporcionálního rizika Jádrové odhady podmíněné rizikové funkce Jádrové odhady podmíněné rizikové funkce ˆλ 2 (x y) = 1 ( ) x Xi h x n h x i=1 w i(y)δ i K ( ) n i=1 w Xi x i(y)w h x kde W (x) = x K(t)dt a w i(y) jsou váhy Nadaraya Watsonovy váhy ( ) K y Yi h y w i (y) = ( ) n j=1 K y Yj h y

Podmíněná riziková funkce Coxův model proporcionálního rizika Jádrové odhady podmíněné rizikové funkce Jádrové odhady podmíněné rizikové funkce ˆλ 3 (x y) = 1 h x ( ) x u K dˆλ n (u y) = h x = 1 n ( ) x X(i) K h x i=1 h x δ (i) w (i) (y) 1 i 1 j=1 w (j)(y) kde X (i) jsou seřazené pozorované časy, δ (i) je odpovídající indikátor cenzorování and w (i) (y) je odpovídající váha

Metoda křížového ověřování Podmíněná riziková funkce Coxův model proporcionálního rizika Jádrové odhady podmíněné rizikové funkce ISE = = = (ˆλ(x y) λ(x y)) 2 f (y)dxdy = ˆλ 2 (x y)f (y)dxdy 2 ˆλ(x y)λ(x y)f (y)dxdy + = ˆλ 2 (x y)f (y)dxdy 2 ˆλ(x y) r(x y)f (y)dxdy + L(x y) CV (h x, h y ) = 1 n n i=1 0 ˆλ 2 (x Y i )dx 2 1 n n ˆλ i (X i Y i ) L(X ˆ i Y i ) i=1 δ i (ĥx, ĥy ) = arg min CV (h x, h y )

500 pozorování. Cenzorování 15 %. log T i = Y i + ε i, Y i U(0, 1), ε i N(0, 1), C i log N(1.9, 0.6 2 )

Vnější typ odhadu

Vnitřní typ odhadu

391 pacientů, kteří byli v letech 2003-2011 léčeni na MOÚ v Brně 75 úmrtí (cenzorování 80 %) čas sledování 9 dní až 154 měsíců (medián 38 měsíců) velikost tumoru 0 až 200 mm (průměr 54 mm), hranice pro nepříznivou předpověď 70 mm věk 21 až 93 let (průměr 61 let)

kovariáta = velikost tumoru

kovariáta = věk

Děkuji za pozornost.