NEPARAMETRICKÉ BAYESOVSKÉ ODHADY V KOZIOLOVĚ-GREENOVĚ MODELU NÁHODNÉHO CENZOROVÁNÍ Michal Friesl Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni Princip Příklady V K.-G. modelu
Bayesovský přístup Data pozorování X s hodnotami v (X, A) X s rozdělením Q Parametricky např. Q = Q µ,σ 2 = N(µ, σ 2 ) µ, σ 2 parametry náhodné veličiny apriorní rozdělení na R 2 Neparametricky Q libovolné rozdělení na (X, A) parametry (Q(A), A A) náhodný proces apriorní rozdělení na prostoru pravděpodobnostních měr
Dirichletův proces Q D(α) α = n 0 Q 0 konečná míra na (X, A) (Q(A 1 ),..., Q(A k )) D(α(A 1 ),..., α(a k )) Interpretace α E Q(A) = Q 0 (A) var Q(A) = Q 0 (A)(1 Q 0 (A))/(n 0 + 1) Vlastnosti pokrývá širokou třídu rozdělení Q s pravděpodobností 1 diskrétní např. Q(A) = p n δ Yn (A), kde Y n Q 0, p n = θ n j<n (1 θ j), θ j B(1, n 0 )
Uplatnění Dirichletova procesu Pozorování X 1,..., X n náhodný výběr z Q Q D(α) Aposteriorní rozdělení (Q X 1,..., X n ) D(α + δ Xi ) Reálné veličiny F (x) = E(Q(, x X 1,..., X n ) = n 0F 0 (x) + nf n (x) n 0 + n Ê Q = n 0 E Q 0 + n X n 0 + n při n 0 0 je F F n, Ê Q X
Zprava neutrální procesy Kromě Q distribuční funkce F (t) = Q(, t F (t 1 ), F (t 2) F (t 1 ),..., F (t k) F (t k 1 ) nezávislé 1 F (t 1 ) 1 F (t k 1 ) Anebo kumulativní intenzita Λ(t) = ln(1 F (t)) S(t) = P(X > t) = e Λ(t), P(X > t X > s) = e Λ(s,t Λ proces s nezávislými přírůstky Vlastnosti skoro jistě diskrétní rozdělení aposteriorní opět zprava neutrální v časech pozorování vždy skoky
Gama proces Λ G(n 0, Λ 0 ) n 0 > 0, Λ 0 libovolná kumulativní intenzita nezávislé přírůstky (zprava neutrální) Λ(s, t = Λ(t) Λ(s) G(n 0, n 0 Λ 0 (s, t ) Parametry E Λ(s, t = Λ 0 (s, t var Λ(s, t = Λ 0 (s, t /n 0 Aposteriorně mezi pozorováními gama v časech pozorování skoky rozdělení nových skoků nezávisí na čase
Gama proces a odhady Pozorování X 1,..., X n náhodný výběr z Q Q G(n 0, Λ 0 ) Pro jednoduchost Λ 0 spojitá, pozorování různá 1 F ( n0 + N ) n0λ t 0(t) (t) = n 0 + N t + 1 i,x i t E Xi kde N t = #{i, X i > t} a ( n0 + N x + 1 ) n0λ0(x) ln((n 0 + N x + 2)/(n 0 + N x + 1)) E x = n 0 + N x ln((n 0 + N x + 1)/(n 0 + N x ))
Cenzorování Náhodné cenzorování některá pozorování předčasně ukončena kromě X i ještě časový cenzor Y i X i a Y i nezávislé Pozorujeme Z i = min(x i, Y i ) δ i = I Xi Y i Při Z i = t pro zkoumané X i skutečné pozorování X i = t (δ = 1) částečná informace X i > t (δ = 0)
Vliv cenzorování na odhady Dirichletův proces aposteriorní není Dirichletův Ŝ(t) = n 0S 0 (t) + N t n 0 S 0 (y ) + N y u y n 0 + n n 0 S 0 (y ) + N y y t,y=y i=z i při n 0 0 Kaplanův-Meierův odhad (1 u x ) N x x t,x=x i=z i Zprava neutrální proces aposteriorní znovu zprava neutrální u G(n 0, Λ 0 ) v odhadu součin jen přes necenzorovaná i cenzorování X i Y i
Koziolův-Greenův model Model náhodného cenzorování X F Λ, Y G Λ G nezávislé pozorujeme Z = min(x, Y ), δ = I X Y navíc 1 G = (1 F ) γ pro nějaké γ > 0 tj. Λ G = γλ Ve spojitém případě Z a δ nezávislé P(δ = 1) = 1/(1 + γ) Oproti předchozímu doba X a cenzor Y mají společný parametr i v Y = t nebo Y t obsažena informace o Λ
Předpoklady Apriorní rozdělení Λ G(n 0, Λ 0 ) γ nezávislé s Λ, s hustotou π(γ) Pozorování data = (Z 1, δ 1 ),..., (Z n, δ n ) značíme N t = #{i, Z i > t} Pro jednoduchost zápisu Λ 0 spojitá pozorování Z i navzájem různá
Po jednom pozorování Např. Z = t, δ = 0, tj. Y = t, X > t věroh. A Λ(A) aprior. Y = t X > t apost. (., s)............... (s, t) λ G(n 0, a) e γλ e λ G(n 0 + 1 + γ, a) {t} µ G(n 0, 0) 1 e γµ e µ G 0 (n 0 + 1, n 0 + 1 + γ) (t, u) ν G(n 0, b) 1 1 G(n 0, b) (u,.)............... G(n 0, a) s hustotou na 0 Γ(a) λa 1 e n0λ, λ > 0 G 0 (n, m), 0 < n < m, s hustotou e nµ e mµ µ ln(n/m), µ > 0
Aposteriorní rozdělení Λ při daném γ a datech nezávislé přírůstky mezi časy pozorování Λ(s, t) G(n 0 + N s (1 + γ), n 0 Λ 0 (s, t)) v čase s jedním { pozorováním Z i = t (Λ 0 {t} = 0) G 0 (N Zi (1 + γ), N Zi (1 + γ) + 1), δ i = 1, Λ{t} = G 0 (N Zi (1 + γ) + 1, N Zi (1 + γ) + 1 + γ), δ i = 0, A hustota γ...
... a hustota γ ( n π(γ data) Aposteriorní rozdělení (pokrač.) j=1 ) C j (γ) D j (γ) π(γ), γ > 0. kde ( n ) n0λ 0 0(Z j 1,Z j) C j (γ) = n 0 + N Zj 1 (1 + γ) n 0 + N Zj (1 + γ) ln n D j (γ) = 0 + N Zj (1 + γ) + 1, δ j = 1 n 0 + N Zj (1 + γ) + 1 ln δ j = 0. n 0 + N Zj (1 + γ) + 1 + γ
Pro t (Z (i 1), Z (i) ) Ŝ(t) = E(e Λ(,t data) = kde ( K 1 (γ) = Odhad 0 0 ) C j (γ)d j (γ) C i1 (γ) j < i ( K 2 (γ) = C i2 (γ)d i (γ) K + 1 (γ) = ( j > i K + 1 (γ)k 2(γ)π(γ) dγ K 1 (γ)k 2 (γ)π(γ) dγ ) C j (γ)d j (γ) C + j (γ)d+ j (γ) )C + i1 (γ) j < i j < i i1 i2 j > i Z (i 1) t Z (i)
Uvolnění předpokladů Skoky v apriorní intenzitě Λ 0 při pozorováních v bodech skoků G 0 g 1 g 2, D(γ) rozdíly C(γ) Shody mezi časy pozorování složitější zápis, kombinace cenz. a necenz. místo G 0 např. e µ (1 e µγ) (1 e µ ) [1 cenz., 1 necenz.] místo D i (γ) např. ln (n0+1)(n0+2+γ) (n 0+1+γ)(n 0+2) Jiné apriorní rozdělení 1 exp( Λ) D(α) v normovacích konstantách (Λ γ) rozdíly digama funkcí
NEPARAMETRICKÉ BAYESOVSKÉ ODHADY V KOZIOLOVĚ-GREENOVĚ MODELU NÁHODNÉHO CENZOROVÁNÍ Michal Friesl Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni http://home.zcu.cz/ friesl/archiv/rob04.html