NEPARAMETRICKÉ BAYESOVSKÉ ODHADY V KOZIOLOVĚ-GREENOVĚ MODELU NÁHODNÉHO CENZOROVÁNÍ. Michal Friesl

Podobné dokumenty
BAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni

BAYESOVSKÉ ODHADY V NĚKTERÝCH MODELECH

Výběrové charakteristiky a jejich rozdělení

PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady

Apriorní rozdělení. Jan Kracík.

Charakterizace rozdělení

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

PRAVDĚPODOBNOST A STATISTIKA

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

1 Klasická pravděpodobnost. Bayesův vzorec. Poslední změna (oprava): 11. května 2018 ( 6 4)( 43 2 ) ( 49 6 ) 3. = (a) 1 1 2! + 1 3!

Definice spojité náhodné veličiny zjednodušená verze

Náhodné vektory a matice

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

PRAVDĚPODOBNOST A STATISTIKA. Odhady parametrů Postačující statistiky

Pravděpodobnost a statistika (BI-PST) Cvičení č. 7

Neparametrické odhady podmíněné rizikové funkce

Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc.

Statistika II. Jiří Neubauer

y = 0, ,19716x.

Přednáška. Další rozdělení SNP. Limitní věty. Speciální typy rozdělení. Další rozdělení SNP Limitní věty Speciální typy rozdělení

Aktualizace modelu vlastnosti materiálu. Stanovení vlastností materiálů

4 Parametrické odhady

AVDAT Náhodný vektor, mnohorozměrné rozdělení

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Téma 22. Ondřej Nývlt

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Hodnocení vlastností materiálů podle ČSN EN 1990, přílohy D

Pravděpodobnost a statistika

Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Odhady - Sdružené rozdělení pravděpodobnosti

Odhady Parametrů Lineární Regrese

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

NMAI059 Pravděpodobnost a statistika

Pravděpodobnost a matematická statistika

Pravděpodobnost a statistika (BI-PST) Cvičení č. 9

Bayesovské metody. Mnohorozměrná analýza dat

Pojistná matematika. Úmrtnostní tabulky, komutační čísla a jejich použití. Silvie Kafková

Základy teorie pravděpodobnosti

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

SPOJITÉ ROZDĚLENÍ PRAVDĚPODOBNOSTI. 7. cvičení

ROVNICE NA ČASOVÝCH ŠKÁLÁCH A NÁHODNÉ PROCESY. Michal Friesl

Pravděpodobnost a statistika (BI-PST) Cvičení č. 4

Pravděpodobnost a statistika

NÁHODNÁ VELIČINA. Podle typu výběrového prostoru rozlišujeme dva základní druhy NV Diskrétní (nespojitou) náhodnou veličinu Spojitou náhodnou veličinu

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Základy teorie odhadu parametrů bodový odhad

Intervalové Odhady Parametrů

Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

NÁHODNÉ VELIČINY JAK SE NÁHODNÁ ČÍSLA PŘEVEDOU NA HODNOTY NÁHODNÝCH VELIČIN?

KGG/STG Statistika pro geografy

5. B o d o v é o d h a d y p a r a m e t r ů

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.

oddělení Inteligentní Datové Analýzy (IDA)

Testování statistických hypotéz

Aplikace 2: Hledání informativních příznaků pro rozpoznávání

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

NÁHODNÁ VELIČINA. 3. cvičení

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

I. D i s k r é t n í r o z d ě l e n í

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

p(x) = P (X = x), x R,

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

pravděpodobnosti, popisné statistiky

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

9. Vícerozměrná integrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Odhad spolehlivosti kolejových obvodů z nekompletních cenzorovaných dat

Intervalová data a výpočet některých statistik

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Chyby měření 210DPSM

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

7. Rozdělení pravděpodobnosti ve statistice

MATEMATICKÁ STATISTIKA

n = 2 Sdružená distribuční funkce (joint d.f.) n. vektoru F (x, y) = P (X x, Y y)

AVDAT Mnohorozměrné metody, metody klasifikace

Lineární algebra : Lineární (ne)závislost

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

15. T e s t o v á n í h y p o t é z

Diferenˇcní rovnice Diferenciální rovnice Matematika IV Matematika IV Program

VaR analýza citlivosti, korekce

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

Přijímací zkouška na navazující magisterské studium 2014

Příloha D Navrhování pomocí zkoušek

Vybraná rozdělení náhodné veličiny

prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Pravděpodobnost a statistika Katedra teoretické informatiky Fakulta informačních technologií

Odhad parametrů N(µ, σ 2 )

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Transkript:

NEPARAMETRICKÉ BAYESOVSKÉ ODHADY V KOZIOLOVĚ-GREENOVĚ MODELU NÁHODNÉHO CENZOROVÁNÍ Michal Friesl Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni Princip Příklady V K.-G. modelu

Bayesovský přístup Data pozorování X s hodnotami v (X, A) X s rozdělením Q Parametricky např. Q = Q µ,σ 2 = N(µ, σ 2 ) µ, σ 2 parametry náhodné veličiny apriorní rozdělení na R 2 Neparametricky Q libovolné rozdělení na (X, A) parametry (Q(A), A A) náhodný proces apriorní rozdělení na prostoru pravděpodobnostních měr

Dirichletův proces Q D(α) α = n 0 Q 0 konečná míra na (X, A) (Q(A 1 ),..., Q(A k )) D(α(A 1 ),..., α(a k )) Interpretace α E Q(A) = Q 0 (A) var Q(A) = Q 0 (A)(1 Q 0 (A))/(n 0 + 1) Vlastnosti pokrývá širokou třídu rozdělení Q s pravděpodobností 1 diskrétní např. Q(A) = p n δ Yn (A), kde Y n Q 0, p n = θ n j<n (1 θ j), θ j B(1, n 0 )

Uplatnění Dirichletova procesu Pozorování X 1,..., X n náhodný výběr z Q Q D(α) Aposteriorní rozdělení (Q X 1,..., X n ) D(α + δ Xi ) Reálné veličiny F (x) = E(Q(, x X 1,..., X n ) = n 0F 0 (x) + nf n (x) n 0 + n Ê Q = n 0 E Q 0 + n X n 0 + n při n 0 0 je F F n, Ê Q X

Zprava neutrální procesy Kromě Q distribuční funkce F (t) = Q(, t F (t 1 ), F (t 2) F (t 1 ),..., F (t k) F (t k 1 ) nezávislé 1 F (t 1 ) 1 F (t k 1 ) Anebo kumulativní intenzita Λ(t) = ln(1 F (t)) S(t) = P(X > t) = e Λ(t), P(X > t X > s) = e Λ(s,t Λ proces s nezávislými přírůstky Vlastnosti skoro jistě diskrétní rozdělení aposteriorní opět zprava neutrální v časech pozorování vždy skoky

Gama proces Λ G(n 0, Λ 0 ) n 0 > 0, Λ 0 libovolná kumulativní intenzita nezávislé přírůstky (zprava neutrální) Λ(s, t = Λ(t) Λ(s) G(n 0, n 0 Λ 0 (s, t ) Parametry E Λ(s, t = Λ 0 (s, t var Λ(s, t = Λ 0 (s, t /n 0 Aposteriorně mezi pozorováními gama v časech pozorování skoky rozdělení nových skoků nezávisí na čase

Gama proces a odhady Pozorování X 1,..., X n náhodný výběr z Q Q G(n 0, Λ 0 ) Pro jednoduchost Λ 0 spojitá, pozorování různá 1 F ( n0 + N ) n0λ t 0(t) (t) = n 0 + N t + 1 i,x i t E Xi kde N t = #{i, X i > t} a ( n0 + N x + 1 ) n0λ0(x) ln((n 0 + N x + 2)/(n 0 + N x + 1)) E x = n 0 + N x ln((n 0 + N x + 1)/(n 0 + N x ))

Cenzorování Náhodné cenzorování některá pozorování předčasně ukončena kromě X i ještě časový cenzor Y i X i a Y i nezávislé Pozorujeme Z i = min(x i, Y i ) δ i = I Xi Y i Při Z i = t pro zkoumané X i skutečné pozorování X i = t (δ = 1) částečná informace X i > t (δ = 0)

Vliv cenzorování na odhady Dirichletův proces aposteriorní není Dirichletův Ŝ(t) = n 0S 0 (t) + N t n 0 S 0 (y ) + N y u y n 0 + n n 0 S 0 (y ) + N y y t,y=y i=z i při n 0 0 Kaplanův-Meierův odhad (1 u x ) N x x t,x=x i=z i Zprava neutrální proces aposteriorní znovu zprava neutrální u G(n 0, Λ 0 ) v odhadu součin jen přes necenzorovaná i cenzorování X i Y i

Koziolův-Greenův model Model náhodného cenzorování X F Λ, Y G Λ G nezávislé pozorujeme Z = min(x, Y ), δ = I X Y navíc 1 G = (1 F ) γ pro nějaké γ > 0 tj. Λ G = γλ Ve spojitém případě Z a δ nezávislé P(δ = 1) = 1/(1 + γ) Oproti předchozímu doba X a cenzor Y mají společný parametr i v Y = t nebo Y t obsažena informace o Λ

Předpoklady Apriorní rozdělení Λ G(n 0, Λ 0 ) γ nezávislé s Λ, s hustotou π(γ) Pozorování data = (Z 1, δ 1 ),..., (Z n, δ n ) značíme N t = #{i, Z i > t} Pro jednoduchost zápisu Λ 0 spojitá pozorování Z i navzájem různá

Po jednom pozorování Např. Z = t, δ = 0, tj. Y = t, X > t věroh. A Λ(A) aprior. Y = t X > t apost. (., s)............... (s, t) λ G(n 0, a) e γλ e λ G(n 0 + 1 + γ, a) {t} µ G(n 0, 0) 1 e γµ e µ G 0 (n 0 + 1, n 0 + 1 + γ) (t, u) ν G(n 0, b) 1 1 G(n 0, b) (u,.)............... G(n 0, a) s hustotou na 0 Γ(a) λa 1 e n0λ, λ > 0 G 0 (n, m), 0 < n < m, s hustotou e nµ e mµ µ ln(n/m), µ > 0

Aposteriorní rozdělení Λ při daném γ a datech nezávislé přírůstky mezi časy pozorování Λ(s, t) G(n 0 + N s (1 + γ), n 0 Λ 0 (s, t)) v čase s jedním { pozorováním Z i = t (Λ 0 {t} = 0) G 0 (N Zi (1 + γ), N Zi (1 + γ) + 1), δ i = 1, Λ{t} = G 0 (N Zi (1 + γ) + 1, N Zi (1 + γ) + 1 + γ), δ i = 0, A hustota γ...

... a hustota γ ( n π(γ data) Aposteriorní rozdělení (pokrač.) j=1 ) C j (γ) D j (γ) π(γ), γ > 0. kde ( n ) n0λ 0 0(Z j 1,Z j) C j (γ) = n 0 + N Zj 1 (1 + γ) n 0 + N Zj (1 + γ) ln n D j (γ) = 0 + N Zj (1 + γ) + 1, δ j = 1 n 0 + N Zj (1 + γ) + 1 ln δ j = 0. n 0 + N Zj (1 + γ) + 1 + γ

Pro t (Z (i 1), Z (i) ) Ŝ(t) = E(e Λ(,t data) = kde ( K 1 (γ) = Odhad 0 0 ) C j (γ)d j (γ) C i1 (γ) j < i ( K 2 (γ) = C i2 (γ)d i (γ) K + 1 (γ) = ( j > i K + 1 (γ)k 2(γ)π(γ) dγ K 1 (γ)k 2 (γ)π(γ) dγ ) C j (γ)d j (γ) C + j (γ)d+ j (γ) )C + i1 (γ) j < i j < i i1 i2 j > i Z (i 1) t Z (i)

Uvolnění předpokladů Skoky v apriorní intenzitě Λ 0 při pozorováních v bodech skoků G 0 g 1 g 2, D(γ) rozdíly C(γ) Shody mezi časy pozorování složitější zápis, kombinace cenz. a necenz. místo G 0 např. e µ (1 e µγ) (1 e µ ) [1 cenz., 1 necenz.] místo D i (γ) např. ln (n0+1)(n0+2+γ) (n 0+1+γ)(n 0+2) Jiné apriorní rozdělení 1 exp( Λ) D(α) v normovacích konstantách (Λ γ) rozdíly digama funkcí

NEPARAMETRICKÉ BAYESOVSKÉ ODHADY V KOZIOLOVĚ-GREENOVĚ MODELU NÁHODNÉHO CENZOROVÁNÍ Michal Friesl Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni http://home.zcu.cz/ friesl/archiv/rob04.html