Odhad spolehlivosti kolejových obvodů z nekompletních cenzorovaných dat

Podobné dokumenty
2 Hlavní charakteristiky v analýze přežití

BAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni

4 Parametrické odhady

Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I

7 Regresní modely v analýze přežití

8 Coxův model proporcionálních rizik I

NEPARAMETRICKÉ BAYESOVSKÉ ODHADY V KOZIOLOVĚ-GREENOVĚ MODELU NÁHODNÉHO CENZOROVÁNÍ. Michal Friesl

ROBUST 1 TESTY DOBRÉ SHODY PRO MODEL. Petr Novák. 1 Regrese v analýze spolehlivosti

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

BAYESOVSKÉ ODHADY V NĚKTERÝCH MODELECH

Příklady - Bodový odhad

PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady

SPOJITÉ ROZDĚLENÍ PRAVDĚPODOBNOSTI. 7. cvičení

Neparametrické odhady podmíněné rizikové funkce

NÁHODNÉ VELIČINY JAK SE NÁHODNÁ ČÍSLA PŘEVEDOU NA HODNOTY NÁHODNÝCH VELIČIN?

Analýza přežití Základy analýzy klinických dat: Analýza přežití

Odhady Parametrů Lineární Regrese

UČENÍ BEZ UČITELE. Václav Hlaváč

oddělení Inteligentní Datové Analýzy (IDA)

A6M33SSL: Statistika a spolehlivost v lékařství Teorie spolehlivosti Přednáška 2

Kapacita jako náhodná veličina a její měření. Ing. Igor Mikolášek, Ing. Martin Bambušek Centrum dopravního výzkumu, v. v. i.

Bayesovské metody. Mnohorozměrná analýza dat

Pravděpodobnost a statistika (BI-PST) Cvičení č. 9

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový.

ODHADY NÁVRATOVÝCH HODNOT

Odhady - Sdružené rozdělení pravděpodobnosti

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

KVADRATICKÁ KALIBRACE

u Pacova Metoda pro validaci koncentrace přízemního ozónu kontinuálně měřené na Atmosférické 1 / 23sta

Návrh a vyhodnocení experimentu

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

15. T e s t o v á n í h y p o t é z

Apriorní rozdělení. Jan Kracík.

Odhad parametrů N(µ, σ 2 )

Toolboxy analýzy a modelování stochastických systémů

Základy teorie odhadu parametrů bodový odhad

3 Bodové odhady a jejich vlastnosti

5. B o d o v é o d h a d y p a r a m e t r ů

Návrh a vyhodnocení experimentu

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

Přijímací zkouška na navazující magisterské studium 2014

Modely selektivní interakce a jejich aplikace

VYBRANÁ ROZDĚLENÍ. SPOJITÉ NÁH. VELIČINY Martina Litschmannová

Západočeská Univerzita v Plzni Fakulta Aplikovaných Věd Katedra Matematiky

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

AVDAT Nelineární regresní model

Téma 4: Stratifikované a pokročilé simulační metody

CHOVÁNÍ SILOFUNKCÍ TESTŮ V COXOVĚ MODELU PROPORCIONÁLNÍCH RIZIK

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

10. Předpovídání - aplikace regresní úlohy

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Intervalové Odhady Parametrů

Normální (Gaussovo) rozdělení

Informační bulletin České statistické společnosti, 1 2/2015

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Téma 3 Metoda LHS, programový systém Atena-Sara-Freet

Cvičení 5. Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc.

PROCES ZAJIŠTĚNÍ FUNKČNÍ BEZPEČNOSTI STROJE

Aktivní detekce chyb

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

TECHNICKÁ UNIVERZITA V LIBERCI

Pravděpodobnost a statistika

Nestranný odhad Statistické vyhodnocování exp. dat M. Čada

Základní statistické modely Statistické vyhodnocování exp. dat M. Čada ~ cada

Shlukování prostorových dat KDE+

Analýza spolehlivosti tlakové nádoby metodou Monte Carlo

Neparametrické odhady hustoty pravděpodobnosti

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Klasická pravděpodobnost. Bayesův vzorec. Poslední změna (oprava): 11. května 2018 ( 6 4)( 43 2 ) ( 49 6 ) 3. = (a) 1 1 2! + 1 3!

Hodnocení vlastností materiálů podle ČSN EN 1990, přílohy D

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost a matematická statistika

Predikce roční spotřeby zemního plynu po ceníkových pásmech

dat Robust ledna 2018

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

Cvičení 11. Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc.

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

ROBUSTNOST V MODELU RŮSTOVÝCH KŘIVEK

1/30. Mgr. Jan Šváb Zobecněný lineární model a jeho použití v povinném ručení Seminář z aktuárských věd. Slides by LATEX.

PDV /2018 Detekce selhání

Úvodem Dříve les než stromy 3 Operace s maticemi

Cvičení 10. Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc.

Odhad parametrů N(µ, σ 2 )

Eva Fišerová a Karel Hron. Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta Univerzity Palackého v Olomouci.

Kvantily a písmenové hodnoty E E E E-02

Statistická teorie učení

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

Klasická a robustní ortogonální regrese mezi složkami kompozice

Intervalové Odhady Parametrů II Testování Hypotéz

Vytěžování znalostí z dat

REZERVOVÁNÍ SOUDNÍCH SPORŮ SAV Iveta Grzonková

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Testování statistických hypotéz

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

Pravděpodobnost a statistika (BI-PST) Cvičení č. 4

4EK211 Základy ekonometrie

Transkript:

Odhad spolehlivosti kolejových obvodů z nekompletních cenzorovaných dat Petr Novák, Rudolf Blažek, Martin Daňhel Katedra aplikované matematiky, Fakulta informačních technologií ČVUT 23. ledna 2018 1 / 24

Úvod Na trat ových úsecích v ČR je přítomnost vlaků detekována pomocí kolejových obvodů. Kolejové obvody jsou složeny z několika komponent. Chceme odhadnout rozdělení doby do poruchy komponent na základě data o poruchách z provozu z let 2006-2016. 2 / 24

Detekce vlaků Bodové detektory: zátěžové počitadlo os, elektronické, rádiové Eurobalise, viz dále. 3 / 24

Detekce vlaků Bodové detektory: zátěžové počitadlo os, elektronické, rádiové Eurobalise, viz dále. Úseková detekce kolejové obvody Elektrický proud skrz kolejnice. V ČR - kolejový obvod KOA-1, výrobce AŽD Praha. Elektronické vyhodnocení. Na mnoha úsecích železnice i v metru. Vysoké nároky na spolehlivost. 3 / 24

Kolejové obvody Kolejový obvod (track circuit): Detekční část Vyhodnocovací část - jedna stanice pro až osm bloků 4 / 24

Kolejové obvody Kolejový obvod (track circuit): Detekční část Vyhodnocovací část - jedna stanice pro až osm bloků Bezpečnostní požadavky Kolejové obvody musí splňovat bezpečnostní požadavky SIL-4 (Safety Integrity Level) dle normy EN 50126. Výměna vadných komponent do 80 hodin. Požadovaná střední životnost 20 let. 4 / 24

Vyhodnocovací část kolejového obvodu PCB Jistič RCT Usměrňovač redunantní, k provozu stačí jeden TCR Track Circuit Receiver redunantní, k provozu stačí dva PSB Rozvodná deska CSB Komunikační deska 5 / 24

Popis dat Servisní databáze Záznamy výrobce o poruchách a opravách Záznamy z 2006 až 2016 Počet instalovaných zařízení narůstal V případě poruchy byla komponenta vyměměna za novou, v případě softwarové chyby byl proveden rework. Po opravě je součástka vždy uvažována jako nová Nejdůležitější část TCR, provádí samotné vyhodnocení. Chceme modelovat rozdělení doby do poruchy. 6 / 24

Cenzorovaná data U některých stanic chyběl údaj o uvedení do provozu. Bylo možné jen identifikovat, kdy ještě stanice nebyla funkční cenzorování zleva. Někdy bylo možné zjistit možný interval uvedení do provozu intervalové cenzorování. Data jsou k dispozici jen do konce roku 2016 cenzorování zprava. necenzorované > cenzorované zprava > cenzorované zleva > > intervalove > > Prvni instalacepocatek studie Konec studie 7 / 24

Nekompletní data Některé poruchy byly přiřazeny k trat ovému úseku a ne ke stanici Nebylo rozlišováno mezi různými zařízeními v rámci jedné stanice. Potřeba ošetřit. Kdybychom znali rozprostření poruch mezi stanice a zařízení, mohli bychom použít běžné nástroje analýzy přežití. Parametricky metoda maximální věrohodnosti. Neparametricky Kaplan-Meierův odhad. 8 / 24

Parametrické modelování doby do poruchy Možnosti vyjádření rozdělení: Funkce přežití S(t) = P(T > t). Intenzita poruch λ(t) = lim h 0 P(t T t + h T t)/h. Vztah: λ(t) = f (t)/s(t). 9 / 24

Parametrické modelování doby do poruchy Možnosti vyjádření rozdělení: Funkce přežití S(t) = P(T > t). Intenzita poruch λ(t) = lim h 0 P(t T t + h T t)/h. Vztah: λ(t) = f (t)/s(t). Odhad rozdělení: Parametricky maximalizováním věrohodnosti. Příspěvek jednoho pozorování je g(t ) = f (T ) 0 F (T T 0 ) L (F(T T 0 ) F(T T 1 )) I S(T ) R. 0 indikátor necenzorovaného selhání, L indikátor cenzorování zleva, I indikátor intervalového cenzorování, R indikátor cenzorování zprava. 9 / 24

Parametrické odhady Postup: Prozkoumáme pro několik parametrických rodin: exponenciální s λ(t) = λ, Weibullovo s S(t) = e (λt)a, gamma s f (t) t a 1 e λt, lognormální. Odhadneme parametry pomocí metody maximální věrohodnosti. Podle hodnoty věrohodnosti můžeme porovnat, které rozdělení popisuje data nejlépe. 10 / 24

Parametrické odhady věrohodnost Uvažujme: N stanic V každé stanici k s zařízení. Z každé stanice záznam o n s poruchách v časech T s1,..., T sns. Rozprostření poruch mezi zařízení pomocí indexů z s = (z s1,..., z sns ). 11 / 24

Parametrické odhady věrohodnost Uvažujme: N stanic V každé stanici k s zařízení. Z každé stanice záznam o n s poruchách v časech T s1,..., T sns. Rozprostření poruch mezi zařízení pomocí indexů Celkem k ns s možností. z s = (z s1,..., z sns ). 11 / 24

Parametrické odhady věrohodnost Uvažujme: N stanic V každé stanici k s zařízení. Z každé stanice záznam o n s poruchách v časech T s1,..., T sns. Rozprostření poruch mezi zařízení pomocí indexů Celkem k ns s možností. z s = (z s1,..., z sns ). Kdybychom znali rozprostření poruch, mohli bychom sestavit věrohodnostní funkci: L(θ, T z ) = N k s n s g I(z si =j) (T si max (T sl, z sl = j)). l=1,...i 1 s=1 j=1 i=1 Pro parametrický model pak můžeme rovnou maximalizovat. 11 / 24

Parametrické odhady rozprostření poruch Nevíme, která z poruch se týkala kterého ze zařízení. Možnosti: Všechny na jednom zařízení Na všech rovnoměrně Náhodně. T1 T2 T3 T4 + + + + 12 / 24

Parametrické odhady rozprostření poruch Nevíme, která z poruch se týkala kterého ze zařízení. Možnosti: Všechny na jednom zařízení Na všech rovnoměrně Náhodně. T1 T2 T3 T4 x x x x Pro exponenciální rozělení vyjde stejně díky bezpamět ovosti. 12 / 24

Parametrické odhady rozprostření poruch Nevíme, která z poruch se týkala kterého ze zařízení. Možnosti: Všechny na jednom zařízení Na všech rovnoměrně Náhodně. T1 T2 T3 T4 x x x x Pro exponenciální rozělení vyjde stejně díky bezpamět ovosti. 12 / 24

Parametrické odhady rozprostření poruch Nevíme, která z poruch se týkala kterého ze zařízení. Možnosti: Všechny na jednom zařízení Na všech rovnoměrně Náhodně. T1 T2 T3 T4 x x x x Pro exponenciální rozělení vyjde stejně díky bezpamět ovosti. 12 / 24

Rozprostření poruch možná řešení Náhodně: Musíme předpokládat určité chování poruch, např. nezávislé rovnoměrné rozprostření. Vygenerujeme rozprostření a odhadneme parametry. Můžeme opakovat mnohokrát a odhady zprůměrovat. 13 / 24

Rozprostření poruch možná řešení Náhodně: Musíme předpokládat určité chování poruch, např. nezávislé rovnoměrné rozprostření. Vygenerujeme rozprostření a odhadneme parametry. Můžeme opakovat mnohokrát a odhady zprůměrovat. Bayesovsky EM algoritmus Věrohodnost uvažujeme jako směs přes všechna možná rozprostření. Iterativně střídavě odhadujeme pravděpodobnosti jednotlivých rozprostření a maximalizujeme věrohodnost. Analyticky i výpočetně náročné. 13 / 24

Rozprostření poruch možná řešení Náhodně: Musíme předpokládat určité chování poruch, např. nezávislé rovnoměrné rozprostření. Vygenerujeme rozprostření a odhadneme parametry. Můžeme opakovat mnohokrát a odhady zprůměrovat. Bayesovsky EM algoritmus Věrohodnost uvažujeme jako směs přes všechna možná rozprostření. Iterativně střídavě odhadujeme pravděpodobnosti jednotlivých rozprostření a maximalizujeme věrohodnost. Analyticky i výpočetně náročné. Bayesovsky MH algoritmus (MCMC) Určíme apriorní rozdělení parametrů a rozprostření poruch. Generujeme návrhy, které bud to přijmeme nebo zamítneme. Citlivé na volbu apriorního rozdělení. 13 / 24

Parametrické odhady bayesovský přístup Apriorní rozprostření poruch mezi zařízení a parametry rozdělení považujeme za náhodné s hustotou p(θ, z). Rozdělení dat při pevných hodnotách parametrů r(t θ, z) odpovídá věrohodnostní funkci Aposteriorní rozdělení je pak π(θ, z T) = r(t θ, z)p(θ, z) r(t θ, z)p(θ, z). 14 / 24

Parametrické odhady bayesovský přístup Apriorní rozprostření poruch mezi zařízení a parametry rozdělení považujeme za náhodné s hustotou p(θ, z). Rozdělení dat při pevných hodnotách parametrů r(t θ, z) odpovídá věrohodnostní funkci Aposteriorní rozdělení je pak π(θ, z T) = r(t θ, z)p(θ, z) r(t θ, z)p(θ, z). Přímý výpočet složitý, použili jsme Metropolis-Hastingsův algoritmus: Uvažujeme neinformativní apriorní rozdělení rozprostření poruch. Vygenerujeme rozprostření poruch a návrhové parametry. Návrh přijememe s pravděpodobností rovnou poměru věrohodností pro nové a staré parametry. Opakujeme. 14 / 24

Odhadnuté parametry Odhadnuté parametry pro vyhodnocovací jednotku TCR. Data randomizována kvůli důvěrnosti. algoritmus rozd. log-lik ˆλ â ex -2828 4.84e-05 náhodně wb -2787 1.25e-05 0.61 ga -2788 8.63e-06 0.59 ln -2783 ˆµ = 11.93 ˆσ = 3.42 ex -2830 5.44e-05 Metropolis- wb -2825 3.40e-05 0.75 -Hastings ga -2827 3.35e-05 0.80 ln -2839 ˆµ = 11.33 ˆσ = 3.07 Lognormální rozdělení dává nejlepší výsledky co do věrohodnosti. M.-H. algoritmus dává o něco horší výsledky. Pro ostatní zařízení dává nejvyšší věrohodnost Weibullovo nebo lognormální. 15 / 24

Odhadnuté intenzity poruch jednotky TCR failure rate 2e 05 4e 05 6e 05 8e 05 exponential gamma Weibull log normal 0 1000 2000 3000 4000 time [days] 16 / 24

Odhad životnosti Můžeme odhadnout: Střední dobu do poruchy pro jednotlivá zařízení dosazením odhadnutých parametrů. Střední dobu do poruchy celého systému. 17 / 24

Odhad životnosti Můžeme odhadnout: Střední dobu do poruchy pro jednotlivá zařízení dosazením odhadnutých parametrů. Střední dobu do poruchy celého systému. Díky redundanci usměrňovačů (stačí jeden ze dvou) a vyhodnocovacích jednotek TCR (dva ze tří) můžeme dobu do poruchy vyjádřit jako T CELK = min(t PCB, T RCT(2:2), T TCR(2:3), T PSB, T CSB ). Považujeme-li součástky za nezávislé, funkci přežití minima lze přepsat jako součin funkcí přežití jednotlivých komponent. 17 / 24

Odhad životnosti Můžeme odhadnout: Střední dobu do poruchy pro jednotlivá zařízení dosazením odhadnutých parametrů. Střední dobu do poruchy celého systému. Díky redundanci usměrňovačů (stačí jeden ze dvou) a vyhodnocovacích jednotek TCR (dva ze tří) můžeme dobu do poruchy vyjádřit jako T CELK = min(t PCB, T RCT(2:2), T TCR(2:3), T PSB, T CSB ). Považujeme-li součástky za nezávislé, funkci přežití minima lze přepsat jako součin funkcí přežití jednotlivých komponent. Dosazením zjistíme, že ET CELK 43300 hodin 119 let. 17 / 24

Odhad životnosti Můžeme odhadnout: Střední dobu do poruchy pro jednotlivá zařízení dosazením odhadnutých parametrů. Střední dobu do poruchy celého systému. Díky redundanci usměrňovačů (stačí jeden ze dvou) a vyhodnocovacích jednotek TCR (dva ze tří) můžeme dobu do poruchy vyjádřit jako T CELK = min(t PCB, T RCT(2:2), T TCR(2:3), T PSB, T CSB ). Považujeme-li součástky za nezávislé, funkci přežití minima lze přepsat jako součin funkcí přežití jednotlivých komponent. Dosazením zjistíme, že ET CELK 43300 hodin 119 let. To je šestkrát více, než požaduje norma, tedy je vše v pořádku. 17 / 24

Srovnání Siemens odhaduje střední dobu do poruchy detektoru Eurobalise ještě vyšší: Zdroj: mobility.siemens.com 18 / 24

Odhadnuté intenzity poruch jednotky TCR failure rate 2e 05 4e 05 6e 05 8e 05 exponential gamma Weibull log normal 0 1000 2000 3000 4000 time [days] Předpovídaná střední doba dožití leží mimo pozorovaný interval. Zkusíme neparametrický model pro bližší pohled na data. 19 / 24

Neparametrický odhad Pokud bychom znali rozprostření poruch a uvažovali bychom jen cenzorování zprava, funkci přežití bychom mohli odhadnout pomocí Kaplan-Meierova odhadu: Ŝ(t) = T j t ( 1 d j r j ), r j počet zařízení v riziku v čase T j d j počet zařízení, co se porouchaly v čase T j. 20 / 24

Neparametrický odhad Pokud bychom znali rozprostření poruch a uvažovali bychom jen cenzorování zprava, funkci přežití bychom mohli odhadnout pomocí Kaplan-Meierova odhadu: Ŝ(t) = T j t ( 1 d j r j ), r j počet zařízení v riziku v čase T j d j počet zařízení, co se porouchaly v čase T j. Zobecnění pro cenzorování zleva a intervalové cenzorování dle Turnbull (1976) a Huang and Wellner (1997) iterativní postup. 20 / 24

Neparametrický odhad Pokud bychom znali rozprostření poruch a uvažovali bychom jen cenzorování zprava, funkci přežití bychom mohli odhadnout pomocí Kaplan-Meierova odhadu: Ŝ(t) = T j t ( 1 d j r j ), r j počet zařízení v riziku v čase T j d j počet zařízení, co se porouchaly v čase T j. Zobecnění pro cenzorování zleva a intervalové cenzorování dle Turnbull (1976) a Huang and Wellner (1997) iterativní postup. Pokud předpokládáme neinformativní náhodné rozprostření poruch, můžeme jej vygenerovat, sestavit Kaplan-Meierův odhad a výsledek zprůměrovat. Získáme tak bodově konzistentní odhad. 20 / 24

Neparametrický odhad funkce přežití pro detektor TCR survival function 0.80 0.85 0.90 0.95 1.00 Kaplan Meier estimate log normal Weibull gamma exponential 0 1000 2000 3000 4000 time [days] Weibullovo, gamma a log-normální rozdělení popisují dobře chování dat na začátku intervalu. Ke konci intervalu nesrovnalosti. Možný náznak vanové křivky. 21 / 24

Neparametrický odhad funkce přežití pro detektor TCR survival function 0.80 0.85 0.90 0.95 1.00 Kaplan Meier estimate log normal Weibull gamma exponential 0 1000 2000 3000 4000 time [days] Weibullovo, gamma a log-normální rozdělení popisují dobře chování dat na začátku intervalu. Ke konci intervalu nesrovnalosti. Možný náznak vanové křivky. 21 / 24

Neparametrický odhad funkce přežití pro detektor TCR survival function 0.80 0.85 0.90 0.95 1.00 Kaplan Meier estimate log normal Weibull gamma exponential 0 1000 2000 3000 4000 time [days] Weibullovo, gamma a log-normální rozdělení popisují dobře chování dat na začátku intervalu. Ke konci intervalu nesrovnalosti. Možný náznak vanové křivky. 21 / 24

Neparametrický odhad funkce přežití pro detektor TCR survival function 0.80 0.85 0.90 0.95 1.00 Kaplan Meier estimate log normal Weibull gamma exponential 0 1000 2000 3000 4000 time [days] Weibullovo, gamma a log-normální rozdělení popisují dobře chování dat na začátku intervalu. Ke konci intervalu nesrovnalosti. Možný náznak vanové křivky. 21 / 24

Neparametrický odhad funkce přežití pro detektor TCR survival function 0.80 0.85 0.90 0.95 1.00 Kaplan Meier estimate log normal Weibull gamma exponential 0 1000 2000 3000 4000 time [days] Weibullovo, gamma a log-normální rozdělení popisují dobře chování dat na začátku intervalu. Ke konci intervalu nesrovnalosti. Možný náznak vanové křivky. 21 / 24

Odhadnuté intenzity poruch jednotky TCR Odhadneme intenzitu poruch pomocí jádrových odhadů (Diehl and Stute, 1988) zjednodušeně, pro jedno konkrétní rozřazení poruch: lambda(t) 1e 05 2e 05 3e 05 4e 05 5e 05 6e 05 7e 05 kernel exponential gamma Weibull log normal 0 500 1000 1500 2000 2500 3000 time Ke konci pozorovaného intervalu je skutečně nesrovnalost. 22 / 24

Odhadnuté intenzity poruch jednotky TCR Odhadneme intenzitu poruch pomocí jádrových odhadů (Diehl and Stute, 1988) zjednodušeně, pro jedno konkrétní rozřazení poruch: lambda(t) 1e 05 2e 05 3e 05 4e 05 5e 05 6e 05 7e 05 kernel exponential gamma Weibull log normal 0 500 1000 1500 2000 2500 3000 time Ke konci pozorovaného intervalu je skutečně nesrovnalost. 22 / 24

Odhadnuté intenzity poruch jednotky TCR Odhadneme intenzitu poruch pomocí jádrových odhadů (Diehl and Stute, 1988) zjednodušeně, pro jedno konkrétní rozřazení poruch: lambda(t) 1e 05 2e 05 3e 05 4e 05 5e 05 6e 05 7e 05 kernel exponential gamma Weibull log normal 0 500 1000 1500 2000 2500 3000 time Ke konci pozorovaného intervalu je skutečně nesrovnalost. 22 / 24

Závěr Shrnutí: Zkoumali jsme metody, jak na základě dat z 11 let provozu modelovat rozdělení doby do poruchy elektronických kolejových obvodů. Použili jsme parametrické i neparametrické metody pro cenzorovaná data. Museli jsme řešit nekompletnosti v datech, zejména chybějící přířazení poruch k zařízením. Odhad střední doby do poruchy není dobře použitelný. 23 / 24

Závěr Shrnutí: Zkoumali jsme metody, jak na základě dat z 11 let provozu modelovat rozdělení doby do poruchy elektronických kolejových obvodů. Použili jsme parametrické i neparametrické metody pro cenzorovaná data. Museli jsme řešit nekompletnosti v datech, zejména chybějící přířazení poruch k zařízením. Outlook: Odhad střední doby do poruchy není dobře použitelný. Prozkoumat další vlastnosti odhadů intervaly spolehlivosti pro Kaplan-Meierův odhad apod. Vyzkoušet modely neúplné opravy a konkurujících rizik, případně regresní modely (Cox, 1972). Prošetřit chování dat ke konci intervalu. 23 / 24

Reference [1] Cox D.R.: Regression models and life tables. J. Roy. Statist. Soc. Ser. B 34, 187-220, 1972. [2] Diehl S., Stute W.: Kernel density and hazard function estimation in the presence of censoring. Journal of Multivariate Analysis 25(2), 299-310, 1988. [3] Huang J., Wellner J.A.: Interval Censored Survival Data: A Review of Recent Progress. In: Lin D.Y., Fleming T.R. (eds) Proceedings of the First Seattle Symposium in Biostatistics. Lecture Notes in Statistics, vol 123. Springer, New York, NY, 1997. [4] Turnbull, B.W.: The empirical distribution function with arbitrarily grouped, censored and truncated data. J. Roy. Statist. Soc. B 38, 290 295, 1976. [5] Siemens AG: Trainguard Eurobalise S21 and S22 at https://www.mobility.siemens.com/mobility/global/ SiteCollectionDocuments/en/rail-solutions/rail-automation/ train-control-systems/trainguard-eurobalise-s21-s22-en.pdf [2018-01-22]. 24 / 24