Informační bulletin České statistické společnosti, 1 2/2015
|
|
- Jindřich Jaroš
- před 5 lety
- Počet zobrazení:
Transkript
1 Informační bulletin České statistické společnosti, 1 2/215 ODHADY ZÁKLADNÍHO RIZIKA V REGRESNÍCH MODELECH OPRAV ESTIMATION OF THE BASELINE HAZARD IN REGRESSION MODELS FOR REPAIRABLE SYSTEMS Petr Novák 1,2 Adresa: 1 MFF UK v Praze, KMPS, Sokolovská 83, Praha 8 2 ÚTIA AV ČR, Pod Vodárenskou věží 4, Praha novakp@karlin.mff.cuni.cz Abstrakt: Pozorujeme nezávislá zařízení podléhající opotřebení a pomocí vhodných regresních modelů se snažíme popsat vliv jejich průběžných oprav a údržby na rozdělení doby do selhání. Nejčastěji používané modely, jako je Coxův model proporcionálního rizika nebo model zrychleného času, popisují vliv regresorů na určitou základní rizikovou funkci. Tu je potřeba buď vhodně parametrizovat, nebo odhadnout neparametricky. V této práci se zaměřujeme na metody porovnávání a testování hypotéz o tvaru základního rizika v modelech oprav a předvádíme jejich využití. Klíčová slova: Analýza spolehlivosti, modely oprav, regrese, základní riziko. Abstract: When observing independent devices which are subject to degradation, we want to describe the influence of repairs and preventive maintenance actions on the time to failure distribution with the help of suitable regression models. Commonly used models, as the Cox proportional hazards and the accelerated failure time model assume, that the covariates influence a certain baseline hazard function, which must be either parametrized or estimated nonparametrically. In this work we focus on methods how to estimate and test hypotheses about the shape of the baseline hazard and we show their applications. Keywords: Reliability analysis, repair models, regression, baseline hazard. 1. Úvod údržba a opravy Zkoumáme data reprezentující životnost n nezávislých systémů podléhajících opotřebení. Když se systém porouchá, je nutné provést opravu. Selhání se také snažíme předejít preventivními údržbami. Označíme T ij, i = 1,..., n, j = 1,..., n i seřazené časy oprav a údržeb i-tého zařízení a ij indikátory, zda na i-tém zařízení byla v j-tém čase provedena oprava ij = 1 nebo 57
2 Vědecké a odborné statě preventivní údržba ij =. Zavedeme čítací procesy oprav a údržeb do času t: n i n i N i t = IT ij t, ij = 1, M i t = IT ij t, ij =. j=1 Označíme rizikové funkce pro každé zařízení j=1 λ i t = lim h P N i t + h N i t 1 Ht/h, kde Ht značí historii událostí do času t. Pracujeme s kumulovanými rizikovými funkcemi Λ i t = λ isds, příslušnými funkcemi přežití S i t = exp Λ i t a hustotami f i t = d dt S it. Věrohodnost lze přepsat jako L = n n i fit ij i=1 j=1 S it ij 1 a log-věrohodnost má pak tvar l = ij 1 ij SiT ij = S it ij 1 n n i λ it ij ij S it ini i=1 j=1 n n i Tin ij log λ i T ij i λ i tdt. i=1 j=1 Věrohodnost dat lze zapsat pomocí čítacích procesů. Zavedeme čítací procesy pro j-té selhání či opravu i-tého zařízení a příslušný indikátor rizika N ij t = ij IT ij t, M ij t = 1 ij IT ij t, Dostaneme Y ij t = IT i,j 1 < t T ij. log λi t dn ij t Y ij tλ i t dt. l = ij 2. Regresní modely oprav 2.1. Coxův model proporcionálního rizika Předpokládáme, že každá oprava či údržba multiplikativně sníží nebo zvýší riziko, vliv mohou mít i případné další regresory, ozn. Z i t. Uvažujeme rizikovou funkci [1] λ i t = λ te Mi tρ+ni tφ+zt i tβ. 58
3 Informační bulletin České statistické společnosti, 1 2/215 Při parametrickém základním riziku lze dosadit do logaritmické věrohodnosti a maximalizovat. Považujme ale základní riziko za neznámé. Označíme β = ρ, φ, β T a X T i t = N i t, M i t, Zi T t. Skóre, získané dosazením rizikové funkce do logaritmické věrohodnosti a derivováním podle parametrů, Uβ = d dβ l, závisí na neznámé Λ t, kterou nahradíme odhadem Nelson- -Aalenova typu dn s Λ t, β = ij ext i s β Y ij s, kde značí součet přes příslušný index. Po dosazení získáme skóre ve tvaru Ûβ = X i t kl X kt e XT k t β Y kl t dn ij kl ext k t β ij t Y kl t a pro nalezení odhadů parametrů řešíme rovnice Ûβ = Model zrychleného času Můžeme také předpokládat, že každá oprava či údržba a regresory způsobí, že virtuální čas plyne pomaleji nebo rychleji Accelerated Failure Time model, AFT. Využijeme transformaci času [2]: t Riziková fukce pak má tvar e Mi sρ+ni sφ+zt i sβ ds =: h i t, β. λ i t = λ h i t, βe Mi tρ+ni tφ+zt i tβ. Pokud základní riziková funkce bude konstantní, tedy odpovídající exponenciálnímu rozdělení, oba modely splývají. Zavedeme transformované procesy N ijt, β = ij Ih i T ij, β t, Y ijt, β = Ih i T i,j 1, β < t h i T ij, β, M ijt, β = 1 ij Ih i T ij, β t, X i t, β = X i h 1 i t, β. Přesné skóre má složitější tvar, je ale možné jej nahradit přibližným [2] a opět dosadit Nelson-Aalenův odhad kumulovaného základního rizika Λ t, β = dn s, β t, β. ij Y ij 59
4 Vědecké a odborné statě Získáme Ũβ = ij X i t, β kl X kt, βykl t, β t, β kl Y kl dn ijt, β. Protože skóre není spojité v β, najdeme odhady parametrů minimalizací Ũβ. 3. Vlastnosti odhadů Λ Navážeme zde na [3], kde bylo hlavním cílem hledání a interpretace odhadů β, a zaměříme se na studování vlastností odhadů kumulovaného základního rizika. Pro každý z modelů zvlášť uvažujme proces W t = n 1/2 Λ t, β Λ t. Pomocí funkcionální centrální limitní věty [4] se dá ukázat, že pro n konverguje W t slabě ke Gaussovskému procesu s nulovou střední hodnotou a konečnou kovarianční funkcí. Tím je zajištěna konzistence Nelson- -Aalenových odhadů. Kovarianční funkce je pro každý z modelů různá. V AFT modelu závisí na neznámých λ a λ = dλ /dt a není možné ji snadno odhadnout přímo. Předvedeme postup pomocí simulační metody. Resampling zákadního rizika Nejprve uvažujme Coxův model. Generujme G 1,..., G n i.i.d. z N, 1. Mějme Û G β = X i t kl X kt e XT k t β Y kl t G ij kl ext ik t β i dn ij t. Y kl t Najdeme β G jako řešení rovnice Û β G = ÛG β a položíme Ŵ t = n 1/2 Λ t, β Λ t, β G + Λ G t, β, kde Λ G t, β = ij G i dn ij s kl ext k s β Y kl s. Pomocí funkcionální CLV [4] se dá ukázat, že za platnosti Coxova modelu Ŵ t konverguje slabě ke stejnému Gaussovskému procesu jako W t. Důkaz 6
5 Informační bulletin České statistické společnosti, 1 2/215 vychází z postupu pro Coxův model s rekurentními událostmi [5], přičemž je potřeba zohlednit použití oprav a údržeb jako regresorů. V modelu zrychleného času postupujeme obdobně, vyrobíme replikované přibližné skóre Ũ G β = ij X i t kl X kt Y kl t t, β kl Y kl najdeme β G řešení rovnice Ũ β G = ŨG β a položíme G i dn ijt, Λ G t, β = ij G i dnij s, β s, β. kl Y kl Potom stejně sestavený replikovaný proces Ŵ t má opět stejnou limitu jako W t v AFT modelu. Postup je založen na funkcionální CLV [4] a inferenci pro AFT model s rekurentními událostmi [6]. Když tedy zreplikujeme mnohokrát Ŵ t, můžeme empiricky odhadnout rozptyl W t a spočítat bodové konfidenční intervaly kumulovaného rizika jako Λ t, β ± u 1 α/2 n 1/2 varŵ t, nebo pomocí log-transformace jako Λ t, β exp ±u 1 α/2 n 1 varŵ t 2 Λ t, β, kde u 1 α/2 je příslušný kvantil N, 1. Testování hypotéz o tvaru základního rizika Chceme-li testovat hypotézy o tvaru celého rizika, je potřeba najít příslušný konfidenční pás pro supremový test. Najdeme q 1 α vyběrový 1 α kvantil Ŵ t generovaných hodnot sup [τ1,τ 2] kde [τ1, τ 2 ] pokrývá zkoumanou část varŵ časového intervalu a spočítáme konfidenční t pás pomocí logaritmické transformace jako Λ t, β exp ±q 1 α n 1/2 varŵ t/ Λ t, β. Hypotézu zamítáme, pokud testovaná kumulovaná základní riziková funkce neleží v konfidenčním pásu. Na Obrázku 1 vidíme příklad Nelson-Aalenova odhadu tučně černě pro data o rozsahu n = 2 z Coxova modelu s φ = 1/1, ρ = 1/1 a Weibullovým základním rozdělením s a = 1/2 a λ = 1/1. 61
6 Vědecké a odborné statě Dále jsou zobrazeny příslušné bodové intervaly spolehlivosti čárkovaně šedě, konfidenční pás čárkovaně černě a parametrické odhady pro různá rozdělení šedě. V tomto případě bychom jasně zamítali exponenciální rozdělení, kde kumulovaná riziková funkce tvoří přímku tečkovaně, i Gumbelovo rozdělení čárkovaně. Naopak parametrický odhad původního Weibullova rozdělení plně je Nelson-Aalenovu odhadu velmi blízko, nezamítali bychom patrně ani lognormální rozdělení čerchovaně. Lambdat Nelson Aalen Bodový int. Konf. pás Exp. Gumbel Lognorm. Weibull Obrázek 1: Porovnání Nelson-Aalenova odhadu, konfidenčních mezí a parametrických odhadů kumulované rizikové funkce. t 4. Simulační studie Generovali jsme data z Coxova i AFT modelu o velikosti n = 2 a n = 5 s různými základními rizikovými funkcemi a parametry. Každé zařízení bylo sledováno do desáté události, údržba byla prováděna náhodně se stejným základním rozdělením. Parametry jsme stanovili tak, aby oprava zvýšila riziko či zrychlila čas φ = 1/1 a údržba naopak ρ = 1/1, jiné kovariáty nebyly uvažovány. 62
7 Informační bulletin České statistické společnosti, 1 2/215 Tabulka 1: Podíl zamítnutých hypotéz o tvaru základního rizika při generování dat z různých rozdělení. Generované rozdělení Testované rozdělení podíl zamítnutí Model λ λ a n Exp. Weibull Gumbel LN Weibull 1/1 5 2,98, ,276 Weibull 1/1 1/2 2,934,916,36 Cox 5 1 1,134 Gumbel 1/1 1,2 2,96,8,272 5,642,2,64 LN µ=2 σ 2 =4 2, ,82 1 Weibull 1/1 5 2,912,6,8,66 5 1,492 Weibull 1/1 1/2 2,94,2,796,88 AFT 5 1 1,644 Gumbel 1/1 1,2 2,372,14,8,592 5,99,5,994 LN µ=2 σ 2 =4 2,996,142,878,92 5 1,22 1 Testovali jsme na hladině α =,5, zda je základní rozdělení exponenciální, Weibullovo λt = aλ a t a 1, useknuté Gumbelovo λt = λa t či lognormální LN s parametry odhadnutými metodou maximální věrohodnosti původního modelu považovanými za pevné a sledovali jsme podíl zamítnutých hypotéz. Každý případ byl simulován 5, testovali jsme na intervalu mezi 5% a 95% kvantilem generovaných dat. Ŵ t bylo počítáno ze 4 replikací. Z tabulky výsledků 1 je patrné, že testy jsou s vyšším počtem pozorovaných zařízení přesnější, tj. nezamítají původní a zamítají ostatní základní rozdělení. U dat s Weibullovým základním rozdělením záleží, zda je Λ konvexní či konkávní, podle toho je spíše zaměnitelné s Gumbelovým nebo lognormálním rozdělením. Exponenciální rozdělení je zamítáno skoro vždy zde se nabízí srovnání s parametrickým testem zda a = 1 ve Weibullově rozdělení. 63
8 Vědecké a odborné statě 5. Závěr Zkoumali jsme metody pro testování hypotéz o tvaru základního rizika při modelování vlivu údržby a oprav na životnost sledovaného zařízení. Pro data z Coxova modelu i modelu zrychleného času jsme představili asymptotický test založený na resamplingu a na simulovaných datech zkoumali jeho vlastnosti v různých situacích. Dalším krokem může být zohlednění variability testovaných parametrických odhadů. Poděkování Tato práce byla podporována granty SVV 2615/214 a GAUK 11122/213. Literatura [1] Percy D. F., Alkali B. M.: Generalized proportional intensities models for repairable systems. IMA Journal of Management Mathematics 17, , 25. [2] Lin D. Y., Ying Z.: Semiparametric inference for the accelerated life model with time-dependent covariates. Journal od Statistical Planning and Inference 44, 47 63, [3] Novák P.: Regrese v modelech oprav. Informační bulletin České statistické společnosti , 83 88, 213. [4] Pollard D.: Empirical Processes: Theory and Applications. Hayward, California, 199. [5] Lin D. Y., Wei L. J., Ying Z.: Checking the Cox model with cumulative sums of martingale-based residuals. Biometrika 8, , [6] Lin D. Y., Wei L. J., Ying Z.: Accelerated failure time models for counting processes. Biometrika 85, ,
ROBUST 1 TESTY DOBRÉ SHODY PRO MODEL. Petr Novák. 1 Regrese v analýze spolehlivosti
ROBUST 2010 c ČStS 2010 TESTY DOBRÉ SHODY PRO MODEL ZRYCHLENÉHO ČASU V ANALÝZE PŘEŽITÍ Petr Novák Klíčová slova: Analýza přežití, testy dobré shody, model zrychleného času Abstrakt: V příspěvku studujeme
Více7 Regresní modely v analýze přežití
7 Regresní modely v analýze přežití Předpokládané výstupy z výuky: 1. Student rozumí významu regresního modelování dat o přežití 2. Student dokáže definovat pojmy poměr rizik a základní riziková funkce
Více8 Coxův model proporcionálních rizik I
8 Coxův model proporcionálních rizik I Předpokládané výstupy z výuky: 1. Student umí formulovat Coxův model proporcionálních rizik 2. Student rozumí významu regresních koeficientů modelu 3. Student zná
VíceLWS při heteroskedasticitě
Stochastické modelování v ekonomii a financích Petr Jonáš 7. prosince 2009 Obsah 1 2 3 4 5 47 1 Předpoklad 1: Y i = X i β 0 + e i i = 1,..., n. (X i, e i) je posloupnost nezávislých nestejně rozdělených
Vícejevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.
Parametrické metody odhadů z neúplných výběrů 2 1 Metoda maximální věrohodnosti pro cenzorované výběry 11 Náhodné cenzorování Při sledování složitých reálných systémů často nemáme možnost uspořádat experiment
VíceIntervalové Odhady Parametrů
Parametrů Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické v Praze
VíceKVADRATICKÁ KALIBRACE
Petra Širůčková, prof. RNDr. Gejza Wimmer, DrSc. Finanční matematika v praxi III. a Matematické modely a aplikace 4. 9. 2013 Osnova Kalibrace 1 Kalibrace Pojem kalibrace Cíle kalibrace Předpoklady 2 3
VíceMODELOVÁNÍ CHVOSTŮ TEORIE EXTRÉMNÍCH ODHADY PARETOVA INDEXU. Jan Dienstbier HODNOT. contact:
MODELOVÁNÍ CHVOSTŮ TEORIE EXTRÉMNÍCH HODNOT ODHADY PARETOVA INDEXU Jan Dienstbier contact: dienstbi@karlin.mff.cuni.cz Univerzita Karlova MFF UK - KPMS Praha KPMS, 31.10. 2007 MODELOVÁNÍ CHVOSTŮ JAK TO
VícePřijímací zkouška na navazující magisterské studium 2014
Přijímací zkouška na navazující magisterské studium 24 Příklad (25 bodů) Spočtěte Studijní program: Studijní obor: Matematika Finanční a pojistná matematika Varianta A M x 2 dxdy, kde M = {(x, y) R 2 ;
VíceAVDAT Klasický lineární model, metoda nejmenších
AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i
VíceOdhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
Více1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou
Víceodpovídá jedna a jen jedna hodnota jiných
8. Regresní a korelační analýza Problém: hledání, zkoumání a hodnocení souvislostí, závislostí mezi dvěma a více statistickými znaky (veličinami). Typy závislostí: pevné a volné Pevná závislost každé hodnotě
VíceOdhady Parametrů Lineární Regrese
Odhady Parametrů Lineární Regrese Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké
Více4 Parametrické odhady
4 Parametrické odhady Předpokládané výstupy z výuky: 1. Student zná základní rozdělení pravděpodobnosti dat přežití 2. Student rozumí principu odhadu funkce přežití a rizikové funkce s využitím metody
VíceOdhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
VíceCHOVÁNÍ SILOFUNKCÍ TESTŮ V COXOVĚ MODELU PROPORCIONÁLNÍCH RIZIK
CHOVÁNÍ SILOFUNKCÍ TESTŮ V COXOVĚ MODELU PROPORCIONÁLNÍCH RIZIK Aneta Andrášiková 1, Eva Fišerová 1, Silvie Bělašková 2 1 Univerzita Palackého v Olomouci, PřF, KMaAM 2 Fakultní nemocnice u sv. Anny v Brně,
VícePravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.
Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
VíceRegresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel
Regresní analýza Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Regresní analýza 1 / 23
VíceEva Fišerová a Karel Hron. Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta Univerzity Palackého v Olomouci.
Ortogonální regrese pro 3-složkové kompoziční data využitím lineárních modelů Eva Fišerová a Karel Hron Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta Univerzity Palackého v Olomouci
VíceÚVOD DO TEORIE ODHADU. Martina Litschmannová
ÚVOD DO TEORIE ODHADU Martina Litschmannová Obsah lekce Výběrové charakteristiky parametry populace vs. výběrové charakteristiky limitní věty další rozdělení pravděpodobnosti (Chí-kvadrát (Pearsonovo),
VíceNormální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký
VíceIntervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
Vícey = 0, ,19716x.
Grafické ověřování a testování vybraných modelů 1 Grafické ověřování empirického rozdělení Při grafické analýze empirického rozdělení vycházíme z empirické distribuční funkce F n (x) příslušné k náhodnému
VíceBootstrap - konfidenční intervaly a testy
9. prosince 2008 Konfidenční intervaly obecně Máme data X 1...X n F,(iid), kde F neznáme. Konfidenční intervaly obecně Máme data X 1...X n F,(iid), kde F neznáme. Chceme odhadnout θ = t(f), např. t(f)
VíceBakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013
Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika Podrobnější rozpis okruhů otázek pro třetí část SZZ Verze: 13. června 2013 1 Úvodní poznámky 6 Smyslem SZZ by nemělo být toliko
VíceKlasická a robustní ortogonální regrese mezi složkami kompozice
Klasická a robustní ortogonální regrese mezi složkami kompozice K. Hrůzová, V. Todorov, K. Hron, P. Filzmoser 13. září 2016 Kompoziční data kladná reálná čísla nesoucí pouze relativní informaci, x = (x
VíceRegresní analýza 1. Regresní analýza
Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému
VíceMatematické modelování Náhled do ekonometrie. Lukáš Frýd
Matematické modelování Náhled do ekonometrie Lukáš Frýd Výnos akcie vs. Výnos celého trhu - CAPM model r it = r ft + β 1. (r mt r ft ) r it r ft = α 0 + β 1. (r mt r ft ) + ε it Ekonomický (finanční model)
VíceIntervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
VíceTestování statistických hypotéz
Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné
VíceOdhad spolehlivosti kolejových obvodů z nekompletních cenzorovaných dat
Odhad spolehlivosti kolejových obvodů z nekompletních cenzorovaných dat Petr Novák, Rudolf Blažek, Martin Daňhel Katedra aplikované matematiky, Fakulta informačních technologií ČVUT 23. ledna 2018 1 /
Více10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.
0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti
Více15. T e s t o v á n í h y p o t é z
15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza
VícePSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady
PSY117/454 Statistická analýza dat v psychologii přednáška 8 Statistické usuzování, odhady Výběr od deskripce k indukci Deskripce dat, odhad parametrů Usuzování = inference = indukce Počítá se s náhodným
VíceTestování hypotéz o parametrech regresního modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,
VícePravděpodobnost a statistika
Pravděpodobnost a statistika Bodové odhady a intervaly spolehlivosti Vilém Vychodil KMI/PRAS, Přednáška 10 Vytvořeno v rámci projektu 963/011 FRVŠ V. Vychodil (KMI/PRAS, Přednáška 10) Bodové odhady a intervaly
VíceTestování hypotéz o parametrech regresního modelu
Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO
VíceEKONOMICKÁ APLIKACE KOMPOZIČNÍHO REGRESNÍHO MODELU
EKONOMICKÁ APLIKACE KOMPOZIČNÍHO REGRESNÍHO MODELU Klára Hrůzová 1,2, Karel Hron 1,2 1 Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, Univerzita Palackého v Olomouci 2 Katedra
VícePravděpodobnost a aplikovaná statistika
Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA STATISTICKÉ TESTOVÁNÍ HYPOTÉZ 22.11.2016 Opakování: CLV příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců
Vícez Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin
Příklady k procvičení z Matematické statistiky Poslední úprava. listopadu 207. Konvergence posloupnosti náhodných veličin. Necht X, X 2... jsou nezávislé veličiny s rovnoměrným rozdělením na [0, ]. Definujme
VíceRozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně
Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný
VíceStatistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead
PSY117/454 Statistická analýza dat v psychologii Přednáška 8 Statistické usuzování, odhady Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead Barevná srdíčka kolegyně
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipa.cz Pravděpodobnost a matematická statistika 2010 1.týden 20.09.-24.09. Data, tp dat, variabilita, frekvenční analýza histogram,
VíceVlastnosti odhadů ukazatelů způsobilosti
Vlastnosti odhadů ukazatelů způsobilosti Jiří Michálek CQR při Ústavu teorie informace a automatizace AV ČR v Praze Úvod Ve výzkumné zprávě č 06 Odhady koeficientů způsobilosti a jejich vlastnosti viz
Více15. T e s t o v á n í h y p o t é z
15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
Víceprosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina
10 cvičení z PSI 5-9 prosince 016 101 intervalový odhad Veličina X, představující životnost žárovky, má exponenciální rozdělení s parametrem τ Průměrná životnost n = 64 náhodně vybraných žárovek je x =
VíceIntervalové Odhady Parametrů II Testování Hypotéz
Parametrů II Testování Hypotéz Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení
VíceCharakterizace rozdělení
Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická
VíceÚvod do teorie odhadu. Ing. Michael Rost, Ph.D.
Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost
VíceNormální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními
Více13.1. Úvod Cílem regresní analýzy je popsat závislost hodnot znaku Y na hodnotách
13 Regrese 13.1. Úvod Cílem regresní analýzy je popsat závislost hodnot znaku Y na hodnotách znaku X. Přitom je třeba vyřešit jednak volbu funkcí k vystižení dané závislosti a dále stanovení konkrétních
Více5. T e s t o v á n í h y p o t é z
5. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
VíceStatistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I
Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I Příklad Tahová síla papíru používaného pro výrobu potravinových sáčků je důležitá charakteristika kvality. Je známo, že síla
VíceDesign Experimentu a Statistika - AGA46E
Design Experimentu a Statistika - AGA46E Czech University of Life Sciences in Prague Department of Genetics and Breeding Summer Term 2015 Matúš Maciak (@ A 211) Office Hours: T 9:00 10:30 or by appointment
VíceBodové a intervalové odhady parametrů v regresním modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model Mějme lineární regresní model (LRM) Y = Xβ + e, kde y 1 e 1 β y 2 Y =., e
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
VíceTesty dobré shody pro časové řady s diskrétními veličinami
Testy dobré shody pro časové řady s diskrétními veličinami Šárka Hudecová, Marie Hušková a Simos G. Meintanis KPMS MFF UK Robust 2016 Testy dobré shody pro časové řady s diskrétními veličinami Šárka Hudecová
Více2 Hlavní charakteristiky v analýze přežití
2 Hlavní charakteristiky v analýze přežití Předpokládané výstupy z výuky: 1. Student umí definovat funkci přežití, rizikovou funkci a kumulativní rizikovou funkci a zná funkční vazby mezi nimi 2. Student
VíceVYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová
VYBRANÉ DVOUVÝBĚROVÉ TESTY Martina Litschmannová Obsah přednášky Vybrané dvouvýběrové testy par. hypotéz test o shodě rozptylů (F-test), testy o shodě středních hodnot (t-test, Aspinové-Welchův test),
VíceStatistika (KMI/PSTAT)
Statistika (KMI/PSTAT) Cvičení dvanácté aneb Regrese a korelace Statistika (KMI/PSTAT) 1 / 18 V souboru 25 jedinců jsme měřili jejich výšku a hmotnost. Výsledky jsou v tabulce a grafu. Statistika (KMI/PSTAT)
VíceCvičení ze statistiky - 8. Filip Děchtěrenko
Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly
Více7. Analýza rozptylu.
7. Analýza rozptylu. Uvedeme obecnou ideu, která je založena na minimalizaci chyby metodou nejmenších čtverců. Nejdříve uvedeme několik základních tvrzení. Uvažujeme náhodný vektor Y = (Y, Y,..., Y n a
VíceZákladní statistické modely Statistické vyhodnocování exp. dat M. Čada ~ cada
Základní statistické modely 1 Statistika Matematická statistika se zabývá interpretací získaných náhodných dat. Snažíme se přiřadit statistickému souboru vhodnou distribuční funkci a najít základní číselné
Více3 Bodové odhady a jejich vlastnosti
3 Bodové odhady a jejich vlastnosti 3.1 Statistika (Skripta str. 77) Výběr pořizujeme proto, abychom se (více) dověděli o souboru, ze kterého jsme výběr pořídili. Zde se soustředíme na situaci, kdy známe
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceProblematika analýzy rozptylu. Ing. Michael Rost, Ph.D.
Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít
VícePřijímací zkouška na navazující magisterské studium 2017
Přijímací zkouška na navazující magisterské studium 27 Studijní program: Studijní obor: Matematika Finanční a pojistná matematika Varianta A Řešení příkladů pečlivě odůvodněte. Věnujte pozornost ověření
VíceSTATISTICKÉ ODHADY Odhady populačních charakteristik
STATISTICKÉ ODHADY Odhady populačních charakteristik Jak stanovit charakteristiky rozložení sledované veličiny v základní populaci? Populaci většinou nemáme celou k dispozici, musíme se spokojit jen s
VíceStatistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup
Statistika Testování hypotéz statistická indukce Úvod do problému Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 21. února 2012 Statistika by Birom
VíceAVDAT Nelineární regresní model
AVDAT Nelineární regresní model Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Nelineární regresní model Ey i = f (x i, β) kde x i je k-členný vektor vysvětlujících proměnných
VíceTESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě
VíceStručný úvod do testování statistických hypotéz
Stručný úvod do testování statistických hypotéz 1. Formulujeme hypotézu (předpokládáme, že pozorovaný jev je pouze náhodný). 2. Zvolíme hladinu významnosti testu a, tj. riziko, s nímž jsme ochotni se smířit.
VíceZáklady biostatistiky II. Veřejné zdravotnictví 3.LF UK - II
Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické
VíceRegresní analýza. Eva Jarošová
Regresní analýza Eva Jarošová 1 Obsah 1. Regresní přímka 2. Možnosti zlepšení modelu 3. Testy v regresním modelu 4. Regresní diagnostika 5. Speciální využití Lineární model 2 1. Regresní přímka 3 nosnost
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
VíceNestranný odhad Statistické vyhodnocování exp. dat M. Čada
Nestranný odhad 1 Parametr θ Máme statistický (výběrový) soubor, který je realizací náhodného výběru 1, 2, 3,, n z pravděpodobnostní distribuce, která je kompletně stanovena jedním nebo více parametry
Více4. Aplikace matematiky v ekonomii
4. Aplikace matematiky v ekonomii 1 Lineární algebra Soustavy 1) Na základě statistických údajů se zjistilo, že závislost množství statku z poptávaného v průběhu jednoho týdne lze popsat vztahem q d =
VíceDiferenciální rovnice
Obyčejné diferenciální rovnice - studijní text pro cvičení v předmětu Matematika - 2. Studijní materiál byl připraven pracovníky katedry E. Novákovou, M. Hyánkovou a L. Průchou za podpory grantu IG ČVUT
VíceROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN
ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN Rovnoměrné rozdělení R(a,b) rozdělení s konstantní hustotou pravděpodobnosti v intervalu (a,b) f( x) distribuční funkce 0 x a F( x) a x b b a 1 x b b 1 a x a a x b
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie ZS 2015/16 Cvičení 7: Časově řady, autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Časové řady Data: HDP.wf1
Více1. Přednáška. Ing. Miroslav Šulai, MBA
N_OFI_2 1. Přednáška Počet pravděpodobnosti Statistický aparát používaný ve financích Ing. Miroslav Šulai, MBA 1 Počet pravděpodobnosti -náhodné veličiny 2 Počet pravděpodobnosti -náhodné veličiny 3 Jevy
Vícepravděpodobnosti, popisné statistiky
8. Modelová rozdělení pravděpodobnosti, popisné statistiky Rozdělení pravděpodobnosti Normální rozdělení jako statistický model Přehled a aplikace modelových rozdělení Popisné statistiky Anotace Klasickým
VíceVěta 12.3 : Věta 12.4 (princip superpozice) : [MA1-18:P12.7] rovnice typu y (n) + p n 1 (x)y (n 1) p 1 (x)y + p 0 (x)y = q(x) (6)
1. Lineární diferenciální rovnice řádu n [MA1-18:P1.7] rovnice typu y n) + p n 1 )y n 1) +... + p 1 )y + p 0 )y = q) 6) počáteční podmínky: y 0 ) = y 0 y 0 ) = y 1 y n 1) 0 ) = y n 1. 7) Věta 1.3 : Necht
VíceODHADY NÁVRATOVÝCH HODNOT
ODHADY NÁVRATOVÝCH HODNOT KLIMATOLOGICKÝCH DAT Katedra aplikované matematiky Fakulta přírodovědně-humanitní a pedagogická Technická univerzita v Liberci Robust 2018 ÚVOD Velká pozornost v analýze extrémních
VíceMetoda backward výběru proměnných v lineární regresi a její vlastnosti
Metoda backward výběru proměnných v lineární regresi a její vlastnosti Aktuárský seminář, 13. dubna 2018 Milan Bašta 1 / 30 1 Metody výběru proměnných do modelu 2 Monte Carlo simulace, backward metoda
VíceEkonometrie. Jiří Neubauer, Jaroslav Michálek
Ekonometrie Jiří Neubauer, Jaroslav Michálek Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz J. Neubauer, J. Michálek (Katedra ekonometrie UO) Zobecněný lineární
VíceJednofaktorová analýza rozptylu
Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie LS 2014/15 Cvičení 10: Heteroskedasticita LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Heteroskedasticita - teorie Druhý
Více1 Klasická pravděpodobnost. Bayesův vzorec. Poslední změna (oprava): 11. května 2018 ( 6 4)( 43 2 ) ( 49 6 ) 3. = (a) 1 1 2! + 1 3!
Výsledky příkladů na procvičení z NMSA0 Klasická pravděpodobnost. 5. ( 4( 43 ( 49 3. 8! 3! 0! = 5 Poslední změna (oprava:. května 08 4. (a! + 3! + ( n+ n! = n k= ( k+ /k! = n k=0 ( k /k!; (b n k=0 ( k
VíceAVDAT Mnohorozměrné metody, metody klasifikace
AVDAT Mnohorozměrné metody, metody klasifikace Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Mnohorozměrné metody Regrese jedna náhodná veličina je vysvětlována pomocí jiných
VíceČasové řady, typy trendových funkcí a odhady trendů
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Stochastický proces Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2 } se nazývá stochastický proces
VíceČasové řady, typy trendových funkcí a odhady trendů
Časové řady, typy trendových funkcí a odhady trendů Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Jiří Neubauer (Katedra ekonometrie UO Brno) Časové
Více