7 Regresní modely v analýze přežití
|
|
- Miloslav Brož
- před 7 lety
- Počet zobrazení:
Transkript
1 7 Regresní modely v analýze přežití Předpokládané výstupy z výuky: 1. Student rozumí významu regresního modelování dat o přežití 2. Student dokáže definovat pojmy poměr rizik a základní riziková funkce 3. Student zná výhody a nevýhody neparametrických a parametrických modelů přežití 4. Student umí formulovat model proporcionálních rizik 5. Student umí formulovat model zrychleného času Regresní modelování obecně využívá statistickou metodiku pro hodnocení vztahu mezi vysvětlovanou proměnnou a vysvětlujícími proměnnými. V případě analýzy přežití je vysvětlovanou proměnnou čas do výskytu sledované události, který je ovšem z důvodu cenzorování problematický, protože v pozorovaných hodnotách se míchají kompletní a nekompletní údaje. Stejně jako pro popisnou analýzu a testování jednoduchých hypotéz o datech přežití tak musíme i pro regresní modelování časů přežití využít nestandardních postupů, které se liší od modelů používaných pro modelování dat bez cenzorovaných hodnot. Tato kapitola představuje úvod do problematiky regresních modelů v analýze přežití, další kapitoly se pak podrobněji věnují Coxovu modelu a nástrojům regresní diagnostiky. 7.1 Úvod Metodika analýzy přežití zahrnuje i vlastní modelovací postupy, které se umí vypořádat s cenzorovanými hodnotami, na něž standardní regresní modely nejsou použitelné. Nemámeli však v hodnoceném souboru cenzorované hodnoty, můžeme pro hodnocení dat přežití teoreticky použít i standardní modely. Prakticky je však standardní metodika statistických modelů nevhodná i z dalších důvodů, kterými jsou zejména tyto tři: Čas přežití může nabývat pouze kladných hodnot a má kladně sešikmené rozdělení pravděpodobnosti. V analýze přežití se používají specifická rozdělení pravděpodobnosti, která vykazují vlastnosti nevhodné pro standardní statistické modely (např. zobecněné lineární modely). Vzhledem k časové složce, kterou data přežití obsahují, nás často místo odhadu střední hodnoty zajímá odhad pravděpodobnosti přežití v daném časovém bodě. V analýze přežití často nemodelujeme přímo pozorované hodnoty, ale odpovídající rizikovou funkci. Regresní modely v analýze přežití jsou tak založeny na rizikové funkci, která lépe popisuje chování přežití sledované skupiny subjektů než hustota pravděpodobnosti. Předpokládejme tedy, že jsme v situaci, kdy chceme analyzovat a hlavně nějakým způsobem kvantifikovat vliv vysvětlující proměnné na přežití pacientů (obecně na dobu do sledované události). Jak to můžeme udělat? V zásadě bychom měli udělat tři kroky:
2 1. V první řadě bychom měli sestrojit Kaplanovy-Meierovy odhady pro jednotlivé skupiny, které nám poskytnou náhled na rozdílný nebo stejný průběh přežití srovnávaných skupin subjektů. Tento postup však umožňuje pouze vizualizaci a optické zhodnocení rozdílu mezi skupinami danými jednou proměnnou. Nic nekvantifikuje a navíc nebere v úvahu vliv dalších proměnných. 2. Dalším v pořadí je Mantelův-Haenszelův log-rank test, který umožňuje statistické zhodnocení rozdílu v přežití pomocí testové statistiky a s ní související p-hodnoty. Test ovšem také neposkytuje kvantifikaci pozorovaného rozdílu v přežití (např. efektu léčby) a nebere v úvahu více než jednu proměnnou. 3. Až použití regresního modelu nám umožňuje současně uvažovat vliv více proměnných a vzájemně tak adjustovat jejich vlivy. Zároveň nám umožňuje kvantifikaci statistické významnosti i velikosti rozdílu v přežití jednotlivých skupin (kvantifikace pozorovaného efektu). V analýze přežití existují dva hlavní modelovací přístupy umožňující vyjádřit vztah vysvětlujících proměnných a času do sledované události jako závisle proměnné a těmi jsou modely proporcionálních rizik (proportional hazards models), kde jsou vysvětlující proměnné vztaženy k rizikové funkci náhodné veličiny T, a tzv. modely zrychleného času (accelerated failure time models, AFT modely), kde jsou vysvětlující proměnné vztaženy k funkci (pravděpodobnosti) přežití. 7.2 Modely proporcionálních rizik Modely proporcionálních rizik jsou v současnosti nejpoužívanějšími modely v analýze přežití, což plyne zejména z jejich intuitivní interpretace a jednoduchosti použití. Regresní model proporcionálních rizik je vyjádřen pomocí rizikové funkce vztahem, exp exp, (7.1) kde index i označuje pacienty, je vektor vysvětlujících proměnných i-tého subjektu, je vektor regresních koeficientů příslušných jednotlivým proměnným a h 0 (t) je tzv. základní riziková funkce (baseline hazard function), která je společná všem pozorovaným subjektům. Výraz exp( ) vyjadřuje tzv. poměr rizik (hazard ratio, HR) daného subjektu vzhledem k subjektu se základním rizikem, který je definován pomocí vektoru vysvětlujících proměnných x i = 0. Vektorem x i = 0 tak většinou označujeme subjekty odpovídající referenční skupině pacientů. Obecně lze poměr rizik pro subjekty s vektory vysvětlujících proměnných x 1 a x 2 vyjádřit pomocí vztahu,, exp exp exp. (7.2) Ze vztahu (7.2) je vidět, že poměr rizik dvou subjektů je v modelu proporcionálních rizik nezávislý na čase, což představuje základní předpoklad této rodiny modelů. A ten je samozřejmě třeba v rámci analýzy vždy ověřit, aby reprezentace dat přežití pomocí modelu proporcionálních rizik byla validní. Ověřením tzv. proporcionality rizik (proportional hazards) se zabývá kapitola o metodách regresní diagnostiky.
3 Vztah (7.1) můžeme zjednodušit s použitím logaritmické transformace, někdy také říkáme, že rovnici linearizujeme. Aplikací přirozeného logaritmu na rovnici (7.1) získáme vztah ln, ln. (7.3) Předchozí vztahy (7.2) a (7.3) lze shrnout do tří předpokladů modelů proporcionálních rizik: 1. Vztah mezi vysvětlujícími proměnnými a přirozeným logaritmem rizikové funkce (ln, ) je lineární; 2. Nebereme-li v úvahu interakce jednotlivých proměnných, mají vysvětlující proměnné na škále ln, aditivní vliv; 3. Vliv vysvětlujících proměnných na rizikovou funkci je stejný v každém čase t. Podle charakteru základní rizikové funkce h 0 (t) rozdělujeme modely proporcionálních rizik na dvě skupiny: parametrické, kde h 0 (t) je specifikována s použitím konkrétního rozdělení pravděpodobnosti (a jeho parametrů), a semiparametrické, kde h 0 (t) není specifikována. Analyticky je možnost vynechat konkrétní specifikaci základní rizikové funkce výhodná, neboť ve většině reálných aplikací nemáme apriorní znalost o rozdělení pravděpodobnosti časů přežití. Nejznámějším semiparametrickým modelem proporcionálních rizik je Coxův model, kterému je věnována následující kapitola Parametrické modely proporcionálních rizik Pro parametrické modely proporcionálních rizik platí, že h 0 (t) má konkrétní vyjádření dané vybraným rozdělením pravděpodobnosti. Předpoklad konkrétního rozdělení je zároveň výhodou i nevýhodou těchto modelů. Znalost rozdělení, z něhož pocházejí pozorované hodnoty, nám umožňuje přesné odhady regresních koeficientů, špatný předpoklad však může vést k nevhodné reprezentaci dat modelem. Pro jednoduchost zde zmíníme pouze dva základní parametrické modely: exponenciální regresní model daný rovnicí, exp exp (7.4) a Weibullův regresní model definovaný vztahem, exp exp. (7.5) Odhad regresních koeficientů parametrického modelu,, 1,,, je založen na věrohodnostní funkci pro cenzorovaná data, která byla definována v kapitole Parametrické odhady. S použitím výše uvedeného značení se jedná o vztah,,,,,,, ln, ln,. (7.6)
4 Ze vztahů (7.4) a (7.5) jsou patrná omezení exponenciálního a Weibullova modelu. Prvním z nich je předpoklad konstantního základního rizika v čase u exponenciálního modelu, který je v případě klinických dat vzácný a každopádně je třeba ho ověřit. V případě Weibullova modelu pak rovnice připouští pouze monotónní základní rizikovou funkci (a z toho plynoucí monotónní rizikové funkce ve všech podskupinách definovaných vysvětlujícími proměnnými), což je někdy z hlediska flexibility popisu dat přežití nedostatečné Semiparametrické modely proporcionálních rizik Semiparametrický model proporcionálních rizik, jak už název napovídá, má jak parametrickou, tak i neparametrickou složku. Model je neparametrický v tom ohledu, že není nutné pomocí konkrétního rozdělení pravděpodobnosti specifikovat základní rizikovou funkci h 0 (t). Na druhé straně je však i parametrický, neboť uvažujeme parametry popisující vliv vysvětlujících proměnných na rizikovou funkci. Nejznámějším a nejpoužívanějším semiparametrickým modelem v analýze přežití je Coxův model, kterému jsou věnovány kapitoly 8 a Modely zrychleného času (Accelerated Failure Time, AFT) Regresní AFT model je vhodnou alternativou pro model proporcionálního rizika tehdy, když je předpoklad proporcionality rizik porušen. Jeho princip je založen na tom, že čas přežití i-tého subjektu, T i, je nezáporný, z čehož plyne, že můžeme modelovat jeho logaritmus. AFT model je tedy definován pomocí rovnice ln, (7.7) kde je reziduální člen s daným rozdělením pravděpodobnosti. Zvolíme-li si referenční skupinu pacientů, pro které je hodnota vektoru vysvětlujících proměnných x i = 0, dostaneme vyjádření jejích časů přežití jako exp. Funkci přežití S 0 (t), která odpovídá referenční skupině pacientů, nazýváme základní funkce přežití (baseline survival function). Nyní uvažujme vliv vektoru vysvětlujících proměnných x. Pokud ze vztahu (7.7) vyjádříme T s využitím referenčních dob přežití, T 0i, vidíme, že vysvětlující proměnná má vzhledem k času přežití multiplikativní efekt: exp exp exp. (7.8) Z toho plyne, že pravděpodobnost přežití i-tého subjektu s vektorem vysvětlujících proměnných x déle než do času t můžeme vyjádřit pomocí vztahu, exp exp exp. (7.9) Tento vztah lze interpretovat tak, že pravděpodobnost přežití pacienta s vektorem vysvětlujících proměnných x v čase t je rovna pravděpodobnosti přežití pacienta z referenční skupiny v čase /exp. V případě pacientů, kteří neodpovídají referenční skupině, tak
5 můžeme říci, že čas běží rychleji či pomaleji dle faktoru exp. Odhad regresních koeficientů v AFT modelu je opět založen na metodě maximální věrohodnosti. Problémy k řešení: 1. Vyjádřete derivaci logaritmu funkce věrohodnosti exponenciálního regresního modelu s jednou vysvětlující proměnnou (nabývající hodnot 0 a 1). Využijte parametrizaci h 0 = exp(β 0 ). (V řešení jsme označili d 1 a d 2 počty pozorovaných událostí a n 1 a n n 1 počty subjektů ve sledovaných skupinách) [Řešení: parciální derivace podle β 0 : exp exp ; parciální derivace podle β 1 : exp ] Doporučená literatura: 1. Marubini E, Valsecchi MG. Analysing Survival Data from Clinical Trials and Observational Studies. 1995, John Wiley & Sons, Chichester, United Kingdom. 2. Collet D. Modelling Survival Data in Medical Research. 2003, Chapman & Hall/CRC, London.
8 Coxův model proporcionálních rizik I
8 Coxův model proporcionálních rizik I Předpokládané výstupy z výuky: 1. Student umí formulovat Coxův model proporcionálních rizik 2. Student rozumí významu regresních koeficientů modelu 3. Student zná
Více2 Hlavní charakteristiky v analýze přežití
2 Hlavní charakteristiky v analýze přežití Předpokládané výstupy z výuky: 1. Student umí definovat funkci přežití, rizikovou funkci a kumulativní rizikovou funkci a zná funkční vazby mezi nimi 2. Student
Více4 Parametrické odhady
4 Parametrické odhady Předpokládané výstupy z výuky: 1. Student zná základní rozdělení pravděpodobnosti dat přežití 2. Student rozumí principu odhadu funkce přežití a rizikové funkce s využitím metody
VíceCHOVÁNÍ SILOFUNKCÍ TESTŮ V COXOVĚ MODELU PROPORCIONÁLNÍCH RIZIK
CHOVÁNÍ SILOFUNKCÍ TESTŮ V COXOVĚ MODELU PROPORCIONÁLNÍCH RIZIK Aneta Andrášiková 1, Eva Fišerová 1, Silvie Bělašková 2 1 Univerzita Palackého v Olomouci, PřF, KMaAM 2 Fakultní nemocnice u sv. Anny v Brně,
VíceRNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných
VíceEKONOMETRIE 7. přednáška Fáze ekonometrické analýzy
EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy Ekonometrická analýza proces, skládající se z následujících fází: a) specifikace b) kvantifikace c) verifikace d) aplikace Postupné zpřesňování jednotlivých
Více1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou
VíceAVDAT Klasický lineární model, metoda nejmenších
AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i
Vícejevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.
Parametrické metody odhadů z neúplných výběrů 2 1 Metoda maximální věrohodnosti pro cenzorované výběry 11 Náhodné cenzorování Při sledování složitých reálných systémů často nemáme možnost uspořádat experiment
VíceTestování hypotéz o parametrech regresního modelu
Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO
VíceTestování hypotéz o parametrech regresního modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,
Více10. Předpovídání - aplikace regresní úlohy
10. Předpovídání - aplikace regresní úlohy Regresní úloha (analýza) je označení pro statistickou metodu, pomocí nichž odhadujeme hodnotu náhodné veličiny (tzv. závislé proměnné, cílové proměnné, regresandu
VíceAVDAT Nelineární regresní model
AVDAT Nelineární regresní model Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Nelineární regresní model Ey i = f (x i, β) kde x i je k-členný vektor vysvětlujících proměnných
VíceRNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 8 Jak analyzovat přežití pacientů.
VícePravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1
Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu
VícePřijímací zkouška na navazující magisterské studium 2017
Přijímací zkouška na navazující magisterské studium 27 Studijní program: Studijní obor: Matematika Finanční a pojistná matematika Varianta A Řešení příkladů pečlivě odůvodněte. Věnujte pozornost ověření
VíceStatistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I
Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I Příklad Tahová síla papíru používaného pro výrobu potravinových sáčků je důležitá charakteristika kvality. Je známo, že síla
VícePřijímací zkouška na navazující magisterské studium 2014
Přijímací zkouška na navazující magisterské studium 24 Příklad (25 bodů) Spočtěte Studijní program: Studijní obor: Matematika Finanční a pojistná matematika Varianta A M x 2 dxdy, kde M = {(x, y) R 2 ;
VíceRegresní analýza 1. Regresní analýza
Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
VícePřednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy
Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy Relativní riziko a poměr šancí Princip korelace dvou náhodných veličin Korelační koeficienty Pearsonůva Spearmanův Korelace a kauzalita
VíceRegresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel
Regresní analýza Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Regresní analýza 1 / 23
VíceTECHNIKA UMĚLÝCH PROMĚNNÝCH V PRŮŘEZOVÉ ANALÝZE A V MODELECH ČASOVÝCH ŘAD
TECHNIKA UMĚLÝCH PROMĚNNÝCH V PRŮŘEZOVÉ ANALÝZE A V MODELECH ČASOVÝCH ŘAD Umělé (dummy) proměnné se používají, pokud chceme do modelu zahrnout proměnné, které mají kvalitativní či diskrétní charakter,
VíceOdhady Parametrů Lineární Regrese
Odhady Parametrů Lineární Regrese Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké
Více4EK211 Základy ekonometrie
4EK Základy ekonometrie Odhad klasického lineárního regresního modelu II Cvičení 3 Zuzana Dlouhá Klasický lineární regresní model - zadání příkladu Soubor: CV3_PR.xls Data: y = maloobchodní obrat potřeb
VíceEKONOMICKÁ APLIKACE KOMPOZIČNÍHO REGRESNÍHO MODELU
EKONOMICKÁ APLIKACE KOMPOZIČNÍHO REGRESNÍHO MODELU Klára Hrůzová 1,2, Karel Hron 1,2 1 Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, Univerzita Palackého v Olomouci 2 Katedra
VíceP13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.
P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod. Matematický přístup k výsledkům únavových zkoušek Náhodnost výsledků únavových zkoušek. Únavové
VíceKORELACE. Komentované řešení pomocí programu Statistica
KORELACE Komentované řešení pomocí programu Statistica Vstupní data I Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná
VíceStatistika. Regresní a korelační analýza Úvod do problému. Roman Biskup
Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009
VíceJana Vránová, 3. lékařská fakulta, UK Praha
Jana Vránová, 3. lékařská fakulta, UK Praha Byla navržena v 60tých letech jako alternativa k metodě nejmenších čtverců pro případ, že vysvětlovaná proměnná je binární Byla především používaná v medicíně
Víceodpovídá jedna a jen jedna hodnota jiných
8. Regresní a korelační analýza Problém: hledání, zkoumání a hodnocení souvislostí, závislostí mezi dvěma a více statistickými znaky (veličinami). Typy závislostí: pevné a volné Pevná závislost každé hodnotě
VíceRNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 4 Jak a kdy použít parametrické a
Vícepravděpodobnosti, popisné statistiky
8. Modelová rozdělení pravděpodobnosti, popisné statistiky Rozdělení pravděpodobnosti Normální rozdělení jako statistický model Přehled a aplikace modelových rozdělení Popisné statistiky Anotace Klasickým
VíceLINEÁRNÍ REGRESE. Lineární regresní model
LINEÁRNÍ REGRESE Chemometrie I, David MILDE Lineární regresní model 1 Typy závislosti 2 proměnných FUNKČNÍ VZTAH: 2 závisle proměnné: určité hodnotě x odpovídá jediná hodnota y. KORELACE: 2 náhodné (nezávislé)
VíceVŠB Technická univerzita Ostrava
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky Katedra aplikované matematiky Neparametrické a semi-parametrické modely v analýze přežití Non-parametric and Semi-parametric Models
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceTéma 22. Ondřej Nývlt
Téma 22 Ondřej Nývlt nyvlto1@fel.cvut.cz Náhodná veličina a náhodný vektor. Distribuční funkce, hustota a pravděpodobnostní funkce náhodné veličiny. Střední hodnota a rozptyl náhodné veličiny. Sdružené
Více10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.
0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti
VíceOdhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
VíceLineární a logistická regrese
Lineární a logistická regrese Martin Branda Univerzita Karlova v Praze Matematicko-fyzikální fakulta Katedra pravděpodobnosti a matematické statistiky Výpočetní prostředky finanční a pojistné matematiky
Více4EK201 Matematické modelování. 11. Ekonometrie
4EK201 Matematické modelování 11. Ekonometrie 11. Ekonometrie Ekonometrie Interdisciplinární vědní disciplína Zkoumá vztahy mezi ekonomickými veličinami Mikroekonomickými i makroekonomickými Ekonomie ekonomické
VíceSTATISTIKA I Metodický list č. 1 Název tématického celku:
STATISTIKA I Metodický list č. 1 Analýza závislostí Základním cílem tohoto tématického celku je seznámit se s pokročilejšími metodami zpracování statistických údajů.. 1. kontingenční tabulky 2. regresní
VíceRegresní analýza. Eva Jarošová
Regresní analýza Eva Jarošová 1 Obsah 1. Regresní přímka 2. Možnosti zlepšení modelu 3. Testy v regresním modelu 4. Regresní diagnostika 5. Speciální využití Lineární model 2 1. Regresní přímka 3 nosnost
VíceÚvodem Dříve les než stromy 3 Operace s maticemi
Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová
VíceBAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni
BAYESOVSKÉ ODHADY V NĚKTERÝCH MODELECH Michal Friesl Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni Slunce Řidiči IQ Regrese Přežití Obvyklý model Pozorování X = (X 1,..., X
VíceNeparametrické odhady podmíněné rizikové funkce
Ústav matematiky a statistiky Přírodovědecká fakulta Masarykova univerzita Finanční matematika v praxi III a Matematické modely a aplikace 3.-6. září 2013 Obsah 1 Analýza přežití Funkce přežití a riziková
VíceJana Vránová, 3. lékařská fakulta UK
Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOS A SAISIKA Regresní analýza - motivace Základní úlohou regresní analýzy je nalezení vhodného modelu studované závislosti. Je nutné věnovat velkou pozornost tomu aby byla modelována REÁLNÁ
VíceYou created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)
Závislost náhodných veličin Úvod Předchozí přednášky: - statistické charakteristiky jednoho výběrového nebo základního souboru - vztahy mezi výběrovým a základním souborem - vztahy statistických charakteristik
VíceNÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:
NÁHODNÁ ČÍSLA TYPY GENERÁTORŮ, LINEÁRNÍ KONGRUENČNÍ GENERÁTORY, TESTY NÁHODNOSTI, VYUŽITÍ HODNOT NÁHODNÝCH VELIČIN V SIMULACI CO JE TO NÁHODNÉ ČÍSLO? Náhodné číslo definujeme jako nezávislé hodnoty z rovnoměrného
VíceRNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 3 Jak a kdy použít parametrické a
VíceLINEÁRNÍ MODELY. Zdeňka Veselá
LINEÁRNÍ MODELY Zdeňka Veselá vesela.zdenka@vuzv.cz Genetika kvantitativních vlastností Jednotlivé geny nejsou zjistitelné ani měřitelné Efekty většího počtu genů poskytují variabilitu, kterou lze většinou
VíceROBUST 1 TESTY DOBRÉ SHODY PRO MODEL. Petr Novák. 1 Regrese v analýze spolehlivosti
ROBUST 2010 c ČStS 2010 TESTY DOBRÉ SHODY PRO MODEL ZRYCHLENÉHO ČASU V ANALÝZE PŘEŽITÍ Petr Novák Klíčová slova: Analýza přežití, testy dobré shody, model zrychleného času Abstrakt: V příspěvku studujeme
VíceVYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová
VYBRANÉ DVOUVÝBĚROVÉ TESTY Martina Litschmannová Obsah přednášky Vybrané dvouvýběrové testy par. hypotéz test o shodě rozptylů (F-test), testy o shodě středních hodnot (t-test, Aspinové-Welchův test),
Více3 Bodové odhady a jejich vlastnosti
3 Bodové odhady a jejich vlastnosti 3.1 Statistika (Skripta str. 77) Výběr pořizujeme proto, abychom se (více) dověděli o souboru, ze kterého jsme výběr pořídili. Zde se soustředíme na situaci, kdy známe
VíceSmíšené regresní modely a možnosti jejich využití. Karel Drápela
Smíšené regresní modely a možnosti jejich využití Karel Drápela Regresní modely Základní úloha regresní analýzy nalezení vhodného modelu studované závislosti vyjádření reálného tvaru závislosti minimalizace
VícePřednáška IX. Analýza rozptylu (ANOVA)
Přednáška IX. Analýza rozptylu (ANOVA) Princip a metodika výpočtu Předpoklady analýzy rozptylu a jejich ověření Rozbor rozdílů jednotlivých skupin násobné testování hypotéz Analýza rozptylu jako lineární
VíceANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.
ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz PŘEHLED TESTŮ rozdělení normální spojité alternativní / diskrétní
Více8.3). S ohledem na jednoduchost a názornost je výhodné seznámit se s touto Základní pojmy a vztahy. Definice
9. Lineární diferenciální rovnice 2. řádu Cíle Diferenciální rovnice, v nichž hledaná funkce vystupuje ve druhé či vyšší derivaci, nazýváme diferenciálními rovnicemi druhého a vyššího řádu. Analogicky
VíceZáklady biostatistiky II. Veřejné zdravotnictví 3.LF UK - II
Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické
VíceProblematika analýzy rozptylu. Ing. Michael Rost, Ph.D.
Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít
VíceTomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
VíceAnalýza přežití Základy analýzy klinických dat: Analýza přežití
Analýza přežití Základy analýzy klinických dat: Analýza přežití Analýza přežití Studujeme čas předcházející události, která nás zajímá T Na rozdíl od mortality nechceme pouze počty událostí Událost smrt,
VíceNestranný odhad Statistické vyhodnocování exp. dat M. Čada
Nestranný odhad 1 Parametr θ Máme statistický (výběrový) soubor, který je realizací náhodného výběru 1, 2, 3,, n z pravděpodobnostní distribuce, která je kompletně stanovena jedním nebo více parametry
VíceSTATISTICKÉ ODHADY Odhady populačních charakteristik
STATISTICKÉ ODHADY Odhady populačních charakteristik Jak stanovit charakteristiky rozložení sledované veličiny v základní populaci? Populaci většinou nemáme celou k dispozici, musíme se spokojit jen s
VíceStatistické metody v marketingu. Ing. Michael Rost, Ph.D.
Statistické metody v marketingu Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Úvodem Modelování vztahů mezi vysvětlující a vysvětlovanou (závisle) proměnnou patří mezi základní aktivity,
VícePravděpodobnost a matematická statistika
Pravděpodobnost a matematická statistika Příklady k přijímacím zkouškám na doktorské studium 1 Popisná statistika Určete aritmetický průměr dat, zadaných tabulkou hodnot x i a četností n i x i 1 2 3 n
VíceKorelační a regresní analýza
Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná
VíceZákladní statistické modely Statistické vyhodnocování exp. dat M. Čada ~ cada
Základní statistické modely 1 Statistika Matematická statistika se zabývá interpretací získaných náhodných dat. Snažíme se přiřadit statistickému souboru vhodnou distribuční funkci a najít základní číselné
Více4. Aplikace matematiky v ekonomii
4. Aplikace matematiky v ekonomii 1 Lineární algebra Soustavy 1) Na základě statistických údajů se zjistilo, že závislost množství statku z poptávaného v průběhu jednoho týdne lze popsat vztahem q d =
VíceZákladní vlastnosti křivek
křivka množina bodů v rovině nebo v prostoru lze chápat jako trajektorii pohybu v rovině či v prostoru nalezneme je také jako množiny bodů na ploše křivky jako řezy plochy rovinou, křivky jako průniky
VíceVlastnosti odhadů ukazatelů způsobilosti
Vlastnosti odhadů ukazatelů způsobilosti Jiří Michálek CQR při Ústavu teorie informace a automatizace AV ČR v Praze Úvod Ve výzkumné zprávě č 06 Odhady koeficientů způsobilosti a jejich vlastnosti viz
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti
VíceGenerování pseudonáhodných. Ing. Michal Dorda, Ph.D.
Generování pseudonáhodných čísel při simulaci Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky V simulačních modelech se velice často vyskytují náhodné proměnné. Proto se budeme zabývat otázkou, jak při simulaci
VícePravděpodobnost a aplikovaná statistika
Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 2. KAPITOLA PODMÍNĚNÁ PRAVDĚPODOBNOST 3. KAPITOLA NÁHODNÁ VELIČINA 9.11.2017 Opakování Uveďte příklad aplikace geometrické definice pravděpodobnosti
Více1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,
KMA/SZZS1 Matematika 1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, operace s limitami. 2. Limita funkce
VíceJemný úvod do statistických metod v netržním oceňování
Jemný úvod do statistických metod v netržním oceňování Ing. Jan Brůha PhD. Karlova univerzita Struktura prezentací První prezentace Cíle, možnosti a omezení Nástroje: metodologie a software CVM (open ended)
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
VíceRozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně
Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný
VíceANALÝZA KATEGORIZOVANÝCH DAT V SOCIOLOGII
ANALÝZA KATEGORIZOVANÝCH DAT V SOCIOLOGII Tomáš Katrňák Fakulta sociálních studií Masarykova univerzita Brno ÚVOD DO LOGLINEÁRNÍHO MODELOVÁNÍ historie - až do 60. let se k analýze kontingenčních tabulek
VíceIng. Michael Rost, Ph.D.
Úvod do testování hypotéz, jednovýběrový t-test Ing. Michael Rost, Ph.D. Testovaná hypotéza Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru, např. o parametru Θ, pak takovéto tvrzení
VíceIlustrační příklad odhadu LRM v SW Gretl
Ilustrační příklad odhadu LRM v SW Gretl Podkladové údaje Korelační matice Odhad lineárního regresního modelu (LRM) Verifikace modelu PEF ČZU Praha Určeno pro posluchače předmětu Ekonometrie Needitovaná
VíceAVDAT Mnohorozměrné metody, metody klasifikace
AVDAT Mnohorozměrné metody, metody klasifikace Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Mnohorozměrné metody Regrese jedna náhodná veličina je vysvětlována pomocí jiných
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Náhodný výběr Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
VíceChyby měření 210DPSM
Chyby měření 210DPSM Jan Zatloukal Stručný přehled Zdroje a druhy chyb Systematické chyby měření Náhodné chyby měření Spojité a diskrétní náhodné veličiny Normální rozdělení a jeho vlastnosti Odhad parametrů
VíceLogaritmus, logaritmická funkce, log. Rovnice a nerovnice. 3 d) je roven číslu: c) -1 d) 0 e) 3 c) je roven číslu: b) -1 c) 0 d) 1 e)
Logaritmus, logaritmická funkce, log. Rovnice a nerovnice ) Výraz log log +log není správná 0 - žádná z předchozích odpovědí ) Číslo log 8 6 je rovno číslu: ) Výraz log log +log - 0 ) Číslo log 6 6 je
VíceOdhad spolehlivosti kolejových obvodů z nekompletních cenzorovaných dat
Odhad spolehlivosti kolejových obvodů z nekompletních cenzorovaných dat Petr Novák, Rudolf Blažek, Martin Daňhel Katedra aplikované matematiky, Fakulta informačních technologií ČVUT 23. ledna 2018 1 /
VíceKapacita jako náhodná veličina a její měření. Ing. Igor Mikolášek, Ing. Martin Bambušek Centrum dopravního výzkumu, v. v. i.
Kapacita jako náhodná veličina a její měření Ing. Igor Mikolášek, Ing. Martin Bambušek Centrum dopravního výzkumu, v. v. i. Obsah Kapacita pozemních komunikací Funkce přežití Kaplan-Meier a parametrické
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie ZS 2015/16 Cvičení 7: Časově řady, autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Časové řady Data: HDP.wf1
VíceČasové řady, typy trendových funkcí a odhady trendů
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Stochastický proces Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2 } se nazývá stochastický proces
Více1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě
Více0.1 Úvod do matematické analýzy
Matematika I (KMI/PMATE) 1 0.1 Úvod do matematické analýzy 0.1.1 Pojem funkce Veličina - pojem, který popisuje kvantitativní (číselné) vlastnosti reálných i abstraktních objektů. Příklady veličin: hmotnost
VíceKGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení
VíceOdhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
VíceMatematické modelování Náhled do ekonometrie. Lukáš Frýd
Matematické modelování Náhled do ekonometrie Lukáš Frýd Výnos akcie vs. Výnos celého trhu - CAPM model r it = r ft + β 1. (r mt r ft ) r it r ft = α 0 + β 1. (r mt r ft ) + ε it Ekonomický (finanční model)
Vícedat Robust ledna 2018
Analýza prostorově závislých funkcionálních dat V. Římalová, A. Menafoglio, A. Pini, E. Fišerová Robust 2018 25. ledna 2018 Motivace Data a náhled lokace Měsíční měření (březen-říjen 2015 a 2016) 5 chemických
Víceanalýzy dat v oboru Matematická biologie
INSTITUT BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Komplexní přístup k výuce analýzy dat v oboru Matematická biologie Tomáš Pavlík, Daniel Schwarz, Jiří Jarkovský,
VíceTestování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,
Více