8 Coxův model proporcionálních rizik I
|
|
- Vít Eduard Valenta
- před 5 lety
- Počet zobrazení:
Transkript
1 8 Coxův model proporcionálních rizik I Předpokládané výstupy z výuky: 1. Student umí formulovat Coxův model proporcionálních rizik 2. Student rozumí významu regresních koeficientů modelu 3. Student zná princip odhadu regresních koeficientů Coxova modelu pomocí metody parciální věrohodnosti 4. Student zná metody pro neparametrický odhad základní rizikové funkce Coxův model proporcionálních rizik je jednoznačně nejpoužívanějším modelem v analýze přežití, což je dáno zejména jednoduchostí jeho použití a snadnou interpretací výstupů. Jednoduchá aplikovatelnost Coxova modelu je však dvojsečná, neboť v případě použití tohoto modelu na data nesplňující jeho předpoklady mohou být výsledky zkreslené a jejich interpretace zavádějící. Tato kapitola je věnována definici Coxova modelu, základní metodice odhadu regresních koeficientů a interpretaci výsledků. Ověření předpokladů a vhodnosti Coxova modelu na reálná data se věnuje kapitola 10 s názvem Regresní diagnostika. 8.1 Úvod Coxův model je jakožto model proporcionálních rizik definován pomocí rizikové funkce. Pro i-tého pacienta lze jeho rizikovou funkci se zahrnutím vlivu nezávislých vysvětlujících proměnných vyjádřit ve tvaru, exp exp, (8.1) kde p je počet zahrnutých vysvětlujících proměnných, jejichž hodnoty jsou pro i-tý subjekt zaznamenány ve vektoru. Vektor je pak vektor příslušných regresních koeficientů a funkce představuje základní rizikovou funkci společnou pro všechny subjekty. Základní rizikovou funkci sice uvažujeme jako funkci času, nicméně její přesná podoba není v modelu specifikována. Důvodem tohoto kroku, který je velmi výhodný, neboť nás zbavuje nutnosti přesně specifikovat charakter dat přežití, je speciální postup odhadu regresních koeficientů modelu, který je nezávislý na konkrétní podobě. Vliv vysvětlujících proměnných na riziko výskytu sledované události je vyjádřen prostřednictvím jednotlivých regresních koeficientů, 1,,, které udávají změnu v riziku výskytu sledované události spojenou se změnou hodnoty vysvětlující proměnné k. Přesněji řečeno představuje hodnotu, o kterou se zvýší přirozený logaritmus rizikové funkce, pokud se hodnota k-té proměnné zvýší o jednu jednotku za předpokladu, že ostatní vysvětlující proměnné se nezmění. Kladné znaménko regresního koeficientu znamená, že riziko sledované události je větší u pacienta s vyšší hodnotou odpovídající vysvětlující proměnné. Naopak záporný koeficient nám říká, že má daná vysvětlující proměnná s vyšší
2 hodnotou protektivní účinek, tzn. riziko výskytu sledované události je nižší. Vztah a rizikové funkce lze pomocí exponenciální transformace vyjádřit jako exp,,,, 1,,,,,,. (8.2) V případě binární proměnné nabývající hodnot 0 a 1 tato hodnota vyjadřuje, kolikrát větší riziko výskytu sledované události má riziková skupina subjektů proti skupině referenční (za předpokladu, že jsou obě skupiny srovnatelné s ohledem na ostatní faktory). 8.2 Odhad regresních koeficientů Coxova modelu Pro odhad regresních koeficientů modelu navrhl David Cox tzv. metodu parciální věrohodnosti (partial likelihood method), která spočívá v tom, že místo standardní funkce věrohodnosti je maximalizována tzv. parciální věrohodnostní funkce (partial likelihood function). Parciální funkce věrohodnosti není závislá na specifikaci a závisí pouze na vektoru regresních koeficientů. Odvození je následující: uvažujme soubor n subjektů s m pozorovanými událostmi (m n). Je-li vektor vysvětlujících proměnných i-tého subjektu x i konstantní v čase, pak lze podmíněnou pravděpodobnost, že k výskytu sledované události v čase t i došlo mezi všemi subjekty v riziku právě u i-tého subjektu, vyjádřit pomocí vztahu,, exp exp exp exp, (8.3) kde je indikátor toho, zda je j-tý pacient v riziku sledované události v čase t i, tedy 1 pokud, 0 pokud. Ve výše uvedeném vztahu pro jednoduchost předpokládáme, že v každém čase t i se vyskytla pouze jedna událost. Za předpokladu, že pozorované časy sledovaných událostí jsou navzájem nezávislé, můžeme parciální věrohodnostní funkci sestrojit jako součin jednotlivých komponent přes všechny pozorované časy t i, tedy jako exp exp. (8.4) Výpočetně je jednodušší pracovat se součtem než se součinem, proto se pro odhad regresních koeficientů používá maximalizace přirozeného logaritmu parciální věrohodnostní funkce, který můžeme vyjádřit jako ln ln exp. (8.5)
3 Subjekty s cenzorovanými časy přežití přispívají k parciální věrohodnostní funkci pouze jako součást skupiny v riziku; příslušný odhad vektoru regresních koeficientů,, pak již získáme maximalizací funkce, tedy položením příslušných derivací podle až rovno nule a vyřešením příslušného systému p rovnic o p neznámých parametrech Skórový vektor a informační matice V souvislosti s logaritmem parciální funkce věrohodnosti definujeme dvě charakteristiky, které se dále využívají s testování hypotéz o regresních koeficientech až. První z nich je tzv. skórový vektor (score vector) U(β), jehož k-tý člen U k (β) je definován jako suma prvních derivací l i, tedy příspěvků logaritmu parciální věrohodnosti v čase t i, podle β k, tedy vztahem. (8.6) Druhou charakteristikou je tzv. informační matice (information matrix) I(β), matice o rozměru p p, která na pozici (k,l) obsahuje jako prvky zápornou hodnotu odpovídající parciální derivace druhého řádu, tedy. Tato matice úzce souvisí s kovarianční maticí maximálně věrohodného odhadu vektoru regresních koeficientů β, var, neboť platí var. (8.7) Interval spolehlivosti pro poměr rizik Odhad vektoru regresních koeficientů,, můžeme jednoznačně propojit s interpretací výsledků modelu, tedy s poměrem rizik, který byl definován v předchozí kapitole. Bodový odhad poměru rizik,, dvou pacientů, označme je i a j, získáme dosazením odhadu vektoru regresních koeficientů do vztahu (7.2): exp. (8.8) Hodnotíme-li vliv pouze jediné vysvětlující proměnné, tedy k = 1, která je navíc binární a tudíž nabývá pouze hodnot 0 a 1, pak poměr rizik jednoduše vyjadřuje vztah exp. Následně můžeme pro poměr rizik zkonstruovat i 100(1 α)% interval spolehlivosti s využitím 1 2 kvantilu standardizovaného normálního rozdělení ve tvaru exp, (8.9) kde SE značí standardní chybu odhadu, kterou lze získat pomocí varianční matice var definované vztahem (8.7).
4 8.3 Testy o regresních koeficientech Chceme-li rozhodnout, zda vysvětlující proměnná má či nemá statisticky významný vliv na dobu do sledované události, musíme se zaměřit na hodnotu odpovídajícího regresního koeficientu. Ve chvíli, kdy je tento koeficient nulový, ze vztahu (8.8) automaticky plyne, že poměr rizik odpovídající dané proměnné je 1, což znamená, že přítomnost této proměnné u pacienta neovlivňuje riziko výskytu sledované události. Pro test hypotézy o tom, zda je či není regresní koeficient pro k-tou vysvětlující proměnnou statisticky významný, lze nulovou hypotézu a odpovídající alternativní hypotézu zapsat jako : 0 : 0, (8.10) čemuž analogicky pro poměr rizik odpovídá nulová a alternativní hypotéza ve tvaru : 1 a : 1. Jednou z možností, jak získat informaci o významu dané proměnné a potažmo regresního koeficientu, je sestrojení 100(1 α)% intervalu spolehlivosti pro odhad regresního koeficientu odpovídajícího k-té proměnné, který má tvar. (8.11) V případě, že tento interval spolehlivosti zahrnuje hodnotu 0, jedná se o indikátor platnosti nulové hypotézy, kterou (samozřejmě pomocí odpovídajícího testu) nejspíše nezamítneme. Hlavním způsobem, jak lze určit statistickou významnost regresního koeficientu, je využití jednoho ze tří testů, které bývají standardně implementovány v dostupných statistických software. Před definicí jednotlivých testů o β k si kvůli jednoduššímu značení přeuspořádejme odhadnutý vektor regresních koeficientů jako,. Zmíněné testy jsou následující: Test pomocí poměru věrohodností (likelihood ratio test): tento test vyhodnocuje rozdíl přirozených logaritmů parciálních věrohodnostních funkcí, které odpovídají alternativní a nulové hypotéze. Testová statistika je definována vztahem 2ln, ln0,. (8.12) V prvním výrazu tedy kalkulujeme parciální věrohodnost vektoru, který byl odhadnut i s koeficientem β k, v druhém výrazu pak kalkulujeme parciální věrohodnost vektoru s položením koeficientu β k = 0. Testová statistika Q LR má asymptoticky chí-kvadrát rozdělení pravděpodobnosti s jedním stupněm volnosti (obecně lze zároveň testovat r regresních koeficientů současně, pak by měla testová statistika chí-kvadrát rozdělení s r stupni volnosti). Waldův test (Wald test) je založen na maximálně věrohodném odhadu první komponenty odhadnutého vektoru koeficientu, tedy. Testová statistika, Q W, je dána poměrem odhadu koeficientu a odpovídající standardní chyby, kterou lze opět získat jako odmocninu prvku varianční matice var definované vztahem (8.7). Q W tedy definujeme vztahem. (8.13)
5 Testová statistika Q W má v tomto případě standardizované normální rozdělení, obecně však můžeme Waldův test použít i pro testování r regresních koeficientů současně. Pak by testová statistika Q W měla složitější vyjádření a měla by chí-kvadrát rozdělení s r stupni volnosti. Skórový test (score test) vyhodnocuje derivaci logaritmu parciální věrohodnosti za platnosti nulové hypotézy (β k = 0) s ohledem na odmocninu pozorované informace dané druhou derivací tohoto logaritmu (opět v bodě β k = 0). Testová statistika Q S má tedy tvar. (8.14) Stejně jako v případě Waldova testu, i statistika Q S má v tomto případě standardizované normální rozdělení. Po zobecnění na testování r regresních koeficientů zároveň by opět statistika Q S měla chí-kvadrát rozdělení s r stupni volnosti. 8.4 Breslowův odhad základní rizikové funkce Kromě hodnocení vztahu mezi přežitím a vysvětlujícími proměnnými pomocí poměru rizik nám Coxův model umožňuje také odhadovat pravděpodobnost přežití, respektive pravděpodobnost výskytu sledované události v čase. Tento odhad je možný na základě znalosti hodnot vysvětlujících proměnných konkrétního subjektu, musíme však specifikovat základní rizikovou funkci, která je třeba pro úplnou specifikaci vzorce (8.1). Odhad rizikové funkce v čase pro subjekt s vektorem vysvětlujících proměnných x i pak vypadá následovně:, exp exp, (8.15) kde,, jsou maximálně věrohodné odhady regresních koeficientů a je vybraný odhad základní rizikové funkce. Nejznámější neparametrická metoda pro odhad základní rizikové funkce (resp. základní kumulativní rizikové funkce) je tzv. Breslowův odhad (Breslow estimate of baseline hazard). Indexujeme-li pacienty a jejich hodnoty vysvětlujících proměnných x i, 1,,, pak Breslowův odhad základního rizika v čase je dán vztahem exp, (8.16) kde je počet událostí, které nastaly v čase, a je indikátor toho, zda je i-tý pacient v riziku sledované události v čase t j, tedy 1 pokud, 0 pokud. Počítáme-li jako časy přežití i časy cenzorované, pak Breslowův odhad základního rizika v čase nabývá nenulové hodnoty, je-li to čas výskytu sledované události, a v těch cenzorovaných je nulový. Ze vztahu (8.16) již můžeme odvodit vztah pro odhad základní kumulativní rizikové funkce
6 exp. (8.17) Odhad základní kumulativní rizikové funkce lze využít pro odhad základní funkce přežití S 0 (t), neboť platí exp. Odhad funkce přežití subjektu s vektorem vysvětlujících proměnných x i pak získáme pomocí vztahu,. (8.18) Doporučená literatura: 1. Marubini E, Valsecchi MG. Analysing Survival Data from Clinical Trials and Observational Studies. 1995, John Wiley & Sons, Chichester, United Kingdom. 2. Collet D. Modelling Survival Data in Medical Research. 2003, Chapman & Hall/CRC, London. 3. Hosmer DW, Lemeshow S, May S. Applied Survival Analysis: Regression Modeling of Time to Event Data, 2nd Edition. 2008, John Wiley & Sons, Chichester, United Kingdom.
7 Regresní modely v analýze přežití
7 Regresní modely v analýze přežití Předpokládané výstupy z výuky: 1. Student rozumí významu regresního modelování dat o přežití 2. Student dokáže definovat pojmy poměr rizik a základní riziková funkce
Více2 Hlavní charakteristiky v analýze přežití
2 Hlavní charakteristiky v analýze přežití Předpokládané výstupy z výuky: 1. Student umí definovat funkci přežití, rizikovou funkci a kumulativní rizikovou funkci a zná funkční vazby mezi nimi 2. Student
VíceAVDAT Klasický lineární model, metoda nejmenších
AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i
Vícejevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.
Parametrické metody odhadů z neúplných výběrů 2 1 Metoda maximální věrohodnosti pro cenzorované výběry 11 Náhodné cenzorování Při sledování složitých reálných systémů často nemáme možnost uspořádat experiment
Více4 Parametrické odhady
4 Parametrické odhady Předpokládané výstupy z výuky: 1. Student zná základní rozdělení pravděpodobnosti dat přežití 2. Student rozumí principu odhadu funkce přežití a rizikové funkce s využitím metody
VíceTestování hypotéz o parametrech regresního modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,
VíceTestování hypotéz o parametrech regresního modelu
Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO
VíceVŠB Technická univerzita Ostrava
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky Katedra aplikované matematiky Neparametrické a semi-parametrické modely v analýze přežití Non-parametric and Semi-parametric Models
Více1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou
VícePřednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy
Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy Relativní riziko a poměr šancí Princip korelace dvou náhodných veličin Korelační koeficienty Pearsonůva Spearmanův Korelace a kauzalita
Více4EK211 Základy ekonometrie
4EK Základy ekonometrie Odhad klasického lineárního regresního modelu II Cvičení 3 Zuzana Dlouhá Klasický lineární regresní model - zadání příkladu Soubor: CV3_PR.xls Data: y = maloobchodní obrat potřeb
VíceJana Vránová, 3. lékařská fakulta, UK Praha
Jana Vránová, 3. lékařská fakulta, UK Praha Byla navržena v 60tých letech jako alternativa k metodě nejmenších čtverců pro případ, že vysvětlovaná proměnná je binární Byla především používaná v medicíně
VíceCHOVÁNÍ SILOFUNKCÍ TESTŮ V COXOVĚ MODELU PROPORCIONÁLNÍCH RIZIK
CHOVÁNÍ SILOFUNKCÍ TESTŮ V COXOVĚ MODELU PROPORCIONÁLNÍCH RIZIK Aneta Andrášiková 1, Eva Fišerová 1, Silvie Bělašková 2 1 Univerzita Palackého v Olomouci, PřF, KMaAM 2 Fakultní nemocnice u sv. Anny v Brně,
VíceRegresní analýza 1. Regresní analýza
Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému
Více10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.
0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti
VíceRNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných
VíceRegrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly:
Regrese 28. listopadu 2013 Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly: 1. Ukázat, že data jsou opravdu závislá. 2. Provést regresi. 3. Ukázat, že zvolená křivka
VíceOdhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VícePřijímací zkouška na navazující magisterské studium 2017
Přijímací zkouška na navazující magisterské studium 27 Studijní program: Studijní obor: Matematika Finanční a pojistná matematika Varianta A Řešení příkladů pečlivě odůvodněte. Věnujte pozornost ověření
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie ZS 2015/16 Cvičení 7: Časově řady, autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Časové řady Data: HDP.wf1
VíceTestování statistických hypotéz
Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné
VíceVYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová
VYBRANÉ DVOUVÝBĚROVÉ TESTY Martina Litschmannová Obsah přednášky Vybrané dvouvýběrové testy par. hypotéz test o shodě rozptylů (F-test), testy o shodě středních hodnot (t-test, Aspinové-Welchův test),
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie LS 2014/15 Cvičení 10: Heteroskedasticita LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Heteroskedasticita - teorie Druhý
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie LS 2014/15 Cvičení 7: Autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Autokorelace - teorie Zopakujte si G-M
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceAnalýza faktorů ovlivňujících délku doby nezaměstnanosti využitím metod analýzy přežití
Analýza faktorů ovlivňujících délku doby nezaměstnanosti využitím metod analýzy přežití Jan Popelka Doktorand oboru Statistika Abstrakt: ento článek věnuje pozornost analýze přežití aplikované na problém
VíceJana Vránová, 3. lékařská fakulta UK
Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace
Více3 Bodové odhady a jejich vlastnosti
3 Bodové odhady a jejich vlastnosti 3.1 Statistika (Skripta str. 77) Výběr pořizujeme proto, abychom se (více) dověděli o souboru, ze kterého jsme výběr pořídili. Zde se soustředíme na situaci, kdy známe
VíceKlasická a robustní ortogonální regrese mezi složkami kompozice
Klasická a robustní ortogonální regrese mezi složkami kompozice K. Hrůzová, V. Todorov, K. Hron, P. Filzmoser 13. září 2016 Kompoziční data kladná reálná čísla nesoucí pouze relativní informaci, x = (x
VíceVlastnosti odhadů ukazatelů způsobilosti
Vlastnosti odhadů ukazatelů způsobilosti Jiří Michálek CQR při Ústavu teorie informace a automatizace AV ČR v Praze Úvod Ve výzkumné zprávě č 06 Odhady koeficientů způsobilosti a jejich vlastnosti viz
VíceStatistické metody v marketingu. Ing. Michael Rost, Ph.D.
Statistické metody v marketingu Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Úvodem Modelování vztahů mezi vysvětlující a vysvětlovanou (závisle) proměnnou patří mezi základní aktivity,
Více15. T e s t o v á n í h y p o t é z
15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
VíceAVDAT Nelineární regresní model
AVDAT Nelineární regresní model Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Nelineární regresní model Ey i = f (x i, β) kde x i je k-členný vektor vysvětlujících proměnných
Více15. T e s t o v á n í h y p o t é z
15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
VíceIlustrační příklad odhadu LRM v SW Gretl
Ilustrační příklad odhadu LRM v SW Gretl Podkladové údaje Korelační matice Odhad lineárního regresního modelu (LRM) Verifikace modelu PEF ČZU Praha Určeno pro posluchače předmětu Ekonometrie Needitovaná
Více9. T r a n s f o r m a c e n á h o d n é v e l i č i n y
9. T r a n s f o r m a c e n á h o d n é v e l i č i n y Při popisu procesů zpracováváme vstupní údaj, hodnotu x tak, že výstupní hodnota y závisí nějakým způsobem na vstupní, je její funkcí y = f(x).
VíceOdhady Parametrů Lineární Regrese
Odhady Parametrů Lineární Regrese Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké
VíceIng. Michael Rost, Ph.D.
Úvod do testování hypotéz, jednovýběrový t-test Ing. Michael Rost, Ph.D. Testovaná hypotéza Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru, např. o parametru Θ, pak takovéto tvrzení
VíceEKONOMETRIE 7. přednáška Fáze ekonometrické analýzy
EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy Ekonometrická analýza proces, skládající se z následujících fází: a) specifikace b) kvantifikace c) verifikace d) aplikace Postupné zpřesňování jednotlivých
VíceBodové a intervalové odhady parametrů v regresním modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model Mějme lineární regresní model (LRM) Y = Xβ + e, kde y 1 e 1 β y 2 Y =., e
VíceNormální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký
VícePRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady
PRAVDĚPODOBNOST A STATISTIKA Bayesovské odhady Bayesovské odhady - úvod Klasický bayesovský přístup: Klasický přístup je založen na opakování pokusech sledujeme rekvenci nastoupení zvolených jevů Bayesovský
Více4EK211 Základy ekonometrie
4EK11 Základy ekonometrie Autokorelace Cvičení 5 Zuzana Dlouhá Gauss-Markovy předpoklady Náhodná složka: Gauss-Markovy předpoklady 1. E(u) = náhodné vlivy se vzájemně vynulují. E(uu T ) = σ I n konečný
VíceRozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně
Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný
VícePřijímací zkouška na navazující magisterské studium 2014
Přijímací zkouška na navazující magisterské studium 24 Příklad (25 bodů) Spočtěte Studijní program: Studijní obor: Matematika Finanční a pojistná matematika Varianta A M x 2 dxdy, kde M = {(x, y) R 2 ;
VíceOdhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
VícePravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.
Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení
VíceStavový model a Kalmanův filtr
Stavový model a Kalmanův filtr 2 prosince 23 Stav je veličina, kterou neznáme, ale chtěli bychom znát Dozvídáme se o ní zprostředkovaně prostřednictvím výstupů Příkladem může býapř nějaký zašuměný signál,
VícePravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1
Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu
VíceTestování statistických hypotéz
Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,
VíceLineární a logistická regrese
Lineární a logistická regrese Martin Branda Univerzita Karlova v Praze Matematicko-fyzikální fakulta Katedra pravděpodobnosti a matematické statistiky Výpočetní prostředky finanční a pojistné matematiky
VíceVYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE VYUŽITÍ LOGISTICKÉ REGRESE VE VÝZKUMU TRHU
VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Fakulta informatiky a statistiky Studijní program: Kvantitativní metody v ekonomice Studijní obor: Statistické a pojistné inženýrství Diplomant: Hana Brabcová Vedoucí diplomové
VíceTESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B
TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu,
VícePravděpodobnost a matematická statistika
Pravděpodobnost a matematická statistika Příklady k přijímacím zkouškám na doktorské studium 1 Popisná statistika Určete aritmetický průměr dat, zadaných tabulkou hodnot x i a četností n i x i 1 2 3 n
Více9. T r a n s f o r m a c e n á h o d n é v e l i č i n y
9. T r a n s f o r m a c e n á h o d n é v e l i č i n Při popisu procesů zpracováváme vstupní údaj, hodnotu x tak, že výstupní hodnota závisí nějakým způsobem na vstupní, je její funkcí = f(x). Pokud
VíceCvičení 12: Binární logistická regrese
Cvičení 12: Binární logistická regrese Příklad: V roce 2014 konalo státní závěrečné zkoušky bakalářského studia na jisté fakultě 167 studentů. U každého studenta bylo zaznamenáno jeho pohlaví (0 žena,
VíceÚvodem Dříve les než stromy 3 Operace s maticemi
Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová
Více5. T e s t o v á n í h y p o t é z
5. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
VíceStatistické metody v marketingu. Ing. Michael Rost, Ph.D.
Statistické metody v marketingu Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Regresní analýza doplnění základů Vzhledem k požadavku Vašich kolegů zařazuji doplňující partii o regresní
VíceKGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním
VíceTestování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,
VíceLINEÁRNÍ REGRESE. Lineární regresní model
LINEÁRNÍ REGRESE Chemometrie I, David MILDE Lineární regresní model 1 Typy závislosti 2 proměnných FUNKČNÍ VZTAH: 2 závisle proměnné: určité hodnotě x odpovídá jediná hodnota y. KORELACE: 2 náhodné (nezávislé)
VíceTomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
VíceStatistické metody v ekonomii. Ing. Michael Rost, Ph.D.
Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Test χ 2 v kontingenční tabulce typu 2 2 Jde vlastně o speciální případ χ 2 testu pro čtyřpolní tabulku.
VíceRegresní analýza. Eva Jarošová
Regresní analýza Eva Jarošová 1 Obsah 1. Regresní přímka 2. Možnosti zlepšení modelu 3. Testy v regresním modelu 4. Regresní diagnostika 5. Speciální využití Lineární model 2 1. Regresní přímka 3 nosnost
VíceTomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
Víceodpovídá jedna a jen jedna hodnota jiných
8. Regresní a korelační analýza Problém: hledání, zkoumání a hodnocení souvislostí, závislostí mezi dvěma a více statistickými znaky (veličinami). Typy závislostí: pevné a volné Pevná závislost každé hodnotě
Více5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza
5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně
VíceTECHNIKA UMĚLÝCH PROMĚNNÝCH V PRŮŘEZOVÉ ANALÝZE A V MODELECH ČASOVÝCH ŘAD
TECHNIKA UMĚLÝCH PROMĚNNÝCH V PRŮŘEZOVÉ ANALÝZE A V MODELECH ČASOVÝCH ŘAD Umělé (dummy) proměnné se používají, pokud chceme do modelu zahrnout proměnné, které mají kvalitativní či diskrétní charakter,
VíceBAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni
BAYESOVSKÉ ODHADY V NĚKTERÝCH MODELECH Michal Friesl Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni Slunce Řidiči IQ Regrese Přežití Obvyklý model Pozorování X = (X 1,..., X
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y Xβ ε Předpoklady: Matice X X n,k je matice realizací. Předpoklad: n > k, h(x) k - tj. matice
VíceAplikovaná numerická matematika
Aplikovaná numerická matematika 6. Metoda nejmenších čtverců doc. Ing. Róbert Lórencz, CSc. České vysoké učení technické v Praze Fakulta informačních technologií Katedra počítačových systémů Příprava studijních
Vícepravděpodobnosti, popisné statistiky
8. Modelová rozdělení pravděpodobnosti, popisné statistiky Rozdělení pravděpodobnosti Normální rozdělení jako statistický model Přehled a aplikace modelových rozdělení Popisné statistiky Anotace Klasickým
VíceNáhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.
1. Korelační analýza V životě většinou nesledujeme pouze jeden statistický znak. Sledujeme více statistických znaků zároveň. Kromě vlastností statistických znaků nás zajímá také jejich těsnost (velikost,
Vícez Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin
Příklady k procvičení z Matematické statistiky Poslední úprava. listopadu 207. Konvergence posloupnosti náhodných veličin. Necht X, X 2... jsou nezávislé veličiny s rovnoměrným rozdělením na [0, ]. Definujme
VíceStatistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I
Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I Příklad Tahová síla papíru používaného pro výrobu potravinových sáčků je důležitá charakteristika kvality. Je známo, že síla
VíceRNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 8 Jak analyzovat přežití pacientů.
VíceMÍRY ZÁVISLOSTI (KORELACE A REGRESE)
zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky
VíceStatistika. Regresní a korelační analýza Úvod do problému. Roman Biskup
Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009
Více1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,
KMA/SZZS1 Matematika 1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, operace s limitami. 2. Limita funkce
VícePřednáška X. Testování hypotéz o kvantitativních proměnných
Přednáška X. Testování hypotéz o kvantitativních proměnných Testování hypotéz o podílech Kontingenční tabulka, čtyřpolní tabulka Testy nezávislosti, Fisherůvexaktní test, McNemarůvtest Testy dobré shody
VíceOtázku, kterými body prochází větev implicitní funkce řeší následující věta.
1 Implicitní funkce Implicitní funkce nejsou funkce ve smyslu definice, že funkce bodu z definičního oboru D přiřadí právě jednu hodnotu z oboru hodnot H. Přesnější termín je funkce zadaná implicitně.
VíceEKONOMICKÁ APLIKACE KOMPOZIČNÍHO REGRESNÍHO MODELU
EKONOMICKÁ APLIKACE KOMPOZIČNÍHO REGRESNÍHO MODELU Klára Hrůzová 1,2, Karel Hron 1,2 1 Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, Univerzita Palackého v Olomouci 2 Katedra
VícePRAVDĚPODOBNOST A STATISTIKA. Testování hypotéz o rozdělení
PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz o rozdělení Testování hypotéz o rozdělení Nechť X e náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládeme, že neznáme tvar distribuční funkce
Více6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový.
6. ZÁKLADY STATIST. ODHADOVÁNÍ X={X 1, X 2,..., X n } výběr z rozdělení s F (x, θ), θ={θ 1,..., θ r } - vektor reálných neznámých param. θ Θ R k. Θ parametrický prostor. Dva základní způsoby odhadu neznámého
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
VíceBakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013
Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika Podrobnější rozpis okruhů otázek pro třetí část SZZ Verze: 13. června 2013 1 Úvodní poznámky 6 Smyslem SZZ by nemělo být toliko
VíceOdhady - Sdružené rozdělení pravděpodobnosti
Odhady - Sdružené rozdělení pravděpodobnosti 4. listopadu 203 Kdybych chtěl znát maximum informací o náhodné veličině, musel bych znát všechny hodnoty, které mohou padnout, a jejich pravděpodobnosti. Tedy
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
VíceRNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 3 Jak a kdy použít parametrické a
VíceTesty. Pavel Provinský. 19. listopadu 2013
Testy Pavel Provinský 19. listopadu 2013 Test a intervalový odhad Testy a intervalové odhady - jsou vlastně to samé. Jiný je jen úhel pohledu. Lze přecházet od jednoho k druhému. Například: Při odvozování
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceNormální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními
VíceGrafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan
1 Úvod 1.1 Empirický výzkum a jeho etapy 1.2 Význam teorie pro výzkum 1.2.1 Konstrukty a jejich operacionalizace 1.2.2 Role teorie ve výzkumu 1.2.3 Proces ověření hypotéz a teorií 1.3 Etika vědecké práce
VíceYou created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)
Závislost náhodných veličin Úvod Předchozí přednášky: - statistické charakteristiky jednoho výběrového nebo základního souboru - vztahy mezi výběrovým a základním souborem - vztahy statistických charakteristik
VíceTestování hypotéz o kvalitativních proměnných
Testování hypotéz o kvalitativních proměnných Předchozí kapitoly byly věnovány hodnocení kvantitativních náhodných veličin, u nichž předpokládáme, že mohou nabývat mnoha rozdílných hodnot (v případě výšky
Více