Markovské metody pro modelování pravděpodobnosti

Podobné dokumenty
Spolehlivost soustav

příkladů do cvičení. V textu se objeví i pár detailů, které jsem nestihl (na které jsem zapomněl) a(b u) = (ab) u, u + ( u) = 0 = ( u) + u.

Matematické přístupy k pojištění automobilů. Silvie Kafková září 2013, Podlesí

Greenova funkce pro dvoubodové okrajové úlohy pro obyčejné diferenciální rovnice

4. Aplikace matematiky v ekonomii

Náhodný pokus Náhodným pokusem (stručněji pokusem) rozumíme každé uskutečnění určitého systému podmínek resp. pravidel.

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

13. cvičení z PSI ledna 2017

ROVNICE NA ČASOVÝCH ŠKÁLÁCH A NÁHODNÉ PROCESY. Michal Friesl

a počtem sloupců druhé matice. Spočítejme součin A.B. Označme matici A.B = M, pro její prvky platí:

Pojistná matematika. Úmrtnostní tabulky, komutační čísla a jejich použití. Silvie Kafková

Lineární algebra. Soustavy lineárních rovnic

VYBRANÉ PARTIE Z NUMERICKÉ MATEMATIKY

Operační výzkum. Přiřazovací problém.

10. Soustavy lineárních rovnic, determinanty, Cramerovo pravidlo

1 Projekce a projektory

FP - SEMINÁŘ Z NUMERICKÉ MATEMATIKY. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Maticí typu (m, n), kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru:

1 Determinanty a inverzní matice

Pravděpodobnost a její vlastnosti

Výběrové charakteristiky a jejich rozdělení

ALGEBRA. Téma 5: Vektorové prostory

Statistika II. Jiří Neubauer

1 Báze a dimenze vektorového prostoru 1

Stochastické modely Informace k závěrečné zkoušce

Necht tedy máme přirozená čísla n, k pod pojmem systém lineárních rovnic rozumíme rovnice ve tvaru

Dále budeme předpokládat, že daný Markovův řetězec je homogenní. p i1 i 2

Pravděpodobnost a statistika

Matice. a m1 a m2... a mn

3 Lineární kombinace vektorů. Lineární závislost a nezávislost

SIGNÁLY A LINEÁRNÍ SYSTÉMY

Teorie informace: řešené příklady 2014 Tomáš Kroupa

Vektory a matice. Obsah. Aplikovaná matematika I. Carl Friedrich Gauss. Základní pojmy a operace

Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice

2 Hlavní charakteristiky v analýze přežití

Statistika pro informatiku (MI-SPI) Cvičení č. 6

1 Linearní prostory nad komplexními čísly

Značení 1.1 (posloupnost výsledků pokusu). Mějme posloupnost opakovaných (i závislých) pokusů,

DEFINICE Z LINEÁRNÍ ALGEBRY

10. N á h o d n ý v e k t o r

METRICKÉ A NORMOVANÉ PROSTORY

Lineární algebra : Metrická geometrie

Dnešní látka Opakování: normy vektorů a matic, podmíněnost matic Jacobiova iterační metoda Gaussova-Seidelova iterační metoda

13. Lineární procesy

Matematický ústav Slezské univerzity v Opavě Učební texty k přednášce ALGEBRA II, letní semestr 2000/2001 Michal Marvan. 14.

cv3.tex. Vzorec pro úplnou pravděpodobnost

Úvod do lineární algebry


Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Náhodné jevy. Teorie pravděpodobnosti. Náhodné jevy. Operace s náhodnými jevy

ANTAGONISTICKE HRY 172

a vlastních vektorů Příklad: Stanovte taková čísla λ, pro která má homogenní soustava Av = λv nenulové (A λ i I) v = 0.

PRAVDĚPODOBNOST A STATISTIKA. Odhady parametrů Postačující statistiky

Obsah. Lineární rovnice. Definice 7.9. a i x i = a 1 x a n x n = b,

Náhodné chyby přímých měření

vyjádřete ve tvaru lineární kombinace čtverců (lineární kombinace druhých mocnin). Rozhodněte o definitnosti kvadratické formy κ(x).

1 Řešení soustav lineárních rovnic

Odhad parametrů N(µ, σ 2 )

z = a bi. z + v = (a + bi) + (c + di) = (a + c) + (b + d)i. z v = (a + bi) (c + di) = (a c) + (b d)i. z v = (a + bi) (c + di) = (ac bd) + (bc + ad)i.

Matematika (CŽV Kadaň) aneb Úvod do lineární algebry Matice a soustavy rovnic

Soustavy lineárních rovnic

Řešení. Označme po řadě F (z) Odtud plyne, že

SIGNÁLY A LINEÁRNÍ SYSTÉMY

3. ANTAGONISTICKÉ HRY

Definice. Vektorový prostor V nad tělesem T je množina s operacemi + : V V V, tj. u, v V : u + v V : T V V, tj. ( u V )( a T ) : a u V které splňují

Bodové a intervalové odhady parametrů v regresním modelu

Kapitola 12: Soustavy diferenciálních rovnic 1. řádu

5. Lokální, vázané a globální extrémy

6. Vektorový počet Studijní text. 6. Vektorový počet

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

Diferenciální rovnice

Operační výzkum. Teorie her cv. Hra v normálním tvaru. Optimální strategie. Maticové hry.

a způsoby jejího popisu Ing. Michael Rost, Ph.D.

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti.

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.

y = 0, ,19716x.

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

9 Kolmost vektorových podprostorů

Vlastní čísla a vlastní vektory

f(x) = arccotg x 2 x lim f(x). Určete všechny asymptoty grafu x 2 2 =

Texty k přednáškám z MMAN3: 4. Funkce a zobrazení v euklidovských prostorech

0.1 Úvod do lineární algebry

populace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech.

Lineární algebra : Vlastní čísla, vektory a diagonalizace

NMAI059 Pravděpodobnost a statistika

MATEMATICKÉ PRINCIPY VÍCEROZMĚRNÉ ANALÝZY DAT

Operace s maticemi. 19. února 2018

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

7. Rozdělení pravděpodobnosti ve statistice

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Odhady - Sdružené rozdělení pravděpodobnosti

Fakt. Každou soustavu n lineárních ODR řádů n i lze eliminací převést ekvivalentně na jednu lineární ODR

Afinita je stručný název pro afinní transformaci prostoru, tj.vzájemně jednoznačné afinní zobrazení bodového prostoru A n na sebe.

Aplikace teoretických postupů pro ocenění rizika při upisování pojistných smluv v oblasti velkých rizik

[1] samoopravné kódy: terminologie, princip

SIMULACE SPOLEHLIVOSTI SYSTÉMŮ HROMADNÉ OBSLUHY. Michal Dorda. VŠB - TU Ostrava, Fakulta strojní, Institut dopravy

Transkript:

Markovské metody pro modelování pravděpodobnosti rizikových stavů 1 Markovský řetězec Budeme uvažovat náhodný proces s diskrétním časem (náhodnou posloupnost) X(t), t T {0, 1, 2,... } s konečnou množinou stavů E {1, 2,..., N}. V případě, že X(t) i, budeme říkat, že proces je v čase t ve stavu i, t T, i E. Stavy procesu X(t) mohou popisovat různé rizikové situace a zajímá nás, s jakou pravděpodobností se v čase t sledovaný proces v jednotlivých rizikových situacích vyskytne. Předpokládejme, že sledujeme v souvislosti s pojišt ovacími operacemi zdravotní stav pojištěnců. Pro jednoduchost předpokládejme, že uvažujeme tři možné kategorie zdravotního stavu pojištěnce: 1. aktivní; 2. onemocnělý; 3. hospitalizovaný. Sledování zdravotního stavu sledujeme v diskrétních časových okamžicích, např. ve dnech. Pak tento zdravotní stav lze popsat náhodnou posloupností X(t), t T. Je-li v čase t 2 sledovaný pojištěnec zdravotně aktivní, lze pomocí X(t) tuto situaci zapsat ve tvaru X(2) 1 a říkáme, že v čase t 2 je proces ve stavu 1 (tj. pojištěnec je aktivní). Cílem je popsat dynamiku procesu X(t), tedy popsat pravděpodobnosti stavů p i (t) P (X(t) i) pro i E a t T. V obecné situaci může být dynamika procesu X(t) velmi komplikovaná, mezi veličinami X(0), X(1), X(2),... mohou být složité statistické vazby, tyto veličiny mohou být různě korelované a najít odhad základních charakteristik tohoto procesu a stanovit predikci budoucího vývoje procesu, najít pravděpodobnosti p i (t) pro velká t (zejména v situacích, kdy je k dispozici pouze jediný záznam realizace procesu) může být problém značně obtížný. Je ovšem možné klást na pravděpodobnostní strukturu procesu X(t) jisté zjednodušující předpoklady, které dobře postihnou charakter některých procesů na straně jedné a na straně druhé po matematické stránce celou situaci zjednoduší. Typickým příkladem takového předpokladu je markovská vlastnost sledovaného procesu, která znamená, že pravděpodobnost budoucího vývoje procesu v čase t + 1, známe-li stav procesu v přítomném čase t, už nezávisí na minulém vývoji procesu v časech t 1, t 2,..., 2, 1, 0. Markovskou vlastnost lze formálně vyjádřit pomocí podmíněných pravděpodobností tak, že pro všechna t 0, 1, 2,... a všechny stavy i, j, i t 1,..., i 0 E platí P (X t+1 j X t i, X t 1 i t 1,..., X 0 i 0 ) P (X t+1 j X t i), (1) pokud podmíněná pravděpodobnost vlevo existuje (tj. když P (X t i, X t 1 i t 1,..., X 0 i 0 ) > 0). Splňuje-li proces X(t) vlastnost (1) říkáme, že X(t) je markovský proces s diskrétním časem nebo stručněji, že X(t) je markovský řetězec. Pro pravděpodobnosti (1) pak zavádíme označení p (t, t + 1) P (X t+1 j X t i) a pravděpodobnosti p (t, t + 1), pokud jsou definovány, nazýváme pravděpodobnosti přechodu ze stavu i v čase t do stavu j v t + 1. Někdy se tyto pravděpodobnosti nazývají pravděpodobnosti přechodu 1. řádu, protože jde o pravděpodobnost přechodu za jednu jednotku času. Dále zavádíme podmíněné pravděpodobnosti p (t, t + s) P (X t+s j X t i), které definujeme pro t, t + s T a i, j E a pokud existují, nazýváme je pravděpodobnosti přechodu ze stavu i v čase t do stavu j v čase t + s. Jinak se též nazývají pravděpodobnosti přechodu s-tého řádu. V některých situacích se může stát, že pravděpodobnost přechodu p (t, t+s) nezávisí na časových okamžicích t a t + s, ale pouze na jejich vzdálenosti, tedy na jejich rozdílu s. Pak říkáme, že markovský řetězec X(t) je Operační program Vzdělávání pro konkurenceschopnost Název projektu: Inovace magisterského studního programu Fakulty ekonomiky a managementu Registrační číslo projektu: CZ.1.07/2.2.00/28.0326 PROJEKT JE SPOLUFINANCOVÁN EVROPSKÝM SOCIÁLNÍM FONDEM A STÁTNÍM ROZPOČTEM ČESKÉ REPUBLIKY.

homogenní. V další části tohoto odstavce budeme uvažovat jenom homogenní markovské řetězce a zavedeme následující terminologii a označení: p i (0) P (X(0) i) nazveme počáteční pravděpodobnost stavu i, p(0) (p 1 (0), p 2 (0),..., p N (0)) nazveme počáteční rozdělení stavů markovského řetězce, p i (t) P (X(t) i) nazveme absolutní pravděpodobnost stavu i v čase t, p(t) (p 1 (t), p 2 (t),..., p N (t)) nazveme absolutní rozdělení stavů markovského řetězce v čase t. Dále pro homogenní řetězec platí, že p (t, t + 1) nezávisí na t a můžeme proto místo p (t, t + 1) psát pouze p (1) p. Pravděpodobnost p nazýváme pravděpodobností přechodu homogenního řetězce po jednom kroku a matici p 11, p 12,..., p 1N p 21, p 22,..., p 2N P. p N1, p N2,..., p NN nazýváme maticí pravděpodobností přechodu homogenního markovského řetězce stručně jenom maticí pravděpodobností přechodu. Pro každý řádek matice pravděpodobností přechodu P platí, že N j1 p 1, a protože p 0, i, j E, platí, že matice P je stochastická matice. Pomocí matice pravděpodobností přechodu P a vektoru počátečních stavů p(0) lze jednoduše popsat dynamiku procesu X(t) (tj. jeho konečněrozměrná rozdělení pravděpodobností). Platí P (X(0) i 0, X(1) i 1,..., X(k) i k ) p i0 (0)p i0 i 1 p i1 i 2 p ik 1 i k pro libovolné stavy i 0, i 1,..., i k E. Uvedeného vztahu je možné využít k popisu pravděpodobností přechodu s-tého řádu. Pro homogenní markovský řetězec platí, že p (t, t+s) nezávisí na t, můžeme proto zavést označení p (t, t + s) pro s 1, 2,... a p (0) { 0 pro i j, 1 pro i j. Pravděpodobnosti pak udávají pravděpodobnosti přechodu homogenního řetězce ze stavu i do stavu j po s krocích. Můžeme je zapsat do matice P (s) 11,..., p(s) 1N. N1,..., p(s) NN kterou nazýváme maticí pravděpodobností přechodu homogenního markovského řetězce po s krocích nebo též s-tého řádu. Pomocí vzorce pro celkovou pravděpodobnost a markovské vlastnosti snadno nahlédneme, že platí p (2), P (X(t + 2) j X(t) i) P (X(t+2)j X(t+1) k, X(t) i) P (X(t+1)k X(t) i) P (X(t + 2) j X(t + 1) k)p (X(t + 1) k X(t) i) p kj p ik 2

pro i, j E. Když získaný výsledek zapíšeme v maticovém tvaru, dostaneme Analogicky lze odvodit, že platí P (2) P 2. P (s) P s. Slovně vyjádřeno, matice pravděpodobností přechodu homogenního markovského řetězce po s krocích je rovna s-té mocnině matice pravděpodobností přechodu tohoto řetězce. Ze vzorce pro celkovou pravděpodobnost dostaneme vyjádření absolutní pravděpodobnosti stavu i v čase t ve tvaru p i (t) P (X(t) i) P (X(0) k)p (X(t) i X(0) k) p k (0)p (t) ki, i E. Potom užitím maticového zápisu dostaneme p(t) p(0)p (t) p(0)p t. (2) Vidíme, že absolutní pravděpodobnosti stavů homogenního markovského řetězce v čase t lze jednoduše vyjádřit pomocí počátečních pravděpodobností stavů a matice pravděpodobností přechodu. Z uvedeného vztahu lze snadno získat pravděpodobnosti rizikových stavů sledovaného procesu, když známe počáteční rozdělení stavů a matici pravděpodobností přechodu. Z hlediska dlouhodobého sledování řetězce X(t) je užitečné umět stanovit absolutní pravděpodobnosti stavů p i (t) pro velká t. Tedy pro t je potřeba stanovit lim t p i (t), i E. Vzhledem k (2) závisí tato limita na vlastnostech matice pravděpodobností přechodu P. Lze ukázat, že v případě, kdy existuje přirozené číslo r tak, že r-tá mocnina matice P, tedy matice P r má v některém sloupci jenom kladné prvky, tak existují limity lim t p(t) ik π k, lim t p k(t) π k pro i, k E, přičemž limitní pravděpodobnosti π 1, π 2,..., π N jsou jediným řešením rovnic π k π j p jk, k E a Když položíme π (π 1,..., π N ) a π π 1, π 2,..., π N Π π... π 1, π 2,..., π N..., π π 1, π 2,..., π N j1 lze uvedené limitní vztahy zapsat maticově ve tvaru π j 1. (3) j1 lim P (t) lim P t Π t t a lim p(t) lim p(0)p t π, t t 3

přičemž π je jediným řešením soustavy rovnic π πp, π1 1, (4) kde 1 je sloupcový vektor délky N tvořený samými jedničkami. Vektor π (π 1,..., π N ) pak definuje tzv. stacionární rozdělení pravděpodobností řetězce X(t). Jestliže počáteční rozdělení pravděpodobnosti je stacionární, tj. když p(0) π, pak všechna absolutní rozdělení pravděpodobnosti p(t) jsou stacionární, tj. p(t) π a říkáme, že řetězec je ve statistické rovnováze. Příklad Vyjdeme z předpokladů, že při pojištění motorových vozidel používá pojišt ovna tří kategorizací pojistného: 0 základní pojistné, 1 bonus 30 % a 2 bonus 50 %. Označme X(t) náhodný proces, který značí kategorii pojistného v t-tém pojistném období. Množina stavů tohoto procesu je E {0, 1, 2}. Pojištěnec je zařazen do příslušné kategorie podle toho, jaký počet pojistných událostí nahlásil v předchozím období. V prvním pojistném období je pojištěnec zařazen do kategorie 0 a platí základní pojištění. Jestliže v prvním pojistném období měl pojištěnec bezeškodní průběh, je v následném období zařazen o kategorii výše (získá bonus). Pokud ale uplatní jeden pojistný nárok, je v příštím období zařazen o kategorii níže, při uplatnění více než jednoho pojistného nároku je zařazen o dvě kategorie níže. Předpokládejme, že počet pojistných událostí v pojistném období t je náhodná veličina Y t, t 1, 2.... Potom proces X(t) je definován následovně: X(0) 1 a pro t 1 platí min{x(t) + 1; 2} pro Y t 0, X(t + 1) max{x(t) 1; 0} pro Y t 1, 0 pro Y t > 1. Budeme předpokládat, že náhodné veličiny Y t pro t 1, 2... jsou nezávislé a mají stejné Poissonovo rozdělení s parametrem λ. Pak X(t) je homogenní markovský řetězec s množinou stavů E {0, 1, 2}, počátečním rozdělením pravděpodobností p(0) (1, 0, 0) a maticí pravděpodobností přechodu P 1 e λ e λ 0 1 e λ 0 e λ 1 e λ λe λ λe λ e λ Protože matice P má v prvním sloupci jenom kladné prvky, existuje stacionární rozdělení π lim t p(t) a získáme jej řešením rovnice (3). Když položíme a 0 e λ a a 1 λe λ, dostaneme po dosazení do (3) soustavu rovnic Odtud snadno nalezneme řešení π 0 + π 1 + π 2 1.. π 0 π 0 (1 a 0 ) + π 1 (1 a 0 ) + π 2 (1 a 0 a 1 ), π 1 π 0 a 0 + π 2 a 1, π 2 π 1 a 0 + π 2 a 0, π 0 1 a 0 a 0 a 1 1 e λ λe 2λ 1 λe 2λ, π 1 a 0(1 a 0 ) e λ (1 e λ ) 1 λe 2λ, π 2 a 2 0 e 2λ 1 λe 2λ. 4

Odtud lze odvodit, že když základní výše pojištění za pojistné období je V, zaplatí pojištěnec při bonusu 30 % pro kategorii 1 a při bonusu 50 % pro kategorii 2 v dlouhodobém horizontu za pojišt ovací období částku π 0 V + 0,7π 1 V + 0,5π 2 V. Uvedená částka záleží na parametru λ, který je roven střednímu počtu pojistných událostí pojištěnce. Při dlouhodobém sledování se dá odhadnout dlouhodobým průměrem počtu pojistných událostí pojištěnce za sledovaná pojistná období. Příklady k procvičení 1. Počasí v jisté pobřežní oblasti je jednoduše klasifikováno jako slunečno nebo deštivo. Po slunečném dni následuje opět slunečný den s pravděpodobností 0,9 a po deštivém dni přichází deštivý den s pravděpodobností 0,3. a) Popište popsanou situaci pomocí markovského řetězce. b) Jestliže v pátek bylo slunečno, jaká je pravděpodobnost, že neděle bude opět slunečná? c) Jestliže v pátek bylo slunečno, jaká je pravděpodobnost, že sobota i neděle bude opět slunečná? 2. Předpokládejme, že daná osoba O 1 obdrží zprávu od osoby O 0, že daný rizikový jev A pravděpodobně nastane. Zprávu předá osobě O 2, která ji dále předá osobě O 3 atd. Předpokládejme, že každá z uvažovaných osob tuto zprávu předává v nezměněné podobě s pravděpodobností 1 θ a s pravděpodobností θ předá negaci původní zprávy, 0 < θ < 1. (Lze si představit, že θ je malé číslo, blízké nule.) Otázkou je zjistit pravděpodobnost, že t-tá osoba O t obdrží původní zprávu, že jev A pravděpodobně nastane. modelujte situaci pomocí markovského řetězce. Určete stacionární rozdělení pravděpodobností. 5