Bc. Marika Stroukalová
|
|
- Václav Vít Matějka
- před 6 lety
- Počet zobrazení:
Transkript
1 Univerzita Karlova v Praze Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE Bc. Marika Stroukalová Modelování systémů bonus - malus Katedra pravděpodobnosti a matematické statistiky Vedoucí diplomové práce: RNDr. Lucie Mazurová, Ph.D. Studijní program: Matematika Studijní obor: Finanční a pojistná matematika Praha 213
2 Na tomto místě bych ráda poděkovala vedoucí diplomové práce RNDr. Lucii Mazurové, Ph.D. za užitečné rady, připomínky a nápady při psaní této práce. Také bych chtěla poděkovat celé své rodině za morální podporu, zejména pak Mgr. Davidu Stroukalovi za přínosné podněty při realizaci této práce. Dále děkuji společnosti Wüstenrot pojišt ovna a.s. za poskytnutí statistických dat.
3 Prohlašuji, že jsem tuto diplomovou práci vypracovala samostatně a výhradně s použitím citovaných pramenů, literatury a dalších odborných zdrojů. Beru na vědomí, že se na moji práci vztahují práva a povinnosti vyplývající ze zákona č. 121/2 Sb., autorského zákona v platném znění, zejména skutečnost, že Univerzita Karlova v Praze má právo na uzavření licenční smlouvy o užití této práce jako školního díla podle 6 odst. 1 autorského zákona. V Praze dne Marika Stroukalová
4 Název práce: Modelování systémů bonus - malus Autor: Marika Stroukalová Katedra: Katedra pravděpodobnosti a matematické statistiky Vedoucí diplomové práce: RNDr. Lucie Mazurová, Ph.D., KPMS MFF UK Abstrakt: V této práci se zabýváme tarifními systémy bonus-malus užívanými k úpravě apriorně stanoveného pojistného na základě individuálního škodního průběhu v pojištění odpovědnosti za škodu způsobenou provozem vozidla. Záměrem předložené práce je popsat klasický model pro průchod klienta systémem v podobě Markovova řetězce. Pro každou bonus-malus třídu je stanovena relativní sazba pojistného. Dalším cílem této práce je najít optimální hodnoty pro relativní sazby, zohledňující apriorně stanovené pojistné. Teoretický model, založený na stacionárním rozdělení bonus-malus tříd, aplikujeme na konkrétní systém v České republice s využitím reálných českých dat. Výsledkem praktické části práce je porovnání optimálních a skutečných relativních sazeb a posouzení vhodnosti použití zvoleného teoretického modelu pro český systém bonus-malus. Klíčová slova: bonus-malus systém, apriorní segmentace, stacionární rozdělení, relativní sazba, kvadratická ztrátová funkce Title: Modelling Bonus - Malus Systems Author: Marika Stroukalová Department: Department of Probability and Mathematical Statistics Supervisor: RNDr. Lucie Mazurová, Ph.D., KPMS MFF UK Abstract: In this thesis we deal with bonus-malus tariff systems commonly used to adjust the a priori set premiums according to the individual claims during motor third party liability insurance. The main aim of this thesis is to describe the standard model based on the Markov chain. For each bonus-malus class we also determine the relative premium ( relativity ). Another objective of this thesis is to find optimal values for the relativities taking into account the a priori set premiums. We apply the theoretical model based on the stationary distribution of bonus-malus classes on real-world data and a particular real bonus-malus system used in the Czech Republic. The empirical part of this thesis compares the optimal and the real relativities and assesses the suitability of the chosen theoretical model for the particular bonus-malus system. Keywords: bonus-malus system, a priori segmentation, stationary distribution, relativity, quadratic loss function
5 Obsah Úvod 2 1 Modelování (očekávaného) počtu škod Negativně binomické rozdělení Regresní model počtu škod Odhady parametrů Roční očekávané počty škod Použití Markovova řetězce v BMS Trajektorie řidiče v BMS Pravděpodobnosti přechodu mezi třídami Chování BMS v dlouhém období Konvergence ke stacionárnímu rozdělení Optimální bonus-malus sazby Bayesovské relativity s kvadratickou ztrátovou funkcí Potřeba přidání fiktivních bonus-malus tříd Další možnosti pro stanovení optimálních relativit Praktická část Bonus-malus systémy v České republice Vstupní data Modifikace a zjednodušení českého bonus-malus systému Přechodová pravidla, stacionární rozdělení Relativity Systém -1/Top Závěr 44 Literatura 46 A Odhady parametrů segmentačních tříd 48 B Konvergence ke stacionárnímu rozdělení 5 1
6 Úvod Pojišt ovnyvčeskérepublicepoužívajíkestanovenívýšepojistnéhovautomobilovém pojištění segmentaci na základě apriorní informace o klientech, a následně systém slev (bonusů) a přirážek (malusů) na apriorním (základním) pojistném, zohledňující škodní historii každého řidiče. Bonus-malus systém(bms) se používá zejména v pojištění odpovědnosti za škodu způsobenou provozem vozidla, běžně nazývaném jako povinné ručení. Každý vlastník motorového vozidla, který jej chce provozovat na pozemních komunikacích v České republice, musí mít toto pojištění sjednáno ze zákona, ale může si vybrat, u jaké pojišt ovny z těch, které ho nabízí, povinné ručení uzavře. Naopak pojišt ovna je ze zákona povinna zohlednit předcházející bezeškodní průběh klienta. Český trh v oblasti povinného ručení v současnosti zaznamenává poměrně silný konkurenční boj o zákazníky, apriorní klasifikace i bonus-malus systémy se liší pojišt ovna od pojišt ovny. Účelem použití aposteriorní rizikové klasifikace v podobě bonus-malus systému společně s apriorním segmentováním klientů je vytvoření co nejhomogenějšího pojistného kmene a stanovení pojistného, které bude adekvátně odpovídat skutečnému rizikovému profilu každého řidiče, tj. jeho aktuální očekávané roční škodní frekvenci. Kromě lepšího ohodnocení individuálního rizika má bonus-malus systém sloužit i k nabádání k bezpečnější jízdě a také k odrazení řidičů od hlášení škod malého rozsahu. Bonus-malus systém se skládá z určitého počtu tříd (stupňů, úrovní) relativních sazeb pojistného (bonus-malus sazeb), kdy se klient každý rok zařadí do jedné z nich na základě počtu škodních nároků uplatněných v předchozím roce a stanovených pravidel. Klient pak platí pojistné ve výši součinu sjednané (základní) pojistné sazby a bonus-malus sazby příslušející aktuálnímu zařazení do systému. Cílem této diplomové práce je popsat tradiční přístup s využitím Markovova řetězce pro modelování průchodu klienta systémem bonus-malus tříd, a dále možný způsob stanovení optimálních bonus-malus sazeb pro jednotlivé třídy systému, založený na chování systému v dlouhodobém časovém horizontu. Do výpočtu optimálních sazeb zahrneme apriorní cenovou segmentaci povinného ručení. Důraz bude kladen na praktickou část práce, ve které aplikujeme teoretický model na reálný český systém. Diplomová práce je rozdělena do čtyř kapitol. V kapitole 1 se budeme zabývat použitím vhodného pravděpodobnostního rozdělení pro počet pojistných událostí v pojistném kmeni povinného ručení a vhodného regresního modelu pro odhad očekávaných škodních frekvencí. V kapitole 2 se budeme věnovat klasickému modelu pro pohyb klienta v systému v podobě homogenního Markovova řetězce. Pro popis chování systému v dlouhodobém (teoreticky nekonečném) časovém horizontu použijeme stacionární roz- 2
7 dělení bonus-malus tříd a uvedeme možnou metodu jeho výpočtu. Teoretických výsledků předchozích kapitol bude využito v kapitole 3 k určení optimálních relativních sazeb pojistného (s ohledem na apriorně stanovené pojistné), které dostaneme minimalizováním zvolené ztrátové funkce. Zmíníme se také o nutnosti v některých případech zařadit do stávajícího systému další (smyšlené) třídy. Teoretickýmodelpakimplementujemenavybranýsystémbonus-malusvČeské republice, čemuž je věnována kapitola 4. Budeme tento systém zkoumat, modifikovat a z poskytnutých dat odhadneme neznámé parametry. Na stejná data použijeme také jeden poměrně přísný, hypotetický bonus-malus systém. V závěru aplikační části budeme interpretovat a porovnávat výsledky v podobě zvolených numerických charakteristik obou systémů a provedeme srovnání optimálních bonus-malus sazeb reálného systému se sazbami skutečně používanými. Cílem aplikační části této diplomové práce je odpovědět na otázku, zda-li je zvolený teoretický model vhodný pro český bonus-malus systém. Hlavním teoretickým zdrojem k problematice modelování bonus-malus systémů bude odborná publikace z roku 27, Actuarial Modelling of Claim Counts ([5]), z níž bude vycházet i většina vzorců a značení použitých v této práci. 3
8 Kapitola 1 Modelování (očekávaného) počtu škod Cílem této kapitoly je popsat nejběžněji používané pravděpodobnostní rozdělení počtu škod v povinném ručení a konstrukci odhadů neznámých parametrů z údajů o apriorní segmentaci a počtech škod řidičů. Budeme vycházet zejména z [5, Kapitola 1 a Kapitola 2]. Mějmenpojištěncůvportfoliupovinnéhoručeníurčitépojišt ovny.n i necht je náhodnáveličinapopisujícípočetškodad i jepříslušnárizikováexpozice(smlouva nemusí být platná po celé sledované období) na i-té pojistné smlouvě za jeden rok. Pojišt ovny segmentují řidiče do rizikových tříd na základě tzv. apriorních proměnných (např. věk, bydliště, některé technické údaje o vozidle). U každého pojistníka známe jeho (apriorní) zařazení do určité tarifní třídy, reprezentované náhodným vektorem x i. I po roztřídění klientů do skupin s podobnou rizikovostí ale existují rozdíly v chování jednotlivých řidičů. Tento reziduální efekt (předem neznámé a těžko měřitelné charakteristiky jako jsou např. řidičské zkušenosti, rychlost reflexů apod.) modelujeme pomocí náhodných veličin Θ 1,...,Θ n, které jsou nezávislé a stejně rozdělené s kladným nosičem rozdělení a jednotkovou střední hodnotou. 1.1 Negativně binomické rozdělení Předpokládáme, že náhodná veličina N i má při Θ i θ Poissonovo rozdělení se střední hodnotou λ iθ, přičemž λ i > je očekávaná škodní frekvence a θ relativní riziková úroveň (větší rizikovost pro θ > 1 v porovnání s ostatními řidiči ve stejné rizikové skupině a menší rizikovost pro θ (,1)). Rozdělení počtu škod je v tomto případě definováno pravděpodobnostmi P[N i k, x i,θ i θ] e λ i θ(λ iθ) k, k,1,... k! Parametr λ i jsme označili horním indexem, abychom ho odlišili od roční očekávané frekvence škod λ i. Počet škod na i-té smlouvě pozorujeme za období délky d i, d i (,1), měřené v letech (riziková expozice je minimálně jeden den, maximálně jeden rok), takže střední hodnota počtu škod (odhadnutá a priori) tohoto pojistníka je λ i : d i λ i, 4
9 skutečná střední hodnota (tj. včetně aposteriorního rizikového parametru θ) je E [N i x i,θ i θ] var[n i x i,θ i θ] λ iθ d i λ i θ. Výskyty pojistných událostí na i-té pojistné smlouvě tedy tvoří Poissonův proces s intenzitou λ i θ, tj. počet pojistných událostí za časový interval délky d i má Poissonovo rozdělení se střední hodnotou (λ i θ) d i. Pro počty škod v portfoliu povinného ručení je typická tzv. overdisperze, která vznikne v důsledku použití náhodného parametru Θ respektive Θ i pro i- tého klienta. Overdisperze znamená, že rozdělení počtu škod bude mít větší rozptyl než střední hodnotu. Nejčastěji používaným pravděpodobnostním rozdělením náhodné veličiny N i je negativně binomické rozdělení, které také v této práci uvažujeme. i-tá nezávislá kopie Θ i náhodného parametru Θ má v tomto případě gama rozdělení s kladnými parametry α a a β a, tj. pro všechna i od 1 do n platí Hustota veličiny Θ i má pak tvar Θ i Γ(a,a), E[Θ i ] 1, (1.1) var[θ i ] 1 a. (1.2) f Θi (θ) 1 Γ(a) aa θ a 1 e aθ, θ > (1.3) V praxi hodnotu parametru Θ i neznáme, takže rozdělení počtu škodních nároků i-tého klienta se známou rizikovou třídou lze na základě (1.3) vyjádřit pomocí parametrů a a λ i jako P[N i k x i ] P[N i k x i,θ i θ]f Θi (θ)dθ e λ i θ(λ iθ) k k! (λ i) k a a Γ(a)k! 1 Γ(a) aa θ a 1 e aθ dθ e (a+λ i)θ θ a+k 1 dθ Γ(a+k) ( ) λ k ( ) a i a (1.4) Γ(a)k! a+λ i a+λ i ( )( ) a+k 1 λ k ( ) a i a, k,1,... (1.5) k a+λ i a+λ i K odvození tvaru (1.4) jsme použili substituci (a+λ i)θ y, dθ 1 dy a+λ i 5
10 a funkci gama vyjádřenou integrálem Γ(p) e y y p 1 dy, kde p může být jakékoliv komplexní číslo s kladnou reálnou částí. K (1.5) jsme použili vyjádření gama funkce Γ(p) pomocí faktoriálu (p 1)!. Veličina N i má tedy negativně binomické rozdělení s parametry λ i a a. Dle (1.1) a (1.2) pro ni platí [ ] E[N i x i ] E E[N i x i,θ i ] E[λ iθ i ] λ i E[Θ i ] λ i, (1.6) var[n i x i ] E [ ] [ ] var[n i x i,θ i ] +var E[N i x i,θ i ] E[λ iθ i ]+var[λ iθ i ] λ i E[Θ i ]+(λ i) 2 var[θ i ] E[N i x i ]+(λ i) 21 a > E[N i x i ], (1.7) tedy heterogenita mezi řidiči nemá vliv na očekávanou škodní frekvenci a přidání náhodného efektu Θ i do pravděpodobnostního modelu pro počet výskytů pojistných událostí dobře postihuje vlastnost overdisperze. Existují i další možná pravděpodobnostní rozdělení parametru Θ, např. inverzní Gaussovo (pak máme Poisonovo-inverzní Gaussovo rozdělení jako smíšený pravděpodobnostní model počtu škod) nebo logaritmicko-normální rozdělení, která jsou také (okrajově) představena v [5, Kapitola 1]. 1.2 Regresní model počtu škod K modelování očekávaných škodních frekvencí λ 1,...,λ n použijeme regresi s negativně binomickým rozdělením pro odezvy N 1,...,N n. Předpokládáme nezávislá pozorování N i a známé hodnoty kategoriálních vysvětlujících proměnných x i (1,x i1,...,x im ) vyjádřené jako -1 dummy proměnné. Pro očekávané počty pojistných událostí pak máme λ i d i exp ( x i β ) ( ) m exp log(d i )+β + x ij β j, (1.8) kde log(d i ) je tzv. offset sloužící k úpravě modelu kvůli různým délkám platnosti smluv a β (β,β 1,...,β m ) je vektor neznámých regresních koeficientů (β je koeficient pro referenční rizikovou skupinu). Vektory x i a β tedy uvažujeme jako sloupcové Odhady parametrů 1. Homogenní portfolio Nejdříve na chvíli předpokládejme homogenní portfolio, v kterém i-tý řidič (i 1,...,n)nahlásilběhemobdobídélkyd i celkemk i škod.posloupnostuplatněných škodních nároků tvoří Poissonův proces s intenzitou λ >, takže počet škod 6 j1
11 i-tého řidiče během sledovaného období má rozdělení N i Pois(λd i ). Střední hodnotu počtu škod za jeden rok můžeme odhadnout metodou maximální věrohodnosti. Mějme věrohodnostní funkci L(λ) n P[N i k i ] i1 n i1 e λd (λd i i) k i. k i! Logaritmická věrohodnostní funkce má pak vyjádření ( ) n l(λ) logl(λ) log e λd (λd i i) k i k i1 i! n n ( ) λ d i + (k i log(λ)+logd i ) log(k i!) λ i1 i1 n d i +log(λ) i1 n k i +konstanta, i1 kde konstanta označuje členy nezávislé na λ. Položíme-li první derivaci podle λ rovnu nule, tj. n d i + 1 n k i, λ i1 dostaneme maximálně věrohodný odhad 1 i1 n i1 λ k i n i1 d, (1.9) i tedy očekávaný roční počet škod v homogenním portfoliu s Poissonovým rozdělením můžeme odhadnout metodou maximální věrohodnosti jako podíl celkového počtu škod v portfoliu ku celkové rizikové expozici. 2. Poissonovská regrese, tj. bez zahrnutí parametru Θ V případě, že klienty zařazujeme do rizikových tříd dle apriorních proměnných, ale neuvažujeme zbytkovou heterogenitu v chování řidičů, platí E[N i x i ] var[n i x i ] λ i. Pro Poissonovskou regresi platí vztahy (1.6) a (1.8). Ze záznamů o klientech potřebujeme odhadnout neznámé regresní koeficienty β,β 1,...,β m vektoru β, k čemuž použijeme metodu maximální věrohodnosti. Opět máme ke každému klientovi i pozorování k i nehod během období délky d i. Věrohodností funkce má tvar n n L(β) P[N i k i x i ] e λ (λ i i) k i, k i! i1 1 Druhá derivace podle λ je záporná ( λ 2 n i1 k i < ), takže se skutečně jedná o maximálně věrohodný odhad. 7 i1
12 kde vektor koeficientů β je schován ve vyjádření λ i (viz (1.8)). Logaritmická věrohodností funkce pak bude tvaru ( ) n l(β) logl(β) log e λ (λ i i) k i k i1 i! n ( ) λ i +k i log(λ i) log(k i!) i1 n i1 ( d i exp ( x i β ) ) +k i x i β + konstanta, kde konstanta označuje členy nezávislé na β, přičemž jsme využili vztahu ( log(λ i) log d i exp ( x i β )) log(d i )+x i β. Položíme-li první derivace logaritmické věrohodnostní funkce podle β j pro j,1,...,m rovny nule, tj. n ( d i x ij exp ( x i β ) ) +k i x ij i1 n x ij (k i λ i), j,1,...,m, (1.1) i1 získáme řešením těchto m+1 rovnic maximálně věrohodné odhady pro koeficienty β,β 1,...,β m.odhadyregresníchkoeficientůjsousoftwarovouzáležitostí(rovnice (1.1) se řeší numericky). 3. Regrese s negativně binomickým rozdělením, tj. se zahrnutím parametru Θ Nyní konečně sestavíme věrohodnostní funkci pro parametry β a a v uvažovaném pravděpodobnostním modelu pro počty škod s pravděpodobnostmi tvaru (1.5). Máme n L(β,a) P[N i k i x i ] i1 n (λ i) k i i1 k i! a a (a+λ i) k i a Γ(a+k i ), Γ(a) logaritmickou věrohodnostní funkci pak lze zapsat jako l(β,a) logl(β,a) ( n (λ log i) k i k i1 i! n i1 + log n i1 ) a a (a+λ i) k i a Γ(a+k i ) Γ(a) ( k i log(λ i) log(k i!)+alog(a) (k i +a)log(a+λ i)+ ( ) ( Γ(a+k i ) log Γ(a)) ) ( ( k i x i β (k i +a)log a+d i exp ( x i β ))) + (1.11) + f unkce(a) + konstanta, 8
13 kde f unkce(a) označuje členy, které nejsou závislé na regresních koeficientech, ale jsou závislé na parametru a, a konstanta označuje členy nezávislé jak na vektorovém parametru β, tak na parametru a. Položením prvních (parciálních) derivací (1.11) podle β j pro j,1,...,m rovných nule dostaneme soustavu m+1 rovnic n ( 1 ) k i x ij (k i +a) λ ix ij i1 n x ij (k i λ i i1 a+k i a+λ i a+λ i ), j,1,...,m. Řešením těchto rovnic jsou maximálně věrohodné odhady β, β 1,..., β m, vektorově tedy β. Jak je řečeno v [5], odhadnutý parametr β j představuje efekt j-té nezávislé proměnné včetně vlivu s ní korelujících nepozorovatelných proměnných (skrytých charakteristik řidičů). Maximalizací logaritmické věrohodnostní funkce vzhledem k a pak dostaneme odhad â parametru a. Maximálně věrohodné odhady β a â se získají opět numericky (nelze je explicitně vyjádřit), pomocí zvoleného iteračního algoritmu. V kapitole 4 si povíme, jakou metodu používá program R. Pro iterační proceduru se musí vhodně zvolit počáteční hodnoty parametrů. Jako rozumná startovací hodnota parametru β se jeví maximálně věrohodný odhad z Poissonovské regrese, tj. numerické řešení rovnice (1.1). Označíme ho jako β poc. Vstupní hodnotu parametru a označíme â poc a dostaneme ji momentovou metodou z rovnice pro podmíněný rozptyl (1.7), s použitím vstupní hodnoty β poc. Tedy za použití empirických odhadů rozptylu a střední hodnoty jakožto jejich momentových odhadů postupně dostaneme 1 n n i1 var[n i x i ] E[N i x i ]+(λ i) 2 1 a, ( k i d i exp ( x i β )) 2 1 n k i 1 n ( d i exp ( x i β )) 21 n n a, i i1 n ( ( k i d i exp ( x i β )) 2 ki ( d i exp ( x i β )) ) 21, a i1 tj. dostaneme startovní hodnotu parametru a vyjádřenou jako â poc n i1 n i1(d i exp ( x i βpoc ) ) 2 ( ( k i d i exp ( x i βpoc) ) 2 ki ) Roční očekávané počty škod Jako vstupní hodnoty do vzorců optimálních bonus-malus sazeb, které si představíme v kapitole 4, potřebujeme odhadnout roční očekávané škodní frekvence a určit váhy jednotlivých tarifních tříd, tedy λ k exp ( β + ) m x kj βj exp β + j1 9 m j1 x kj 1 x kj βj, k 1,...,K, (1.12)
14 kde K je počet v portfoliu zastoupených rizikových tříd, exp( β ) je odhadnutá roční očekávaná škodní frekvence pro zvolenou referenční rizikovou skupinu 2, a exp( β j ) pro j 1,...,m představuje efekt j-té tarifní proměnné. Váhu w k k-té rizikové třídy spočteme jako součet rizikových expozic pojistných smluv v této třídě vydělený celkovou rizikovou expozicí portfolia. Necht k-tá tarifní třída zahrnuje t k smluv. Pak platí w k tk i1 d i n i1 d. (1.13) i 2 Např. program R za referenční třídu volí kombinaci kategorií, které jsou u jednotlivých segmentačních kritérií uvedeny na prvních místech ve výčtu používaných kategorií (konkrétní příklad bude popsán v kapitole 4. 1
15 Kapitola 2 Použití Markovova řetězce v BMS Systém bonus-malus je tvořen určitým (konečným) počtem tříd s relativní výší pojistného (bonus-malus sazbou) 1. Každý pojistný rok je motorista zařazen do jedné z bonus-malus tříd na základě počtu škod hlášených během předešlého pojistného roku, přechodových pravidel a znalosti třídy, do které byl přiřazen v předchozím pojistném roce. Průchod pojistníka systémem budeme modelovat pomocí homogenního Markovova řetězce {L n,n N }, jehož stavy představují bonus-malus třídy. Kromě konečnosti a homogenity budeme také předpokládat neperiodičnost stavů a nerozložitelnost Markovova řetězce 2. Budeme vycházet z všeobecného porozumění těmto pojmům, jejichž definice a vlastnosti lze nalézt např. v univerzitních skriptech [8]. V této kapitole vyložíme Markovovy řetězce s ohledem na záměry této práce. Opět se budeme držet struktury a značení hlavního zdroje [5, Kapitola 4]. 2.1 Trajektorie řidiče v BMS Mějme množinu stavů S {1,...,s}, kde stav 1 určuje nejlepší třídu (klient zařazený do této třídy dostane nejvyšší bonus neboli slevu na pojistném) a s nejhorší (v této třídě bude klientovi vyměřen nejvyšší malus neboli maximální přirážka k pojistnému). Trajektorii pojištěnce v systému modelujeme pomocí posloupnosti náhodných veličin L,L 1,L 2,..., kde L n pro časy n,1,... může nabývat hodnot z S a představuje bonus-malus třídu, ve které je klient v časovém intervalu [n,n + 1). L představuje tzv. vstupní třídu pro nového řidiče (do ní je řidič zařazen v čase, tj. když přijde do systému). Vstupní třída je určena spolu s přechodovými pravidly systému 3. Pro počet uplatněných škodních nároků pojištěnce během n-tého pojistného roku mějme náhodnou veličinu N n. Hodnota L n závisí na hodnotách L n 1 a N n a na daných přechodových pravidlech systému. Např. dle [5] může L n splňovat následující stochastickou rekurzivní rovnici { L n max min { L n 1 +(N n pen 1),s } },1, (2.1) 1 Blíže o relativních sazbách pojednává teoretická kapitola 3 a praktická kapitola 4. 2 Nerozložitelnost řetězce znamená, že se lze z každého stavu dostat do ostatních stavů v konečném čase. 3 V České republice je to trochu jinak, viz kapitola 4. 11
16 kdesymbolpenznamenápenalizacivpodoběsestupuodanýpočettřídzakaždou způsobenou škodu, např. pen 2 (viz kapitola 4). V tomto případě za každý bezeškodný rok klient postoupí do sousední lepší třídy, (do stavu L n 1 1), za jednu škodu sestoupí do sousední horší třídy (do stavu L n 1 + 1), při dvou nastalých pojistných událostech se klient v systému posune o tři bonus-malus třídy níže směrem k nejhorší třídě s (přejde do stavu L n 1 +3) atd., s ohledem na to, že pojistník se může dostat nejlépe do stavu 1 a nejhůře do stavu s. Vidíme zde vlastnost bez paměti (markovská vlastnost), charakteristickou pro Markovův řetězec, kdy se budoucí trajektorie odvíjí jen od přítomného stavu. 2.2 Pravděpodobnosti přechodu mezi třídami Zařazování řidičů do jednotlivých tříd probíhá na základě stanovených přechodových pravidel v (konkrétním) systému bonus-malus. Pravidla můžeme zapsat pomocí čtvercových matic T(k) {t ij (k),i,j S}, kde t ij (k) { 1 pro přechod z i-té do j-té třídy pro následující rok, jinak při uplatnění k škod během současného roku. Necht počty pojistných událostí N 1,N 2,... pojistníka v jednotlivých letech jsou nezávislé a poissonovsky rozdělené náhodné veličiny s roční očekávanou škodní frekvencí λ, tj. N n Poiss(λ),n N. Rozdělení veličin L 1,L 2,... závisí na parametru λ představujícím individuální riziko klienta. Nyní můžeme vyjádřit pravděpodobnost přechodu mezi bonusmalus třídami i a j tohoto klienta za jeden pojistný rok jako p ij P[L n+1 j L n i,l n 1 i n 1,...,L i ] P[L n+1 j L n i] P[L n+1 j L n i,n n+1 k]p[n n+1 k L n i] k k t ij (k)e λλk k!, i,j S (2.2) pro všechny časy n N (uvažujeme homogenní Markovův řetězec) a všechny stavy i,...,i takové, že pravděpodobnost první podmínky je kladná. Dále jsme v (2.2) využili markovské vlastnosti a nezávislosti N n+1 na L n, nebot (např.) dle (2.1) závisí veličina L n na hlášených škodách N 1,...,N n a škodní nároky v jednotlivých letech jsou dle předpokladu nezávislé. Všechny pravděpodobnosti z (2.2) uspořádáme do (čtvercové) matice P {p ij,i,j S}. Matice pravděpodobností přechodu P je stochastická matice, nebot p ij jsou nezáporné pro všechny stavy i,j S a platí j S p ij 1 pro všechny i S. 12
17 Pravděpodobnosti p ij tedy můžeme přepsat maticově jako P k T(k)e λλk k!. Ovšem matice P obsahuje pravděpodobnosti přechodu mezi jednotlivými stavy (respektive bonus-malus třídami) Markovova řetězce během jednoho pojistného roku(obecně jednoho období). K dalšímu výkladu budeme potřebovat přechodové pravděpodobnosti za více let. 2.3 Chování BMS v dlouhém období Potřebujeme mít k dispozici pravděpodobnosti přechodu mezi třídami za více pojistných let, tj. pro každé n,m N a i,j S pravděpodobnost přechodu ze třídy i do třídy j za n let p (n) ij P[L m+n j L m i] či v maticovém vyjádření P (n) { p (n) ij,i,j S }. Matice pravděpodobností přechodu P (n) po n krocích, příslušná matici P, je také stochastická (tj. všechny prvky z intervalu (,1) a jednotkové řádkové součty). Dále zavedeme označení pro počáteční rozdělení pravděpodobností(tj. v čase ) zařazení pojistníka do jednotlivých bonus-malus tříd a pro rozdělení tříd v čase n p() {p i () : P[L i],i S} p(n) {p j (n) : P[L n j],j S}. Uvažujeme p() a p(n) jako sloupcové vektory. Nepodmíněné pravděpodobnosti p j (n), nazývané absolutní pravděpodobnosti v čase n ([8]), můžeme vyjádřit jako p j (n) i S p i ()p (n) ij, maticově pak p (n) p ()P (n). Podobně také vyjádříme přechodové pravděpodobnosti po n + 1 krocích jako p (n+1) ij l S p (n) il p lj, (2.3) maticově pak z čehož plyne P (n+1) P (n) P, P (n) P n. Od bonus-malus systému očekáváme, že se stabilizuje v dlouhodobém časovém horizontu. O tom, jak bude systém vypadat po ustálení, se dozvíme prostřednictvím stacionárního rozdělení tříd ([8]): 13
18 Definice 1 (Stacionární rozdělení). Necht {L n,n N } je homogenní Markovův řetězec s množinou stavů S a maticí pravděpodobností přechodu P. Dále necht π {π j,j S} je pravděpodobnostní rozdělení na S, tj. π j pro j S a j S π j 1. Potom π je stacionární rozdělení, pokud platí π j i S π ip ij pro každé j S, nebo v maticovém vyjádření π π P, když uvažujeme π jako sloupcový vektor. Díky předpokladům, které jsme stanovili na začátku pro Markovův řetězec, víme, že stacionární rozdělení existuje právě jedno a platí ([8]) π l lim p (n) n il lim p l (n) > pro všechna i,l S. (2.4) n π l je tedy pravděpodobnost, že motorista s rizikovým parametrem λ skončí v nekonečném horizontu (po ustálení systému) ve třídě l. Stacionární rozdělení tříd nezávisí na tom, jaké je počáteční rozdělení, tj. pomocí matic můžeme(2.4) zapsat jako π Π. lim P (n), (2.5) n π π lim n p(n). Z definice 1 vidíme, že π j i S π ip ij je vlastně (2.3) po aplikování limity pro n na obě strany rovnosti. Přímá metoda pro výpočet π Stacionární rozdělení π můžeme spočítat např. přímou metodou uvedenou v [1]. Mějme matici E složenou z s s jedniček, jednotkovou matici I řádu s a vektor jedniček e délky s. Definice 2 (Regulární stochastická matice). Stochastickou matici nazveme regulární, pokud existuje konečné přirozené číslo n takové, že všechny prvky matice P n jsou kladné. Dle našich vstupních předpokladů jsou všechny stavy Markovova řetězce dosažitelné ze všech stavů po konečném počtu kroků (tj. řetězec je nerozložitelný), tedy matice P splňuje regularitu z definice 2. Věta 1. Mějme matici pravděpodobností přechodu P, o níž předpokládáme, že je regulární. Potom je matice I P +E invertibilní a platí Důkaz nalezneme v [1]. π e (I P +E) 1. (2.6) 14
19 2.3.1 Konvergence ke stacionárnímu rozdělení Bonus-malus systém se dostane do rovnovážného stavu bez ohledu na výchozí rozdělení tříd, každopádně zvolené počáteční rozdělení má vliv na to, jak rychle se bude systém stabilizovat. Rozdělení tříd se bude blížit stacionárnímu rozdělení tím rychleji (systém se ustálí za kratší dobu), čím blíže bude počáteční rozdělení stacionárnímu rozdělení. Dle [5] či [11] můžeme systém považovat za ustálený za n let, jestliže p l (n ) π l K n l S l S p i ()p (n ) il π l < ǫ.5, (2.7) i S pokud ovšem známe očekávaný roční počet škod λ. Pro náhodně vybraného řidiče z pojistného kmene, tj. s neznámou očekávanou roční škodní frekvencí λ k příslušející rizikové třídě k, do které je řidič zařazen na základě apriorních informací, a s neznámou relativní rizikovou úrovní θ, rychlost konvergence zavedeme v následující kapitole. 15
20 Kapitola 3 Optimální bonus-malus sazby Na úvod této kapitoly objasníme pojem relativita 1. Relativitu neboli relativní sazbu pojistného v l-té třídě systému bonus-malus značíme r l a interpretujeme ji následovně: motorista, nacházející se v l-té bonus-malus třídě, platí pojistné rovné součinu základního(apriorního) pojistného příslušejícího segmentační třídě, do které je zařazen při příchodu do systému na základě apriorních proměnných,atétorelativnívýšepojistného,čiliplatír l 1%zapriorníhopojistného. Cílem této kapitoly je představit jeden z možných způsobů, jak lze optimálně nastavit relativní sazby r l se zahrnutím apriorní segmentace do modelu. K problematice optimálních relativních (bonus-malus) sazeb budeme přistupovat hlavně na základě [5, Kapitola 4]. Chceme, aby klienti z dlouhodobého hlediska platili pojistné co nejvíce odpovídající jejich aktuální (ale neznámé) škodní frekvenci, tedy jejich skutečnému rizikovému profilu. 3.1 Bayesovské relativity s kvadratickou ztrátovou funkcí Mějme náhodně vybraného řidiče z pojistného kmene, u kterého neznáme očekávaný počet škod na základě apriorní segmentace ani relativní rizikovou úroveň. Zavedeme pro něj tedy dvě náhodné veličiny dle [5]: Λ - představuje (apriorně) očekávanou roční škodní frekvenci Θ - představuje relativní výši pojistného. Řidič pak bude mít aktuální (neznámou) roční očekávanou škodní frekvenci ΛΘ. O veličinách Λ a Θ předpokládáme, že jsou vzájemně nezávislé. V první kapitole jsme odhadli roční očekávané počty událostí λ k dle (1.12) a spočetli váhy w k dle (1.13) pro tarifní třídy k 1,...,K. Veličina Λ tedy může nabývat hodnot λ 1,..., λ K s pravděpodobnostmi Dále zavedeme náhodnou veličinu P[Λ λ 1 ] w 1,...,P[Λ λ K ] w K. (3.1) L - představuje bonus-malus třídu, v které se ustálí náhodně vybraný motorista v nekonečném časovém horizontu. 1 Relativity - překlad z anglického výrazu relativities. 16
21 Vzorce pro optimální relativity, které zde za chvíli představíme, jsou založeny nastacionárnímrozdělení.proúčelydalšíhovýkladumístoπ budemepsátπ( λ k θ) pro zdůraznění, že se jedná o stacionární rozdělení bonus-malus tříd klienta seznámouhodnotouaktuálníhoročníhopočtuškod λ k θ(tosamépropravděpodobnosti přechodu či absolutní pravděpodobnosti). Pravděpodobnost, že klient s tímto rizikovým profilem bude po (nekonečně) dlouhém období zařazen do l-té bonusmalus třídy, je P[L l Λ λ k,θ θ] π l ( λk θ ), l S, nepodmíněné pravděpodobnosti výskytu jednotlivých hodnot veličiny L určíme dle vzorce P[L l] K P[L l Λ λ k ]P[Λ λ k ] k1 K k1 K w k w k k1 P[L l Λ λ k,θ θ]f Θ (θ)dθ π l ( λk θ ) f Θ (θ)dθ, l S, (3.2) kdef Θ (θ)jehustotaneznámérelativnísazbyθ,onížvtétoprácipředpokládáme, že pochází z gama rozdělení s jednotkovou střední hodnotou, tedy s hustotou ve tvaru (1.3). Pravděpodobnosti P[L 1] až P[L s] lze také interpretovat jako podíly pojistníků v jednotlivých bonus-malus třídách po uvedení systému do rovnovážného stavu. Optimální relativity dostaneme minimalizováním ztrátové funkce. Zvolili jsme kvadratickou ztrátovou funkci, tedy chceme takové hodnoty, pro které je průměrná čtvercová odchylka skutečné 2 (neznámé) relativní sazby pojistného Θ od odhadnuté relativní sazby r L minimální. Kvadratická ztrátová funkce má tedy tvar MSE(r L ) E [ (Θ r L ) 2] s E[(Θ r L ) 2 L l]p[l l] l1 s l1 s l1 K k1 w k (θ r l ) 2 P[L l Θ θ]f Θ (θ)dθ K (θ r l ) 2 P[L l Θ θ,λ λ k ]P[Λ λ k ]f Θ (θ)dθ k1 s ( ) (θ r l ) 2 π l θ λk fθ (θ)dθ. (3.3) l1 Ztrátovou funkci jsme označili MSE podle anglického výrazu mean squared error. 2 V publikaci [5] se píše o veličině Θ jako o true relative premium, můžeme ji tedy chápat jako spravedlivou či správnou relativní pojistnou sazbu. 17
22 Pomocné výsledky: Bayesův vzorec: aposteriorní rozdělení Θ (za podmínky, že veličiny L a Λ nabývají konkrétních hodnot) pomocí apriorního rozdělení Θ společně s na ní nezávislou veličinou Λ (tj. pomocí apriorní informace o Θ vyjádřené hustotou (1.3) a marginálního rozdělení Λ v podobě (3.1)) vyjádříme prostřednictvím aposteriorní hustoty g(θ L l,λ λ k ) veličiny Θ jako g(θ L l,λ λ k ) P[L l,λ λ k Θ θ]f Θ (θ) P[L l,λ λ k ] P[L l Θ θ,λ λ k ]P[Λ λ k ]f Θ (θ) P[L l,λ λ k ] π ( ) l θ λk wk f Θ (θ) P[L l,λ λ k ]. Podmíněná střední hodnota parametru Θ pak bude E[Θ L l,λ λ k ] Optimální relativity w k θg(θ L l,λ λ k )dθ ( ) π l θ λk θ P[L l,λ λ k ] f Θ(θ)dθ. (3.4) Minimalizováním kvadratické ztrátové funkce (3.3) dostaneme pro každou bonus-malus třídu l optimální relativní sazbu r l rovnou střední hodnotě relativního rizikového parametru Θ za podmínky, že náhodný řidič bude v nekonečném horizontu zařazen do této třídy, tj. bayesovský odhad neznámého parametru Θ. S pomocí (3.2) a (3.4) tak získáme optimální relativity r l E[Θ L l] [ ] E E[Θ L l,λ] L l K E[Θ L l,λ λ k ]P[Λ λ k L l] k1 K k1 w k ( ) π l θ λk θ P[L l,λ λ k ] f Θ(θ)dθ P[L l,λ λ k ] P[L l] K k1 w ( ) k θπ l θ λk fθ (θ)dθ K k1 w ( ), l S. (3.5) k π l θ λk fθ (θ)dθ 18
23 Finanční rovnováha Pro střední hodnotu veličiny r L odvodíme E[r L ] s r l P[L l] l1 K s k1 w ( ) k θπ l θ λk fθ (θ)dθ K k1 w ( ) k π l θ λk fθ (θ)dθ l1 K k1 K w k w k l1 K k1 ( s ( ) ) θ π l θ λk f Θ (θ)dθ θ 1 f Θ (θ)dθ w k k1 k1 k1 π l ( λk θ ) f Θ (θ)dθ K K w k E[Θ] w k 1 1. Střední hodnota relativity r L je 1 neboli 1% 3, což znamená, že bourající řidiči zaplatí na pojistném více v porovnání s těmi, kteří jezdí bez nehod v rámci téže segmentační skupiny, ale v součtu pojišt ovna od klientů vybere stejnou částku jako kdyby optimální bonus-malus systém nepoužívala. Konvergence ke stacionárnímu rozdělení náhodně vybraného řidiče V sekci jsme se zmiňovali o rychlosti konvergence ke stacionárnímu rozdělení pojištěnce s konkrétní rizikovostí. Pro náhodně vybraného jedince z portfolia budeme systém bonus-malus považovat za stabilizovaný za n let, pokud K n s [P[L n l] P[L l] l1 s K l1 l1 k1 s K k1 w k w k ( p l (n ) ( ) ( ) ) θ λ k πl θ λk f Θ (θ)dθ ( i S kde opět uvažujeme ǫ.5. p i () ( θ λ k ) p (n ) il ( ) ( ) ) θ λk πl θ λk f Θ (θ)dθ < ǫ, (3.6) 3 Uvedený výsledek plyne rovněž z E[r L ] E [ ] E[Θ L ] E[Θ] 1. 19
24 Apriorní a aposteriorní sazbování Dle [5] můžeme vzájemné ovlivňování apriorního a aposteriorního sazbování popsat pomocí střední hodnoty aposteriorního rozdělení Λ, když víme, v které bonus-malus třídě v dlouhodobém horizontu náhodně vybraný řidič skončí. Se znalostí apriorního rozdělení Λ (3.1) a s pomocí (3.2) dostaneme E[Λ L l] K λ k P[Λ λ k L l] k1 K k1 λ k P[L l Λ λ k ]P[Λ λ k ] P[L l] K k1 λ k w k π l ( λk θ ) f Θ (θ)dθ K k1 w k π l ( λk θ ), l S. (3.7) f Θ (θ)dθ Intuitivně očekáváme, že tato podmíněná střední hodnota, podobně jako optimální bonus-malus sazba, bude rostoucí funkcí l, což ale nemusí vzhledem k různým speciálním přechodovým pravidlům obecně platit. Předpokládejme nyní rostoucí průběh střední hodnoty aposteriorního rozdělení Λ a střední hodnoty aposteriorního rozdělení Θ v závislosti na l. Mějme klienta s pozorovatelnými charakteristikami beznehodového řidiče. Při uzavření pojistné smlouvy je tento klient zařazen do tarifní skupiny s nízkým základním pojistným, tj. pojišt ovna ještě před započetím škodního průběhu očekává, že tento klient nebude způsobovat mnoho škod a adekvátně ho tímto (apriorně) ocení. Pak mějme klienta s apriorním profilem nehodového řidiče. Ten bude na počátku zařazen do skupiny s vysokým základním pojistným, nebot pojistitel očekává vysokou škodní frekvenci. Bude-li se klient po ustálení systému vyskytovat v nejlepší bonusové třídě, bude střední hodnota Λ nízká a klient bude aposteriorně oceněn, protože této třídě odpovídá nízká optimální relativní pojistná sazba. Bude-li se klient v dlouhodobém horizontu pohybovat v malusových třídách, bude střední hodnota Λ vysoká a klient bude pojišt ovnou aposteriorně penalizován v podobě vysokých relativních sazeb pojistného, příslušejících těmto třídám. V této práci se zabýváme stanovením optimálních relativních pojistných sazeb, které do výpočtu zahrnují apriorní segmentaci řidičů. Oproti relativitám, které při výpočtu neberou v úvahu tuto segmentaci, zaznamenávají vždy nižší hodnoty v případě malusových tříd (tj. nižší přirážky k základnímu pojistnému) a vyšší hodnoty v třídách bonusových (tj. nižší slevy na základním pojistném), nebot klienti jsou pojistitelem již částečně oceněni či penalizováni apriorně, tj. než u něj započnou svůj škodní průběh. Tuto skutečnost dokládají i různé příklady uvedené v [5]. 3.2 Potřeba přidání fiktivních bonus-malus tříd Některé systémy bonus-malus jsou zkonstruovány tak, že ve stávající podobě nelze průchod klienta takto definovaným systémem modelovat pomocí Markovova 2
25 řetězce (nesplňují markovskou vlastnost). Je potřeba přidat do systému fiktivní třídy tak, aby byly splněny předpoklady, které jsme zmínili v úvodu kapitoly 2. V publikaci [5, Podkapitola 4.7], je tato problematika popsána v souvislosti se speciálním bonusovým pravidlem v dřívějším jednotném belgickém bonusmalus systému. V kapitole 4 se budeme zabývat konkrétním systémem jedné české pojišt ovny, kde bude také potřeba systém bonus-malus tříd mírně upravit, takže na tomto místě popíšeme problematiku pouze teoreticky. Máme nějaký systém bonus-malus s množinou tříd S {1,...,s}. Třídy, které je potřeba upravit, rozdělíme do podtříd, takže ke každé třídě l z S máme určitýpočetpodtřídoznačenýpísmenemf l.pokudjsmekněkterétříděinepřidávali žádné fiktivní třídy, bude f i 1. Místo upravované třídy l pak do výpočtu stacionárního rozdělení budou vstupovat fiktivní třídy, které značíme l j (j od 1 dof l ),uostatníchtřídponechávámepůvodníznačeníl.maticepravděpodobností přechodu pak bude mít rozměry ( s l1 f l) ( s l1 f l) namísto s s, vektor stacionárních pravděpodobností pak délku s l1 f l oproti původní délce s. Optimální relativity Optimální relativní sazby pojistného r l pro l S {1,...,s} dostaneme opět jako argument minima kvadratické ztrátové funkce, definované v (3.3), ovšem s omezující podmínkou r l r l 1 r l fl, l 1,...,s, (3.8) protože relativity stále počítáme pro původní počet bonus-malus tříd a tedy všechny podtřídy příslušné jedné, takto modifikované, třídě mají stejnou relativní sazbu. Dle [3] pak v upraveném systému určíme optimální relativní sazby pojistného podle vzorce r l K k1 w k θ f l j1 π ) l j( θ λk fθ (θ)dθ K k1 w fl k j1 π ), l S. (3.9) l j( θ λk fθ (θ)dθ Pro střední hodnotu r L opět odvodíme E[r L ] s r l P[L l] l1 K s k1 w k K k1 w k l1 K k1 K k1 w k w k θ f l j1 π l j( θ λk ) fθ (θ)dθ fl j1 π l j( θ λk ) fθ (θ)dθ ( s f l ( ) ) θ π l j θ λk f Θ (θ)dθ l1 j1 θf Θ (θ)dθ K w k E[Θ] k1 K k1 w k K w k 1, k1 21 f l j1 ( ) π l j θ λk fθ (θ)dθ
26 k čemuž jsme využili nového vyjádření rozdělení pravděpodobností původních s hodnot veličiny L ve tvaru P[L l] K k1 w k f l j1 π l j ( θ λk ) fθ (θ)dθ, l S. (3.1) ( ) Tedy stačí zaměnit pravděpodobnosti π l θ λk za součet složek vektoru stacionárních pravděpodobností přes všechny podtřídy příslušející modifikované třídě l, tj. za f l j1 π ) l j( θ λk. To samé platí pro podmíněnou střední hodnotu veličiny Λ, kterou v situaci s přidanými podtřídami vyjádříme jako K k1 λ k w fl k j1 π ) l j( θ λk fθ (θ)dθ E[Λ L l] K k1 w k fl j1 π l j( θ λk ) fθ (θ)dθ, l S. (3.11) 3.3 Další možnosti pro stanovení optimálních relativit Existují také jiné způsoby, jak stanovit optimální relativní sazby pojistného, jiné ztrátové funkce nebo jiné předpoklady, např. Lineární relativity jako rostoucí funkce proměnné l, tj. ve tvaru r lin l α+βl, β >,l S, které dostaneme minimalizováním ztrátové funkce. V případě kvadratické ztrátové funkce minimalizujeme [ (Θ r ) lin 2 ] [ E L E (Θ α βl ) 2]. Odvození tvaru optimálních lineárních relativit najdeme např. v [7]. Výhodou linearizace relativit je pravidelnost růstu r lin l vzhledem ke třídě l. Geometrické relativity r geo l αβ l s kladnými parametry α a β, představené např. v[1] jako alternativa k lineárním relativitám, hledaná proto, že lineární relativní sazby pro nejlepší bonusové třídy mohou (v případě značné heterogenity mezi klienty i po apriorním roztřídení) teoreticky vyjít záporné. Relativity s exponenciální ztrátovou funkcí, která je tvaru [ ] E exp( c(θ r L )), kde parametr c > určuje přísnost bonus-malus systému. Optimální relativity s exponenciální ztrátovou funkcí se blíží relativitám s kvadratickou ztrátovou funkcí pro parametr c blížící se zprava k nule. Čím vyšší je hodnota c, tím je systém méně přísný, tj. snižují se přirážky na pojistném. Při vysoké hodnotě parametru c jsou ale i bonusy nižší. Volbou tohoto parametru může pojišt ovna zpřísnit nebo naopak zjemnit aposteriorní úpravy pojistného. Tato ztrátová funkce dává větší důležitost chybám z nadhodnocení odhadnuté relativity (r L > Θ) než na chyby vzniklé z podhodnocení ([5]). Popis systémů s exponenciální ztrátovou funkcí lze nalézt např. v [4]. 22
27 V této práci předpokládáme, že náhodná veličina Λ, reprezentující neznámou apriorně očekávanou roční škodní frekvenci, se nemění v čase a tedy můžeme použít tradiční přístup s použitím homogenního Markovova řetězce a stacionárního rozdělení. Systémům se stochastickou migrací mezi segmenty je věnován stejnojmenný článek v [2]. 23
28 Kapitola 4 Praktická část Teoretické poznatky předchozích kapitol nyní aplikujeme na reálný bonusmalus systém vybrané pojišt ovny v České republice a reálná data, která nám poskytla tato pojišt ovna. Hlavním cílem této kapitoly je na základě údajů o počtech pojistných událostí a použité segmentaci řidičů stanovit optimální bonus-malus sazby pro analyzovaný systém a porovnat je se sazbami, které pojišt ovna aktuálně používá. Modelování a výpočty budeme realizovat pomocí statistického softwaru R (verze 3..1). Program R a všechny knihovny(balíčky) jsou dostupné z centrálního repozitáře CRAN. Budeme čerpat z dokumentace k jednotlivých knihovnám, zejména [9] a [6], a také pro nás bude užitečný materiál [14] o implementaci regresních modelů v R. 4.1 Bonus-malus systémy v České republice Teoretická část této práce je, jak již bylo výše uvedeno, založena na publikaci [5], kde autoři ilustrovali teoretické poznatky na belgických datech (z roku 1997), týkající se smluv povinného ručení jednotného systému bonus-malus. V České republice není předepsán jednotný systém přiznávání bonusů a uplatňování malusů v povinném ručení, každá pojišt ovna může na český trh povinného ručení přijít s vlastním systémem. Pojišt ovny mezi sebou soutěží ve vytváření modelů pro apriorní sazbování a na rozdíl od [5] si také konkurují v nabídce bonusů a malusů. V České republice je používán zcela jiný princip, založený na tzv. rozhodné době. Pro popis takového systému jsme vybrali systém bonus-malus povinného ručení, který používá pojišt ovna Wüstenrot. Na tomto místě vycházíme přímo z pojistných podmínek pojišt ovny [12], veřejně dostupných na internetu. Rozhodná doba je doba nepřerušeného trvání pojištění odpovědnosti pojistníka, která se počítá v celých ukončených měsících, snížená za každou pojistnou událost o 24 měsíců. Bonus je sleva na pojistném za kladnou rozhodnou dobu. Malus je přirážka k pojistnému za zápornou rozhodnou dobu. Při uzavírání pojistné smlouvy se započítává rozhodná doba a přiznává bonus resp. uplatňuje malus podle údajů v databázi škod České kanceláře 24
29 pojistitelů. Přiznání bonusu, resp. uplatnění malusu v průběhu pojištění odpovědnosti se uskutečňuje na základě vyhodnocení rozhodné doby a zohlední se v předpisu pojistného nejpozději na následující pojistné období. Pojišt ovna Wüstenrot používá systém bonus-malus, znázorněný v tabulce 4.1. Stupeň bonusu Rozhodná doba Bonus (sleva) v měsících B1 12 a více 6% B9 18 až % B8 96 až 17 5% B7 84 až 95 45% B6 72 až 83 4% B5 6 až 71 3% B4 48 až 59 2% B3 36 až 47 15% B2 24 až 35 1% B1 12 až 23 5% Základní stupeň Rozhodná doba Bonus (sleva) v měsících Z až 11 % Stupeň malusu Rozhodná doba Malus (přirážka) v měsících M1 12 až 1 3% M2 36 až 13 9% M3 37 a více 15% Tabulka 4.1: Systém bonus-malus používaný pojišt ovnou Wüstenrot pro povinné ručení. Systémztabulky4.1mácelkem14stupňů(tříd);ztoho1bonusových(klient dostane slevu na pojistném), jeden základní a tři malusové (klientovi je vyměřena přirážka k základnímu pojistnému). Při stanovování pojistného pro další pojistný rok se hodnotí individuální škodní průběh řidiče v předchozích dvanácti měsících. Za každý beznehodový rok řidič dostane bonus v procentuální výši odpovídající jeho aktuálnímu zařazení v systému. Při dlouholetém bezeškodním průběhu může klient dostat slevu až 6%. Pojišt ovna Wüstenrot nehodnotí jednu pojistnou událost příliš přísně, když se klientovi jen sníží jeho rozhodná doba a na začátku dalšího období sestoupí v systému maximálně o jeden stupeň. Při častém hlášení škod pojišt ovně ale může platit až o 15% více než je jeho základní pojistné, stanovené při uzavření pojistné smlouvy. Když klient změní pojišt ovnu, dají se přesunout jeho bonusy získané u dřívějšího pojistitele. Bohužel, pokud je jeho aktuální rozhodná doba záporná, změnou pojišt ovny se nevyhne přesunu jeho malusu. V České republice totiž od funguje centrální Databáze škod povinného ručení, spravovaná Českou kanceláří pojistitelů, jak jsme již zmínili výše. Databáze obsahuje historická data počínaje 25
30 dnem 1.1.2, kdy skončil monopol České pojišt ovny na poskytování tohoto pojištění. Nový klient se tedy do systému zařadí podle jeho aktuální rozhodné doby. Pokud osoba uzavírá svou první smlouvu o povinném ručení, je její rozhodná doba měsíců a tedy se zařadí do základní bonus-malus třídy (Základní stupeň). Vzniká tu jeden zásadní problém: rozhodná doba může být v nekonečném horizontu nekonečná a to kladná i záporná, tedy český systém bude třeba modifikovat, aby se dal průchod klienta systémem modelovat pomocí homogenního Markovova řetězce. Celkově bude nutné systém, definovaný pomocí rozhodné doby, upravit tak, aby se dal převést do řeči stavů Markovových řetězců a aby byly splněny všechny předpoklady na něj kladené. 4.2 Vstupní data Data jsme získali s laskavým svolením pojišt ovny Wüstenrot. Máme k dispozici údaje k celkem n pojistným smlouvám povinného ručení za rok 212, tj. ke smlouvám, které byly během kalendářního roku 212 platné alespoň jeden den. Ke každé smlouvě i, i 1,...,n známe její expozici v riziku, tj. po jakou část roku 212 byla v platnosti...v teoretické části práce jsme značili d i početpojistnýchudálostívroce212...značilijsmek i jakorealizaciveličiny N i používanou třídu bonusu tj. do jaké bonus-malus třídy je klient zařazen pro příští období, po zohlednění počtu škod v roce 212. Ke smlouvám povinného ručení používáme (apriorní) cenovou segmentaci podle frekvence placení pojistného, rozlišování mezi fyzickou a právnickou osobou, věku a místa bydliště majitele auta. Měli jsme původně k dispozici více apriorních proměnných, ale některé jsme vyřadili z důvodu velké výpočetní náročnosti. Vyřadili jsme takové proměnné, které se zdály být nejméně statisticky významné pro počty škod (např. analýzou rozptylu v R). Výsledky optimálních sazeb byly hodně podobné, at jsme tyto proměnné použili či nikoliv. V této práci není naším úkolem určit optimální apriorní segmentaci, nýbrž optimální aposteriorní bonusmalus sazby, takže budeme brát upravenou a zjednodušenou segmentaci podle čtyř kritérií jako daný předpoklad. V programu R si pro lepší názornost označíme apriorní proměnné (segmentační kritéria) a příslušné kategorie jako frekvence placení: proměnná FREKV s kategoriemi obecně zapsanými jako fr1 až fr3 fyzická/právnická osoba: proměnná FO PO s dvěma kategoriemi o1 a o2 věk řidiče: proměnná VEK se čtyřmi kategoriemi vek1 až vek4 bydliště řidiče: proměnná REGION s pěti kategoriemi reg1 až reg5. Dále pak v R označíme rizikovou expozici, nabývající hodnot mezi a 1, proměnnou EXPOZICE 26
31 počet pojistných událostí proměnnou POCET PU. V R pracujeme s výchozím formátem dat v této podobě: data.frame : obs. of 6 variables: $ FREKV : Factor w/ 3 levels "fr1","fr2","fr3": $ FO_PO : Factor w/ 2 levels "o1","o2": $ EZPOZICE: num $ VEK : Factor w/ 4 levels "vek1","vek2",..: $ REGION : Factor w/ 5 levels "reg1","reg2",..: $ POCET_PU: int... Za rok 212 máme celkovou rizikovou expozici , tj. součet dob platnosti na smlouvách. Pojistných událostí máme celkem Kdybychom uvažovali homogenní pojistný kmen bez apriorní segmentace, dostali bychom průměrnou roční škodní frekvenci jako λ n i1 k i n i1 d i , viz podkapitola 1.2.1, bod 1., odhad (1.9). Hodnota 3.33% se zdá být celkem malá, v případě 1 totožných smluv jsoucích v platnosti po celý rok očekáváme vznik 3.33 pojistných událostí za rok. Když se vrátíme k našim pozorováním, tak v % případech, tj. ve valné většině, nedošlo během sledovaného roku k žádné nahlášené dopravní nehodě, na 2.53% pojistných smlouvách došlo k jedné pojistné události,.14% řidičů hlásilo dvě nehody a zanedbatelných.4% smluv zaznamenalo tři pojistné události. K více než třem škodám nedošlo u žádného klienta. Odhad parametrů v R Pro počet pojistných událostí, jak jsme psali v kapitole 1, používáme negativně binomickou regresi. Není to klasický zobecněný lineární model (GLM, generalized linear model) s negativně binomickým rozdělením závisle proměnné, ale spíš rozšíření GLM s odhadováním parametrů modelu metodou maximální věrohodnosti se zahrnutím přidaného parametru a. Hodnotu overdisperzního parametru a, znamenajícího převrácenou hodnotu rozptylu náhodného parametru Θ, neznáme, a je tedy třeba ji odhadnout z dat. Taktéž neznámé regresní koeficienty β,...,β m z (1.8) musíme odhadnout z dat. Dle [14] v případě, kdy neznáme parametr a, není tedy negativně binomická regrese speciálním případem GLM, nicméně maximálně věrohodné odhady mohou být snadno spočítány opětovným použitím GLM metodologie - iteračním odhadováním β, když známe a, a naopak. To vede k maximálně věrohodným odhadům pro oba parametry β a a, které mohou být spočteny použitím funkce glm.nb() z balíčku (knihovny) MASS ([9]). Parametry modelu odhadneme pomocí příkazu glm_pov <- glm.nb(pocet_pu ~ FREKV+REGION+ FO_PO+VEK+offset(log(EXPOZICE)), data pov) 27
Matematické přístupy k pojištění automobilů. Silvie Kafková. 3. 6. září 2013, Podlesí
Matematické přístupy k pojištění automobilů Silvie Kafková 3. 6. září 2013, Podlesí Obsah 1 Motivace 2 Tvorba tarifních skupin a priori 3 Motivace Obsah 1 Motivace 2 Tvorba tarifních skupin a priori 3
Markovské metody pro modelování pravděpodobnosti
Markovské metody pro modelování pravděpodobnosti rizikových stavů 1 Markovský řetězec Budeme uvažovat náhodný proces s diskrétním časem (náhodnou posloupnost) X(t), t T {0, 1, 2,... } s konečnou množinou
Kredibilitní pojistné v pojištění automobilů. Silvie Zlatošová září 2016, Robust
Silvie Zlatošová 11. - 16. září 2016, Robust Obsah 1 Motivace a cíl 2 Tvorba apriorních tarifních skupin 3 Teorie kredibility 4 Aplikace aposteriorních korekcí Motivace a cíl Obsah 1 Motivace a cíl 2 Tvorba
Pojistná matematika 2 KMA/POM2E
Pojistná matematika 2 KMA/POM2E RNDr. Ondřej Pavlačka, Ph.D. pracovna 5.052 tel. 585 63 4027 e-mail: ondrej.pavlacka@upol.cz web: http://aix-slx.upol.cz/~pavlacka (informace + podkladové materiály) Konzultační
Apriorní rozdělení. Jan Kracík.
Apriorní rozdělení Jan Kracík jan.kracik@vsb.cz Apriorní rozdělení Apriorní rozdělení (spolu s modelem) reprezentuje informaci o neznámém parametru θ, která je dostupná předem, tj. bez informace z dat.
3 Bodové odhady a jejich vlastnosti
3 Bodové odhady a jejich vlastnosti 3.1 Statistika (Skripta str. 77) Výběr pořizujeme proto, abychom se (více) dověděli o souboru, ze kterého jsme výběr pořídili. Zde se soustředíme na situaci, kdy známe
AVDAT Nelineární regresní model
AVDAT Nelineární regresní model Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Nelineární regresní model Ey i = f (x i, β) kde x i je k-členný vektor vysvětlujících proměnných
PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady
PRAVDĚPODOBNOST A STATISTIKA Bayesovské odhady Bayesovské odhady - úvod Klasický bayesovský přístup: Klasický přístup je založen na opakování pokusech sledujeme rekvenci nastoupení zvolených jevů Bayesovský
13. cvičení z PSI ledna 2017
cvičení z PSI - 7 ledna 07 Asymptotické pravděpodobnosti stavů Najděte asymptotické pravděpodobnosti stavů Markovova řetězce s maticí přechodu / / / 0 P / / 0 / 0 0 0 0 0 0 jestliže počáteční stav je Řešení:
Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel
Regresní analýza Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Regresní analýza 1 / 23
1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou
Odhady - Sdružené rozdělení pravděpodobnosti
Odhady - Sdružené rozdělení pravděpodobnosti 4. listopadu 203 Kdybych chtěl znát maximum informací o náhodné veličině, musel bych znát všechny hodnoty, které mohou padnout, a jejich pravděpodobnosti. Tedy
Petr Kubát. Bonus - malus systém se spoluúčastí. Katedra pravděpodobnosti a matematické statistiky
BAKALÁŘSKÁ PRÁCE Petr Kubát Bonus - malus systém se spoluúčastí Katedra pravděpodobnosti a matematické statistiky Vedoucí bakalářské práce: Studijní program: Studijní obor: RNDr. Lucie Mazurová, Ph.D.
4. Aplikace matematiky v ekonomii
4. Aplikace matematiky v ekonomii 1 Lineární algebra Soustavy 1) Na základě statistických údajů se zjistilo, že závislost množství statku z poptávaného v průběhu jednoho týdne lze popsat vztahem q d =
VYBRANÉ PARTIE Z NUMERICKÉ MATEMATIKY
VYBRANÉ PARTIE Z NUMERICKÉ MATEMATIKY Jan Krejčí 31. srpna 2006 jkrejci@physics.ujep.cz http://physics.ujep.cz/~jkrejci Obsah 1 Přímé metody řešení soustav lineárních rovnic 3 1.1 Gaussova eliminace...............................
oddělení Inteligentní Datové Analýzy (IDA)
Vytěžování dat Filip Železný Katedra počítačů oddělení Inteligentní Datové Analýzy (IDA) 22. září 2014 Filip Železný (ČVUT) Vytěžování dat 22. září 2014 1 / 25 Odhad rozdělení Úloha: Vstup: data D = {
Stavový model a Kalmanův filtr
Stavový model a Kalmanův filtr 2 prosince 23 Stav je veličina, kterou neznáme, ale chtěli bychom znát Dozvídáme se o ní zprostředkovaně prostřednictvím výstupů Příkladem může býapř nějaký zašuměný signál,
Regresní analýza 1. Regresní analýza
Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému
Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup
Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009
Úlohy nejmenších čtverců
Úlohy nejmenších čtverců Petr Tichý 7. listopadu 2012 1 Problémy nejmenších čtverců Ax b Řešení Ax = b nemusí existovat, a pokud existuje, nemusí být jednoznačné. Často má smysl hledat x tak, že Ax b.
1 Linearní prostory nad komplexními čísly
1 Linearní prostory nad komplexními čísly V této přednášce budeme hledat kořeny polynomů, které se dále budou moci vyskytovat jako složky vektorů nebo matic Vzhledem k tomu, že kořeny polynomu (i reálného)
Aplikace teoretických postupů pro ocenění rizika při upisování pojistných smluv v oblasti velkých rizik
Aplikace teoretických postupů pro ocenění rizika při upisování pojistných smluv v oblasti velkých rizik Ondřej Pavlačka Praha, 18. ledna 2011 Cíle projektu Vytvořit matematický model pro oceňování přijímaného
1/30. Mgr. Jan Šváb Zobecněný lineární model a jeho použití v povinném ručení. 31.3.2006 Seminář z aktuárských věd. Slides by LATEX.
1/30 31.3.2006 Seminář z aktuárských věd Slides by LATEX Mgr. Jan Šváb Zobecněný lineární model a jeho použití v povinném ručení 2/30 Obsah 1 Zobecněné lineární modely (GLZ 1 ) Obecný lineární model (GLM)
BAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni
BAYESOVSKÉ ODHADY V NĚKTERÝCH MODELECH Michal Friesl Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni Slunce Řidiči IQ Regrese Přežití Obvyklý model Pozorování X = (X 1,..., X
10. Soustavy lineárních rovnic, determinanty, Cramerovo pravidlo
0. Soustavy lineárních rovnic, determinanty, Cramerovo pravidlo (PEF PaA) Petr Gurka aktualizováno 9. prosince 202 Obsah Základní pojmy. Motivace.................................2 Aritmetický vektorový
AVDAT Klasický lineární model, metoda nejmenších
AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i
Aplikovaná numerická matematika - ANM
Aplikovaná numerická matematika - ANM 3 Řešení soustav lineárních rovnic iterační metody doc Ing Róbert Lórencz, CSc České vysoké učení technické v Praze Fakulta informačních technologií Katedra počítačových
Výběrové charakteristiky a jejich rozdělení
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový
9. T r a n s f o r m a c e n á h o d n é v e l i č i n y
9. T r a n s f o r m a c e n á h o d n é v e l i č i n y Při popisu procesů zpracováváme vstupní údaj, hodnotu x tak, že výstupní hodnota y závisí nějakým způsobem na vstupní, je její funkcí y = f(x).
Nejdřív spočítáme jeden příklad na variaci konstant pro lineární diferenciální rovnici 2. řádu s kostantními koeficienty. y + y = 4 sin t.
1 Variace konstanty Nejdřív spočítáme jeden příklad na variaci konstant pro lineární diferenciální rovnici 2. řádu s kostantními koeficienty. Příklad 1 Najděte obecné řešení rovnice: y + y = 4 sin t. Co
Základy teorie odhadu parametrů bodový odhad
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Odhady parametrů Úkolem výběrového šetření je podat informaci o neznámé hodnotě charakteristiky základního souboru
[1] Determinant. det A = 0 pro singulární matici, det A 0 pro regulární matici
[1] Determinant je číslo jistým způsobem charakterizující čtvercovou matici det A = 0 pro singulární matici, det A 0 pro regulární matici používá se při řešení lineárních soustav... a v mnoha dalších aplikacích
0.1 Úvod do lineární algebry
Matematika KMI/PMATE 1 01 Úvod do lineární algebry 011 Vektory Definice 011 Vektorem aritmetického prostorur n budeme rozumět uspořádanou n-tici reálných čísel x 1, x 2,, x n Definice 012 Definice sčítání
Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice
Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice Vektorové podprostory K množina reálných nebo komplexních čísel, U vektorový prostor nad K. Lineární kombinace vektorů u 1, u 2,...,u
Nestranný odhad Statistické vyhodnocování exp. dat M. Čada
Nestranný odhad 1 Parametr θ Máme statistický (výběrový) soubor, který je realizací náhodného výběru 1, 2, 3,, n z pravděpodobnostní distribuce, která je kompletně stanovena jedním nebo více parametry
(Cramerovo pravidlo, determinanty, inverzní matice)
KMA/MAT1 Přednáška a cvičení, Lineární algebra 2 Řešení soustav lineárních rovnic se čtvercovou maticí soustavy (Cramerovo pravidlo, determinanty, inverzní matice) 16 a 21 října 2014 V dnešní přednášce
a počtem sloupců druhé matice. Spočítejme součin A.B. Označme matici A.B = M, pro její prvky platí:
Řešené příklady z lineární algebry - část 1 Typové příklady s řešením Příklady jsou určeny především k zopakování látky před zkouškou, jsou proto řešeny se znalostmi učiva celého semestru. Tento fakt se
Přijímací zkouška na navazující magisterské studium 2014
Přijímací zkouška na navazující magisterské studium 24 Příklad (25 bodů) Spočtěte Studijní program: Studijní obor: Matematika Finanční a pojistná matematika Varianta A M x 2 dxdy, kde M = {(x, y) R 2 ;
1 Determinanty a inverzní matice
Determinanty a inverzní matice Definice Necht A = (a ij ) je matice typu (n, n), n 2 Subdeterminantem A ij matice A příslušným pozici (i, j) nazýváme determinant matice, která vznikne z A vypuštěním i-tého
Jana Vránová, 3. lékařská fakulta UK
Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace
0.1 Úvod do lineární algebry
Matematika KMI/PMATE 1 01 Úvod do lineární algebry 011 Lineární rovnice o 2 neznámých Definice 011 Lineární rovnice o dvou neznámých x, y je rovnice, která může být vyjádřena ve tvaru ax + by = c, kde
vyjádřete ve tvaru lineární kombinace čtverců (lineární kombinace druhých mocnin). Rozhodněte o definitnosti kvadratické formy κ(x).
Řešené příklady z lineární algebry - část 6 Typové příklady s řešením Příklad 6.: Kvadratickou formu κ(x) = x x 6x 6x x + 8x x 8x x vyjádřete ve tvaru lineární kombinace čtverců (lineární kombinace druhých
1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,
KMA/SZZS1 Matematika 1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, operace s limitami. 2. Limita funkce
Testování hypotéz o parametrech regresního modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,
Testování hypotéz o parametrech regresního modelu
Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO
1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.
VIII. Náhodný vektor. Náhodný vektor (X, Y má diskrétní rozdělení s pravděpodobnostní funkcí p, kde p(x, y a(x + y +, x, y {,, }. a Určete číslo a a napište tabulku pravděpodobnostní funkce p. Řešení:
2 Hlavní charakteristiky v analýze přežití
2 Hlavní charakteristiky v analýze přežití Předpokládané výstupy z výuky: 1. Student umí definovat funkci přežití, rizikovou funkci a kumulativní rizikovou funkci a zná funkční vazby mezi nimi 2. Student
Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze
Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,
1 Řešení soustav lineárních rovnic
1 Řešení soustav lineárních rovnic 1.1 Lineární rovnice Lineární rovnicí o n neznámých x 1,x 2,..., x n s reálnými koeficienty rozumíme rovnici ve tvaru a 1 x 1 + a 2 x 2 +... + a n x n = b, (1) kde koeficienty
10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.
0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti
Časové řady, typy trendových funkcí a odhady trendů
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Stochastický proces Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2 } se nazývá stochastický proces
KGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení
Diskrétní náhodná veličina
Lekce Diskrétní náhodná veličina Výsledek náhodného pokusu může být vyjádřen slovně to vede k zavedení pojmu náhodného jevu Výsledek náhodného pokusu můžeme někdy vyjádřit i číselně, což vede k pojmu náhodné
Lineární a logistická regrese
Lineární a logistická regrese Martin Branda Univerzita Karlova v Praze Matematicko-fyzikální fakulta Katedra pravděpodobnosti a matematické statistiky Výpočetní prostředky finanční a pojistné matematiky
UNIVERSITA PALACKÉHO V OLOMOUCI PŘÍRODOVĚDECKÁ FAKULTA. KATEDRA MATEMATICKÉ ANALÝZY A APLIKACÍ MATEMATIKY školní rok 2009/2010 BAKALÁŘSKÁ PRÁCE
UNIVERSITA PALACKÉHO V OLOMOUCI PŘÍRODOVĚDECKÁ FAKULTA KATEDRA MATEMATICKÉ ANALÝZY A APLIKACÍ MATEMATIKY školní rok 2009/2010 BAKALÁŘSKÁ PRÁCE Testy dobré shody Vedoucí diplomové práce: RNDr. PhDr. Ivo
Věta 12.3 : Věta 12.4 (princip superpozice) : [MA1-18:P12.7] rovnice typu y (n) + p n 1 (x)y (n 1) p 1 (x)y + p 0 (x)y = q(x) (6)
1. Lineární diferenciální rovnice řádu n [MA1-18:P1.7] rovnice typu y n) + p n 1 )y n 1) +... + p 1 )y + p 0 )y = q) 6) počáteční podmínky: y 0 ) = y 0 y 0 ) = y 1 y n 1) 0 ) = y n 1. 7) Věta 1.3 : Necht
populace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech.
Populace a Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 1 populace soubor jednotek, o jejichž vlastnostech bychom
9. T r a n s f o r m a c e n á h o d n é v e l i č i n y
9. T r a n s f o r m a c e n á h o d n é v e l i č i n Při popisu procesů zpracováváme vstupní údaj, hodnotu x tak, že výstupní hodnota závisí nějakým způsobem na vstupní, je její funkcí = f(x). Pokud
Časové řady, typy trendových funkcí a odhady trendů
Časové řady, typy trendových funkcí a odhady trendů Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Jiří Neubauer (Katedra ekonometrie UO Brno) Časové
Odhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
ROVNICE NA ČASOVÝCH ŠKÁLÁCH A NÁHODNÉ PROCESY. Michal Friesl
Robust 14, Jetřichovice ROVNICE NA ČASOVÝCH ŠKÁLÁCH A NÁHODNÉ PROCESY Michal Friesl Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni Robust 14, Jetřichovice ÚVOD Úvod Analýzníkům
Bayesovské metody. Mnohorozměrná analýza dat
Mnohorozměrná analýza dat Podmíněná pravděpodobnost Definice: Uvažujme náhodné jevy A a B takové, že P(B) > 0. Podmíněnou pravěpodobností jevu A za podmínky, že nastal jev B, nazýváme podíl P(A B) P(A
Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X
Náhodný vektor Náhodný vektor zatím jsme sledovali jednu náhodnou veličinu, její rozdělení a charakteristiky často potřebujeme vyšetřovat vzájemný vztah několika náhodných veličin musíme sledovat jejich
1 Projekce a projektory
Cvičení 3 - zadání a řešení úloh Základy numerické matematiky - NMNM20 Verze z 5. října 208 Projekce a projektory Opakování ortogonální projekce Definice (Ortogonální projekce). Uvažujme V vektorový prostor
7 Regresní modely v analýze přežití
7 Regresní modely v analýze přežití Předpokládané výstupy z výuky: 1. Student rozumí významu regresního modelování dat o přežití 2. Student dokáže definovat pojmy poměr rizik a základní riziková funkce
PRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Náhodný výběr Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
8 Coxův model proporcionálních rizik I
8 Coxův model proporcionálních rizik I Předpokládané výstupy z výuky: 1. Student umí formulovat Coxův model proporcionálních rizik 2. Student rozumí významu regresních koeficientů modelu 3. Student zná
LWS při heteroskedasticitě
Stochastické modelování v ekonomii a financích Petr Jonáš 7. prosince 2009 Obsah 1 2 3 4 5 47 1 Předpoklad 1: Y i = X i β 0 + e i i = 1,..., n. (X i, e i) je posloupnost nezávislých nestejně rozdělených
Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jestliže opakujeme nezávisle nějaký pokus, můžeme z pozorovaných hodnot sestavit rozdělení relativních četností
MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci
MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým
Operace s maticemi. 19. února 2018
Operace s maticemi Přednáška druhá 19. února 2018 Obsah 1 Operace s maticemi 2 Hodnost matice (opakování) 3 Regulární matice 4 Inverzní matice 5 Determinant matice Matice Definice (Matice). Reálná matice
Základy maticového počtu Matice, determinant, definitnost
Základy maticového počtu Matice, determinant, definitnost Petr Liška Masarykova univerzita 18.9.2014 Matice a vektory Matice Matice typu m n je pravoúhlé (nebo obdélníkové) schéma, které má m řádků a n
Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III
Vysoká škola báňská - Technická univerzita Ostrava 4. října 2018 Podmíněná pravděpodobnost Při počítání pravděpodobnosti můžeme k náhodnému pokusu přidat i nějakou dodatečnou podmínku. Podmíněná pravděpodobnost
příkladů do cvičení. V textu se objeví i pár detailů, které jsem nestihl (na které jsem zapomněl) a(b u) = (ab) u, u + ( u) = 0 = ( u) + u.
Několik řešených příkladů do Matematiky Vektory V tomto textu je spočteno několik ukázkových příkladů které vám snad pomohou při řešení příkladů do cvičení. V textu se objeví i pár detailů které jsem nestihl
1 Odvození poptávkové křivky
Odvození poptávkové křivky Optimalizační chování domácností (maximalizace užitku) vzhledem k rozpočtovému omezení. Nejprve odvodíme deterministický model, který potom rozšíříme o stochastické prvky. Odvozené
Lineární algebra : Násobení matic a inverzní matice
Lineární algebra : Násobení matic a inverzní matice (8. přednáška) František Štampach, Karel Klouda frantisek.stampach@fit.cvut.cz, karel.klouda@fit.cvut.cz Katedra aplikované matematiky Fakulta informačních
Odhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
Maticí typu (m, n), kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru:
3 Maticový počet 3.1 Zavedení pojmu matice Maticí typu (m, n, kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru: a 11 a 12... a 1k... a 1n a 21 a 22...
1. Přednáška. Ing. Miroslav Šulai, MBA
N_OFI_2 1. Přednáška Počet pravděpodobnosti Statistický aparát používaný ve financích Ing. Miroslav Šulai, MBA 1 Počet pravděpodobnosti -náhodné veličiny 2 Počet pravděpodobnosti -náhodné veličiny 3 Jevy
Odhady Parametrů Lineární Regrese
Odhady Parametrů Lineární Regrese Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké
1 Polynomiální interpolace
Polynomiální interpolace. Metoda neurčitých koeficientů Příklad.. Nalezněte polynom p co nejmenšího stupně, pro který platí p() = 0, p(2) =, p( ) = 6. Řešení. Polynom hledáme metodou neurčitých koeficientů,
4. Trojúhelníkový rozklad p. 1/20
4. Trojúhelníkový rozklad 4. Trojúhelníkový rozklad p. 1/20 4. Trojúhelníkový rozklad p. 2/20 Trojúhelníkový rozklad 1. Permutační matice 2. Trojúhelníkové matice 3. Trojúhelníkový (LU) rozklad 4. Výpočet
Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Výsledky některých náhodných pokusů jsou přímo vyjádřeny číselně (např. při hodu kostkou padne 6). Náhodnou veličinou
Regrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly:
Regrese 28. listopadu 2013 Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly: 1. Ukázat, že data jsou opravdu závislá. 2. Provést regresi. 3. Ukázat, že zvolená křivka
Teorie informace a kódování (KMI/TIK) Reed-Mullerovy kódy
Teorie informace a kódování (KMI/TIK) Reed-Mullerovy kódy Lukáš Havrlant Univerzita Palackého 10. ledna 2014 Primární zdroj Jiří Adámek: Foundations of Coding. Strany 137 160. Na webu ke stažení, heslo:
Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1
Minikurz aplikované statistiky Marie Šimečková, Petr Šimeček Minikurz aplikované statistiky p.1 Program kurzu základy statistiky a pravděpodobnosti regrese (klasická, robustní, s náhodnými efekty, ev.
KGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním
Základní statistické modely Statistické vyhodnocování exp. dat M. Čada ~ cada
Základní statistické modely 1 Statistika Matematická statistika se zabývá interpretací získaných náhodných dat. Snažíme se přiřadit statistickému souboru vhodnou distribuční funkci a najít základní číselné
Vektory a matice. Obsah. Aplikovaná matematika I. Carl Friedrich Gauss. Základní pojmy a operace
Vektory a matice Aplikovaná matematika I Dana Říhová Mendelu Brno Obsah 1 Vektory Základní pojmy a operace Lineární závislost a nezávislost vektorů 2 Matice Základní pojmy, druhy matic Operace s maticemi
Matice. Modifikace matic eliminační metodou. α A = α a 2,1, α a 2,2,..., α a 2,n α a m,1, α a m,2,..., α a m,n
[1] Základní pojmy [2] Matice mezi sebou sčítáme a násobíme konstantou (lineární prostor) měníme je na jiné matice eliminační metodou násobíme je mezi sebou... Matice je tabulka čísel s konečným počtem
Lineární algebra : Polynomy
Lineární algebra : Polynomy (2. přednáška) František Štampach, Karel Klouda frantisek.stampach@fit.cvut.cz, karel.klouda@fit.cvut.cz Katedra aplikované matematiky Fakulta informačních technologií České
Matematika (CŽV Kadaň) aneb Úvod do lineární algebry Matice a soustavy rovnic
Přednáška třetí (a pravděpodobně i čtvrtá) aneb Úvod do lineární algebry Matice a soustavy rovnic Lineární rovnice o 2 neznámých Lineární rovnice o 2 neznámých Lineární rovnice o dvou neznámých x, y je
Jednofaktorová analýza rozptylu
I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých
7. Analýza rozptylu.
7. Analýza rozptylu. Uvedeme obecnou ideu, která je založena na minimalizaci chyby metodou nejmenších čtverců. Nejdříve uvedeme několik základních tvrzení. Uvažujeme náhodný vektor Y = (Y, Y,..., Y n a
Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně
7 Náhodný vektor Nezávislost náhodných veličin Definice 7 Nechť je dán pravděpodobnostní prostor (Ω, A, P) Zobrazení X : Ω R n, které je A-měřitelné, se nazývá (n-rozměrný) náhodný vektor Měřitelností
Pravděpodobnost a aplikovaná statistika
Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 2. KAPITOLA PODMÍNĚNÁ PRAVDĚPODOBNOST 3. KAPITOLA NÁHODNÁ VELIČINA 9.11.2017 Opakování Uveďte příklad aplikace geometrické definice pravděpodobnosti
Regresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
2.6. VLASTNÍ ČÍSLA A VEKTORY MATIC
.6. VLASTNÍ ČÍSLA A VEKTORY MATIC V této kapitole se dozvíte: jak jsou definována vlastní (charakteristická) čísla a vektory čtvercové matice; co je to charakteristická matice a charakteristický polynom
NMAI059 Pravděpodobnost a statistika
NMAI059 Pravděpodobnost a statistika podle přednášky Daniela Hlubinky (hlubinka@karlin.mff.cuni.cz) zapsal Pavel Obdržálek (pobdr@matfyz.cz) 205/20 poslední změna: 4. prosince 205 . přednáška. 0. 205 )
Téma 22. Ondřej Nývlt
Téma 22 Ondřej Nývlt nyvlto1@fel.cvut.cz Náhodná veličina a náhodný vektor. Distribuční funkce, hustota a pravděpodobnostní funkce náhodné veličiny. Střední hodnota a rozptyl náhodné veličiny. Sdružené