6 th Internatonal Scentfc Conference Managng and Modellng of Fnancal Rsks Ostrava VŠB-TU Ostrava, Faculty of Economcs,Fnance Department 0 th th September 202 Valdaton of the selected factors mpact on the nsured accdent Ověření vlvu vybraných faktorů na vznk pojstné událost Martna Borovcová Abstract Paper s focused on applcaton possbltes of the logstc regresson n the nsurance sector. There are generally defned the areas of the possble applcaton of the logstc regresson, there s n detal the area of the non-lfe property nsurance analyzed, more precsely accdent nsurance. By applyng logstc regresson are key factors defned wth nfluence on the occurrence probablty of nsured accdent, where nfluences of bnary, categoral and contnuous varables are analyzed. Impacts of selected factors are wthn one dmensonal analyss quantfed, as well. Key words Regresson analyss, Logstc Regresson, Generalzed Lnear Models, Bnary varables, Categoral varables, Contnuous varables, JEL Classfcaton: C20, G22 Úvod Nejčastěj využívané přístupy k analýze dat nejrůznější povahy souvsí s regresní analýzou. Její využtí v oblast fnancí, řízení a rozhodování fnančních nsttucí a tedy pojšťovnctví je rovněž reálné. Př vyslovení slova regrese se zpravdla vybaví regrese lneární, méně často nelneární nebo logstcká, když právě logstcká regrese je jž nejméně tř desetletí standardní metodou v západoevropské a amercké vědě včetně společenské. Cílem příspěvku je proto ověření vlvu vybraných faktorů na vznk pojstné událost př využtí logstcké regrese. Na konkrétním příkladu je pomocí logstcké regrese zhodnoceno, zda vybrané faktory jsou určujícím pro vznk pojstné událost a tento vztah je dále kvantfkován. V článku je nejprve defnována a vysvětlena regresní analýza a stručně je popsán regresní model. Následně je zmíněna podstata logstcké regrese, včetně odhadu koefcentů metodou maxmální věrohodnost a poté je provedena analýza vlvu vybraných faktorů na vznk pojstné událost ve smyslu haváre motorového vozdla. 2 Regresní analýza Statstcké metody, pomocí nchž odhadujeme hodnotu určté náhodné velčny na základě znalost velčn jných, označujeme jako regresní analýzu. Přtom náhodná velčna, jejíž Ing. Martna Borovcová, Ph.D., VŠB-TU Ostrava, Ekonomckáfakulta, katedra fnancí, Sokolská třída 33, 702 2 Ostrava, martna.borovcova@vsb.cz. Tento příspěvek vznkl v rámc řešení projektu 20 Modelování a predkce pojstných rzk ve výuce Pojšťovnctví na Ekf-VŠB TU Ostrava 74
6 th Internatonal Scentfc Conference Managng and Modellng of Fnancal Rsks Ostrava VŠB-TU Ostrava, Faculty of Economcs,Fnance Department 0 th th September 202 hodnota je odhadována, může být označena také jako závsle proměnná, cílová proměnná, proměnná vysvětlovaná nebo také odezva, regresand. Naprot tomu velčna, jejíž znalost jž máme, je nezávsle proměnná, proměnná vysvětlující, regresor. Ne vždy je použta nezávsle proměnná jedná. Často vystupuje regresorů několk, přčemž může jít o další velčny, nebo funkce menšího počtu velčn. Modelování vztahů mez vysvětlující a vysvětlovanou proměnnou patří mez základní aktvty, se kterým je možné se setkat ve statstce. Obvyklý je předpoklad, že závsle proměnná je náhodnou velčnou s normálním rozdělením. Pro odvození modelu je pak zpravdla použta metoda nejmenších čtverců. Je-l však závsle proměnná znakem bnárním, nkol spojtým statstckým znakem, může nastat problém. V takovém případě by k odhadu parametrů bylo použtí regresní analýzy s odhadem regresních koefcentů prostřednctvím metody nejmenších čtverců problematcké. Podstatou řešení regrese je pak stanovení nejlepšího regresního modelu, spočívající v určení matematcké rovnce, která bude popsovat závslost y na x, stanovení parametrů modelu, souvsející se stanovením nejlepších odhadů parametrů β, stanovení statstcké významnost modelu, souvsející s určením, zda nalezený model přspěje ke zpřesnění odhadu závsle proměnné oprot použtí pouhého průměru, č nterpretace výsledků zjštěných modelem z hledska zadání. 3 Logstcká regrese Cílem analýzy, která využívá metodu regrese, je nalézt co nejlepší, nejúspornější a současně věcně smysluplný model, který popíše vztah mez závslou proměnnou a skupnou nezávslých proměnných. Je-l vysvětlovaná proměnná spojtá, obracíme se k regres lneární, není-l spojtá, pak k regres logstcké. Metoda logstcké regrese není omezená jen na případ, kdy vysvětlovaná proměnná je bnární. I když pro tuto stuac byla logstcká regrese původně vyvnuta a je nterpretačně, ale jnak nejsnazší. Exstují však metody a také programy, které pracují s případy, kdy kategorzovaná závslá proměnná není bnární, a dokáží respektovat požadavek, aby j považovaly za ordnální. 3. Možnost využtí logstcké regrese v oblast pojšťovnctví S ohledem na výše uvedenou podstatu logstcké regrese je šíře jejího využtí v oblast pojšťovnctví evdentní. Ať už se jedná o měření solventnost pojšťoven, hospodaření pojšťoven, hodnocení úrovně pojstného trhu, odhad výše technckých rezerv, stanovení pojstného v jednotlvých odvětvích pojštění a další, ve všech případech je možná snaha o vytvoření modelu a nalezení vztahu mez konkrétním závslým a nezávslým proměnným. 3.2 Formulace modelu Předpokládejme, že máme bnární velčnu Y charakterzující kladnou a zápornou varantu v kontextu vznku pojstné událost -tého pojstníka, tedy pro poztvní varantu (pojstná událost nastane), Y = pro =,..., n, 0 pro negatvní varantu (pojstná událost nenastane), kde n je počet pojstníků. Každý tento pojstník je charakterstcký vektorem x = (,x, x 2,,x k ) obsahujícím k prvků, Stršš, Valečková, Valecký (200, str. 206-207). Pravděpodobnost vznku pojstné událost -tého pojstníka P =P(Y =) na základě jeho charakterstckého vektoru x lze vyjádřt funkcí F(β;x ), jenž je monotónně rostoucí 75
6 th Internatonal Scentfc Conference Managng and Modellng of Fnancal Rsks Ostrava VŠB-TU Ostrava, Faculty of Economcs,Fnance Department 0 th th September 202 F (β;x ) 0 a má defnční obor (-, ) a obor hodnot (0,). Platí tedy, že F(- )=0 a F(+ )= a funkc pravděpodobnost odpověd lze psát jako P =F(β;x ), () kde β je vektor parametrů (β 0, β,, β k ). Tyto vlastnost jsou splněny kumulatvní dstrbuční funkcí logstckého rozdělení ve tvaru β x e P = P( Y = ) = F( β ; x ) =, (2) β x + e která je zároveň funkcí pravděpodobnost vznku pojstné událost. Pravděpodobnost negatvní varanty, nevznknutí pojstné událost, lze pak vyjádřt ve tvaru P = P( Y = 0) = F( β ; x ) =. (3) + e β x Defnujme dále podíl pravděpodobnost vznku a nevznknutí pojstné událost známé také jako šance (odds) ve tvaru ( Y = ) ( Y = 0) π P β x = = e, π P a dále tzv. logtovou transformac (log-odds, logt) vztahu (4) (4) Odhad parametrů modelu π ln =β x = g( x ). π K odhadu neznámých parametrů β je nejčastěj používána metoda maxmální věrohodnost. Tato metoda spočívá v nalezení věrohodnostní funkce l( ), která je posléze maxmalzována. Mějme pravděpodobnost kladné odpověd -tého respondent charakterstckého vektorem x, tedy P ( Y x ) = π ( x ), (5) = (6) a dále pravděpodobnost negatvní varanty, nevznknutí pojstné událost P ( Y 0 x ) = P( Y = x ) = π ( x ). = (7) Sdružená pravděpodobnost kladných a záporných varant vznku pojstné událost lze poté vyjádřt ve tvaru P Y ( ) ( ) [ ( )] ( ) Y x = x π x. Y π (8) 76
6 th Internatonal Scentfc Conference Managng and Modellng of Fnancal Rsks Ostrava VŠB-TU Ostrava, Faculty of Economcs,Fnance Department 0 th th September 202 Jsou-l jednotlvá pozorování nezávslá, pak věrohodnotstní funkce je určena jako součn sdružených pravděpodobností pro všechny pojstníky, tedy l N Y ( ) ( ) [ ( )] ( ) Y β = x π x. = π (9) Odhad parametrů metodou maxmální věrohodnot je získán maxmalzací logartmu rovnce (9) ve tvaru L N ( β) ln l( β) = Y ln( π ( x )) + ( Y ) ln π ( x ) = = ( ), (0) za podmínek L β ( β) j = 0 pro j =,..., k. Odhad metodou maxmální věrohodnot bývá prováděn pomocí teračních algortmů, přčemž nejčastěj je používána Newton-Raphsonova metoda. Prncp této metody spočívá v aproxmac logartmu věrohodnoctví funkce v okolí počátečního odhadu pomocí prvních tří členů Taylorova rozvoje, vz Pecáková (2007), přčemž počáteční odhad lze získat například metodou nejmenších čtverců. 4 Ověření vlvu vybraných faktorů na vznk pojstné událost V této část příspěvku jsou analyzovány vybrané faktory, a zjštěna jejch statstcká významnost na dané hladně spolehlvost. Analýza je provedena pomocí dat získaných z pojstného kmene konkrétní pojšťovny a skládá se z datového vzorku 6 897 smluv. Smlouvy, tvořící pojstný kmen, jsou uzavřeny na produkt nežvotního pojštění, pojštění majetku (vozu) ve smyslu havarjního pojštění. Jsou použta data za rok 2008, přčemž časová expozce smlouvy je jeden rok. V souboru jsou obsaženy údaje o velkost a počtu škod, ceně vozu, věku a pohlaví pojstníka, o lokaltě bydlště pojstníka a o průměrném věku obyvatelstva v dané lokaltě, dále také o stáří dopravního prostředku, objemu motoru, výkonu dopravního prostředku, druhu spalovaného palva, o uplatnění zvýhodněných balíčků, o způsobu používání vozdla č ntenztě jeho využívání a další. Zdrojem pro veškeré výstupy uvedené v této subkaptole je program STATA. 4. Pops jednotlvých zkoumaných znaků z datového souboru Prvním z dostupných údajů v datovém souboru je nárok, clam. V datovém souboru je zachyceno, zda ke vznku nároku dochází č nkol. Dalším zkoumaným znaky, uvedeným v datovém souboru jsou typ palva (fuel), typ pojštění (ns), počet obyvatelstva v regonu (noct), průměrný věk obyvatelstva v regonu (avgagereg), výše spoluúčast (excess), stáří vozdla (agecar), věk pojstníka (ageman), pohlaví pojstníka (gender), využtí dopravního prostředku k podnkání (company), výkon vozdla (kw) a objem motoru (volume). () 77
6 th Internatonal Scentfc Conference Managng and Modellng of Fnancal Rsks Ostrava VŠB-TU Ostrava, Faculty of Economcs,Fnance Department 0 th th September 202 Tabulka : Pops jednotlvých zkoumaných znaků z datového souboru 78
6 th Internatonal Scentfc Conference Managng and Modellng of Fnancal Rsks Ostrava VŠB-TU Ostrava, Faculty of Economcs,Fnance Department 0 th th September 202 Dle hodnot uvedených v tabulce je možné konstatovat, že v rámc sledovaného souboru dat u převážné většny pojštěných dopravních prostředků nedochází ke vznku pojstného nároku. Převážná většna dopravních prostředků př svém provozu spaluje benzín. V početně nejvyšším zastoupení je sjednáno pojštění dopovídající stupn A, což představuje pojštění kryjící šroký rozsah rzk. Průměrný počet obyvatel v regonech (okresech) ční 527 387 osob, přčemž mnmální počet obyvatel v regonu byl zjštěn v počtu 4 255 obyvatel a maxmální počet obyvatel v regonu ční 249 026 obyvatel. Průměrný věk obyvatelstva se pohybuje v rozmezí 38,2 až 42 let. Výše spoluúčast pojstníka na případném pojstném plnění je 79
6 th Internatonal Scentfc Conference Managng and Modellng of Fnancal Rsks Ostrava VŠB-TU Ostrava, Faculty of Economcs,Fnance Department 0 th th September 202 v rámc sledovaného souboru dat udávána v rozmezí pět až třcet procent, přčemž častější je výskyt spoluúčast ve výš pět procent. Nejstarším vozdlem v souboru je dopravní prostředek ve stáří 43 let, opakem je pak zcela nový vůz, jehož stáří nedosahuje an jednoho roku. Průměrné stáří pojštěných vozů je 4,9 let. Maxmální věk pojstníka ční 99 let, přčemž průměrný věk ční 32 let. Zcela zřetelné je rozdělení pojstníků dle pohlaví, kdy zastoupení mužů je více než dvoutřetnové. Většna pojštěných vozů není používána k podnkání. Průměrný výkon pojštěných vozů je vyčíslen ve výš 72,5 kw a průměrný objem motoru je 664,57 cm 3. 4.2 Jednofaktorová analýza a test významnost kategorí V rámc této podkaptoly je postupně hodnocen vztah jednotlvých vysvětlujících proměnných vzhledem k vysvětlované proměnné a to za předpokladu, že zbylé vysvětlující velčny nabývají nulových hodnot. Je-l proměnná rozdělena na podkategore, pak jsou dílčí kategore zahrnuty souběžně. Tabulka 2: Jednofaktorová analýza a test významnost kategorí 80
6 th Internatonal Scentfc Conference Managng and Modellng of Fnancal Rsks Ostrava VŠB-TU Ostrava, Faculty of Economcs,Fnance Department 0 th th September 202 Dle výše uvedených výstupů je považováno za vhodné začlent do odhadovaného modelu téměř všechny nezávslé velčny. Některé z podkategorí se sce jeví jako nevýznamné, ale odstranění takových vybraných podkategorí z modelu není možné, neboť je vždy nutné současné zahrnutí veškerých dílčích podkategorí. 5 Závěr Cílem příspěvku bylo ověření vlvu vybraných faktorů na vznk pojstné událost. Tedy zjštění, zda jsou vybrané faktory určujícím pro vznk pojstné událost č nkol a tento vztah dále kvantfkovat a to pomocí logstcké regrese na konkrétním příkladu datového vzorku smluv konkrétního pojsttele. V článku byla nejprve defnována a vysvětlena regresní analýza a stručně byl popsán regresní model. Následně byla zmíněna podstata logstcké regrese, včetně odhadu koefcentů metodou maxmální věrohodnost a poté byla provedena analýza vlvu vybraných faktorů na vznk pojstné událost ve smyslu haváre motorového vozdla. Z výše uvedených výsledků vyplývá, že vznk pojstné událost je determnován typem palva, typem pojštění, počtem obyvatelstva v regonu, průměrným věkem obyvatelstva v regonu, výší spoluúčast, stáří vozdla, věkem pojstníka, pohlavím pojstníka, využtím dopravního prostředku k podnkání, výkonem vozdla a objemem motoru. References [] BOROVCOVÁ, M. 20. Applcaton possbltes of the logstc regresson n the nsurance sector. Fnancal management of frms and fnancal nsttutons. VŠB-TU Ostrava, pp. 32-39. [2] BOROVCOVÁ, M. 20. Analýza vlvu vybraných faktorů na vznk pojstné událost. Aktuárska veda v teór a prax. Ekonomcká unverzta v Bratslave, pp. 6-. [3] FOJTÍKOVÁ, A. 202. Konstrukce modelu stanovení pojstného na báz metody regresní analýzy. Dplomová práce. VŠB-TU Ostrava. [4] HARDIN, J. W., HILBE J. M., 2007. Generalzed Lnear Models and Extensons. Texas: Stata Press. [5] HOSMER, D.W., LEMESHOW, S., 2000. Appled Logstc Regresson. New Jersey: John Wley & Sons. [6] PECÁKOVÁ, I., 2007. Logstcká regrese s vícekategorální vysvětlovanou proměnnou. Acta Oeconomca Pragensa, roč. 5, č., pp. 86-96. [7] STRIŠŠ, J., VALEČKOVÁ, J., VALECKÝ, J., 200. Aplkace logstcké regrese v měření spokojenost zákazníků. Rozvoj marketngu v teór a prax, Žlnská unverzta v Žlně, pp. 205-20. 8
6 th Internatonal Scentfc Conference Managng and Modellng of Fnancal Rsks Ostrava VŠB-TU Ostrava, Faculty of Economcs,Fnance Department 0 th th September 202 [8] ŠIMURDA, M., 2008. Zobecněný lneární model (GLM). Dostupné na: http://www.actuara.cz/upload/glm_smm_mff_web.pdf. [9] WEISBERG, S., 2005. Appled Lnear Regresson. New Jersey: John Wley & Sons. [0] ZMEŠKAL, Z., 2004. Fnanční modely. Praha: EKOPRESS. Summary Příspěvek je zaměřen na možnost aplkace metody logstcké regrese v oblast pojšťovnctví, konkrétně její využtí př ověření vlvu vybraných faktorů na vznk pojstné událost. Obecně jsou defnovány oblast možného využtí logstcké regrese, podrobněj je analyzována oblast nežvotního pojštění majetku, konkrétně havarjní pojštění. Pomocí logstcké regrese jsou dentfkovány klíčové faktory ovlvňující pravděpodobnost vznku pojstné událost, přčemž jsou analyzovány vlvy bnárních, kategorálních spojtých velčn. Vlvy vybraných faktorů jsou v rámc jednorozměrné analýzy rovněž kvantfkovány. 82