ROBUST 000, 47 56 c JČMF 001 SROVNÁNí APROXIMAČNíCH METOD V TEORII RIZIKA MARTIN ROTKOVSKÝ Absrak. One of he main erms of he risk heory is so called individual model, which describes for example oal aggregae claim from n insurance policies. nx S ind := X i = C i D i For evaluaing of disribuion of S ind we mus calculae convoluions of higher order, wha is unpossible in general case and very compuaionally difficul in case of discree disribuions, so i is no he opimal way o ge good (and fas) resuls. We can approximae his model by various mehods. In his conribuion I will compare differen approximaions. Firs heoreically and laer for a concree example, where X i are i.i.d. wih disribuion C i Exp(θ) and D i A(p). Rezme: Odnim iz osnovnyh poni eorii riska vlecak nazyvaemaindividualnamode, koora opisyvae naprimer akkumulirovannupoer iz qisla n crahovyh polisov. S ind := nx X i = nx nx C i D i Dl opreddeleni raspredeleni S ind my dolny byli by sosqia~mnogokranye konvolcii, qo, uqiyva slonos~ rasqea diskrenyh sluqanyh veliqin i poqi nevozmonos~ rasqea obwih raspredeleni, ne vlec opima nym puem. Poeomu ea mode byvae qaso approksimirovana s pomow~ raznyh meodov. V naso- we sa~e my zanimaems sravneniem eih meodov. Snaqala na eoreiqeskom urovne, i poom odel~nye meody cravnivac na konkrenom primere, kogda X i n.o.r.s.v. s raspredeleniem C i Exp(θ) i D i A(p). 1. Úvod Jedním ze základních pojmů eorie rizika je akzvaný individuální model, kerý popisuje kumulovanou zráu z n pojisných smluv. Vychází z oho, že i-á pojisná smlouva s určiou nenulovou pravděpodobnosí 1 p i nepřinese ani jednu škodu a s doplňkovou pravděpodobnosí přinese zráu, jejíž rozdělení je dáno disribuční funkcí V i. Celkovou zráu z i-é smlouvy je edy možno zapsa X i = C i D i,kdec i má d.f. V i a D i má alernaivní rozdělení s paramerem p i. Celková škoda z n smluv je edy S ind := X i = C i D i Pro určení rozdělení S ind bychom museli počía mnohonásobné konvoluce, což je výpočově náročné pro diskréní a éměř nemožné pro obecně rozdělené náhodné 000 Mahemaics Subjec Classificaion. Primary 6P05. Klíčová slova. Teorie rizika, individuální model, aproximace, kumulovaná zráa. Tao práce vznikla za podpory granu MSM 11300008.
48 Marin Rokovský veličiny. Proo je eno model časo aproximován různými meodami. V omo příspěvku se zabýváme jejich srovnáním. Nejdříve eoreicky a pak jsou jednolivé meody srovnány pro konkréní příklad, kdy X i jsou i.i.d. s rozdělením V i Exp(θ) a D i A(p). V omo, v praxi hojně používaném, příkladě lze oiž urči poměrně snadno konvoluci libovolného poču náhodných veličin a ím se dobra i k poměrně slušným výsledkům. Na závěr je provedeno srovnání aproximace exponenciálním rozdělením vůči reálným daům konkréní pojišťovny. 0-1 Hrubá výpočení síla Věa 0-1: Jsou-li X a Y diskréní náhodné veličiny s n a m body nespojiosi má X + Y diskréní rozdělení s nejméně n + m 1 a nejvíce n.m bodů nespojiosi. Pokud edy děláme konvoluci k i.i.d. náhodných veličin s řešeoviým rozdělením, keré má body nespojiosi pouze v bodech 0,...,mδ dosáhneme u konvoluce přibližně m k bodů nespojiosi. Pro výpoče konvoluce dvou veličin s m body nespojiosi pořebujeme uděla řádově m operací. Přibližný celkový poče aproximací při éo meodě je dán následující abulkou: m/k 1 3 5 10 15 4 16 64 104 1048576 107374184 5 5 100 400 6400 6553600 6710886400 10 100 400 1600 5600 614400 6843545600 50 500 10000 40000 640000 655360000 6,71089E+11 100 10000 40000 160000 560000 61440000,68435E+1 Vzhledem k obvyklému rozsahu poču smluv > 13 by bylo spočení konvoluce pro dosaečně jemná dělení nedosupné v reálném čase. Pozn. 1: Zabýváme se pouze počy m = k, pro osaní m je možné výsledek dosáhnou ak, že { m = a k k 0, kde a k = 1, k=0 X m = X k1 X k l, kde k 1 je odpovídá prvnímu k, proněža k = 1 a podle dvojkového rozkladu m odpovídají i další k i, i =1,...,l výskyům jedničky ve dvojkovém zápise m. 0- Jak porovnáva aproximace Pro určování kvaliy různých druhů aproximacís ind je pořeba sanovi meriku, kerá bude sanovova vzdálenos od původního modelu. Sandarní volbou je zv. sopp-loss merika řádu 1: d 1 (X, Y ):=sup (x )d(f X (x) F Y (x)) =sup E(X ) + E(Y ) + Ve výše uvedeném příkladu pojisných smluv ao merika určuje odchylku dvou sopp-loss pojisných odpovídajících jednolivým modelům (Gerber 1981, sr. 71). Exisuje zobecnění d 1 na d m,m IN, kerá je akzvanou ideální merikou řádu m, což znamená: Definice 0-1: Pro náhodné veličiny X 1,X,Z,kde(X 1,X ) je nezávislý se Z a nenunlovou konsanu c plaí: (i) d m (X 1 + Z, X + Z) d m (X 1,X )a
Srovnání aproximačních meod v eorii rizika 49 (ii) d m (cx 1,cX )= c m d m (X 1,X ). aímplaíi Lemma 0-: (a)pro X 1,...,X n nezávislé a Y 1,...,Y m nezávislé a c i > 0 ( n ) d m c i X i, c i Y i c m i d m (X i,y i ). (b)pokud E(X j Y j )=0, 1 j m, poom d m (X, Y ) k m(x, Y ) m! = x m 1 (m 1)! F X(x) F Y (x) dx E X X m 1 Y Y m 1 Důkaz :(a)z rojúhelníkové nerovnosi a idealiy. (b) Rachev 1991, sr. 30.. Teoreická porovnání Pro aproximaci individuálního modelu se časo používá zv. kolekivní model, kerý lze zapsa následujícím způsobem: N S coll := Z i, kde Z i jsou i.i.d. s Z i V a N Po(µ) az i,n jsou nezávislé. p i µ := p i, V := µ V i V příkladě pojisných smluv lze N nahlíže jako celkový poče pojisných událosí z n smluv a Z i jako výši konkréní škody. S coll můžeme edy zapsa S coll = Si coll, (+) kde S coll i = N i j=i Z ij, kden i Po(p i )az ij V i. Pozn. 1: ES ind = ES coll,alevars ind = n p ivar(c i )+ n p i(1 p i )(EC i ) < <VarS coll = p i Var(C i )+ p i (EC i ). Pozn. : Vyjádření (+) lze upravi ak, aby se shodovaly oba momeny. Teno model budu dále označova Sparam. coll Přia i := EC i a b i := ECi vypadá ako: S coll i = N i j=1 Z ij, Z ij u i C i, N i Po(µ i ) µ i := p ib i b i p i a, u i := p i i µ i I - 0 Specifické výpočy pro exponenciální model Nejprve provedeme několik pomocných výpočů pro případ výše zmíněného homogeního (p i = p) exponenciálního (V i Exp(θ)) modelu, y využijeme později v prakických příkladech d 1 (X 1,S1 coll )=sup (x )d(f X1 (x) F S coll(x)) 1 x f Γ(θ,k) (x)c k dx = 0 k=0
50 Marin Rokovský kde f Γ(θ,k) (x) je husoa Γ rozdělení s příslušnými paramery (pro k = 0 uvažujeme δ funkci a 1 p e p k =0 c k = p(1 e p ) k =1 e p p k k což odpovídá rozdílu mezi jednolivými pravděpodobnosmi k-ých konvolucí C i vořících X 1 a S1 coll. Oduď dosáváme xc k f Γ(θ,k) (x) dx (a) = p(1 e p e p p k )θ + kθ =p(1 e p )θ. k=0 0 k= Při přechodu (a) jsme využili znalos o Γ rozdělení. Podobně spočeme i d : d (X 1,S1 coll )= x c k f Γ(θ,k) dx = p(1 e p )θ e p p k + θ (k + k )= k=0 0 k= =4pθ (1 e p e p p k )+p θ (k +1)=p θ +4pθ (1 e p ) Nyní uvažujme ješě paramerizovaný model Sparam coll.vzhledemkomu,žejeformální zápis sejný i pro eno model a liší se pouze paramery, proo spočeme hodnou ěcho paramerů a poé je dosadíme do výsledků z předešlého modelu: µ := µ i = p ib i = p b i p i a i p = u = u i = p i = p µ i Rozdělení zachovávají yp a mění pouze paramer, zn. Z ij p p ) Exp(θ) Exp( θ) a N i Po. Odud dosazením do výsledků pro jednoduchý model obdržíme: ( p p d 1 (X 1,S coll param1) =p(1 e p p )θ, I - 1 Prosé využií vlasnosí meriky d 1 d (X 1,S coll param1) =p θ +4 p pθ (1 e p p ) Zde i v dalších odsavcích je S coll použio pro eoreické vyjádření obou modelů, proože jejich rozklad je formálně shodný.pokud použijeme lemma 0- b) dosáváme: d 1 (S ind,s coll ) d 1 (X i,si coll ) Pro homogení model dosáváme: = nd 1 (X 1,S1 coll ), pokud bychom neměli informaci o exponencialiě rozdělení V i mohli bychom rozdíl odhadnou podle lemmau 0- ako: n(e X 1 + E S1 coll ) npθ (1) Pokud využijeme jemnější odhad d 1 z bodu I-0 dosaneme. Pro jednoduchý model: d 1 (S ind,s coll ) np(1 e p )θ () Pro paramerizovaný model: d 1 (S ind,sparam coll ) np(1 e p p )θ (3) I- Využií idealiy meriky d Poněkud sofisikovanější meodou je využí vzahu mezi d 1 a d,keroupopisuje následující lemma:
Srovnání aproximačních meod v eorii rizika 51 Lemma I - 1: Pokud E(X j Y j )=0,j =1, plaí následující vzah d 1 (X, Y ) 4 π d (X, Y ) Z nunosi shody prvních dvou momenů lze odhad použí pouze pro paramerizovaný model. Budeme edy nejprve odhadova d (S ind,s coll ): d (S ind,s coll ) d (X i,si coll ) pro homogení model edy plaí = nd (X 1,S coll 1 ), bez znalosi rozdělení můžeme opě pouze podle lemmau 0- odhadnou: d (X 1,S1 coll ) 1 (EX 1 + E(S1 coll ) )=EX1 = pb Pro paramerizovaný model by eno hrubý odhad odpovídal: d 1 (S ind,s coll ) 4 npθ (4) π Při použií jemnějšího odhadu z bodu I - 0 dosaneme: d (S ind,sparam) coll = 4 [ n p θ +4 p ] π pθ (1 e p p ) I - 3 Využií vlasnosí d 1 a Poissonova rozdělení (5) V následujících dvou odsavcích budeme využíva k odhadu podobnos rozdělení Z ij s C i (Z ij = u i C i ) a ím danou podobnos jejich příslušných konvolucí společně s využiím znalosí o Poissonově rozdělení. Následující věa dává edy jisým způsobem opimální odhad pokud nevíme nic o rozdělení C i. Věa I - : Pro paramerizovaný model a C i 0 s.j. plaí pro i 1: d 1 (S ind,s coll ) p i τ i, kde τ i := a i + i v i + max( i a i v i, a i ṽ i +(1+ i a i v i p i )u i ), v i := a i b i 1 p i, p i v i 1 1 i, ṽ i := a i b i p i a i Důkaz: Rachev 1991, sr. 39-331. Po dosazení všech paramerů dosaneme pro exponenciální model: [ d 1 (S ind,s coll ) np θ 1+ p + p ] [ 1 + np p + p ] (6) I - 4 Využií vlasnosí d a Poissonova rozdělení Analogicky jako v odsavci I - odhadneme nejprve d a z něj pak pomocí lemmau I - 1 i d 1. Posup odhadu d bude analogický odhadu jako v I-3: Věa I - 3: Pro C i 0 s.j. plaí pro paramerizovaný model: d (S ind,s coll ) 1 p i τ i
5 Marin Rokovský kde τi = b i +3a i + ia i +ṽ ib i + b iu i + ia i p i,kde i,ṽ i jsou sejné jako ve věě I-. Tím máme ( d 1 (S ind,s coll ) 4 n ) 1 p i τi π Důkaz: Rachev 1991, sr. 331-333 Po dosazení dosaneme ( ) τ1 =θ +3θ + θ p + 8 p θ4 p +θ + θ p p aedy d 1 (S ind,s coll ) 4 [ ( 8 np π p θ4 +(7+ p p + p )θ + p )] 1 p θ (7) I - 5 Vyžií všech znalosí o modelu Posup výpoču bude podobný jako u neuvedených důkazů z předešlých dvou odsavců. S ím, že na rozdíl od obecného případu jsme schopni přesně napočía k-é konvoluce C i Exp(θ), keré mají gama rozdělení C1 k Γ(θ, k) a ak dosaneme velmi přesný odhad d 1 (S ind,s coll )proenomodel. 0 d 1 (S ind,s coll )=sup (x )d(f S ind(x) F S coll(x)) (x ) c k f Γ(θ,k) (x)dx c k E Γ(θ,k) X = c k kθ (8) kde pro neparamerizovaný model plaí ) c k = n ( p k k (1 p) n k e np (np) k I - 6 Aproximace homogeního modelu pomocí normálního rozdělení V omo odsavci bude na rozdíl od všech osaních daleko ěžší využí plnou sílu věy při znalosi konkréního rozdělení C i a horní mez z věy budeme pro eno yp rozdělení pouze odhadova. Věa I - 4: Pokud jsou X i i.i.d. náhodné veličiny s a := a 1 a σ := Var(C 1 ), p := p 1, pak plaí [ ( N1 )] d 1 (S ind,sparam) coll 11, 5[pσ + p(1 p)a ] 1 τ 3 (X 1,Y)+τ 3 C i,y kde Y N(0, 1), N 1 Po(µ 1 ) a při označení τ 3 (X, Y ):=max((e X + E Y ), 1 3 (E X 3 + E Y 3 )), X := X EX Var(X) Důkaz: [], sr. 38 a v [5], sr. 7 lze naléz určié zpřesnění (zpřesnění)
Srovnání aproximačních meod v eorii rizika 53 Nejprve uveďme absoluní momeny normálního rozdělení. 8 E Y = π, E Y 3 = π Pro normalizaci je pořeba zná hodnou rozpylu, a je (Gerber 1981, sr. 50) VarX 1 =(1 p)pθ + pθ =( p)pθ Nyní spočeme momeny: [ 0 E X 1 EX 1 = p(1 p)θ + p x 1 pθ θ e x/θ dx + 0 x 1 ] θ e x/θ dx = p(1 p)θ + pθe pθ (1 e p (1 p)) = pθ [ 1 p + e pθ (1 e p (1 p)) ] Spočís lze i hodnou E X 3, ale použjeme odhad: E X 1 EX 1 3 (pθ) 3 + pec 3 1 (pθ) 3 +6pθ 3 v prosředním členu odpovídá první sčíanec záporné a druhý kladné čási rozdělení X 1 EX 1. Podobným rikem budeme posupova i pro odhad τ 3 (S1 coll,y). Vzhledem k paramerizaci zvolené ak, aby se shodovali první dva momeny je rozpyl sejný jako pro X i E S1 coll ES1 coll e p p k pθ + kθ pθ a pro výpoče řeího momenu uvedeme nejprve hodnou řeího momenu Γ(θ, k) rozdělení: E Γ(θ,k) X 3 = θ 3 (k 3 +3k +k) s ímo vyjde E S1 coll ES1 coll 3 (pθ) 3 + θ 3 e p p k (k +3k + k 3 )=θ 3 (p 3 +6p +6p) Výraz, kerý by vzniknul po dosazení do věy I - 4 budeme označova (9). 3. Numerické aproximace Věa 0-1 říká kolik bodů nespojiosi má konvoluce diskréních n.v. a víme, že minimálního poču lze dosáhnou v případě řešeoviého rozdělení. Ovšem i pro oo rozdělení nám poče bodů nespojiosi rose velmi rychle. Proo bude vhodné rozdělení konvoluce aproximova novou náhodnou veličinou, kerá má méně bodů nespojiosi. Nejprve zvolme diskréní náhodnou veličinu K i aproximující rozdělení C i,abyse od C i ve smyslu meriky d 1 příliš nevzdálila. Pokud rozdělení C i nemá příliš ěžký chvos zvolím δ ak, aby pro použielné n plailo nδ (x nδ)dx δ, pak rozdělení K i volím s následující disribuční funkcí F Ki (x) = I [x iδ] P iδ (δ), kde P iδ (δ) =P (C 1 [iδ, (i +1)δ[) i=0
54 Marin Rokovský s Vzhledem k omu, že C i K i můžeme odhadnou n 1 (k+1)δ d 1 (C 1,K 1 ) xf C1 (dx) iδp iδ (δ)+ k=0 kδ nδ (x nδ)f C1 (dx) δ I pokud volíme malý krok δ EX/1000 nebude pro rozdělení s nerosoucí inenziou poruch problém nají n dosaečně malé (n 10000) požadované vlasnosi. Vlasní algorimus pro redukci poču bodů nespojiosi je akový, že při každém kroku vynechám liché násobky délky předešlého kroku a jejich pravděpodobnos přidáme nejbližšímu nižšímu sousedovi. Samozřejmě, že lepším způsobem redukce bodů by bylo rozděli pravděpodobnos mezi oba sousedy rovným dílem (jak ukazuje abulka na éo sránce), ale pak bychom zraili jisou o om, kerým směrem se vzdalujeme od originální náhodné veličiny. Tím získáme rozdělení, keré má opě pouze n bodů nespojiosi je řešeovié a algorimus nenabývá na výpočové náročnosi. Poče veličin k d 1 Očišěná pro p =0, 1 Oběma sousedům 1 1 0,19 1 8 3 1 4,41373116 8 18 7 448 31,487656 56 104 10 510 4035,89814 816 819 13 5348 44575,185 867 Nyní ješě zbývá popsa meodu jak získa m-é konvoluce pro libovolné m IN. Nejprve najdu nejvěší l akové, že l m a pro něj najdu aproximaci m/ l -é konvoluce. Tu najdeme ak, že ve všech dříve vyvořených aproximacích i -ých konvolucí vynecháme body a přeneseme jejich pravděpodobnosi do nejbližších nižších sousedů, násobků kroku m/l δ. Too shluknuí nám způsobí u každé veličiny chybu m/l 1 δ. Konvoluce ako vzniklých aproximací nám pak dáva aproximaci požadované konvoluce m/l, na kerou pak provedeme l kroků původního algorimu. Při omo posupu se zvyšuje poče bodů, ale en nikdy nepřesáhne n. Záleží edy pouze na zvoleném δ jak přesná bude ao aproximace. Algorimus je možné uvažova za spočiaelný pro n řádu 10 4, neboť má výpočovou složios přibližně (n) k. V případě exponenciálního rozdělení je pořeba uvažova ješě disanci původní náhodné veličiny C i Exp(θ) odjejíaproximacek i a jejich příslušných konvolucí d 1 (Ci k,ki k ) k+1 δ, vzhledem k vlasnosem meriky d 1 plaí i pro obecné m vzah d 1 (C1 m,ki m ) mδ. Škoda X i := C i D i má nenulovou pravděpodobnos P (X i = 0). Proo při jednolivých krocích algorimu bude mí neshluknuá náhodná veličina určiou pravděpodobnos oho, že je rovna nule. S ouo pravděpodobnosí shluknuí nic neudělá. O uo hodnou je proo možné odhad očisi (viz. příklad v abulce). 4. Srovnání aproximačních meod Pro konkréní příklady zvolme různé počy smluv n, rozdělení s různou pravděpodobnosí výskyu škody p, ale její výši ponechme sejnou ak, jak vyjde v příkladu uvedeném ve IV-é kapiole,.j. θ =0, 13.
Srovnání aproximačních meod v eorii rizika 55 Formulka číslo 1 3 4 n 10000 10000 1000 1000 p 0,1 0,01 0,1 0,01 θ 0,13 0,13 0,13 0,13 (1) 60,00 6,000 6,000,6000 () 4,74 0,59,474 0,059 (3) 5,98 0,60,598 0,060 (4) 13,1 4,149 4,149 1,310 (5) 6,4 0,655,03 0,07 (6) 174,97 1,759 17,497 0,1759 (7) 6,13 0,59 1,939 0,187 (8) 6,63 0,065 0,663 0,0065 (9) 4,01 3,44 4,006 3,445 Numericky 5,19 3,851 0,88 0,1865 Je zřejmé, že neexisuje univerzální odhad nejlepší pro všechny kombinacie n a p. Pro vysoká n a p je nejlepším odhadem aproximace přes normální rozdělení (9), pro malá p je nejlepší odhad přes meriku d (5) a (7), či přímý odhad (8). 5. Příklad zpraxe V předešlých kapiolách jsme se zabývali rozdílem pro exponenciální rozdělení C i. Nebyla ovšem řešena oázka jak dobrou aproximací je použií ohoo rozdělení míso skuečného rozdělení. Následující graf ukazuje jak vypadá rozdíl disribučních funkcí výše škody získané z da jedné pojišťovny (z havarijního pojišění au) vůči exponenciálnímu rozdělení se sejnou sřední hodnoou. Poznamenejme, že hodnoa meriky d 1 pro skuečnou výši škod a její exponenciální aproximaci zachovávající sřední hodnou je 0,005183, což předsavuje 4,4589% sřední hodnoy výše škod. Teorie Praxe
56 Marin Rokovský 6. Lieraura [1] Gerber, H. (1981): An Inducion o Mahemaical Risk Theory. Huebner Foundaion Monograph. [] Rachev, S.T.(1991): Probabiliy Merics and he Sabiliy of Sochasic Models. John Wiley & Sons [3] Rokovský, M.(1999): WDS 99 Proceedings of conribued papers. Mafyzpress [4] Zoloarev, V. M.(1976): Meric disances in spaces of random variables and heir disribuions. Mah. USSR sb. 30 [5] Zoloarev, V. M.(1986): Conemporary Thery of Summaion of Random Variables. Nauka, Moscow. (In Russian) and heir disribuions. Mah. USSR sb. 30 UK MFF, KPMS, Sokolovská 83, 186 75 Praha 8 E-mail address: rokovsk@karlin.mff.cuni.cz