Univerzita Karlova v Praze Matematicko-fyzikální fakulta

Rozměr: px
Začít zobrazení ze stránky:

Download "Univerzita Karlova v Praze Matematicko-fyzikální fakulta"

Transkript

1 Univerzita Karlova v Praze Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE Ludmila Obdržálková Modelování výše škod v čase pomocí kopul Katedra pravděpodobnosti a matematické statistiky Vedoucí diplomové práce: Mgr. Jan Šváb, Ph.D. (Kooperativa) Studijní program: Matematika, Finanční a pojistná matematika 29

2 Na tomto místě bych ráda poděkovala vedoucímu diplomové práce Mgr. Janu Švábovi, PhD. za cenné rady, připomínky a za vstřícný přístup při psaní této diplomové práce. Můj dík dále patří pojišt ovně Kooperativa za poskytnutá data k výpočtům. A v neposlední řadě mým rodičům, rodině a přátelům za podporu a trpělivost, kterou mi během psaní této práce věnovali. Prohlašuji, že jsem svou diplomovou práci napsala samostatně a výhradně s použitím citovaných pramenů. Souhlasím se zapůjčováním práce a jejím zveřejňováním. V Praze dne.7.29 Ludmila Obdržálková 2

3 Obsah Úvod 5 Kopuly 7. Definice Sklarova věta Vlastnosti kopul Míry závislosti Základní rodiny kopul Gaussova kopula Studentova t kopula Fréchetova rodina Archimédovské kopuly Modelování výše škod, výpočet rozdělení IBNR rezervy 9 2. Vstupní data Určení marginálních rozdělení Výběr kopuly Simulace Určení počtu vzniklých škod Určení počtu nenahlášených škod Výpočet rozdělení IBNR rezervy Závěr 45 Literatura 47 3

4 Název práce: Modelování výše škod v čase pomocí kopul Autor: Ludmila Obdržálková Katedra: Katedra pravděpodobnosti a matematické statistiky Vedoucí diplomové práce: Mgr. Jan Šváb, Ph.D., Kooperativa pojišt ovna, a.s., VIG vedoucího: jsvab@koop.cz Abstrakt: V předložené práci je navržen a popsán stochastický přístup výpočtu IBNR rezervy založený na modelování výší škod v čase pomocí kopul. První kapitola vymezuje základní pojmy teorie kopul a dává ucelený přehled o jejich nejznámějších rodinách. Druhá kapitola se věnuje jednotlivým krokům výpočtu IBNR rezervy. Výpočet je demonstrován numericky na datech havarijního pojištění. Výsledné rozdělení je porovnáno s rozdělením získaným z Mackova modelu pro metodu Chain ladder. Klíčová slova: kopula, Archimédovská kopula, IBNR rezerva, zobecněné lineární modely Title: Modelling the Loss Development in Time with Aid of Copulas Author: Ludmila Obdržálková Department: Department of Probability and Mathematical Statistics Supervisor: Mgr. Jan Šváb, Ph.D., Kooperativa pojišt ovna, a.s., VIG Supervisor s address: jsvab@koop.cz Abstract: There is proposed and described stochastic approach of calculation of IBNR reserve based on modelling loss development in time using copulas in this thesis. The first chapter determinates basic terms of copula theory and gives compact summary of most widely known copula families. Particular steps of calculation of IBNR reserve follow in the second chapter. The calculation is demonstrated numerically over the casco insurance. The resultant distribution is compared with distribution obtained by Mack s model for the Chain ladder method. Keywords: copula, Archimedean copula, IBNR reserve, general linear models 4

5 Úvod Zákonnou povinností každé pojišt ovny je vytvářet technické rezervy v takové výši, aby byla schopná dostát závazkům vyplývajících z převzatých rizik. Jednou z povinných rezerv je i rezerva na pojistná plnění (někdy nazývaná škodní rezervou). Rezerva na pojistná plnění má jak v životním, tak v neživotním pojištění dvě hlavní složky: rezervu na pojistná plnění z pojistných událostí do rozvahového dne nahlášených, ale doposud nezlikvidovaných (reported but not settled, RBNS), a rezervu na pojistná plnění z pojistných událostí, které nastaly do rozvahového dne, ale doposud nebyly nahlášeny (incurred but not reported, IBNR). Výše IBNR rezervy se často stanovuje pomocí metod pracujících s vývojovými trojúhelníky (např. metodou Chain ladder). Cílem této práce ovšem bude navrhnout a popsat stochastický přístup stanovení IBNR rezervy založený na modelování výše škod v čase pomocí kopul. Kopuly jsou nástrojem, který slouží ke konstrukci sdružených distribučních funkcí z jejich distribučních funkcí marginálních. To vše při zachování závislostní struktury. Ve finanční a pojistné matematice se kopuly začaly používat hlavně v posledním desetiletí a i za tuto krátkou dobu našly velké množství uplatnění. Např. Frees a Valdez [2] použili kopuly k modelování výší škod a likvidačních nákladů a následně ukázali, jak pomocí odhadnuté kopuly spočíst výši zajistného; Cherubini [4] použil kopuly k oceňování opcí a Pettere a Kollo [], jejichž článek byl podnětem pro vznik této práce, použili kopuly k modelování škodní rezervy lotyšské pojišt ovny. V první kapitole se seznámíme s teorií kopul, od definice pojmu, základních vlastností, až po příklady běžně používaných kopul. Důraz bude kladen na Archimédovské kopuly. V druhé kapitole se již budeme věnovat stanovení výše IBNR rezervy. Kapitola bude rozčleněna do sedmi částí korespondujících s jednotlivými kroky námi návrženého postupu. V prvních dvou částech se seznámíme s modelovanými dvourozměrnými daty (výše škody a doba mezi vznikem a nahlášením škody) a určíme jejich marginální rozdělení. Třetí část bude věnována identifikaci Archimédovské kopuly, která nejlépe popisuje zkoumaná data. Z této kopuly budou ve čtvrté části nasimulovány výše škod odpovídající daným zpožděním v nahlášení. V páté části se budeme věnovat 5

6 počtům vzniklých škod. K odhadu parametrů jejich rozdělení budou použity zobecněné lineární modely. Postup, kterým z nagenerovaných počtů vzniklých škod získáme počet škod nenahlášených, bude uveden v šesté části. Závěrečná sedmá část použije výsledky částí předchozích a seznámí nás se vzorcem, který jsme navrhli pro stanovení výše IBNR rezervy. Stanovená hodnota IBNR rezervy bude porovnána s hodnotou získanou metodou Chain ladder a také s reálnými daty. Porovnána budou také rozdělení IBNR rezervy získaná oběma metodami. K výpočtům v této práci bude použit program Matlab verze 7. (R4). 6

7 Kapitola Kopuly Pojem kopula pochází z latinského slova copula, kterým se označuje pouto, provaz, řemen nebo hák. V gramatice je výrazem pro jazykovou sponu. V matematickém významu jej poprvé použil A. Sklar roku 959 ve své korespondenci s M. Fréchetem. Pojmenoval takto funkci spojující sdruženou distribuční funkci s jejími jednorozměrnými marginálními distribučními funkcemi. Až do roku 976 byly kopuly zkoumány hlavně v souvislosti s pravděpodobnostními metrickými prostory. Teprve později (hlavně v posledním desetiletí) se teorie kopul a jejich aplikace začala používat ve financích a pojišt ovnictví. Přestože jsou kopuly v tomto oboru v počátcích výzkumu a ještě zde existuje množství nedořešených otázek, těší se stále rostoucí oblibě. Kromě financí a pojišt ovnictví našly kopuly uplatnění také v teorii rizika, enviromentálních studiích (hydrologie, geologie,...) atd. O historii kopul lze více nalézt v [9], [2].. Definice V této práci se budeme zabývat pouze dvourozměrným případem. Definice Kopula je funkce C : [, ] 2 [, ], pro niž platí:. C(u, ) = = C(,v), u,v [, ]; 2. C(u, ) = u,c(,v) = v, u,v [, ]; 3. C(u 2,v 2 ) C(u 2,v ) C(u,v 2 )+C(u,v ), pro každé u,u 2,v,v 2 z [, ] takové, že u u 2,v v 2. Definice ze Slovníku lingvistických termínů pro filology (Edvarda Lotka, 25): kopula = sponové sloveso typu být (je, není), stát se vyjadřující více či méně jen predikační vztah mezi subjektem a nominální částí predikátu v kategorickém soudu, spona. 7

8 Z definice vyplývá, že máme-li dvojici náhodných veličin (U,V ) s rovnoměrným rozdělením na [, ], pak kopula C je jejich sdruženou distribuční funkcí: C(u,v) = P(U u,v v). Necht X a Y jsou náhodné veličiny s distribuční funkcí F X resp. F Y. F X (X) a F Y (Y ) jsou rovnoměrně rozložené, tedy F X (X) = U a F Y (Y ) = V. Protože kopuly jsou sdružené distribuční funkce rovnoměrně rozložených distribučních funkcí, můžeme snadno ukázat, že kopula spočtená v F X (x),f Y (y) dává sdruženou distribuční funkci F X,Y (x,y): C(F X (x),f Y (y)) = P(U F X (x),v F Y (y)) = P(F X (U) x,fy (V ) y) = P(X x,y y) = F X,Y (x,y) (.).2 Sklarova věta Sklarova věta je jednou z nejdůležitějších vět teorie kopul. Ukazuje nejenom, že kopuly jsou sdruženými distibučními funkcemi (viz vztah (.)), ale také, že ke každé sdružené distribuční funkci existuje kopula zapsaná pomocí marginálních distribučních funkcí, která zachovává závislostní strukturu. Věta (Abe Sklar, 959) Necht F X,Y je sdružená distribuční funkce s marginálními distribučními funkcemi F X a F Y. Potom existuje kopula C : [, ] 2 [, ] taková, že F X,Y (x,y) = C(F X (x),f Y (y)) (.2) pro každé (x,y) R 2. Pokud jsou F X (x),f Y (y) spojité, kopula je určena jednoznačně. V opačném případě je kopula určena jednoznačně pro každé (x,y) (obor hodnot F X obor hodnot F Y ). Obráceně, je-li C kopula a F X,F Y jsou marginální distribuční funkce, pak funkce F X,Y určená vztahem (.2) je sdruženou distribuční funkcí s danými marginálami F X a F Y. Důkaz: uveden v [9], str. 2 Důsledek Za platnosti předpokladů Sklarovy věty je (jednoznačná) kopula C určena vztahem C(u,v) = F(F X (u),fy (v)). 8

9 .3 Vlastnosti kopul Zezdola i zeshora je každá kopula omezena Fréchetovou mezí: W(u,v) = max(u + v, ) C(u,v) min(u,v) = M(u,v) kde (u,v) [, ] 2. Dolní Fréchetova mez (tzv. minimální kopula) W(u,v) bývá také označována C. Reprezentuje perfektní negativní závislost mezi proměnnými. Perfektní pozitivní závislost je naopak představována horní Fréchetovou mezí (tzv. maximální kopulou) M(u,v), která se také označuje C +. Grafické znázornění maximální a minimální kopuly je uvedeno na o- brázku Obrázek.: Maximální a minimální kopula (zleva). Existence horních a dolních mezí nás přivádí k definici konkordačního uspořádání, které je uspořádáním částečným: Definice 2 (Konkordanční uspořádání) Kopula C je menší než kopula C 2 - píšeme C C 2, pokud C (u,v) C 2 (u,v) pro každé (u,v) [, ] 2. Další důležitou vlastností kopulí je, že jsou invariantní vůči striktně rostoucím transformacím náhodných veličin: Věta 2 (Schweizer & Wolf, 976, 98) Necht X, Y jsou spojité náhodné veličiny s marginálními distribučními funkcemi F,F 2 a kopulou C. Pokud jsou α,α 2 striktně rostoucí funkce, pak náhodné veličiny α (X),α 2 (Y ) s marginálními distribučními funkcemi H = F (α ), H 2 = F 2 (α2 ) a sdruženou distribuční funkcí H mají také kopulu C: H(u,t) = P(α (X) u,α 2 (Y ) t) H(u,t) = C(H (u),h 2 (t)). 9

10 Kopuly bývají často nazývány závislostními funkcemi (poprvé Deheuvels, 978). Vztahy mezi kopulami a některými mírami závislosti jsou popsány v následující části této kapitoly. Dále budeme předpokládat, že X a Y jsou spojité náhodné veličiny..4 Míry závislosti Nejznámější mírou závislosti je Pearsonův korelační koeficient: ρ X,Y = cov(x,y ) var(x)var(y ) Ten měří lineární závislost mezi veličinami. Pearsonův korelační koeficient nelze vyjádřit pouze pomocí kopuly, protože závisí i na marginálním rozdělení. Podívejme se proto na dvě jiné robustnější míry závislosti, které jdou vyjádřit pouze pomocí kopuly a které jsou navíc invariantní vůči striktně rostoucí nelineární transformaci. Jedná se o Kendallovo τ a Spearmanovo ρ S. Obě měří závislost ve formě zvané konkordance: Definice 3 Dvě pozorování (x,x 2 ), ( x, x 2 ) z náhodného vektoru (X,X 2 ) jsou konkordantní právě tehdy, když q = (x x )(x 2 x 2 ) >. Pokud platí obrácená nerovnost, jsou diskordantní. Pár náhodných veličin je tedy konkordantní, pokud se velké (resp. malé) hodnoty jedné proměnné zpravidla objevují s velkými (resp. malými) hodnotami druhé proměnné. Kendallovo τ je definováno jako rozdíl mezi pravděpodobností konkordance a pravděpodobností diskordance: τ(x,y ) = P[(X X 2 )(Y Y 2 ) > ] P[(X X 2 )(Y Y 2 ) < ], kde (X,Y ), (X 2,Y 2 ) jsou dva nezávislé vektory se stejným rozdělením, jaké má vektor (X,Y ). Odhad Kendallova koeficientu pro n nezávislých pozorování (X,X 2 ),...,(X n,x 2n ) z dvourozměrného náhodného vektoru (X,Y ) získáme ze vztahu: ( ) n τ n = sign [(X i X j ) (X 2i X 2j )], (.3) 2 i<j který odpovídá intuitivní představě: τ = # počet konkordantních párů # počet diskordantních párů. # počet všech párů

11 Jak bylo uvedeno výše, jednou z výhod použití Kendallova koeficientu k měření závislosti je možnost jeho zapsání pouze pomocí kopule. Necht X,Y jsou náhodné veličiny s kopulou C, pak Kendallovo τ je dáno vztahem: τ = 4 C(u, v)dc(u, v). (.4) Spearmanovo ρ S je definováno jako korelace mezi U a V, kde U = F X (X) a V = F Y (Y ): ρ S (X,Y ) = ρ(u,v ) = E(UV ) E(U)E(V ) var(u)var(v ) Protože střední hodnota rovnoměrných rozdělení U a V je 2, můžeme dále psát: 2 a jejich rozptyl ρ S (X,Y ) = E(UV ) 4 = 2 = 2 2 = 2E(UV ) 3 uv dc(u,v) 3 = 2 [C(u,v) uv] du dv C(u,v) du dv 3 Souvislost pravděpodobnosti konkordance a diskordance se Spearmanovým koeficientem je ukázána v následující alternativní definici ρ S : Definice 4 Necht (X,Y ), (X 2,Y 2 ), (X 3,Y 3 ) jsou nezávislé stejně rozdělené vektory s kopulou C. Spearmanovo ρ S (X,Y ) je dáno vztahem: ρ S (X,Y ) = 3[P((X X 2 )(Y Y 3 ) > ) P((X X 2 )(Y Y 3 ) < )]. ρ S (X,Y ) je tedy definováno jako trojnásobek rozdílu pravděpodobnosti konkordance a pravděpodobnosti diskordance vektorů (X,Y ), (X 2,Y 3 ), tj. páru vektorů se stejnými marginálními rozděleními, ale různými sdruženými distribučními funkcemi. Zatímco první vektor má sdruženou distribuční funkci určenou kopulou C, komponenty druhého vektoru jsou nezávislé a sdružená distribuční funkce je rovna součinu marginálních rozdělení F(X)G(Y ). Odhad Spearmanova ρ S je dán vztahem: n i= ρ S = 6 (rank(x i) rank(y i )) 2. n(n 2 ) Podívejme se nyní na některé vlastnosti Kendallova τ a Spearmanova ρ S :

12 . τ(x,y ) = τ(y,x); ρ S (X,Y ) = ρ S (Y,X); 2. pokud jsou X a Y nezávislé, pak τ(x,y ) = ρ S (X,Y ) = ; 3. τ, ρ S [, ]; 4. τ(x,y ) = ρ S (X,Y ) = C = C + Y = T(X), T striktně rostoucí, tj. X a Y jsou komonotické; 5. τ(x,y ) = ρ S (X,Y ) = C = C Y = T(X), T striktně klesající, tj. X a Y jsou kontramonotické; 6. τ,ρ S jsou invariantní vůči striktně monotónním transformacím. Dalším příkladem konkordačních měr je koncová závislost (tail dependence). Nahlíží na konkordanci ve chvostech neboli extrémních hodnotách X a Y. Definice 5 Necht existuje konečná limita lim v P { X > F (v) Y > G (v) } = λ U Řekneme, že kopula C má závislost horních chvostů, pokud λ U (, ] a že kopula nemá závislost horních chvostů, pokud λ U =. Analogicky, necht existuje konečná limita lim v + P { X < F (v) Y < G (v) } = λ L Řekneme, že kopula C má závislost dolních chvostů, pokud λ L (, ] a že kopula nemá závislost dolních chvostů, pokud λ L =. Uved me ještě definici pozitivní kvadrantové závislosti (PQD, positive quadrant dependency): Definice 6 Dvě náhodné veličiny X a Y jsou pozitivně kvadrantově závislé pokud C(u,v) uv, pro každé (u,v) I 2. Alternativně, za použití konkordačního uspořádání, X a Y jsou PQD, pokud: C(u,v) C. C v definici 6 označuje tzv. součinovou kopulu C (u,v) = uv (jiné označení Π(u,v)). Platí, že veličiny X a Y jsou nezávislé, pokud mají součinovou kopulu. Proto také bývá součinová kopula velmi často označována jako nezávislá kopula. 2

13 .5 Základní rodiny kopul V této části budou představeny základní rodiny (třídy) dvourozměrných kopul. Největší pozornost bude věnována Archimédovským kopulám. Doposud jsme se seznámili se třemi základními kopulami. Minimální, nezávislou a maximální kopulou. Každou rodinu kopul, která bude obsahovat tyto tři základní kopuly, budeme nazývat komprehensivní. Rodiny kopul se liší formou závislosti, kterou reprezentují..5. Gaussova kopula Definice 7 Gaussova kopula je definována vztahem: C Ga (u,v) = Φ ρxy (Φ (u), Φ (v)), kde Φ ρxy je sdružená distribuční funkce dvourozměrného standardního normálního vektoru s lineárním korelačním koeficientem ρ XY a Φ je inverze standardní distribuční funkce normálního rozdělení. Odtud Φ (u) Φ (v) ( ) C Ga (u,v) = 2π 2ρXY st s 2 t 2 exp ρ 2 2( ρ 2 XY XY ) ds dt. Gaussově kopuli se často říká normální kopula, protože pro veličiny se standardním normálním rozdělením generuje sdruženou standardní normální distribuční funkci. Pro veličiny s jiným marginálním rozdělením než normálním tato vlastnost neplatí. Gaussova kopula patří mezi komprehensivní kopuly. Navíc je pozitivně uspořádaná vzhledem k lineárnímu korelačnímu koeficientu: C = C Ga ρ= C Ga ρ< C Ga ρ= = C C Ga ρ> C Ga ρ= = C +. Pokud ρ, nemá Gaussova kopula ani horní ani dolní závislost chvostů: { ρ < λ U = λ L = ρ =. Vliv korelačního koeficientu na hodnoty Gaussovy kopuly ukazuje obrázek.2 na straně Studentova t kopula Podobně jako je Gaussova kopula odvozena od normálního rozdělení, je Studentova kopula založena na Studentově t rozdělení o ν stupních volnosti. To má distribuční funkci: t ν (x) = x Γ((ν + )/2) ( + s2 ν+ πνγ(ν/2) ν ) 2 ds. 3

14 rho =.9 rho = Obrázek.2: Náhodný vzorek 5 dvojic (u,v) z Gaussovy kopuly pro ρ =.9 a ρ =.3. Definice 8 Studentova kopula C S ρ,ν je definovaná: C S ρ,ν(u,v) = t ρ,ν (t ν (u),t = t ν (u) t ν (v) ν (v)) 2π ρ 2 ( ) + s2 + t 2 ν+2 2 2ρst ν( ρ 2 ) kde ρ I a t ρ,ν je dvourozměrná distribuce odpovídající t ν. ds dt, Studentova kopula je pozitivně uspořádaná vzhledem k ρ (pro dané ν). Dosahuje horní a dolní hranice Fréchetových mezí (C,ν S = C, C,ν S = C + ), ale pro konečný počet stupňů volnosti neplatí C,ν S = C. Koncová závislost (tail dependency) Studentovy kopuly se mění s počtem stupňů volnosti ν. Pro nízké hodnoty ν (např. ν = 3) je koncová závislost velká, ale s rostoucími hodnotami klesá. Pro ν kopula konverguje ke Gaussově kopule. Že má Studentova kopula s ν = mnohem více pozorování ve chvostech než Gaussova kopula, lze vidět srovnáním obrázků.2 a Fréchetova rodina Definice 9 Dvouparametrická rodina kopul: C F (u,v) = pc + ( p q)c + qc + = p max(u + v, ) + ( p q)uv + q min(u,v), kde p,q I, p + q, se nazývá Fréchetova. Fréchetova třída je negativně uspořádaná vzhledem k p, pozitivně uspořádaná vzhledem ke q. Je komprehensivní, protože pro p =, q = dostaneme dolní Fréchetovu mez C, pro p = q = získáme součinovou kopulu C a p =, q = dává horní Fréchetovu mez C +. 4

15 rho =.9 rho = Obrázek.3: Náhodný vzorek 5 dvojic (u, v) ze Studentovy kopuly s jedním stupněm volnosti pro ρ =.9 a ρ = Archimédovské kopuly Důležitou třídu kopul s širokým uplatněním představují Archimédovské kopuly. Jejich výhodou je snadná zkonstruovatelnost. Umožňují totiž vyjádřit vícerozměrnou Archimédovskou kopulu pomocí jednorozměrné funkce, tzv. generátoru. Díky tomu, že generátor určuje Archimédovskou kopulu jednoznačně, je tato třída velmi rozmanitá na rodiny kopul se spoustou hezkých vlastností. Definice Necht φ je spojitá, klesající a konvexní funkce φ : [, ] [, ], φ() = a necht φ [ ] je pseudo-inverze φ: { φ φ [ ] (u) = (u), u φ(), φ() u Pak funkci C φ (u,v) = φ [ ] (φ(u) + φ(v)), kde u,v (, ], nazveme Archimédovskou kopulou. Funkce φ se nazývá generátor kopuly C φ. Pokud φ() =, funkce φ je striktní generátor. V tomto případě platí, že φ [ ] = φ a C φ (u,v) = φ (φ(u) + φ(v)) se nazývá strikní Archimédovská kopula. Archimédovské kopuly jsou symetrické, asociativní, tj. C φ (C φ (u,v),w) = C φ (u,c φ (v,w)) pro všechna u,v,w [, ], a platí, že pro libovolnou konstantu c > je cφ také generátorem kopuly C φ. 2 2 Důkaz: Necht u,v,w [,], c > je libovolná konstanta. Pak: (a) symetrie: C φ (u,v) = φ (φ(u) + φ(v)) = φ (φ(v) + φ(u)) = C φ (v,u) 5

16 Podívejme se nyní na Archimédovské kopuly z hlediska závislosti. Zatímco k vyjádření Kendallova τ je obecně zapotřebí určit hodnotu dvojného integrálu ze vztahu.4, pro Archimédovskou kopulu je situace mnohem jednodušší. Kendallovo τ může být vyjádřeno přímo z generátoru kopuly jako: τ = 4 φ(t) φ (t) Vztah.5 dostaneme ze vztahu.4 následovně: τ = 4 = 4 = 3 4 dt + (.5) C φ (u,v)dc φ (u,v) = 4 E(C φ (U,V )) = t dk φ (t) [ t φ(t) φ (t) per partes ] = 3 4 K φ (t) dt = φ(t) dt = 4 φ (t) dt + V odvození vztahu.5 byla použita Kendallova distribuční funkce K φ (t) = t φ(t) kopuly C φ (t) φ. Že je Archimédovská kopula C φ určena Kendallovou distribuční funkcí K φ jednoznačně, plyne z věty 3. Této vlastnosti později využijeme k výběru nejlepší Archimédovské kopuly. Věta 3 (Genest a Rivest, 993) Necht X a Y jsou rovnoměrně rozložené náhodné veličiny se závislostní funkcí C(x,y) tvaru φ (φ(x) + φ(y)) a φ je konvexní klesající funkce definovaná na (, ] s vlastností φ() =. Necht U = φ(x)/ {φ(x) + φ(y )},V = C(X,Y ) a λ(v) = φ(v)/φ (v), kde < v. Pak (a) U je rovnoměrně rozložené na (, ); (b) V má na (, ) rozdělení dané distribuční funkcí K(v) = v λ(v); (c) U a V jsou nezávislé náhodné veličiny. Důkaz: uveden v [3], str. 4 Generátor Archimédovské kopuly určuje také její koncovou závislost (tail dependency). Necht φ je generátor kopuly C φ (u,v) = φ (φ(u)+φ(v)). Pak koeficienty koncové závislosti jsou dle Nelsena [9] určeny vztahy: λ U = 2 lim v C φ (v,v) v = 2 lim x + φ [ ] (2x) φ [ ] (x) = 2 lim v φ [ ] (2φ(v)) v (b) asociativnost: C φ (C φ (u,v),w) = φ (φ[φ (φ(u) + φ(v))] + φ(w)) = φ (φ(u) + φ(v) + φ(w)) = φ (φ(u) + φ[φ (φ(v) + φ(w))]) = C φ (u,c φ (v,w)) (c) C cφ (u,v) = φ ( c [cφ(u) + cφ(v)]) = φ ( c [c(φ(u) + φ(v))]) = φ (φ(u) + φ(v)) = C φ (u,v). 6

17 C φ (v,v) λ L = lim v + v φ [ ] (2φ(v)) = lim v + v φ [ ] (2x) = lim x + φ [ ] (x). Volbou generátoru určujeme rodinu nebo podtřídu Archimédovských kopul. Nejznámější jednoparametrické Archimédovské rodiny a jejich generátory jsou uvedeny v tabulce.. 3 Náhodný vzorek z nich pak na obrázku.4 na straně 8. Rodina Generátor φ(t) Parametr α Dvourozměrná kopula C φ (u,v) Nezávislá ln(t) - uv Claytonova t α α > (u α + v α ) /α Gumbelova ( ln t) α α exp { [( ln u) α + ( ln v) α ] /α} ( ) Frankova ln eαt e α < α < α ln + (eαu )(e αv ) e α Tabulka.: Archimédovské kopuly a jejich generátory. Claytonova kopula v limitním případě α nabývá horní Fréchetovy meze C +. Má dolní závislost chvostů s koeficientem λ L = 2 /α. Vztah Kendallova τ a parametru α Claytonovy kopuly je definován jako: τ = α (.6) α + 2 Za povšimnutí stojí, že díky hodnotám parametru α a jeho pevně danému vztahu s Kendallovým τ nepočítá Claytonova kopula s negativní závislostí ani s nezávislostí. Další kopulou z tabulky. je Gumbelova kopula. Jejími speciálními případy jsou C = C,C = C +. Vidíme tedy, že volbou parametru α můžeme interpolovat mezi nezávislostí a perfektní pozitivní závislostí. S negativní závislostí se opět nepočítá. Gumbelova kopula má závislost horních chvostů s koeficientem λ U = 2 2 /α. Vztah Kendallova τ a parametru α Gumbelovy kopuly je definován jako: τ = α (.7) Frankova kopula je narozdíl od předchozích dvou kopul radiálně symetrická, tj. C(u,v) = C( u, v) + u + v. Je komprehensivní: C = C,C = C,C = C + Dovoluje jak pozitivní tak negativní závislost a nemá ani horní ani dolní koncovou závislost. Vztah Kendallova τ a parametru α Frankovy kopuly je definován jako: τ = 4 α {D ( α) }, 3 Ucelený přehled více než 2 jednoparametrických Archimédovských kopul lze nalézt v [6] nebo [9]. 7

18 kde D označuje tzv. Debye funkci definovanou jako: D k (x) = k x x t k e t dt, pro k =, 2. Pro záporné argumenty Debye funkce D k platí (Frees a Valdez [2]): D k ( x) = D k (x) + kx k +. Pomocí Debye funkce se dá vyjádřit také vztah Spearmanova ρ S pro Frankovu kopulu jako: ρ S = 2 α {D 2( α) D ( α)}. U2 U2 Claytonova kopula, α = U Gumbelova kopula, α = U U2 U Frankova kopula, α =.4.5 U Nezavisla kopula U Obrázek.4: Náhodný vzorek 5 dvojic (u, v) z Archimédovských kopul. Uvedené parametry α byly spočteny pro τ =.7. 8

19 Kapitola 2 Modelování výše škod, výpočet rozdělení IBNR rezervy Ne všechny škody, které vzniknou v určitém období, jsou v tomto období také nahlášeny. Rezerva, která slouží ke krytí pojistných plnění z takovýchto škod se nazývá IBNR rezerva. V této kapitole bude popsán postup, který jsme použili k stanovení její výše s využitím teorie o Archimédovských kopulách. V první části této kapitoly se seznámíme s daty, která jsme měli k dispozici, definujeme dvě zkoumané veličiny - výši škod a dobu mezi vznikem a nahlášením škody - a stanovíme datum, ke kterému jsme výši IBNR rezervy odhadovali. V druhé části uvedeme postup vedoucí k určení marginálních rozdělení zkoumaných veličin. Třetí a čtvrtá část této kapitoly jsou věnovány identifikaci nejvhodnější Archimédovské kopuly a následnému nasimulování odpovídajících dvourozměrných výstupů. Pátá část se zabývá počty škod, které vznikly v jednotlivých dnech zkoumaného období, šestá část pak počty v tomto období nenahlášených škod. Závěrečná sedmá část pracuje s výsledky z částí předchozích a používá je ke stanovení výše IBNR rezervy ve sledovaném období. Získaná hodnota je následně porovnána s hodnotou IBNR rezervy spočtenou pomocí metody Chain ladder a s reálnými daty. Srovnána jsou také rozdělení IBNR rezervy získaná oběma metodami. 2. Vstupní data K dispozici jsme měli data o škodách z havarijního pojištění společnosti Kooperativa z let 99-27, tedy o škodách na motorovém vozidle způsobené Kooperativa pojišt ovna, a.s., Vienna Insurance Group. 9

20 Míra inflace (%) 56,6, 2,8, 9, 8,8 8,5,7 2, Koeficient 4,8 2,629 2,367,959,78,633,5,383, Míra inflace (%) 3,9 4,7,8, 2,8,9 2,5 2,8 Koeficient,224,78,25,5,4,74,54,28, Tabulka 2.: Míra inflace vyjádřená přírůstkem průměrného ročního indexu spotřebitelských cen a koeficient míry inflace vztažený k..28. havárií, živelnou událostí, krádeží nebo např. vandalismem. Údaje obsahovaly datum vzniku škody, datum jejího nahlášení, datum registrace škody (tj. uložení do systému společnosti) a také údaj o výši vyplacené částky za škodu společně s aktuální výší rezervy. Každou škodu v našem modelu jsme charakterizovali dvěmi náhodnými veličinami: výší škody a dobou mezi vznikem a nahlášením škody ve dnech. Výše škody Pracovali jsme s tzv. nenulovými škodami. Škody s nulovou výší výplaty (např. bezpředmětná pojistná událost nesplňující pojistné podmínky nebo nahlášená a doposud nevyřízená pojistná událost) jsme nevybrali. Protože údaje o výších škod pocházely z několikaletého horizontu, zohlednili jsme inflaci. V tabulce 2. lze nalézt roční míru inflace stanovenou Českým statistickým úřadem a také koeficient, kterým jsme přenásobili výše škod registrované v příslušném roce. Veškeré výpočty byly dále prováděny s hodnotami vztaženými k..28. Inflace již nebyla znovu zahrnuta. Doba mezi vznikem škody a jejím nahlášením Tuto veličinu jsme definovali jako počet dní mezi datem nahlášení škody a datem jejího vzniku. Protože 99,9 % škod bylo nahlášeno do 649 dní (necelé dva roky), pracovali jsme s předpokladem, že je každá škoda nahlášena do tří let (95 dní) od svého vzniku. Abychom mohli výši IBNR rezervy na závěr porovnat nejen s výsledkem spočteným metodou Chain ladder, ale také s reálnými daty, byla IBNR rezerva počítána k Tedy pro škody vzniklé v období od..22 do a k nenahlášené. Pro lepší aproximaci marginálního rozdělení veličiny doby mezi vznikem škody a jejím nahlášením jsme přidali údaje o škodách s již ukončeným vývojem a pracovali tak s daty z let 2 až 24. 2

21 Výše škody Doba mezi vznikem a nahlášením škody Počet Střední hodnota Medián Směrodatná odchylka Rozptyl Šikmost Špičatost Minimum Maximum percentil percentil percentil Tabulka 2.2: Souhrn charakteristik obou zkoumaných veličin. 2.2 Určení marginálních rozdělení Prvním krokem našeho postupu bylo určení marginálních rozdělení obou zkoumaných veličin. Veličinu popisující výše škod jsme označili X. Jak lze vidět z tabulky 2.2, která popisuje základní charakteristiky obou veličin, výše škod se vyznačují velkou šikmostí (koeficient šikmosti má hodnotu ) a četností menších škod. Veličinu X jsme modelovali pomocí následujících rozdělení: exponenciálního, Gama, Weibullova a logaritmicko-normálního. Využili jsme dfittool programu Matlab, který odhaduje parametry jednotlivých rozdělení pomocí metody maximální věrohodnosti a navíc umožňuje grafické srovnání fitovaných distribučních funkcí s empirickou distribuční funkcí. Nejvhodnější rozdělení jsme vybrali právě na základě tohoto grafického porovnání. Ze zkoumaných rozdělení data nejlépe aproximuje logaritmicko-normální rozdělení s parametry µ = a σ =.3898, které má hustotu tvaru: f(x µ,σ) = 2πσx e (ln x µ)2 /2σ 2, x >. Na obrázku 2.(a) je pravděpodobnostní graf všech uvažovaných rozdělení. Obrázek 2.(b) srovnává empirickou distribuční funkci výše škod s distribuční funkcí zvoleného logaritmicko-normálního rozdělení. Díky typickému rysu havarijního pojištění, tj. větší četnosti menších škod, uvádíme srovnání empirické a teoretické distribuční funkce pouze pro hodnoty do 35 Kč (pro vyšší hodnoty jsou rozdíly obou distribučních funkcí zanedbatelné). Veličinu charakterizující zpoždění v nahlášení jsme označili Y. Podobně jako výše škod i doba mezi vznikem a nahlášením škod se vyznačuje velkou 2

22 Pravdepodobnost X data Exponencialni Weibullovo Gama Log normalni Data x 6 (a) Pravděpodobnostní graf pro modelovaná rozdělení Distribucni funkce Empiricka distribucni funkce Teoreticka distribucni funkce Data x 5 (b) Srovnání empirické a teoretické distribuční funkce Obrázek 2.: Fitování výše škod. 22

23 Pravdepodobnost Y data Exponencialni Weibullovo Gamma Log normalni Data (a) Pravděpodobnostní graf pro modelovaná rozdělení Distribucni funkce Empiricka distribucni funkce Teoreticka distribucni funkce Data (b) Srovnání empirické a teoretické distribuční funkce Obrázek 2.2: Fitování doby mezi vznikem a nahlášením škody. 23

24 šikmostí (koeficient šikmosti je 7.538) a velkou četností malých hodnot. Modelovali jsme ji pomocí stejných rozdělení jako veličinu X. Opět bylo zvoleno logaritmicko-normální rozdělení, tentokrát s parametry µ = a σ =.264. Grafy odpovídající fitování doby mezi vznikem škody a jejím nahlášením jsou na obrázku Výběr kopuly V druhém kroku našeho postupu jsme nalezli Archimédovskou kopulu, která nejlépe modelovala zkoumaná dvourozměrná data (X, Y ). Použili jsme k tomu proceduru popsanou pány Genest a Rivest v roce 993 [3]. Před tím, než uvedeme konkrétní výsledky této procedury, seznamme se s ní teoreticky. Předpokládejme, že máme nezávislá pozorování (X,Y ),...,(X n,y n ) z dvourozměrného rozdělení se sdruženou distribuční funkcí H X,Y (x,y), marginálními distribučními funkcemi F(x), G(y) a kopulou C. Dále předpokládejme, že kopula C je tvaru C(u,v) = φ (φ(u) + φ(v)), kde φ je spojitá, klesající a konvexní funkce definovaná na (, ], φ() =. Předpokládáme tedy Archimédovskou kopulu s generátorem φ. Procedura Genest-Rivest identifikuje Archimédovskou kopulu C, která je svými hodnotami nejblíže sdružené distribuční funkci H X,Y, ve třech krocích a pracuje s nepozorovatelnou veličinou Z i = H X,Y (X i,y i ), i =,...,n. Distribuční funkce této veličiny K(z) = P(Z i z) je s generátorem φ Archimédovské kopuly spojena vztahem K(z) = z φ(z), který plyne z věty 3. φ (z) Procedura Genest-Rivest (993). Spočteme neparametrický odhad Kendallova korelačního koeficientu: τ n = ( ) n sign [(X i X j ) (Y i Y j )] 2 i<j 2. Zkonstruujeme neparametrický odhad empirické distribuční funkce K: (a) V prvním kroku zadefinujeme pseudopozorování Z i : Z i = # {(X j,y j );X j < X i Y j < Y i }/(n ),i =,...,n (b) Ve druhém kroku odhadneme distribuční funkci K následujícím způsobem: K n (z) = # {Z i;z i z}. n 24

25 3. Určíme parametrický odhad distribuční funkce K použitím vztahu: K φ (z) = z φ(z) φ (z) (2.) Rodina Vztah mezi τ a α K φ (z,α) Claytonova α = 2τ τ Gumbelova α = τ Frankova τ = 4 α + 4 α 2 α z dz e z z ln z zα+ z α z z ln z α e αz e α α (e αz ) Tabulka 2.3: Vztahy pro získání parametru α z Kendallova τ a vztahy pro parametrické odhady distribuční funkce K pro různé rodiny Archimédovských kopul. Tvary funkce K φ (z) pro Claytonovu, Gumbelovu a Frankovu kopulu jsou uvedeny v tabulce 2.3. Krok 3 opakujeme pro různé volby generátoru φ. Každý parametrický odhad K φ (z) poté porovnáváme s neparametrickým odhadem K n (z) zkonstruovaným ve druhém kroku. Na závěr vybereme takovou kopulu, a tedy generátor φ, pro kterou je parametrický odhad K φ (z) nejbližší neparametrickému odhadu K n (z). Blízkost můžeme porovnat následujícími způsoby:. Graficky: (a) vykreslením grafu K n (z) a K φ (z) proti z, (b) vykreslením příslušných Q-Q grafů. 2. Numericky: (a) Frees a Valdez [2] navrhují zvolit takovou kopulu, která minimalizuje vzdálenost [K φ(z) K n (z)] 2 dk n (z), (b) Pettere a Kollo [] přidávají srovnání hodnoty z (a) spočtené jako n i= [K φ(z) K n (z)] 2 s hodnotou funkce K φ (z) K n (z). Nejprve jsme tedy spočetli neparametrický odhad Kendallova korelačního koeficientu zkoumaných dat (X,Y ) a získali hodnotu τ =.376. Pro srovnání hodnota Spearmanova korelačního koeficientu zkoumaných dat je ρ S =.568 a Pearsonův lineární korelační koeficient je roven ρ X,Y =.47. Protože nám odhad Kendallova τ vyšel záporně a jak Claytonova, tak Gumbelova kopula nedovolují pracovat s negativní závislostí, použili jsme 25

26 pro účely výběru nejvhodnější kopuly v druhém a třetím kroku procedury Genest-Rivest kladnou hodnotu τ =.376, tj. pracovali jsme s veličinami X a Y. Neparametrický odhad K n (z) druhého kroku procedury jsme se rozhodli porovnat s parametrickými odhady K φ (z) Claytonovy, Gumbelovy a Frankovy kopuly. Bylo proto třeba určit hodnoty parametru α jednotlivých kopul odpovídající τ =.376. U Claytonovy a Gumbelovy kopuly jsme je získali ze vztahů.6 a.7. U Frankovy kopuly z funkce copulaparam( Frank,tau) programu Matlab. Hodnoty byly následující: Claytonova kopula.782 Gumbelova kopula.39 Frankova kopula.339 Dosazením těchto hodnot do vztahů pro K φ (z,α) uvedených v tabulce 2.3 jsme pak již snadno spočetli parametrické odhady distribuční funkce K. Výběr nejvhodnější Archimédovské kopuly byl proveden jak na základě grafického, tak i numerického porovnání parametrických odhadů K φ (z) distribuční funkce K s jejím neparametrickým odhadem K n (z). Ke třem zkoumaným Archimédovským kopulám jsme u grafického porovnání přidali také nezávislou kopulu. Grafy jsou uvedeny na obrázku 2.3. Z grafického srovnání vyšly nejlépe Gumbelova a Frankova kopula, nebylo ale možno jednoznačně rozhodnout, která z nich lépe popisuje zkoumaná data. K numerickému posouzení blízkosti odhadů jsme použili vztahy: Ψ = n [K φ (z) K n (z)] 2 i= LM = max K φ (z) K n (z) Hodnoty Ψ a LM pro námi uvažované kopuly jsou uvedeny v tabulce 2.3. Numerickým srovnáním bychom volili nezávislou nebo Gumbelovu kopulu. Jako nejlepší volba k modelování zkoumaných dat byla nakonec vybrána Gumbelova kopula s parametrem

27 Nezavisla kopula Gumbelova kopula Claytonova kopula Frankova kopula K n nezavisla K n Gumbelova K n Claytonova K n Frankova Obrázek 2.3: Srovnání neparametrického odhadu K n (z) s parametrickými odhady K φ (z) distribuční funkce K. 27

28 2.4 Simulace Ψ LM Claytonova kopula Gumbelova kopula Frankova kopula Nezávislá kopula Tabulka 2.4: Hodnoty Ψ a LM uvažovaných kopul. Dalším krokem po výběru nejvhodnější Archimédovské kopuly 2 bylo nagenerování výší škod odpovídajících daným zpožděním v nahlášení. Jinými slovy z námi vybrané kopuly bylo třeba nagenerovat náhodné veličiny X,Y se známou distribuční funkcí H X,Y (x,y) = C φ (F(x),G(y))), kde C φ označuje vybranou nejvhodnější Archimédovskou kopulu. Ke generování (simulaci) dat z kopuly jsme použili algoritmus, který pracuje s podmíněnou distribuční funkcí jedné veličiny druhou veličinou. Tento algoritmus byl uveřejněn v [2], opět se s ním nejprve seznámíme teoreticky. Algoritmus pro generování výstupů z Archimédovské kopuly. Generujme U,U 2 nezávislá náhodná čísla z rovnoměrného rozdělení (, ). 2. Položme X = F (U ). 3. Y spočteme jako řešení U 2 = G(Y X) = φ () (φ(f(x) + φ(g(y ))). (2.2) φ () (φ(f(x)) φ () ve vztahu 2.2 označuje první derivaci inverzní funkce generátoru φ. Odvod me ji nyní pro Claytonovu, Gumbelovu a Frankovu kopulu. Claytonova kopula je určena generátorem φ(t) = t α pro α >, jehož inverzní funkce má tvar φ (s) = ( + s) /α, a tedy φ () (s) = α ( + s) (/α). (2.3) 2 Za povšimnutí stojí, že k určení nejvhodnější Archimédovské kopuly popisující zkoumaná data nebylo třeba znát jejich marginální rozdělení. 28

29 Gumbelova kopula je určena generátorem φ = ( ln t) α pro α, jehož inverzní funkce má tvar φ (s) = exp( s /α ), a tedy φ () (s) = α s /α exp( s /α ). (2.4) Frankova kopula je určena generátorem ln eαt pro < α <, jehož e α inverzní funkce má tvar φ (s) = α ln[ + e s (e α )], a tedy φ () (s) = e s (e α ) α( + e s (e α )). (2.5) Podívejme se podrobněji na třetí krok výše popsaného algoritmu. Pro Claytonovu kopulu dosazujeme vztah 2.3 do rovnice 2.2 a hledáme Y, které je řešením: U 2 = α ( + G(Y ) α + U α ) (/α) α ( + U α. ) (/α) Postupnými úpravami dostáváme: U 2 U 2 U α/(+α) = α ( + G(Y ) α + U α ) (/α) α ( + U α ) (/α) = (G(Y ) α + U α ) (/α) (U α ) (/α) 2 = G(Y ) α + U α U α U α/(+α) 2 = G(Y ) α U α + U α G(Y ) α = U α (U α/(+α) 2 ) G(Y ) = [ + U α (U α/(+α) /α def 2 )] = U 2 Hledané Y pak spočteme jako Y = G (U 2 ). Podobným způsobem, jakým jsme spočetli Y Claytonovy kopuly, se postupuje u Frankovy kopuly. Hledáme Y, které je řešením rovnice: U 2 = e αu ( e α e αg(y ) e αg(y ) + ). Nalezené řešení má tvar Y = G (U 2 ), kde U 2 = U 2e α e αu ( U 2 ). U 2 + e αu ( U2 ) 29

30 Řešení Y z rovnice 2.2 pro Gumbelovu kopulu nemá uzavřený tvar. Je třeba jej hledat numericky. Ke generování náhodných proměnných z Gumbelovy kopuly je možno použít např. funkci copularnd( Gumbel,α,N) programu Matlab, kde α je parametr Gumbelovy kopuly a N je počet dvojic generovaných z Gumbelovy kopuly. Vrat me se nyní zpět k našemu příkladu. Jako kopula nejlépe popisující zkoumaná data ( X,Y ) byla v předchozí části vybrána Gumbelova kopula s parametrem.39. Naším cílem bylo z této kopuly nasimulovat výše škod odpovídající zpožděním v nahlášení až 95 dní (potřebné později při určování výše IBNR rezervy). Jak již bylo řečeno, ke generování dat z kopuly se používá výše uvedený algoritmus. Speciálně u Gumbelovy kopuly je na něm založena funkce copularnd( Gumbel,α,N) programu Matlab. Jejím výstupem je N dvojic U a U 2 (značení odpovídá výše uvedené teorii), z nichž se X a Y získají jako X = F (U ) a Y = G (U 2 ). V našem případě jsme ovšem pro daná Y generovali X. Narozdíl od právě uvedené teorie jsme podmiňovali záporné výše škod zpožděním v nahlášení, tj. veličinu X veličinou Y. Zformulujme proto algoritmus odpovídající našemu případu:. Definujme U = G(Y ), kde G označuje distribuční funkci logaritmickonormálního rozdělení s parametry µ = a σ =.264 a Y nabývá hodnot,...,95. Hodnoty zpoždění v nahlášení dostaneme jako Y = G (U ). 2. Generujme U 2 jako nezávislá náhodná čísla z rovnoměrného rozdělení (, ). 3. Hledané X jsme spočteme jako X = F ( U 2 ). U 2 získáme z funkce copularnd( Gumbel,.39,96) upravené pro práci s hodnotami U definovanými v prvním kroku. Dále jsme pracovali s kladnými hodnotami výší škod. Na obrázku 2.4 je graf průměrných výší škod odpovídajících jednotlivým zpožděním v nahlášení. 2.5 Určení počtu vzniklých škod K stanovení IBNR rezervy naším postupem bylo také třeba znát počet škod, které ve zkoumaném období vznikly, ale nebyly nahlášeny. Abychom tento počet určili, modelovali jsme nejprve počet škod, které v jednotlivých dnech zkoumaného období vznikly. 3

31 6.5 x X Y Obrázek 2.4: Průměrné výše škod X odpovídající zpožděním Y nagenerované z Gumbelovy kopuly s parametrem.39. Uvažovali jsme kolektivní model rizika, ve kterém je úhrn škod S i vyjádřen součtem N i S i = X ij, j= kde náhodná veličina N i představuje počet škod vzniklých ve dni i a X ij značí výše jednotlivých škod j vzniklých v itém dni. Předpokládá se, že N i a X ij jsou vzájemně nezávislé. K nalezení rozdělení veličiny N jsme opět využili funkci dfittool programu Matlab. Aplikovali jsme ji na počty nahlášených škod od počátku roku 2 do 4. čtvrtletí roku 23, 3 Z grafů na obrázku 2.5 lze vidět, že počty vzniklých škod nejlépe modeluje negativně binomické rozdělení (případně Gama rozdělení). Před tím než uvedeme způsob, jakým jsme predikovali počty vzniklých škod ve zkoumaném období a nalezli parametry negativně binomického rozdělení, seznamme se se zobecněnými lineárními modely, které jsme při tom využívali. Zobecněné lineární modely (Generalized Linear Models, GLM) patří mezi třídu statistických modelů, kterou v roce 972 představili John Nelder a Robert Wedderburn. Zatímco v klasickém lineárním regresním modelu pozorujeme náhodnou veličinu Y s předpokládaným normálním rozdělením se 3 Konkrétně jsme pracovali s údaji z 4 po sobě následujících dnů. Tento rozsah byl zvolen proto, že si počty nahlášených škod a počty skutečně vzniklých škod v tomto období s 99,9% pravděpodobností odpovídají. 3

32 .2 Pocty skod Normalni Gama Negativne binomicke Poissonovo.5 Hustota Data Pravdepodobnost Pocty skod Normalni Gama Negativne binomicke Poissonovo Data Obrázek 2.5: Fitování počtů škod vzniklých za den. 32

33 střední hodnotou µ, zobecněné lineární modely rozšiřují předpoklad rozdělení veličiny Y na libovolné rozdělení z tzv. exponenciální rodiny rozdělení. Rozdělení z této rodiny mají hustotu pravděpodobnosti pro pozorování y i dánu vztahem: f(y i ;θ i,φ) = exp( y iθ i b(θ i ) + c(y i,φ)), a i (φ) kde θ i je přirozený parametr související se střední hodnotou, φ je disperzní parametr, a i (φ) je spojitá kladná funkce, b(θ i ) je kumulantová funkce se spojitou druhou derivací a c(y i,φ) je funkce normující f. Funkce a i (φ) má zpravidla tvar a i (φ) = φ/w i, kde w i je apriorní váha i-tého pozorování. V této práci jsme použili w i = pro každé pozorování i. Pro rozdělení z této rodiny dále platí: E(y i ) = µ i = db(θ i) dθ i = b (θ i ) (2.6) Var(y i ) = a i (φ) d2 b(θ i ) dθ 2 i = a i (φ)b (θ i ) = a i (φ)v (µ i ) (2.7) kde V (µ i ) je tzv. varianční funkce. Mezi významné členy exponenciální rodiny patří normální, Poissonovo, binomické, gamma nebo inverzní Gaussovo rozdělení. Blízkými příbuznými jsou např. negativně binomické a Weibullovo rozdělení. Lognormální rozdělení do této rodiny nepatří. Dalším důležitým aspektem zobecnění v GLM je existence lineárního prediktoru a spojovací funkce. Necht y,...y n jsou nezávislá pozorování se středními hodnotami µ,...,µ n a necht pozorování y i má rozdělení z exponenciální rodiny. Lineární kombinace vektoru vysvětlujích proměnných x = (x,...,x k ) a vektoru neznámých parametrů β se nazývá lineární prediktor η: k η = x β = β + β i x i. Lineární prediktor η i je se střední hodnotou µ i spojen prostřednictvím prosté diferencovatelné spojovací funkce (link function): Platí tedy: i= η i = g(µ i ), i =,...,n. E(y i ) = µ i = g (η i ) = g (x iβ). V této práci budeme uvažovat pouze kanonickou spojovací funkci. 4 Spojovací funkce je kanonická, pokud se lineární prediktor rovná kanonickému parametru, tj. pokud η i = θ i. Spojovací funkce g(µ i ) je v tomto případě funkcí 4 Přehled ostatních spojovacích funkcí je možno nalézt v [7]. 33

34 inverzní k b (θ i ). Kanonické spojovací funkce běžně používaných rozdělení z exponenciální rodiny jsou společně s jejich charakteristikami shrnuty v tabulce 2.5 na straně 35. Parametry zobecněného lineárního modelu se odhadují metodou maximální věrohodnosti (Maximum Likelihood Estimate, MLE). Logaritmická věrohodnostní funkce má tvar: l(y,β) = n i= ( y iθ i b(θ i ) a i (φ) + c(y i,φ)) Derivaci logaritmické věrohodnostní funkce lze za použití kanonické spojovací funkce vyjádřit jako: l β = n i= l θ i n [ θ i β = y i db(θ ] i) x i = a i (φ) dθ i i= n i= y i µ i a i (φ) x i. Maximálně věrohodný odhad parametrů β je pak řešením soustavy: n i= y i µ i a i (φ) x i =. (2.8) K nalezení řešení soustavy 2.8 vzhledem k parametru β se používá iteračně vážená metoda nejmenších čtverců (Iteratively Reweighted Least Squares, IRLS). Algoritmus této metody, stejně jako vyjádření odhadů parametru β, jsou uvedeny v [7]. V této práci jsme k odhadu parametrů využili funkci, která je na iteračně vážené metodě nejmenších čtverců založená - funkci glmfit programu Matlab. Mezi nejčastěji používané testové statistiky sloužící k posouzení kvality zobecněných lineárních modelů a jejich vzájemnému srovnání patří škálovaná deviance (scaled deviance) a škálovaná Pearsonova X 2 (chí-kvadrát) statistika.škálovaná deviance porovnává skutečnou hodnotu logaritmické věrohodnostní funkce s její maximální možnou hodnotou. Pro pevnou hodnotu disperzního parametru φ je škálovaná deviance dána vztahem: D = 2(l(y, β) l(y,µ)). Maximální možné hodnoty logaritmické věrohodnostní funkce lze dosáhnout, pokud je počet odhadovaných parametrů v modelu stejný jako počet měření. Tedy pokud má každé pozorování vlastní parametr. Takovýto model nazýváme saturovaný. Vektor β lze v tomto případě ztotožnit s vektorem µ a vyhlazená střední hodnota µ i je rovna přímo pororování y i. 34

35 35 Tabulka 2.5: Charakteristiky některých běžně používaných rozdělení z exponenciální rodiny. Zdroj [7]. Normální Poissonovo Binomické Gamma Inverzní Gaussovo Označení N(µ,σ 2 ) P(µ) Bi(m,π)/m G(µ,ν) IG(µ,σ 2 ) Definiční obor y (, ),, 2,...,,,2,..., m (, ) (, ) Disperzní parametr φ σ 2 m Kumulantová funkce b(θ) ν σ 2 θ 2 /2 exp(θ) ln( + e θ ) ln( θ) 2θ c(y,φ) 2 (y2 φ + ln(2πφ)) ln(y!) ln ( m my µ(θ) = E(Y,θ) θ exp(θ) e θ ) +e θ θ Kanonický link η = θ(µ) µ ln(µ) ln( µ µ ) µ φ ln( y φ ) ln(y) ln(γ( φ )) 2 (ln(2πφy3 ) + Varianční funkce V (µ) µ µ( µ) µ 2 µ 3 2θ µ 2 φy )

36 Vynásobením škálované deviance D disperzním parametrem φ dostaneme devianci: D = φd. Pro nejčastěji používaná rozdělení v zobecněných lineárních modelech je deviance dána vztahy uvedenými v tabulce 2.6. Rozdělení Normální Poissonovo Binomické Gamma Inverzní Gaussovo Deviance n i= (y i µ i ) 2 2 n i= [y i ln( y i µ i ) (y i µ i )] 2 n i= [y i ln( y i µ i ) + (m i y i ) ln( m i y i m i µ i )] 2 n i= [ ln( y i µ i ) + ( y i µ i ) n i= (y i µ i ) 2 µ i 2 y i µ i ] Tabulka 2.6: Deviance některých rozdělení v GLM modelech. Druhou nejčastější mírou kvality vyhlazení v zobecněných lineárních modelech je Pearsonova X 2 statistika, resp. škálovaná Pearsonova X 2 statistika, definovaná jako: n X 2 (y i µ i ) 2 =, resp. X 2 /φ. V ( µ i ) i= Pokud není disperzní parametr φ znám, je k jeho odhadu možné použít jak Pearsonovu X 2 statistiku, tak devianci: φ = D n k, φ = X2 n k, kde n je počet pozorování a k počet odhadovaných parametrů v modelu. Jmenovatel n k souvisí s tím, že obě škálované verze výše uvedených statistik mají za určitých podmínek asymptoticky chí-kvadrát rozdělení s n k stupni volnosti. Disperzní parametr φ lze ovšem odhadnout také metodou maximální věrohodnosti, viz [7]. Software pracující se zobecněnými lineárními modely dává jako výstup mimo jiné tzv. scale parametr. Tento parametr je odhadnut pomocí MLE, souvisí s konstantním koeficientem rozptylu a dá se použít k odhadu φ. Pro gamma rozdělení platí scale = /φ, pro ostatní rozdělení je pak scale = φ. Podívejme se ještě na rezidua, která umožňují vizualizaci kvality modelu ve vztahu k datům, pro než byl model vytvořen. Rezidua běžně používaná v standardní lineární regresi, tj. y i µ i, nejsou pro GLM příliš vhodná, protože rozptyl y i není konstantní. Intuintivnějšími typy reziduí jsou Pearsonova rezidua, která vycházejí z Pearsonovy X 2 statistiky (ovšem pro jiná 36

37 než normální rozdělení mohou být zešikmená): r pi = y i µ i n V ( µi ), rpi 2 = X 2 a devianční rezidua, která nesou stejná znaménka jako y i µ i a souvisí s deviancí: r di = sign(y i µ i ) yi y i s n n d i = sign(y i µ i ) 2 µ i V (s) ds, rdi 2 = d i = D. i= i= i= Vrat me se nyní zpět k našemu příkladu. Ukázali jsme, že počty vzniklých škod za den mají negativně binomické rozdělení. Naším cílem bylo dále určit parametry tohoto rozdělení pro každý den zkoumaného období a predikovat počty vzniklých škod. Negativně binomické rozdělení vyloučilo použití klasického lineárního regresního modelu, protože nesplňuje základní předpoklad o normalitě rozdělení. Vhodnou alternativou nám byly právě popsané zobecněné lineární modely. Přestože negativně binomické rozdělení přímo nepatří do exponenciální rodiny rozdělení, je s touto rodinou příbuzné. Lze jej odvodit z Poissonova rozdělení, jehož parametr je náhodná veličina s Gama rozdělením. 5 K modelování počtů vzniklých škod jsme použili zobecněný lineární model s Gama rozdělením G(µ, ν) a odpovídající kanonickou spojovací funkcí /µ, který byl vybrán na základě srovnání škálovaných deviancí, Pearsonovy X 2 statistiky a grafického srovnání Pearsonových reziduí modelů s normálním, Poissonovým a inverzně-gaussovým rozdělením. Grafy Pearsonových reziduí Gama modelu jsou na obrázku 2.6. Jako vysvětlující proměnnou jsme v GLM modelu s Gama rozdělením volili čas, tj. vektor t = (,..., 4). Parametry β = (.8227,.) jsme nalezli pomocí funkce glmfit programu MATLAB, jejímž výstupem byl také parametr scale = a deviance D = Odtud φ = /scale =.8 (případně φ =.6, pokud bychom k odhadu disperzního parametru použili devianci D, tj. vztah φ = D ) a n k D = D/φ = (případně D = ). Lineární prediktor byl tedy tvaru η i =.8227.t i. Ze vztahu µ i = g (η i ) jsme odvodili µ i =.8227.t i. K dispozici jsme tak měli dostatečné množství podkladů k stanovení parametrů negativně binomického rozdělení definovaného pravděpodobnostmi: ( ) n + h P(N = n) = p h ( p) n, h >, < p <, n =,,... n 5 Odvození lze nalézt v [5], str

Charakterizace rozdělení

Charakterizace rozdělení Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}. VIII. Náhodný vektor. Náhodný vektor (X, Y má diskrétní rozdělení s pravděpodobnostní funkcí p, kde p(x, y a(x + y +, x, y {,, }. a Určete číslo a a napište tabulku pravděpodobnostní funkce p. Řešení:

Více

Využití korelace v rezervování povinného ručení

Využití korelace v rezervování povinného ručení INSURANCE Využití korelace v rezervování povinného ručení Ondřej Bušta, Actuarial services 7. prosince 2007 ADVISORY 1 Agenda Nástin problému Majetkové škody Zdravotní škody Korelační analýza a riziko

Více

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

MATEMATICKÁ STATISTIKA.   Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým

Více

Statistika II. Jiří Neubauer

Statistika II. Jiří Neubauer Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Zaměříme se především na popis dvourozměrných náhodných veličin (vektorů). Definice Nechť X a Y jsou

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

Téma 22. Ondřej Nývlt

Téma 22. Ondřej Nývlt Téma 22 Ondřej Nývlt nyvlto1@fel.cvut.cz Náhodná veličina a náhodný vektor. Distribuční funkce, hustota a pravděpodobnostní funkce náhodné veličiny. Střední hodnota a rozptyl náhodné veličiny. Sdružené

Více

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y 9. T r a n s f o r m a c e n á h o d n é v e l i č i n y Při popisu procesů zpracováváme vstupní údaj, hodnotu x tak, že výstupní hodnota y závisí nějakým způsobem na vstupní, je její funkcí y = f(x).

Více

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní ..08 8cv7.tex 7. cvičení - transformace náhodné veličiny Definice pojmů a základní vzorce Je-li X náhodná veličina a h : R R je měřitelná funkce, pak náhodnou veličinu Y, která je definovaná vztahem X

Více

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace Jan Slovák Masarykova univerzita Fakulta informatiky 28. 11 2. 12. 2016 Obsah přednášky 1 Literatura 2 Střední

Více

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu. 6. NÁHODNÝ VEKTOR Průvodce studiem V počtu pravděpodobnosti i v matematické statistice se setkáváme nejen s náhodnými veličinami, jejichž hodnotami jsou reálná čísla, ale i s takovými, jejichž hodnotami

Více

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457. 0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin Příklady k procvičení z Matematické statistiky Poslední úprava. listopadu 207. Konvergence posloupnosti náhodných veličin. Necht X, X 2... jsou nezávislé veličiny s rovnoměrným rozdělením na [0, ]. Definujme

Více

Poznámky k předmětu Aplikovaná statistika, 4. téma

Poznámky k předmětu Aplikovaná statistika, 4. téma Poznámky k předmětu Aplikovaná statistika, 4. téma 4. Náhodné vektory V praxi se nám může hodit postihnout více vlastností jednoho objektu najednou, např. výšku, váhu a pohlaví člověka; rychlost chemické

Více

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Výsledky některých náhodných pokusů jsou přímo vyjádřeny číselně (např. při hodu kostkou padne 6). Náhodnou veličinou

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 2. KAPITOLA PODMÍNĚNÁ PRAVDĚPODOBNOST 3. KAPITOLA NÁHODNÁ VELIČINA 9.11.2017 Opakování Uveďte příklad aplikace geometrické definice pravděpodobnosti

Více

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak. 8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) e, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá normované

Více

I. D i s k r é t n í r o z d ě l e n í

I. D i s k r é t n í r o z d ě l e n í 6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme

Více

Normální rozložení a odvozená rozložení

Normální rozložení a odvozená rozložení I Normální rozložení a odvozená rozložení I.I Normální rozložení Data, se kterými pracujeme, pocházejí z různých rozložení. Mohou být vychýlena (doleva popř. doprava, nebo v nich není na první pohled vidět

Více

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009

Více

p(x) = P (X = x), x R,

p(x) = P (X = x), x R, 6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Výběrové charakteristiky a jejich rozdělení

Výběrové charakteristiky a jejich rozdělení Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový

Více

1/30. Mgr. Jan Šváb Zobecněný lineární model a jeho použití v povinném ručení. 31.3.2006 Seminář z aktuárských věd. Slides by LATEX.

1/30. Mgr. Jan Šváb Zobecněný lineární model a jeho použití v povinném ručení. 31.3.2006 Seminář z aktuárských věd. Slides by LATEX. 1/30 31.3.2006 Seminář z aktuárských věd Slides by LATEX Mgr. Jan Šváb Zobecněný lineární model a jeho použití v povinném ručení 2/30 Obsah 1 Zobecněné lineární modely (GLZ 1 ) Obecný lineární model (GLM)

Více

MATEMATICKÁ STATISTIKA - XP01MST

MATEMATICKÁ STATISTIKA - XP01MST MATEMATICKÁ STATISTIKA - XP01MST 1. Úvod. Matematická statistika (statistics) se zabývá vyšetřováním zákonitostí, které v sobě obsahují prvek náhody. Zpracováním hodnot, které jsou výstupem sledovaného

Více

Poznámky k předmětu Aplikovaná statistika, 4. téma

Poznámky k předmětu Aplikovaná statistika, 4. téma Poznámky k předmětu Aplikovaná statistika, 4. téma 4. Náhodné vektory V praxi se nám může hodit postihnout více vlastností jednoho objektu najednou, např. výšku, váhu a pohlaví člověka; rychlost chemické

Více

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel Regresní analýza Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Regresní analýza 1 / 23

Více

Odhady Parametrů Lineární Regrese

Odhady Parametrů Lineární Regrese Odhady Parametrů Lineární Regrese Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké

Více

AVDAT Náhodný vektor, mnohorozměrné rozdělení

AVDAT Náhodný vektor, mnohorozměrné rozdělení AVDAT Náhodný vektor, mnohorozměrné rozdělení Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Opakování, náhodná veličina, rozdělení Náhodná veličina zobrazuje elementární

Více

Odhady - Sdružené rozdělení pravděpodobnosti

Odhady - Sdružené rozdělení pravděpodobnosti Odhady - Sdružené rozdělení pravděpodobnosti 4. listopadu 203 Kdybych chtěl znát maximum informací o náhodné veličině, musel bych znát všechny hodnoty, které mohou padnout, a jejich pravděpodobnosti. Tedy

Více

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně

Více

8 Coxův model proporcionálních rizik I

8 Coxův model proporcionálních rizik I 8 Coxův model proporcionálních rizik I Předpokládané výstupy z výuky: 1. Student umí formulovat Coxův model proporcionálních rizik 2. Student rozumí významu regresních koeficientů modelu 3. Student zná

Více

3 Bodové odhady a jejich vlastnosti

3 Bodové odhady a jejich vlastnosti 3 Bodové odhady a jejich vlastnosti 3.1 Statistika (Skripta str. 77) Výběr pořizujeme proto, abychom se (více) dověděli o souboru, ze kterého jsme výběr pořídili. Zde se soustředíme na situaci, kdy známe

Více

MATEMATICKÁ STATISTIKA

MATEMATICKÁ STATISTIKA MATEMATICKÁ STATISTIKA 1. Úvod. Matematická statistika se zabývá vyšetřováním zákonitostí, které v sobě obsahují prvek náhody. Zpracováním hodnot, které jsou výstupem sledovaného procesu, se snažíme popsat

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení

Více

Apriorní rozdělení. Jan Kracík.

Apriorní rozdělení. Jan Kracík. Apriorní rozdělení Jan Kracík jan.kracik@vsb.cz Apriorní rozdělení Apriorní rozdělení (spolu s modelem) reprezentuje informaci o neznámém parametru θ, která je dostupná předem, tj. bez informace z dat.

Více

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D. Střední hodnota a rozptyl náhodné veličiny, vybraná rozdělení diskrétních a spojitých náhodných veličin, pojem kvantilu Ing. Michael Rost, Ph.D. Príklad Předpokládejme že máme náhodnou veličinu X která

Více

Kontingenční tabulky, korelační koeficienty

Kontingenční tabulky, korelační koeficienty Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Budeme předpokládat, že X a Y jsou kvalitativní náhodné veličiny, obor hodnot X obsahuje r hodnot (kategorií,

Více

AVDAT Klasický lineární model, metoda nejmenších

AVDAT Klasický lineární model, metoda nejmenších AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i

Více

1. Přednáška. Ing. Miroslav Šulai, MBA

1. Přednáška. Ing. Miroslav Šulai, MBA N_OFI_2 1. Přednáška Počet pravděpodobnosti Statistický aparát používaný ve financích Ing. Miroslav Šulai, MBA 1 Počet pravděpodobnosti -náhodné veličiny 2 Počet pravděpodobnosti -náhodné veličiny 3 Jevy

Více

Derivace funkce Otázky

Derivace funkce Otázky funkce je jedním z hlavních nástrojů matematické analýzy. V příští části ukážeme, jak mnoho různorodých aplikací derivace má. Geometricky lze derivaci funkce v nějakém bodě chápat jako směrnici tečny grafu

Více

8. Normální rozdělení

8. Normální rozdělení 8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, 2 ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) 2 e 2 2, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá

Více

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B. Zkouška z předmětu KMA/PST. Anotace předmětu Náhodné jevy, pravděpodobnost, podmíněná pravděpodobnost. Nezávislé náhodné jevy. Náhodná veličina, distribuční funkce. Diskrétní a absolutně spojitá náhodná

Více

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y 9. T r a n s f o r m a c e n á h o d n é v e l i č i n Při popisu procesů zpracováváme vstupní údaj, hodnotu x tak, že výstupní hodnota závisí nějakým způsobem na vstupní, je její funkcí = f(x). Pokud

Více

Základy teorie odhadu parametrů bodový odhad

Základy teorie odhadu parametrů bodový odhad Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Odhady parametrů Úkolem výběrového šetření je podat informaci o neznámé hodnotě charakteristiky základního souboru

Více

Derivace funkce DERIVACE A SPOJITOST DERIVACE A KONSTRUKCE FUNKCÍ. Aritmetické operace

Derivace funkce DERIVACE A SPOJITOST DERIVACE A KONSTRUKCE FUNKCÍ. Aritmetické operace Derivace funkce Derivace je jedním z hlavních nástrojů matematické analýzy. V příští části ukážeme, jak mnoho různorodých aplikací derivace má. Geometricky lze derivaci funkce v nějakém bodě chápat jako

Více

pravděpodobnosti, popisné statistiky

pravděpodobnosti, popisné statistiky 8. Modelová rozdělení pravděpodobnosti, popisné statistiky Rozdělení pravděpodobnosti Normální rozdělení jako statistický model Přehled a aplikace modelových rozdělení Popisné statistiky Anotace Klasickým

Více

Úlohy nejmenších čtverců

Úlohy nejmenších čtverců Úlohy nejmenších čtverců Petr Tichý 7. listopadu 2012 1 Problémy nejmenších čtverců Ax b Řešení Ax = b nemusí existovat, a pokud existuje, nemusí být jednoznačné. Často má smysl hledat x tak, že Ax b.

Více

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Stochastický proces Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2 } se nazývá stochastický proces

Více

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový.

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový. 6. ZÁKLADY STATIST. ODHADOVÁNÍ X={X 1, X 2,..., X n } výběr z rozdělení s F (x, θ), θ={θ 1,..., θ r } - vektor reálných neznámých param. θ Θ R k. Θ parametrický prostor. Dva základní způsoby odhadu neznámého

Více

8.3). S ohledem na jednoduchost a názornost je výhodné seznámit se s touto Základní pojmy a vztahy. Definice

8.3). S ohledem na jednoduchost a názornost je výhodné seznámit se s touto Základní pojmy a vztahy. Definice 9. Lineární diferenciální rovnice 2. řádu Cíle Diferenciální rovnice, v nichž hledaná funkce vystupuje ve druhé či vyšší derivaci, nazýváme diferenciálními rovnicemi druhého a vyššího řádu. Analogicky

Více

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) = Základní rozdělení pravděpodobnosti Diskrétní rozdělení pravděpodobnosti. Pojem Náhodná veličina s Binomickým rozdělením Bi(n, p), kde n je přirozené číslo, p je reálné číslo, < p < má pravděpodobnostní

Více

NÁHODNÝ VEKTOR. 4. cvičení

NÁHODNÝ VEKTOR. 4. cvičení NÁHODNÝ VEKTOR 4. cvičení Náhodný vektor Náhodným vektorem rozumíme sloupcový vektor X=(X, X,, X n ) složený z náhodných veličin X, X,, X n, který je charakterizován sdruženým rozdělením pravděpodobnosti.

Více

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně 7 Náhodný vektor Nezávislost náhodných veličin Definice 7 Nechť je dán pravděpodobnostní prostor (Ω, A, P) Zobrazení X : Ω R n, které je A-měřitelné, se nazývá (n-rozměrný) náhodný vektor Měřitelností

Více

Teorie náhodných matic aneb tak trochu jiná statistika

Teorie náhodných matic aneb tak trochu jiná statistika Teorie náhodných matic aneb tak trochu jiná statistika B. Vlková 1, M.Berg 2, B. Martínek 3, O. Švec 4, M. Neumann 5 Gymnázium Uničov 1, Gymnázium Václava Hraběte Hořovice 2, Mendelovo gymnázium Opava

Více

INTEGRÁLY S PARAMETREM

INTEGRÁLY S PARAMETREM INTEGRÁLY S PARAMETREM b a V kapitole o integraci funkcí více proměnných byla potřeba funkce g(x) = f(x, y) dy proměnné x. Spojitost funkce g(x) = b a f(x, y) dy proměnné x znamená vlastně prohození limity

Více

Vlastnosti odhadů ukazatelů způsobilosti

Vlastnosti odhadů ukazatelů způsobilosti Vlastnosti odhadů ukazatelů způsobilosti Jiří Michálek CQR při Ústavu teorie informace a automatizace AV ČR v Praze Úvod Ve výzkumné zprávě č 06 Odhady koeficientů způsobilosti a jejich vlastnosti viz

Více

Základní statistické modely Statistické vyhodnocování exp. dat M. Čada ~ cada

Základní statistické modely Statistické vyhodnocování exp. dat M. Čada   ~ cada Základní statistické modely 1 Statistika Matematická statistika se zabývá interpretací získaných náhodných dat. Snažíme se přiřadit statistickému souboru vhodnou distribuční funkci a najít základní číselné

Více

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů Časové řady, typy trendových funkcí a odhady trendů Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Jiří Neubauer (Katedra ekonometrie UO Brno) Časové

Více

1 Klasická pravděpodobnost. Bayesův vzorec. Poslední změna (oprava): 11. května 2018 ( 6 4)( 43 2 ) ( 49 6 ) 3. = (a) 1 1 2! + 1 3!

1 Klasická pravděpodobnost. Bayesův vzorec. Poslední změna (oprava): 11. května 2018 ( 6 4)( 43 2 ) ( 49 6 ) 3. = (a) 1 1 2! + 1 3! Výsledky příkladů na procvičení z NMSA0 Klasická pravděpodobnost. 5. ( 4( 43 ( 49 3. 8! 3! 0! = 5 Poslední změna (oprava:. května 08 4. (a! + 3! + ( n+ n! = n k= ( k+ /k! = n k=0 ( k /k!; (b n k=0 ( k

Více

Vícerozměrná rozdělení

Vícerozměrná rozdělení Vícerozměrná rozdělení 7. září 0 Učivo: Práce s vícerozměrnými rozděleními. Sdružené, marginální, podmíněné rozdělení pravděpodobnosti. Vektorová střední hodnota. Kovariance, korelace, kovarianční matice.

Více

Přijímací zkouška na navazující magisterské studium 2014

Přijímací zkouška na navazující magisterské studium 2014 Přijímací zkouška na navazující magisterské studium 24 Příklad (25 bodů) Spočtěte Studijní program: Studijní obor: Matematika Finanční a pojistná matematika Varianta A M x 2 dxdy, kde M = {(x, y) R 2 ;

Více

5. T e s t o v á n í h y p o t é z

5. T e s t o v á n í h y p o t é z 5. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013 Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika Podrobnější rozpis okruhů otázek pro třetí část SZZ Verze: 13. června 2013 1 Úvodní poznámky 6 Smyslem SZZ by nemělo být toliko

Více

4. Aplikace matematiky v ekonomii

4. Aplikace matematiky v ekonomii 4. Aplikace matematiky v ekonomii 1 Lineární algebra Soustavy 1) Na základě statistických údajů se zjistilo, že závislost množství statku z poptávaného v průběhu jednoho týdne lze popsat vztahem q d =

Více

Pravděpodobnost a statistika

Pravděpodobnost a statistika Pravděpodobnost a statistika Bodové odhady a intervaly spolehlivosti Vilém Vychodil KMI/PRAS, Přednáška 10 Vytvořeno v rámci projektu 963/011 FRVŠ V. Vychodil (KMI/PRAS, Přednáška 10) Bodové odhady a intervaly

Více

Kredibilitní pojistné v pojištění automobilů. Silvie Zlatošová září 2016, Robust

Kredibilitní pojistné v pojištění automobilů. Silvie Zlatošová září 2016, Robust Silvie Zlatošová 11. - 16. září 2016, Robust Obsah 1 Motivace a cíl 2 Tvorba apriorních tarifních skupin 3 Teorie kredibility 4 Aplikace aposteriorních korekcí Motivace a cíl Obsah 1 Motivace a cíl 2 Tvorba

Více

Vybraná rozdělení náhodné veličiny

Vybraná rozdělení náhodné veličiny 3.3 Vybraná rozdělení náhodné veličiny 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 Rozdělení Z 3 4 5 6 7 8 9 10 11 12 13 14 15 Život je umění vytvářet uspokojivé závěry na základě nedostatečných předpokladů.

Více

AVDAT Nelineární regresní model

AVDAT Nelineární regresní model AVDAT Nelineární regresní model Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Nelineární regresní model Ey i = f (x i, β) kde x i je k-členný vektor vysvětlujících proměnných

Více

MATICE. a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij]

MATICE. a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij] MATICE Matice typu m/n nad tělesem T je soubor m n prvků z tělesa T uspořádaných do m řádků a n sloupců: a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij] a m1 a m2 a mn Prvek a i,j je prvek matice A na místě

Více

Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jestliže opakujeme nezávisle nějaký pokus, můžeme z pozorovaných hodnot sestavit rozdělení relativních četností

Více

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

Téma 2: Pravděpodobnostní vyjádření náhodných veličin 0.05 0.0 0.05 0.0 0.005 Nominální napětí v pásnici Std Mean 40 60 80 00 0 40 60 Std Téma : Pravděpodobnostní vyjádření náhodných veličin Přednáška z předmětu: Spolehlivost a bezpečnost staveb 4. ročník

Více

Náhodné vektory a matice

Náhodné vektory a matice Náhodné vektory a matice Jiří Militký Katedra textilních materiálů Technická Universita Liberec, Červeně označené slide jsou jen pro doplnění informací a nezkouší se. Symbolika A B Jev jistý S (nastane

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která Náhodná veličina a její charakteristiky Náhodná veličina a její charakteristiky Představte si, že provádíte náhodný pokus, jehož výsledek jste schopni ohodnotit nějakým číslem. Před provedením pokusu jeho

Více

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení 2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním

Více

Základy teorie pravděpodobnosti

Základy teorie pravděpodobnosti Základy teorie pravděpodobnosti Náhodná veličina Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 12. února 2012 Statistika by Birom Základy teorie

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

MÍRY ZÁVISLOSTI (KORELACE A REGRESE) zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Náhodný vektor a jeho charakteristiky

Náhodný vektor a jeho charakteristiky Náhodný vektor a jeho číselné charakteristiky 1 Náhodný vektor a jeho charakteristiky V následující kapitole budeme věnovat pozornost pouze dvourozměřnému náhodnému vektoru, i když uvedené pojmy a jejich

Více

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1 Minikurz aplikované statistiky Marie Šimečková, Petr Šimeček Minikurz aplikované statistiky p.1 Program kurzu základy statistiky a pravděpodobnosti regrese (klasická, robustní, s náhodnými efekty, ev.

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Náhodný výběr Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN Rovnoměrné rozdělení R(a,b) rozdělení s konstantní hustotou pravděpodobnosti v intervalu (a,b) f( x) distribuční funkce 0 x a F( x) a x b b a 1 x b b 1 a x a a x b

Více

Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I

Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I Příklad Tahová síla papíru používaného pro výrobu potravinových sáčků je důležitá charakteristika kvality. Je známo, že síla

Více

Mnohorozměrná statistická data

Mnohorozměrná statistická data Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistický znak, statistický soubor Jednotlivé objekty nebo subjekty, které jsou při statistickém

Více

Definice spojité náhodné veličiny zjednodušená verze

Definice spojité náhodné veličiny zjednodušená verze Definice spojité náhodné veličiny zjednodušená verze Náhodná veličina X se nazývá spojitá, jestliže existuje nezáporná funkce f : R R taková, že pro každé a, b R { }, a < b, platí P(a < X < b) = b a f

Více

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika vektory

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika vektory Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 202 Založeno na materiálech doc. Michala Kulicha Náhodný vektor často potřebujeme

Více

NMAI059 Pravděpodobnost a statistika

NMAI059 Pravděpodobnost a statistika NMAI059 Pravděpodobnost a statistika podle přednášky Daniela Hlubinky (hlubinka@karlin.mff.cuni.cz) zapsal Pavel Obdržálek (pobdr@matfyz.cz) 205/20 poslední změna: 4. prosince 205 . přednáška. 0. 205 )

Více