Kalibrace scoringových modelů



Podobné dokumenty
Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

MATEMATICKÉ UVAŽOVÁNÍ V ŘÍZENÍ KREDITNÍCH RIZIK

připravili Filip Trojan, Pavel Macek,

Credit scoring. Libor Vajbar Analytik řízení rizik. 18. dubna Brno

Statistické metody v marketingu. Ing. Michael Rost, Ph.D.

Hodnocení a modelování populačních dat na příkladu epidemiologie vážných chorob: I. Analýza dat, princip predikcí.

vzorek vzorek

Ratingem se rozumí ohodnocení. (úvěrovým) závazkům.

AVDAT Mnohorozměrné metody, metody klasifikace

METODIKA. hodnocení rizika vývoje produkce zpracovatelského průmyslu

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Jana Vránová, 3. lékařská fakulta, UK Praha

Kalkulace závažnosti komorbidit a komplikací pro CZ-DRG

Usuzování za neurčitosti

Pravděpodobnostní (Markovské) metody plánování, MDP - obsah

Metodika hodnocení ekonomicky spjatých skupin ČR

Získávání znalostí z dat

Nestranný odhad Statistické vyhodnocování exp. dat M. Čada

Míra růstu dividend, popř. zisku

Obecné pokyny k odhadu ztrátovosti ze selhání pro případ hospodářského poklesu ( odhad LGD při poklesu )

Volba zobrazení (Direct Current, Scaling) - FFT 1D, FFT 2D

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

SPOLEHLIVOST KONSTRUKCÍ & TEORIE SPOLEHLIVOSTI část 5: Aproximační techniky

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Propenzitní modelování. Veronika Počerová

DOOSAN Škoda Power s. r. o. a Západočeská univerzita v Plzni ŘÍZENÍ AERODYNAMICKÉHO TUNELU PRO KALIBRACI TLAKOVÝCH SOND

(n, m) (n, p) (p, m) (n, m)

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

2D transformací. červen Odvození transformačního klíče vybraných 2D transformací Metody vyrovnání... 2

Vyhněte se katastrofám pomocí výpočetní matematiky

Přehled vybraných predikčních modelů finanční úrovně

Klasifikace a rozpoznávání. Lineární klasifikátory

Credit Valuation Adjustment

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

Brožová. Burda. Vedoucí DP Rok Téma (ČJ) 2011 Finanční analýza významných zástupců stavebních firem v ČR

Způsoby výpočtu hodnoty rizikově vážené expozice v rámci přístupu IRB

Kredibilitní pojistné v pojištění automobilů. Silvie Zlatošová září 2016, Robust

4EK211 Základy ekonometrie

Induktivní statistika. z-skóry pravděpodobnost

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy

UNIVERZITA PARDUBICE. 4.4 Aproximace křivek a vyhlazování křivek

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů

Závislost odporu termistoru na teplotě

Přejímka jedním výběrem

KTE/TEVS - Rychlá Fourierova transformace. Pavel Karban. Katedra teoretické elektrotechniky Fakulta elektrotechnická Západočeská univerzita v Plzni

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více

Funkce arcsin. Některé dosud probírané funkce můžeme spojit do dvojic: 4 - je číslo, které když dám na druhou tak vyjde 4.

1. Přednáška. Ing. Miroslav Šulai, MBA

Predikce roční spotřeby zemního plynu po ceníkových pásmech

Intervalová data a výpočet některých statistik

Manuální kroková regrese Newsletter Statistica ACADEMY

Pravděpodobnost, náhoda, kostky

Hedonický cenový index na datech poskytovatelů hypotečních úvěrů. Ing. Mgr. Martin Lux, Ph.D.

Klíčová slova prediktory absolvování studia medicíny, logistická regrese, ROC křivky

Specifické informace o fondech

NÁHODNÉ VELIČINY JAK SE NÁHODNÁ ČÍSLA PŘEVEDOU NA HODNOTY NÁHODNÝCH VELIČIN?

Odhad stavu matematického modelu křižovatek

Jak si udržet zákazníky a nabídnout jim co nejvíce?

Základy teorie finančních investic

Systém rizikové analýzy při sta4ckém návrhu podzemního díla. Jan Pruška

Rizika na liberalizovaném trhu s elektřinou

Dijkstrův algoritmus

PRAKTIKUM I. Oddělení fyzikálních praktik při Kabinetu výuky obecné fyziky MFF UK. Pracoval: Pavel Ševeček stud. skup.: F/F1X/11 dne:

ÚŘEDNÍ SDĚLENÍ ČESKÉ NÁRODNÍ BANKY ze dne 26. ledna 2016

3. Procesní řízení Procesní management Procesní řízení Management procesů a změn ve veřejné správě Řízení procesů ve veřejné správě

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

Testování statistických hypotéz

1 Polynomiální interpolace

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Řízení projektů. Konstrukce síťového grafu pro řízení projektů Metoda CPM Metoda PERT

Polynomy a interpolace text neobsahuje přesné matematické definice, pouze jejich vysvětlení

Miroslav Kalous, Česká národní banka. Makroekonomické prognozování

CobiT. Control Objectives for Information and related Technology. Teplá u Mariánských Lázní, 6. října 2004

Jak přetavit data v hodnotné informace, které nesou peníze

Zkušenosti s použitím metod Counterfactual Impact Evaluation při evaluaci ESF v České republice. Jan Brůha IREAS

Specifické informace o fondech

Chyby nepřímých měření

oddělení Inteligentní Datové Analýzy (IDA)

na magisterský studijní obor Učitelství matematiky pro střední školy

Nedejte šanci drahým a nevýhodným úvěrům

2.2 Kalibrace a limity její p esnosti

BAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

Neuronové časové řady (ANN-TS)

METROLOGIE ...JAKO SOUČÁST KAŽDODENNÍHO ŽIVOTA

MO-ME-N-T MOderní MEtody s Novými Technologiemi

Zadání Máme data hdp.wf1, která najdete zde: Bodová předpověď: Intervalová předpověď:

Úlohy nejmenších čtverců

Vysvětlivky k měsíčním reportům fondů RCM

FIT ČVUT MI-LOM Lineární optimalizace a metody. Dualita. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

2 Hlavní charakteristiky v analýze přežití

PRAVDĚPODOBNOST A STATISTIKA

Úvěrové registry a jejich využití při řízení kreditního rizika. Lukáš Civín Chief Risk Officer ČR & SR

Funkce Arcsin. Předpoklady: Některé dosud probírané funkce můžeme spojit do dvojic: 4 je číslo, jehož druhá mocnina se rovná 4.

3. Vícevrstvé dopředné sítě

Kalibrace a limity její přesnosti

SEMESTRÁLNÍ PRÁCE UNIVERZITA PARDUBICE. Fakulta chemicko - technologická Katedra analytické chemie

Transkript:

Kalibrace scoringových modelů Finanční matematika v praxi III Hotel Podlesí 3. 4. září 2013 Pavel Plát pavel.plat@rb.cz Raiffeisenbank a.s., Policy & Analysis

1. Scoringový model Business pohádka a trocha formalismu Banka poskytuje klientům úvěry a spravuje úvěrové portfolio Z hlediska plnění závazků vůči bance je každý klient/kontrakt hodnocen buď jako dobrý nebo jako špatný (default) Někteří klienti mají vyšší šanci, že se dostanou do problémů než jiní. O každém klientu/kontraktu má banka nějaké informace Na základě aktuální situace klienta/kontraktu chceme predikovat schopnost plnit závazky vůči bance v následujícím období Označme K množinu všech klientů/ kontraktů D k = 0 jestliže k K je dobrý 1 jestliže k K je špatný Používáme pravděpodobnostní model, tj. chceme predikovat pravděpodobnost defaultu PD = P(D k = 1) Situace klienta/kontraktu k K je popsána bodem ve vhodně zvoleném měřitelném prostoru(obvykle R n ) x k = (x k,1,, x k,n ) P(D k = 1 x k ) = p(x k ) Hodnocení klienta je jednoznačně definované a opakovatelné SCORE: R n R

1. Scoringový model K čemu je skorekarta? Jasně definovaná pravidla Automatizace Objektivita Opakovatelnost Optimalizace využití informace Využití soft ukazatelů Kombinace více ukazatelů P(D = 1 SCORE = x, v čase t ) = q( x,t ) q: R 2 [0,1] q je v x monotonní

2. Kalibrované a nekalibrované score Nekalibrované score Stejné základní ukazatele vstupující do výpočtu vedou v různém čase ke stejné hodnotě nekalibrovaného score (nekalibrované score pana Nováka se v čase nemění) Závislost PD na hodnotě nekalibrovaného score se v čase mění q(x,t) = P( D = 1 SCORE (NONCAL) = x, v čase t ) t 1 t 2, pak q( x, t 1 ) q( x, t 2 ) Rizikovost v závislosti na nekalibrovaném score vypočteném různými scorekartami není obecně srovnatelná. Dvě různé scorekarty: q 1 ( x, t ) q 2 ( x, t )

2. Kalibrované a nekalibrované score Standardní stupnice a kalibrované score Standardní stupnice Definuje vztah mezi hodnotou score a pravděpodobností defaultu Kalibrované score (SCORE (CAL) ) Platí v čase invariantní vztah mezi hodnotou score a pravděpodobností defaultu definovaný pomocí standardní stupnice Stejné základní ukazatele vstupující do výpočtu vedou v různém čase k různé hodnotě kalibrovaného score (pravděpodobnost selhání pana Nováka se v čase mění, tzn. má v čase různé kalibrované score) p(x) = P(D = 1 SCORE (CAL) = x ) Rizikovost v závislosti na kalibrovaném score vypočteném různými scorekartami je srovnatelná. Dvě různé scorekarty: p 1 ( x ) = p 2 ( x )

2. Kalibrované a nekalibrované score A co my? (RBI standardní stupnice) score 660 = poměr šancí 72 dvojnásobný poměr šancí každých 40 bodů p(x) = 1 c 1+ exp( i RBI + s RBI x ) i RBI = ln(72) 660 ln(2) s RBI = x 40 ln(2) x 40 Lineární závislost mezi score a logaritmem poměru šancí: ln 1 - p(x) x p(x) = i RBI + s RBI x

2. Kalibrované a nekalibrované score A co my? (URG ratingová stupnice) Na základě kalibrovaného score je stanoven rating Score Rating Score PD (%) < 500 4.5 < 500 > 18.18 [ 500, 540 ) 4.0 [ 500, 540 ) ( 10.00, 18.18 ] [ 540, 580 ) 3.5 [ 540, 580 ) ( 5.26, 10.00 ] [ 580, 620 ) 3.0 [ 580, 620 ) ( 2.70, 5.26 ] [ 620, 660 ) 2.5 [ 620, 660 ) ( 1.37, 2.70 ] [ 660, 700 ) 2.0 [ 660, 700 ) ( 0.69, 1.37 ] [ 700, 740 ) 1.5 [ 700, 740 ) ( 0.35, 0.69 ] [ 740, 780 ) 1.0 [ 740, 780 ) ( 0.17, 0.69 ] 780 0.5 780 0.17

2. Kalibrované a nekalibrované score Kalibrované nebo nekalibrované score? Nekalibrované score Ratingová struktura: Pokud banka nemění procesy, výrazně se nemění Její vývoj odráží změny v portfoliu z pohledu ukazatelů vstupujících do scorekarty Neříká mnoho o vývoji rizikovosti Kalibrované score Ratingová struktura: Dynamičtější Nese informaci o rizikovosti portfolia Srovnatelná mezi různými scorekartami Scvhalovací strategie (Cut-off): Je třeba měnit dle vývoje rizikovosti Scvhalovací strategie (Cut-off): Není třeba měnit

3. Kalibrace Kalibrace Cíl: Najít transformaci, která převede nekalibrované score na kalibrované Hledáme f t : S (NONCAL) S (CAL) pro kterou platí: Předpoklady o tvaru funkce q(x,t) q(x,t) = p(f t (x)) Podobně jako při vývoji scorekarty můžeme použít logistickou transformaci Lineární závislost ln(odds) a score je příliš omezující předpoklad Chceme umožnit korekci závisloti score na vybraných ukazatelích q(x,t) = 1 c 1+ exp( g t (x)+ γ t,v v ) v SV ln 1 - q(x,t) x q(x,t) = g t (x) + γ t,v v v SV f t (x) = - i RBI /s RBI + 1/s RBI g t (x) + γ t,v v v SV

3. Kalibrace Odhad g t Potřebujeme konkrétnější specifikaci g t (x): h i (x) jsou velmi jednoduché funkce score. Příklad: h i (x) = x i g t (x) = β t,i h i (x), i (polynomiální transformace score při kalibraci) Výsledný model: q(x,t) = 1 c 1+ exp( β t,i h i (x), + γ t,v v ) i v SV β t,i aγ t,v mohu odhadnout pomocí logistické regrese

3. Kalibrace Kalibrační vzorek Můžeme použít data s ukončenou outcome period, tzn. 12 měsíců stará data Kalibrační vzorek Datum kalibrace Outcome period 12 měsíců Použití kalibrace 3 měsíce Stabilita versus aktuálnost Pro relevantní odhady v logistické regresy potřebuji dostatečný počet defaultních klientů Pravidlo, které určí délku kalibračního vzorku podle počtu pozorováných špatných klientů Nejvíce chci zohlednit nejaktuálnější data Každému pozorování přiřadím váhu podle jeho stáří

3. Kalibrace Délka kalibračního vzorku, váhová funkce Váhová funkce Požadavky Starší pozorování mají menší váhu Nastavitelná rychlost zapomínání Formalizace: w: Z [0,1] R z 1 < z 2 w α (z 1,α ) w(z 2,α) α 1 < α 2 w(z,α 1 ) w(z,α 2 ) Další parametry TARGET_N B požadovaný počet defaultních klientů ve vzorku MIN_LS minimální délka kalibračního vzorku MAX_LS maximální délka kalibračního vzorku Délka kalibračního vzorku: LS t,w l = min max min l : i= Parametrizace váhové funkce: α t = 1 max α : MAX _LS 1 w i= 0 ( 12 i, α) 1 0 n w ( 12 i, 1) n B(t 12 i) TARGET _NB,MIN_LS,MAX _LS (t 12 i) TARGET_ B N B 0 když když LS t < MAX_LS když LS t = MAX_LS MAX_LS w( 12 i, 0) i= 0 1 n (t 12 i) TARGET_ B N B

3. Kalibrace A co my? (Parametrizace kalibrací) g t (x) Lineární transformace g t (x) = β t,0 + β t,1 x Pokud je detekována nelinearita v závislosti mezi kalibrovaným score a logaritmem poměru šancí, pak g t (x) = β t,0 + β t,1 x + β t,1 x 2 + β t,1 x 3 Váhová funkce w(z, α) = 1 ( max(1, z 13) ) α. Další parametry TARGET_N B = 350 MIN_LS = 3 MAX_LS = 24

3. Kalibrace Forward looking kalibrace motivace 16% 14% 12% 10% 8% 6% 4% 2% 15 měsíců Chyba kalibrace založené na historii hlavní důvod je zpoždění mezi kalibračním vzorkem a obdobím použití kalibrace. Kalibrační vzorek Datum kalibrace 0% 31JAN2004 30APR2004 31JUL2004 31OCT2004 31JAN2005 30APR2005 31JUL2005 31OCT2005 31JAN2006 30APR2006 31JUL2006 31OCT2006 31JAN2007 30APR2007 31JUL2007 31OCT2007 31JAN2008 30APR2008 31JUL2008 31OCT2008 31JAN2009 30APR2009 31JUL2009 31OCT2009 31JAN2010 30APR2010 31JUL2010 31OCT2010 31JAN2011 30APR2011 Pravděpodobnost defaultu Actual PD Predicted PD no calibration Predicted PD after calibration Outcome period 12 měsíců Použití kalibrace 3 měsíce Je možné kalibrovat lépe? Snad ano! prediktivní model pro PD (červená křivka) s použitím makroekonomických veličin použít makroekonomickou predikci PD k úpravě kalibrační transformace

3. Kalibrace Historie vs. budoucnost Historická kalibrace Kalibrace založená na historickém kalibračním vzorku. Logistická regrese s jedním prediktorem SCORE* (nekalibrované score). Výstup: f t (x) SCORE (CAL,history) = f t (SCORE (NONCAL) ) Calibration sample Outcome Period (12 months) Calibration date Usage period of the calibration (3 months) Predikce PD Predikce PD založená na makroekonomickém modelu. Výstup: (macro) PD m PD (target) - makroekonomická predikce váženého PD v měsíci m 1 (macro) = PDm 3 m období použití kalibrace Calibration date Macroeconomic forecast Development sample for used for calibration macroeconomic model PD adjustment

3. Kalibrace Úprava historické kalibrace dle predikce PD Forward Korekce interceptu looking kalibrační transformace kalibrace získané z historické kalibrace tak aby PD predikované pomocí výsledného kalibrovaného score bylo na kalibračním vzorku rovno požadované hodnotě dle makroekonomické predikce. Tzn je třeba nalézt takové aby platilo (target) 1 1 PD = N 660 ln(2) ( ( ( ) + + + ) calibratio contract i NONCAL 1 exp ln(72) ln(2) f n sample t SCORE i 40 40 Iterativní algoritmus pro výpočet Výstup: (0) (j + 1) = 0, (finální kalibrované score) SCORE (CAL) = + f t (SCORE (NONCAL) ) = PD (j) (j) + = 40 ln2 1 N (ukončit když (j + 1) (j) je dostatečně malé): 1 PD ln PD 1+ exp ln(72) (target) (target) 660 40 1 PD ln (j) PD (j) ln(2) + 1 ln(2) 40, (j) ( ( ( NONCAL ) + ft SCORE i ) Calibration Usage period Calibration sample date of the calibration Outcome Period (12 months) Development sample for macroeconomic model PD Macroeconomic forecast used for calibration adjustment