Logit vs při determinaci souhrnných ukazatelů výkonnosti bank Petr Gurný, Martin Gurný 2 Abstrakt Určování pravděpodobnosti úpadku (PD) se řadí mezi jeden z klíčových úkolů risk managementu. Tento parametr nehraje důležitou roli pouze při určování bonity dlužníka, ale také například při oceňování kreditních derivátů. V tomto příspěvku budeme diskutovat možnost určování PD pomocí credit-scoring modelů, a to konkrétně pomocí logit a probit modelu. Po představení teoretických východisek odhadneme v aplikační části oba modely na vzorku tří set amerických komerčních bank. Tyto modely budeme následně aplikovat jak na původní vzorek, tak také na kontrolní vzorek 00 amerických komerčních bank. Cílem příspěvku je určit PD vybraných amerických bank pomocí odhadnutého logit a u, diskutovat výhody a nevýhody obou modelů a srovnat dosažené výsledky. Klíčová slova Pravděpodobnost úpadku,,.. Úvod Určování bonity dlužníka, tedy určování jeho pravděpodobnosti úpadku (PD), je v současné době finanční krize v centru pozornosti spousty bank a ratingových agentur. A to nejen určování PD nefinančních institucí, ale zejména určování bonity finančních ústavů. Tento parametr hraje dále klíčovou roli v určování ratingů, oceňování dluhových instrumentů, jakými jsou např. kreditní deriváty, a při kalkulaci ekonomického a regulatorního kapitálu dle Basel II. Tyto důvody vedou k tomu, že je téma určování PD v centru pozornosti jak podnikatelské, tak akademické sféry. Mezi nejrozšířenější modely používané k určování bonity dlužníků patří tzv. credit-scoring modely. To jsou obecně vícerozměrné modely, které jako vstupy používají hlavní finanční indikátory, kterým následně dle konkrétního použitého modelu přiřazují váhy, tak, aby co nejlépe odrážely jejich relativní významnost při předpovědi defaultu. Credit-scoring modely se člení do několika kategorií (blíže viz Green (2008) nebo Engelmann and Rauhmeier (2006)). Statistická metodologie pro tyto procesy byla představena již autory jako jsou Fischer (936) a Durand (94), o rozvoj a aplikaci těchto modelů se dále zasloužil zejména Beaver (966) a Altman (968). V rámci České republiky patří mezi nejznámější model tzv. IN model, viz Neumaierová a Neumaier (2002). Tento článek vznikl za finanční podpory Studentské grantové soutěže EkF, VŠB-TU Ostrava v rámci projektu SP/20002 Určování pravděpodobnosti úpadku finančních institucí na bázi credit-scoring modelů a za pomocí Lévyho procesů a copula funkcí 2 Ing. Petr Gurný, VŠB Technická univerzita Ostrava, Ekonomická fakulta, katedra Financí, Sokolská 33, 70 2 Ostrava, e-mail: petr.gurny.ekf@vsb.cz. Bc. Martin Gurný, VŠB Technická univerzita Ostrava, Ekonomická fakulta, katedra Financí, Sokolská 33, 70 2 Ostrava, e-mail: martingurny@seznam.cz.
Tento příspěvek bude dále věnován regresní podskupině credit-scoring modelů, konkrétně logit a u, a to v aplikaci na finanční instituce. Modely sloužící k určování PD finančních institucí nejsou natolik rozvinuty jako modely k určování PD nefinančních institucí, nicméně některé výzkumy sloužící k určování bonity bank pomocí finančních ukazatelů již existují, viz např. Peresetsky and Karminsky (2008) a Gurný and Gurný (2009). Cílem tohoto příspěvku je odhadnout modely pro určování pravděpodobnosti úpadku bank z údajů amerického trhu pomocí logit a u a graficky demonstrovat rozdíly mezi nimi. Příspěvek bude strukturován následovně. V metodologické části bude nejprve detailněji představen logit a včetně odhadů parametrů. Tato metodologická východiska budou dále aplikována na vzorek 300 amerických komerčních bank, budou odhadnuty a porovnány oba modely, které budou následně aplikovány na kontrolní vzorek čítající 00 amerických komerčních bank. 2. Logit model, Jak již bylo uvedeno výše, logit a y jsou vícerozměrné statistické modely sloužící k předpovědi pravděpodobnosti defaultu, přičemž jako vstupy se využívají hlavní ekonomické a finanční ukazatele. Tyto modely zachycují vztah mezi závislou proměnnou Y (dichotomická proměnná) a jednou nebo více nezávislými proměnnými X. Vysvětlovaná proměnná,, je dána jestliže default nastane 0 jestliže default nenastane, a dále předpokládejme, že pravděpodobnost je dána a tedy že 0 je dána pravděpodobností : s pravděpodobností 0 s pravděpodobností. Cílem je tedy modelovat pravděpodobnost, že default nastane, specifikováním následujícího modelu, kde jsou jednotlivé finanční indikátory a a jsou odhadované parametry. Existuje řada možností, jak specifikovat, v tomto článku se ale zaměříme na logistickou a probistickou transformaci, tedy na logit a. Logit model exp exp exp,
Probit model 2 exp 2. Vzhledem k nelineárním vlastnostem těchto modelů není možné při odhadu parametrů využít klasickou OLS (ordinary least squares) metodu, nýbrž je nutné maximalizovat funkci věrohodnosti. Při dané pravděpodobnosti, můžeme formulovat pravděpodobnostní funkci jako. Z čistě výpočetních důvodů je vhodnější maximalizovat logaritmus této funkce, tedy ln ln ln. Konkrétně tedy pro logit a : ln ln exp ln exp, ln ln 2 exp 2 ln Maximalizací těchto funkcí získáme odhady parametrů a. 3. Aplikační část 2 exp 2 V této části budou výše uvedené metodologické poznatky aplikovány na vzorek 300 amerických komerční bank a bude odhadnut logit a pro určování PD bankovních institucí. Dále budou graficky demonstrovány rozdíly mezi oběma modely a následně budou oba modely aplikovány na kontrolní vzorek 00 amerických komerčních bank. 3. Vstupní data Jak již bylo uvedeno v úvodu, budeme v tomto příspěvku pracovat se vzorkem 300 amerických komerčních bank. První nezbytným krokem je rozdělení tohoto vzorku na dvě skupiny bank, zdefaultované a nezdefaultované. Definovat default lze řadou různých způsobů, v tom příspěvku budou za zdefaultované banky považovány ty, které se dostaly do likvidace, případně ty, kterým k přežití musel pomoct stát. Vzorky bank pro obě tyto skupiny byly
vybírány náhodně na základě veřejně dostupných informací. 3 Druhým krokem je určení finančních indikátorů (nezávislých proměnných). Zde byly brány v úvahu finanční ukazatele ze všech hlavních oblastí řízení bank (velikost banky, rentabilita, efektivita, kvalita aktiv a kapitálová přiměřenost), blíže viz Karminsky and Peresetsky (2008). V tabulce jsou uvedeny střední hodnoty vybraných finančních indikátorů pro obě skupiny bank. nezdefaultované banky zdefaultované banky fin. indikátory stř. hodnoty fin. Indikátory stř. hodnoty fin. Indikátory stř. hodnoty fin. Indikátory stř. hodnoty x : LTA 5,804 x 9 : PE OI 23,2% x : LTA,97 x 9 : PE OI 26,62% x 2 : YAEA 5,8% x 0 : PL GL 3,7% x 2 : YAEA 6,65% x 0 : PL GL 5,5% x 3 : CIBL 3,30% x : LLR GL,96% x 3 : CIBL 3,69% x : LLR GL 3,24% x 4 : NIM 3,56% x 2 : PL EQ LLR 27,42% x 4 : NIM 3,5% x 2 : PL EQ LLR 39,09% x 5 : ROAA,4% x 3 : T 0,70% x 5 : ROAA -4,3% x 3 : T 7,84% x 6 : ROAE 7,62% x 4 : EQ TA 0,92% x 6 : ROAE -68,3% x 4 : EQ TA 5,58% x 7 : IE II 37,87% x 5 : CAR 2,60% x 7 : IE II 55,43% x 5 : CAR 8,35% x 8 : CIR 86,8% x 6 : D EQ 7,862 x 8 : CIR 5,54% x 6 : D EQ 5,37 Tab.č. : Střední hodnoty finančních indikátorů pro obě skupiny bank 3.2 Odhad modelů Aplikací metodologických východisek z teoretické části na uvedená vstupní data byly odvozeny následující modely: exp7,96 66,87, 88,37, 45,38,, 2 exp 2 2,2 2, 2,9, 25,8, Φ2,2 2, 2,9, 25,8,, kde, a značí YAEA (yield on average interest earning assets), ROAA (return on average assets) a PL GL (problem loans on gross loans). 4 Tyto modely byly nejprve zpětně aplikovány na výchozí vzorek bank s cílem určit jejich odhadnuté PD. V tabulce 2 a 3 jsou uvedeny odhadnuté střední hodnoty PD (zleva pro logit a ) pro obě skupiny bank ze vzorku, na obrázcích a 2 jsou pak graficky znázorněny odhadnuté PD pro každou konkrétní banku ze vzorku (na ose x jsou pořadová čísla bank, kde zhruba prvních 45 bank jsou banky nezdefaultované), opět pro oba modely. nezdafaultované banky stř. hodnoty zdefaultované banky stř. hodnoty Tab.č.2: Střední hodnoty PD () nezdafaultované banky stř. hodnoty zdefaultované banky stř. hodnoty PD,28% PD 90,40% PD 4,32% PD 82,50% Tab.č.3: Střední hodnoty PD () 3 www.federalreserve.gov, www.failedbankreporter.com 4 při eliminaci jednotlivých ukazatelů byla využita stepwise metoda
Z uvedených hodnot v tabulkách a z grafických výsledků je zřejmé, že přestože oba modely rozdělují obě skupiny bank docela dobře (,28 % a 90,4 % pro, 4,32 % a 82,5 % pro, respektive), vhodnějším modelem pro určování pravděpodobnosti úpadků je v tomto případě. Obr.č.: Odhadnuté PD () 0 9 8 7 6 5 4 3 2 0 50 00 50 200 250 300 Obr.č.2: Odhadnuté PD () 0 9 8 7 6 5 4 3 2 0 50 00 50 200 250 300 Non - default banks Default banks Non-default Default Graficky demonstrovat rozdíly mezi oběma modely můžeme také pomocí závislosti tzv. z-score,, a pravděpodobnosti úpadku. Výsledky můžeme pozorovat na obrázku 3, na obrázku 4 pak ve výřezu pak koncové hodnoty. 0 Obr.č.3: logit vs logit vs probit Obr.č.4: logit vs (koncové hodnoty) 0,20% logit vs probit prob. of default 8 6 4 2 logit probit prob. of default 0,5% 0,0% 0,05% logit probit -0,00-5,00 0,00 5,00 0,00 Score -9,50-9,00-8,50-8,00-7,50-7,00 Score Z grafických výsledků je vidět, že oba modely mají podobný průběh a kvalitativně dávají obdobné výsledky. Hlavní rozdíl mezi nimi pak spočívá v tom, že logistická regrese (logit model) vykazuje mírně těžší konce. 3.3 Aplikace odhadnutých modelů na kontrolní vzorek bank Dalším krokem je aplikace odhadnutých modelů na kontrolní vzorek 00 amerických komerčních bank, které nebyly obsaženy v původním vzorku, s cílem ověřit úspěšnost odhadnutých modelů. Výsledky jsou opět prezentovány na střeních hodnotách PD (tabulka 4 a 5) pro oba modely a na obrázcích 5 a 6 na grafických vyjádřeních konkrétních PD pro každou banku (na ose x jsou opět pořadová čísla bank, kde prvních 50 bank jsou banky nezdefaultované). nezdefaultované banky stř. hodnoty zdefaultované banky stř. hodnoty nezdefaultované banky stř. hodnoty zdefaultované banky stř. hodnoty PD 8,44% PD 85,50% PD 3,94% PD 72,79% Tab.č.2: Střední hodnoty PD () Tab.č.3: Střední hodnoty PD () Z uvedených hodnot je opět patrné, že lepších výsledků při aplikaci na kontrolní vzorek dosahuje, u nezdefaultovaných bank se výsledky oproti odhadnutému modelu o něco zlepšily. Naopak u u se výsledky pro obě skupiny bank staly mírně horšími.
Obr.č.5: Odhadnuté PD () 00,0% 90,0% 80,0% 70,0% 60,0% 50,0% 40,0% 30,0% 20,0% 0,0% 0,0% 0 0 20 30 40 50 60 70 80 90 00 Obr.č.6: Odhadnuté PD () 00,0% 90,0% 80,0% 70,0% 60,0% 50,0% 40,0% 30,0% 20,0% 0,0% 0,0% 0 0 20 30 40 50 60 70 80 90 00 Non - default banks Default banks Non - default banks Default banks 4. Závěr Pravděpodobnost úpadku jako klíčový parametr při určování ratingu, oceňování kreditních derivátů a určování kapitálové přiměřenosti se v současné době doznívající finanční krize dostává do centra zájmu jak podnikové tak akademické sféry. Tento příspěvek je věnován možnostem určování pravděpodobnosti úpadku komerčních bank dle tzv. credit-scoring modelů, a to konkrétně pomocí regresních logit a ů. Ze vzorku 300 amerických bank byly odhadnuty dva modely, které byly následně zpětně aplikovány na původní vzorek bank a dále byly použity k ověření na kontrolním vzorku 00 amerických komerčních bank. Z dosažených a předložených výsledků lze říci, že oba modely dávají kvalitativně podobné výsledky, přesto hodnoty o u vycházejí o něco lépe. Hlavní rozdílem obou modelů jsou pak mírně těžší konce u u. Literatura [] ALTMAN, E. I. Financial Ratios, Discriminant Analysis and the Prediction of Corporate Bankruptcy. Journal of Finance, September, 968, 589-609. [2] ALTMAN, E. I., at al. Application of Classification Techniques in Business, Banking and Finance. JAI Press, Greenwich, 98. [3] BALTHAZAR, L. From Basel to Basel 3: The Integration of State-of-the-Art Risk Modeling in Banking Regulation. New York: Palgrave Macmillan, 2006. 294 p. [4] BEAVER, W. Financial ratios as predictors of failures. Empirical Research in Accounting: Selected Studies 966, supplement to Journal of Accounting Research, 4, 967, 7-. [5] DURAND, B. Risk elements in consumer installments financing. Working paper, 94, NBER. [6] ENGELMANN, B., RAUHMEIER, R. (Eds.) (2006): The Basel II Risk Parameters. Springer Verlag, 2006. [7] FISHER, R. The use of multiple measurements in taxonomic problems. Annals of Eugenics, 7, 936, 79-88. [8] GREEN, W. (2008): Econometric Analysis. 6 th ed. Prentice Hall, 2008. [9] GURNÝ, P., GURNÝ, M. (2009): Estimation of PD of financial institutions within linear discriminant analysis. Mathematical Methods in Economics. CZU Praha, 2009. [0] JAKUBÍK, P., TEPLÝ, P. (2008): The Prediction of Corporate Bankruptcy and Czech Economy s Financial Stability through Logit Analysis. Institute of Economic Studies Working Paper, no. 9., 2008. [] KARMINSKY, A., PERESETSKY, A. Models for Moody s bank rating, BOFIT Discussion Papers 7, 2007.
[2] NEUMAIEROVÁ, I., NEUMAIER, I. (2002). Výkonnost a tržní hodnota firmy. Praha: Grada Publishing. [3] PERETSKY, A., KARMINSKY, A. (2008): Models for Moody s bank rating, BOFIT Discussion Papers 7, 2008. [4] QUEEN, M., ROLL, R. Firm mortality: using market indicators to predict survival. Financial Analysts Journal 3, 987, 9 26. [5] RESTI, A., SIRONI, A. Risk management and Shareholders value in banking. Chichester: Wiley, 2007, 782 p. [6] SANTOMERO, A., VISNO, J. D. Estimating the probability of failure for commercial banks and the banking system. Journal of Banking and Finance, 977, 85 25. Summary One of the most important tasks in the risk management, rating estimation, pricing of credit derivatives and many others key financial fields is the correct determination of probability of default (PD) of particular financial subjects. In this paper a possibility of determination of financial institution s PD according to credit scoring models is discussed. First, in theoretical part, we will briefly introduce the two categories of credit scoring models, which will be afterwards used in application part and. In the main part of the paper we will work with the sample of almost three hundreds of commercial US banks which will be separate into the groups of defaulted and non-defaulted banks on the basis of historical information. Subsequently, we will stepwise apply the above mentioned models on this sample to derive two models for estimation of PD. The goal of the paper is estimation of the PD of chosen US banks by means of the logit and, discussion of the drawbacks and advantages of these models and comparison of the reached results.