Investiční strategie na základě scoringu

Podobné dokumenty
MultiCharts Integration Guide A S S E T M A N A G E M E N T P R O J E C T. Verze 1.0 Česky

Subscription Guide A S S E T M A N A G E M E N T P R O J E C T. Verze 2.4 Česky

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

PRAVIDLA KOMERČNÍ BANKY, A.S. PRO OBCHODOVÁNÍ S NÁSTROJI

Reporting Guide A S S E T M A N A G E M E N T P R O J E C T. Verze 1.8 Česky

ČESKÁ SPOŘITELNA a.s.

INFORMACE O INVESTIČNÍCH SLUŽBÁCH A NÁSTROJÍCH

MT5 Integration Guide A S S E T M A N A G E M E N T P R O J E C T. Verze 1.2 Česky

7. Rozdělení pravděpodobnosti ve statistice

5. Umělé neuronové sítě. Neuronové sítě

7. přednáška Systémová analýza a modelování. Přiřazovací problém

Otázky ke státní závěrečné zkoušce

Credit scoring. Libor Vajbar Analytik řízení rizik. 18. dubna Brno

METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1

INFORMACE O RIZICÍCH

Kalibrace scoringových modelů

Aplikovaná statistika v R - cvičení 3

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Otázka č. 2: Ekonomická analýza banky, analýza aktiv, pasiv, nákladů a výnosů.

DERIVÁTOVÝ TRH. Druhy derivátů

Návrh postupu pro stanovení četnosti překročení 24hodinového imisního limitu pro suspendované částice PM 10

Produkty finančních trhů a jejich rizika. Ostatní produkty

Jak Admiral.MAC funguje?

Services Guide A S S E T M A N A G E M E N T P R O J E C T. Verze 2.3 Česky

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy

PRAVIDLA PRO PROVÁDĚNÍ OBCHODŮ

Rychlý průvodce finančním trhem

Komplexní čísla, Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady

PRAVIDLA PRO ZPRACOVÁNÍ NÁKUPNÍCH A PRODEJNÍCH POKYNŮ CENNÝCH PAPÍRŮ ( PRAVIDLA )

8. Sběr a zpracování technologických proměnných

Informační systém banky

EBA/GL/2013/ Obecné pokyny

Modelování a optimalizace vozidel, linek a dopravní infrastruktury města. Zdeněk Peroutka, Jan Přikryl, Radim Dudek, Pavel Drábek

Rizika na liberalizovaném trhu s elektřinou

Výpočet hodnoty rizikově vážené sekuritizované expozice při používání standardizovaného přístupu

4EK201 Matematické modelování. 2. Lineární programování

Matematika. 7. ročník. Číslo a proměnná celá čísla. absolutní hodnota čísla. zlomky. racionální čísla

Návratnost projektu EDC příklad

Matematika stavebního spoření

7 Regresní modely v analýze přežití

MODERNÍ METODY SEGMENTACE ZÁKAZNÍKŮ Ing. Miloš Uldrich ZÁKAZNICKÁ LOAJALITA A AKVIZICE VE FINANČNÍCH SLUŽBÁCH. StatSoft CR

2.6. VLASTNÍ ČÍSLA A VEKTORY MATIC

Forex Outlook USDCAD

OMEZÍ REÁLNOU EKONOMIKU ZHORŠUJÍCÍ SE PŘÍSTUP K FINANCOVÁNÍ?

FOREX. Jana Horáková. (sem. sk. středa 8,30-10,00)

KGG/STG Statistika pro geografy. Mgr. David Fiedor 4. května 2015

PŘEDMLUVA 1 PŘEDMĚT A CÍL FINANČNÍ ANALÝZY 3 METODY FINANČNÍ ANALÝZY 7

Intervence: Jdeme do finále

Úvod. Kapitálové statky výrobek není určen ke spotřebě, ale k další výrobě (postupná spotřeba) amortizace Finanční kapitál cenné papíry

Příručka k měsíčním zprávám ING fondů

Web-terminal User s Guide A S S E T M A N A G E M E N T P R O J E C T. Verze 1.0 Česky

vzorek vzorek

JAK (ZNOVU) ZAČÍT. Webinář pro klienty Praha, Tomáš Vobořil, Colosseum, a.s.

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy

Náklady kapitálu. Finanční struktura by měla korespondovat s majetkovou strukturou z hlediska časovosti. Stálá aktiva. Dlouhodobý.

Příručka k měsíčním zprávám ING fondů

Metodika klasifikace fondů závazná pro členy AKAT

FOREX - INVESTICE - TRADING INOVATIVNÍ ZPŮSOB INVESTOVÁNÍ NA TRZÍCH

Segmentace bankovních zákazníků algoritmem k- means

INVESTIČNÍ DOTAZNÍK. 1. Identifikace zákazníka. 2. Investiční cíle zákazníka. Jméno a příjmení / obchodní firma / název: RČ/IČ: bytem/sídlo:

Složitost Filip Hlásek

INVESTIČNÍ DOTAZNÍK (dále jen dotazník )

MODEL OBCHODOVÁNÍ PRO STRUKTUROVANÉ PRODUKTY

Regresní a korelační analýza

1. Úvod 2. Ekonomický kalendář 3. Přizpůsobení kalendáře 4. Důležité ekonomické zprávy 5. Výhody používání kalendáře

Detekce neznámých typů mutantů na základě odlišnosti kinetiky fluorescence

Posouzení finanční stability města Jeseník ve vztahu k plánovaným investicím

MSFN Hodnocení firem aneb co to znamená úspěšná firma. 2018/2019 Marek Trabalka

Komerční banka. Akumulovat Sázka na dividendu a oživení

Akciové. investování.

Normální (Gaussovo) rozdělení

Ilustrační příklad odhadu LRM v SW Gretl

Investiční produkty v rámci finanční skupiny České spořitelny

Rizika v oblasti pasivních obchodů banky Banka podstupuje při svých pasivních obchodech níže uvedená rizika:

Úvod do zpracování signálů

Úvod do analýzy cenných papírů. Dagmar Linnertová 5. Října 2009

2D transformací. červen Odvození transformačního klíče vybraných 2D transformací Metody vyrovnání... 2

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

INVESTIČNÍ DOTAZNÍK pro investiční službu AURA INVEST Chytré portfolio

STATISTICKÉ PROGRAMY

Inovace bakalářského studijního oboru Aplikovaná chemie

Aplikace teoretických postupů pro ocenění rizika při upisování pojistných smluv v oblasti velkých rizik

Cvičení z matematiky jednoletý volitelný předmět

Použití technik UI v algoritmickém obchodování III

Zpracování digitalizovaného obrazu (ZDO) - Popisy III

4EK311 Operační výzkum. 1. Úvod do operačního výzkumu

Předpokládané znalosti žáka 1. stupeň:

Změna hodnoty pozice v důsledku změn tržních cen.

Změna hodnoty pozice v důsledku změn tržních cen.

Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady

TRADESTATION A ÚSPĚŠNÝ ALGORITMICKÝ TRADING. Ing. Petr Tmej petr.tmej@aostrading.cz

Shrnutí látky EBF 1 a 2

Technická Analýza Aktualizace doporučení obnovení nákupního doporučení long.

Pravděpodobnost, náhoda, kostky

Opční strategie Straddle, Strangle

Transkript:

FAR 2-38. Non-confidential Česky Investiční strategie na základě scoringu Andrej Chomič Faunus Analytics Research Překlád z Ruštiny Úvod V první části se popisuje pojem scoringu, uvádějí se příklady použití scoringu pro vyřešení praktických úloh v různých oblastech podnikání. Druhá část je zaměřena na použití technologií scoringu pro vybudování a optimalizaci investičních strategií, pro přijetí obchodních rozhodnutí a pro řízení rizik na finančních trzích (příkladem bude sloužit trh FOREX). Materiál tohoto článku zahrnuje základní teoretické principy, které jsou používány pro výzkum a vývoj v rámci projektu Faunus Asset Management. Definice scoringu Nech máme cílový objekt, který se charakterizuje svým minulým a současným stavem. Tímto objektem může být finanční trh, klient banky, produktový segment atd. Nechme také, že tento objekt má některou charakteristiku, která přijímá pouze 2 hodnoty. Označme tuto binární charakteristiku za cílovou proměnnou. Zajímá nás budoucí hodnota cílové proměnné. Scoringem tudíž je hodnocení pravděpodobností budoucích hodnot cílové proměnné podle známé historie stavů objektu. Aplikace scoringu Výše jsme uvedli formální definici scoringu. Pro lepší pochopení aplikovaného významu scoringu je účelné probrat příklady jeho využití. Kreditní scoring Hodnocení rizik spojených s poskytováním a správou půjček v bankovní činnosti se nazývá kreditní (úvěrový) scoring. Vyčleňují se scoring úvěrové žádosti (application scoring) a scoring chování (behavior scoring). Rozebereme první typ kreditního scoringu. V tomto případě je objektem žádost o úvěr. Stavem objektu je charakteristika žadatele, například: věk, povolání, současné pracovní místo, stáže na současném pracovním místě, průměrný příjem za poslední rok atd. Pokud žadatel (applicant) již dříve dostával půjčky, pak nejdůležitější charakteristikou je historie splacení těchto úvěrů. Je důležité spojovat a porovnávat příjem žadatele, jeho současné výdaje, sumu a předpokládanou dobu splacení příslušného úvěru. Vyčlenění potenciálně důležitých charakteristik žádosti o úvěr a žadatele není jednoduchou úlohou, která v sobě spojuje tvůrčí přístup a přísnost statistické analýzy. Touto úlohou se zabývají analytici, kteří se dobře orientují v bankovní činnosti.

Cílovou proměnnou je defolt z úvěru. Defolt se může uskutečnit nebo neuskutečnit. Tzn., že jsou na místě dvě reálné hodnoty cílové proměnné. Zde se potýkáme s druhou komplikací s volbou cílové proměnné. Definice defoltu je ve skutečnosti nejednoznačná. Definice defoltu jako nemožností vymoci dluh soudní cestou je pro byznys proces řízení rizik špatně přijatelná. Příliš mnoho času uplývá mezi prvními příznaky blížícího se problému a právně uznaným defoltem. Daleko cennější je určení defoltu jako prodlení ve splacení úvěru delší než 6 měsíců. Jsou možné i jiné definice defoltu. Scoring v telekomunikačních společnostech Telekomunikační byznys je byznysem vysoce konkurenčním. Praxe ukazuje, že získávání klientů je mnohem dražší než jejich udržení. Proto je velmi důležité včas identifikovat již podle raných příznaků potenciální možnost přechodu klienta ke konkurenci. Scoring se může používat pro udržení klientů. Objektem scoringu je abonent, který se charakterizuje personálními daty, historii využití služeb. Cílovou proměnnou je odmítnutí klientem služeb společnosti. A zase definice cílové proměnné není triviální úlohou. Specifikou telekomu je, že abonent velmi vzácně píše žádost o odmítnutí služeb, častěji jednoduše je přestává využívat. Lze to identifikovat podle nulového trafiku. I přesto nulový trafik za konkrétní období může být způsoben například dovolenou nebo pracovní cestou abonentu. Jako dostatečně dobrá definice odlivu může sloužit příznak absence trafiku a jakékoliv další aktivity abonenta za období delší než 3 měsíce. Scoring pro investiční strategie na FOREX Formalizace trhu Objektem scoringu může také být finanční trh. Rozebereme v této souvislosti měnový trh FOREX. Volba charakteristik historie trhu a cílové proměnné je komplikovanou úlohou. Je potřeba zvolit hloubku historie kotací, timeframe, způsob redukování počtu proměnných a mnoho dalšího. Zde v nejobecnějším tvaru popišme jeden z možných přístupů k formalizaci úlohy scoringu FOREX. Historie kotací s některým zjednodušením může být prezentována jako množství hodnot kotací, oddělených přes časová období s permanentní periodou. Časová období lze očíslovat. Pak historie kotací může být prezentována jako časová řada rate = rate[t], rate[t+1],..., rate[t+n], rate[t+n+1] Při prognózování kotací měnového páru jsou nám známé hodnoty kotací rate[t], rate[t+1],..., rate[t+n] a je potřeba udělat prognózu některých důležitých vlastností, a společně s tím zdůraznit, že pro praktické potřeby není nutní prognózovat samotnou hodnotu kotací.

Volba cílové proměnné scoringu Volba cílové proměnné je často spojena s kompromisem. V ideálu samozřejmě bychom chtěli mít model, který dostatečně přesně prognózuje kotace za každou minutu na období 2-3 let. Bohužel, model tohoto typu není možné vybudovat. Proto je potřeba zjednodušovat definici úlohy s cílem dodržet kompromis mezi zjednodušením modelování a aplikovanou významností výsledku. Toto je tvůrčí úloha, která v sobě obsahuje element svévole výběru. Například, lze určit cílovou proměnnou jako znak změny kotace měnového páru za období určitého trvání. Pro FOREX je důležité umět prognózovat znak změny kotací. Ale prakticky je hodně důležitější prognózování významných změn kotací, umožňujících pokrývat brokerské komise a spready. Scoringový model se optimalizuje na historických příkladech. Algoritmy optimalizace scoringových modelů umožňují přidávat příkladům vah číselné nezáporné hodnoty. Pokud určíme každému příkladu váhu prognózování pro případy významných změn kotací., pak vylepší model přesnost Lze nabídnout i rozšířenou variantu určení váhy příkladu. Při rozšířené variantě se část příkladů s nedostatečně výrazným chováním trhu nebo anomálními vychrleními (s větší mírou šumu a menším podílem užitečných informací) neučástní optimalizace scoringového modelu. Praxe ukazuje, že podobná strategie filtrace šumu umožňuje zlepšit přesnost modelování. Scoring trhu Prognóza měnového páru se zjednodušeně omezuje na prognózu znaku změny kotace. Výsledkem prognózy je hodnocení pravděpodobnosti možných výstupů. Kde: 1. rate - historie kotace měnového páru 2. TRANSFORM - funkce transformace historie kotací 3. SCORING_MODEL - model scoringu, umožňující podle transformované historie vyhodnotit pravděpodobnost budoucího růstu kotací.

Předzpracování dat Jedná z variant předzpracování historie kotací Nabízený způsob transformace je jednoduchý ve své realizaci a zároveň odstraňuje některé efekty nestacinarity časových řad FOREX. Pro redukci vlivu vychrlení a heteroskedascisity (proměnlivosti volatility) lze používat logaritmování: V případě však, že počítáme s tím, že prudké kolísání kurzu v minulosti je důležité pro prognózu v budoucnu, pak lze použit umocňování: Výsledkem transformace je také časová řada, odvozená od časové řady kotací. Struktura modelu Jako model scoringu SCORING_MODEL se může používat logistická regrese. Funkce logistické regrese: Kde: 1. - logistická funkce 2. - lineární funkce 3. x - vektor prediktorů. V případě FOREX je to výsledek transformace časové řady kotací. 4. - vektor koeficientů regrese. Koeficienty regrese se hodnotí specializovanými algoritmy optimalizace. Většina programů statistické analýzy zahrnuje hotové realizace algoritmů vybudování regrese.

Obrázek 1 Příklad grafu logistické funkce Důležitou vlastností logistické funkce je monotónnost a omezenost číselným úsekem (0,1). Všechno toto umožňuje interpretovat logistickou regresi jako hodnocení pravděpodobnosti. Struktura scoringového modelu se neomezuje pouze na logistickou regresi. Například, scoringový model lze vybudovat na základě umělé neuronové sítě nebo dalších řešení. Hodnocení parametrů Scoringový model se staví pro skupinu objektů jedné třídy. Odlišuje to scoringový model od modelu časové řady. Při prognózování časových řad se ve finále buduje zvláštní model pro každou časovou řadu, anebo jediný model pro nevelkou skupinu časových řad (vícerozměrné prognózování časových řad). Ve scoringu jeden univerzální model se aplikuje na nekonečně velkou skupinu objektů. Segmentace obchodních nástrojů FOREX se může uskutečňovat podle různých kriterií. Například, podle úrovně likvidity, podle typu kotováného objektu (měna, kov, ropa atd.). Jsou možná i jiná kriteria segmentace. Konkrétně pro FOREX to znamená, že není nutné prognózovat EUR/USD jedním modelem, a AUD/CHF pak druhým. Lze tyto měnové páry sloučit podle příznaku vysoké likvidity a shodné volatility, a dále používat pro prognózování jediný univerzální model. Scoringový model není něčím neměnným. Model musí počítat se změnami tržních zákonitostí. Proto parametry modelu je nutno periodicky nebo podle události opakovaně optimalizovat s ohledem na nová data. Optimalizace parametrů se provádí na datech minulých pozorování. Ale účelem optimalizace parametrů modelu je prakticky přijatelná přesnost prognóz na nových datech. Abychom kontrolovali očekávanou přesnost modelu na nových datech, je potřeba část známých příkladů vyčlenit pro testování. V jednoduché variantě trainingové a testové množství příkladů může být vytvořeno jednou náhodným výběrem. Lze rovněž do testového množství zapojovat pouze příklady za poslední období pozorování. Lze též pro training modelu využívat pouze příklady za období pozorování, která předcházejí období testování (walk forward analysis). Doporučujeme využívat cross-testování (cross validation). Cross-testování předpokládá rozdělení celého období pozorování na rovnocenné úseky. Každý úsek období pozorování se jeden po druhém stává testovým obdobím, kdežto ostatní obdobím trainingovým. Výsledky testování zvláštních úseků se zprůměrňují.

Přijetí obchodních rozhodnutí Obchodník vždy má na FOREXu 4 varianty řešení: 1. Otevřít dlouhou pozici 2. Otevřít krátkou pozici 3. Uzavřít všechny současné pozice na obchodní nástroj 4. Neotevírat dodatečnou pozici na obchodní nástroj Obchodník může nevstupovat na trh s preferencí absence zisku před alternativou neúměrně vysokých rizik ztrát. Pro pochopení ve které situaci je lepší vstupovat na trh, lze využit analýzy křivky ziskovosti. Tržní situaci lze charakterizovat jedním číslem hodnocením pravděpodobnosti, které je realizováno pomocí scoringového modelu. Tím pádem může být úloha omezena na výběr limitní hodnoty pravděpodobnosti. Tento limit je zvykem ve scoringu jmenovat prahem odseknutí. Jak bude popsáno dále, pro FOREX se používají 2 meze odseknutí: práh vstupu na trh a práh výstupu z trhu. Algoritmus výběru prahu vstupu na trh může být následující: 1. Uvádí se omezení na očekávané statistické charakteristiky obchodování 2. Historické příklady z testového množství (viz sekci Scoring trhu / Hodnocení parametrů ) se zařazují do žebříčku podle klesání maximálního testového hodnocení pravděpodobnosti. Připomínáme, že scoringový model hodnotí pravděpodobnost 2 nespolečných událostí - růstu a snížení kotací. 3. Pro každou prahovou variantu vstupu na trh se určuje: a. očekávaná průměrná a nejmenší ziskovost, při otevření pozic v případě překročení pravděpodobnosti prahu vstupu na trh v nejpřijatelnějším směru b. očekávané množství operací za období c. očekávaný maximální drawdown za období d. jiné očekávané statistické charakteristiky výsledků budoucího obchodování 4. Vynechávají se prahové varianty vstupu na trh, pří kterých statistické charakteristiky obchodování neodpovídají stanoveným omezením 5. Ze zbývajících prahových variant vstupu na trh pak volíme variantu, která přináší maximální očekávanou ziskovost.

Obrázek 2 Výběr meze odseknutí (cutoff) podle křivky ziskovosti. Kromě řešení úlohy výběru okamžiku vstupu na trh, je také důležité vědět vhodný okamžik výstupu z trhu. Pro to je potřeba zavést druhý práh odseknutí práh výstupu z trhu. Tento práh je vždycky očividně menší než práh vstupu na trh. Při optimalizaci prahu výstupu z trhu je velmi důležité počítat se spreadem a s brokerskou komisí. Práh výstupu z trhu nesmí být příliš blízko prahové hodnotě vstupu na trh. Jinak může vzniknout riziko otevření velkého podílu pozic otevíraných na krátké časové období. Čas udržení pozic může být nedostatečný pro pokrytí průměrnou ziskovosti podle pozic spreadů a brokerských komisí. V tomto případě bude samozřejmě broker spokojený, ale obchodník bude nést ztráty Scoring vytváří prognózu trhu pro omezené období. Pozice musí být každopádně uzavřena po skončení doby platnosti prognózy. Kromě prahů odseknutí nelze také zapomínat na tradiční prostředek kontroly rizik stopúrovně a řízení objemů pozic (money management). Takže, v minimální variantě jsme napočítali pět parametrů procedury přijetí obchodních rozhodnutí: 1. Práh vstupu na trh 2. Práh výstupu z trhu 3. Limitní úroveň ztrát na pozici (stop loss) 4. Limitní úroveň zisku na pozici (take profit) 5. Objem pozice Tyto parametry jsou navzájem propojeny. Optimalita hodnoty jednoho parametru závisí na zvolených hodnotách jiných parametrů. Proto se tyto parametry musí optimalizovat společně. Pro redukci výpočtů lze používat metody skenování podle mříže, pseudogradientního odtoku, náhodného hledání, genetických algoritmů. Stejně jako v případě hodnocení parametrů scoringového modelu (viz sekci Scoring trhu / Hodnocení parametrů ), je třeba vyčlenit testové období, na kterém se budou hodnotit očekávané charakteristiky budoucího obchodování.

Kontaktní informace Andrej Chomič Faunus Analytics Research +7 495 648-69-18 (Moskva, Ruská Federace) fardd@faunusanalytics.com www.faunusanalytics.com