PŘEDPOVĚDI SMĚRU VÝVOJE ČASOVÝCH ŘAD VYBRANÝCH REGIONÁLNÍCH UKAZATELŮ # DIRECTIONAL FORECASTS OF TIME SERIES OF SELECTED REGIONAL INDICATORS KÁBA, Bohumil Abstract Traditional evaluation of forecasting models peformance is based on several model selection criteria which provide information about the accuracy of forecasts. This paper has a methodological character and describes the procedure that allows to evaluate the directional accuracy of a forecast. This procedure is then applied to the set of real time series of selected regional indicators. Key words: time series, forecasting model, accuracy of forecast, directional forecast. Abstrakt Tradiční hodnocení kvality předpovědních modelů časových řad je založeno na některých selekčních kritériích, která poskytují informaci o přesnosti předpovědí. Daný příspěvek má metodologický charakter a popisuje proceduru, která umožňuje hodnocení předpovědí z hlediska vystižení směru vývoje časové řady. Uvedená procedura je potom použita na souboru reálných časových řad vybraných regionálních ukazatelů. Klíčová slova: časová řada, předpovědní model, přesnost předpovědi, předpověď směru vývoje. Úvod Významnou a nezbytnou součástí každého prognostického systému je monitorování a hodnocení kvality stanovených předpovědí. Pro tyto účely byla zkonstruována řada měr přesnosti predikce, založených na faktických zjištěných rozdílech mezi skutečnými a prognózovanými hodnotami analyzované veličiny. Mezi nejfrekventovanější míry přesnosti predikce patří střední kvadratická chyba MSE, střední absolutní chyba MAE, střední absolutní procentuální chyba MAPE, Theilův koeficient atd. (DELURGIO, 1998). Tyto metriky # Poznatky uváděné v příspěvku vyplynuly z řešení IVZ MSM 6046070906 "Ekonomika zdrojů českého zemědělství a jejich efektivní využívání v rámci multifunkčních zemědělskopotravinářských systémů". Pieces of knowledge introduced in this paper resulted from solution of an institutional research intention MSM 6046070906 Economics of resources of Czech agriculture and their efficient use in frame of multifunctional agri-food systems. 264
nejenom syntetickým způsobem charakterizují přesnost predikce, dosažené v minulosti, ale některé z nich např. MSE mohou být rozloženy do několika složek, jež popisují určité významné individuální vlastnosti prognostických metod (např. zkreslení apod.). V některých situacích je však pro analýzu důležitější postihnout nikoliv hodnotu zkoumané veličiny, nýbrž směr vývoje časové řady tohoto ukazatele. Metrikám, které jsou orientovány na zhodnocení relací mezi vývojovými tendencemi skutečných hodnot a jejich predikovaných hodnot, je ve statistické metodologii zatím věnována poměrně malá pozornost. V daném příspěvku je stručně uvedena procedura hodnocení směrových předpovědí jednorozměrných časových řad, která je modifikací metodiky navržené v publikaci (PESARAN, TIMMERMANN, 2004). Materiál a metodika Cílem příspěvku je identifikace vhodných modelů ročních časových řad ukazatelů trhu práce v Jihočeském kraji a evaluace směrových předpovědí z těchto modelů. Pro empirickou evaluaci byly zvoleny časové řady, které zahrnovaly ukazatele: věk populace v Jihočeském kraji (12 časových řad dle různých věkových skupin) pracovní síla v Jihočeském kraji důvody neaktivity a postavení neaktivního obyvatelstva (7 časových řad) zaměstnanost v národním hospodářství odvětví činnosti zaměstnaných v národním hospodářství (7 časových řad) nezaměstnaní v Jihočeském kraji míra nezaměstnanosti v Jihočeském kraji míra ekonomické aktivity v Jihočeském kraji. Všechny časové řady se vztahovaly k období 1993 2006. Podkladová data byla získána z databáze Českého statistického úřadu (4). Identifikace respektive konstrukce adekvátních prognostických modelů byla založena na selekčním postupu, využívajícím zkrácenou časovou řadu o cca 25 % pozorování (SAS, 1995) a byla realizována pomocí statistického programového systému SAS, v jehož komponentě TSFS jsou implementovány velmi efektivní diagnostické testy. Pro hodnocení směrových předpovědí bylo využito asociačních tabulek 2 x 2, sumarizujících četnosti souhlasného respektive nesouhlasného směru vývoje skutečných hodnot sledovaných ukazatelů trhu práce Jihočeského kraje a hodnot jejich krátkodobých předpovědí (s horizontem předpovědi h = 1), získaných z jednotlivých prognostických modelů. Tabulky pak byly dále analyzovány obvyklými postupy zkoumání závislosti kategoriálních znaků. Výsledky Pro modelování a konstrukci krátkodobých extrapolačních předpovědí (s jednočlenným horizontem předpovědi) disponibilních časových řad výše zmíněných ukazatelů byly zvoleny modely, charakterizované nejnižšími hodnotami extrapolačního kriteria MAPE (střední absolutní procentuální chyby), které se vztahovaly k období evaluace 2003 2005. Jednalo se o čtyři adaptivní modely (Brownovy modely jednoduchého respektive dvojitého exponenciálního vyrovnávání, model exponenciálního vyrovnávání s tlumeným trendem, Holtův model exponenciálního vyrovnávání) a dále o model náhodné procházky s posunem. Kromě těchto individuálních modelů byly též zkonstruovány 3 varianty kombinovaných modelů, vytvořených z různých kombinací dvou, tří respektive pěti individuálních modelů. Kombinované modely byly konstruovány ve formě prostého aritmetického průměru uvedených individuálních modelů a generovány pomocí statistického programového systému 265
SAS. Shrnující deskriptivní charakteristiky jejich kriteria MAPE, vztahující se k období evaluace 2003 2005, jsou uvedeny v tabulce 1: Tabulka 1 - Charakteristiky předpovědních chyb MAPE Model Průměr Medián 1.kvartil 3.kvartil B1 4,38 4,43 1,36 5,55 B2 5,09 2,94 0,92 8,36 EDT 6,88 3,05 1,15 11,8 HE 5,74 4,49 1,13 8,76 RW 5,67 5,52 2,61 8,21 C5 4,85 3,16 0,89 9,52 C2 3,59 2,26 0,73 6,33 C3 3,96 2,63 0,80 6,88 Zdroj: vlastní výpočty V tabulce bylo použito následující značení: B1 Brownův adaptivní model jednoduchého exponenciálního vyrovnávání B2 Brownův adaptivní model dvojitého exponenciálního vyrovnávání EDT adaptivní model exponenciálního vyrovnávání s tlumeným trendem HE Holtův adaptivní model exponenciálního vyrovnávání RW model náhodné procházky s posunem C2 dvoučlenná kombinace dvou individuálních modelů s nejnižšími hodnotami MAPE C3 kombinace tří individuálních modelů s nejnižšími hodnotami MAPE C5 kombinace pěti nejlepších individuálních modelů Asociační tabulky, sestavené pro zhodnocení relací mezi skutečnými a predikovanými hodnotami vybraných ukazatelů trhu práce v Jihočeském kraji, byly vyhodnoceny 2 χ testem a těsnost zjištěné asociační závislosti byla změřena Cramerovým koeficientem. Dosažené výsledky jsou soustředěny v tabulce 2. Tabulka 2 - Hodnocení relací mezi skutečnými a předikovanými hodnotami ukazatelů trhu práce Jihočeského kraje Model Testové kriterium 2 χ p - hodnota Cramerův koeficient V B1 7,35 0,0067 0,4625 B2 7,17 0,0074 0,5509 EDT 3,52 0,0600 - HE 7,17 0,0074 0,4958 RW 4,51 0,0330 0,3769 C5 1,74 0,1369 - C2 7,31 0,0069 0,4780 C3 7,31 0,0069 0,4780 Zdroj: vlastní výpočty Diskuse 266
Výsledky shrnuté v tabulce 1 ukázaly, že z hlediska úrovně předpovědních chyb MAPE jsou pro tvorbu krátkodobých předpovědí časových řad ukazatelů trhu práce v Jihočeském kraji predeterminovány především kombinované modely (zejména modely C2 a C3), které byly charakterizovány velmi nízkými průměry (respektive mediány) předpovědních chyb MAPE. V těchto kombinacích byly obvykle zastoupeny Brownovy adaptivní modely exponenciálního vyrovnávání a model náhodné procházky s posunem. Nízká úroveň předpovědních chyb byla typická i pro ostatní uvažované individuální a kombinované modely. Určitou výjimku představoval pouze model exponenciálního vyrovnávání s tlumeným trendem. Tento model má ve srovnání s jinými adaptivními modely exponenciálního vyrovnávání vyšší nároky na rozsah údajové základny a relativně krátké disponibilní časové řady patrně neumožňovaly adekvátní identifikaci modelu a odhad jeho strukturálních parametrů. Těžiště srovnávací analýzy prezentovaných prognostických modelů spočívalo v posouzení, do jaké míry je průběh předpovědí (o jeden krok dopředu) z těchto modelů konsistentní s faktickým trendem příslušné řady. V této souvislosti je potřebné zdůraznit, že identifikované modely časových řad zvolených ukazatelů trhu práce Jihočeského kraje patří mezi relativně jednoduché nástroje modelování jednorozměrných časových řad a této okolnosti je nutné přizpůsobit očekávání při hodnocení předpovědí z hlediska vystižení směru vývoje časové řady. Vypočtené hladiny významnosti (tzv. p hodnoty), soustředěné v tabulce 2 ukázaly, že většina modelů, charakterizovaných nejnižšími hodnotami předpovědních chyb MAPE, umožňuje též správný odhad směru vývoje skutečných hodnot jednotlivých řad. Jedná se o odhad převládajícího směru vývoje (případně odhad poznamenaný jistým časovým zpožděním), nikoliv o identifikaci a odhad bodů zvratu časové řady. Z výsledků je patrné, že relace mezi skutečnými hodnotami ukazatelů trhu práce Jihočeského kraje a jejich predikovanými hodnotami byly statisticky významné u šesti modelů (B2, B1, HE, C2, C3 a RW) z osmi srovnávaných modelů. Hodnoty Cramerova koeficientu signalizují, že těsnost zjištěné asociační závislosti lze obvykle charakterizovat jako středně silnou. Méně přesvědčivé výsledky byly zjištěny u modelu náhodné procházky s posunem. V případě modelu exponenciálního vyrovnávání s tlumeným trendem a kombinovaného modelu C5, agregujícího předpovědi ze všech pěti individuálních modelů, byla relace mezi jejich předpověďmi a skutečnými hodnotami sledovaných ukazatelů vyhodnocena jako statisticky nevýznamná. Závěr Srovnávací analýza prognostických modelů jednorozměrných časových řad vybraných ukazatelů trhu práce Jihočeského kraje ukázala, že k hodnocení kvality prognostických modelů je účelné přistupovat z několika hledisek. Kromě tradičního posuzování přesnosti zkonstruovaných předpovědí je též důležité zhodnotit, zda předpovědi správně naznačují budoucí směr vývoje skutečných hodnot sledovaného ukazatele. Extenzivní empirická analýza naznačila, že tvorbu krátkodobých předpovědí časových řad ukazatelů trhu práce Jihočeského kraje bude účelné zakládat na adaptivních modelech exponenciálního vyrovnávání respektive jejich kombinacích. Z individuálních modelů lze s přihlédnutím k výše zmíněným aspektům hodnocení kvality prognostických modelů pro tvorbu extrapolačních předpovědí doporučit Brownovy modely jednoduchého a dvojitého exponenciálního vyrovnávání. Proces tvorby krátkodobých předpovědí je však možné ještě dále zkvalitnit kombinováním předpovědí z různých prognostických metod. Na základě výsledků prezentovaných v tomto příspěvku je možné očekávat, že velmi kvalitní předpovědi sledovaných ročních časových řad ukazatelů trhu práce mohou být získány pomocí 267
dvoučlenné respektive tříčlenné kombinace individuálních předpovědí, zkonstruované ve formě jejich aritmetického průměru. Vzhledem k vlastnostem aritmetického průměru jsou takto získané kombinované předpovědi stabilnější než předpovědi z individuálních modelů. Literatura [1] DELURGIO, S.A.: Forecasting principles and applications, Boston, Irwin/McGraw- Hill, 1998, 802 s., ISBN 0-256-13433-2 [2] PESARAN, M.H., TIMMERMANN, A.: How costly is it to ignore breaks when forecasting the direction of a time series?, International Journal of Forecasting, 2004, 20, č. 3, s. 411-425 [3] SAS Institute Inc., SAS/ETS Software: Time Series Forecasting, Version 6, First Edition, Cary, NC: SAS Institute Inc., 1995, 264 s., ISBN 1-55544-275-7 [4] http://www.czso.cz Adresa autora: Bohumil Kába Česká zemědělská univerzita Provozně ekonomická fakulta/katedra statistiky Kamýcká 129 165 21 Praha 6 - Suchdol Česká republika Telefon: 224 382 236 E-mail: kaba@pef.czu.cz 268