Vybrané metody analýzy časových řad s programem STATISTICA

Podobné dokumenty
1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Regresní analýza 1. Regresní analýza

KGG/STG Statistika pro geografy. Mgr. David Fiedor 4. května 2015

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Korelační a regresní analýza

Testování hypotéz o parametrech regresního modelu

LINEÁRNÍ REGRESE. Lineární regresní model

Lineární regrese. Komentované řešení pomocí MS Excel

Statistická analýza jednorozměrných dat

Regresní analýza. Eva Jarošová

Testování hypotéz o parametrech regresního modelu

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Diagnostika regrese pomocí grafu 7krát jinak

Ilustrační příklad odhadu LRM v SW Gretl

8 ANALÝZA ČASOVÝCH ŘAD SEZÓNNÍ SLOŽKA

4EK211 Základy ekonometrie

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013

Úvod do analýzy časových řad

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Odhad parametrů N(µ, σ 2 )

Regresní a korelační analýza

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ

UNIVERZITA PARDUBICE. 4.4 Aproximace křivek a vyhlazování křivek

KORELACE. Komentované řešení pomocí programu Statistica

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Kalibrace a limity její přesnosti

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica

4EK211 Základy ekonometrie

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Téma 9: Vícenásobná regrese

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Periodicita v časové řadě, její popis a identifikace, exponenciální vyrovnáván

Normální (Gaussovo) rozdělení

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

AVDAT Nelineární regresní model

Plánování experimentu

4EK211 Základy ekonometrie

Statistika (KMI/PSTAT)

Statistická analýza jednorozměrných dat

Úloha 1. Napište matici pro případ lineárního regresního spline vyjádřeného přes useknuté

Regresní a korelační analýza

4EK211 Základy ekonometrie

Regresní a korelační analýza

KGG/STG Statistika pro geografy

Regresní a korelační analýza

Neuronové časové řady (ANN-TS)

Regresní a korelační analýza

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Regresní a korelační analýza

Tvorba nelineárních regresních modelů v analýze dat

Cvičení 9 dekompozice časových řad a ARMA procesy

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

4EK211 Základy ekonometrie

Tomáš Karel LS 2012/2013

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie

PRAVDĚPODOBNOST A STATISTIKA

Časové řady a jejich periodicita úvod

PRAVDĚPODOBNOST A STATISTIKA

Zápočtová práce STATISTIKA I

Statistika pro geografy

Ekonometrie. Jiří Neubauer

Statistika II. Jiří Neubauer

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Měření závislosti statistických dat

Popisná statistika. Komentované řešení pomocí MS Excel

You created this PDF from an application that is not licensed to print to novapdf printer (

Odhady parametrů základního souboru. Cvičení 6 Statistické metody a zpracování dat 1 (podzim 2016) Brno, říjen listopad 2016 Ambrožová Klára

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

1. Přednáška. Ing. Miroslav Šulai, MBA

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Simulace. Simulace dat. Parametry

Pokud data zadáme přes "Commands" okno: SDF1$X1<-c(1:15) //vytvoření řady čísel od 1 do 15 SDF1$Y1<-c(1.5,3,4.5,5,6,8,9,11,13,14,15,16,18.

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

4EK211 Základy ekonometrie

S E M E S T R Á L N Í

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

Semestrální práce. 3.3 Tvorba nelineárních regresních modelů v analýze dat

4EK211 Základy ekonometrie

Charakteristika datového souboru

Odhad parametrů N(µ, σ 2 )

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba nelineárních regresních modelů v analýze dat. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.

10. Předpovídání - aplikace regresní úlohy

Úloha 1: Lineární kalibrace

SEMESTRÁLNÍ PRÁCE X. Aproximace křivek Numerické vyhlazování

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

Bodové a intervalové odhady parametrů v regresním modelu

KGG/STG Statistika pro geografy

UNIVERZITA PARDUBICE

4EK211 Základy ekonometrie

Transkript:

Univerzita Karlova v Praze Matematicko-fyzikální fakulta BAKALÁŘSKÁ PRÁCE Magdalena Indrová Vybrané metody analýzy časových řad s programem STATISTICA Katedra pravděpodobnosti a matematické statistiky Vedoucí bakalářské práce: RNDr. Šárka Hudecová Ph.D. Studijní program: Matematika Studijní obor: Finanční matematika Praha 2012

Poděkování Na tomto místě bych ráda poděkovala vedoucí mé práce RNDr. Šárce Hudecové, Ph.D. za věnovaný čas, odborné rady a připomínky. Dále děkuj rodině za podporu v průběhu celého studia.

Prohlašuji, že jsem tuto bakalářskou práci vypracovala samostatně a výhradně s použitím citovaných pramenů, literatury a dalších odborných zdrojů. Beru na vědomí, že se na moji práci vztahují práva a povinnosti vyplývající ze zákona č. 121/2000 Sb., autorského zákona v platném znění, zejména skutečnost, že Univerzita Karlova v Praze má právo na uzavření licenční smlouvy o užití této práce jako školního díla podle 60 odst. 1 autorského zákona. V... dne... Podpis autora

Název práce: Vybrané metody analýzy časových řad s programem STATISTICA Autor: Magdalena Indrová Katedra: Katedra pravděpodobnosti a matematické statistiky Vedoucí bakalářské práce: RNDr. Šárka Hudecová Ph.D., Katedra pravděpodobnosti a matematické statistiky Abstrakt: Práce se zabývá využítím programu STATISTICA k základní analýze časových řad. Zaměřena je na dekompozici časových řad, zejména na eliminaci trendu. Pro tuto analýzu byly vybrány tři sady dat, na kterých byla v programu STATISTICA eliminace trendu vyzkoušena. Nejprve jsou teoreticky popsány základní metody analýzy, a to modelování trendu matematickými křivkami (polynomiální, exponenciální, logistická, Gompertzova) a adaptivní přístupy (klouzavé průměry, jednoduché exponenciální vyrovnávání a Holtova metoda). Následně jsou tyto postupy aplikovány v programu STATISTICA na tři různé datové soubory (měsíční stavy rozvahy nejmenované banky za období 1998-1993, postupné procentuální nahrazování plachetnic za lodě poháněné parou mezi lety 1820-1970 a kurz české koruny vůči euru od roku 1998 do 2012). Všechny postupy analýz jsou podrobně popsány a jednotlivé výstupy programu jsou detailně vysvětleny a komentovány. Klíčová slova: časové řady, modelování trendu, exponenciální vyrovnávání, klouzavé průměry, program STATISTICA. Title: Selected methods of time series analysis with STATISTICA Author: Magdalena Indrová Department: Department of Probability and Mathematical Statistics Supervisor: RNDr. Šárka Hudecová Ph.D., Department of Probability and Mathematical Statistics Abstract: This work deals with the use of STATISTICA software for the basic analysis of time series. The thesis is focused on time series decomposition, mainly on the trend elimination. First, the basic methods of the analysis are described theoretically, namely, trend modeling using mathematical curves (polynomial, exponential, logistic and Gompertz) and adaptive approach (moving averages, simple exponential smoothing and Holt s method). These methods are then applied to three selected data sets (unnamed bank s balance sheet from 1998 to 1993, ship construction trends between 1820 and 1997, and CZK/EUR exchange rate from 1998 to 2012). All analytical procedures are described in detail and individual program outputs are thoroughly explained and commented. Keywords: time series, trend modeling, exponential smoothing, moving averages, STATISTICA software.

Obsah Úvod 6 1 Úvod do analýzy časových řad 7 1.1 Základní pojmy............................ 7 1.2 Předpověď pomocí časových řad................... 9 2 Dekompozice časových řad analýza trendu 11 2.1 Modelování trendu matematickými křivkami............ 11 2.1.1 Polynomiální trendy..................... 11 2.1.2 Exponenciální trendy..................... 13 2.1.3 Logistický trend........................ 14 2.1.4 Gompertzova křivka..................... 15 2.2 Adaptivní přístupy.......................... 15 2.2.1 Metoda klouzavých průměrů................. 16 2.2.2 Exponenciální vyrovnávání.................. 16 3 Analýza časových řad v programu STATISTICA 19 3.1 Popis použitých dat.......................... 19 3.2 Popis trendu matematickými křivkami............... 21 3.2.1 Lineární trend......................... 21 3.2.2 Kvadratický trend....................... 23 3.2.3 Exponenciální trend..................... 24 3.2.4 Modifikovaný exponenciální trend.............. 26 3.2.5 Logistický trend........................ 30 3.2.6 Gompertzova křivka..................... 32 3.3 Adaptivní přístupy.......................... 34 3.3.1 Metoda klouzavých průměrů................. 34 3.3.2 Jednoduché exponenciální vyrovnávání........... 37 3.3.3 Holtova metoda........................ 39 Závěr 42 Literatura 43 5

Úvod Problematika analýzy časových řad je nejen u finančních a ekonomických disciplín velmi důležitá a aktuální. Data, dostupná ve formě časových řad, se vyskytují v mnoha vědeckých oborech. Jako příklad lze uvést nejrůznější demografické (porodnost, migrace... ), meteorologické (teplota, srážky... ) i ekonomické údaje (hodnoty akcií, kurzy měn,... ). Proto je velmi důležité tato data umět zpracovat a dozvědět se tak z nich požadované informace. Pro získání těchto informací lze časové řady graficky zobrazit, analyzovat jejich trend či předpovídat jejich budoucí hodnoty. Protože ve většině případů takové řady obsahují velké množství dat, jejich zpracování se neobejde bez vhodného (statistického) softwaru. Software STA- TISTICA, (který lze získat kompletně v českém jazyce), je jedním z programů nabízejících takové nástroje, pomocí kterých je možné analýzu časových řad provést. Tato práce se zabývá jednoduchými metodami analýzy časových řad které program STATISTICA nabízí. Cílem práce je tyto metody teoreticky popsat, aplikovat je na konkrétní časové řady, popsat postup při jejich modelování a podrobně vysvětlit obdržené výsledky. Použity jsou základní dekompoziční metody, jako je analýza trendu, metoda (vážených) klouzavých průměrů a exponenciální vyrovnávání. Práce je rozdělena do čtyř kapitol. První kapitola obsahuje základní definice a pojmy, které se v dalším textu používají. Následně je uveden přehled vybraných zpracovávaných metod. Třetí kapitola je již věnovávna programu STATISTICA a způsobu, jakým lze tento software použít při analýze časových řad. V této kapitole jsou uvedeny i praktické příklady na konkrétních řadách. Poslední kapitola obsahuje závěr a zhodnocení práce. I když byla většina výstupů zpracována v programu STATISTICA, byl pro doplňující výpočty a obrázky použit také program Microsoft Excel a program Mathematica 7.0. 6

1. Úvod do analýzy časových řad 1.1 Základní pojmy Obsah úvodních kapitol, obsahujících teorii k danému tématu, je čerpán převážně z knih Analýza časových řad s aplikacemi v ekonomii (1986), Finanční ekonometrie (2008) a z přednášek Časové řady, vyučované na MFF, od Prof. RNDr. Tomáše Cipry, DrSc. Informace uvedené v kapitole 2.2 byly také získány z diplomové práce Dekompoziční metody pro časové řady s nepravidelně pozorovanými hodnotami (2007) od Mgr. Tomáše Hanzáka. Další použité zdroje jsou uvedeny v části Literatura. Začátek této kapitoly obsahuje základní definice, týkající se časových řad. Jako časovou řadu můžeme brát soubor hodnot nějaké veličiny, které jsou získávany v pravidelných časových intervalech (nepravidelné časové řady viz např. Hanzák, 2007). V praxi se většinou setkáváme s intervaly, vztaženými ke kalendáři, tedy s denními, měsíčními, ročními apod. Jako příklad lze uvést pravidelné měření teploty nebo výši HDP. Definice 1.1. Časovou řadou rozumíme jakoukoliv posloupnost dat y 1,...,y n chronologicky uspořádanou v čase. Definice 1.2. Náhodný proces (stochastický proces) {Y t,t T} je množina náhodných veličin na pravděpodobnostním prostoru (Ω, F, P) indexovaná pomocí hodnot z množin T R interpretovaných jako čas. Definice 1.3. Podle T se rozlišuje: Náhodný proces ve spojitém čase, kde T je interval na nějaké přímce (např. T = [0, ),{Y t,t 0}). Značení: {y(t),t T} Náhodný proces v diskrétním čase, kde T tvoří diskrétní hodnoty (např. T = N,{Y 1,Y 2...}). Značení: {y t,t T} Poznámka: Časová řada se chápe jako konkrétní realizace náhodného procesu s diskrétním časem. V praxi se tyto pojmy používají ekvivalentně. Složky časových řad Zvláště ekonomické časové řady mohou být rozloženy do několika složek: Trend Tr t - popisuje dlouhodobé změny v průměrném chování časové řady (např. exponenciální pokles, lineární růst). Sezónní složka Sz t - odráží periodické změny, které se udály během jednoho kalendářního roku nebo jiného časového období a každé toto období se opakují. Pokud jsou měření příliš řídká, je těžké sezónní složku rozpoznat. 7

Cyklická složka C t - vyjadřuje fluktuace okolo trendu. Střídají se zde fáze poklesu a fáze růstu. Na rozdíl od sezónní složky je délka i intenzita cyklů různá a jednotlivé cykly se vytvářejí za období delší než jeden rok. Při dekompozici časových řad bývá někdy tato složka zanedbána, protože se dekompoziční metody používají především na krátkodobé nebo střednědobé předpovědi. Bývá tedy zahrnuta do trendu (trend-cyklus). Reziduální (zbytková, náhodná, iregulární) složka E t - zbývá po odstranění všech předchozích složek. Je tvořena náhodnými fluktuacemi bez rozpoznatelného charakteru. Obvykle se předpokládá, že je tato složka tzv. bílý šum, kde E(E t ) = 0, var(e t ) = σ 2 0, cov(e t,e s ) = 0 pro s t. Trendová a cyklická složka mohou být přítomné v časových řadách ročních údajů, ale také v řadách s intervalem sledování kratším než jeden rok. Sezónní složka se vyskytuje pouze v krátkodobých časových řadách, reziduální složka je přítomná v každé časové řadě. Vlastní tvar rozložené časové řady lze zapsat dvěma způsoby: 1. y t = Tr t +Sz t +C t +E t. Tento rozklad nazýváme aditivní dekompozice. Každá složka je uváděna v absolutní hodnotě a má stejnou jednotku jako y t. 2. y t = Tr t Sz t C t E t. Tento tvar se nazývá multiplikativní dekompozice. Zde je pouze trend vyjádřen v absolutní hodnotě, ostatní složky jsou bezrozměrné koeficienty. Je zřejmé, že ne všechny časové řady musí obsahovat všechny tyto složky. U některých časových řad mohou některé složky chybět. Na následujícím obrázku je znáznorněna dekompozice časové řady. Obr.1 Dekompozice časové řady na trendovou, sezónní a reziduální složku. Poznámka: Při práci s časovými řadami je možné rozlišit dva základní přístupy. Jedním z nich je dekompozice časových řad, při které se zabýváme hlavně trendovou, sezónní a cyklickou složkou. Dále při tom předpokládáme, že jsou daná 8

pozorování navzájem nekorelovaná. Druhým typem je tzv. Boxův-Jenkinsův přístup, který pracuje především se složkou reziduální, která navíc může být tvořena korelovanými náhodnými veličinami. Tuto metodologii je tedy možné použít při analýze časových řad tvořených závislými pozorováními. Více např. Cipra (1986) nebo Montgomery a kol. (2008). Následující text je věnován především prvnímu zmiňovanému přístupu. 1.2 Předpověď pomocí časových řad Předpověď je jedním z problémů vyskytujících se v nejrůznějších oborech. S tímto problémem se setkáváme v ekonomice, medicíně, sociálních vědách, politice, na finančních trzích a v mnoha dalších odvětvích. Právě časové řady jsou při konstrukci předpovědí používány velmi často. Při předpovídání časových řad je třeba brát v úvahu několik hledisek: 1. Bodová předpověď představuje náš nejlepší odhad budoucí hodnoty. Zde je však vždy nutné počítat s chybou. Proto je vhodné pracovat s předpovědním intervalem, ve kterém budoucí hodnota leží s určitou pravděpodobností. Jedná se tak o interval spolehlivosti z matematické statistiky. 2. Kvantitativní předpovědní metody pracují na základě statistické analýzy údajů, podle jasných matematicko-statistických postupů. Použití těchto metod ale závisí na předpokladu, že se charakter dané řady v čase nemění. Jde tedy pouze o jakési prodloužení dosavadních hodnot řady. 3. Chyba předpovědi je definovaná jako e t = y t ŷ t, kde ŷ t je předpovězená hodnota v čase t. Jejím hlavním zdrojem jsou nepravidelné fluktuace v datech, tedy jejich reziduální složka E t. Dalším zdrojem může být i kvalita předpovědi systematických složek. Nejčastěji se setkáváme s těmito mírami, hodnotícími přesnost výsledku: Součet čtvercových chyb: SSE = n (y t ŷ t ) 2 = n t=1 e 2 t t=1 Střední čtvercová chyba: MSE = 1 n t ŷ t ) n t=1(y 2 = 1 n n e 2 t t=n Další míry, které se používají pro ocenění kvality předpovědí lze nalézt v literatuře (např. Montgomery a kol., 2008, Cipra, 2008). V programu STATISTICA se setkáváme také s tzv. koeficientem determinace, který se používá v lineární regresi, R 2 = n (ŷ t ȳ) 2 t=1 n = 1 (y t ȳ) 2 t=1 SSE n, (y t ȳ) 2 kde ȳ je průměr z pozorovaných (předpovězených) hodnot. Koeficient udává, kolik procent celkové variability se podařilo regresí vysvětlit. Hodnotí tedy kvalitu použitého modelu. Nabývá hodnot od 0 do 1, přičemž hodnoty blízké jedné značí 9 t=1

dobrou kvalitu (Statsoft, 2012). v praxi je často zvykem vyjadřovat koeficient determinace v procentech. Avšak v případě, že model neobsahuje intercept (absolutní člen), nemá koeficient determinace žádnou vypovídací schopnost, neboť se nerovnají průměry hodnot y a ŷ. Jeho hodnota pak také může vyjít i záporná. Pro porovnání takových modelů je tedy vhodnější použít SSE nebo MSE. Program STATISTICA ovšem počítá R 2 i pro nelineární modely, avšak z výše uvedeného důvodu je třeba interpretovat jeho hodnoty s rozvahou a při výběru modelu se řídit spíše již zmíněnými SSE a MSE. 10

2. Dekompozice časových řad analýza trendu Cílem dekompozičních metody v problematice časových řad je eliminovat jednotlivé složky řady, tj. složky Tr t,sz t,c t a E t. Důvodem může být studium samotných složek, či očištění řady od sezónních výkyvů a náhodného šumu. Dalším důležitým cílem je také extrapolace časové řady za účelem určení budoucího vývoje eliminovaných složek. Následující podkapitoly jsou věnovány metodám, které z časové řady eliminují trendovou složku. Při práci s trendovou složkou se můžeme také setkat s pojmem vyhlazení či vyrovnání časové řady. 2.1 Modelování trendu matematickými křivkami Kromě jednoduchých, subjektivních metod eliminace trendu, založených především na grafickém základě (např. Cipra, 1986), existují metody, které popisují trend analyticky, pomocí matematických křivek. Obecným předpokladem je, že analyzovaná řada má tvar y t = Tr t +E t. Neobsahuje tedy periodické složky. Ty je možné předem odstranit pomocí sezónního očišťování. Po reziduální složce vyžadujeme nulovou střední hodnotu, nekorelovanost a konstantní rozptyl. Poznámka: V následujícím textu jsou uvedeny pouze některé nejdůležitější vzorce a výpočty. Jejich úplný přehled lze nalézt např. v knize T. Cipry (2008). 2.1.1 Polynomiální trendy Polynomiální trendy zahrnují velmi jednoduché matematické křivky, kterými lze popsat hlavní vývoj dat. Rozhodnutí, jaký stupeň polynomu bude nejvhodnější, záleží především na povaze pozorovaných dat. Protože se v analýze časových řad setkáváme především s nultým, prvním a druhým stupněm, budou na následujících řádcích popsány právě tyto trendy. Program STATISTICA ale nabízí při prokládání dat polynomiálním trendem možnost vybrat polynom až do řádu osm. (Rovnice polynomů vyšších řádů než osm, musí uživatel zadat již ručně, přes speciální modul Nelineární odhad. Více o tomto postupu pojednává kap. 3.2). Použití jednotlivých trendů je určeno především na základě grafického zobrazení dat. Pokud jsou tato data stacionární (bez trendu), je možné použít trend konstantní, s nulovým stupněm polynomu. Vykazují-li data lineární růst či pokles, hodí se použít trend lineární, se stupněm polynomu jedna. Pro data, jejichž graf se podobá kvadratické funkci, je vhodné polynomiální trend se stupněm polynomu dva, tedy kvadratický trend. Obecný předpis polynomiálních trendů můžeme popsat následovně: Tr t = β 0 +β 1 t+β 2 t 2 + +β n t n pro t = 1...k, 11

kde β 0,...,β n jsou parametry, jejichž počet určuje typ polynomiálního trendu. Odhady parametrů β 0,...,β n se spočítají pomocí soustavy normálních rovnic, určených podle metody nejmenších čtverců (MNČ, angl. Ordinary Least Squares). Konstantní trend - nejjednodušší typ polynomiálního trendu, obsahuje pouze parametr β 0, jehož OLS odhadem je b 0 = ȳ. Takovou řadu označujeme jako řadu bez trendu. Konstantní trend má tvar: Tr t = β 0, t = 1...n. Lineární trend: Tr t = β 0 +β 1 t, t = 1...n. Kvadratický trend: Tr t = β 0 +β 1 +β 2 t 2, t = 1...n. Jak již bylo řečeno, bodové odhady lze spočítat pomocí soustavy normálních rovnic. V případě lineárního trendu vycházíme z následující soustavy n b 0 n+b 1 t = t=1 n n b 0 t+b 1 t 2 = t=1 t=1 n y t, t=1 n ty t. t=1 Jejím řešením pak získáme požadované odhady b 0 a b 1, které mají tvar b 0 = ȳ n+1 b 1, b 1 = 2 n ty t n+1 n 2 t=1 n(n 2 1) 12 Pro předpověď ŷ T budoucí hodnoty y T, kde T > n, je možné také zkonstruovat předpovědní interval. Pro lineární trend pak intervalový odhad vypadá takto: ( b0 +b 1 T t 1 p/2 (n 2) s f T,b 0 +b 1 T +t 1 p/2 (n 2) s f T ), t=1 y t. kde f T = 1+ 1 n + ( T n+1 2 n(n 2 1) 12 ) 2, s je výběrová směrodatná odchylka a t 1 p/2 (n 2) značí (1 p/2)-kvantil t rozdělení s (n 2) stupni volnosti. Pro získání 95% intervalu spolehlivosti klademe p = 0,05. Bodové i intervalové odhady pro další trendy lze najít v odborné literatuře, např. (Cipra, 2008). 12

2.1.2 Exponenciální trendy Pomocí exponenciálních trendů lze jednak modelovat řady exponenciálně rostoucí či klesající a jednak také řady, které jsou pro velká t asymptoticky omezeny. Oba uvedené typy exponenciáních trendů jsou již nelineární funkce. Při jejich modelování je tedy nutné data linearizovat nebo použít pro odhad parametrů iterativní metody. Jak je vidět z následujíích rovnic, exponenciální trendy jsou již víceparametrické. 1. Jednoduchý exponenciální trend Jedná se o dvouparametrický trend, s parametry α a β, pro který platí Tr t = αβ t, t = 1,...,n. aβ > 0. Pokud jeα > 0, pak proβ > 1 dochází k růstu, a pro0 < β < 1 k poklesu. Odhady prametrů je možné provést několika způsoby. Zlogaritmováním trendu dostaneme trend lineární, jehož odhady jsou log α a log β. Zpětným odlogaritmováním pak získáme odhady pro α a β. Protože tyto odhady ale nemají dobré statistické vlastnosti (např. reziduální složka po zlogaritmování nemá zcela jistě nulovou střední hodnotu), je např. možné použít metodu nejmenších vážených čtverců (Cipra, 1986). V programu STATISTICA lze využít modul, který metodou nejmenších čtverců minimalizuje zadanou odhadovanou nelineární funkci. Pomocí iteračních metod (Levenberg-Marquardtova a Gauss-Newtonova) lze odhadnout parametry α a β. 2. Modifikovaný exponenciální trend V tomto případě jde o zobecnění předchozího modelu. Tento trend je tříparametrický, s parametry α, β a γ. Platí Tr t = γ +αβ t, t = 1,...,n a β > 0. Pro α < 0,0 < β < 1 a γ > 0 je tento trend asymptoticky omezen hodnotou γ. Přímým výpočtem (viz Cipra 2008) lze získat odhady všech tří parametrů. Při pevně zvoleném β se model stává modelem lineárním a podle MNČ se pro různé hodnoty β vypočítají zbývající parametry. Zvolí se takový výsledek, který minimalizuje MSE. Žádnou transformací již ale tento model nelze linearizovat, proto se k odhadu parametrů používají iterativní metody. V programu STATISTICA se využije stejných metod jako v předchozím případě. 13

2.1.3 Logistický trend Tento trend je tříparametrický a vystihuje ho vzorec Tr t = γ 1+αβt, t = 1,...,n a β,γ > 0. Logistický trend lze zařadit mezi tzv. S-křivky, jelikož je charakteristický svým inflexním bodem. S tímto modelem se můžeme setkat při modelování dat v ekonomické oblasti. Pro β < 1 je asymptoticky omezen hodnotou γ a jeho první derivace se nazývá růstová funkce. Na obrázku 2 je zobrazen trend i jeho derivace pro α > 1,0 < β < 1 a γ > 0. 150 100 a=250 a=50 30 25 20 15 a=50 50 a=10 10 a=0,9 5 2 4 6 8 10 5 10 15 20 Obr. 2: Tvar logistického trendu (vlevo) a jeho derivace (vpravo). Při odhadování parametrů lze opět použít několik metod. Logistický trend je možné považovat za inverzi modifikovaného exponenciálního trendu. Při použití tohoto faktu je odhad parametrů totožný, pouze s aplikací na řadu 1/y t. Zde se ovšem setkáváme s problémem transformace řady, který vede k horším statistickým výsledkům. Další možností je tzv. princip diferenčních odhadů, kdy místo původní řady y t pracujeme s řadou y t+1 y t. Podrobný výklad této metody viz (Cipra, 2008). Ve statistickém softwaru můžeme opět použít nelineární regresi a iterační metody. Při použití iteračních metod, je vhodné odhadnout počáteční hodnotu parametrů. To lze provést přímým výpočtem, který se aplikuje na řadu yt = 1/y t. Podle postupu, popsaného např. v (Cipra, 2008), se řada rozdělí na tři stejné úseky (pokud není počet pozorování dělitelný třemi, první hodnoty se vynechají), které se postupně sečtou. Dle vzorců uvedených v knize se vypočítají odhady pro transponovanou řadu yt. Protože platí: 1 = 1+αβt = 1 y t γ γ + α γ βt, po substituci y t = 1 y t, γ = 1 γ, α = α γ, β = β se pomocí modifikovaného exponenciálního trendu odhadnou parametry α, β a γ (Petrášková, 2012). Pro jejich odhady a, b a g pak platí b = b, g = 1 g, a = a g, 14

kde a, b a g jsou hledané (počáteční) odhady parametrů α, β a γ. 2.1.4 Gompertzova křivka Trend popsaný touto křivkou je podobný logistickému trendu, vzniká totiž také transformací modifikovaného exponenciálního trendu. Jeho tvar je Tr t = exp(γ +αβ t ), t = 1,...,n a β > 0. Křivka je také asymptoticky omezena, ale je nesymetrická kolem inflexního bodu, stejně tak derivace je zešikmena doleva (obr. 3). 7 6 0.8 5 4 3 2 1 a=-3,5 a=-0,7 0.6 0.4 0.2 a=-3,5 2 4 6 8 10 12 14 5 10 15 20 Obr. 3: Tvar Gompertzovy křivky (vlevo)a její derivace (vpravo). Při odhadování parametrů za použití modifikovaného exponenciálního trendu pracujeme s řadou logy t (symbol log značí přirozený logaritmus). Jinak je také možné ve statistickém softwaru použít nelineární regresi. Poznámka: Při použití regresních modelů je nutné předpokládat, že reziduální složka má nulovou sřední hodnotu, je v čase nekorelovaná a homoskedastická. Pokud tyto podmínky nejsou splněny, tedy např. reziduální složky nemají konstantní rozptyl (jsou heteroskedastické), je to známka toho, že OLS-odhady nejsou nejlepší (i když v případě heteroskedasticity a autokorelovanosti mohou být stále nestranné i konzistentní). V případě, že rezidua nemají nulovou střední hodnotu, a graf reziduí vykazuje určitý trend, je zřejmé, že vybraná křivka, popisující trend v datech nebyla vhodná. 2.2 Adaptivní přístupy V této podkapitole budou vysvětleny dva základní přístupy, které se řadí mezi adaptivní. Jsou jimi metoda klouzavých průměrů a exponenciální vyrovnávání. Tyto přístupy se používají v situacích, kdy nelze celou řadu popsat pouze jednou trendovou funkcí. Můžeme ale použít funkci s měnivými parametry a řadu v krátkých úsecích vyrovnat pomocí matematické křivky. V každém takovém úseku bude mít křivka různé parametry. Mluvíme tedy o lokálním vyrovnání trendu v časových bodech t. Výhodou adaptivních přístupů je fakt, že se výsledná křivka přizpůsubuje lokálnímu průběhu řady. Přitom stupeň tohoto přizpůsobení lze ovlivnit podle 15

toho, jak moc je nutné řadu vyrovnat. I v této podkapitole budeme uvažovat řadu y t = Tr t +E t. 2.2.1 Metoda klouzavých průměrů Metodou klouzavých průměrů označujeme takové vyrovnávání, kdy pomocí lineární kombinace členů původní řady získáme řadu vyrovnanou. Posloupnost pozorování tak nahradíme řadou průměrů, resp. vážených průměrů, které jsou z nich vypočítané. Obecný postup je takový, že vhodným polynomem vyrovnáme prvních 2m+1 členů řady. Hodnota polynomu ve středu tohoto intervalu (t = m+1) se pak použije jako vyrovnaná hodnota ŷ m+1. Vyrovnanou hodnotu v bodě t = m+2 pak získáme vyrovnáním hodnot y 2,...,y 2m+2. Při výpočtu tak postupujeme vždy o jedno pozorování dopředu, odtud také název klouzavé. V literatuře se můžeme setkat s několika typy klouzavých průměrů. Kromě jednoduchých klouzavých průměrů, kdy se v každém úseku počítá jeho aritmetický průměr, můžeme obecně vyrovnávat daný úsek polynomem r-tého řádu (např. kubickou parabolou). V těchto případech se setkáváme s tzv. váženými klouzavými průměry. Váhy jsou pevně určené koeficienty, které lze vypočítat pomocí metody nejmenších čtverců. Jejich součet je rovný jedné. Dalším typem jsou centrované klouzavé průměry. Ty se používají především u sezónních časových řad, kdy má vyrovnávaný úsek často sudou délku (měsíce, čtvrtletí... ). Kromě této metody je nevýhodné volit úseky se sudým počtem hodnot (2m). Vyrovnaná hodnota by totiž byla přímo mezi dvěma pozorováními. Podrobně se těmito metodami zabývá např. Cipra (2008). Délka klouzavých průměrů se volí ve většině případů subjektivně, podle požadovaného vyrovnání. Je zřejmé, že čím větší délka, tím je vyrovnání patrnější. Pouze v případě sezónních či cyklických dat je třeba zvolit takovou délku, která dané fluktuace vyhladí. Nakonec je nutné poznamenat, že při použití klouzavých průměrů, zůstane prvních a posledních m hodnot původní řady nevyrovnáno. V nejjednoduších případech je možné tyto hodnoty ponechat stejné jako původní řady, nebo využít tzv. počátečních a koncových průměrů (Cipra, 2008) Poznámka: Alternativou ke klouzavým průměrům jsou tzv. klouzavé mediány, které jsou velmi efektivním nástrojem, pokud je nutné odstranit z řady odlehlá pozorování či neobvyklé hodnoty (Montgomery a kol., 2008). Postup je analogický jako u klouzavých průměrů, pouze vyrovnanou hodnotou bude tentokrát medián vyrovnávaného úseku. 2.2.2 Exponenciální vyrovnávání Exponenciální vyrovnávání je často používanou metodou vyhlazování a předpovídání časových řad. Jeho výhodou, např. na rozdíl od metody klouzavých průměrů, je volba délky úseků. V případě klouzavých průměrů je nutné pevně stanovit délku vyrovnávaných úseků řady. Jak již bylo řečeno, stanovení délky se 16

provádí většinou subjektivně. U metody exponenciálního vyrovnávání tuto délku nemusíme určovat, protože výpočet vyrovnaných hodnot je založen na všech předchozích pozorováních. Vyrovnaná řada ŷ t pak minimalizuje výraz (y t ŷ t ) 2 +(y t 1 ŷ t 1 ) 2 β +(y t 2 ŷ t 2 ) 2 β 2 +..., 0 < β < 1, kde β je uživatelem zvolená diskontní konstanta. Z uvedeného výrazu vyplývá, že vzdáleným pozorováním přiřazujeme stále nižší váhy, které se exponenciálně zmenšují (odtud název exponenciální vyrovnávání). Nejpoužívanějšími druhy exponenciálního vyrovnávání je jednoduché exponenciální vyrovnávání, dvojité exponenciální vyrovnávání a jeho zobecnění, které se nazývá Holtova metoda. Protože program STATISTICA nabízí pouze jednoduché exponenciální vyrovnávání a Holtovu metodu, budou v práci popsány právě tyto dva přístupy. 1. Jednoduché exponenciální vyrovnávání Jedná se o nejjednoduší typ exponenciálního vyrovnávání, který se používá pro řady bez zřetelného lokálního rostoucího nebo klesajícího trendu. Je tedy vhodné pro řady, které v krátkých úsecích vykazují konstantní trend (Tr t = β 0 ). Vyrovnanou hodnotu řady v čase t získáme pomocí následujícího rekurentního vztahu ŷ t = αy t +(1 α)ŷ t 1, kde α = 1 β a nazývá se vyrovnávací konstanta. Čím větší je její hodnota, tím rychleji metoda reaguje na změny v datech a vyrovnání řady je menší. V praxi se obvykle omezujeme na interval 0 < α 0,3. Vyrovnávací konstanta se volí většinou expertně. Postupně se vyzkouší několik hodnot a vybere se ta hodnota, která pro daný účel poskytuje nejlepší výsledky. Další možností je tzv. síťové hledání, kdy se pro různé hodnoty α hledá minimální SSE. Kromě vyrovnávací konstanty je také nutné zvolit počáteční hodnotuŷ 0. Ta se nejčastěji volí jako aritmetický průměr několika počátečních hodnot, nebo přímo jako y 1. Pokud chceme použít metodu jednoduchého exponenciálního vyrovnávání pro předpověď budoucích hodnot, pak klademe ŷ t+τ (t) = ŷ t, kde τ > 0 určuje budoucí časový okamžik, který chceme předpovědět. Poznámka: Protože exponenciální vyrovnávání je ad hoc metoda, která nemusí být založena na žádném pravděpodobnostním modelu, není jak určit meze předpovědních intervalů (Hanzák, 2007). Pokud ale předpokládáme, že reziduální složka má normální rozdělení lze vytvořit následující (1 p) 100procentní předpovědní interval (Cipra, 2008) (ŷn+τ (n) u 1 p/2 1,25 MAE,ŷ n+τ (n)+u 1 p/2 1,25 MAE ), 17

t=1 kde u 1 p/2 je (1 p/2) kvantil normovaného normálního rozdělení a MAE je střední absolutní chyba, MAE = (1/n) n y t ŷ t (t 1). Pro 95% interval klademe p = 0,05. Pokud neplatí podmínka normality reziduí, je tento interval pouze aproximativní. 2. Holtova metoda Holtova metoda je velmi známá metoda, která se používá na nesezónní časové řady, tentokrát s lokálně lineárním trendem (Hanzák, 2007). Tato metoda je považována za zobecnění dvojitého exponenciálního vyrovnávání. V Holtově metodě se již setkáváme s dvěma parametry, a to s parametrem α, který slouží pro vyrovnávání úrovně S t a s parametrem γ pro vyrovnávání směrnice trendu T t. Parametr α tedy řídí míru adaptace, což znamená, že čím větší je jeho hodnota, tím metoda reaguje na změny v datech rychleji. Naproti tomu γ je parametr, který určuje míru vyhlazení lokálně lineárních trendů (Zdražil, 2009). To znamená, že čím větší α a menší γ, tím je řada méně vyrovnaná a výsledná křivka se podobá původním datům. Pro oba parametry opět platí 0 < α,γ < 1. Při modelování řady pomocí této metody platí následující rekurentní vztahy: S t = αy t +(1 α)(s t 1 +T t 1 ), T t = γ(s t S t 1 )+(1 γ)t t 1, ŷ t = S t. Jako počáteční hodnoty se v praxi volí S 0 = y 1 a T 0 = y 2 y 1. Chceme-li pomocí Holtovy metody také předpovídat o τ časových jednotek vpřed, klademe ŷ t+τ (t) = S t +T t τ. Volba vyrovnávacích konstant se provádí většinou stejně jako u jednoduchého exponenciálního vyrovnávání, tedy opět expertně nebo minimalizací např. MSE přes určitý úsek zkoumané časové řady (Hanzák, 2007). Obvykle se ale u obou parametrů opět preferují nižší hodnoty. Především záleží na uživateli metody, jak moc potřebuje daná data vyrovnat. Jak již bylo řečeno, tato metoda vychází z dvojitého exponenciálního vyrovnávání. Je v podstatě jejím speciálním případem, protože platí následující vztahy α Holt = α(2 α),γ Holt = α 2 α. Více o vzájemném vztahu těchto dvou metod lze nalézt např. v bakalářské práci Exponenciální vyrovnávání (Mikulka, 2008). 18

3. Analýza časových řad v programu STATISTICA Následující kapitola ukazuje praktické řešení modelování časových řad v programu STATISTICA. Kapitola je zaměřena na modelování trendu vybraných dat. Je opět rozdělena na dvě části, a to na prokládání dat matematickými křivkami (kap. 3.2) a na použití adaptivních přístupů (kap. 3.3), jako jsou klouzavé průměry a exponenciální vyrovnávání. U každé části je spolu s okomentovanými výsledky vysvětlen postup analýzy v programu STATISTICA. 3.1 Popis použitých dat V kapitole 3.2, vysvětlující prokládání trendu matematickými křivkami, byly použity dvě sady dat. Pro první čtyři analýzy byla vybrána data zobrazující měsíční stavy rozvahy nejmenované banky, za období únor 1988 až leden 1993 (dále data1). Data byla získána z internetové stránky http://robjhyndman.com/tsdl. Z grafu na obr. 4 je zřejmé, že data1 vykazují rostoucí trend, který se po roce 1990 prudce zvyšuje. Je možné předpokládat, že vhodnou matematickou křivkou, popisující tato data, by mohla být křivka exponenciálního nebo kvadratického trendu. Obr. 4: Měsíční stavy rozvahy, 1988-1993 (data1). Pro poslední dvě analýzy z této kapitoly byla použita jiná sada dat (data2), a to sice řada udávající postupné procentuální nahrazování plachetnic za lodě poháněné parou, od roku 1820 do roku 1970 (http://www.docstoc.com/docs/356563/ S-Curve-Forecasting-Data). 19

Obr. 5: Nahrazování plachetnic parníky, 1820-1970 (data2). Jelikož graf těchto dat má tvar S-křivky, s inflexním bodem přibližne v roce 1885, bude vhodné je modelovat právě logistickým trendem nebo Gompertzovou křivkou. V kapitole 3.3, zabývající se exponenciálním vyrovnáváním, bylo pracováno s daty, která zobrazují kurz české koruny vůči euru, od května roku 1998 do dubna roku 2012 (data3, obr. 6). Jedná se o měsíční data, která byla získána ze stránek České národní banky, z veřejné databáze ARAD, nabízející volně stažitelné časové řady (http://www.cnb.cz/docs/arady/html/index.htm). Obr. 6: Kurz Kč/Eur, květen 1998 - duben 2012 (data3). Z obrázku je patrné, že za posledních čtrnáct let posílila česká koruna vůči euru o více než dvanáct korun. Tato data nevykazují žádnou sezónnost, a až na výjimky u nich můžeme pozorovat dlouhodobě klesající trend. Postup tvorby grafů v programu STATISTICA je následující. Nejprve je nutné 20

do nové tabulky vložit vstupní data. Způsobů nabízí STATISTICA více, například je možné data zkopírovat, importovat ze souboru či otevřít tabulku Microsoft Excel. Do prvních třech sloupců tabulky tak byla vložena data určená pro analýzu, dále hodnoty t = 1,...,n a data pro popis osy x. Graf řady lze vytvořit např. pomocí modulu Spojnice nebo Bodový graf nacházejících se v záložce Grafy, nebo rychleji kliknutím na Grafy bloku dat. Po kliknutím levým tlačítkem na oblast grafu lze výsledný graf dále upravovat. 3.2 Popis trendu matematickými křivkami V této části bude ilustrováno použití metod z kapitoly 2.1. V následujících podkapitolách bude předvedeno, jak program STATISTICA využít při popisu řady výše popsanými polynomiálními trendy, dále logistickým trendem a Gompertzovou křivkou. 3.2.1 Lineární trend Pro modelování lineárního trendu zvolíme v hlavní nabídce Statistiky modul Vícenásobná regrese. Po otevření dialogového okna zvolíme závislé (data) a nezávislé (čas) proměnné. Po proběhnutí výpočtu se zobrazí okno s výsledky, které opět obsahuje několik záložek. V jeho horní části nalezneme statistiky jako např. koeficient determinace R 2, hodnotu testovací statistiky pro F-test nebo p- hodnotu. Po kliknutí na výsledky regrese se zobrazí následující tabulky: Tab. 1 a 2: lineární trend - výsledky, data1. V druhé tabulce ve sloupci b nalezneme odhady b 0 a b 1 parametrů β 0 a β 1. Rovnice lineárního trendu a současně vyrovnané řady je tedy: ŷ t = 328765,2+2656,6 t, t = 1,...,n. V posledních dvou sloupcích je obsažena hodnota t-testu, který testuje nevýznamnost regresních koeficientů. Příslušné p-hodnoty jsou téměř nulové, což znamená, že parametry jsou významné na hladině významnosti α = 0,05. V horní části tabulky se nachází koeficient determinace (R 2 = 0,879), jehož hodnota nám napovídá, že zvolený trend by mohl být vyhovující. Ovšem obr. 7 21

jasně ukazuje, že lineární trend není pro tato data příliš vhodný. V liště s názvem Residua/předpoklady/předpovědi je dále možné zvolit budoucí okamžik, pro který se vypočte jeho hodnota. Pro hodnotu 61 (n = 60) je výsledek zobrazen do následující tabulky: Tab. 3: Předpověď o jeden krok, data1. Výsledná tabulka je rozdělena do dvou částí. Horní část obsahuje jednotlivé členy rovnice lineárního trendu pro t = 61. V dolní části je pak samotná předpovězená hodnota (ŷ 61 = 490808,9) a meze 95% intervalu spolehlivosti pro tuto hodnotu. Kromě možnosti výpočtu budoucích hodnot, je ve stejné záložce možné spustit i reziduální analýzu. Po kliknutí na Rezidua předpovědi, se vypočítají předpovězené hodnoty, rezidua, směrodatné odchylky a další. Výsledek je opět zobrazen do přehledné tabulky (tab. 4 - zde prvních 10 hodnot). Analýzu reziduí je možné provést například pomocí grafů. Vizuální kontrola rozdělení reziduí je důležitá pro ověření správnosti použitého modelu. Rezidua by měla být náhodná, nezávislá, se stejným rozptylem a průměrem blízkým nule. Pro vizuální hodnocení náhodnoti a homoskedasticity lze v programu STA- TISTICA použít nabídku Grafy 2D, kde je možné zvolit např. bodový graf, normální p-graf nebo histogram. Jako test nezávislosti může sloužit např. Durbin- Watsonův test, který lze nalézt v menu Reziduální analýza, pod záložkou Detaily (více k teoretickému základu tohoto testu viz Cipra, 2008). Tab. 4: Předpovědi, rezidua - prvních 10 hodnot, data1. Samotný modul Reziduální analýza nabízí také vykreslení korelace 2 zvolených proměnných, histogramů, odlehlých hodnot či pravděpodobnostních grafů. V hlavním okně výsledků, v záložce detailní výsledky pak pod ANOVA nalezneme analýzu rozptylu (tab. 5). 22

Tab. 5: Analýza rozptylu, data1. V druhém řádku nalezneme postupně SSE, stupně volnosti a MSE. I podle těchto hodnot můžeme odhadnout kvalitu zvoleného modelu. Třetí sloupec obsahuje hodnotu testovací statistiky pro F-test, který se zabývá statistickou významností celého modelu, a poslední p-hodnotu. Pro vizuální zhodnocení výsledků je možné např. vytvořit graf předpovězených a pozorovaných hodnot. V hlavní nabídce vybereme Grafy-spojnice, zvolíme proměnné a nastavíme graf jako vícenásobný. Když již známe odhadnuté parametry, lze také graf pozorovaných hodnot proložit vlastní funkcí (menu Možnosti grafu). Obr. 7: Proložení lineárním trendem, data1. Poznámka: Pokud uživatel nepotřebuje detailní výsledky, jako nabízela předchozí analýza, lze provést proložení lineárním trendem jednodušeji. V hlavní nabídce Grafy zvolíme Bodový graf a v záložce Detaily zaškrtneme proložení lineárním trendem (obr. 7). Lze také zobrazit např. regresní rovnici nebo pásy spolehlivosti. 3.2.2 Kvadratický trend Pro modelování pomocí kvadratického trendu zvolíme modul Polynomická regrese, nacházející se pod Statistiky Pokročilé modely Obecné regresní modely. Po vyplnění proměnných se zobrazí okno s dostupnými výsledky, které je možné pomocí tlačítka Více výsledků ještě rozšířit. Jednotlivé výsledky jsou opět zobrazeny ve formě tabulek. 23

Tab. 6 a 7: Kvadratický trend - výsledky, data1. Podle prvního sloupce první tabulky má odhadnutý kvadratický trend tvar ŷ t = 363360,8 692,2t+54,9t 2, t = 1,...,n. P-hodnota je opět nízká, tedy všechny parametry jsou na hladině α = 0,05 významné. Z druhé tabulky je zřejmé, že koeficient determinace je vyšší, a součty čtverců reziduí jsou nižší než u lineárního trendu. Z toho můžeme usoudit, že použití kvadratického trendu přináší kvalitnější výsledky (viz také celkové porovnání v tab. 13). Analýzu reziduí je možné provést stejně jako v přechozím případě. Graf proložení trendem (obr. 8) lze získat také stejnými způsoby jako v předchozím případě. Z tvaru křivky kvadratického trendu je vidět, že tato křivka popisuje trend v datech mnohem lépe než křivka lineárního trendu. Obr. 8: Proložení kvadratickým trendem, data1. 3.2.3 Exponenciální trend V následující podkapitole budou předvedeny dva způsoby modelování časových řad pomocí exponenciálního trendu. Nejprve v programu STATISTICA využijeme modulu Nelineární odhad. Najdeme ho opět pod Pokročilé modely. Jako druhý způsob pak bude exponenciální trend převeden na trend lineární, a to 24

zlogaritmováním původních dat. Jak již bylo ale řečeno v teoretické části, tímto dochází ke zhoršení kvality statistických výsledků. Obě metody budou porovnány. 1. Odhad pomocí nelineární regrese Po zvolení této metody vybereme možnost Vlastní regrese (MNČ) a dále do pole Odhadovaná funkce napíšeme tvar exponenciálního trendu v2=a*bˆv1, kde v1 a v2 reprezentují sloupce, v jakých máme uložená data, a koeficienty a a b jsou odhady parametrů α a β. Dále je třeba vybrat jednu z nabízených iteračních metod, nastavit počet iterací, kritérium konvergence a počáteční hodnoty parametrů. Všechny tyto položky jsou již automaticky přednastaveny (počet iterací na 50, kritérium konvergence na 6 a počáteční hodnoty parametrů na 0,1), stačí tedy kliknout na ok. Pokud po spuštění modelu nedojde k zobrazení výsledků a zobrazí se chybová hláška, je třeba změnit defaultní hodnoty. V našem případě stačilo zvýšit počet iterací a kritérium konvergence. V některých případech je ale nutné přenastavit i počáteční hodnoty parametrů. Po úspěšném výpočtu se zobrazí tabulka s výsledky. Odhady parametrů (tab. 8 a 9) nalezneme v záložce Základ nebo Detailní výsledky. V těchto záložkách nalezneme i Předpovědi, rezidua a Analýzu rozptylu. Modul nelineární odhad nabízí i proložení dat vypočtenou funkcí (obr. 9). Tab. 8 a 9: Exponenciální trend - výsledky, data1. V prvním sloupečku první tabulky jsou opět odhady parametrů, vyrovnaná řada se počítá podle vzorce ŷ t = 331974,8 1,0067 t, t = 1,...,n Z druhé tabulky můžeme v druhém řádku vyčíst součet čtvercových chyb i střední čtvercovou chybu. Obě tyto hodnoty jsou opět o něco vyšší, než u kvadratického trendu. 25

Obr. 9: Proložení exponenciálním trendem, data1. Číselné výsledky dokládá i výše zobazený graf. Z něj je také zřejmé, že tento trend data1 moc dobře nevystihuje. Díky tomu, že b 1, jeví se pro tato data odhadnutý exponenciální trend téměř jako lineární. 2. Převedení na lineární trend Pro transformaci dat stačí v programu STATISTICA vytvořit nový sloupec dat, a do pole Dlouhé jméno napsat = log(v2), kde v2 je sloupec s původními daty. Dále postupujeme jako v případě lineárního trendu. Abychom získali výsledky pro původní data, předpovědi i odhady parametrů opět transformujeme zpět. Hodnoty, jako je SSE a MSE vypočítáme zvlášť. Základní výsledky zobrazuje následující tabulka: a 335510,9927 b 1,00635 SSE 1,38E+10 MSE 2,43E+8 Tab.10: Odhady parametrů, MSE a SSE po transformaci dat, data1. I když je výsledků patrné, že oba modely jsou velmi podobné (srovnání tab. 13), potvrzuje se fakt, že zlogaritmování dat a převedení tak trendu exponenciálního na trend lineární přináší horší statistické výsledky. 3.2.4 Modifikovaný exponenciální trend V programu STATISTICA provedeme analýzu modifikovaného exponenciálního trendu stejně, jako u exponenciálního trendu, tedy pomocí nelineárních odhadů. Tentokrát ale do odhadované funkce napíšeme v2=g+a*bˆv1, kde v1 a v2 jsou opět sloupce s daty, a koeficienty g, a a b jsou odhady parametrů γ, α a β. Po zvýšení počtu iterací i konvergenčního kritéria, docházíme k následujícím výsledkům: 26

Tab. 11 a 12: Modifikovaný exponenciální trend - výsledky, data1. V prvním sloupci první tabulky jsou odhay parametrů γ, α a β. Odhadnutý trend má tedy tvar ŷ t = 330365+21741 1,0369 t, t = 1,...,n Podle údajů z druhé tabulky a obr. 10 můžeme tvrdit, že modifikovaný exponenciální trend vyhovuje těmto datům mnohem více než obyčejný exponenciální trend, ale kvality kvadratického trendu nedosahuje. Graficky je trend zobrazen na následujícím obrázku. Obr. 10: Proložení mod.exponenciálním trendem, data1. Orientační hodnoty parametrů modifikovaného exponenciálního trendu lze také odhadnout přímým výpočtem. Tyto odhady jsou ovšem méně přesné než iterační metody nelineární regrese (Cipra, 2008). Následující tabulka obsahuje hodnoty statistických výsledků aplikovaných trendů na řadu bankovních dat. Při pohledu na tabulku je především z MSE zřejmé, že z použitých metod nejlépe vyhovovala metoda proložení kvadratickým trendem. Také koeficient determinace se u tohoto trendu velmi blíží jedné. 27

kritérium\trend Lineární Kvadratický Exponenciální Exp.-transformace modif. exp. R 2 0,879 0,968 SSE 1,27E+11 4,35E+9 1,35E+10 1,38E+10 5,79E+9 MSE 1,27E+11 7,6E+7 2,33E+8 2,43E+08 1,01E+8 Tab. 13: Porovnání statistických výsledků, data1. Vhodnost použité techniky nám může doložit i reziduální složka. Jak již bylo řečeno, reziduální složka by měla být nekorelovaná, homoskedastická se střední hodnotou nula a popř. normálním rozdělením. Z nabídky Základní statistiky byl zjištěn průměr reziduí -1,12E-10, což je hodnota téměř nulová. Obr. 11 pak zobrazuje jejich rozložení pomocí nabídky Bodový graf. Obr. 11: Graf reziduí při zvolení kvadratického trendu, data1. Je patrné, že rozptyl reziduí nelze považovat za úplně náhodný. Z grafu je zřejmé, že rezidua vykazují jistou zbytkovou závislost. I když křivka kvadratického trendu data na první pohled vystihuje velmi dobře (obr. 8), je na ní vidět, že původní pozorování jsou střídavě nad a pod křivkou. Stejným způsobem se pak chovají i rezidua na obr. 11. Z tohoto důvodu bylo vyzkoušeno také proložení polynomiálním trendem vyššího stupně. Postup je analogický jako u kvadratického trendu, pouze je nutné při výběru proměnných kliknout na Meziskup. efekty, a zde nastavit požadovaný stupeň polynomu. Původně je nastaven druhý stupeň, ale program STATISTI- CA nabízí nastavení až do stupně osm (křivky vyšších stupňů lze získat pomocí modulu Nelineární odhad). Protože po vyzkoušení několika možností bylo zjištěno, že pro polynomy vyššího stupně jsou již odhady koeficientů nulové, bylo nakonec vybráno proložení polynomiálním trendem stupně 6. Výsledek tohoto proložení je na obr. 12, rezidua pak na obr. 13. 28

Obr. 12: Proložení polynomiálním trendem 6-tého řádu, data1. Obr. 13: Graf reziduí při zvolení pol. trendu 6-tého řádu, data1. Z obrázku 12 je vidět, že zvýšení řádu polynomu přispělo k mnohem lepšímu proložení zkoumané řady. To ostatně dokazují i statistické údaje (R 2 = 0,993, SSE = 1,00E9 a MSE = 1,90E7), které dávají v porovnání s hodnotami jiných proložení (tab. 13) lepší výsledky. Graf reziduí na obr. 13 ukazuje, že změnou stupně polynomu došlo k určité eliminaci zbytkového trendu, který byl patrný při proložení dat pouze kvadratickým trendem. Pro další ověření, zda je použití kvadratického trendu vyhovující je možné ještě zobrazit histogram nebo testovat normalitu. Histogram s proložením funkce hustoty normálního rozdělení najdeme pod Grafy Grafy bloku dat Histogram: celé sloupce. Vytvoření histogramu reziduí nabízí také většina použitých modulů pro vytváření analýz. Testy normality jsou opět v menu Základní statistiky. Následující obrázek pak ukazuje proložení dat všemi dosud aplikovanými trendy. 29

Obr. 14: Proložení lineárním, kvadratickým, exp., mod. exp. trendem a pol. 6. řádu, data1. 3.2.5 Logistický trend Pro následující dvě analýzy budeme pracovat s druhou sadou dat (data2, viz kap. 3.1). Co se týče logistického trendu, existuje několik metod, jak odhadnout jeho parametry. V programu STATISTICA můžeme přímo použít předpis logistického trendu a za použití modulu Nelineární odhady požadované parametry vypočítat. Protože logistický trend lze považovat za inverzi modifikovaného exponenciálního, můžeme také pracovat s řadou 1/y t, postupovat jako v případě modifikovaného exponenciálního trendu a výsledné hodnoty pak transformovat zpět. Transformací řady však opět dochází k horším výsledkům. Další možností je pak použití metody diferenčních odhadů parametrů (Cipra, 2008). V programu STATISTICA použijeme opět modul Nelineární odhady. Klasickým postupem nedochází STATISTICA ani po zvýšeném počtu iterací k uspokojivým výsledkům. Většinou je výpočet ukončen chybovou hláškou nebo jsou odhady parametrů velmi nedůvěryhodné. Proto je třeba změnit přednastavenou počáteční hodnotu odhadovaných parametrů. Tyto parametry přibližně odhadneme přímým výpočtem (kap. 2; Cipra, 2008). Výsledky zobrazuje následující tabulka. b 0,6471 b 0,6471 a 0,2557 a 28,084 g 0,0091 g 109,79 Tab.14: Odhady parametrů logistického trendu, data2. Po vložení nových počátečních hodnot již proces proběhne a zobrazí se okno s výsledky (tab. 15 a 16). 30

Tab. 15 a 16: Logistický trend - výsledky, data2. Jak je vidět z první tabulky, hodnoty parametrů byly iteračním procesem pozměněny. Všechny odhady jsou ale statisticky významné, protože p-hodnoty t-testu o nevýznamnosti parametrů jsou všechny téměř nulové. Výsledná rovnice odhadnutého logistického trendu je ŷ t = 105, 08 1+62,76 0,6t, t = 1,...,n. Proložení dat křivkou logistického trendu je zobrazeno na následujícím obrázku. Z něj je patrné, že tato křivka popisuje trend v datech velmi přesně. Obr. 15: Proložení logistickým trendem, data2. Kdybychom dále pracovali s původními vypočtenými parametry a, b a g, vypadalo by proložení daty tak, jak je vidět na obr. 16, na kterém jsou obě křivky porovnány. 31

Obr. 16: Porovnání vypočtených a iteračně získaných parametrů, data2. Křivka vypocet, zobrazující použití vypočtených parametrů z transformovaných dat opět potvrzuje předpoklad, že transformacemi modelu dochází k horším výsledkům. Je patrné, že křivka zobrazující trend s iteračně vypočtenými parametry se k datům přimyká o mnoho lépe. 3.2.6 Gompertzova křivka Na stejnou sadu dat vyzkoušíme aplikovat i trend zobrazený pomocí Gompertzovy křivky. Postup je téměř identický s předchozím případem. Stejně jako u logistického trendu, ani použití Gompertzovy křivky se neobejde bez odhadu počátečních parametrů. Protože trend ve tvaru této křivky vzniká také transformací modifikovaného exponenciálního trendu, odhadneme počáteční parametry také přímým výpočtem, pouze budeme nyní pracovat s řadou y t = logy t. Tentokrát ani nemusíme odhadnuté parametry nijak transponovat, protože platí: logy t = γ +α β t, po substituci y t = logy t, se γ = γ, α = α a β = β. Odhady a, b a g se tedy rovnají hledaným odhadům a, b a g. Následující tabulky pak ukazují odhady parametrů, i výsledky po proběhlé iteraci v programu STATISTICA. b 0,8156 a -4,112 g 4,8907 Tab. 17: Odhady parametrů pro Gompertzovu křivku, data2. 32

Tab. 18 a 19: Gompertzova křivka-výsledky, data2. Z tabulky 18 je vidět, že počáteční parametry byly opět o něco pozměněny. Pokud bychom dále pracovali s původně vypočtenými parametry, opět bychom získali trend, který se ke skutečnému trendu dat blíží méně. Odhadnutý trend podle programu STATISTICA má tvar ŷ t = exp(4,74 7,74 0,75 t ), t = 1,...,n. Z druhé tabulky již podle MSE i SSE můžeme tvrdit, že Gompertzova křivka sice trend v této řadě vystihuje, ale ve srovnání s logistickým trendem jsou tyto hodnoty vyšší (tab. 20). To ostatně potvrzuje i obr. 17, kde jsou oba modely graficky porovnány. kritérium\trend Logistický Gompertzova křivka SSE 148,11 333,53 MSE 11,39 25,66 Tab. 20: Porovnání hodnot MSE a SSE, data2. Obr. 17: Porovnání log. trendu a Gomp. křivky, data2. 33

Analýza reziduí může být provedena analogicky, jako tomu bylo v kapitole 3.2.4. Opět je důležité, aby rezidua byla homoskedastická, nekorelovaná a s nulovou střední hodnotou (obr. 18). Obr. 18: Rozložení reziduí, logistický trend, data2. 3.3 Adaptivní přístupy V této kapitole bude předvedeno, jak použít program STATISTICA pro analýzu časových řad pomocí adaptivních přístupů, které byly popsány v kapitole 2.2. Jedná se tedy o klouzavé průměry a exponenciální vyrovnávání. V celé kapitole jsou používána data3, zobrazující kurz české koruny vůči euru, od roku 1998 do roku 2012 (více viz kap. 3.1). 3.3.1 Metoda klouzavých průměrů Po vložení dat do nové tabulky zvolíme v nabídce Statistiky Pokročilé metody modul Časové řady/predikce. Vybereme správná data a zvolíme OK (transformace, autokorelace, kříž. korelace, grafy). Zobrazí se menu Transformace proměnných, s několika záložkami. Pro metodu klouzavých průměrů vybereme záložku Vyhlazování. Program STATISTICA nenabízí v tomto případě vyhlazení polynomy vyšších řádů. K dispozici jsou tedy (vážené) aritmetické průměry, popř. centrované, pokud uživatel zadá sudou délku úseku. Jednoduché klouzavé průměry vybereme zaškrtnutím hned první nabídky, a po specifikování délky úseku stačí kliknout na OK (Transformovat vybrané řady). Bohužel se zobrazí pouze graf vyrovnaných hodnot, bez hodnot původních. Vykreslení obou řad lze dosáhnout v záložce Přehledy & grafy, kde vybráním položky Graf můžeme označit dostupné proměnné a transformace, které mají být zobrazeny společně v jednom grafu. Tímto způsobem je možné vykreslit pozorované hodnoty i s několika transformacemi najednou. Výše popsaným způsobem byly vytvořeny křivky klouzavých průměrů délky 5, 9 a 15, které jsou zobrazeny na následujícím obrázku. 34

Obr. 19: Jednoduché klouzavé průměry, délky 5, 9 a 13, data3. Na obrázku je patrné, že čím větší délka úseku, přes který se průměr počítá, tím je řada více vyhlazená. Záleží na uživateli, jak moc potřebuje daná data vyrovnat a jak moc se má výsledná křivka podobat původním datům. Jak již bylo řečeno, v programu STATISTICA lze také časové řady vyhladit pomocí vážených klouzavých průměrů, které program počítá podle vzorce ȳ (2m+1) t = y t m w t m +y t m+1 w t m+1 + +y t+m w t+m w t m +w t m+1 + +w t+m, kde 2m+1 je délka klouzavého průměru a w t m...w t+m jsou váhy pro jednotlivá pozorování. Aby bylo možné vážený klouzavý průměr aplikovat, je nutné zaškrtnout políčko vážený a vybrat Specifiovat váhy. Objeví se okno, do kterého lze vložit požadované váhy. Použití váženého klouzavého průměru bude ilustrováno pomocí tzv. Hanningova filtru (Montgomery a kol., 2008), pro který platí ȳ (3) t = y t 1 0,25+y t 0,5+y t+1 0,25. Jedná se tedy o klouzavý průměr délky 3, kde největší váhu má vždy prostřední pozorování. Výsledný graf je na obr. 20. 35

Obr. 20: Hanningův filtr, data3. Je vidět, že vážený klouzavý průměr délky 3 vyrovnává data jen velmi minimálně. Pokud by bylo nutné data více vyrovnat, bylo by třeba zvolit jiný typ filtru s větší délkou klouzavého průměru. Klouzavé mediány Kromě klouzavých průměrů nabízí program STATISTICA i vyhlazení pomocí klouzavých mediánů. V teoretické části bylo popsáno, že klouzavé mediány jsou vhodné pro odstranění odlehlých pozorování. Protože naše řada několik takových výkyvů obsahuje, byla na ní vyzkoušena také tato metoda. Klouzavé mediány lze zvolit ve stejném menu jako klouzavé průměry. Mediány délky 7 zobrazuje následující obrázek. Obr. 21: Klouzavé mediány délky 7 data3. Z obrázku je zřejmé, že použití klouzavých mediánů opravdu odřízlo výkyvy, které se v původních datech vyskytovaly, což je vidět především na hodnotách v letech 2008 a 2009. 36

3.3.2 Jednoduché exponenciální vyrovnávání Analýzu jednoduchého exponenciálního vyrovnávání najdeme opět pod menu Časové řady/predikce. Zde zvolíme Exponenciální vyrovnávání & předpověď. Po vybrání správné proměnné se zobrazí tabulka Sezónní a nesezónní exponenciální vyrovnávání. Protože naše data nevykazují žádný viditelný trend, vybereme v záložce Základ sloupec Žádná sezónní komponenta a pro jednoduchý exponenciální trend zaškrtneme volbu Bez trendu, čímž je metoda jednoduchého exponenciálního vyrovnávání zvolena. Počáteční hodnotu ŷ 0 a vyrovnávací konstantu α lze nastavit v záložce Detaily. Bylo zvoleno: ŷ 0 = y 1, tedy 36,11. Pokud uživatel počáteční hodnotu nezadá, program si ji zvolí sám (průměr ze všech pozorování). Pro určení vyrovnávací konstanty je možné ve třetí záložce využít tzv. Síťového hledání. Na základě ukazatelů jako je průměrná chyba, MSE, MAE (střední absolutní chyba) a další, program vybere tu nejvhodnější. Je možné nastavit minimum a maximum sítě, ve které se vyhledává a dále krok, s jakým se postupně zkouší hodnota α. Jak již bylo v teoretické části řečeno, tento koeficient značí míru vyrovávání. Program tedy ve většině případů zvolí vždy maximální povolenou hodnotu koeficientu, protože pro tuto hodnotu je řada nejméně vyrovnaná a blíží se původní řadě. Tudíž i statistické ukazatele jako jsou MSE a SSE jsou ve většině případů nejmenší. Následující tabulka ukazuje výsledky síťového hledání při neomezené volbě parametrů - tzn. byly ponechány původní hodnoty na 0,1 α 0,9. Krok byl nastaven na 0,05. Tab. 21: Síťové hledání, jednoduché exp. vyrovn., data3. Jak je vidět z tabulky, ve všech statistických ukazatelích byla vždy vybrána hodnota α = 0, 9 (tučné hodnoty). Pokud tuto hodnotu v záložce Detaily nakonec zvolíme, po kliknutí na Shrnutí: Exponenciální vyrovnávání se zobrazí dvě tabulky s výsledky a graf (tab. 22 a 23, obr. 22). V té samé záložce je také možné zvolit počet hodnot, které se mají předpovědět do budoucna. Tato hodnota byla ponechána na 10. 37

Tab. 22 a 23: Jednoduché exp. vyrovn.,výsledky, data3. V první tabulce můžeme vidět hodnoty několika druhů chyb, druhá tabulka ukazuje prvních 10 předpovězených hodnot a reziduí. Jak je patrné z grafu na obr. 22, řada dat není vůbec vyrovnaná, téměř kopíruje původní hodnoty, se zpožděním a jeden krok (tab. 23). Zvolení parametru α = 0,9 tedy není vhodné. Obr. 22: Jednoduché exp. vyrov., α = 0,9, data3. Místo síťového hledání bylo nakonec přistoupeno k expertnímu řešení. Vzhledem k doporučovaným hodnotám parametru α (0 < α 0,3), byly postupně vyzkoušeny hodnoty 0,1, 0,2 a 0,3. Výsledky zobrazuje následující graf. 38

Obr. 23: Jednoduché exp. vyrovn., porovnání parametrů, data3. Z grafu je patrné, že čím větší hodnota α, tím se výsledná křivka více přimyká k původním datům. Vzhledem k tomuto srovnání můžeme konstatovat, že pro naše data je vyhovující hodnota α = 0,3. Poznámka: Druhou možností, jak v programu STATISTICA provést jednoduché exponenciální vyrovnávání, je po vybrání modulu Časové řady/predikce kliknout na OK (Transformace, autokorelace, kříž. korelace, grafy) a zde v záložce Vyhlazování vybrat jednoduché exponenciální. Po nastavení hodnoty α, stačí zvolit OK (transformovat vybrané řady). V tomto případě se však zobrazí pouze graf vyrovnaných hodnot, bez hodnot původních a bez reziduí. Pro jejich zobrazení by bylo nutné postupovat jako v případě klouzavých průměrů. Z tohoto důvodu je pro metody exponenciálního vyrovnávání první způsob praktičtější. 3.3.3 Holtova metoda Při vyrovnávání dat pomocí Holtovy metody postupujeme téměř stejně jako u jednoduchého exponenciálního vyrovnávání. Po zobrazení okna Sezónní a nesezónní exponenciální vyrovnávání zvolíme nyní v záložce Základ možnost lineární trend. V záložce Detaily nastavíme počáteční hodnotu a počáteční hodnotu trendu S 0 = y 1 = 36,11 a T 0 = y 2 y 1 = 0,6. Co se týče parametrů α a γ, i nyní lze využít možnost síťového hledání, pro nalezení optimální kombinace. Ovšem setkáváme se se stejným problémem jako u jednoduchého exponenciálního vyrovnávání. Pokud zanecháme všechny hodnoty tak, jak byly přednastavené, výsledkem je α = 0,9 a γ = 0,1. Což opět znamená, že by výsledná řada nebyla vůbec vyhlazena. Omezíme-li se u obou parametrů na interval (0;0,3] s krokem 0,05, nejlepším výsledkem podle programu STATISTICA je α = 0,3 a γ = 0,3 (viz následující tabulka). 39

Tab. 24: Holtova metoda, síťové hledání, data3. Pokud zvolíme tyto hodnoty, zobrazí se následující graf: Obr. 24: Holtova metoda, α = 0,3, γ = 0,3, data3. Z grafu je patrné, že výsledná křivka vyrovnává data velmi dobře, proto by kombinace těchto parametrů mohla být označena jako vyhovující. Pro srovnání ovšem uvedu ještě několik jiných kombinací parametrů α a γ. Obr. 25: Holtova metoda, porovnání parametrů, data3. 40

Z obrázku můžeme usoudit, že hodnoty vybrané programem STATISTICA byly pro tato data nejvhodnější. Při srovnání vybraných hodnot s dalšími kombinacemi můžeme tvrdit, že zvoleníα = 0,3 aγ = 0,3 vedlo k nejlepším výsledkům. Posledním obrázkem je porovnání jednoduchého exponenciálního vyrovnávání s parametrem α = 0,3, a Holtovy metody s parametry α = 0,3 a γ = 0,3. Obr. 26: Porovnání exponenciálních vyrovnávání, data3. Při pohledu na graf lze jednodnzačně usoudit, že Holtova metoda vyrovnává tuto sadu dat lépe, i když například MSE je nižší u jednoduchého exponenciálního vyrovnávání (jednoduché exponencilní vyrovnávání: 83,9, Holtova metoda: 99). Je třeba brát v úvahu, že je nutné zvolit paramtery tak, aby výsledek odpovídal účelům, pro jaké chceme data vyrovnat. Adaptivní přístupy, nejen exponenciální vyrovnávání, tak zůstanou spíše subjektivními metodami, kdy je lepší rozhodovat se na základě vizuálního zobrazení dat než podle statistických údajů. 41