Univerzita Karlova v Praze Matematiko-fyzikální fakulta BAKALÁŘSKÁ PRÁCE. Kateřina Boková. Predikce časových řad

Podobné dokumenty
Lineární a adaptivní zpracování dat. 8. Modely časových řad I.

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

Lineární a adaptivní zpracování dat. 9. Modely časových řad II.

8. Analýza rozptylu.

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

Deskriptivní statistika 1

6. Posloupnosti a jejich limity, řady

Náhodný výběr 1. Náhodný výběr

4. B o d o v é o d h a d y p a r a m e t r ů

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

1.3. POLYNOMY. V této kapitole se dozvíte:

3. Lineární diferenciální rovnice úvod do teorie

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

procesy II Zuzana 1 Katedra pravděpodobnosti a matematické statistiky Univerzita Karlova v Praze

8.2.1 Aritmetická posloupnost I

Úloha II.S... odhadnutelná

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

8.2.1 Aritmetická posloupnost

Odhady parametrů 1. Odhady parametrů

Sekvenční logické obvody(lso)

Pravděpodobnost a aplikovaná statistika

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

12. N á h o d n ý v ý b ě r

Obsah. 1 Mocninné řady Definice a vlastnosti mocninných řad Rozvoj funkce do mocninné řady Aplikace mocninných řad...

Analýza a zpracování signálů. 4. Diskrétní systémy,výpočet impulsní odezvy, konvoluce, korelace

P2: Statistické zpracování dat

1. ZÁKLADY VEKTOROVÉ ALGEBRY 1.1. VEKTOROVÝ PROSTOR A JEHO BÁZE

23. Mechanické vlnění

Iterační výpočty projekt č. 2

Přednáška VI. Intervalové odhady. Motivace Směrodatná odchylka a směrodatná chyba Centrální limitní věta Intervaly spolehlivosti

základním prvkem teorie křivek v počítačové grafice křivky polynomiální n

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

Komplexní čísla. Definice komplexních čísel

1 Základy Z-transformace. pro aplikace v oblasti

Matematika I, část II

OKRUŽNÍ A ROZVOZNÍ ÚLOHY: OBCHODNÍ CESTUJÍCÍ. FORMULACE PŘI RESPEKTOVÁNÍ ČASOVÝCH OKEN

MATICOVÉ HRY MATICOVÝCH HER

Úloha III.S... limitní

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

2 STEJNORODOST BETONU KONSTRUKCE

PRAVDĚPODOBNOST A STATISTIKA

Užití binomické věty

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

14. B o d o v é o d h a d y p a r a m e t r ů

Budeme pokračovat v nahrazování funkce f(x) v okolí bodu a polynomy, tj. hledat vhodné konstanty c n tak, aby bylo pro malá x a. = f (a), f(x) f(a)

jako konstanta nula. Obsahem centrálních limitních vět je tvrzení, že distribuční funkce i=1 X i konvergují za určitých

Matematika 1. Katedra matematiky, Fakulta stavební ČVUT v Praze. středa 10-11:40 posluchárna D / 13. Posloupnosti

1 Základní pojmy a vlastnosti

EKONOMETRIE 9. přednáška Zobecněný lineární regresní model

1.1. Definice Reálným vektorovým prostorem nazýváme množinu V, pro jejíž prvky jsou definovány operace sčítání + :V V V a násobení skalárem : R V V

1. Základy měření neelektrických veličin

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

Závislost slovních znaků

Tržní ceny odrážejí a zahrnují veškeré informace předpokládá se efektivní trh, pro cenu c t tedy platí c t = c t + ε t.

8.1.3 Rekurentní zadání posloupnosti I

Intervalové odhady parametrů

Správnost vztahu plyne z věty o rovnosti úhlů s rameny na sebe kolmými (obr. 13).

Abstrakt. Co jsou to komplexní čísla? K čemu se používají? Dá se s nimi dělat

S polynomy jste se seznámili již v Matematice 1. Připomeňme definici polynomické

STUDIUM MAXWELLOVA ZÁKONA ROZDĚLENÍ RYCHLSOTÍ MOLEKUL POMOCÍ DERIVE 6

DERIVACE FUNKCÍ JEDNÉ REÁLNÉ PROM

Základy statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková

U klasifikace podle minimální vzdálenosti je nutno zvolit:

DIFERENCIÁLNÍ POČET FUNKCE JEDNÉ PROMĚNNÉ. 1) Pojem funkce, graf funkce

1 ROVNOMĚRNOST BETONU KONSTRUKCE

2 IDENTIFIKACE H-MATICE POPISUJÍCÍ VEDENÍ Z NAMĚŘENÝCH HODNOT

Analýza a zpracování signálů. 3. Číselné řady, jejich vlastnosti a základní operace, náhodné signály

1 Uzavřená Gaussova rovina a její topologie

Iterační metody řešení soustav lineárních rovnic

13 Popisná statistika

Základní požadavky a pravidla měření

L A B O R A T O R N Í C V I Č E N Í Z F Y Z I K Y

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

10.3 GEOMERTICKÝ PRŮMĚR

Kvantová a statistická fyzika 2 (Termodynamika a statistická fyzika)

} kvantitativní znaky. korelace, regrese. Prof. RNDr. Jana Zvárov. Obecné principy

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

Parametr populace (populační charakteristika) je číselná charakteristika sledované vlastnosti

6. FUNKCE A POSLOUPNOSTI

KONEČNĚ ROZDĚLENÁ ZPOŽDĚNÍ. POLYNOMICKY ROZDĚLENÉ ZPOŽDĚNÍ.

11. přednáška 16. prosince Úvod do komplexní analýzy.

Popisná statistika - zavedení pojmů. 1 Jednorozměrný statistický soubor s kvantitativním znakem

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

MATEMATIKA PŘÍKLADY K PŘÍJÍMACÍM ZKOUŠKÁM BAKALÁŘSKÉ STUDIUM MGR. RADMILA STOKLASOVÁ, PH.D.

MATEMATICKÁ INDUKCE. 1. Princip matematické indukce

Intervalové odhady parametrů některých rozdělení.

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

2,3 ČTYŘI STANDARDNÍ METODY I, ČTYŘI STANDARDNÍ METODY II

Metody zkoumání závislosti numerických proměnných

REGRESNÍ DIAGNOSTIKA. Regresní diagnostika

a my chceme data proložit nějakou hladkou funkcí, která by vystihovala hlavní vlastnosti dat, ale ignorovala malé fluktuace a nepřesnosti.

je konvergentní, právě když existuje číslo a R tak, že pro všechna přirozená <. Číslu a říkáme limita posloupnosti ( ) n n 1 n n n

Elementární zpracování statistického souboru

2. Náhodná veličina. je konečná nebo spočetná množina;

Zhodnocení přesnosti měření

n-rozměrné normální rozdělení pravděpodobnosti

6. P o p i s n á s t a t i s t i k a

Aritmetická posloupnost, posloupnost rostoucí a klesající Posloupnosti

Aplikovaná informatika. Podklady předmětu Aplikovaná informatika pro akademický rok 2006/2007 Radim Farana. Obsah. Algoritmus

Transkript:

Uiverzita Karlova v Praze Matematiko-fyzikálí fakulta BAKALÁŘSKÁ PRÁCE Kateřia Boková Predikce časových řad Katedra teoretické iformatiky a matematické logiky Vedoucí bakalářské práce: Mgr. Marti Pilát, Ph.D Studijí program: Iformatika Studijí obor: obecá iformatika Praha 2014

Prohlašuji, že jsem tuto bakalářskou práci vypracovala samostatě a výhradě s použitím citovaých prameů, literatury a dalších odborých zdrojů. Beru a vědomí, že se a moji práci vztahují práva a poviosti vyplývající ze zákoa č. 121/2000 Sb., autorského zákoa v platém zěí, zejméa skutečost, že Uiverzita Karlova v Praze má právo a uzavřeí licečí smlouvy o užití této práce jako školího díla podle 60 odst. 1 autorského zákoa. V... de... podpis

Název práce: Predikce časových řad Autor: Kateřia Boková Katedra : Katedra teoretické iformatiky a matematické logiky Vedoucí bakalářské práce: Mgr. Marti Pilát, Ph.D Abstrakt: V předložeé práci podáváme přehled metod pro modelováí a predikci časových řad. Popisujeme jak dekompozičí metody a metody založeé a Boxově- Jekisově metodologii, tak metody využívající postupů z oblasti výpočetí iteligece, především euroové sítě. Popis metod je vede především z algoritmického hlediska jsou uvedey a odvozey způsoby, jak astavovat jejich parametry. Součástí práce je software, který umožňuje jedotlivé metody aplikovat a časové řady, experimetovat s imi a porovávat je. Klíčová slova: časové řady, predikce, euroové sítě, regresí aalýza Title: Time series predictio Author: Kateřia Boková Departmet: Departmet of Theoretical Computer Sciece ad Mathematical Logic Supervisor: Mgr. Marti Pilát, Ph.D. Abstract: I this preset work, we provide a overview of methods for time series modellig ad predictio. We describe methods based o decompositio as well as methods based o the Box-Jekis methodology. Moreover, we also discuss methods based o the ideas from computatioal itelligece maily eural etworks. Thedescriptio of the methods is focused o the algorithmic aspects we derive the ways i which the parameters of the models are set. The work also cotais a software, which allows the user to applhe described methods to give time series ad compare them amog each other. Keywords: time series, predictio, eural etworks, regressio aalysis

Obsah 1.Základí pojmy...6 1.1.Problémy časových řad...7 1.2.Předpovědi časových řad...8 1.3.Přístupy k aalýze časových řad...9 2.Dekompozičí metody...10 2.1.Klasická dekompozice...10 1.Aditiví dekompozice...11 2.Multiplikativí dekompozice...11 2.2.Řadvořeé tredem a reziduálí složkou...11 2.2.1.Metoda ejmeších čtverců...12 2.2.2.Nejběžější matematické křivky...12 1.Kostatí tred...12 2.Lieárí tred...13 3.Kvadratický tred...13 4.Expoeciálí tred...14 5.Modifikovaý expoeciálí tred...15 6.Logistický tred...16 2.3.Adaptiví metody...16 2.3.1.Metoda klouzavých průměrů...17 2.3.2.Expoeciálí vyrováí...18 1.Jedoduché expoeciálí vyrováí...18 2.3.3.Dvojité expoeciálí vyrováí...19 2.4.Sezóí složka...21 2.4.1.Odstraěí sezóosti pomocí klouzavých průměrů...22 1.Aditiví dekompozice...22 2.Multiplikativí dekompozice...22 2.5.Odhaleí cyklické složky...23 3.Boxova-Jekisova metodologie...25 3.1.Stacioarita...25 3.2.Modely...27 3.2.1.Proces klouzavých součtů MA...28 3.2.2.Autoregresí proces AR...29 3.2.3.Smíšeý proces ARMA...30 3.3.Nestacioárí řady...31 3.4.Předpovědi...32 4.Neuroové sítě...33 4.1.Předpovědi...35 5.Uživatelská dokumetace...36 5.1.Spuštěí...36 5.2.Načteí řady...36 5.3.Editace záložek...38 5.4.Editace řad a výběr metody...38 6.Srováí euroových sítí s jiými metodami...42 7.Závěr...45

Úvod V deší dyamické době, kdy každý chce mít áskok před ostatími, by bylo velikou výhodou zát budoucost a v důsledku toho se umět ve správý okamžik správě rozhodout. Udělat správé obchodí rozhodutí ebo dobře ivestovat peíze a díkomu zbohatout. Predikce časových řad, jak už ázev apovídá, se zabývá právě budoucím chováím časové řady. V podstatě se pokusíme zkostruovat předpovědi pro časovou řadu. Ale jak to uděláme? A budou tyto předpovědi opravdu spolehlivé? Jedím ze způsobů, jak předpovídat budoucí chováí řady je podívat se a časově starší hodoty predikovaé řady a sažit se vypozorovat ějaké vlastosti či vzory chováí. Ne adarmo se říká, že se miulost opakuje. Z toho vyplývá, že se ejdříve budeme sažit ějakou časovou řadu zaalyzovat a pak až předvídat to, jak by se mohla chovat v budoucosti. V tomto textu se zpočátku budeme zabývat aalýzou a růzými vlastostmi časových řad. Dále se pokusíme pomocí aalýzy určit kokrétí metodu vhodou pro daou časovou řadu tak, aby aše předpovědi byly co ejpřesější. Poté, co se ám podaří učiit ějaké předpovědi, bychom určitě chtěli zát aší míru úspěšosti. Cílem mé bakalářské práce je vytvořit program, který abíde uživateli ačteí a grafické zpracováí časové řady. Umoží mu ačteou časovou řadu dále upravovat pomocí růzých filtrů a predikovat její budoucí chováí pomocí matematických modelů, ale i pomocí metod založeých a pricipu euroových sítích. 5

1. Základí pojmy V této kapitole se sezámíme se základími pojmy defiovaými v publikaci Fiačí ekoometrie [1], které budeme v ásledujícím textu používat. Defiice: Časová řada je libovolá posloupost dat y 1, y 2,... y chroologicky uspořádaých v čase. V časových řadách hraje důležitou roli také áhodost. V ašem případě je áhodost de facto ezalost všech skutečostí, jež utvářely hodotu časové řady v daém mometu jako apř. počasí, které ovlivňovalo úrodu. A proto budeme používat také modely, které využívají pricip áhodosti. Defiice: Náhodý proces eboli stochastický proces je možia {Y t,t T } áhodých veliči a stejém pravděpodobostím prostoru (Ω,Α, Ρ ) idexovaý pomocí hodot t z možiy T ( T R ), kde t představuje čas. Podle parametru t můžeme áhodé procesy dále rozdělit a áhodé procesy ve spojitém čase, kde T je časový iterval, ebo a áhodé procesy v diskrétím čase. Dalším možým rozděleím je děleí podle hodot áhodých veliči a áhodý proces s diskrétími stavy, a áhodý proces se spojitými stavy a a vícerozměrý áhodý proces, kde Y t je -rozměrý áhodý vektor. 6

Realizací vícerozměrého áhodého procesu jsou pak vícerozměré časové řady a realizací áhodého procesu s diskrétími či spojitými stavy, kde Y je skalárí veličia, je jedoduchá časová řada. Teto text se adále bude zabývat je jedoduchými časovými řadami v diskrétím čase, protože s tímto typem časových řad se setkáváme ejčastěji. Vícerozměré časové řady jsou zobecěím jedoduchých časový řad. 1.1. Problémy časových řad Jak už bylo výše zmíěo, budeme pracovat s časovými řadami v diskrétím čase, ovšem ěkteré řady jsou ve spojitém čase. Máme dvě možosti jak dosáhout diskrétího času. Prvím způsobem je vybrat z každého spojitého itervalu jedu reprezetativí hodotu, s íž se bude dál pracovat apř. posledí aměřeou hodotu. Druhý způsob je akumulace hodot, tedy apř. sečteí hodot v daém časovém období. Jedím z hlavích problémů časových řad je zazameáváí pomocí času. Celý kaledáří systém je poěkud epravidelý. Měsíce mají růzý počet dů, každá země má své specifické svátky a v důsledku toho má každá země jiý počet pracovích dů v měsíci, časová pásma a jié. Proto byly pro praxi zavedey jisté stadardy, kde měsíc má 30 dů a rok 360. Tyto stadardy jsou používaé hlavě v úročeí. Nebo můžeme měsíčí výdaje přepočítat tak, aby každý měsíc měl 30 dů tím, že vypočteme průměrou hodotu pro jede de a vyásobíme jí 30. Defiice: Délka časové řady je počet pozorováí, které vytvářejí daou řadu. 7

Délka časové řady je také důležitý faktor pro aalýzu řad. Např. pro Boxův- Jekisův přístup potřebujeme miimálě 50 pozorováí, aby byl model odpovídající. Je-li délka řady příliš malá, emusí ám poskytout dostatek iformací pro její aalýzu. Naopak při větší délce časové řady se ám může její chováí postupě měit a bude obtížější daou řadu zaalyzovat a ajít pro í vhodý model. Dalším úskalím příliš dlouhých řad jsou změy hodot v měřeí a začátku a koci časové řady způsobeé apř. iflací. 1.2. Předpovědi časových řad Naší předpovědí v ějakém budoucím bodě může být kokrétí hodota ebo rozmezí, kde by se hodota měla vyskytovat. Prví typ předpovědi se azývá bodový a musíme ho brát spíše orietačě. Druhou možostí je itervalová předpověď, která ám urči horí a dolí mez v jaké by se předpovídaá hodota měla acházet s ámi předem určeou pravděpodobostí. Pokud si chceme ověřit předpovědí správost modelu, tak se často uměle odstraňují ěkterá data, která potom tvoří tzv. zatajeý vzorek. Předpovědí model se pak zkostruuje a základě zbylých dat a vypočítají se předpovědi pro časové body zatajeého vzorku. Následě se porovají výsledky předpovědí se skutečými výsledky. Pro kotrolu správosti zvoleé metody můžeme vypočítat chybu e t aší předpovědi ŷ t, když už záme skutečou hodotu. Chybu v čase t spočteme ásledově e t = ŷ t. (1.2.1) Při výběru správé prediktiví metody a při správém astaveím jejích parametrů by chybová míra měla zázorňovat reziduálí složku, tj. složku časové řady, která má vlastosti šumu (viz. ásledující kapitola). Pokud chceme aše předpovědi souhrě porovat, tak můžeme použít jedu z ásledujících metod [1], kde začí hodotu a ŷ t odhad hodoty v čase t, je délka řady a h je počet provedeých provedeých predikcí. Součet čtvercových chyb SSE 8

+h SSE = t=+1 +h ( ŷ t ) 2 2 = e t t= +1 Středí čtvercová chyba MSE + h MSE= 1 h t=+1 +h 2 e t t =+1 ( ŷ t ) 2 = 1 h (1.2.2) (1.2.3) Odmocěá středí čtvercová chyba RMSE vytvořeá tak, aby vracela chybu ve stejých jedotkách jako předvídaá řada. RMSE= 1 h = +h ( ŷ t ) 2 1 h +h 2 e t t=+1 t=+1 (1.2.4) Pro řady s odlehlými pozorováími je vhodá středí absolutí chyba MEA, protože eklade takový důraz a velké chyby. +h MAE= 1 h t =+1 +h ŷ t = 1 h t=+1 e t (1.2.5) Můžeme, také použít metody ezávislé a měřítku řady,jako apř. středí absolutí procetí chyby MAPE MAPE= 100 h a jié. +h t=+1 ŷ t (1.2.6) 1.3. Přístupy k aalýze časových řad V ásledujících kapitolách si popíšeme dva ejběžější matematické přístupy aalýzy časových řad a také budeme časovou řadu modelovat mocí euroových sítí. Prvím matematický přístup je dekompozičí, který se daou řadu saží vyjádřit složeím jiých jedodušších řad. Druhý přístup je založe a pricipu Boxovy- Jekisovy metodologie, která se saží vyšetřit závislosti mezi jedotlivými pozorováími. 9

2. Dekompozičí metody V této kapitole si popíšeme podle Cipry[1] dva způsoby rozkladů časových řad a jedodušší časové řady, které se dají saději předpovědět, a také metody pro predikci řady plyoucí z těch rozkladů. 2.1. Klasická dekompozice Asi hlaví vlastostí, které ás bude z dlouhodobého hlediska zajímat, je ta, zda hodoty řady spíše celkově klesají či rostou. Tuto složku budeme azývat tred a budeme ho začit Tr t. Sezóí složkou popíšeme periodické změy v časové řadě během kaledářího roku, které se každý rok opakují, ačkoliv ěkdy měí svůj charakter. K aalýze sezóí složky je zapotřebí mít miimálě pololetí data (tj. data,ve kterých délka itervalu mezi pozorováí je kratší ež půl roku). Sezóí složku budeme začit Sz t. Další složkou, která vykazuje jistou pravidelost v chováí jako tredová ebo sezóí složka je cyklická složka. Tato složka zazameává růst a pokles v rámci časového úseku s jiou ež ročí periodou. Její odhaleí je obtížé, stejě jako odhaleí příčiy jejího vziku, především kvůli vykazováí epravidelostí. Perioda opakováí mívá proměou délku a obvykle zde bývají i rozdíly mezi sousedími body zvratu. Po odstraěí předešlých tří složek ám zbude směs růzých epravidelých faktorů ovlivňujících řadu. Tuto složku azýváme reziduálí složka a začíme jí E t. Předpokládáme, že má tvar bílého šumu. Defiice: Bílý šum ozačuje posloupost ekorelovaých áhodých veliči s ulovou středí hodotou a kostatím koečým rozptylem. 10

Nyí už záme všechy potřebé složky časové řady. Jediou otázka, která zbývá, je jak se mají poskládat dohromady. Máme dvě možosti: 1. Aditiví dekompozice Aditiví dekompozice [1] součtem všech složek. =Tr t +Sz t +C t +E t (2.1.1) Máme-li k dispozi předpovědi všech jejích hlavích složek můžeme zkostruovat předpověď (šum ěkdy zaedbáváme, ačkoli se dá modelovat stochastický) ŷ t = Tr t + Sz t +Ĉ t (2.1.2) 2. Multiplikativí dekompozice Výsledá řada vzike součiem všech složek. tredová složka je měřeá v jedotkách řady a ostatí složky jsou bezrozměré. =Tr t Sz t C t E t (2.1.3) 2.2. Řadvořeé tredem a reziduálí složkou Pokud se ám podařilo časovou řadu očistit od sezóí a cyklické složky(viz další kapitoly), můžeme se yí pokusit přiřadit křivce tvořeé je tredovou a reziduálí složkou =Tr t +E t (2.2.1) ějakou zámou základí matematickou křivku a dopočítat parametrak, aby křivka kopírovala tvar predikovaé časové řady. Předpovědi v tomto případě tvoří hodoty matematické křivky v čase t=+1, t=+2,... Přesost metody se dá zkotrolovat vizuálě či vypočteím chyb. Než budeme rozebírat kokrétí matematické křivky, tak si připomeeme metodu ejmeších čtverců, pomocí íž budeme odhadovat parametry křivek. 11

2.2.1. Metoda ejmeších čtverců Metoda ejmeších čtverců [1] je optimalizačí metoda, jejímž úkolem je ajít odhady b 1, b 2,...,b parametrů β 1, β 2,..., β, tak aby součet čtverců T S= t =1 T ( (β 1 +β 2 x t,2 +β 3 x t,3 +...+β x t, )) 2 = ( x t β ) 2 (2.2.2) t=1 byl miimálí. Nejdříve spočteme parciálí derivace podle jedotlivých parametrů. δ S δ β 1 =2( y 1 (β 1 +β 2 x 1,2 +...+β x 1, ))+...+2( y (β +β 2 x,2 +...+β x, )) δ S δ β =2x 1, ( y 1 (β 1 +β 2 x 1,2 +...+β x 1, ))+...+2x, ( y (β +β 2 x,2 +...+β x, )) (2.2.3) Jelikož hledáme miimum, tak položíme parciálí derivace rovy ule a upravíme. Tím ám vzike soustava rovic, jejímž řešeím jsou ámi hledaé odhady. t =1 t=1 =b 1 t =1 x t, =b 1 t=1 1+b 2 t =1 x t, +b 2 t =1 x t,2 +...+b x t, t=1 x t,2 x t, +...b x t, x t, t =1 (2.2.4) 2.2.2. Nejběžější matematické křivky Pomocí metody ejmeších čtverců jsme schopi řadu proložit libovolou křivkou. Nyí si ukáže křivky, které se používají ejčastěji. 1. Kostatí tred Tvarem křivky kostatího tredu [1] je přímka rovoběžá s osou t Tr t =β 0,kdet=1,.., (2.2.5) 12

Kostatí tred použijeme a řadu, kde rozdíly sousedích hodot +1 jsou přibližě ulové. Odhad b 0 parametru β 0 pomocí metody ejmeších čtverců se vyjádří z rovice b 0 = t=1. (2.2.6) Předpověď ŷ t pak abývá hodot ŷ t =b 0 prot>. (2.2.7) 2. Lieárí tred Lieárí tred [1] má tvar přímky Tr t =β 0 +β 1 t,,kdet=1,.., (2.2.8) Pokud rozdíly sousedích +1 hodot se pohybují okolo eulové kostaty, tak bychom měli použít lieárí tred. Odhady b 0 a b 1 parametrů β 0 a β 1 pomocí metody ejmeších čtverců dostaeme řešeím soustavy rovic b 0 +b 1 t=, b 0 t=1 t =1 t+b 1 t=1 t=1 t 2 = t =1 Předpověď ŷ t pak vypočteme ásledově t. (2.2.9) ŷ t =b 0 +b 1 t prot> (2.2.10) 3. Kvadratický tred Kvadratický tred [1] reprezetujeme kvadratickým polyomem Tr t =β 0 +β 1 t+β 2 t 2,kdet=1,..,. (2.2.11) Pohybuje-li se hodota výrazu +2 2+1 + okolo ějaké kostaty, tak pro odhad použijeme kvadratický tred. Odhady b 0, b 1 a b 2 parametrů β 0, β 1 a β 2 pomocí metody ejmeších čtverců dostaeme jako řešeí ásledující soustavy rovic 13

b 0 +b 1 t+b 2 b 0 t =1 b 0 t=1 t =1 t=1 t+b 1 t 2 +b 2 t=1 t 2 +b 1 t =1 t=1 t 3 +b 2 t =1 t 2 = t=1 t 3 = t =1 t 4 = t=1, t, t 2,. (2.2.12) Předpověď ŷ t pak abývá hodot ŷ t =b 0 +b 1 t+b 2 t 2, pro t>. (2.2.13) 4. Expoeciálí tred Expoeciálí tred [1] se vyjadřuje ásledově Tr t =α β t, kdet=1,.., a β >0 (2.2.14) a je vhodé ho použít a řadu, kde podíl hodot +1 je kostatí. Logaritmujeme-li rovici (2.2.14), dostaeme se k rovici lieárího tredu, kde můžeme vypočítat klasicky oba odhady pro lieárí tred. Následým zlogaritmováím dostaeme odhady pro původí rovici. V praxi se, ale osvědčilo používat pro odhady a a b parametrů α a β místo klasické metody ejmeších čtverců její modifikaci - vážeou metodu ejmeších čtverců s vhodě trasformovaými hodotami. Takže místo miimalizace výrazu T v t ( α β t ) 2, (2.2.15) t =1 Miimalizuje zlogaritmovaý výraz T w t (l (lα +t l β )) 2, (2.2.16) t =1 kde w t jsou váhy závislé a v t obvykle tímto způsobem w t = 2 v t, t=1,...,, (2.2.17) Výsledkem je odlogaritmovaé řešeí ásledující soustavy lα y 2 t v t +l β y 2 t v t t= ( y 2 t v t l ), t=1 lα t =1 t =1 2 v t t+l β t=1 t =1 2 v t t 2 = t =1 ( 2 v t t l ) (2.2.18) 14

Předpověď ŷ t pak abývá hodot ŷ t =exp(l α+t l β ) pro t> (2.2.19) 5. Modifikovaý expoeciálí tred Modifikovaý expoeciálí tred [1], jak je patré a prví pohled, zobecňuje expoeciálí tred Tr t =γ +α β t,kde t=1,.., (β >0) (2.2.20) Odhady a, b a c parametrů α, β a γ dostaeme jako řešeí tří rovic, které vzikou rozděleím celé poslouposti a 3 stejé části (pokud délka poslouposti eí beze zbytku dělitelá třemi, tak vyecháme potřebý počet pozorováí a počátku řady). Jedotlivé části ásledě sečteme. Modifikovaý expoeciálí tred je vhodé použít, když podíl sousedích rozdílů se pohybuje okolo ějaké kostaty. 1 =mγ + α β (β m 1), b 1 1 je součet prví části 2 =mγ + α β m+1 (β m 1), b 1 2 je součet druhé části 3 =mγ + α β 2m+1 (β m 1) b 1 3 je součet třetí části +2 +1 +1 (2.2.21) Odhady parametrů získáme vyřešeím soustavy rovic (2.2.21). Explicitě vyjádřeé odhady mají ásledující tvar b=( y 3 t 2 y )1 t m 2 1 a= b 1 b(b m 1) 2 ( 2 1 ) c= 1 m ( 1 ab(bm 1) b 1 ) Předpověď ŷ t pak abývá hodot. (2.2.22) 15

ŷ t =c+ab t prot>. (2.2.23) 6. Logistický tred Logistický tred [1] má předpis Tr t = γ, kdet=1,.., (β >0,γ >0) (2.2.24) 1+α β t Odhady a, b a c parametrů α, β a γ spočteme pomocí modifikovaého expoeciálí tredu. Ze vzorce je patré, že logistický tred si lze představit jako převráceou hodotu modifikovaého expoeciálího tredu. Postup je pak obdobý jako u modifikovaého expoeciálího tredu, avšak místo hodoty se dosadí její převráceá hodota 1. Z toho vyplývá, že jej použijeme, když je podíl rozdílů převráceých hodot Předpověď ŷ t pak abývá hodot 1/ +2 1/ +1 1/ +1 1/ kostatí. ŷ t = 1 c+ab t, prot> (2.2.25) 2.3. Adaptiví metody Aproximace pomocí křivek má jedu evýhodu. Nedokáže se přizpůsobit změě charakteru řady, ke kterému může dojít. Následující dva druhy metod se řadí do tzv. adaptivích metod, které jsou schopy se přizpůsobit daé změě. 16

2.3.1. Metoda klouzavých průměrů Metoda klouzavých průměrů[1] slouží k vyhlazováí řady. Lze s í při správém astaveí parametrů odstrait sezóí ebo cyklickou složku. Základí myšleka je vytvořit pro každé pozorováí vyrovávací hodotu pomocí hodot před a po tomto pozorováí. De facto se sažíme každý časový bod a jeho okolí aproximovat ějakým předem určeým polyomem. Takže vezměme prvích 2+1 bodů (je vhodé volit lichou délku poslouposti kvůli matematickému zjedodušeí viz (2.3.4)) časové řady. A jak už bylo výše řečeo, aše prví vyrovávací hodota bude v bodě t=+1. Vyvažovací hodota pro bod t=+2 se vypočítá z bodů y 2,.. y 2 +2 a tak dále. Aproximace m hodot, kde m=2+1 v čase t se řádem polyomu r +τ, kdeτ =,.., 1,0,1,.. (2.3.1) řešíme pomocí metody ejmeších čtverců. Sažíme se ajít odhady pro miimalizaci tohoto výrazu τ = ( +τ (β 0 +β 1 τ +β 2 τ 2,..., β r τ r )) 2 (2.3.2) Použitím parciálích derivací dostaeme ásledující soustavu rovic b 0 τ j +b 1 τ j+1 +b 2 τ j +2 +,..,+b r τ = (2.3.3) τ = τ = τ = τ j +r = +τ τ j, kde j=0,1,..,r τ = Nyí tuto poěkud robustí soustavu trochu zjedodušíme. Prví čeho si všimeme, je to, že pro všecha lichá i platí τ = τ i =0 (2.3.4) 17

Protože chceme zát je prostředí hodotu, tj. hodotu v bodě τ =0, k výpočtu hodoty z polyomu řádu r b 0 +b 1 τ +b 2 τ 2,...,b r τ r ám stačí je zát hodotu odhadu b 0. Tato hodota je řešeím soustavy rovic vziklé z v pořadí sudých rovic, jelikož každá v pořadí lichá rovice eobsahuje díky (2.3.4) čle s b 0. Tímto způsobem jsme získali vyrovávací hodoty pro skoro celou posloupost až a prvích a posledích pozorováí. Prví vyrovávací hodoty lze vyjádřit pomocí prvího polyomu v čase s parametry τ <0 a posledí pomocí posledího polyomu s parametry τ >0. K těmto výpočtům již musíme dopočítat i ostatí odhady b 1, b 2,..,b r parametrů β 1, β 2,.., β r. Tímto způsobem můžeme i predikovat budoucí hodotak, že za parametr τ při aproximaci posledím polyomem dosadíme hodotu větší ež. Nicméě, čím vzdáleější budoucí předpovědi pomocí této metody vytvoříme, tím méě jsou spolehlivé. Klouzavé průměry se spíš používají k odstraěí cyklické či sezóí složky a ásledě se pak provede aproximace pomocí ěkteré z matematických křivek z části (2.2). 2.3.2. Expoeciálí vyrováí Při expoeciálím vyrováváí může pomocí tzv. diskotí kostaty 0<β <1 upředostit aktuálější hodoty před staršími hodotami. ( ŷ t ) 2 +( 1 ŷ t 1 ) 2 β +( 2 ŷ t 2 ) 2 β 2 +( 3 ŷ t 3 ) 2 β 3 +... (2.3.5) 1. Jedoduché expoeciálí vyrováí Jedoduché expoeciálí vyrováí [1] se používá pro řady lokálě kostatí. Tr t =β 0 (2.3.6) V tomto případě je odhad b 0 (t) závislý a čase t získáme ho miimalizací výrazu, ze kterého se vypočítává, a j=0 ( j β 0 ) 2 β j. (2.3.7) 18

Po zderivováí podle β 0 dostaeme rovici. b 0 =(1 β ) j β j j=0 Protože zde mluvíme o řadě lokálě kostatí tak ŷ t =b 0. Nyí ještě převedeme tuto rovici a rekurziví vzorec ŷ t =(1 β ) +β y t 1, (2.3.8) který ještě trochu upravíme ŷ t =α +(1 α ) ŷ t 1, kdeα =1 β,0<α<1 (2.3.9) Výhodou této metody je možost korigovat pomocí parametru α adaptabilost metody - čím ižší zvolíme α tím vyhlazeější bude řada. Jako počátečí hodota parametru ŷ 0 se obvykle používá buď hodota y 1 ebo aritmetický průměr ěkolika prvích hodot. Počátečí hodota pro α se v praxi obvykle volí z itervalu (0, 0.3] buď fixě ebo se postupě zkouší všechyto hodoty 0,01 ;0,02 ;...; 0,3 a vybere se hodota s ejmeší chybovou fukci SSE. Předpovědí pro τ >0 je posledí vyrovávací hodota pro jedoduché expoeciálí vyrováí v čase t. ŷ t+τ (t)= ŷ t (2.3.10) Pro kostrukci této metody se většiou používá časový bod posledího pozorováí. 2.3.3. Dvojité expoeciálí vyrováí Dvojité expoeciálí vyrováí [1] je vhodé pro řady s lokálě lieárím tredem Tr t j =β 0 j β 1 (2.3.11) Pomocí metody ejmeších čtverců miimalizujeme výraz j=0 [ j (β 0 +β 1 ( j))] 2 β j (2.3.12) a dostaeme soustavu dvou rovic o dvou ezámých 19

β 0 j=0 β 0 j=0 β j β 1 j=0 j β j β 1 j=0 j β j = j=0 j 2 β j = j=0 j β j, j β j. (2.3.13) Nahrazeím sum jejich součtovými vzorci dostaeme ásledující rovice β 0 1 1 β β 1 β 0 β (1 β ) 2 β 1 β (1 β ) = 2 j=0 β (1+β ) (1 β ) 3 = j=0 j β j, j β j (2.3.14) Rovice ásledě upravíme tak, abychom měli podobý vzorec jako u jedoduchého expoeciálí tredu. β β 0 β 1 1 β =(1 β ) j β j, j =0 (2.3.15) β (1+β ) β 0 β β 1 (1 β ) =(1 β )2 yt j β j j j=0 Nyí, když celou levou strau prví rovice ahradíme S t a celou levou strau druhé rovice ahradíme S t [2] vyrováí rovice přepsat do rekurzivích vzorců, můžeme stejě jako u jedoduchého expoeciálí S t =(1 β ) +β S t 1 (2.3.16) [2 S ] [2 ] t =(1 β )S t +β S t 1 Po vypočteí S t a S t [2] koečě vypočítáme odhady b 0 (t) a b 1 (t ) (začíme b 0 (t), protože záleží a času, ze kterého se odhady počítají) parametrů β 0 a β 1 jako řešeí ásledující soustavy rovic β b 0 (t ) b 1 (t ) 1 β =S t, b 0 (t)β b 1 (t) β (1+β ) (1 β ) =S [ 2] t Explicití vyjádřeí výsledku je [2 b 0 (t)=2s t S ] t, b 1 (t )= 1 β β (S S t t [ 2] ). (2.3.17). (2.3.18) Předpověď ŷ t+τ vytvořeá v čase t abývá hodot 20

ŷ t+τ =β 0 (t)+β 1 (t)τ, kdeτ =1,.., (2.3.19) Počátečí odhady vyjádříme z rovice (2.3.18) a za b 0 (0) a b 1 (0) dosadíme odhady parametrů β 0 a β 1 získaé z aproximace počátečích hodot přímkou. S 0 =b 0 (0) 1 α α b 1(0) S 0 [2 ] =b 0 (0) 2(1 α ) α b 1 (0), (2.3.20) kde α=1 β. 2.4. Sezóí složka Předchozí kapitola se věovala predikci časových řad tvořeých tredovou složkou a šumem. Ale e vždy máme k dispozici data je v této formě, tedy data očištěé od sezóosti a cyklické složky. V této kapitole si ukážeme, jak se dá řada očistit od sezóí i cyklické složky. Sezóí složku ám budou modelovat sezóí faktory I 1, I 2,..., I s, kde s ozačuje délku sezóy, tj. počet pozorováí během jedoho roku. Nejdříve si ale musíme určit hraici mezi tredovou a sezóí složkou, jelikož eí vždy jedozačá. Pro teto účel si zavedeme ormalizačí pravidlo. Normalizačí pravidlo pro aditiví dekompozici vyžaduje součet sezóích faktorů za každý rok rový ule. Pro multiplikativí dekompozici se souči sezóích faktorů za každý rok musí rovat jedé. 21

2.4.1. Odstraěí sezóosti pomocí klouzavých průměrů Jak už bylo dříve zmíěo, klouzavé průměry mohou zbavit řadu sezóosti. Popsaá metoda tedy bude založea a pricipu cetrovaých klouzavých průměrů. Cetrovaé klouzavé průměry jsou modifikací klouzavých průměrů sudé délky m, kdy výsledý odhad spadá mezi dvě pozorováí. Situaci řešíme tak, že spočteme aritmetický průměr dvou ejbližších klouzavých průměrů sudé délky(dvou meziobdobí). 1. Aditiví dekompozice Při aditiví dekompozici [1] vytvoříme cetrovaé klouzavé průměry, které použijeme jako odhad tredu. Odstraíme tredovou složku z řady * = (2.4.1) a odhademe sezóí faktory. Ij * se odhade jakou aritmetický průměr všech j-tých hodot v každém roce. Dále ámi získaé odhady cetrujeme odečteím aritmetického průměru sezóích faktorů I j =I * j Ī * =I * j I * 1+ I * * 2 +...+I s s, kde j=1,2,.., s. (2.4.2) Po odečteí odhadů z původí řady, dostaeme řadu očištěou od sezóí složky ŷ t = I j, (2.4.3) kde t odpovídá j-tému měsíci. 2. Multiplikativí dekompozice Podobě u multiplikativí dekompozici [1] se provádí sezóí očistěí i u multiplikativí dekompozice. Zkostruujeme cetrovaé klouzavé průměry. Odstraíme tredovou složku z řady * =. (2.4.4) 22

a odhademe sezóí faktory aplikací aritmetického průměru a všechy j-té hodoty v každém roce. Abychom splili ormalizačí pravidlo, tak řadu vydělíme celkovým geometrickým průměrem I j = I * j I = * * I j s I * 1 + I * * 2 +...+I s A vyděleím dostaeme řadu očištěou od sezóí složky.,kde j=1,2,.., s. (2.4.5) ŷ t = I j, (2.4.6) kde t odpovídá j-tému měsíci. 2.5. Odhaleí cyklické složky Cyklická složka [1] se obtížě určuje, zvláště je-li v daé řadě skryto více cyklických složek. Pro odhaleí cyklické složky bude zapotřebí periodogram [1] a statistické testy. Defiice: Periodogram I (ω ) časové řady y 1, y 2,.., y je fukcí frekvece ω měřeých v radiáech za časovou jedotku. Defiovaý ásledově I (ω )= 1 4π (a2 (ω )+b 2 (ω )), 0 ω π, a(ω)= 2 t=1 cos(ω t), (2.5.1) b(ω )= 2 t =1 si (ω t), Fisherův statistický test periodicitestuje ulovou hypotézu, že daá řada eobsahuje periodickou složku. Takže ulová hypotéza je tvaru H 0 : =μ+ϵ t, t=1,2,..,. (2.5.2) Proti ulové hypotéze stojí myšleka, že řada je tvořea směsí periodických složek k =μ+ l=1 (α l cos(ω l t)+β l si (ω l t))+ϵ t t=1,2,..,. (2.5.3) Test vychází z hodot periodogramu v bodech ω j * ω j * = 2π j, j=1,2,..,m,kde m=[ 1 2 ] (2.5.4) 23

A hodoty statistiky spočítáme tímto vzorcem W = max Y j = max 1,2,.., m 1,2,..,m I (ω j * ) I (ω 0 * )+ I (ω 1 * )+...+ I (ω m * ) (2.5.5) Pro rozděleí statistiky W použijeme aproximačí vzorec P (W >x)=m(1 x) m 1 0< x<1,m<50 (2.5.6) Z aproximačího vzorce získáme kritickou hodotu, jež hodota W esmí překročit, abychom a hladiě výzamosti 5% mohli potvrdit. Při potvrzeí hypotézy je hledaou frekvecí ω j *. Po odstraěí hodoty I (ω j * ) z periodogramu opakujeme postup. Při eplatosti aproximačího vzorce skočíme. Nechť máme alezeé všechy odhady frekvecí periodických složek ω 1,,ω k, pak z rovice (2.5.3) vypočteme pomocí metody ejmeších čtverců ásledující odhady μ= 1 t=1 (2.5.7), α j = 2 t=1 cos( ω j t), β j = 2 t =1 si ( ω j t), j=1,, k 24

3. Boxova-Jekisova metodologie Boxova-Jekisova metodologie přistupuje k aalýze časové řady z úplě jiého hlediska, ež tomu bylo u dekompozičích metod. Základem této metodologie je prozkoumat vztah mezi jedotlivými pozorováími. Boxova-Jekisova metodologie by měla zvládout predikovat i řady, které jsou dekompozičí metodou obtížě zvládutelé. Tato metodologie ese v ázvu autory moografie Box Jekis(1970). Hlavím příosem této moografie bylo vytvořeí algoritmické podoby popsaých metod. Cipra uvádí, že mezi hlaví výhodéto metodologie patří to,že stochastické modelypu ARMA jsou začě flexibilí a tedy použitelé i pro časové řady velmi obecých průběhů a zatím eexistuje lepší rutií ástroj pro aalýzu časově závislých pozorováí. Oproti tomu, ale Boxova-Jekisova metodologie vyžaduje delší časové řady (jako miimálí délka se doporučuje padesát pozorováí, to ovšem ebývá problém pro fiačí časové řady) a Boxova-Jekisova metodologie je v podstatě erealizovatelá bez počítače vybaveého příslušým softwarem a bez určité istruktáže 3.1. Stacioarita Jak jsme si řekli v prví kapitole, a časovou řadu se můžeme dívat jako a áhodý proces {Y t, t T }. Ze začátku předpokládejme, že aše řada splňuje podmíku slabé stacioarity [1]. V této kapitole budeme pod pojmem stacioarita vždy rozumět pojem slabá stacioarita. 25

Defiice Slabě stacioarí áhodý proces je ivariatí vůči posuům v čase v rámci druhých mometů, tj. pro áhodou veličiu Y t platí E (Y t )=μ=kost (3.1.1) a pro každé s a t platí cov(y t,y s )=E (Y t μ)(y s μ)=cov(y t h,y s h ), pro libovolé h. (3.1.2) Sousedí pozorováí v časové řadě mezi sebou většiou vzájemě souvisí, tj. má-li pozorováí v čase t hodotu, tak je dost pravděpodobé, že časově ejbližší hodoty, 1, +2, +1, abývají podobých hodot. Proto si zadefiujeme fukce vyjadřující tyto vztahy pro slabou stacioaritu (středí hodota μ a rozptyl σ Y 2 áhodé veličiy Y t jsou kostatí) [1]. Autokovariačí fukce pro zpožděí k je γ k =cov(y t,y t k )=E (Y t μ)(y t k μ) (3.1.3) Autokorelačí fukce pro zpožděí k má tvar ρ k = γ k σ y 2 =γ k γ 0, k=.., 1,0,1,... (3.1.4) Vypočteé korelace můžeme zázorit grafem, tzv. Korelogramem [1]. Protože autokovariačí a autokorelačí fukce jsou sudé, tak ám stačí zát je hodoty pro k 0. V praxi se autokovariačí fukce odhaduje ásledově c k = 1 t =k+1 ( y)( k y), k=0,1,.., 1, (3.1.5) kde y= 1 t =1 je odhad středí hodoty. A autokorelačí fukce má tvar r k = c k c 0, k=0,1,.., 1. (3.1.6) Aby daé odhady byly věrohodé, tak se doporučuje tyto odhady provádět a řadě délky miimálě =50 a volit k< 4. 26

Další fukcí, která ám pomůže blíže aalyzovat vztah mezi pozorováími je parciálí autokorelačí fukce [1]. Jejíž odhad je vyjádře rekuretím vzorcem r 11 =r 1, r kk = k 1 r k j=1 k 1 1 j =1 r k 1, j r k j r k 1, j r j,pro k>1, (3.1.7) kde r k, j =r k 1, j r kk r k 1,k j,pro j=1,2,..,k 1. (3.1.8) Průběh odhadutých autokorelačích a parciálích autokorelačích fukci ám pomáhá idetifikovat model (viz ásledující kapitola). Zejméa ás zajímá tzv. bod usekutí k 0, kdy se korelačí hodota pohybuje blízko ule, pokud takový bod existuje. 3.2. Modely Základem BoxovyJekisovy metodologie je lieárí proces [2] tvaru Y t =ε t +ψ 1 ε t 1 +ψ 2 ε t 2 +, (3.2.1) kde je {ε t } bílý šum a ψ 1, ψ 2 jsou parametry, které musejí splňovat podmíku ψ 2 i <, (3.2.2) i=0 aby řada (3.2.1) kovergovala a proces byl stacioárí s ulovou středí hodotou. Zavedeme-li fukci Φ (z)= ψ i z i +1, (3.2.3) i=1 můžeme také říci, že proces je stacioárí a řada (3.2.1) koverguje, když Φ (z) koverguje pro z 1 v komplexí roviě. Lieárí proces můžeme také vyjádřit i pomocí ostatích áhodých veliči jako Y t =π 1 Y t 1 +π 2 Y t 2 + +ε t (3.2.4) za podmíky, že je daý proces ivertibilí, tj. Π (z) koverguje pro z 1. 27

Pro zjedodušeí zápisu si zavedeme operátor časového posuu B tímto způsobem B j Y t =Y t j (3.2.5) 3.2.1. Proces klouzavých součtů MA Proces klouzavých součtů MA( q ) [1] je v podstatě lieárí proces ukočeý v bodě q Y t =ε t +θ 1 ε t 1 + +θ q ε t q =Θ ( B)ε t,kdeθ (B)=1+θ 1 B+,...,θ q B q (3.2.6) MA( q ) je stacioárí proces s ulovou středí hodotou. Jeho rozptyl lze vyjádřit jako σ 2 Y =(1+θ 2 1 + +θ 2 q )σ (3.2.7) a autokorelačí fukce má tvar ρ k = θ k +θ 1 θ k +1 + +θ q k θ q (1+θ 2 1 + +θ 2 q ) pro k=1,,q (3.2.8) 0 pro k>q MA( q ) je ivertibilí, tj. MA( q ) lze ahradit AR( ), když pro kořey z 1,, z q Θ ( z) platí, že leží vě jedotkového kruhu v komplexí roviě. Odhad modelu Model idetifikujeme z odhadutého korelogramu a parciálího korelogramu. MA( q ) má u autokorelačí fukce bod usekutí k 0 =q a parciálí autokorelačí fukce je omezeá lieárí kombiací geometricky klesajících posloupostí a siusoid růzých frekvecí s geometricky klesající amplitudou. Pro lepší odhad bodu usekutí z odhadutého korelogramu, můžeme ámi vybraý bod otestovat pomocí Bartlettovy aproximace r k 2 1 k (1+ 0 r 2 j ) pro k>k 0. (3.2.9) j=1 Odhady parametrů θ 1,,θ q spočteme pomocí rekuretích vzorců z iovačího algoritmu [2] s proměými θ q,1,, θ q, q, kde θ 1 = θ q,1,, θ q = θ q, q, 28

v 0 =c 0 a k 1 θ q,q k = v 1 k (c q k θ θ v ) k, k i q, q i i q 1 v q =c 0 + θ 2 q, q i v i i=0 i =0,kde k=0,,q 1 (3.2.10) v q =σ ϵ 2 (3.2.11) 3.2.2. Autoregresí proces AR Autoregresí proces AR( p ) [1] má tvar ivertovaého lieárího procesu ε t =Y t ϕ 1 Y t 1... ϕ p Y t p =ϕ ( B)Y t (3.2.12) AR( p ) je vždy ivertibilí proces, tj. MA( q ) lze vždy ahradit AR ( ),a je stacioárí, když pro kořey z 1,, z q Φ (z) platí, že leží vě jedotkového kruhu v komplexí roviě. Za podmíky stacioarity má ulovou středí hodotou a jeho rozptyl zapíšeme ásledově σ ϵ 2 σ 2 Y = (1 φ 1 ρ 1 φ q ρ p ). (3.2.13) Kovariatí fukce vyjádříme tzv. YuleWalkerovými rovicemi [2] ρ k =ϕ 1 ρ k 1 +ϕ 2 ρ k 2 +...+ϕ p ρ k p prok=1,, p (3.2.14) Odhad modelu Autokorelačí fukce připomíá lieárí kombiaci geometricky klesajících posloupostí a siusoid růzých frekvecí s geometricky klesající amplitudou a parciálí autokorelačí fukce má pod usekutí k 0 = p, jež můžeme otestovat ásledově r kk 2 1 pro k>k 0 (3.2.15) Odhady parametrů φ 1,,φ p [2] můžeme získat z YuleWalkerových rovic dosazeím odhadů r k za ρ k a vyřešeím soustavy rovic. Odhad ρ rozptylu bílého šumu vypočteme jako řešeí rovice(3.2.13) 29

3.2.3. Smíšeý proces ARMA Smíšeý proces ARMA( p,q ) [1] vzikl spojeím předchozích dvou procesů Y t =ϕ 1 Y t 1 +...+ϕ p Y t p +ϵ t +θ 1 ϵ t p +...+θ q ϵ t q ϕ (B) =θ (B)ϵ t (3.2.16) Proces ARMA( p, q ) je stacioárí, když platí podmíka stacioarity pro AR( p ) a ARMA( p,q ) je ivertibilí, když platí podmíka ivertibility pro MA( q ). Pokud je ARMA( p,q ) stacioárí proces, tak má ulovou středí hodotu a korelačí fukci vyjádříme jako ρ k =ϕ 1 ρ k 1 +ϕ 2 ρ k 2 +..+ϕ p ρ k p pro k>q (3.2.17) Model AR( p ) je speciálím případem modelu ARMA ( p,q ), kde q=0, a model MA( q ) je také speciálí případem modelu ARMA( p, q ) pro p=0. Odhad procesu Autokorelačí fukce pro q p a parciálí autokorelačí fukce po p q hodotách jsou omezeé lieárí kombiaci geometricky klesajících posloupostí a siusoid růzých frekvecí s geometricky klesající amplitudou. Protože k procesu ARMA( p,q ) (3.2.16) existuje jeho ekoečá alterativa [2] Y t =ε t +ψ 1 ε t 1 +ψ 2 ε t 2 + (3.2.18),kde i=0 ψ j <, tak pro z 1 získáme rovici Ψ (z)= Θ ( z) Φ (z) (1 ϕ 1 z ϕ 2 z 2... ϕ p z p )(ψ 0 +ψ 1 z+ψ 2 z 2 +...)=(1+θ 1 z+θ 2 z 2... +θ q z q ) (3.2.19) Porováím koeficietů u moci z dostaeme ásledující rovice z 0 :ψ 0 =1 z 1 :ψ 1 =θ 1 +φ 1 z 2 :ψ 2 =θ 2 +φ 1 ψ 1 +φ 2 obecě zapsáo jako ψ 0 =1 mi( j, p) ψ j =θ j + φ i ψ j i i=1, kde j=1,2, (3.2.20), (3.2.21) kde θ j =0 pro j>q. Odhady iovačího algoritmu θ q,1,, θ q, q+ p 30

použijeme jako odhady ψ 1, ψ 1,,ψ p+q,. Po dosazeí získáme mi( j, p) θ q, j =θ j + φ i θ q, j i,kde j=1,2,, p+q (3.2.22) i=1 v q =σ 2. (3.2.23) Řešeím (3.2.22) soustavy rovic pro j=q+1,, p+q, kde θ j =0 dostaeme odhady φ 1,, φ p. Odhady θ 1,, θ q získáme z (3.2.22) mi( j, p) θ j = θ q, j φ i θ q, j i,kde j=1,2,,q. (3.2.24) i=1 3.3. Nestacioárí řady Nyí už víme, jak vytvořit model pro stacioárí řadu. Bohužel většiou se setkáváme s řadami estacioárími. Důvody esplěí stacioarity můžou být ásledující. Determiistický tred Časová řada obsahuje polyomický tred ebo periodickou složku, které musíme před stacioárím modelováí elimiovat. Stochastický tred Časová řada ukrývá stochastický tred, tj. jede ebo více kořeů lieárího procesu leží a jedotkové kružici (leží-li ějaké kořey vě jedotkové kružice, jedá se o estacioárí proces explozivího typu, který se od určitého t zače podobat řadě 2 t ). 31

3.4. Předpovědi Pro kostrukci použijeme fakt,že ŷ t + j (t)= + j pro j 0, ε t+ j = 0 pro j>0 ε t+ j = + j ŷ t+ j (t+ j 1) pro j 0 (3.4.1) a odhady počítáme postupě rekuretě ŷ q+1 (q), ŷ q+2 (q+1),. Z těchto odhadů spočítáme odhady ŷ q+2 (q), ŷ q+3 (q+1), a tak dále až do posledího pozorováí. Počátečí hodoty astavíme a ulu ε 1 = ε q =0. Výsledkem je řada vziklá z takového času,kde chyba MSE je ejižší. 32

4. Neuroové sítě Neuroové sítě představují edetermiistický výpočetí model ispirovaý chováím euroů v mozku. Základí jedotkou euroových sítí je euro [4]defiovaý jako y= f ( (w i, x i )+Θ ), (4.1) i=1 kde y je výstup eurou, x i jsou vstupí hodoty eurou, w i jsou jejich syaptické váhy, Θ je práh eurou a f je přeosová fukce. Jedou z ejčastěji používaých přeosových fukcí je sigmodiálí přeosová fukce[3] y j = f ( z j )= 1 1+e λ z j, kde z j = i=1 y i w ij (4.2) y i jsou vstupí hodoty eurou j a w ij jsou váhy spojů mezi i -tým a j -tým euroem. Tato fukce má v každém bodě prví derivaci, f (z j )=λ y j (1 y j ), (4.3) kterou budeme později potřebovat pro algoritmus zpětého šířeí. Orietovaým propojeím jedotlivých euroů, určeím vstupích a výstupích euroů a astaveím prahové fukce: euro R a váhové fukce: spoj R získáme euroovou síť[4]. Vrstevatou euroovou síť defiujeme jako euroovou síť s orietovaým acyklickým grafem spojů, kde euroy rozdělíme do m+2 disjuktích hladi euroů. Prví hladia se skládá z tzv. vstupích euroů, jejichž výstupí hodota se rová té vstupí. Následuje m vrstev skrytých euroů, které počítají fukci dle vztahu ( 4.1). Posledí vrstvu tvoří výstupí euroy. 33

Stejě jako člověk i euroová síť prochází procesem učeí, kdy jsou euroové síti předkládáa tréovací data, tj. vstupí hodoty a k im příslušé výstupí hodoty, a cílem je optimalizovat váhovou a prahovou fukci, tak aby chybová fukce byla miimálí a všech tréovacích datech. Chybovou fukci [4] zadefiujeme jako E= 1 2 ( y j, p d j, p ) 2, (4.4) p j kde p ozačuje vzory, j je počet výstupích euroů, y j, p výstupí hodota a d j, p je požadovaá výstupí hodota. Neuroové sítě se tradičě učí algoritmem zpětého šířeí [4]. Jeho postup je ásledující. Napřed zvolíme áhodě počátečí váhy. Vložíme tréovací data a aktualizujeme hodoty váhové a prahové fukce proti směru gradietu chybové fukce vyjádřeé jako fukce vah sítě. Fukce se postupě upravují od výstupí ke vstupí vrstvě euroů. Ozačme w ij (t) váhu spoje z i -tého do j -tého eurou v iteraci učí t, pak hodotu v iteraci t+1 vyjádříme jako w ij (t+1)=w ij (t)+δ E w ij (t) (4.5) kde Δ E w ij (t) je přírůstek váhy w ij (t) miimalizující chybovou fukci E. Pro výstupí vrstvu přírůstek váhy odhademe tímto způsobem Δ E w ij ϑ E = ϑ E ϑ y j ϑ z j = ϑ E ϑ w ϑ y i j y i j i ϑ w ij ϑ y j ϑ z j ϑ w ij ϑ y j ϑ z j ϑ w ij ϑ E f ( z ϑ y j ) y i = ( y j d j ) f (z j ) y i =δ j y i j (4.6) a pro skrytou vrstvu Δ E w ij ϑ E ϑ E ϑ z = ( k ) ϑ y j ϑ w ij k ϑ z k ϑ y j ϑ z j ϑ E ( w k ϑ z jk ) ϑ y j k ϑ z j kde (4.7) ϑ w j k y j ϑ E j y i = ( k ϑ z k ϑ y j y i = ( δ k w jk ) f ( z j ) y i =δ j y i k Pomocí (4.3) souhrě vzorce zapíšeme v podobě = ϑ E ϑ y j ϑ y j ϑ z j y i = ) ϑ y j ϑ z j y i = w ij (t+1)=w ij (t)+δ E w ij (t)=w ij (t)α δ j y i +α m (w ij (t) w ij (t 1)), (4.8) 34

δ j = (d y )λ y (1 y ) j j j j δ k w jk )λ y j (1 y j ) ( k pro výstupí euroy pro skryté euroy kde λ určuje strmost přeosové fukce, k je idex pro euroy z vrstvy ad euroem j, z j poteciál a δ j chyba eurou j, α je parametr (4.9) učeí a α m momet učeí. 4.1. Předpovědi Pro výpočet euroové sítě potřebujeme zvolit testovací data. U časových řad se obvykle volí okéko, jehož délka je rová počtu vstupích euroů. K tomuto vstupu potřebujeme i výstup, abychom mohli síť atréovat. Jako výstup ám poslouží hodota těsě za okékem, tj, počet výstupích euroů bude jede a vždy budeme kostuovat předpověď je o jede krok. Zvolíme si euroovou síť s jedou skrytou vrstvou a počet skrytých euroů se většiou volí polovia vstupích euroů. Na takto zvoleých datech euroovou síť atréujeme podle zadaého počtu iterací učeí (řádově ěkolik tisíc). Po aučeí postupě od začátku pomocí okéka odhadujeme hodotěsě za okékem. Budeme-li chtít delší předpověď, tak použijeme jako vstup vygeerovaé předpovědi z předchozích kroků. 35

5. Uživatelská dokumetace 5.1. Spuštěí Po spuštěí programu uživatel spatří formulář se záložkami. Na každé záložce je zobraze sezam řad, jejich grafické zázorěí. 5.2. Načteí řady Časovou řadu ačteme klikutím a položku Soubor v horím meu a ásledě zvolíme položku Otevřít. Nebo můžeme použít klávesovou zkratku Ctr+O. Nyí se ám objeví dialogové oko, v ěmž vybereme soubor, který chceme zobrazit. Program zpracovává pouze textové dokumety, tj. dokumety kočící přípoou.txt. Program ačte dva sloupce hodot odděleé tabulátorem. V prvím sloupci musí být je časové hodotvaru "d.m.yyyy", "h:m:s", "d.m.yyyy h:m:s"a ve druhém sloupci by měly být pouze číselé hodoty (s desetiou čárkou, e tečkou), v jiém případě program soubor eačte. Pro úspěšé ačteí řady uživatel potřebuje miimálě 10 hodot. 36

Po úspěšém ačteí souboru se zázamy chroologicky setřídí a yí můžeme pomocí formuláře Parametry ačítaé řady ačteá data upravit. V koloce Název řady uvedeme ámi vybraé pojmeováí, které bude reprezetovat ačteá data. Ve skupiě astaveí časové osy můžeme omezit ačteou řadu astaveím platých časových údajů do koloek Od a Do. Program potom vybere je pozorováí mezi těmito časy. Tyto koloky emusí být vyplěé. Abychom zajistili pravidelosti pozorováí, tak si ejdříve musíme zvolit časové jedotky pro ačítaou řaduvýběrem v pravé části skupiy Nastaveí časové osy. Výběr Lieárí iterpolace doplí chybějící pozorováí pomocí lieárí iterpolace a výběr Aritmetický průměr vypočítá aritmetický průměr ze všech pozorováí v ámi zvoleé časové jedotce. Jsou-li zvoleé obě možosti, tak se ejdříve provede aritmetický průměr a až potom lieárí iterpolace. Těmito výběry zajistíme pravidelá pozorováí. Takto upraveá řada se zobrazí v aktuálě zobrazeé záložce, odpovídá-li časová jedotka řady časové jedotce grafu a záložce, jiak se vytvoří ová záložka, kde bude řada zobrazea. 37

5.3. Editace záložek Klikutím pravým tlačítkem a ázev záložky vyvoláme kotextové meu. V meu máme a výběr ze tří položek Vložit, Přejmeovat a Smazat. Klikutím a položku Vložit vytvoříme po zadáí ázvu ovou záložku. Vybereme-li si Přejmeováí, tak vybraou záložku po zadáí ového ázvu přejmeujeme a výběrem Smazat tuto záložku smažeme. 5.4. Editace řad a výběr metody Klikutím pravým tlačítkem a ázev řady vyvoláme kotextové meu pro řady. Řadu můžeme smazat výběrem položky Smazat ebo po zadáí ového ázvu přejmeovat výběrem položky Přejmeovat. Klikutím a položku Uložit otevřeme dialogové oko pro uložeí řady. Výběrem položky Metody vyvoláme formuláře, ve kterých je možé modelovat vybraou řadu. 38

V prvím formuláři azvaém Základí úprava řady můžeme v položce Od odstrait počátečí hodoty řady pomocí vložeého data. Neí-li ic astaveo, řada začíá od prvího pozorováí. Poté v koloce Počet zatajeých pozorováí určíme počet pozorováí, které chceme zatajit, abychom ásledě mohli posoudit předpovědí schopost modelu a v koloce Počet predikovaých hodot astavíme počet hodot, které budeme predikovat. Klikutím a tlačítko Další zobrazíme druhý formulář s výběrem pomocých metod. Zaškrtutím volby Korelogram či Parciálí korelogram se v ovém okě zobrazí graf hodot korelačí fukce či parciálí korelačí fukce. Chceme-li a řadu aplikovat ějaký prediktiví model, tak stiskeme tlačítko Další a vyvoláme tak posledí formulář. V koloce Název ové řady zvolíme pojmeováí ové řady. Ve skupiě sezóost z řady můžeme odstrait aditiví sezóost. 39

Pokud ve Cyklická složka vybereme Odhad peridogramem, tak se z řady a základě maximálě 50 posledích pozorováí odstraí cyklická složka, která vzikla odhadem frekvecí pomocí Fisherova testu. Ve skupiě Modely vybereme model, který předpovídá tred. Potřebé další parametry k vybraému modelu se zobrazí ve skupiě Parametry. Při postupém odstraňováí sezóosti, cyklické složky a tredu se řady odčítají (používá se aditiví dekompozice). Nastaveí parametrů vyžadují tyto modely: Klouzavé průměry teto model potřebuje zát stupeň vyrovávajícího polyomu a délku aproximovaé poslouposti. Zvolíme-li sudou délku poslouposti, tak se automaticky počítají cetrovaé klouzavé průměry. Řád se obvykle volí malý a délka poslouposti by měla odpovídat sezóí ebo cyklické periodě. Expoeciálí vyrováí toto vyrováí potřebuje astavit hodotu alfa. Hodota alfa áleží itervalu (0,0.3]. Dvojité expoeciálí vyrováí vyžaduje astaveí hodoty alfa v itervalu (0,0.3] 40

ARIMA vyžaduje astaveí parametru d, p, q. Parametr d určuje stupeň diferecí, parametr p a q řády modelu, odhady kokrétího modelu se spočítají automaticky. Neuroové sítě ke správému fugováí euroových sítí, potřebujeme určit počet vstupích, počet euroů ve skryté vrstvě. Dále potřebujeme astavit maximálí počet iterací pro učeí. Z vybraé řady se postupě odčítají vymodelovaé řady a výsledá řada se zobrazí. V případě odstraěí všech systematických dekompozičích složek bato řada měla mít tvar bílého šumu. V opačém případě jsme zvolili špaté metody. Zaškrtutím ikoky Zobrazit řadu v každé skupiě zobrazíme jedu složku dekompozice rozšířeou o předpovědí hodoty vypočteou vybraou metodou. 41

6. Srováí euroových sítí s jiými metodami 1)Prvím pokusem bylo použití euroových sítí a řadu odpovídající lieárímu tredu. Na vstupí data jsem použili jak metodu lieárího tredu, tak metodu euroových sítí s parametry : počet vstupích euroů 10, počet skrytých euroů = 5 a maximálí počet iterací = 10000. 42

Zde proložeí i předpověď pomocí euroových sítí vypadá velmi slibě. Dle mého ázoru předpověď pomocí euroových sítí vypadá líp ež pomocí lieárího tredu. 2)Druhým pokusem bylo použití euroových sítí a řadu se sezóí a cyklickou složkou. Postupě jsem zkostruovali předpovědi pro sezóí složku, pak cyklickou a akoec jsem po odstraěí těchto složek řadu proložili lieárím tredem. Výsledé předpovědi jsme sečetli. Pro předpověď jsme také použili euroovou síť s parametry : počet vstupích euroů 10, počet skrytých euroů = 5 a maximálí počet iterací = 10000. 43

I tady si euroová síť evedla ejhůře, ale pro delší předpověď je rozhodě lepší předpověď provedeá dekompozicí a ásledou kompozicí. 3)Dalším příkladem bude použití euroových sítí a obecou řadu. Pro předpověď jsme také použili euroovou síť s parametry : počet vstupích euroů 10, počet skrytých euroů = 5 a maximálí počet iterací = 10000. 44

7. Závěr Vytvořeá aplikace zobrazuje časové řady a lze a í pomocí parametrů zvoleých v uživatelských formulářích postupě aplikovat výše zmíěé metody. Program používá ávrhový vzor model-view-preseter. A jeho kihoví část zvaá model je sado rozšířitelá o další metody. Hodě času zabralo porozuměí zadaé látky a její ásledé zalgoritmováí. Taktéž hledáí chyb ebylo úplě přímočaré a tak z časových důvodů se estihl implemetovat jedoduchý skriptovací jazyk. Nicméě program i bez ěj fuguje a jeho ásledá implemetace by ebyla obtížá. Docela mě překvapila velká schopost euroových sítí odhadout daou řadu. Nicméě daý typ eí v ěkterých případech ideálí pro delší předpovědi. V budoucu by bylo možé aplikaci ještě dále rozšířit a vylepšit. V této práci byly použity stochastické metody je a stacioárí řady. Existují růzé metody a postupy vyrovávající se s estacioárími daty a jiými problémy bráící vytvořeí kvalití předpovědi pomocí výše zmíěých metod. Další z možostí je implemetace metod z oblasti strojového učeí, jako apř. jié typy euroových sítí, regresí stromy a dalších. Také by bylo možé přidat podporu pro automatizovaé porováváí jedotlivých metod a ěkolika časových řadách, což by umožilo porovávat případé ově avržeé metody s metodami existujícími." 45

[1] Cipra,T.:Fiačí ekoometrie. Ekopress, Praha 2008 [2] https://is.mui.cz/el/1431/jaro2006/m0122/m0122.pdf [3] S. Hayki, Neural Networks: A Comprehesive Foudatio (2 d Editio). Pretice Hall, July 1998 [4] http://ksvi.mff.cui.cz/~mraz// 46