Prohlašuji, že jsem svou bakalářskou práci napsala samostatně a výhradně s použitím citovaných pramenů.



Podobné dokumenty
Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů

Úvod do analýzy časových řad

5 Časové řady. Definice 16 Posloupnost náhodných veličin {X t, t T } nazveme slabě stacionární, pokud

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

AVDAT Klasický lineární model, metoda nejmenších

Modely stacionárních časových řad

Učební texty k státní bakalářské zkoušce Matematika Vlastní čísla a vlastní hodnoty. študenti MFF 15. augusta 2008

Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice

příkladů do cvičení. V textu se objeví i pár detailů, které jsem nestihl (na které jsem zapomněl) a(b u) = (ab) u, u + ( u) = 0 = ( u) + u.

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

Maticí typu (m, n), kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru:

Cvičení 9 dekompozice časových řad a ARMA procesy

Definice. Vektorový prostor V nad tělesem T je množina s operacemi + : V V V, tj. u, v V : u + v V : T V V, tj. ( u V )( a T ) : a u V které splňují

MATEMATICKÁ STATISTIKA - XP01MST

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

10 Funkce více proměnných

Regresní analýza 1. Regresní analýza

NÁHODNÝ VEKTOR. 4. cvičení

Testování hypotéz o parametrech regresního modelu

Derivace funkcí více proměnných

Testování hypotéz o parametrech regresního modelu

PRAVDĚPODOBNOST A STATISTIKA

Stavový model a Kalmanův filtr

Učební texty k státní bakalářské zkoušce Matematika Diferenciální rovnice. študenti MFF 15. augusta 2008

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

1. Přednáška. Ing. Miroslav Šulai, MBA

Teorie informace a kódování (KMI/TIK) Reed-Mullerovy kódy

Statistika II. Jiří Neubauer

Náhodný vektor a jeho charakteristiky

Vektory a matice. Obsah. Aplikovaná matematika I. Carl Friedrich Gauss. Základní pojmy a operace

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

PRAVDĚPODOBNOST A STATISTIKA

Matematika. Kamila Hasilová. Matematika 1/34


Texty k přednáškám z MMAN3: 4. Funkce a zobrazení v euklidovských prostorech

KGG/STG Statistika pro geografy. Mgr. David Fiedor 4. května 2015

3 Lineární kombinace vektorů. Lineární závislost a nezávislost

STATISTIKA I Metodický list č. 1 Název tématického celku:

Necht tedy máme přirozená čísla n, k pod pojmem systém lineárních rovnic rozumíme rovnice ve tvaru

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Diferenciální rovnice a jejich aplikace. (Brkos 2011) Diferenciální rovnice a jejich aplikace 1 / 36

AVDAT Geometrie metody nejmenších čtverců

LDF MENDELU. Simona Fišnarová (MENDELU) LDR druhého řádu VMAT, IMT 1 / 22

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

I. D i s k r é t n í r o z d ě l e n í

19 Hilbertovy prostory

Základy teorie matic

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Úvodní informace. 17. února 2018

Věta 12.3 : Věta 12.4 (princip superpozice) : [MA1-18:P12.7] rovnice typu y (n) + p n 1 (x)y (n 1) p 1 (x)y + p 0 (x)y = q(x) (6)

Markovské metody pro modelování pravděpodobnosti

Aplikovaná numerická matematika

p(x) = P (X = x), x R,

Primitivní funkce a Riemann uv integrál Lineární algebra Taylor uv polynom Extrémy funkcí více prom ˇenných Matematika III Matematika III Program

MATICE. a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij]

Derivace funkce. Přednáška MATEMATIKA č Jiří Neubauer

Dnešní látka Variačně formulované okrajové úlohy zúplnění prostoru funkcí. Lineární zobrazení.

Základy teorie odhadu parametrů bodový odhad

Odhad parametrů N(µ, σ 2 )

1 Báze a dimenze vektorového prostoru 1

Měření závislosti statistických dat

(ne)závislost. α 1 x 1 + α 2 x α n x n. x + ( 1) x Vektoru y = ( 1) y říkáme opačný vektor k vektoru y. x x = 1. x = x = 0.

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Limita a spojitost funkce a zobrazení jedné reálné proměnné

Téma 22. Ondřej Nývlt

Modely pro nestacionární časové řady

11 Analýza hlavních komponet

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Modely pro nestacionární časové řady

prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Pravděpodobnost a statistika Katedra teoretické informatiky Fakulta informačních technologií

Definice 13.1 Kvadratická forma v n proměnných s koeficienty z tělesa T je výraz tvaru. Kvadratická forma v n proměnných je tak polynom n proměnných s

MKI Funkce f(z) má singularitu v bodě 0. a) Stanovte oblast, ve které konverguje hlavní část Laurentova rozvoje funkce f(z) v bodě 0.

VI. Maticový počet. VI.1. Základní operace s maticemi. Definice. Tabulku

Učební texty k státní bakalářské zkoušce Matematika Skalární součin. študenti MFF 15. augusta 2008

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Univerzita Karlova v Praze procesy II. Zuzana. funkce

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

NMAI059 Pravděpodobnost a statistika

Matematická analýza ve Vesmíru. Jiří Bouchala

a vlastních vektorů Příklad: Stanovte taková čísla λ, pro která má homogenní soustava Av = λv nenulové (A λ i I) v = 0.

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika vektory

Úlohy nejmenších čtverců

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

Odhady Parametrů Lineární Regrese

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

Přednáška 6, 6. listopadu 2013

Základy matematiky pro FEK

AVDAT Náhodný vektor, mnohorozměrné rozdělení

Generování pseudonáhodných. Ing. Michal Dorda, Ph.D.

Těleso racionálních funkcí

Drsná matematika III 6. přednáška Obyčejné diferenciální rovnice vyšších řádů, Eulerovo přibližné řešení a poznámky o odhadech chyb

21. Úvod do teorie parciálních diferenciálních rovnic

1. Obyčejné diferenciální rovnice

a způsoby jejího popisu Ing. Michael Rost, Ph.D.

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

METRICKÉ A NORMOVANÉ PROSTORY

Výběrové charakteristiky a jejich rozdělení

Regresní a korelační analýza

Transkript:

Masarykova Univerzita Přírodovědecká fakulta BAKALÁŘSKÁ PRÁCE Karolína Mladá Jednoduché strukturální modely časových řad Vedoucí práce: RNDr. Marie Forbelská, Ph.D. Studijní program: Aplikovaná matematika Studijní obor: Statistika a analýza dat 2010

Poděkování Děkuji paní RNDr. Marii Forbelské, Ph.D. za odborné vedení mé bakalářské práce, čas strávený na konzultacích a za nadhled nad danou problematikou, který mi celou dobu pomáhala udržet. Prohlašuji, že jsem svou bakalářskou práci napsala samostatně a výhradně s použitím citovaných pramenů. V Brně dne 4.6.2010 Karolína Mladá

Název práce: Jednoduché strukturální modely časových řad Autor: Karolína Mladá Ústav matematiky a statistiky Přírodovědecké fakulty MU Vedoucí bakalářské práce: RNDr. Marie Forbelská, Ph.D. Abstrakt: Tématem bakalářské práce jsou jednoduché strukturální modely časových řad. Práce je rozdělena do čtyř kapitol. První kapitola představuje teoretický základ obsahující pojmy a vztahy používané v dalších částech práce. Druhá kapitola popisuje jednotlivé typy přístupů k analýze časových řad. Třetí kapitola se zaměřuje na vysvětlení dynamického přístupu při modelování časových řad a způsobu jejich zápisu pomocí stavově- prostorových modelů. Ve čtvrté kapitole jsou uvedeny jednoduché strukturální modely časových řad, a to konkrétně modely trendu a sezónní složky. Klíčová slova: časové řady, stavově- prostorové modely, strukturální dynamické modely, trend, sezónnost Title: Simple structural time series models Author: Karolína Mladá Department of Mathematics and Statistics, Faculty of Science, MU Supervisor: RNDr. Marie Forbelská, Ph.D. Abstract: The theme of the bachelor thesis are the simple structural models of time series. The paper is divided into four chapters. The first one represents the theoretical basis and contains terminology and equations used in the following sections of the thesis. The second chapter describes various ways of analysing time series. The third chapter explains the dynamic way ofmodelingtimeseriesandhowtowritethemusingthestate-spacemodels. In the fourth chapter are introduced the simple structural models of time series, concretely models with trend and seasonal components. Keywords: time series, state- space models, structural dynamic models, trend, seasonal components

Obsah Úvod 2 1 Základní pojmy z teorie náhodných procesů 3 1.1 Definicenáhodnéhoprocesu............ 3 1.2 Stochasticképrocesydruhéhořádu........ 5 1.3 Procesynestacionárnívestředníhodnotě..... 10 2 Analýza časových řad 11 2.1 Časovéřady.......... 11 2.2 Základnípřístupykanalýzečasovýchřad..... 11 2.3 Klasickádekompozicečasovýchřad........ 12 3 Dynamické lineární modely 13 3.1 Motivačnípříklad... 13 3.2 Stavově-prostorovémodely............ 16 4 Jednoduché strukturální modely časových řad 17 4.1 Trend............. 17 4.2 Sezónnost........... 22 Závěr 24 Seznam použité literatury 25 1

Úvod Analýza časových řad je velmi důležitou disciplínou matematické statistiky. Tématem bakalářské práce jsou jednoduché strukturální modely časových řad. Práce je rozdělena do čtyř kapitol. První kapitola představuje teoretický základ obsahující pojmy a vztahy používané v dalších částech práce. Druhá kapitola popisuje jednotlivé typy přístupů k analýze časových řad. Třetí kapitola se zaměřuje na vysvětlení dynamického přístupu při modelování časových řad a způsobu jejich zápisu pomocí stavově- prostorových modelů. Ve čtvrté kapitole jsou uvedeny jednoduché strukturální modely časových řad, a to konkrétně modely trendu a sezónní složky. V prvních třech kapitolách jsem čerpala především ze skript Stochastické modelování jednorozměrných časových řad od RNDr.Forbelské Ph.D, jejích učebních materiálů k předmětu Lineární statistické modely a ze skript Základní statistické metody od RNDr.Budíkové, PhD. Ve čtrvté kapitole jsem vycházela především z druhé kapitoly anglické knihy od A.C.Harveyho Forecasting, structural series and the Kalman filter a knihy Dynamic Linear Models with R od G.Petris, S.Petrone a P.Campagnoli. 2

Kapitola 1 Základní pojmy z teorie náhodných procesů 1.1 Definice náhodného procesu Definice 1.1.1. Nechť je dán pravděpodobnostní prostor(ω, A, P), indexová množina T Rareálnáfunkce Y:Ω T Rdefinovanápro ω Ωa t T. Jestližepro t Tje Y(ω, t)borelovskyměřitelnáfunkcevzhledemka (tj.pro B B a t Tplatí Y 1 (B)={ω Ω:Y(ω, t) B} A, kde B je σ-algebra borelovských podmnožin), pak tuto funkci nazýváme(n- rozměrným) náhodným procesem. Náhodnýproces Y(ω, t)připevném ω Ωsenazývárealizace(trajektorie) procesu. Pravěpodobnostnímíru P Y (B)=P(Y 1 (B))nazývámerozdělenípravděpodobností náhodného procesu Y(ω, t). Poznámka.Obdobnějakounáhodnýchveličin,kdemísto Y(ω), ω Ωpíšeme pouze Y,unáhodnýchprocesůbudememísto {Y(ω, t), ω Ω, t T }psát {Y t, t T }. Definice1.1.2.Pokudindexovámnožina T= Z=0, ±1, ±2,...nebo T Z, mluvíme o procesu s diskrétním časem či o náhodné posloupnosti. 3

KAPITOLA 1. ZÁKLADNÍ POJMY Z TEORIE NÁHODNÝCH PROCESŮ Poznámka.Pozdějibudemeunáhodnéhoprocesu {Y t, t T }indexovou množinu Tinterpretovatjakočasapokud T= Z,budemetentoprocesnazývat pouze časovou řadou. Definice1.1.3.Pokudindexovámnožina T= t 1, t 2,kde t 1 t 2, říkáme,že Y t, t Tjenáhodnýprocessespojitýmčasem. Dvojice(S,S),kde Sjemnožinahodnotnáhodnýchveličin Y t as je σ-algebra podmnožin S,senazývástavovýprostorprocesu {Y t, t T }. Pokudnáhodnéveličiny Y t nabývajípouzediskrétníchhodnot,říkáme,žejde o proces s diskrétními stavy. Nabývají-li hodnot z nějakého intervalu, mluvíme o procesu se spojitými stavy. Definice1.1.4.Nechť T n jemnožinavšechvektorů T n =t=(t 1,...,t n ) : t 1 t 2 t n ; t i T; i=1,..., n. Pak(konečně dimenzionální) distribuční funkcí náhodného procesu rozumíme funkci F t (y)=f t1,...,t n (y 1,...,y n )=P(Y t1 y 1,...,Y tn y n ) = P Yt ((, y 1 >,...,(, y n >) pro t=(t 1,...,t n ) T n a y=(y 1,...,y n ) R n. 4

KAPITOLA 1. ZÁKLADNÍ POJMY Z TEORIE NÁHODNÝCH PROCESŮ 1.2 Stochastické procesy druhého řádu Definice 1.2.1. Jestliže pro t=(t 1,...,t n ) T n apro τ=(t 1 + h,...,t n + h) T n platí F t (y)=f t1,...,t n (y 1,...,y n )=F τ1,...,τ n (y 1,..., y n )=F τ (y), pakřekneme,ženáhodnýproces {Y t, t T }jestriktněstacionární. Rovnost lze interpretovat tak, že základní pravděpodobnostní charakteristiky procesuseneměnípřoposunutívčase. Definice 1.2.2.Existuje-lipro t T středníhodnota E(Y t ),paknazýváme funkci µ=e(y t )středníhodnotounáhodnéhoprocesu. Definice 1.2.3.Jestližepro t T platí E(Y 2 t) <,paknáhodnýproces {Y t, t T }nazývámeprocesemdruhéhořáduaříkáme,ženáhodnýproces má konečné druhé momenty. Definice1.2.4.Náhodnýproces {Y t, t T }nazývámestacionárnívestřední hodnotě,pokudpro t Tjestředníhodnotakonstantní,tj. E(Y t )=µ. Pokud E(Y t )=0,nazývámenáhodnýprocescentrovaným. Definice1.2.5.Uvažujemenáhodnýproces {Y t, t T },kterýmákonečnédruhé momenty. Pak funkci γ(s, t)=c(y s, Y t )=E(Y s E(Y s ))(Y t E(Y t )) nazveme autokovarianční funkcí. Poznámka. Tato reálná funkce dvou proměnných dává informaci o lineárním vztahumezijakoukolivdvojicínáhodnýchveličin Y s a Y t. Definice1.2.6.Náhodnýproces {Y t, t T }senazývákovariančně stacionární,pokudpro t, s Tplatí γ(s, t)=γ(0, s t ), cožbudemetaképsátveformě γ(s, t)=γ(s t),tj.autokovariančnífunkcezávisí na svých argumentech pouze prostřednictvím jejich rozdílů. 5

KAPITOLA 1. ZÁKLADNÍ POJMY Z TEORIE NÁHODNÝCH PROCESŮ Definice1.2.7.Náhodnýproces {Y t, t T }senazývá (slabě) stacionární, je-li kovariančně stacionární, tj. γ(s, t)=γ(s t) pro t, s T, a navíc stacionární ve střední hodnotě, tj. E(Y t )=µ pro t T. Poznámka. Přívlastek slabě se většinou vynechává. Lze snadno ukázat, že je-li proces striktně stacionární, je také stacionární. Opačná implikace však neplatí. Definice1.2.8.Nechťnáhodnýproces {Y t, t T }jestacionární.označme a zaveďme funkci γ(0)=σ 2 ϱ(t)= γ(t) σ 2 = γ(t) γ(0). Tuto funkci nazveme autokorelační funkcí stacionárního náhodného procesu. Nyní definujme náhodné procesy, které budou hrát důležitou roli v aplikacích. Definice 1.2.9.Řekneme,ženáhodnýproces {ε t, t T }jebílým šumem (WhiteNoise),jestliže ε t jsounekorelovanénáhodnéveličinysnulovoustřední hodnotou, tj. značíme E(ε t )=0, D(ε t )=σ 2, C(ε t, ε s )=0 (s t), ε t WN(0, σ 2 ). Pokud jsou navíc nejen nekorelované, ale i nezávislé, značíme je symbolem IID (independent identical defined), píšeme ε t IID(0, σ 2 ). Poznámka. Bílý šum je nejjednodušší specifikace náhodné fluktuace. Je to posloupnost náhodných nekorelovaných proměnných s konstantní střední hodnotou (v tomto případě 0) a konstantním rozptylem. 6

KAPITOLA 1. ZÁKLADNÍ POJMY Z TEORIE NÁHODNÝCH PROCESŮ Věta1.1.Náhodnéprocesy ε t WN(0, σ 2 )aε t IID(0, σ 2 )jsoustacionárními náhodnými procesy Důkaz. Zřejmý. Definice1.2.10.Náhodnýproces {Y t, t T }senazývágaussovským(normálním),jestližeprokaždépřirozené nalibovolnáčísla t j T, j=1,...,n,je jeho n-rozměrnádistribučnífunkce F t1,...,t n (y 1,...,x n )distribučnífunkcí n-rozměrného normálního rozdělení. Věta 1.2.Gaussůvnáhodnýproces {Y t, t T }jestacionární,právěkdyžje striktně stacionární. Důkaz. Triviální, plyne z vlastností normálního rozdělení. Definice 1.2.11.Řekneme, ženáhodnýproces {Y t, t T }splňujelineární regresní model, pokud pro jeho střední hodnotu platí t T: E(Y t )=µ t = m β j f j (t), j=0 kde f 0,...,f m jsouznáméfunkcedefinovanénat, β=(β 0,...,β n ) jeneznámývektorregresníchparametrů. Pro lepší představu o lineárním regresním modelu předpokládejme, že mezi nějakýminenáhodnýmiveličinami y, x 1,...,x k platílineárnívztah y= β 1 x 1 +...+β k x k, vekterémjsou β 1,...,β k neznámýmiparametry. Informace o těchto parametrech můžeme získávat pomocí experimentu, a to tak, že budeme opakovaně měřit hodnoty veličin y při vybraných hodnotách proměnných x 1,..., x k. Při měření však vznikají chyby, což lze modelovat takto Y= β 1 x 1 +...+β k x k + ε t, kde ε t jenáhodnáchybaměření. Opakovanéhodnotysledovanýchveličinsepro i=1,..., nznačí Y i, x i1,...,x ik. Celkově jsme tedy dostali model Y 1 = β 1 x 11 +...+β k x 1k + ε 1. Y n = β 1 x n1 +...+β k x nk + ε n 7

KAPITOLA 1. ZÁKLADNÍ POJMY Z TEORIE NÁHODNÝCH PROCESŮ vyjádřený maticově jako Y 1. Y n Y x 11... x 1k β 1 ε 1 =... +. x n1... x nk β k ε n X(matice plánu) β ε Klasickým konkrétním příkladem lineárního modelu je jednoduchá lineární regrese,kdepředpokládáme,ženezávislénáhodnéveličiny Y i pro(i=1,...,n) mají normální rozdělení Y i N(µ i = β 0 + β 1 x i, σ 2 ), kde x i jsoudanékonstanty,kterénejsouvšechnystejné. Rozptyly Y i jsoustejné,zatímcostředníhodnotylzevyjádřitjakolineárnífunkci známýchkonstant x i pomocíneznámýchparametrů β 0 a β 1. V tomto případě zapíšeme vektor závisle proměnných ve tvaru Y =. 1 x 1 matici plánu X =.., vektor regresních koeficientů β = 1 x n ε 1 avektorchyb ε=., přičemž ε N n (0, σ 2 I n ). ε n Definice1.2.12.Nechť {Y t, t Z}jeposloupnostnáhodnýchveličin. Operátor zpětného posunutí(backshift operator) je definován pomocí výrazu BY t = Y t 1, přičemž jej lze aplikovat několikanásobně jako Y 1 Y n ( β0 β 1, ) B j Y t = Y t j 8

KAPITOLA 1. ZÁKLADNÍ POJMY Z TEORIE NÁHODNÝCH PROCESŮ Tzv. diferenční operátor zavádíme pomocí vztahu: Y t = Y t Y t 1 =(1 B)Y t 2 Y t = ( Y t )= (Y t Y t 1 ). =(Y t Y t 1 ) (Y t 1 Y t 2 ) = Y t 2Y t 1 + Y t 2 =(1 B) 2 Y t d Y t =(1 B) d Y t. Definice 1.2.13. Definujme ARMA proces řádu p,q vztahem Y t ϕ 1 Y t 1... ϕ p Y t p = ε t + θ 1 ε t 1 +...+θ q ε t q, kde ε t WN(0, σ 2 ), přičemž pomocí operátoru zpětného chodu lze psát Y t ARMA(p, q):φ(b)y t =Θ(B)ε t, kde φ(b)=1 ϕ 1 B... ϕ p B p (ϕ 0 1) a Θ(B)=1+θ 1 B+...+θ q B q (θ 0 1). Řekneme,že {Y t, t Z}jeARMA(p,q)sestředníhodnotou µ,jestliže {Y t µ} je ARMA(p,q) proces. Speciální případy ARMA procesů nazýváme: Autoregresnímodel(ARproces): Y t AR(p) ARMA(p,0), tj. q=0 Procesklouzavýchsoučtů(MAproces): Y t MA(q) ARMA(0, q),tj. p=0 V reálných situacích se však se stacionárními procesy setkáváme pouze zřídka. Obecně rozlišujeme dva druhy nestacionarity: nestacionaritu ve střední hodnotě a nestacionaritu v rozptylu. Z důvodu dalších aplikací se nyní budeme věnovat pouze případu nestacionarity ve střední hodnotě. 9

KAPITOLA 1. ZÁKLADNÍ POJMY Z TEORIE NÁHODNÝCH PROCESŮ 1.3 Procesy nestacionární ve střední hodnotě Nyní je třeba vysvětlit a odlišit pojmy: Deterministický trend, tj. případ, kdy nestacionaritu ve střední hodnotě chápeme jako funkci času. K jeho modelování použijeme například polynomickýtrend E(Y t )=f(t)=β 0 + β 1 t+...+β d t d, případně periodickýtrend E(Y t )=f(t)=µ+ p (α j cosλ j t+β j sin λ j t) Stochastický trend: U ARMA procesů požadujeme, aby všechny kořeny polynomu j=1 φ(z)=1 ϕ 1 z... ϕ p z p ležely vně jednotkové kružnice, tj. aby proces byl kauzální. Pokud však nějaký kořen leží na jednotkové kružnici, mluvíme o procesu nestacionárním se stochastickým trendem. V případě, že kořen leží uvnitř jednotkové kružnice, mluvíme o procesu nestacionárním explozivního typu. Nestacionární proces se stochastickým trendem nazýváme integrovaným smíšeným modelem a značíme ARIMA(p,d,q) Formálně jej zapíšeme pomocí operátoru zpětného chodu takto: a položíme-li ARIMA(p, d, q):φ(b)(1 B) d Y t =Θ(B)ε t W t =(1 B) d Y t, pak W t jestacionárníarma(p,q). Poznámka. Velice důležitým ARIMA modelem je náhodná procházka kterou značíme také I(1). Y t = Y t 1 + ε t, 10

Kapitola 2 Analýza časových řad 2.1 Časové řady Pod pojmem časová řada rozumíme realizaci(konečné délky) náhodné posloupnosti.jdeon-ticihodnot y t1,...,y tn uspořádanoupodlepřirozené časovéposloupnosti t 1,...,t n. Od této chvíle budeme uvažovat pouze případy, kdy jsou časové intervaly mezi pozorováními (t 1, t 2 ),...,(t n 1, t n ) stejnědlouhé(tj.jsouekvidistantní)azápiszjednodušímena y 1,...,y n. Máme-li k dispozici hodnoty určitého ukazatele za více období ve formě časové řady, je nám umožněno rozpoznat určité zákonitosti ve vývoji tohoto ukazatele. Časové řady vznikají v přírodních vědách nebo technice(např.seismický záznam v geofyzice, údaje o průměrných ročních teplotách v klimatologii), v bilogických vědách(četnosti výskytu určitého škůdce v několika po sobě jdoucích letech, v ekonomii(vývoj směnného kurzu) atd. 2.2 Základní přístupy k analýze časových řad V analýze časových řad se nejčastěji setkáváme s těmito základními přístupy: Klasická dekompozice časových řad, která je založena na regresní analýze Neoklasická dekompozice časových řad(tzv. Box-Jenkinsonova metodologie), jejímž základem je korelační analýze Spektrální analýza časových řad založená na Fourierově analýze 11

KAPITOLA 2. ANALÝZA ČASOVÝCH ŘAD Dynamickélineárnímodely-vpraxisečastosetkávámestím,žehodnoty určité časové řady nejsou jen funkcí času, či předchozích pozorování, ale jsou vysvětlovány pomocí dalších časových řad, kterým říkáme faktorové časové řady a mluvíme o tzv. příčinných(kauzálních, faktorových) modelech, které jsou konstruovány na základě teoretických předpokladů. 2.3 Klasická dekompozice časových řad Klasická dekompozice časových řad vychází z předpokladu, že náhodný proces, který časovou řadu generuje, je závislý pouze na čase. Samotnou dekompozicí časové řady pak rozumíme rozklad časové řady na deterministickou a náhodnou složku. Deterministickásložkasedálerozkládánatrend(Tr t )asezónnísložku(sz t ). Náhodnousložkupředstavujínáhodnéfluktuace(ε t ),kterémodelujídrobné a v jednotlivostech nepostižitelné příčiny kolísání časových řad. Proces ε t jebílýšumsnulovoustředníhodnotou. Při klasické dekompozici časových řad se používají především tyto modely: Aditivní modely, které lze zapsat rovnicí a multiplikativní modely ve tvaru Y t = Tr t + Sz t + ε t, Y t = Tr t Sz t ε t, které se transformují logaritmováním na aditivní modely. Klíčovým nástrojem klasické dekompozice časových řad je regresní analýza, která využívá regresních modelů. Neznámé parametry v těchto modelech bývají odhadovány pomocí metody nejmenších čtverců. 12

Kapitola 3 Dynamické lineární modely Dynamické lineární modely jsou narozdíl od klasické dekompozice časových řad založeny na myšlence, že hodnoty určité časové řady nejsou jen funkcí času či předchozích pozorování, ale jsou ovlivňovány i dalšími faktory. 3.1 Motivační příklad K lepší představě o myšlence dynamických lineárních modelů nám může posloužit jednoduchý ilustrační příklad. Představmesi,žejsmeseocitlinaostrověasnažímeseodhadnoutnaší vzdálenost od pobřeží. Tuto vzdálenost budeme značit x a je pro nás tedy neznámým stavem. Nejprve předpokládejme, že během tohoto odhadování stojíme stále na stejném místě, což znamená, že x je konstatní. Hrubou představu o naší pozici máme, neboť čas od času máme možnost zahlédnout pobřeží skrze stromy. O naší vzdálenosti od pobřeží se však chceme dozvědět víc, proto provádíme průběžná měření. Tatoměřeníoznačíme Y t abudemejemodelovattakto: Y t = x+ε t, ε t N(0, σ 2 ), t=0,1,2,..., n kde ε t a xjsounezávisláaprojednoduchost σ 2 jeznámákonstanta. 13

KAPITOLA 3. DYNAMICKÉ LINEÁRNÍ MODELY Měření Y t jsounezávisláamajístejnénormálnírozdělenípravděpodobností, tedy Y i N(x, σ 2 ), kde t=0,1,..., n 1.Pomocíhvězdodhadnemevčase0našipozicijako Y 0 surčitou nepřesností C 0. Na základě dosavadních znalostí známe hustotu pozice x, kterou označíme p 1 0 (x)=p(x Y 0 ),sestředníhodnotou x 1 0 = Y 0 arozptylem σ 2 1 0 = C 0, tedy x N(Y 0, C 0 ). 2. Mraky se rozestoupí a jasněji vidíme hvězdy. Proto upřesníme náš odhad jako Y 1 světšíjistotou C 1 < C 0. Na základě širších znalostí dostáváme novou hustotu pozice x jako p 1 1 (x)=p(x Y 0, Y 1 ) sestředníhodnotou x 1 1 arozptylem σ 2 1 1. Tutostředníhodnotuvypočtemejakováženýprůměrpozorování Y 0 a Y 1, kdeváhajeotovětší,očjepozorovánípřesnější,tj.mámenšírozptyl (přitomsoučetvahjeroven1) x 1 1 = 1 C 0 1 C 0 + 1 Y 0 + 1 C 1 1 C 1 C 1 C 0 + 1 Y 1 = C 1 C 0 + C } {{ 1} =(1 K) Y 0 + C 0 C 0 + C 1 =K Y 1 =(1 K)Y 0 +KY 1 Pozorování Y 0 a Y 1 jsounezávislá,protorozptylváženéhoprůměrujeroven ( ) 2 ( ) 2 σ 1 1 2 = C1 C0 C 0 C 0 + C 1 = C 1 = KC 1 =(1 K)C 0 C 0 + C 1 C 0 + C 1 C 0 + C 1 tj. σ 2 1 1 < C 1 Celkově tedy dostaneme tyto rekurentní vztahy: x 1 1 = x 1 0 + K(Y 1 x 1 0 ) a σ2 1 1 =(1 K) σ 2 1 0 Tedy x 1 1 jsmezískalijakonejlepšíodhadvčase0, x 1 0,opravený předpovědníchybou(y 1 x 1 0 )aváženýfaktorem K= C 0 C 0 +C 1. Využili jsme tedy informace z prvního i druhého měření. 14

KAPITOLA 3. DYNAMICKÉ LINEÁRNÍ MODELY 3. Nyní náš příklad zdynamizujeme(rozpohybujeme). Představmesi,ževčase2sezačnemepohybovat, tzn.vzdálenost x už není konstantní, ale mění se v čase. Tutozměnumezidvěmaměřenímimůžememodelovatjako 1 : x t = x t 1 + ν+ w t, kde w t N(0, σ 2 w), (3.1) akde νjeznámárychlostnašehopohybuaw t náhodnáchyba sestředníhodnotou0aznámounepřesností σ 2 w. Před tím, než provedeme další měření(v čase 2), uděláme predikci x 2 1 = F 1 x 1 1 nazákladěinformací,kterézatímznáme, tzn.nazákladěpředchozíhostavu x 1 1 adynamickéhomodelu (nějakéfunkcepřechodu F 1 )surčitoudávkounepřesnosti σ 2 2 1. Nyníprovedemedalšíměřenípolohy,tj. Y 2 snepřesností C 2. 4. Všechny předchozí informace shrneme do odhadu polohy x 2 2 = x 2 1 +K(Y 2 x 2 1 ) svahou K= σ 2 2 1 σ 2 2 1 + C 2 (též tzv. Kalmanův zisk) σ 2 2 2 =(1 K) σ 2 2 1 1 Krovnici(3.1)můžemedojítzjednoduchéhodynamickéhomodelu dx dt = }{{} ν + }{{} w konstantnní posun náhodná složka resp.rovnice x ti = x ti 1 + ν(t i t i 1 )+w ti (t i t i 1 ), kdeberemejednotkovéčasovéintervaly,tzn.(t i t i 1 )=1 15

KAPITOLA 3. DYNAMICKÉ LINEÁRNÍ MODELY 3.2 Stavově- prostorové modely Stavově- prostorové modely jsou způsobem, jak pohodlně sestavit formální zápis lineárních dynamických modelů. Místojednorozměrnénáhodnéposloupnosti {Y t, t Z}uvažujmeposloupnost w-rozměrnýchnáhodnýchvektorů {Y t, t Z},Y t R w,kterésplňují tzv. datové a stavové rovnice: Datová rovnice popisuje vztah mezi(nepozorovatelnými) stavovými veličinamivektorux t anaměřenými(pozorovatelnými)veličinamivektoruy t ; je určena zápisem: Y t =G t X t +W t kde t=1,2,3,... Stavová rovnice popisuje vývoj stavu procesu popsaného v časovém okamžiku tvektoremstavovýchproměnnýchx t tak,žejedefinovánasouvislost mezistavovýmvektoremvokamžiku tavnásledujícímokamžiku t+1,tj. X t+1 =F t X t +V t+1 kde t=1,2,3,..., X t jetzv.stavový v-rozměrnýnáhodnývektor, W t ješumměření(w-rozměrnýnáhodnývektorchyb), V t+1 ješumprocesu(v-rozměrnýnáhodnývektorchyb), G t jeposloupnostmatictypu w v(popisujívztahpozorováníkestavu) af t jeposloupnostmatictypu v v(tzn.maticpřechodumodelujících dynamiku) Předpokládejme, že všechny náhodné vektory mají konečné druhé momenty aplatí E(V t )=0 E(W t )=0 D ( Wt V t E(W t W t)=r t ) ( ) Rt S = t, tj. E(V t V t )=Q t S t Q t E(W t V t )=S t a C(X t,(w t,v t ) )=0,(tj.stavovývektorachybovévektoryjsou nekorelované). 16

Kapitola 4 Jednoduché strukturální modely časových řad Strukturálními modely časových řad budeme rozumět takové modely, které jednoduchým rekurentním způsobem popisují stochastické chování časových řad. Dále se budeme věnovat elementárním modelům, které dovolují modelovat trend a sezónnost. 4.1 Trend Trend v časové řadě představuje dlouhodobou tendenci vývoje zkoumaného jevu. Je výsledkem dlouhodobého působení vnějších faktorů a podmínek. Nejjednodušší strukturální modely časových řad se skládají právě z trendu a náhodné fluktuace. Trendové modely zapisujeme ve tvaru: Y t = Tr t + ε t t=1,...,t kdesložky Tr t a ε t jsouoběstochastické, Tr t představujetrendaε t bílýšum. Přitom předpokládáme, že obě složky jsou stochasticky nezávislé. Všimněme si postupně jednotlivých typů trendu, resp. trendových funkcí. a) KONSTANTNÍ TREND Nejjednodušším modelem trendu je Tr t = α. 17

KAPITOLA 4. JEDNODUCHÉ STRUKTURÁLNÍ MODELY ČASOVÝCH ŘAD Vtomtopřípaděplatí Tr t+1 = α=tr t. Pokud chceme, aby se parametry měnily v čase, přidáme náhodnou chybu η t,kterájebílýmšumemsnulovouhodnotouarozptylem σ 2 η,tj. η t WN(0, σ 2 η ) a dostaneme tzv. model s lokálním konstantním trendem(anglicky local level model). Tr t+1 = Tr t + η t+1. Model můžeme přepsat do datových a stavových rovnic takto: Datová rovnice Y t = Tr }{{} t + ε t, tj. G }{{} t =1 X t W t Stavová rovnice Tr } {{ t+1 = Tr } t + η }{{} t+1 tj.také F }{{} t =1 X t+1 X t V t b) LINEÁRNÍ TREND Pokud nevystačíme s konstantním lokálním trendem a přidáme další složku, pak Tr t = α+βt. V tomto případě Tr t+1 = α+β(t+1)=α+βt+β= Tr t + β Tr t Vidíme tedy, že nepotřebujeme znát hodnotu parametru α. Pokudbudemeopětchtít,abyseiparametr βmohlměnitvčase,budeme uvažovatmodelsnáhodnýmifluktuacemi η t a ξ t,kteréjsoubílýmišumy snulovoustředníhodnotouarozptylem σ 2 η a σ2 ξ, tj. platí η t WN(0, σ 2 η ) ξ t WN(0, σ 2 ξ ), 18

KAPITOLA 4. JEDNODUCHÉ STRUKTURÁLNÍ MODELY ČASOVÝCH ŘAD a dostaneme modely Tr t+1 = Tr t + β t + η t+1 β t+1 = β t + ξ t+1 kde t=..., 1,0,1,.... Fluktuace η t dovolujehladinětrendupohybovatsenahoruadolů, zatímcofluktuace ξ t dovolujezměnuparametru β. Čím větší jsou rozptyly těchto fluktuací, tím větší jsou stochastické pohyby v trendu. Všimněmesi,že β t jenáhodnouprocházkou,tj.modelem I(1). Celkový model můžeme opět vyjádřit pomocí stavově- prostorových modelů, tzn. pomocí stavových a datových rovnic, a to takto Datová rovnice Y t = ( 1 0 ) ( ) ( ) Trt εt + G t=g β t X t 0 W t Stavová rovnice ( ) Trt+1 = β t+1 X t+1 ( ) ( ) 1 1 Trt 0 1 β t F t=f X t ( ) ηt+1 + ξ t+1 V t c) CYKLICKÝ TREND v časové řadě vyjadřuje dlouhodobé kolísání okolo trendu, ve kterém se střídají fáze růstu a poklesu. V posledních letech se věnuje pozornost zejména technologickým, inovačním či demografickým cyklům. Cyklický trend předpokládá, že Tr t = ψ t, kde ψ t jecyklickásložkasfrekvencí λ c,kteroulzevyjádřitdvojímzpůsobem. Zápisem pomocí funkce kosinus: ψ t = Acos(λ c t θ), kde t=1,...,t 19

KAPITOLA 4. JEDNODUCHÉ STRUKTURÁLNÍ MODELY ČASOVÝCH ŘAD nebo jako kombinaci funkcí sinus a kosinus: ψ t = αcosλ c t+βsin λ c t, kde t=1,...,t, přičemž A= α 2 + β 2 jeamplituda a θ=arctan β α je fáze. Abychom dostali rekurentní vztah jako u lineárního trendu, uvažujme nejprve ψ t = αcosλ c t+βsin λ c t. Pak ψ t+1 = αcosλ c (t+1)+βsin λ c (t+1)= = α[cosλ c tcosλ c sin λ c tsin λ c ]+β[sin λ c tcosλ c +cosλ c tsin λ c ]= =cosλ c [αcosλ c t+βsin λ c t] +sin λ c [ αsin λ c t+βcosλ c t] ψ t ψ Při značení počítejme dále ψ t= αsin λ c t+βcos λ c t ψ t+1 = αsin λ c(t+1)+βcosλ c (t+1)= = α[sin λ c tcosλ c +cosλ c tsin λ c ]+β[cosλ c tcosλ c sin λ c tsin λ c ]= =cosλ c [ αsin λ c t+βcosλ c t] sin λ c [αcosλ c t+βsin λ c t]. Takže můžeme psát ψ t+1 =cosλ c ψ t +sin λ c ψ t ψ t+1 = sin λ cψ t +cos λ cψ t, což lze vyjádřit maticově takto: ( ) ( ) ( ) ψt+1 cos λc sin λ = c ψt sin λ c cosλ c ψ t+1 ψ t 20

KAPITOLA 4. JEDNODUCHÉ STRUKTURÁLNÍ MODELY ČASOVÝCH ŘAD Nynípředchozívztahydoplnímeonáhodnéfluktuace κ t a κ t,kteréjsou nezávislé bílé šumy, tj. κ t WN(0, σ 2 κ) Dostaneme tedy datovou rovnici κ t WN(0, σ2 κ ). Y t = ( 1 0 ) G t=g ( ψt ψ t ) X t a stavovou rovnici ( ) ( ) ψt+1 cos λc sin λ ψt+1 = c sin λ c cosλ c X t+1 F t + ε t }{{} W t ( ψt ψ t X t ) + ( κt+1 κ t+1 ) V t kde funkce označené hvězdičkami jsou pouze pomocné, umožňující rekurzivní přepis. 21

KAPITOLA 4. JEDNODUCHÉ STRUKTURÁLNÍ MODELY ČASOVÝCH ŘAD 4.2 Sezónnost Sezónnísložka Sz t popisujevlineárníchmodelechkrátkodobéperiodickézměny, tj. pravidelné kolísání okolo trendu v rámci kalendářního roku, které je kratšího rázu, např. vliv střídání ročních období, svátků, dovolených apod. Nejprve uvažujme jednoduchý sezónní model se šumem. Předpokládejme, že délka sezóny je s. Sezónníkomponenty(výkyvy)označme γ 1, γ 2,..., γ s apředpokládejme,žepro ně platí vztahy γ t+s = γ t, tj.vlivvýkyvusepouplynutícelésezónyneliší,a γ 1 +...+γ s =0, tj. celkový vliv výkyvů za sezónu je nulový. Odtud dostaneme jednoduché vztahy γ t+1 = γ t+1 s γ t+1 + γ t +...+γ t+1 s+1 =0, tj. γ t+1 = γ t γ t 1... γ t+2 s Doplníme-lipředchozívztahonáhodnéfluktuace ω t,kteréjsoubílýmšumem,tj. dostaneme neboli obecně amaticově γ t+1 γ t γ t 1. γ t+2 s ω t WN(0, δ 2 ω ), γ t+1 = γ t γ t 1... γ t+2 s + ω t+1, s 1 γ t = γ t j + ω t j=1 1 1... 1 0 1 0... 0 0 = 0 1............ 0 0 0... 0 1 0 γ t γ t 1 γ t 2. γ t+1 s + ω t+1 0.. 0 22

KAPITOLA 4. JEDNODUCHÉ STRUKTURÁLNÍ MODELY ČASOVÝCH ŘAD Abychom sezónní složky mohli zakomponovat do modelu časové řady Y t = Sz t + ε t, zavedemepomocnéproměnné z jt definovanépro j=1,...,s 1následujícím způsobem: 1, t=j, j+ s, j+2s,... z jt = 0, t j, j+ s, j+2s,... 1, t=s,2s,3s,... Pak Sz t = j γ j z jt. Zápis sezónnosti pomocí stavově- prostorových modelů bude vypadat takto: Datová rovnice Stavová rovnice Y t = ( ) z tt z t 1,t z t 2,t... z t+1 s,t G t γ t+1 γ t γ t 1. γ t+2 s X t+1 1 1... 1 0 1 0... 0 0 = 0 1............ 0 0 0... 0 1 0 F t γ t γ t 1 γ t 2. γ t+1 s X t γ t γ t 1 γ t 2. γ t+1 s X t + ε t }{{} W t + ω t+1 0.. 0 V t+1 23

Závěr Jedním ze způsobů analýzy časových řad je klasická dekompozice založená na regresní analýze. Při tomto přístupu je konstruován model pro všechna data a jeho parametry se nemění. Regresní modely jsou výhodné především z hlediska interpretace, předpokládají však vzájemnou nekorelovanost(nezávislost) dat z minulosti. Tento předpoklad časové řady nesplňují, proto byla snaha najít lepší způsob, který by se vypořádal i s daty, která se navzájem ovlivňují. Tímto způsobem je Box-Jenkinsova metodologie, která celou časovou řadu považuje za řadu stochastického charakteru. Avšak z hlediska interpretace a vyhodnocování je Box-Jenkinsova metoda černou skřínkou, neboť současná hodnota je lineární kombinací předchozích hodnot a lineární kombinací náhodných fluktuací. Strukturální přístup k analýze časových řad navržený A.C.Harveyem(1990) je jistou kombinací dvou předešlých metod. Využívá předchozích dat a jejich vzájemné závislosti, pracuje však pouze s informací, kterou jsou získali o jeden krok dříve. Díky tomuto postupu jsou strukturální dynamické modely při výpočtech méně náročné na paměť, objevuje se v nich méně parametrů a parametry, které se v nich používají, jsou lépe interpretovatelné, než tomu je v Box-Jenkinsově metodě. Navíc se parametry mohou měnit v čase, čímž jsou modely více flexibilní. V bakalářské práci jsou popsány nejjednodušší strukturální dynamické modely časových řad a jsou zapsány pomocí stavově-prostorových modelů. Tyto jednoduché strukturální modely jsou základními kameny dynamického přístupu kanalýzečasovýchřadamohousedálrůzněkombinovatavytvářettakmodely složitější. 24

Seznam použité literatury [1] Budíková M., Lerch T., Mikoláš Š. Základní statistické metody, Brno 2006 [2] Forbelská, M. Stochastické modelování jednorozměrných časových řad, Brno 2009 [3] Forbelská M. učební materiály k předmětu Lineární statistické modely, M5120 [4] Harvey, A.C. Forecasting, structural series models and the Kalman filter, Cambridge 1990 [5] Petris, G., Petrone, S., Campagnoli, P. Dynamic Linear Models with R, Springer 2009 25