Masarykova Univerzita Přírodovědecká fakulta BAKALÁŘSKÁ PRÁCE Karolína Mladá Jednoduché strukturální modely časových řad Vedoucí práce: RNDr. Marie Forbelská, Ph.D. Studijní program: Aplikovaná matematika Studijní obor: Statistika a analýza dat 2010
Poděkování Děkuji paní RNDr. Marii Forbelské, Ph.D. za odborné vedení mé bakalářské práce, čas strávený na konzultacích a za nadhled nad danou problematikou, který mi celou dobu pomáhala udržet. Prohlašuji, že jsem svou bakalářskou práci napsala samostatně a výhradně s použitím citovaných pramenů. V Brně dne 4.6.2010 Karolína Mladá
Název práce: Jednoduché strukturální modely časových řad Autor: Karolína Mladá Ústav matematiky a statistiky Přírodovědecké fakulty MU Vedoucí bakalářské práce: RNDr. Marie Forbelská, Ph.D. Abstrakt: Tématem bakalářské práce jsou jednoduché strukturální modely časových řad. Práce je rozdělena do čtyř kapitol. První kapitola představuje teoretický základ obsahující pojmy a vztahy používané v dalších částech práce. Druhá kapitola popisuje jednotlivé typy přístupů k analýze časových řad. Třetí kapitola se zaměřuje na vysvětlení dynamického přístupu při modelování časových řad a způsobu jejich zápisu pomocí stavově- prostorových modelů. Ve čtvrté kapitole jsou uvedeny jednoduché strukturální modely časových řad, a to konkrétně modely trendu a sezónní složky. Klíčová slova: časové řady, stavově- prostorové modely, strukturální dynamické modely, trend, sezónnost Title: Simple structural time series models Author: Karolína Mladá Department of Mathematics and Statistics, Faculty of Science, MU Supervisor: RNDr. Marie Forbelská, Ph.D. Abstract: The theme of the bachelor thesis are the simple structural models of time series. The paper is divided into four chapters. The first one represents the theoretical basis and contains terminology and equations used in the following sections of the thesis. The second chapter describes various ways of analysing time series. The third chapter explains the dynamic way ofmodelingtimeseriesandhowtowritethemusingthestate-spacemodels. In the fourth chapter are introduced the simple structural models of time series, concretely models with trend and seasonal components. Keywords: time series, state- space models, structural dynamic models, trend, seasonal components
Obsah Úvod 2 1 Základní pojmy z teorie náhodných procesů 3 1.1 Definicenáhodnéhoprocesu............ 3 1.2 Stochasticképrocesydruhéhořádu........ 5 1.3 Procesynestacionárnívestředníhodnotě..... 10 2 Analýza časových řad 11 2.1 Časovéřady.......... 11 2.2 Základnípřístupykanalýzečasovýchřad..... 11 2.3 Klasickádekompozicečasovýchřad........ 12 3 Dynamické lineární modely 13 3.1 Motivačnípříklad... 13 3.2 Stavově-prostorovémodely............ 16 4 Jednoduché strukturální modely časových řad 17 4.1 Trend............. 17 4.2 Sezónnost........... 22 Závěr 24 Seznam použité literatury 25 1
Úvod Analýza časových řad je velmi důležitou disciplínou matematické statistiky. Tématem bakalářské práce jsou jednoduché strukturální modely časových řad. Práce je rozdělena do čtyř kapitol. První kapitola představuje teoretický základ obsahující pojmy a vztahy používané v dalších částech práce. Druhá kapitola popisuje jednotlivé typy přístupů k analýze časových řad. Třetí kapitola se zaměřuje na vysvětlení dynamického přístupu při modelování časových řad a způsobu jejich zápisu pomocí stavově- prostorových modelů. Ve čtvrté kapitole jsou uvedeny jednoduché strukturální modely časových řad, a to konkrétně modely trendu a sezónní složky. V prvních třech kapitolách jsem čerpala především ze skript Stochastické modelování jednorozměrných časových řad od RNDr.Forbelské Ph.D, jejích učebních materiálů k předmětu Lineární statistické modely a ze skript Základní statistické metody od RNDr.Budíkové, PhD. Ve čtrvté kapitole jsem vycházela především z druhé kapitoly anglické knihy od A.C.Harveyho Forecasting, structural series and the Kalman filter a knihy Dynamic Linear Models with R od G.Petris, S.Petrone a P.Campagnoli. 2
Kapitola 1 Základní pojmy z teorie náhodných procesů 1.1 Definice náhodného procesu Definice 1.1.1. Nechť je dán pravděpodobnostní prostor(ω, A, P), indexová množina T Rareálnáfunkce Y:Ω T Rdefinovanápro ω Ωa t T. Jestližepro t Tje Y(ω, t)borelovskyměřitelnáfunkcevzhledemka (tj.pro B B a t Tplatí Y 1 (B)={ω Ω:Y(ω, t) B} A, kde B je σ-algebra borelovských podmnožin), pak tuto funkci nazýváme(n- rozměrným) náhodným procesem. Náhodnýproces Y(ω, t)připevném ω Ωsenazývárealizace(trajektorie) procesu. Pravěpodobnostnímíru P Y (B)=P(Y 1 (B))nazývámerozdělenípravděpodobností náhodného procesu Y(ω, t). Poznámka.Obdobnějakounáhodnýchveličin,kdemísto Y(ω), ω Ωpíšeme pouze Y,unáhodnýchprocesůbudememísto {Y(ω, t), ω Ω, t T }psát {Y t, t T }. Definice1.1.2.Pokudindexovámnožina T= Z=0, ±1, ±2,...nebo T Z, mluvíme o procesu s diskrétním časem či o náhodné posloupnosti. 3
KAPITOLA 1. ZÁKLADNÍ POJMY Z TEORIE NÁHODNÝCH PROCESŮ Poznámka.Pozdějibudemeunáhodnéhoprocesu {Y t, t T }indexovou množinu Tinterpretovatjakočasapokud T= Z,budemetentoprocesnazývat pouze časovou řadou. Definice1.1.3.Pokudindexovámnožina T= t 1, t 2,kde t 1 t 2, říkáme,že Y t, t Tjenáhodnýprocessespojitýmčasem. Dvojice(S,S),kde Sjemnožinahodnotnáhodnýchveličin Y t as je σ-algebra podmnožin S,senazývástavovýprostorprocesu {Y t, t T }. Pokudnáhodnéveličiny Y t nabývajípouzediskrétníchhodnot,říkáme,žejde o proces s diskrétními stavy. Nabývají-li hodnot z nějakého intervalu, mluvíme o procesu se spojitými stavy. Definice1.1.4.Nechť T n jemnožinavšechvektorů T n =t=(t 1,...,t n ) : t 1 t 2 t n ; t i T; i=1,..., n. Pak(konečně dimenzionální) distribuční funkcí náhodného procesu rozumíme funkci F t (y)=f t1,...,t n (y 1,...,y n )=P(Y t1 y 1,...,Y tn y n ) = P Yt ((, y 1 >,...,(, y n >) pro t=(t 1,...,t n ) T n a y=(y 1,...,y n ) R n. 4
KAPITOLA 1. ZÁKLADNÍ POJMY Z TEORIE NÁHODNÝCH PROCESŮ 1.2 Stochastické procesy druhého řádu Definice 1.2.1. Jestliže pro t=(t 1,...,t n ) T n apro τ=(t 1 + h,...,t n + h) T n platí F t (y)=f t1,...,t n (y 1,...,y n )=F τ1,...,τ n (y 1,..., y n )=F τ (y), pakřekneme,ženáhodnýproces {Y t, t T }jestriktněstacionární. Rovnost lze interpretovat tak, že základní pravděpodobnostní charakteristiky procesuseneměnípřoposunutívčase. Definice 1.2.2.Existuje-lipro t T středníhodnota E(Y t ),paknazýváme funkci µ=e(y t )středníhodnotounáhodnéhoprocesu. Definice 1.2.3.Jestližepro t T platí E(Y 2 t) <,paknáhodnýproces {Y t, t T }nazývámeprocesemdruhéhořáduaříkáme,ženáhodnýproces má konečné druhé momenty. Definice1.2.4.Náhodnýproces {Y t, t T }nazývámestacionárnívestřední hodnotě,pokudpro t Tjestředníhodnotakonstantní,tj. E(Y t )=µ. Pokud E(Y t )=0,nazývámenáhodnýprocescentrovaným. Definice1.2.5.Uvažujemenáhodnýproces {Y t, t T },kterýmákonečnédruhé momenty. Pak funkci γ(s, t)=c(y s, Y t )=E(Y s E(Y s ))(Y t E(Y t )) nazveme autokovarianční funkcí. Poznámka. Tato reálná funkce dvou proměnných dává informaci o lineárním vztahumezijakoukolivdvojicínáhodnýchveličin Y s a Y t. Definice1.2.6.Náhodnýproces {Y t, t T }senazývákovariančně stacionární,pokudpro t, s Tplatí γ(s, t)=γ(0, s t ), cožbudemetaképsátveformě γ(s, t)=γ(s t),tj.autokovariančnífunkcezávisí na svých argumentech pouze prostřednictvím jejich rozdílů. 5
KAPITOLA 1. ZÁKLADNÍ POJMY Z TEORIE NÁHODNÝCH PROCESŮ Definice1.2.7.Náhodnýproces {Y t, t T }senazývá (slabě) stacionární, je-li kovariančně stacionární, tj. γ(s, t)=γ(s t) pro t, s T, a navíc stacionární ve střední hodnotě, tj. E(Y t )=µ pro t T. Poznámka. Přívlastek slabě se většinou vynechává. Lze snadno ukázat, že je-li proces striktně stacionární, je také stacionární. Opačná implikace však neplatí. Definice1.2.8.Nechťnáhodnýproces {Y t, t T }jestacionární.označme a zaveďme funkci γ(0)=σ 2 ϱ(t)= γ(t) σ 2 = γ(t) γ(0). Tuto funkci nazveme autokorelační funkcí stacionárního náhodného procesu. Nyní definujme náhodné procesy, které budou hrát důležitou roli v aplikacích. Definice 1.2.9.Řekneme,ženáhodnýproces {ε t, t T }jebílým šumem (WhiteNoise),jestliže ε t jsounekorelovanénáhodnéveličinysnulovoustřední hodnotou, tj. značíme E(ε t )=0, D(ε t )=σ 2, C(ε t, ε s )=0 (s t), ε t WN(0, σ 2 ). Pokud jsou navíc nejen nekorelované, ale i nezávislé, značíme je symbolem IID (independent identical defined), píšeme ε t IID(0, σ 2 ). Poznámka. Bílý šum je nejjednodušší specifikace náhodné fluktuace. Je to posloupnost náhodných nekorelovaných proměnných s konstantní střední hodnotou (v tomto případě 0) a konstantním rozptylem. 6
KAPITOLA 1. ZÁKLADNÍ POJMY Z TEORIE NÁHODNÝCH PROCESŮ Věta1.1.Náhodnéprocesy ε t WN(0, σ 2 )aε t IID(0, σ 2 )jsoustacionárními náhodnými procesy Důkaz. Zřejmý. Definice1.2.10.Náhodnýproces {Y t, t T }senazývágaussovským(normálním),jestližeprokaždépřirozené nalibovolnáčísla t j T, j=1,...,n,je jeho n-rozměrnádistribučnífunkce F t1,...,t n (y 1,...,x n )distribučnífunkcí n-rozměrného normálního rozdělení. Věta 1.2.Gaussůvnáhodnýproces {Y t, t T }jestacionární,právěkdyžje striktně stacionární. Důkaz. Triviální, plyne z vlastností normálního rozdělení. Definice 1.2.11.Řekneme, ženáhodnýproces {Y t, t T }splňujelineární regresní model, pokud pro jeho střední hodnotu platí t T: E(Y t )=µ t = m β j f j (t), j=0 kde f 0,...,f m jsouznáméfunkcedefinovanénat, β=(β 0,...,β n ) jeneznámývektorregresníchparametrů. Pro lepší představu o lineárním regresním modelu předpokládejme, že mezi nějakýminenáhodnýmiveličinami y, x 1,...,x k platílineárnívztah y= β 1 x 1 +...+β k x k, vekterémjsou β 1,...,β k neznámýmiparametry. Informace o těchto parametrech můžeme získávat pomocí experimentu, a to tak, že budeme opakovaně měřit hodnoty veličin y při vybraných hodnotách proměnných x 1,..., x k. Při měření však vznikají chyby, což lze modelovat takto Y= β 1 x 1 +...+β k x k + ε t, kde ε t jenáhodnáchybaměření. Opakovanéhodnotysledovanýchveličinsepro i=1,..., nznačí Y i, x i1,...,x ik. Celkově jsme tedy dostali model Y 1 = β 1 x 11 +...+β k x 1k + ε 1. Y n = β 1 x n1 +...+β k x nk + ε n 7
KAPITOLA 1. ZÁKLADNÍ POJMY Z TEORIE NÁHODNÝCH PROCESŮ vyjádřený maticově jako Y 1. Y n Y x 11... x 1k β 1 ε 1 =... +. x n1... x nk β k ε n X(matice plánu) β ε Klasickým konkrétním příkladem lineárního modelu je jednoduchá lineární regrese,kdepředpokládáme,ženezávislénáhodnéveličiny Y i pro(i=1,...,n) mají normální rozdělení Y i N(µ i = β 0 + β 1 x i, σ 2 ), kde x i jsoudanékonstanty,kterénejsouvšechnystejné. Rozptyly Y i jsoustejné,zatímcostředníhodnotylzevyjádřitjakolineárnífunkci známýchkonstant x i pomocíneznámýchparametrů β 0 a β 1. V tomto případě zapíšeme vektor závisle proměnných ve tvaru Y =. 1 x 1 matici plánu X =.., vektor regresních koeficientů β = 1 x n ε 1 avektorchyb ε=., přičemž ε N n (0, σ 2 I n ). ε n Definice1.2.12.Nechť {Y t, t Z}jeposloupnostnáhodnýchveličin. Operátor zpětného posunutí(backshift operator) je definován pomocí výrazu BY t = Y t 1, přičemž jej lze aplikovat několikanásobně jako Y 1 Y n ( β0 β 1, ) B j Y t = Y t j 8
KAPITOLA 1. ZÁKLADNÍ POJMY Z TEORIE NÁHODNÝCH PROCESŮ Tzv. diferenční operátor zavádíme pomocí vztahu: Y t = Y t Y t 1 =(1 B)Y t 2 Y t = ( Y t )= (Y t Y t 1 ). =(Y t Y t 1 ) (Y t 1 Y t 2 ) = Y t 2Y t 1 + Y t 2 =(1 B) 2 Y t d Y t =(1 B) d Y t. Definice 1.2.13. Definujme ARMA proces řádu p,q vztahem Y t ϕ 1 Y t 1... ϕ p Y t p = ε t + θ 1 ε t 1 +...+θ q ε t q, kde ε t WN(0, σ 2 ), přičemž pomocí operátoru zpětného chodu lze psát Y t ARMA(p, q):φ(b)y t =Θ(B)ε t, kde φ(b)=1 ϕ 1 B... ϕ p B p (ϕ 0 1) a Θ(B)=1+θ 1 B+...+θ q B q (θ 0 1). Řekneme,že {Y t, t Z}jeARMA(p,q)sestředníhodnotou µ,jestliže {Y t µ} je ARMA(p,q) proces. Speciální případy ARMA procesů nazýváme: Autoregresnímodel(ARproces): Y t AR(p) ARMA(p,0), tj. q=0 Procesklouzavýchsoučtů(MAproces): Y t MA(q) ARMA(0, q),tj. p=0 V reálných situacích se však se stacionárními procesy setkáváme pouze zřídka. Obecně rozlišujeme dva druhy nestacionarity: nestacionaritu ve střední hodnotě a nestacionaritu v rozptylu. Z důvodu dalších aplikací se nyní budeme věnovat pouze případu nestacionarity ve střední hodnotě. 9
KAPITOLA 1. ZÁKLADNÍ POJMY Z TEORIE NÁHODNÝCH PROCESŮ 1.3 Procesy nestacionární ve střední hodnotě Nyní je třeba vysvětlit a odlišit pojmy: Deterministický trend, tj. případ, kdy nestacionaritu ve střední hodnotě chápeme jako funkci času. K jeho modelování použijeme například polynomickýtrend E(Y t )=f(t)=β 0 + β 1 t+...+β d t d, případně periodickýtrend E(Y t )=f(t)=µ+ p (α j cosλ j t+β j sin λ j t) Stochastický trend: U ARMA procesů požadujeme, aby všechny kořeny polynomu j=1 φ(z)=1 ϕ 1 z... ϕ p z p ležely vně jednotkové kružnice, tj. aby proces byl kauzální. Pokud však nějaký kořen leží na jednotkové kružnici, mluvíme o procesu nestacionárním se stochastickým trendem. V případě, že kořen leží uvnitř jednotkové kružnice, mluvíme o procesu nestacionárním explozivního typu. Nestacionární proces se stochastickým trendem nazýváme integrovaným smíšeným modelem a značíme ARIMA(p,d,q) Formálně jej zapíšeme pomocí operátoru zpětného chodu takto: a položíme-li ARIMA(p, d, q):φ(b)(1 B) d Y t =Θ(B)ε t W t =(1 B) d Y t, pak W t jestacionárníarma(p,q). Poznámka. Velice důležitým ARIMA modelem je náhodná procházka kterou značíme také I(1). Y t = Y t 1 + ε t, 10
Kapitola 2 Analýza časových řad 2.1 Časové řady Pod pojmem časová řada rozumíme realizaci(konečné délky) náhodné posloupnosti.jdeon-ticihodnot y t1,...,y tn uspořádanoupodlepřirozené časovéposloupnosti t 1,...,t n. Od této chvíle budeme uvažovat pouze případy, kdy jsou časové intervaly mezi pozorováními (t 1, t 2 ),...,(t n 1, t n ) stejnědlouhé(tj.jsouekvidistantní)azápiszjednodušímena y 1,...,y n. Máme-li k dispozici hodnoty určitého ukazatele za více období ve formě časové řady, je nám umožněno rozpoznat určité zákonitosti ve vývoji tohoto ukazatele. Časové řady vznikají v přírodních vědách nebo technice(např.seismický záznam v geofyzice, údaje o průměrných ročních teplotách v klimatologii), v bilogických vědách(četnosti výskytu určitého škůdce v několika po sobě jdoucích letech, v ekonomii(vývoj směnného kurzu) atd. 2.2 Základní přístupy k analýze časových řad V analýze časových řad se nejčastěji setkáváme s těmito základními přístupy: Klasická dekompozice časových řad, která je založena na regresní analýze Neoklasická dekompozice časových řad(tzv. Box-Jenkinsonova metodologie), jejímž základem je korelační analýze Spektrální analýza časových řad založená na Fourierově analýze 11
KAPITOLA 2. ANALÝZA ČASOVÝCH ŘAD Dynamickélineárnímodely-vpraxisečastosetkávámestím,žehodnoty určité časové řady nejsou jen funkcí času, či předchozích pozorování, ale jsou vysvětlovány pomocí dalších časových řad, kterým říkáme faktorové časové řady a mluvíme o tzv. příčinných(kauzálních, faktorových) modelech, které jsou konstruovány na základě teoretických předpokladů. 2.3 Klasická dekompozice časových řad Klasická dekompozice časových řad vychází z předpokladu, že náhodný proces, který časovou řadu generuje, je závislý pouze na čase. Samotnou dekompozicí časové řady pak rozumíme rozklad časové řady na deterministickou a náhodnou složku. Deterministickásložkasedálerozkládánatrend(Tr t )asezónnísložku(sz t ). Náhodnousložkupředstavujínáhodnéfluktuace(ε t ),kterémodelujídrobné a v jednotlivostech nepostižitelné příčiny kolísání časových řad. Proces ε t jebílýšumsnulovoustředníhodnotou. Při klasické dekompozici časových řad se používají především tyto modely: Aditivní modely, které lze zapsat rovnicí a multiplikativní modely ve tvaru Y t = Tr t + Sz t + ε t, Y t = Tr t Sz t ε t, které se transformují logaritmováním na aditivní modely. Klíčovým nástrojem klasické dekompozice časových řad je regresní analýza, která využívá regresních modelů. Neznámé parametry v těchto modelech bývají odhadovány pomocí metody nejmenších čtverců. 12
Kapitola 3 Dynamické lineární modely Dynamické lineární modely jsou narozdíl od klasické dekompozice časových řad založeny na myšlence, že hodnoty určité časové řady nejsou jen funkcí času či předchozích pozorování, ale jsou ovlivňovány i dalšími faktory. 3.1 Motivační příklad K lepší představě o myšlence dynamických lineárních modelů nám může posloužit jednoduchý ilustrační příklad. Představmesi,žejsmeseocitlinaostrověasnažímeseodhadnoutnaší vzdálenost od pobřeží. Tuto vzdálenost budeme značit x a je pro nás tedy neznámým stavem. Nejprve předpokládejme, že během tohoto odhadování stojíme stále na stejném místě, což znamená, že x je konstatní. Hrubou představu o naší pozici máme, neboť čas od času máme možnost zahlédnout pobřeží skrze stromy. O naší vzdálenosti od pobřeží se však chceme dozvědět víc, proto provádíme průběžná měření. Tatoměřeníoznačíme Y t abudemejemodelovattakto: Y t = x+ε t, ε t N(0, σ 2 ), t=0,1,2,..., n kde ε t a xjsounezávisláaprojednoduchost σ 2 jeznámákonstanta. 13
KAPITOLA 3. DYNAMICKÉ LINEÁRNÍ MODELY Měření Y t jsounezávisláamajístejnénormálnírozdělenípravděpodobností, tedy Y i N(x, σ 2 ), kde t=0,1,..., n 1.Pomocíhvězdodhadnemevčase0našipozicijako Y 0 surčitou nepřesností C 0. Na základě dosavadních znalostí známe hustotu pozice x, kterou označíme p 1 0 (x)=p(x Y 0 ),sestředníhodnotou x 1 0 = Y 0 arozptylem σ 2 1 0 = C 0, tedy x N(Y 0, C 0 ). 2. Mraky se rozestoupí a jasněji vidíme hvězdy. Proto upřesníme náš odhad jako Y 1 světšíjistotou C 1 < C 0. Na základě širších znalostí dostáváme novou hustotu pozice x jako p 1 1 (x)=p(x Y 0, Y 1 ) sestředníhodnotou x 1 1 arozptylem σ 2 1 1. Tutostředníhodnotuvypočtemejakováženýprůměrpozorování Y 0 a Y 1, kdeváhajeotovětší,očjepozorovánípřesnější,tj.mámenšírozptyl (přitomsoučetvahjeroven1) x 1 1 = 1 C 0 1 C 0 + 1 Y 0 + 1 C 1 1 C 1 C 1 C 0 + 1 Y 1 = C 1 C 0 + C } {{ 1} =(1 K) Y 0 + C 0 C 0 + C 1 =K Y 1 =(1 K)Y 0 +KY 1 Pozorování Y 0 a Y 1 jsounezávislá,protorozptylváženéhoprůměrujeroven ( ) 2 ( ) 2 σ 1 1 2 = C1 C0 C 0 C 0 + C 1 = C 1 = KC 1 =(1 K)C 0 C 0 + C 1 C 0 + C 1 C 0 + C 1 tj. σ 2 1 1 < C 1 Celkově tedy dostaneme tyto rekurentní vztahy: x 1 1 = x 1 0 + K(Y 1 x 1 0 ) a σ2 1 1 =(1 K) σ 2 1 0 Tedy x 1 1 jsmezískalijakonejlepšíodhadvčase0, x 1 0,opravený předpovědníchybou(y 1 x 1 0 )aváženýfaktorem K= C 0 C 0 +C 1. Využili jsme tedy informace z prvního i druhého měření. 14
KAPITOLA 3. DYNAMICKÉ LINEÁRNÍ MODELY 3. Nyní náš příklad zdynamizujeme(rozpohybujeme). Představmesi,ževčase2sezačnemepohybovat, tzn.vzdálenost x už není konstantní, ale mění se v čase. Tutozměnumezidvěmaměřenímimůžememodelovatjako 1 : x t = x t 1 + ν+ w t, kde w t N(0, σ 2 w), (3.1) akde νjeznámárychlostnašehopohybuaw t náhodnáchyba sestředníhodnotou0aznámounepřesností σ 2 w. Před tím, než provedeme další měření(v čase 2), uděláme predikci x 2 1 = F 1 x 1 1 nazákladěinformací,kterézatímznáme, tzn.nazákladěpředchozíhostavu x 1 1 adynamickéhomodelu (nějakéfunkcepřechodu F 1 )surčitoudávkounepřesnosti σ 2 2 1. Nyníprovedemedalšíměřenípolohy,tj. Y 2 snepřesností C 2. 4. Všechny předchozí informace shrneme do odhadu polohy x 2 2 = x 2 1 +K(Y 2 x 2 1 ) svahou K= σ 2 2 1 σ 2 2 1 + C 2 (též tzv. Kalmanův zisk) σ 2 2 2 =(1 K) σ 2 2 1 1 Krovnici(3.1)můžemedojítzjednoduchéhodynamickéhomodelu dx dt = }{{} ν + }{{} w konstantnní posun náhodná složka resp.rovnice x ti = x ti 1 + ν(t i t i 1 )+w ti (t i t i 1 ), kdeberemejednotkovéčasovéintervaly,tzn.(t i t i 1 )=1 15
KAPITOLA 3. DYNAMICKÉ LINEÁRNÍ MODELY 3.2 Stavově- prostorové modely Stavově- prostorové modely jsou způsobem, jak pohodlně sestavit formální zápis lineárních dynamických modelů. Místojednorozměrnénáhodnéposloupnosti {Y t, t Z}uvažujmeposloupnost w-rozměrnýchnáhodnýchvektorů {Y t, t Z},Y t R w,kterésplňují tzv. datové a stavové rovnice: Datová rovnice popisuje vztah mezi(nepozorovatelnými) stavovými veličinamivektorux t anaměřenými(pozorovatelnými)veličinamivektoruy t ; je určena zápisem: Y t =G t X t +W t kde t=1,2,3,... Stavová rovnice popisuje vývoj stavu procesu popsaného v časovém okamžiku tvektoremstavovýchproměnnýchx t tak,žejedefinovánasouvislost mezistavovýmvektoremvokamžiku tavnásledujícímokamžiku t+1,tj. X t+1 =F t X t +V t+1 kde t=1,2,3,..., X t jetzv.stavový v-rozměrnýnáhodnývektor, W t ješumměření(w-rozměrnýnáhodnývektorchyb), V t+1 ješumprocesu(v-rozměrnýnáhodnývektorchyb), G t jeposloupnostmatictypu w v(popisujívztahpozorováníkestavu) af t jeposloupnostmatictypu v v(tzn.maticpřechodumodelujících dynamiku) Předpokládejme, že všechny náhodné vektory mají konečné druhé momenty aplatí E(V t )=0 E(W t )=0 D ( Wt V t E(W t W t)=r t ) ( ) Rt S = t, tj. E(V t V t )=Q t S t Q t E(W t V t )=S t a C(X t,(w t,v t ) )=0,(tj.stavovývektorachybovévektoryjsou nekorelované). 16
Kapitola 4 Jednoduché strukturální modely časových řad Strukturálními modely časových řad budeme rozumět takové modely, které jednoduchým rekurentním způsobem popisují stochastické chování časových řad. Dále se budeme věnovat elementárním modelům, které dovolují modelovat trend a sezónnost. 4.1 Trend Trend v časové řadě představuje dlouhodobou tendenci vývoje zkoumaného jevu. Je výsledkem dlouhodobého působení vnějších faktorů a podmínek. Nejjednodušší strukturální modely časových řad se skládají právě z trendu a náhodné fluktuace. Trendové modely zapisujeme ve tvaru: Y t = Tr t + ε t t=1,...,t kdesložky Tr t a ε t jsouoběstochastické, Tr t představujetrendaε t bílýšum. Přitom předpokládáme, že obě složky jsou stochasticky nezávislé. Všimněme si postupně jednotlivých typů trendu, resp. trendových funkcí. a) KONSTANTNÍ TREND Nejjednodušším modelem trendu je Tr t = α. 17
KAPITOLA 4. JEDNODUCHÉ STRUKTURÁLNÍ MODELY ČASOVÝCH ŘAD Vtomtopřípaděplatí Tr t+1 = α=tr t. Pokud chceme, aby se parametry měnily v čase, přidáme náhodnou chybu η t,kterájebílýmšumemsnulovouhodnotouarozptylem σ 2 η,tj. η t WN(0, σ 2 η ) a dostaneme tzv. model s lokálním konstantním trendem(anglicky local level model). Tr t+1 = Tr t + η t+1. Model můžeme přepsat do datových a stavových rovnic takto: Datová rovnice Y t = Tr }{{} t + ε t, tj. G }{{} t =1 X t W t Stavová rovnice Tr } {{ t+1 = Tr } t + η }{{} t+1 tj.také F }{{} t =1 X t+1 X t V t b) LINEÁRNÍ TREND Pokud nevystačíme s konstantním lokálním trendem a přidáme další složku, pak Tr t = α+βt. V tomto případě Tr t+1 = α+β(t+1)=α+βt+β= Tr t + β Tr t Vidíme tedy, že nepotřebujeme znát hodnotu parametru α. Pokudbudemeopětchtít,abyseiparametr βmohlměnitvčase,budeme uvažovatmodelsnáhodnýmifluktuacemi η t a ξ t,kteréjsoubílýmišumy snulovoustředníhodnotouarozptylem σ 2 η a σ2 ξ, tj. platí η t WN(0, σ 2 η ) ξ t WN(0, σ 2 ξ ), 18
KAPITOLA 4. JEDNODUCHÉ STRUKTURÁLNÍ MODELY ČASOVÝCH ŘAD a dostaneme modely Tr t+1 = Tr t + β t + η t+1 β t+1 = β t + ξ t+1 kde t=..., 1,0,1,.... Fluktuace η t dovolujehladinětrendupohybovatsenahoruadolů, zatímcofluktuace ξ t dovolujezměnuparametru β. Čím větší jsou rozptyly těchto fluktuací, tím větší jsou stochastické pohyby v trendu. Všimněmesi,že β t jenáhodnouprocházkou,tj.modelem I(1). Celkový model můžeme opět vyjádřit pomocí stavově- prostorových modelů, tzn. pomocí stavových a datových rovnic, a to takto Datová rovnice Y t = ( 1 0 ) ( ) ( ) Trt εt + G t=g β t X t 0 W t Stavová rovnice ( ) Trt+1 = β t+1 X t+1 ( ) ( ) 1 1 Trt 0 1 β t F t=f X t ( ) ηt+1 + ξ t+1 V t c) CYKLICKÝ TREND v časové řadě vyjadřuje dlouhodobé kolísání okolo trendu, ve kterém se střídají fáze růstu a poklesu. V posledních letech se věnuje pozornost zejména technologickým, inovačním či demografickým cyklům. Cyklický trend předpokládá, že Tr t = ψ t, kde ψ t jecyklickásložkasfrekvencí λ c,kteroulzevyjádřitdvojímzpůsobem. Zápisem pomocí funkce kosinus: ψ t = Acos(λ c t θ), kde t=1,...,t 19
KAPITOLA 4. JEDNODUCHÉ STRUKTURÁLNÍ MODELY ČASOVÝCH ŘAD nebo jako kombinaci funkcí sinus a kosinus: ψ t = αcosλ c t+βsin λ c t, kde t=1,...,t, přičemž A= α 2 + β 2 jeamplituda a θ=arctan β α je fáze. Abychom dostali rekurentní vztah jako u lineárního trendu, uvažujme nejprve ψ t = αcosλ c t+βsin λ c t. Pak ψ t+1 = αcosλ c (t+1)+βsin λ c (t+1)= = α[cosλ c tcosλ c sin λ c tsin λ c ]+β[sin λ c tcosλ c +cosλ c tsin λ c ]= =cosλ c [αcosλ c t+βsin λ c t] +sin λ c [ αsin λ c t+βcosλ c t] ψ t ψ Při značení počítejme dále ψ t= αsin λ c t+βcos λ c t ψ t+1 = αsin λ c(t+1)+βcosλ c (t+1)= = α[sin λ c tcosλ c +cosλ c tsin λ c ]+β[cosλ c tcosλ c sin λ c tsin λ c ]= =cosλ c [ αsin λ c t+βcosλ c t] sin λ c [αcosλ c t+βsin λ c t]. Takže můžeme psát ψ t+1 =cosλ c ψ t +sin λ c ψ t ψ t+1 = sin λ cψ t +cos λ cψ t, což lze vyjádřit maticově takto: ( ) ( ) ( ) ψt+1 cos λc sin λ = c ψt sin λ c cosλ c ψ t+1 ψ t 20
KAPITOLA 4. JEDNODUCHÉ STRUKTURÁLNÍ MODELY ČASOVÝCH ŘAD Nynípředchozívztahydoplnímeonáhodnéfluktuace κ t a κ t,kteréjsou nezávislé bílé šumy, tj. κ t WN(0, σ 2 κ) Dostaneme tedy datovou rovnici κ t WN(0, σ2 κ ). Y t = ( 1 0 ) G t=g ( ψt ψ t ) X t a stavovou rovnici ( ) ( ) ψt+1 cos λc sin λ ψt+1 = c sin λ c cosλ c X t+1 F t + ε t }{{} W t ( ψt ψ t X t ) + ( κt+1 κ t+1 ) V t kde funkce označené hvězdičkami jsou pouze pomocné, umožňující rekurzivní přepis. 21
KAPITOLA 4. JEDNODUCHÉ STRUKTURÁLNÍ MODELY ČASOVÝCH ŘAD 4.2 Sezónnost Sezónnísložka Sz t popisujevlineárníchmodelechkrátkodobéperiodickézměny, tj. pravidelné kolísání okolo trendu v rámci kalendářního roku, které je kratšího rázu, např. vliv střídání ročních období, svátků, dovolených apod. Nejprve uvažujme jednoduchý sezónní model se šumem. Předpokládejme, že délka sezóny je s. Sezónníkomponenty(výkyvy)označme γ 1, γ 2,..., γ s apředpokládejme,žepro ně platí vztahy γ t+s = γ t, tj.vlivvýkyvusepouplynutícelésezónyneliší,a γ 1 +...+γ s =0, tj. celkový vliv výkyvů za sezónu je nulový. Odtud dostaneme jednoduché vztahy γ t+1 = γ t+1 s γ t+1 + γ t +...+γ t+1 s+1 =0, tj. γ t+1 = γ t γ t 1... γ t+2 s Doplníme-lipředchozívztahonáhodnéfluktuace ω t,kteréjsoubílýmšumem,tj. dostaneme neboli obecně amaticově γ t+1 γ t γ t 1. γ t+2 s ω t WN(0, δ 2 ω ), γ t+1 = γ t γ t 1... γ t+2 s + ω t+1, s 1 γ t = γ t j + ω t j=1 1 1... 1 0 1 0... 0 0 = 0 1............ 0 0 0... 0 1 0 γ t γ t 1 γ t 2. γ t+1 s + ω t+1 0.. 0 22
KAPITOLA 4. JEDNODUCHÉ STRUKTURÁLNÍ MODELY ČASOVÝCH ŘAD Abychom sezónní složky mohli zakomponovat do modelu časové řady Y t = Sz t + ε t, zavedemepomocnéproměnné z jt definovanépro j=1,...,s 1následujícím způsobem: 1, t=j, j+ s, j+2s,... z jt = 0, t j, j+ s, j+2s,... 1, t=s,2s,3s,... Pak Sz t = j γ j z jt. Zápis sezónnosti pomocí stavově- prostorových modelů bude vypadat takto: Datová rovnice Stavová rovnice Y t = ( ) z tt z t 1,t z t 2,t... z t+1 s,t G t γ t+1 γ t γ t 1. γ t+2 s X t+1 1 1... 1 0 1 0... 0 0 = 0 1............ 0 0 0... 0 1 0 F t γ t γ t 1 γ t 2. γ t+1 s X t γ t γ t 1 γ t 2. γ t+1 s X t + ε t }{{} W t + ω t+1 0.. 0 V t+1 23
Závěr Jedním ze způsobů analýzy časových řad je klasická dekompozice založená na regresní analýze. Při tomto přístupu je konstruován model pro všechna data a jeho parametry se nemění. Regresní modely jsou výhodné především z hlediska interpretace, předpokládají však vzájemnou nekorelovanost(nezávislost) dat z minulosti. Tento předpoklad časové řady nesplňují, proto byla snaha najít lepší způsob, který by se vypořádal i s daty, která se navzájem ovlivňují. Tímto způsobem je Box-Jenkinsova metodologie, která celou časovou řadu považuje za řadu stochastického charakteru. Avšak z hlediska interpretace a vyhodnocování je Box-Jenkinsova metoda černou skřínkou, neboť současná hodnota je lineární kombinací předchozích hodnot a lineární kombinací náhodných fluktuací. Strukturální přístup k analýze časových řad navržený A.C.Harveyem(1990) je jistou kombinací dvou předešlých metod. Využívá předchozích dat a jejich vzájemné závislosti, pracuje však pouze s informací, kterou jsou získali o jeden krok dříve. Díky tomuto postupu jsou strukturální dynamické modely při výpočtech méně náročné na paměť, objevuje se v nich méně parametrů a parametry, které se v nich používají, jsou lépe interpretovatelné, než tomu je v Box-Jenkinsově metodě. Navíc se parametry mohou měnit v čase, čímž jsou modely více flexibilní. V bakalářské práci jsou popsány nejjednodušší strukturální dynamické modely časových řad a jsou zapsány pomocí stavově-prostorových modelů. Tyto jednoduché strukturální modely jsou základními kameny dynamického přístupu kanalýzečasovýchřadamohousedálrůzněkombinovatavytvářettakmodely složitější. 24
Seznam použité literatury [1] Budíková M., Lerch T., Mikoláš Š. Základní statistické metody, Brno 2006 [2] Forbelská, M. Stochastické modelování jednorozměrných časových řad, Brno 2009 [3] Forbelská M. učební materiály k předmětu Lineární statistické modely, M5120 [4] Harvey, A.C. Forecasting, structural series models and the Kalman filter, Cambridge 1990 [5] Petris, G., Petrone, S., Campagnoli, P. Dynamic Linear Models with R, Springer 2009 25