Cvičení 9 dekompozice časových řad a ARMA procesy

Podobné dokumenty
Úvod do analýzy časových řad

Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných)

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů

Modely stacionárních časových řad

18AEK Aplikovaná ekonometrie a teorie časových řad. Řešení domácích úkolů č. 1 a 2 příklad 1

4EK211 Základy ekonometrie

Inovace bakalářského studijního oboru Aplikovaná chemie

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

4EK211 Základy ekonometrie

PRAVDĚPODOBNOST A STATISTIKA

Ilustrační příklad odhadu LRM v SW Gretl

SEMINÁRNÍ PRÁCE Z 4ST432 Tereza Michlíková (xmict05) ZS 06/07

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

4EK211 Základy ekonometrie

Zadání Máme data hdp.wf1, která najdete zde: Bodová předpověď: Intervalová předpověď:

Regresní analýza 1. Regresní analýza

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

6. Lineární regresní modely

4EK211 Základy ekonometrie

PRAVDĚPODOBNOST A STATISTIKA

4EK211 Základy ekonometrie

REGRESNÍ ANALÝZA NESTACIONÁRNÍCH EKONOMICKÝCH ČASOVÝCH ŘAD

Korelační a regresní analýza

4EK211 Základy ekonometrie

Plánování experimentu

4EK211 Základy ekonometrie

8 ANALÝZA ČASOVÝCH ŘAD SEZÓNNÍ SLOŽKA

Cvičící Kuba Kubina Kubinčák Body u závěrečného testu

Tomáš Karel LS 2012/2013

Kalibrace a limity její přesnosti

Kalibrace a limity její přesnosti

z dat nasbíraných v letech Ke zpracování dat byl použit statistický software R. Základní model poptávkové funkce, ze kterého vycházíme,

Model finančních nákladů pevných linek

Příloha č. 1 Grafy a protokoly výstupy z adstatu

6. Lineární regresní modely

Modely pro nestacionární časové řady

2011 (datový soubor life expectancy CR.txt). Budeme predikovat vývoj očekávané doby dožití pomocí

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.

6. Lineární regresní modely

Bodové a intervalové odhady parametrů v regresním modelu

6. Lineární regresní modely

Semestrální práce. 3.3 Tvorba nelineárních regresních modelů v analýze dat

Statistika (KMI/PSTAT)

Kalibrace a limity její přesnosti

5 Časové řady. Definice 16 Posloupnost náhodných veličin {X t, t T } nazveme slabě stacionární, pokud

Semestrální práce. 2. semestr

4EK211 Základy ekonometrie

ČESKÁ ZEMĚDĚLSKÁ UNIVERZITA V PRAZE PROVOZNĚ

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba nelineárních regresních modelů v analýze dat. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

4EK211 Základy ekonometrie

Modely pro nestacionární časové řady

Regresní analýza. Eva Jarošová

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

2.2 Kalibrace a limity její p esnosti

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

http: //meloun.upce.cz,

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

AVDAT Klasický lineární model, metoda nejmenších

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

4EK211 Základy ekonometrie

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Úloha 1. Napište matici pro případ lineárního regresního spline vyjádřeného přes useknuté

TVORBA LINEÁRNÍCH REGRESNÍCH MODELŮ PŘI ANALÝZE DAT. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Tvorba nelineárních regresních modelů v analýze dat

Aplikovaná ekonometrie a teorie časových řad Zápočtový test 2 Varianta P2017

O MOŽNOSTI ADJUSTACE IMISNÍCH KONCENTRACÍ NA METEOROLOGICKÉ PODMÍNKY. RNDr. Josef Keder, CSc.

UNIVERZITA PARDUBICE. 4.4 Aproximace křivek a vyhlazování křivek

Analýza časových řad pomoci SAS82 for Win

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba lineárních regresních modelů. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.

Téma 9: Vícenásobná regrese

5EN306 Aplikované kvantitativní metody I

Jednofaktorová analýza rozptylu

4EK211 Základy ekonometrie

TECHNIKA UMĚLÝCH PROMĚNNÝCH V PRŮŘEZOVÉ ANALÝZE A V MODELECH ČASOVÝCH ŘAD

Neuronové časové řady (ANN-TS)

STATISTIKA I Metodický list č. 1 Název tématického celku:

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Plánování experimentu

Úloha 1: Lineární kalibrace

AVDAT Nelineární regresní model

Odhad parametrů N(µ, σ 2 )

4EK211 Základy ekonometrie

AVDAT Výběr regresorů v mnohorozměrné regresi

KALIBRACE A LIMITY JEJÍ PŘESNOSTI. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie

Základy lineární regrese

odpovídá jedna a jen jedna hodnota jiných

Tvorba nelineárních regresních modelů v analýze dat

Úvod do ekonometrie Minitesty

4EK211 Základy ekonometrie

Základy ekonometrie. XI. Vektorové autoregresní modely. Základy ekonometrie (ZAEK) XI. VAR modely Podzim / 28

Ekonometrie. Jiří Neubauer

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Transkript:

Cvičení 9 dekompozice časových řad a ARMA procesy Příklad 1: Dekompozice časové řady Soubor 18AEK-cv09.xls obsahuje dvě časové řady (X a Y) se 72 pozorováními. Použijte časovou řadu Y. a) Pokuste se na základě grafického zobrazení odhadnout, zda je stacionární. Proměnná Graf časové řady 2200 2000 1800 1600 1400 1200 Y 1000 800 600 400 200 Časová řada Y vykazuje již od pohledu rostoucí trend a patrně nějakou sezónnost. Předpoklad slabé stacionarity patrně nebude splněn. b) Namodelujte trend této časové řady. Z grafického zobrazení usuzujeme na lineární trend. Generujeme tedy časový trend t (Přidat Časový trend) 0 a konstruujeme lineární regresní model: Y = β 0 + β 1 t + u. 18AEK, Mgr. Jana Sekničková, Ph.D. 1

Odhadneme ho (obě proměnné jsou statisticky významné, model jako celek také). Vyrovnané hodnoty představují lineární trend Tr = β 0 + β 1 t = 275,970 + 25,3739t. 18AEK, Mgr. Jana Sekničková, Ph.D. 2

c) Odstraňte namodelovaný trend pomocí aditivní dekompozice. Pro aditivní dekompozici platí: Y = Tr + Sz + C + E. Odstranění trendu se tedy provede odečtením Tr od původní řady Y. Označme řadu Y očištěnou o trend Tr symbolem Y. Pak platí: Y = Y Tr a je zřejmé, že Y = Sz + C + E. Vzhledem ke skutečnosti, že vyrovnané (predikované) hodnoty Y z předchozího bodu odpovídají trendu, jsou rezidua z předchozího bodu hodnotami očištěné časové řady. Stačí tedy uložit rezidua (Uložit Rezidua). Graf očištěné řady Y odpovídá grafu reziduí z předchozího bodu. 200 150 100 50 y_vlnka 0-50 -100-150 -200 d) Odstraňte namodelovaný trend pomocí multiplikativní dekompozice. 18AEK, Mgr. Jana Sekničková, Ph.D. 3

Pro multiplikativní dekompozici platí: Y = Tr Sz C E. Odstranění trendu se tedy provede vydělením původní řady Y trendem Tr. Označme řadu Y očištěnou o trend Tr symbolem Y. Pak platí: Y = Y Tr a je zřejmé, že Y = Sz C E. Vzhledem ke skutečnosti, že vyrovnané (predikované) hodnoty Y z předchozího bodu odpovídají trendu, stačí tyto hodnoty uložit (Uložit Vyrovnané hodnoty) a generovat hodnoty nové proměnné (Přidat Definovat novou proměnnou: y_dvetecky = Y/y_hat) podle vztahu Y = Y. Graf očištěné řady Y vypadá následovně. 1,3 1,2 1,1 y_dvetecky 1 0,9 0,8 0,7 0,6 0,5 e) Zobrazte obě očištěné řady. Proměnná Graf časové řady: 18AEK, Mgr. Jana Sekničková, Ph.D. 4

200 1,3 150 1,2 100 1,1 y_vlnka 50 0 y_dvetecky 1 0,9-50 0,8-100 0,7-150 0,6-200 Z grafů lze předpokládat, že aditivní dekompozice bude vhodnější, i když rozdíl není nijak zásadní. Pracujte dále s řadou očištěnou o trend pomocí aditivní dekompozice (z bodu c). f) Pokuste se na základě grafického zobrazení odhadnout, zda je řada nyní stacionární. Proměnná Graf časové řady: 0,5 200 150 100 50 y_vlnka 0-50 -100-150 -200 Zobrazená řada je již patrně slabě stacionární (má konstantní střední hodnotu a konstantní rozptyl). Z grafu je ovšem patrná jistá sezónní nebo cyklická složka. Při bližším zkoumání grafu vidíme, že každé desáté pozorování má vysokou hodnotu a následující pak významně nižší. Dochází tedy k jistému opakování vždy po 10 pozorováních. g) Očistěte řadu o sezónnost. 18AEK, Mgr. Jana Sekničková, Ph.D. 5

Již jsme vysvětlili, že k opakování dochází vždy po ukončení cyklu, který má 10 pozorování. Každé 10. a následující je zřejmě významné, není však očividné, jak je to s ostatními pozorováními. Vytvoříme tedy (pro jistotu) 10 umělých (dummy) proměnných D (j), j = 1, 2,, 10 (Přidat Definovat novou proměnnou): D i (j) = { 1, pro i = 10k + j, k N 0 0, jinak Konstruujeme lineární regresní model: Y = β 0 + j=1 β j D (j) + u. Při odhadu pochopitelně narazíme na problém perfektní multikolinearity a jednu umělou proměnnou musíme z modelu vypustit. (GRETL si s tímto problémem poradí sám a automaticky vypustí poslední proměnnou v seznamu vysvětlujících proměnných.) Odhadneme upravený model. Pokud je vypuštěnou dummy proměnnou D (10), je statisticky plně verifikovatelný model: 10 Sz = β 0 + β j D (j) 10 j=1 = 141,328 270,952D 1 248,913D 2 222,624D 3 157,602D 4 144,799D 5 100,242D 6 96,7203D 7 64,1803D 8 73,3580D 9 Pokud jsme vypustili jinou proměnnou, ne všechny proměnné byly statisticky významné. Nejméně významnou proměnné postupně odstraňujeme až do okamžiku, kdy jsou všechny zahrnuté vysvětlující proměnné statisticky významné na zvolené hladině významnosti. Nejlepším modelem pak je: 18AEK, Mgr. Jana Sekničková, Ph.D. 6

Podle korigovaného koeficientu vícenásobné determinace je první model lepší, a proto budeme pracovat s ním. Vyrovnané hodnoty v tomto modelu představují sezónnost Sz, rezidua pak řadu Y očištěnou o tuto sezónnost Sz. 200 y_vlnka Sz 150 100 50 0-50 -100-150 -200 Z následujícího grafu vidíme, že data neobsahují žádnou cyklickou složku. Výsledná očištěná časová řada odpovídá tedy reziduální složce E. 100 80 60 40 20 E 0-20 -40-60 -80-100 18AEK, Mgr. Jana Sekničková, Ph.D. 7

h) Pomocí softwaru vypočtěte hodnoty ACF a PACF a zobrazte korelogram. Proměnná Korelogram: i) Pokuste se najít pro ACF i PACF identifikační body. Z grafu i výpisu hodnot je zřejmé, že identifikační body pro obě funkce jsou k = 0. j) Rozhodněte, které ARMA modely lze použít jako počáteční. Podle ACF i PACF se řada chová jako bílý šum. Počáteční ARMA modely tedy nejsou. k) Modelujte očištěnou řadu pomocí vhodného ARMA modelu. Zkusíme tedy pouze nejjednodušší modely pro očištěnou řadu, kterou jsme označili E t (Model Časová řada ARIMA): AR(1) Vidíme, že konstanta ani zpožděná hodnota E t 1 nejsou statisticky významné, po odstranění konstanty je E t 1 v AR(1) modelu stále nevýznamné a tato zpožděná proměnná tedy do modelu nepatří. Všimněme si, že řada je stacionární (kořen leží vně jednotkového kruhu a to opravdu významně absolutní hodnota je 7,2105). 18AEK, Mgr. Jana Sekničková, Ph.D. 8

MA(1) Vidíme, podobně jako u AR(1) modelu, že konstanta ani zpožděná hodnota e t 1 nejsou statisticky významné, po odstranění konstanty je e t 1 v MA(1) modelu stále nevýznamné a tato zpožděná proměnná tedy do modelu nepatří. Všimněme si, že tato řada je invertibilní (kořen leží vně jednotkového kruhu a to opravdu významně absolutní hodnota je 6,5737). l) Predikujte 4 následující hodnoty původní řady Y. Namodelovanou časovou řadu lze tedy zapsat při použití aditivní dekompozice ve tvaru: Y = Tr + Sz + C + E, kde dle výše uvedeného: Tr = β 0 + β 1 t = 275,970 + 25,3739t Sz = β 0 + 10 j=1 β j D (j) = 141,328 270,952D 1 248,913D 2 222,624D 3 157,602D 4 144,799D 5 100,242D 6 96,7203D 7 64,1803D 8 73,3580D 9 C = 0 E = 0 a řadu tedy můžeme zapsat: Y = 275,970 + 25,3739t + 141,328 270,952D 1 248,913D 2 222,624D 3 157,602D 4 144,799D 5 100,242D 6 96,7203D 7 64,1803D 8 73,3580D 9 + e a po sečtení konstant: Y = 417,298 + 25,3739t 270,952D 1 248,913D 2 222,624D 3 157,602D 4 144,799D 5 100,242D 6 96,7203D 7 64,1803D 8 73,3580D 9 + e Předpovědi můžeme zkonstruovat třemi způsoby: 1. způsob: ruční výpočet Po dosazení za t = 73, 74, 75 a 76 při použití odpovídajících dummy proměnných: Y 73 = 417,298 + 25,3739 73 222,624 1 = 2 046,9687 Y 74 = 417,298 + 25,3739 74 157,602 1 = 2 137,3646 = 417,298 + 25,3739 75 144,799 1 = 2 175,5415 Y 75 18AEK, Mgr. Jana Sekničková, Ph.D. 9

Y 76 = 417,298 + 25,3739 76 100,242 1 = 2 245,4724 2. způsob: predikce pomocí softwaru Možností je několik. Např. po konstrukci modelu v každém kroku udělat predikce a ty v závěru sečíst dle Y = Tr + Sz + C + E = Tr + Sz. Z modelu trendu: 73 2128,263136 95,240433 1938,312082-2318,214191 74 2153,637020 95,347606 1963,472217-2343,801823 75 2179,010904 95,457549 1988,626825-2369,394982 76 2204,384787 95,570255 2013,775925-2394,993650 Z modelu sezónnosti: 73-81,295835 39,835417-160,925698 - -1,665972 74-16,274673 39,835417-95,904536-63,355190 75-3,471315 39,835417-83,101179-76,158548 76 41,085614 39,835417-38,544249-120,715477 Předpovědi: Y 73 = 2128,263136 81,295835 = 2 046,967301 Y 74 = 2153,637020 16,274673 = 2 137,362347 Y 75 = 2179,010904 3,471315 = 2 175,539589 = 2204,384787 + 41,085614 = 2 245,470401 Y 76 Poznámka 1: Rozdíly v předpovědích oproti 1. způsobu jsou dány zaokrouhlovacími chybami. Poznámka 2: Při tomto způsobu doporučuji zkontrolovat, že po přidání pozorování pro předpovědi byly dobře nagenerovány hodnoty dummy proměnných. 3. způsob: odhad celého modelu najednou a predikce pomocí softwaru Kdybychom odhadli přímo celý model najednou (regrese na konstantě, časovém trendu a devíti dummy proměnných), dostali bychom následující výsledky. Všimněme si, že všechny 4 předpovědi se liší o cca 10, což odpovídá rozdílu v konstantách. Nabízím prémiových 10 bodů tomu, kdo jako první pošle vysvětlení, kde k rozdílu došlo. Je evidentní, že odhad modelu vypadá jinak, otázkou ale je PROČ? Kde se postupy od sebe odchýlí? 18AEK, Mgr. Jana Sekničková, Ph.D. 10

73 2036,739335 40,580086 1955,594437-2117,884232 74 2127,134381 40,580086 2045,989483-2208,279278 75 2165,311622 40,580086 2084,166724-2246,456519 76 2235,242435 40,580086 2154,097537-2316,387332 Poznámka pro zajímavost: Ve skutečnosti byla data generována následovně: Y = Tr + Sz + E Tr = 130 + 25 t Sz = 30 t mod 300 E = 40 N(0,1) 18AEK, Mgr. Jana Sekničková, Ph.D. 11

Příklad 2: ARMA(p,q) modely Soubor 18AEK-cv09.xls obsahuje dvě časové řady (X a Y) se 72 pozorováními. Použijte časovou řadu X. a) Pokuste se na základě grafického zobrazení odhadnout, zda je řada stacionární. 540 520 500 480 X 460 440 420 400 Řada stacionárně nevypadá, vykazuje rostoucí trend. Předpokládejte, že uvedená řada je slabě stacionární a není tedy třeba odstraňovat trend. b) Pomocí softwaru vypočtěte hodnoty ACF a PACF a zobrazte korelogram. Autokorelační funkce pro X zpoždění ACF PACF Q-stat. [p-hodnota] 1 0,8952 *** 0,8952 *** 60,1320 [0,000] 2 0,8005 *** -0,0040 108,9069 [0,000] 3 0,7154 *** -0,0024 148,4251 [0,000] 4 0,6380 *** -0,0064 180,3216 [0,000] 5 0,5687 *** -0,0018 206,0373 [0,000] 6 0,5048 *** -0,0100 226,6110 [0,000] 7 0,4481 *** -0,0003 243,0666 [0,000] 8 0,3951 *** -0,0127 256,0632 [0,000] 9 0,3476 *** -0,0037 266,2808 [0,000] 10 0,3038 ** -0,0096 274,2108 [0,000] 11 0,2642 ** -0,0053 280,3095 [0,000] 12 0,2277 * -0,0098 284,9142 [0,000] 13 0,1939-0,0098 288,3109 [0,000] 14 0,1631-0,0083 290,7546 [0,000] 15 0,1348-0,0088 292,4533 [0,000] 18AEK, Mgr. Jana Sekničková, Ph.D. 12

c) Pokuste se najít pro ACF i PACF identifikační body. Z výše uvedeného korelogramu je zřejmé, že ACF identifikační bod nemá, PACF má identifikační bod k = 1. d) Rozhodněte, které ARMA modely lze použít jako počáteční. Z předchozího bodu je jediným vhodným počátečním modelem AR(1). AR(1) Při použití přesné ML (výpis zkrácen) Model AR(1): ARMA, za použití pozorování 1-72 Odhad proveden pomocí Kalmanova filtru (přesné ML) Závisle proměnná: X Směrodatné chyby založené na Hessiánu koeficient směr. chyba z p-hodnota --------------------------------------------------------- const 471,892 58,6578 8,045 8,64e-016 *** phi_1 0,998474 0,00209924 475,6 0,0000 *** Akaikovo kritérium 388,9706 Schwarzovo kritérium 395,8006 Hannan-Quinnovo kritétium 391,6897 Reálná Imaginární Abs. hodnota Frekvence ----------------------------------------------------------- AR Kořen 1 1,0015 0,0000 1,0015 0,0000 ----------------------------------------------------------- 18AEK, Mgr. Jana Sekničková, Ph.D. 13

Při použití podmíněné ML (výpis zkrácen) Model AR(1): ARMA, za použití pozorování 2-72 (T = 71) Odhad proveden pomocí nejmenších čtverců (podmíněné ML) Závisle proměnná: X koeficient směr. chyba z p-hodnota -------------------------------------------------------- const 52,7616 0,692624 76,18 0,0000 *** phi_1 0,900497 0,00134821 667,9 0,0000 *** Akaikovo kritérium 42,70015 Schwarzovo kritérium 47,22551 Hannan-Quinnovo kritétium 44,49975 Reálná Imaginární Abs. hodnota Frekvence ----------------------------------------------------------- AR Kořen 1 1,1105 0,0000 1,1105 0,0000 ----------------------------------------------------------- V obou případech je splněna podmínka stacionarity (kořen vně jednotkového kruhu) a model je statisticky plně verifikovatelný. Všimněme si, že volba typu maximální věrohodnosti (ML) ovlivní hodnoty informačních kritérií a je tedy potřeba porovnávat výsledky pro modely odhadnuté stejným typem. e) Modelujte očištěnou řadu pomocí ARMA modelů pro p 4 a q 4. U každého nevhodného modelu uveďte, proč ho zamítáte. U každého vhodného modelu vypište hodnoty informačních kritérií. INFORMAČNÍ KRITÉRIA DŮVOD ZAMÍTNUTÍ AIC BIC HQC AR(1) 388,9706 395,8006 391,6897 (při použití přesné ML) 42,70015 47,22551 44,49975 (při použití podmíněné ML) AR(2) 115,3858 119,8828 117,1721 (STAT. NEVÝZN. KONSTANTA, podm. ML, NESTACIONÁRNÍ) AR(3) 62,26371 68,96603 64,92274 (STAT. NEVÝZN. KONSTANTA, podm. ML, NESTACIONÁRNÍ) AR(4) 58,82354 67,70157 62,34129 (STAT. NEVÝZN. KONSTANTA, podm. ML, NESTACIONÁRNÍ) MA(1) 603,4052 610,2352 606,1242 (NEINVERTIBILNÍ) MA(2) 525,7635 534,8701 529,3889 (NEINVERTIBILNÍ) MA(3) 460,4064 471,7897 464,9381 (NEINVERTIBILNÍ) MA(4) 408,7137 422,3737 414,1518 (NEINVERTIBILNÍ) ARMA(1,1) 325,1983 334,3050 328,8237 ARMA(1,2) 267,9209 279,3042 272,4526 ARMA(1,3) 249,9051 263,5650 255,3431 ARMA(1,4) 227,4126 243,3492 233,7570 ARMA(2,1) 162,5358 173,9191 167,0675 1 (STATISTICKY NEVÝZNAMNÝ) 1 Při prvním odhadu se ukáže, že konstanta je statisticky nevýznamná, po jejím odstranění je nutné použít podmíněnou ML, ale pro tu není splněno kritérium konvergence, a tak výsledky nezískáme. Uvedené hodnoty informačních kritérií pochází tedy z modelu se statisticky nevýznamnou konstantou. Můžeme model odhadnout tak, že vypneme kovarianční matici pomocí Hessiánu, pak je konstanta významná, ale nevýznamné je theta_1, 18AEK, Mgr. Jana Sekničková, Ph.D. 14

ARMA(2,2) 149,2918 162,9517 154,7298 ARMA(2,3) 147,4298 163,3664 153,7742 (STATISTICKY NEVÝZNAMNÝ) ARMA(2,4) 136,0378 151,9744 142,3822 2 ARMA(3,1) 153,0104 166,6704 158,4485 ARMA(3,2) 150,5758 164,2358 156,0139 3 (STATISTICKY NEVÝZNAMNÝ) ARMA(3,3) 152,6542 170,8676 159,9050 (STATISTICKY NEVÝZNAMNÝ) ARMA(3,4) 136,0400 149,7000 141,4781 4 ARMA(4,1) 139,9265 155,8631 146,2709 ARMA(4,2) 152,7931 168,7298 159,1376 5 ARMA(4,3) 129,7008 150,1908 137,8579 6 ARMA(4,4) 126,8350 145,0483 134,0858 7 f) Vyberte nejvhodnější model. Z důvodů uvedených v předchozím bodě a s ohledem na minimální hodnotu informačních kritérií je z verifikovaných modelů (statisticky významných, stacionárních a invertibilních) nejvhodnějším modelem ARMA(4,4). Uvedený model je však dosti složitý a nebylo by hrubou chybou použití modelu AR(1). Odhadnutý model má tvar: X t = β 0 + φ 1 X t 1 + φ 2 X t 2 + φ 3 X t 3 + φ 4 X t 4 + e t + θ 1 e t 1 + θ 4 e t 4 Odhady regresních parametrů jsou uvedeny v následujícím výpisu. Tam jsou také hodnoty vypočtených kořenů vidíme, že model je stacionární i invertibilní (všechny kořeny leží vně jednotkového kruhu). což vede na AR(2) model a tento ARMA(2,1) považujeme za statisticky nevýznamný. Vzhledem k tomu, že následující model (ARMA(2,2)) bude lepší, není třeba se tímto problémem zabývat. 2 Nevýznamné theta_3 3 Při prvním odhadu je statisticky nevýznamné phi_2, upravíme tedy AR část na specifické zpoždění 1,3, znovu odhadneme, na 5% hladině je nevýznamné i theta_2 a model se tedy stává ARMA(3,1) model ARMA(3,2) považujeme za statisticky nevýznamný. 4 Při prvním odhadu je statisticky nevýznamné theta_1, upravíme tedy MA část na specifické zpoždění 2,3,4, znovu odhadneme, nevýznamné i theta_3, opět upravíme zpoždění na 2,4 a odhadneme. Nyní je nevýznamné phi_2 upravíme zpoždění pro AR část na 1,3 a odhadneme. Výsledný model ARMA(3,4) považujeme za statisticky významný. 5 Nevýznamné phi_3 6 Počítáno bez kovarianční matice pomocí Hessiánu 7 Nevýznamné theta_2 a theta_3 18AEK, Mgr. Jana Sekničková, Ph.D. 15

g) Predikujte 4 následující hodnoty původní řady X. Analýza Předpovědi 73 530,815244 0,443677 529,945652-531,684835 74 531,193719 0,795601 529,634370-532,753069 75 531,488952 1,337073 528,868337-534,109567 76 531,811598 1,944579 528,000293-535,622902 18AEK, Mgr. Jana Sekničková, Ph.D. 16

18AEK, Mgr. Jana Sekničková, Ph.D. 17