SEMINÁRNÍ PRÁCE Z 4ST432 Tereza Michlíková (xmict05) ZS 06/07

Podobné dokumenty
Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných)

Modely pro nestacionární časové řady

Modely pro nestacionární časové řady

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

Příloha č.1 Vypočtené hodnoty jednotlivých proměnných indexu OCA pro MUBS za období

Cvičení 9 dekompozice časových řad a ARMA procesy

NESTEJNÝ TREND V OČEKÁVANÉM VÝVOJI MZDOVÉHO PRŮMĚRU A MZDOVÉHO MEDIÁNU V ČESKÉ REPUBLICE

ŠKODA AUTO VYSOKÁ ŠKOLA, O.P.S. D I P L O M O V Á P R Á C E Bc. Petr Zápotocký

JIHOČESKÁ UNIVERZITA V ČESKÝCH BUDĚJOVICÍCH. Ekonomická fakulta. Katedra aplikované matematiky a informatiky. Diplomová práce

Modely stacionárních časových řad

Studentská limitovaná verze je ke stažení na stránkách GiveWin otevření datového souboru

4EK211 Základy ekonometrie

Úvod do analýzy časových řad

Lineární regrese. Komentované řešení pomocí MS Excel

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

BLÍZKÁ BUDOUCNOST ZAMĚSTNANÝCH OSOB V ODVĚTVÍ ZDRAVOTNÍ A SOCIÁLNÍ PÉČE

4ST432. Kamil Kladívko. 1 Cena a výnos aktiva, volatilita Odhad očekávaného výnosu, interval spolehlivosti, test hypotézy...

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

4EK211 Základy ekonometrie

Časové řady, typy trendových funkcí a odhady trendů

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica

SPC v případě autokorelovaných dat. Jiří Michálek, Jan Král OSSM,

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Analýza časových řad pomoci SAS82 for Win

Časové řady, typy trendových funkcí a odhady trendů

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Inovace bakalářského studijního oboru Aplikovaná chemie

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Vývoj sledovaného ukazatele v letech v ČR (NZ_C) a v SR (NZ_S) uvádí obrázek 1, pro srovnání je uveden i vývoj v celé EU-28 (NZ_EU).

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

VYUŽITÍ WAVELETŮ PŘI ANALÝZE ČASOVÝCH ŘAD 2. PRAKTICKÁ ČÁST

Ilustrační příklad odhadu LRM v SW Gretl

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

Beáta Stehlíková Časové rady, FMFI UK, 2013/2014. CvičenievR-kuI.:ARIMAmodely p.1/15

AVDAT Klasický lineární model, metoda nejmenších

z dat nasbíraných v letech Ke zpracování dat byl použit statistický software R. Základní model poptávkové funkce, ze kterého vycházíme,

Aplikovaná ekonometrie 7. Lukáš Frýd

Zadání Máme data hdp.wf1, která najdete zde: Bodová předpověď: Intervalová předpověď:

FORUM STATISTICUM SLOVACUM 7/

Stav Svobodný Rozvedený Vdovec. Svobodná Rozvedená Vdova 5 8 6

Úloha 1: Lineární kalibrace

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Lineární modely časových řad a jejich aplikace na vybraných ekonomických problémech

4EK211 Základy ekonometrie

KALIBRACE A LIMITY JEJÍ PŘESNOSTI. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Návrhy dalších možností statistického zpracování aktualizovaných dat

4EK211 Základy ekonometrie

Kalibrace a limity její přesnosti

Seminář 6 statistické testy

Semestrální práce. 3.3 Tvorba nelineárních regresních modelů v analýze dat

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

TECHNICKÁ UNIVERZITA V LIBERCI

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

REGRESNÍ ANALÝZA NESTACIONÁRNÍCH EKONOMICKÝCH ČASOVÝCH ŘAD

Karta předmětu prezenční studium

Regresní analýza. Eva Jarošová

8 ANALÝZA ČASOVÝCH ŘAD SEZÓNNÍ SLOŽKA

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

Statistika II. Jiří Neubauer

(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.

4EK211 Základy ekonometrie

Vysoká škola ekonomická DRUHÝ DEMOGRAFICKÝ PŘECHOD V ZRCADLE ČASOVÝCH ŘAD

Očekávané trendy ve vývoji zaměstnanosti. Predikce zaměstnaných osob ve vybraných odvětvích nevýrobní sféry

Ekonometrie. Jiří Neubauer

Kalibrace a limity její přesnosti

UNIVERZITA PARDUBICE

Ekonomické předstihové ukazatele: nástroj krátkodobé predikce

Tvorba nelineárních regresních modelů v analýze dat

Seminář 6 statistické testy

= = 2368

Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze

PREDIKOVÁNÍ CEN AKCIÍ V KOMERČNÍ BANCE PREDICTING STOCK PRICES IN COMMERCIAL BANK

THE EXPECTED TRENDS IN REAL SALARY DEVELOPMENT OF THE CZECH AND SLOVAC REPUBLIC OČEKÁVANÉ TRENDY V REÁLNÉM MZDOVÉM VÝVOJI ČESKÉ A SLOVENSKÉ REPUBLIKY

Tvorba modelu sorpce a desorpce 85 Sr na krystalických horninách za dynamických podmínek metodou nelineární regrese

Analýza dat z dotazníkových šetření

M cvičení : GLM04b (Vztah mezi Poissonovým a

Uni- and multi-dimensional parametric tests for comparison of sample results

05/29/08 cvic5.r. cv5.dat <- read.csv("cvic5.csv")

6. Lineární regresní modely

ADDS cviceni. Pavlina Kuranova

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba lineárních regresních modelů. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Opravená data Úloha (A) + (E) Úloha (C) Úloha (B) Úloha (D) Lineární regrese

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

Jednovýběrové testy. Komentované řešení pomocí MS Excel

4EK211 Základy ekonometrie

TVORBA LINEÁRNÍCH REGRESNÍCH MODELŮ PŘI ANALÝZE DAT. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

4EK211 Základy ekonometrie

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Statistické metody v marketingu. Ing. Michael Rost, Ph.D.

M cvičení : GLM03a (The Working Activities of Bees)

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Daňové modely MAB/KMA A07136 Jindrich Bek

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie

5EN306 Aplikované kvantitativní metody I

MASARYKOVA UNIVERZITA ÚSTAV MATEMATIKY A STATISTIKY

ČESKÁ ZEMĚDĚLSKÁ UNIVERZITA V PRAZE PROVOZNĚ

Transkript:

SEMINÁRNÍ PRÁCE Z 4ST432 Tereza Michlíková (xmict05) ZS 06/07

Nesezónní časová řada - Základní údaje o časové řadě Časová řada příjmy z daní z příjmu v Austrálii ( http://www.economagic.com/emcgi/data.exe/tmp/213-220-208-205!20061203093308 ) v milionech AUD. Jedná se o roční časovou řadu od roku 1975 do roku 2005. Tabulka 1 rok Prijmy z DzP 1.diference 1975-1 7770 1976-1 10019 2249 1977-1 12109 2090 1978-1 12164 55 1979-1 13866 1702 1980-1 15915 2049 1981-1 18859 2944 1982-1 22976 4117 1983-1 22281-695 1984-1 27384 5103 1985-1 30072 2688 1986-1 35375 5303 1987-1 41312 5937 1988-1 45828 4516 1989-1 49955 4127 1990-1 51654 1699 1991-1 50935-719 1992-1 49824-1111 1993-1 52114 2290 1994-1 55936 3822 1995-1 62865 6929 1996-1 68773 5908 1997-1 74523 5750 1998-1 81173 6650 1999-1 84842 3669 2000-1 84887 45 2001-1 90217 5330 2002-1 95103 4886 2003-1 102329 7226 2004-1 109403 7074 2005-1 117057 7654

Grafická analýza 25000 00000 Svar1 5000 0000 5000 1.0 1975 1980 1985 1990 1995 2000 2005 ACF-Svar1 PACF-Svar1 0.5 0.0-0.5 0 5 10 Z rostoucího průběhu a z grafu autokorelační funkce ( ACF ) a parciální autokorelační funkce ( PACF ), kde je první hodnota blízká jedné, vyplývá, že se jedná o nestacionární časovou řadu. Rozšířený Dickey-Fullerův test Předpoklad nestacionarty se pokusíme potvrdit pomocí rozšířeného Dickey- Fullerova testu. Unit-root tests (using prijmy z dani2.xls) The sample is 1977-2005 Svar1: ADF tests (T=29, Constant; 5%=-2.97 1%=-3.68) D-lag t-adf beta Y_1 sigma t-dy_lag t-prob AIC F-prob 1 1.685 1.0269 2180. 1.961 0.0607 15.47 0 2.958 1.0428 2292. 15.54 0.0607 Jak můžeme vidět hodnota t-prob je u zpoždění 1 rovna 0,0607, což je větší než 0,05. Z toho vyplývá, že 1.zpoždění je v modelu statisticky nevýznamné. Hodnota testového kritéria ADF ( t-adf ) je u zpoždění 0 rovna 2,958, což je větší než -2,97, z toho vyplývá, že na 5ti% hladině významnosti nezamítáme testovanou hypotézu H 0 o nestacionaritě časové řady ( tj. časová řada je nestacionární ). Časovou řadu budeme stacionarizovat pomocí 1.diferencí.

1.diference Výsledky prvních diferencí jsou uvedeny v tabulce 1. 7500 DSvar1 5000 2500 0 1.0 1975 1980 1985 1990 1995 2000 2005 ACF-DSvar1 PACF-DSvar1 0.5 0.0-0.5 0 5 10 Stacionarizovaná časová řada a její autokorelační a parciální autokorelační funkce je vidět na grafu výše. Podle grafu autokorelační a parciální autokorelační funkce můžeme vidět, že statisticky významné jsou pouze první hodnoty autokorelační a parciální autokorelační funkce. Proto nelze jednoznačně odhadnout, zda se bude vhodnější model ARIMA ( 1,1,0 ) nebo ARIMA (0,1,1). Přidání procesu AR(1) do modelu The estimation sample is: 1976-2005 The dependent variable is: DSvar1 (prijmy z dani2.xls) Coefficient Std.Error t-value t-prob AR-1 0.541346 0.1624 3.33 0.003 Constant 3910.97 878.3 4.45 0.000 log-likelihood -272.590647 no. of observations 30 no. of parameters 3 AIC.T 551.181295 AIC 18.3727098 mean(dsvar1) 3642.9 var(dsvar1) 6.32802e+006 sigma 2174.09 sigma^2 4.72668e+006 Podle t-testu vidíme, že jak parametr procesu AR(1), tak konstanta jsou v modelu statisticky významné. Ani jedna hodnota t-prob není větší než 0,05.

Diagnostika odhadnutého modelu ARIMA (1,1,0) 1.00 0.75 ACF-r:DSvar1 PACF-r:DSvar1 0.50 0.25 0.00-0.25-0.50-0.75 0 5 10 Hodnoty autokorelační a parciální autokorelační funkce leží uvnitř tolerančních mezí, můžeme tedy říci, že rezidua nevykazují autokorelaci. Tuto skutečnost indikuje také Portmanteau test. Portmanteau test Portmanteau statistic for residuals Portmanteau(12): Chi^2(11)= 9.1510 [0.6080] že nesystematická složka ( rezidua ) jsou neautokorelovaná. Jarque-Bera test Normality test for residuals Asymptotic test: Chi^2(2) = 0.85892 [0.6509] Normality test: Chi^2(2) = 0.76693 [0.6815] že nesystematická složka má normální rozdělení. Test ARCH (1) ARCH coefficients: Lag Coefficient Std.Error 1 0.18202 0.1905 RSS = 8.48312e+014 sigma = 5.71204e+006 Testing for error ARCH from lags 1 to 1 ARCH 1-1 test: F(1,26) = 0.91335 [0.3480] že nesystematická složka je podmíněně homoskedastická. Model ARIMA (1,1,0) je vhodný.

Přidání procesu MA(1) do modelu The estimation sample is: 1976-2005 The dependent variable is: DSvar1 (prijmy z dani2.xls) Coefficient Std.Error t-value t-prob MA-1 0.373622 0.1390 2.69 0.012 Constant 3658.27 612.6 5.97 0.000 log-likelihood -274.466644 no. of observations 30 no. of parameters 3 AIC.T 554.933289 AIC 18.4977763 mean(dsvar1) 3642.9 var(dsvar1) 6.32802e+006 sigma 2314.39 sigma^2 5.35639e+006 Podle t-testu vidíme, že jak parametr procesu MA(1), tak konstanta jsou v modelu statisticky významné. Ani jedna hodnota t-prob není větší než 0,05. Diagnostika odhadnutého modelu ARIMA (0,1,1) 1.00 0.75 ACF-r:DSvar1 PACF-r:DSvar1 0.50 0.25 0.00-0.25-0.50-0.75 0 5 10 Hodnoty autokorelační a parciální autokorelační funkce leží uvnitř tolerančních mezí, můžeme tedy říci, že rezidua nevykazují autokorelaci. Tuto skutečnost indikuje také Portmanteau test. Portmanteau test Portmanteau statistic for residuals Portmanteau(12): Chi^2(11)= 11.271 [0.4208] že nesystematická složka ( rezidua ) jsou neautokorelovaná. Jarque-Bera test Normality test for residuals Asymptotic test: Chi^2(2) = 1.3588 [0.5069] Normality test: Chi^2(2) = 1.5406 [0.4629] že nesystematická složka má normální rozdělení.

Test ARCH (1) ARCH coefficients: Lag Coefficient Std.Error 1-0.008397 0.1981 RSS = 8.25017e+014 sigma = 5.63307e+006 Testing for error ARCH from lags 1 to 1 ARCH 1-1 test: F(1,26) =0.0017964 [0.9665] že nesystematická složka je podmíněně homoskedastická. Model ARIMA (0,1,1) je vhodný. Porovnání modelů Srovnání modelů na základě Akeikeho kritéria volíme model ARIMA (1,1,0), který má nižší hodnotu tohoto kritéria. Předpovědi dle modelu ARIMA (1,1,0) 2006 5937.24181228791 2007 5007.88194252219 2008 4504.7768612632 2009 4232.42302824001 Z výstupu dostáváme předpovědi 1.diferencí. Přepočtem z rovnice 1.diferencí dostáváme tyto hodnoty. y y + y t = t 1 2006 122994,24 2007 128002,12 2008 132506,90 2009 136739,32 t V následujícím grafu je vidět hodnoty původní časové řady ( červená křivka ) a hodnoty předpovědí ( modrá křivka ). 40000 Svar1 var4 20000 00000 0000 0000 0000 0000 1975 1980 1985 1990 1995 2000 2005 2010

Sezónní časová řada základní údaje o časové řadě Jedná se o čtvrtletní časovou řadu průměrné mzdy v podnikatelském sektoru ( www.cszo.cz )za období od 1.čtvrtletí 1998 do 4.čtvrtletí 2005. I.Q. 1998 10833 II.Q. 1998 12075 III.Q. 1998 11856 IV.Q. 1998 13255 I.Q. 1999 11663 II.Q. 1999 12889 III.Q. 1999 12810 IV.Q.1999 14240 I.Q. 2000 12609 II.Q. 2000 13757 III.Q. 2000 13692 IV.Q. 2000 15410 I.Q. 2001 13776 II.Q. 2001 14979 III.Q. 2001 14859 IV.Q. 2001 16522 I.Q. 2002 14789 II.Q. 2002 15991 III.Q. 2002 15819 IV.Q. 2002 17487 I.Q. 2003 15603 II.Q. 2003 16927 III.Q. 2003 16760 IV.Q. 2003 18529 I.Q. 2004 16960 II.Q. 2004 17891 III.Q. 2004 17937 IV.Q. 2004 19697 I.Q. 2005 17775 II.Q. 2005 18836 III.Q. 2005 18924 IV.Q. 2005 20631

Grafická analýza 0000 mzdy pod. sek. 7500 5000 2500 1.0 1998 1999 2000 2001 2002 2003 2004 2005 2006 ACF-mzdy pod. sek. PACF-mzdy pod. sek. 0.5 0.0-0.5 0 5 10 Vývoj časové řady je rostoucí, budeme tedy muset diferencovat. Vzhledem k tomu, že sezónní rozdíly se nezvětšují, není třeba řadu zlogaritmovat. Hodnoty autokorelační funkce schodovitě klesají. Diference Musíme rozhodnout, zda budeme časovou řadu diferencovat sezonálně nebo ne. Přidání procesu I (d) do modelu ARIMA Model: (0 1 0) Nonseasonal differences: 1 Parameter Value (fixed) ------------------------------------- Variance 0.17212E+07 ------------------------------------- Likelihood Statistics Effective number of observations (nefobs) 31 Number of parameters estimated (np) 1 Log likelihood (L) -266.5442 AIC 535.0883 AICC (F-corrected-AIC) 535.2263

Přidání procesu SI (d) do modelu ARIMA Model: (0 0 0)(0 1 0)4 Seasonal differences: 1 Parameter Value (fixed) ------------------------------------- Variance 0.10292E+07 ------------------------------------- Likelihood Statistics Effective number of observations (nefobs) 28 Number of parameters estimated (np) 1 Log likelihood (L) -233.5504 AIC 469.1009 AICC (F-corrected-AIC) 469.2547 Na základě Akeikeho kritéria vybíráme diferenci sezónní a dostáváme model SARIMA (0,0,0) (0,1,0). Grafická analýza modelu SARIMA (0,0,0) (0,1,0) 1.00 0.75 ACF-RES:mzdy pod. sek. PACF-RES:mzdy pod. sek. 0.50 0.25 0.00-0.25-0.50-0.75 0 5 10 15 Z grafu autokorelační a parciální autokorelační funkce vidíme, že u obou funkcí přesahuje toleranční mez 1. sloupec. Vzhledem k tomu, že hodnoty autokorelační funkce klesají pomaleji, budeme do modelu přidávat proces AR (1). Vzhledem k tomu, že na základě grafu ACF a PACF nemůžeme přesně rozhodnout, který z modelů je nejlepší dostáváme 4 možné modely přidáním procesu AR (1), AR (1) a konstanty, MA (1) nebo MA (1) a konstanty.

A.Přidání procesu AR (1) ARIMA Model: (1 0 0)(0 1 0)4 Seasonal differences: 1 Standard Parameter Estimate Errors Nonseasonal AR Lag 1 0.9864 0.01978 Variance 0.23001E+05 Likelihood Statistics Effective number of observations (nefobs) 28 Number of parameters estimated (np) 2 Log likelihood (L) -182.1426 AIC 368.2851 AICC (F-corrected-AIC) 368.7651 Musíme otestovat statistickou významnost odhadu parametru φ 1. Hodnota t-statistiky pro parametr AR (1) je 49,8685541. t(26,2-sided) = 49.869 [0.0000] ** Podle hodnoty p-value [0,0000] můžeme říci, že parametr je statisticky významný. Grafická analýza modelu SARIMA ( 1,0,0 ) ( 0,1,0 ) 1.00 0.75 ACF-RES:mzdy pod. sek. PACF-RES:mzdy pod. sek. 0.50 0.25 0.00-0.25-0.50-0.75 0 5 10 15 Z grafu je vidět, že jedna hodnota je stále ještě statisticky významná. Vzhledem k tomu, že se jedná o 4. hodnotu autokorelační funkce mohli bychom do modelu přidat proces SMA (1) nebo MA (1).

A1.přidání procesu MA (1) MODEL ESTIMATION/EVALUATION Estimation converged in 27 ARMA iterations, 87 function evaluations. ARIMA Model: (1 0 1)(0 1 0)4 Seasonal differences: 1 Standard Parameter Estimate Errors Nonseasonal AR Lag 1 0.9964 0.00702 Nonseasonal MA Lag 1 0.4412 0.16339 Variance 0.19347E+05 Likelihood Statistics Effective number of observations (nefobs) 28 Number of parameters estimated (np) 3 Log likelihood (L) -179.9077 AIC 365.8154 AICC (F-corrected-AIC) 366.8154 Musíme otestovat statistickou významnost odhadu parametru φ 1 a θ 1. Hodnota t-statistiky pro parametr AR (1) je 141,93732. t(25,2-sided) = 141.94 [0.0000] ** Podle hodnoty p-value [0,0000] můžeme říci, že parametr je statisticky významný. Hodnota t-statistiky pro parametr MA (1) je 2,700287655. t(25,2-sided) = 2.7003 [0.0123] * Podle hodnoty p-value [0,0123] můžeme říci, že parametr je statisticky významný.

Grafická analýza modelu SARIMA ( 1,0,1 ) ( 0,1,0 ) 1.00 0.75 ACF-RES:mzdy pod. sek. PACF-RES:mzdy pod. sek. 0.50 0.25 0.00-0.25-0.50-0.75 0 5 10 15 Všechny hodnoty ACF a PACF jsou uvnitř tolerančních mezí, pro kontrolu musíme provést diagnostiku modelu. Diagnostika modelu SARIMA ( 1,0,1 ) ( 0,1,0 ) Portmanteau test Portmanteau statistic for residuals Portmanteau(12): Chi^2(12)= 8.3065 [0.7607] že nesystematická složka ( rezidua ) jsou neautokorelovaná. Jarque-Bera test Normality test for residuals Asymptotic test: Chi^2(2) = 1.8246 [0.4016] Normality test: Chi^2(2) = 6.7168 [0.0348]* Na základě hodnoty testového kritétia ( Asymptotic test )nezamítáme testovanou hypotézu H 0 o tom, že nesystematická složka má normální rozdělení. Normality test dává výsledek opačný. Test ARCH (1) ARCH coefficients: Lag Coefficient Std.Error 1 0.049941 0.1958 RSS = 3.15025e+010 sigma = 34808.5 Testing for error ARCH from lags 1 to 1 ARCH 1-1 test: F(1,26) = 0.065042 [0.8007] že nesystematická složka je podmíněně homoskedastická. Model SARIMA (1,0,1 ) (0,1,0) je vhodný.

A2.přidání procesu SMA (1) ARIMA Model: (1 0 0)(0 1 1)4 Seasonal differences: 1 Standard Parameter Estimate Errors Nonseasonal AR Lag 1 0.9971 0.00579 Seasonal MA Lag 4 0.4588 0.16503 Variance 0.18439E+05 Likelihood Statistics Effective number of observations (nefobs) 28 Number of parameters estimated (np) 3 Log likelihood (L) -179.6867 AIC 365.3733 AICC (F-corrected-AIC) 366.3733 Musíme otestovat statistickou významnost odhadu parametru φ 1 a Θ 1. Hodnota t-statistiky pro parametr AR (1) je 172,2107081. t(25,2-sided) = 172.21 [0.0000] ** Podle hodnoty p-value [0,0000] můžeme říci, že parametr je statisticky významný. Hodnota t-statistiky pro parametr SMA (1) je 2,780100588. t(25,2-sided) = 2.7801 [0.0102] * Podle hodnoty p-value [0,0102] můžeme říci, že parametr je statisticky významný. Grafická analýza modelu SARIMA ( 1,0,0 ) ( 0,1,1 ) 1.00 0.75 ACF-RES:mzdy pod. sek. PACF-RES:mzdy pod. sek. 0.50 0.25 0.00-0.25-0.50-0.75 0 5 10 15 Všechny hodnoty ACF a PACF jsou uvnitř tolerančních mezí, pro kontrolu musíme provést diagnostiku modelu.

Diagnostika modelu SARIMA ( 1,0,0 ) ( 0,1,1 ) Portmanteau test Portmanteau statistic for residuals Portmanteau(12): Chi^2(12)= 6.7522 [0.8735] že nesystematická složka ( rezidua ) jsou neautokorelovaná. Jarque-Bera test Normality test for residuals Asymptotic test: Chi^2(2) = 1.3237 [0.5159] Normality test: Chi^2(2) = 3.3964 [0.1830] že nesystematická složka má normální rozdělení. Test ARCH (1) ARCH coefficients: Lag Coefficient Std.Error 1 0.18353 0.1928 RSS = 2.0217e+010 sigma = 27885.1 Testing for error ARCH from lags 1 to 1 ARCH 1-1 test: F(1,26) = 0.90607 [0.3499] Na základě hodnoty testového kritétia nezamítáme testovanou hypotézu H 0 o tom, že nesystematická složka je podmíněně homoskedastická. Model SARIMA (1,0,0 ) (0,1,1) je vhodný. B.Přidání procesu AR (1) a konstanty MODEL ESTIMATION/EVALUATION Parameter Standard Variable Estimate Error t-value Constant 1000.0609 37.75638 26.49 ARIMA Model: (1 0 0)(0 1 0)4 Seasonal differences: 1 Standard Parameter Estimate Errors Nonseasonal AR Lag 1 0.3809 0.17406 Variance 0.15969E+05 Likelihood Statistics Effective number of observations (nefobs) 28 Number of parameters estimated (np) 3 Log likelihood (L) -175.3067 AIC 356.6135 AICC (F-corrected-AIC) 357.6135

Musíme otestovat statistickou významnost odhadu parametru φ 1 a konstanty. Hodnota t-statistiky pro parametr AR (1) je 2,188325865. t(25,2-sided) = 2.1883 [0.0382] * Podle hodnoty p-value [0,0382] můžeme říci, že parametr je statisticky významný. Hodnota t-statistiky konstanty je 26,49. t(25,2-sided) = 26.49 [0.0000] ** Podle hodnoty p-value [0,0000] můžeme říci, že konstanta je statisticky významná. Grafická analýza modelu SARIMA ( 1,0,0 ) ( 0,1,0 ) s konstantou 1.00 0.75 ACF-RES:mzdy pod. sek. PACF-RES:mzdy pod. sek. 0.50 0.25 0.00-0.25-0.50-0.75 0 5 10 15 Všechny hodnoty ACF a PACF jsou uvnitř tolerančních mezí, pro kontrolu musíme provést diagnostiku modelu. Diagnostika modelu SARIMA ( 1,0,0 ) ( 0,1,0 ) s konstantou Portmanteau test Portmanteau statistic for residuals Portmanteau(12): Chi^2(12)= 11.148 [0.5163] že nesystematická složka ( rezidua ) jsou neautokorelovaná. Jarque-Bera test Normality test for residuals Asymptotic test: Chi^2(2) = 1.1881 [0.5521] Normality test: Chi^2(2) = 2.3284 [0.3122] že nesystematická složka má normální rozdělení.

Test ARCH (1) ARCH coefficients: Lag Coefficient Std.Error 1 0.040277 0.1964 RSS = 1.72722e+010 sigma = 25774.3 Testing for error ARCH from lags 1 to 1 ARCH 1-1 test: F(1,26) = 0.042061 [0.8391] že nesystematická složka je podmíněně homoskedastická. Model SARIMA (1,0,0 ) (0,1,0) s konstantou je vhodný. C.Přidání procesu MA (1) ARIMA Model: (0 0 1)(0 1 0)4 Seasonal differences: 1 Standard Parameter Estimate Errors Nonseasonal MA Lag 1-0.9998 0.17261 Variance 0.27877E+06 Likelihood Statistics Effective number of observations (nefobs) 28 Number of parameters estimated (np) 2 Log likelihood (L) -216.9456 AIC 437.8912 AICC (F-corrected-AIC) 438.3712 Musíme otestovat statistickou významnost odhadu parametru θ 1. Hodnota t-statistiky pro parametr MA (1) je -5,792248421. t(26,2-sided) = -5.7922 [0.0000] ** Podle hodnoty p-value [0,000] můžeme říci, že parametr je statisticky významný.

Grafická analýza modelu SARIMA ( 0,0,1 ) ( 0,1,0 ) 1.00 0.75 ACF-RES:mzdy pod. sek. PACF-RES:mzdy pod. sek. 0.50 0.25 0.00-0.25-0.50-0.75 0 5 10 15 Všechny hodnoty ACF a PACF jsou uvnitř tolerančních mezí, pro kontrolu musíme provést diagnostiku modelu. Diagnostika modelu SARIMA ( 0,0,1 ) ( 0,1,0 ) Portmanteau test Portmanteau statistic for residuals Portmanteau(12): Chi^2(12)= 225.51 [0.0000]** Na základě hodnoty testového kritétia zamítáme testovanou hypotézu H 0 o tom, že nesystematická složka ( rezidua ) jsou neautokorelovaná. Jarque-Bera test Normality test for residuals Asymptotic test: Chi^2(2) = 0.36411 [0.8336] Normality test: Chi^2(2) =0.0056450 [0.9972] že nesystematická složka má normální rozdělení. Test ARCH (1) ARCH coefficients: Lag Coefficient Std.Error 1-0.52216 0.1682 RSS = 4.24826e+011 sigma = 127826 Testing for error ARCH from lags 1 to 1 ARCH 1-1 test: F(1,26) = 9.6422 [0.0046]**] Na základě hodnoty testového kritétia zamítáme testovanou hypotézu H 0 o tom, že nesystematická složka je podmíněně homoskedastická. Model SARIMA ( 0,0,1 ) (0,1,0) není vhodný.

D.Přidání procesu MA (1) a konstanty MODEL ESTIMATION/EVALUATION Regression Model Parameter Standard Variable Estimate Error t-value Constant 1002.9664 32.97902 30.41 ARIMA Model: (0 0 1)(0 1 0)4 Seasonal differences: 1 Standard Parameter Estimate Errors Nonseasonal MA Lag 1-0.3845 0.17484 Variance 0.16202E+05 Likelihood Statistics Effective number of observations (nefobs) 28 Number of parameters estimated (np) 3 Log likelihood (L) -175.5108 AIC 357.0215 AICC (F-corrected-AIC) 358.0215 Musíme otestovat statistickou významnost odhadu parametru θ 1 a konstanty. Hodnota t-statistiky pro parametr MA (1) je -2.199153512. t(25,2-sided) = -2.1992 [0.0373] * Podle hodnoty p-value [0,0373] můžeme říci, že parametr je statisticky významný. Hodnota t-statistiky pro konstantu je 30,41. t(25,2-sided) = 30.41 [0.0000] ** Podle hodnoty p-value [0,000] můžeme říci, že konstanta je statisticky významná. Grafická analýza modelu SARIMA ( 0,0,1 ) ( 0,1,0 ) s konstantou 1.00 0.75 ACF-RES:mzdy pod. sek. PACF-RES:mzdy pod. sek. 0.50 0.25 0.00-0.25-0.50-0.75 0 5 10 15

Z grafu je vidět, že jedna hodnota je stále ještě statisticky významná. Vzhledem k tomu, že se jedná o 4. hodnotu parciální autokorelační funkce mohli bychom do modelu přidat proces SAR (1) nebo AR (1). D1.přidání procesu AR (1) MODEL ESTIMATION/EVALUATION Estimation converged in 7 ARMA iterations, 36 function evaluations. Regression Model Parameter Standard Variable Estimate Error t-value Constant 998.6032 39.79362 25.09 ARIMA Model: (1 0 1)(0 1 0)4 Seasonal differences: 1 Standard Parameter Estimate Errors Nonseasonal AR Lag 1 0.4902 0.33373 Nonseasonal MA Lag 1 0.1246 0.38120 Variance 0.15918E+05 Likelihood Statistics Effective number of observations (nefobs) 28 Number of parameters estimated (np) 4 Log likelihood (L) -175.2651 AIC 358.5302 AICC (F-corrected-AIC) 360.2693 Musíme otestovat statistickou významnost odhadu parametrů θ 1 a φ 1 a konstanty. Hodnota t-statistiky pro parametr MA (1) je 1,468852066. t(24,2-sided) = 1.4689 [0.1549] Podle hodnoty p-value [0,1549] můžeme říci, že parametr je statisticky nevýznamný. Přidáním procesu AR (1) do modelu SARIMA ( 0,0,1) (0,1,0) s konstatntou došlo k tomu, že parametr MA (1 ) je statisticky nevýznamný. Vyloučením tohoto parametru bychom dostali již výše uvedený model SARIMA ( 1,0,0 ) ( 0,1,0 ).

D2.přidání procesu SAR (1) MODEL ESTIMATION/EVALUATION Estimation converged in 7 ARMA iterations, 36 function evaluations. Regression Model Parameter Standard Variable Estimate Error t-value Constant 1011.6687 23.11066 43.77 ARIMA Model: (0 0 1)(1 1 0)4 Seasonal differences: 1 Standard Parameter Estimate Errors Seasonal AR Lag 4-0.3772 0.18180 Nonseasonal MA Lag 1-0.3922 0.17365 Variance 0.13784E+05 Likelihood Statistics Effective number of observations (nefobs) 28 Number of parameters estimated (np) 4 Log likelihood (L) -173.5673 AIC 355.1345 AICC (F-corrected-AIC) 356.8737 Musíme otestovat statistickou významnost odhadu parametrů θ 1 a Φ 1 a konstanty. Hodnota t-statistiky pro parametr MA (1) je -2,258566081. t(24,2-sided) = -2.2586 [0.0333] * Podle hodnoty p-value [0,0333] můžeme říci, že parametr je statisticky významný. Hodnota t-statistiky pro parametr SAR (1) je -2,074807481. t(24,2-sided) = -2.0748 [0.0489] * Podle hodnoty p-value [0,0489] můžeme říci, že parametr je statisticky významný. Hodnota t-statistiky pro konstantu je 43,77. t(24,2-sided) = 43.77 [0.0000] ** Podle hodnoty p-value [0,0000] můžeme říci, že konstanta je statisticky významná.

Grafická analýza modelu SARIMA ( 0,0,1 ) ( 1,1,0 ) s konstantou 1.00 0.75 ACF-RES:mzdy pod. sek. PACF-RES:mzdy pod. sek. 0.50 0.25 0.00-0.25-0.50-0.75 0 5 10 15 Všechny hodnoty ACF a PACF jsou uvnitř tolerančních mezí, pro kontrolu musíme provést diagnostiku modelu. Diagnostika modelu SARIMA ( 0,0,1 ) ( 1,1,0 ) s konstantou Portmanteau test Portmanteau statistic for residuals Portmanteau(12): Chi^2(12)= 7.6282 [0.8135] že nesystematická složka ( rezidua ) jsou neautokorelovaná. Jarque-Bera test Normality test for residuals Asymptotic test: Chi^2(2) = 0.58886 [0.7450] Normality test: Chi^2(2) = 0.40663 [0.8160] že nesystematická složka má normální rozdělení. Test ARCH (1) ARCH coefficients: Lag Coefficient Std.Error 1 0.061237 0.1975 RSS = 7.04959e+009 sigma = 16466.3 Testing for error ARCH from lags 1 to 1 ARCH 1-1 test: F(1,26) = 0.096137 [0.7590] že nesystematická složka je podmíněně homoskedastická. Model SARIMA (0,0,1 ) (1,1,0) s konstantou je vhodný.

Porovnání modelů Modely SARIMA AIC stat. význ. parametrů graf. analýza Portmanteau Jarque- Bera ARCH(1) vhodný postup (010)(000) 535,0883 xxx xxx xxx xxx xxx ne xxx (000)(010) 469,1009 xxx (100)(010) 368,2851 ano přesahuje 1.sl. ACF 1.sl. PACF xxx xxx xxx ne přesahuje 4.sl. ACF xxx xxx xxx ne (101)(010) 365,8154 ano OK ano ano ano ano xxx (100)(011) 365,3733 ano OK ano ano ano ano xxx (100)(010)+konst. 356,6135 ano OK ano ano ano ano xxx (001)(010) 437,8912 ano OK ne ano ne ne xxx (001)(010)+konst. 357,0215 ano přesahuje 4.sl. PACF xxx xxx xxx ne (101)(010)+konst. 358,5302 ne xxx xxx xxx xxx ne xxx (001)(110)+konst. 355,1345 ano OK ano ano ano ano xxx Ve výše uvedené tabulce je vidět, že nejvhodnějším modelem je podle Akeikeho kritéria model SARIMA (001)(110) s konstantou. y θ t = ct + at 1 * at 1 + Θ1 yt S = 1011,6687 + at ( 0,3922) * at 1 + ( 0,3772) * yt 4 přidáme AR(1) (+konst.) nebo MA(1) (+konst.) přidáme MA(1) nebo SMA(1) přidáme AR(1) nebo SAR(1) Předpovědi ---------------------------- Standard Date Forecast Error ---------------------------- 2006.1 18844.99 119.610 2006.2 19872.82 130.066 2006.3 19944.97 130.066 2006.4 21671.97 130.066 ----------------------------

V následujícím grafu je vidět hodnoty původní časové řady ( červená křivka ) a hodnoty předpovědí ( modrá křivka ). 2000 mzdy pod. sek. FORmzdy pod. sek. 0000 8000 6000 4000 2000 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 Použitá literatura: Arlt, J.;Arltová, M.: Ekonomické časové řady; Grada, Praha 2007