Univerzita Karlova v Praze Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE. Martin Hrba

Podobné dokumenty
Úvod do analýzy časových řad

Modely stacionárních časových řad

5 Časové řady. Definice 16 Posloupnost náhodných veličin {X t, t T } nazveme slabě stacionární, pokud

Univerzita Karlova v Praze Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE. Eduard Hybler

Maticí typu (m, n), kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru:

Časové řady, typy trendových funkcí a odhady trendů

Testování hypotéz o parametrech regresního modelu

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Regresní analýza 1. Regresní analýza

10 Funkce více proměnných

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Časové řady, typy trendových funkcí a odhady trendů

Základy teorie odhadu parametrů bodový odhad

0.1 Úvod do lineární algebry

Testování hypotéz o parametrech regresního modelu

0.1 Úvod do lineární algebry

Univerzita Karlova v Praze procesy II. Zuzana. Predikce

Regresní a korelační analýza

AVDAT Klasický lineární model, metoda nejmenších

Odhad parametrů N(µ, σ 2 )

Matematika (CŽV Kadaň) aneb Úvod do lineární algebry Matice a soustavy rovnic

Normální (Gaussovo) rozdělení

Testování statistických hypotéz

3 Bodové odhady a jejich vlastnosti

Cvičení 9 dekompozice časových řad a ARMA procesy

MATEMATICKÁ STATISTIKA - XP01MST

1 Linearní prostory nad komplexními čísly

Maximálně věrohodné odhady v časových řadách

2.6. VLASTNÍ ČÍSLA A VEKTORY MATIC

Texty k přednáškám z MMAN3: 4. Funkce a zobrazení v euklidovských prostorech

Lineární algebra : Metrická geometrie

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Definice 13.1 Kvadratická forma v n proměnných s koeficienty z tělesa T je výraz tvaru. Kvadratická forma v n proměnných je tak polynom n proměnných s

Vektory a matice. Obsah. Aplikovaná matematika I. Carl Friedrich Gauss. Základní pojmy a operace

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

Operace s maticemi. 19. února 2018

Regresní a korelační analýza

8 Coxův model proporcionálních rizik I

Výběrové charakteristiky a jejich rozdělení

Pravděpodobnost a aplikovaná statistika

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

AVDAT Geometrie metody nejmenších čtverců

Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague

Aplikovaná numerická matematika - ANM

AVDAT Mnohorozměrné metody, metody klasifikace

PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady

Úvod do lineární algebry

Necht tedy máme přirozená čísla n, k pod pojmem systém lineárních rovnic rozumíme rovnice ve tvaru

Ing. Michael Rost, Ph.D.

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Dnešní látka Opakování: normy vektorů a matic, podmíněnost matic Jacobiova iterační metoda Gaussova-Seidelova iterační metoda

Modely pro nestacionární časové řady

I. D i s k r é t n í r o z d ě l e n í

Normální (Gaussovo) rozdělení

Jednofaktorová analýza rozptylu

15. T e s t o v á n í h y p o t é z

p(x) = P (X = x), x R,

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

(Cramerovo pravidlo, determinanty, inverzní matice)

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

AVDAT Mnohorozměrné metody metody redukce dimenze

Faktorová analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Normální rozložení a odvozená rozložení

Odhad parametrů N(µ, σ 2 )

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Statistická analýza jednorozměrných dat

15. T e s t o v á n í h y p o t é z

ALGEBRA. Téma 5: Vektorové prostory

MATICE. a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij]

Markovské metody pro modelování pravděpodobnosti

5. Lokální, vázané a globální extrémy

Modely pro nestacionární časové řady

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

MKI Funkce f(z) má singularitu v bodě 0. a) Stanovte oblast, ve které konverguje hlavní část Laurentova rozvoje funkce f(z) v bodě 0.

1 Determinanty a inverzní matice

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

Lineární algebra : Lineární prostor

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

Dnešní látka Variačně formulované okrajové úlohy zúplnění prostoru funkcí. Lineární zobrazení.

Bodové a intervalové odhady parametrů v regresním modelu

Derivace funkcí více proměnných

Přijímací zkouška na navazující magisterské studium 2014

Matice. Modifikace matic eliminační metodou. α A = α a 2,1, α a 2,2,..., α a 2,n α a m,1, α a m,2,..., α a m,n

Lineární algebra : Báze a dimenze

Matematika III. Miroslava Dubcová, Daniel Turzík, Drahoslava Janovská. Ústav matematiky

Matice. a m1 a m2... a mn

PRAVDĚPODOBNOST A STATISTIKA

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Charakterizace rozdělení

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

stránkách přednášejícího.

Testování statistických hypotéz

You created this PDF from an application that is not licensed to print to novapdf printer (

Pravděpodobnost a statistika (BI-PST) Cvičení č. 9

Transkript:

Univerzita Karlova v Praze Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE Martin Hrba Aplikace modelů mnohorozměrných časových řad ve finanční analýze Katedra pravděpodobnosti a matematické statistiky Vedoucí diplomové práce: RNDr. Jitka Zichová, Dr. Studijní program: Matematika Studijní obor: Finanční a pojistná matematika

Poděkování patří vedoucí diplomové práce, RNDr. Jitce Zichové, Dr., za cenné připomínky a podněty k této práci, čas strávený konzultacemi a za umožnění práce s potřebným softwarem. Prohlašuji, že jsem svou diplomovou práci napsal samostatně a výhradně s použitím citovaných pramenů. Souhlasím se zapůjčováním práce. V Praze dne 12. 4. 2006 Martin Hrba 2

Obsah Úvod 6 1 Mnohorozměrný náhodný proces 7 2 Mnohorozměrné ARMA modely 9 2.1 Definice posloupnosti ARMA........................ 9 2.2 Stacionarita a invertibilita posloupností ARMA.............. 11 3 Identifikace ARMA modelu 18 3.1 Určení řádu modelu.............................. 18 3.1.1 Kovarianční a korelační maticová funkce.............. 19 3.1.2 Parciální autoregresní maticová funkce............... 22 3.1.3 Parciální korelační maticová funkce................. 25 3.1.4 Shrnutí volby řádu modelu...................... 27 3.2 Odhad parametrů modelu.......................... 29 3.2.1 Momentová metoda.......................... 29 3.2.2 Metoda maximální věrohodnosti................... 29 3.3 Verifikace modelu............................... 30 4 Konstrukce předpovědí 32 5 Zpracování konkrétních časových řad 36 5.1 Řada měnových kurzů............................ 36 5.2 Řada oborových burzovních indexů..................... 42 Závěr 49 Literatura 50 Přílohy 51 Příloha č. 1: Výpis programu rada1.nb...................... 52 Příloha č. 2: Výpis programu rada2.nb...................... 59 Příloha č. 3: Komentář k programovému řešení.................. 70 3

Název práce: Aplikace modelů mnohorozměrných časových řad ve finanční analýze Autor: Martin Hrba Katedra: Katedra pravděpodobnosti a matematické statistiky Vedoucí diplomové práce: RNDr. Jitka Zichová, Dr. e-mail vedoucího: zichova@karlin.mff.cuni.cz Abstrakt: Práce se zabývá aplikací mnohorozměrných ARMA modelů na konkrétní časové řady z finančních trhů a sestává z teoretické a praktické části. V první části je vyložena teorie mnohorozměrných posloupností ARMA a postupy při jejich použití. V druhé části jsou za pomoci systému Mathematica 5.0 zpracovány dvě časové řady, a to řada měnových kurzů a řada burzovních indexů. Zpracovaná data a výpis programu jsou přiloženy na CD. Klíčová slova: Analýza časových řad, mnohorozměrná časová řada, ARMA model Title: Application of Multivariate Time Series Models in Financial Analysis Author: Martin Hrba Department: Department of probability and mathematical statistics Supervisor: RNDr. Jitka Zichová, Dr. Supervisor s e-mail address: zichova@karlin.mff.cuni.cz Abstract: The thesis deals with the applications of multivariate ARMA models for particular time series from financial markets; it consists of a theoretical part and a practical part. The former refers to the theory of multivariate ARMA models and methods of their applications. In the latter two time series are solved by system Mathematica 5.0, one currency courses series and one stock exchange index series. The data and programme source code are enclosed on a CD. Keywords: Time series analysis, multivariate time series, ARMA model 4

Úvod Velké množství dat ve financích má podobu časové řady, tj. hodnota stejného ukazatele je zaznamenána v konkrétních časech v minulosti. Přitom se zřídka vyskytne časová řada, která by existovala sama o sobě a byla zcela nezávislá na řadách ostatních, proto se v rámci modelů mnohorozměrných časových řad zkoumají celé vektory hodnot pozorovaných v jednotlivých časech. Úkolem je vyšetřit, zda se vzájemně ovlivňují složky vektoru v konkrétním čase nebo zda hodnota současných pozorování souvisí s hodnotami pozorování minulých, identifikovat pro data vhodný model, který by tyto souvislosti popisoval, a pak na jeho základě předpovídat data do budoucnosti. Tato práce se zabývá aplikací mnohorozměrných ARMA modelů na konkrétní finanční data. ARMA modely jsou lineární modely založené na předpokladu, že pozorování časové řady v určitém čase je lineární funkcí předchozích pozorování a náhodné složky s neměnným rozdělením pravděpodobnosti. Práce je členěna do pěti kapitol, v nichž je nejprve vyložena teorie mnohorozměrných ARMA modelů a poté je aplikována na konkrétní data. Bez dalšího vysvětlování jsou používány základní pojmy matematické statistiky (pojem náhodného vektoru, základní pravděpodobnostní rozdělení, jejich momenty apod.). V první kapitole jsou shrnuty základy teorie mnohorozměrných náhodných procesů. Druhá kapitola je zaměřena na teorii mnohorozměrných ARMA modelů a definuje klíčové vlastnosti posloupností ARMA: stacionaritu a invertibilitu. Třetí kapitola se již věnuje konkrétním postupům analýzy mnohorozměrných časových řad, jsou popsány způsoby identifikace modelu, které spočívají v určení řádů posloupnosti ARMA a odhadu jejích parametrů. Ve čtvrté kapitole je vyložen postup konstrukce předpovědí. Pátá kapitola popisuje výsledky aplikace postupů vyložených v této práci na dvě konkrétní mnohorozměrné časové řady z finančních trhů. V přílohách jsou uvedeny zdrojové kódy programů použitých k analýze dat a vybrané výstupy, dále také stručný komentář k programovému řešení. Na přiloženém CD jsou soubory obsahující zpracovávaná data (data1.txt a data2.txt) a oba použité programy (rada1.nb a rada2.nb). 5

Značení: V celé práci budou vektory uvažovány sloupcové a budou značeny tučnými písmeny, transpozice vektoru X bude značena X T. Matice budou ve většině případů značeny řeckými písmeny, opět matice transponovaná k matici Γ bude značena Γ T. Střední hodnota náhodného vektoru X bude značena EX, rozptylová matice varx a kovarianční matice náhodných vektorů X a Y bude značena cov(x, Y). 6

Kapitola 1 Definice a základní vlastnosti mnohorozměrného náhodného procesu Definice 1.1: Náhodný proces Nechť T R a pro všechna t T je X t m-rozměrný reálný náhodný vektor. Pak se systém {X t, t T } nazývá m-rozměrný náhodný proces. Je-li speciálně T podmnožina celých čísel, nazývá se {X t, t T } m-rozměrná náhodná posloupnost nebo také m-rozměrná časová řada. Pokud je z kontextu zřejmé, o jakou množinu T se jedná, budeme psát pouze {X t }. Úmluva 1.2: Protože se celá práce zabývá mnohorozměrným případem náhodných procesů, budeme v dalším textu většinou slovo m-rozměrný vynechávat, přitom m bude nadále značit rozměr příslušné náhodné posloupnosti, i pokud nebude explicitně uveden. Definice 1.3: Střední hodnota Nechť {X t, t T } je náhodný proces takový, že pro každé t T existuje střední hodnota EX t. Pak se vektorová funkce e t = EX t definovaná na T nazývá střední hodnota náhodného procesu {X t }. Náhodný proces s nulovou střední hodnotou nazýváme centrovaný náhodný proces. Definice 1.4: Kovarianční maticová funkce Nechť {X t, t T } je m-rozměrný náhodný proces se střední hodnotou EX t, kde X t = (X 1,t, X 2,t,..., X m,t ) T, a platí E(X k,t ) 2 < pro t T a k = 1,..., m. Pak se maticová funkce Γ(s, t) = E(X s EX s )(X t EX t ) T definovaná na T T nazývá kovarianční maticová funkce náhodného procesu {X t }. 7

Funkce Γ(t, t) definovaná na T se nazývá rozptylová maticová funkce náhodného procesu {X t }. Definice 1.5: Slabá stacionarita Je-li střední hodnota nějakého náhodného procesu konstantní a kovarianční maticová funkce Γ(s, t) je pouze funkcí rozdílu argumentů t s a je konečná pro všechna s, t T, pak se tento náhodný proces nazývá slabě stacionární. Pak zkráceně píšeme Γ(k) = Γ(t, t + k) a Γ(0) nazýváme rozptylová matice. Poznámka 1.6: Pro t Z zřejmě platí Γ( k) = Γ(k) T, proto často matici Γ(k) počítáme pouze pro t N 0. 8

Kapitola 2 Mnohorozměrné ARMA modely Důležitou třídou náhodných procesů jsou modely lineárních náhodných posloupností, často zkráceně označované jako posloupnosti ARMA nebo ARMA modely. 2.1 Definice posloupnosti ARMA Definice 2.1: Bílý šum Nechť {Y t, t Z} je náhodná posloupnost, EY t = 0 pro všechna t Z, kovarianční maticová funkce Γ(s, t) = 0 je nulová matice pro všechna s t, s, t Z a Γ(t, t) je konečná, symetrická, pozitivně definitní matice a je stejná pro všechna t Z. Pak se {Y t } nazývá bílý šum. Poznámka 2.2: Bílý šum je zřejmě centrovaná slabě stacionární náhodná posloupnost, jejíž kovarianční maticová funkce Γ(k) ve smyslu definice 1.5 je nulová pro všechna k Z \ {0}. Úmluva 2.3: Dále bude symbol {Y t } vždy označovat bílý šum. Rozptylová matice Γ(0) bílého šumu bude značena Σ Při definici i při dalším použití ARMA modelů je vhodné za účelem zjednodušení zápisu používat následující operátor. Definice 2.4: Operátor zpětného posunutí Nechť {X t, t Z} je systém m-rozměrných vektorů. Pak se operátor B, který pro všechna t Z vektoru X t přiřazuje vektor X t 1, nazývá operátor zpětného posunutí. Pro n = 1, 2,... definujeme rekurentně operátor n-násobného zpětného posunutí: Nejprve položíme B 1 X t = BX t = X t 1, dále pak B n X t = B(B n 1 X t ) =... = X t n. 9

Definice 2.5: Posloupnost klouzavých součtů Nechť {Y t, t Z} je m-rozměrný bílý šum, q N, Θ 1,..., Θ q jsou matice typu m m, přičemž Θ q je nenulová. Pak se m-rozměrná náhodná posloupnost {X t, t Z} nazývá posloupnost klouzavých součtů řádu q, značíme MA(q), jestliže X t = Y t + Θ 1 Y t 1 + Θ 2 Y t 2 +... + Θ q Y t q pro všechna t Z. Označíme-li Θ(B) = q s=0 Θ sb s, kde B je operátor zpětného posunutí a Θ 0 = I je jednotková matice, lze ekvivalentně psát X t = Θ(B)Y t. Protože v mnohorozměrném případě je problematické si vytvořit intuitivní představu o operátorech B nebo Θ(B), pokusíme se je dát do souvislosti s analogickými jednorozměrnými operátory známými z teorie jednorozměrných ARMA modelů. Poznámka 2.6: Operátor zpětného posunutí B přiřazuje každému vektoru X t vektor X t 1. Při zavedení jednorozměrného operátoru B, který veličině X t přiřazuje veličinu X t 1, si lze B lépe představit jako diagonální matici, jejíž prvky na diagonále jsou právě B, pak je totiž možno formálně psát B 0... 0 0 B... 0 BX t =...... 0 0... B X 1,t X 2,t. X m,t = BX 1,t BX 2,t. BX m,t = X 1,t 1 X 2,t 1. X m,t 1 = X t 1. Poznámka 2.7: Podobně si lze v maticové podobě představit i operátor Θ(B). Označme nejprve pro každé s = 0, 1,..., q prvky matice Θ s jako θ ij,s, pak Θ(B) = = = q Θ s B s = s=0 θ 11,s θ 12,s... θ 1m,s B s 0... 0 q θ 21,s θ 22,s... θ 2m,s 0 B s... 0............ θ m1,s θ m2,s... θ mm,s 0 0... B s θ 11,s B s θ 12,s B s... θ 1m,s B s q θ 21,s B s θ 22,s B s... θ 2m,s B s...... = θ m1,s B s θ m2,s B s... θ mm,s B s s=0 s=0 10 =

q s=0 θ 11,sB s q s=0 θ 12,sB s... q s=0 θ 1m,sB s = q s=0 θ 21,sB s q s=0 θ 22,sB s... q s=0 θ 2m,sB s...... q s=0 θ m1,sb s q s=0 θ m2,sb s... q s=0 θ mm,sb s. Při označení θ ij (B) = q s=0 θ ij,sb s lze tedy psát θ 11 (B) θ 12 (B)... θ 1m (B) θ 21 (B) θ 22 (B)... θ 2m (B) Θ(B) =...... θ m1 (B) θ m2 (B)... θ mm (B). Definice 2.8: Autoregresní posloupnost Nechť {Y t, t Z} je m-rozměrný bílý šum, p N, Φ 1, Φ 2,..., Φ p jsou matice typu m m, přičemž Φ p je nenulová. Pak se m-rozměrná náhodná posloupnost {X t, t Z} nazývá autoregresní posloupnost řádu p, značíme AR(p), jestliže X t = Y t Φ 1 X t 1 Φ 2 X t 2... Φ p X t p pro všechna t Z. Označíme-li opět Φ(B) = p s=0 Φ sb s, kde Φ 0 = I je jednotková matice, lze ekvivalentně psát Φ(B)X t = Y t. Úmluva 2.9: V definicích 2.5 a 2.8 byly pro zpřehlednění zápisu zavedeny matice Θ 0 = I a Φ 0 = I. Ze stejného důvodu budeme i v dalším textu matice Θ 0 a Φ 0 ztotožňovat s jednotkovými maticemi. Definice 2.10: Posloupnost ARMA Nechť {Y t, t Z} je bílý šum, p, q, Θ 0, Θ 1,..., Θ q, Φ 0, Φ 1,..., Φ p, Θ(B) a Φ(B) jako v předchozích definicích, pak se náhodná posloupnost {X t, t Z} nazývá smíšený model autoregrese a klouzavých součtů řádů p a q, značíme ARMA(p, q), jestliže Φ(B)X t = Θ(B)Y t. 2.2 Stacionarita a invertibilita posloupností ARMA Teorie ARMA modelů je vytvořena hlavně pro třídu posloupností, které mají vlastnost stacionarity a invertibility. Stacionarita a invertibilita jsou důležité pro identifikaci příslušného ARMA modelu a pro konstrukci předpovědí. Pokud je úkolem analyzovat nestacionární časovou řadu, je obvykle možné ji transformovat na řadu stacionární, jak bude ještě dále zmíněno. 11

Definice 2.11: Sčitatelnost v absolutní hodnotě Posloupnost matic {Ψ s, s N 0 }, kde Ψ s = [ψ ij,s ] i,j=1,2,...,m, se nazývá sčitatelná v absolutní hodnotě, jestliže s=0 ψ ij,s < pro všechna i a j. Definice 2.12: Stacionarita Nechť {X t } je posloupnost ARMA(p, q). Posloupnost {X t } se nazývá stacionární, jestliže existuje posloupnost matic {Ψ s, s N 0 } sčitatelná v absolutní hodnotě a taková, že X t = s=0 Ψ sy t s. Poznámka 2.13: V celé práci se konvergencí náhodných veličin a vektorů myslí konvergence podle kvadratického středu, tedy například symbol X t = s=0 Ψ sy t s znamená [( q ) T q )] lim E X t Ψ s Y t s (X t Ψ s Y t s = 0. q s=0 s=0 Aby však uvedená definice stacionarity byla korektní, je třeba si uvědomit, že symbol X t = s=0 Ψ sy t s znamená, že jednak existuje limita podle kvadratického středu posloupnosti q s=0 Ψ sy t s pro q a jednak že je tato limita rovna X t. Následující tvrzení vysvětluje, že v případě stacionarity se není potřeba existencí limity nijak zvlášť zabývat. Tvrzení 2.14: Důkaz: Pokud {Ψ s, s N 0 } je posloupnost matic sčitatelná v absolutní hodnotě, pak posloupnost částečných součtů X q t = q s=0 Ψ sy t s konverguje podle kvadratického středu pro všechna t Z a pro q. Dokážeme, že posloupnost {X q t, q N} je cauchyovská podle kvadratického středu pro libovolné t. Mějme n 1 < n 2, je třeba dokázat [( ) T ( )] E X n 2 t X n 1 t X n 2 t X n 1 t 0, n 1, n 2. Protože (X n 2 t X n 1 t ) T (X n 2 t X n 1 t ) je součtem diagonálních prvků (tzv. stopou) matice (X n 2 t X n 1 t )(X n 2 t X n 1 t ) T, je také E[(X n 2 t X n 1 t ) T (X n 2 t X n 1 t )] součtem diagonálních prvků λ n 1n 2 ii matice Λ n 1n 2 = E[(X n 2 t X n 1 t )(X n 2 t X n 1 t ) T ] přes i = 1, 2,..., m. Zabývejme se tedy maticí Λ n 1n 2 : [( )( ) T ] Λ n 1n 2 = E X n 2 t X n 1 t X n 2 t X n 1 t = 12

[( n 2 = E [ n 2 = E = s=n 1 +1 n 2 s=n 1 +1 l=n 1 +1 n 2 n 2 s=n 1 +1 l=n 1 +1 )( n 2 Ψ s Y t s Ψ s E l=n 1 +1 Ψ l Y t l ) T ] = ] Ψ s Y t s Yt lψ T T l = [ ] Y t s Yt l T Ψ T l. Protože E[Y t s Yt l T ] je podle definic 1.4 a 2.1 nulová pro s l, je Λ n 1n 2 = n 2 s=n 1 +1 Ψ s ΣΨ T s, kde Σ = [σ ij ] i,j=1,2,...,m je rozptylová matice E[Y t s Yt s] T bílého šumu. Matice Λ n 1n 2 má tedy prvky λ n 1n 2 ij = = n 2 s=n 1 +1 n 2 ( m ( m ) ψ il,s σ lk )ψ kj,s T = m k=1 s=n 1 +1 k=1 l=1 a speciálně na diagonále λ n 1n 2 ii = l=1 m ψ il,s σ lk ψ jk,s = m k=1 m l=1 n 2 σ lk s=n 1 +1 m k=1 m l=1 ψ il,s ψ ik,s. n 2 σ lk s=n 1 +1 ψ il,s ψ jk,s Není těžké si uvědomit, že z podmínky sčitatelnosti v absolutní hodnotě s=0 ψ ij,s < pro všechna i, j = 1, 2,..., m plyne mimo jiné také s=0 ψ il,sψ ik,s < pro libovolná i, l, k = 1, 2...., m, tedy také n2 s=n 1 +1 ψ il,sψ ik,s 0 pro n 1 < n 2 a n 1, n 2. Pak také λ n 1n 2 ii 0 a konečně [( ) T ( )] E X n 2 t X n 1 t X n 2 t X n 1 t = m i=1 λ n 1n 2 ii 0, n 1, n 2. Tedy {X q t, q N} je cauchyovská podle kvadratického středu. Poznámka 2.15: Nejjednodušším příkladem stacionární posloupnosti ARMA je libovolná posloupnost MA(q). Následující věta dává do souvislosti právě definovanou stacionaritu se slabou stacionaritou definovanou v kapitole 1. 13

Věta 2.16: Důkaz: Stacionární posloupnost ARMA(p, q) je centrovaná slabě stacionární náhodná posloupnost. Stacionární posloupnost ARMA(p, q) lze podle definice 2.12 zapsat ve tvaru X t = s=0 Ψ sy t s, kde {Ψ s, s N 0 } je posloupnost matic sčitatelná v absolutní hodnotě. Podle předchozího tvrzení je X t limitou podle kvadratického středu posloupnosti X q t pro každé t T a pro q. Protože EX q t = q s=0 Ψ sey t s = 0 pro všechna q N, je také střední hodnota EX t nulová. Pro každé q N a k N 0 je ] [( Γ q (k) = E [(X q )( q ) T ] qt )(X qt+k )T = E Ψ s Y t s Ψ l Y t+k l = [( q )( q+k = E Ψ s Y t s = s=0 q+k q Ψ s E s=0 l=k l=k [ Y t s Y T t l s=0 Y T t lψ T l k ] Ψ T l k. )] = Protože EY t s Yt l T je nulová matice pro s l a EY t syt s T značíme Σ, platí { q Γ q (k) = s=k Ψ sσψ T s k pro k = 0, 1,..., q 0 pro k > q, nazávisle na t, pak také Γ(k) = E[X t X T t+k ] nezávisí na t. Konečnost plyne podobnou úvahou jako v předchozím důkazu ze sčitatelnosti posloupnosti {Ψ s } v absolutní hodnotě s použitím konečnosti matice Σ. Posloupnost {X t } je tedy centrovaná slabě stacionární náhodná posloupnost. Věta 2.17: Podmínka stacionarity Důkaz: Posloupnost ARMA(p, q) daná rovnicí Φ(B)X t = Θ(B)Y t je stacionární, pokud kořeny polynomu det(φ(b)) leží vně jednotkového kruhu. Je potřeba dokázat, že Φ(B)X t = Θ(B)Y t lze přepsat do tvaru X t = Ψ(B)Y t, kde řada {Ψ s, s N 0 } je sčitatelná v absolutní hodnotě. Protože s ohledem na poznámku 2.7 lze s Φ(B) formálně zacházet jako s maticí, je nejvhodnějším kandidátem na Ψ(B) jistě Φ(B) 1 Θ(B) (pokud Φ(B) 1 existuje), pak totiž l=0 Φ(B)X t = Φ(B)Φ(B) 1 Θ(B)Y t = Θ(B)Y t. 14

Předpokládejme nejprve, že inverzní matice k Φ(B) existuje, pak podle známého vztahu pro inverzní matici je Ψ(B) = Φ(B) 1 Θ(B) = 1 det(φ(b)) Φ+ (B)Θ(B), kde Φ + (B) značí matici adjungovanou k matici Φ(B). Prvky matice Φ + (B)Θ(B) jsou konečné polynomy v B (tj. tvaru L l=0 a ij,lb l, kde L N), neboť prvky matice Φ + (B) jsou determinanty podmatic matice Φ(B) a matice Φ(B) a Θ(B) jsou podle poznámky 2.7 matice konečných polynomů v B. Prvky matice Ψ(B) jsou tedy tvaru ψ ij (B) = 1 det(φ(b)) L a ij,l B l V [4] na str. 60 je dokázáno, že leží-li kořeny nějakého polynomu p(b) vně 1 jednotkového kruhu, lze psát ve tvaru p(b) k=0 b kb k, kde navíc k=0 b k <. Odtud plyne existence posloupnosti {b k, k Z}, kde k=0 b k <, takové, že a následně také existence Φ(B) 1. Je tedy l=0 1 det(φ(b)) = b k B k k=0 ψ ij (B) = = b k B k k=0 L l=0 a ij,l B l = L 1 ( s a ij,l b s l )B s + s=0 l=0 s=l l=0 ( L a ij,l b s l )B s. Přitom tudíž s=l L a ij,l b s l l=0 L 1 s=0 L l=0 s a ij,l b s l + l=0 ( a ij,l s=l k=l l ) b k <, L a ij,l b s l < Označíme-li ψ ij,s = min(s,l) l=0 a ij,l b s l prvky matice Ψ s pro s N 0, pak {Ψ s, s N 0 } je sčitatelná v absolutní hodnotě a X t = s=0 Ψ sy t s, tedy {X t } je stacionární. l=0 15

Definice 2.18: Invertibilita Nechť {X t } je posloupnost ARMA(p, q). Posloupnost {X t } se nazývá invertibilní, jestliže existuje posloupnost matic {π s, s N 0 } sčitatelná v absolutní hodnotě a taková, že Y t = s=0 π sx t s. V případě invertibility již neplatí analogie s tvrzením 2.14, že pro libovolnou posloupnost {Π s } a libovolnou náhodnou posloupnost {X t } existuje limita podle kvadratického středu posloupnosti p s=0 π sx t s pro p. Proto je potřeba v podmínce invertibility přidat dodatečný předpoklad o konečnosti kovarianční maticové funkce posloupnosti {X t }. Věta 2.19: Podmínka invertibility Důkaz: Posloupnost ARMA(p, q) s konečnou kovarianční maticovou funkcí daná rovnicí Φ(B)X t = Θ(B)Y t je invertibilní, pokud kořeny polynomu det(θ(b)) leží vně jednotkového kruhu. Posloupnost {Π s } sčitatelná v absolutní hodnotě se sestrojí analogickým postupem jako posloupnost {Ψ s } v důkazu podmínky stacionarity. K dokončení důkazu je zapotřebí ukázat existenci limity podle kvadratického středu posloupnosti p s=0 Π sx t s pro p. Vzhledem k analogii s důkazem tvrzení 2.14 stačí vyšetřovat pro libovolné t T diagonální prvky matice Λ n 1n 2 (t) = n 2 s=n 1 +1 l=n 1 +1 n 2 s=n 1 +1 l=n 1 +1 k=1 k =1 Ψ s Γ(t s, t l)ψ T l, ty mají (při zřejmém označení prvků matic Π a Γ) tvar n 2 n 2 ( m m ) λ n 1n 2 (t) = π ik,s γ kk (t s, t l)π ik,l. Vzhledem ke konečnosti kovarianční maticové funkce Γ je m m ( n 2 )( n 2 ) λ n 1n 2 (t) max(γ kk (t s, t l)) π ik,s π ik,l, s,l s=n 1 +1 l=n 1 +1 k=1 k =1 pak díky sčitatelnosti posloupnosti {Π s } v absolutní hodnotě platí λ n 1n 2 (t) 0 pro n 1, n 2 a posloupnost p s=0 Π sx t s je cauchyovská a tedy konvergentní podle kvadratického středu. Poznámka 2.20: Zatímco v jednorozměrném případě je při zápisu stacionární posloupnosti ARMA ve tvaru X t = s=0 ψ sy t s součet na pravé straně vždy součtem nekonečně mnoha členů (takovou posloupnost bychom mohli značit MA( )) a stejně tak invertibilní posloupnost ARMA lze zapsat jedině jako AR( ), v mnohorozměrném případě existují posloupnosti, které lze současně zapsat jako posloupnost AR(p) a současně jako MA(q) pro konečná p i q, podrobnější vysvětlení lze nalézt v [5] na str. 347-348. 16

Stacionarizace časové řady Podle věty 2.16 se stacionární ARMA posloupnost vyznačuje tím, že její střední hodnota je nulová a její kovarianční maticová funkce se nemění v čase. Pokud analyzovaná časová řada vykazuje buď nenulovou střední hodnotu, nebo nekonstantní kovarianční maticovou funkci, využívají se ke stacionarizaci takové řady metody analogické metodám používaným v jednorozměrném případě, mnohorozměrnou časovou řadu je totiž možno transformovat po složkách. Postupy transformace jsou uvedeny v [1] na str. 144-148. Zde jen ve zkratce uveďme, že typickou transformací odstraňující nestacionaritu v kovarianční maticové funkci je přechod od původní řady k řadě jejích logaritmů a typickou transformací odstraňující nestacionaritu ve střední hodnotě je přechod k řadě diferencí. 17

Kapitola 3 Identifikace ARMA modelu Stěžejní součástí použití ARMA modelů na pozorovanou časovou řadu je identifikace modelu. Na základě pozorovaných dat je potřeba určit řád modelu, který budeme používat, a odhadnout parametry modelu. Poznamenejme, že velký důraz bývá kladen na to, aby řád modelu nebyl zbytečně vysoký a nezvyšoval tak výpočtovou náročnost odhadu parametrů i konstrukce předpovědí. Ještě před vlastní identifikací modelu by měla být pozorovaná časová řada transformována na řadu stacionární a centrovanou, jak je popsáno na konci kapitoly 2. Po skončení celého dále popsaného postupu včetně konstrukce předpovědí se inverzní transformací přejde k původní řadě. Úmluva 3.1: Dále budeme, jak bývá zvykem, pojmem časová řada rozumět řadu pozorovaných hodnot, přičemž hodnotu v čase t budeme značit x t. Pro teoretický popis budeme i nadále používat pojem náhodná posloupnost a příslušné náhodné vektory značit X t. Složky těchto jednotlivých vektorů budeme značit x i,t, resp. X i,t pro i = 1, 2,..., m. Rozsah výběru x t budeme označovat n, tzn. předpokládáme, že známe x t pro t = 1, 2,..., n. 3.1 Určení řádu modelu Určení řádů p a q modelu ARMA(p,q) je založeno na zkoumání výběrové korelační maticové funkce, výběrové parciální autoregresní maticové funkce a výběrové parciální korelační maticové funkce. Obvykle stačí použít jen několik prvních hodnot těchto funkcí, například 10 až 20, přitom by se jich nemělo používat více než n. I tak je však potřeba 4 počítat s tím, že pracujeme pouze s odhady příslušných charakteristik, které mohou být zkreslené, a netrvat proto striktně na výsledcích dále popsaných statistických testů. V případě nejasné volby mezi několika modely je vhodné pokračovat se všemi modely a pro ten správný se rozhodnout až ve fázi odhadu parametrů nebo ve fázi verifikace modelu. 18

3.1.1 Kovarianční a korelační maticová funkce Kovarianční maticová funkce je vhodným nástrojem pro určení řádu q, chceme-li popsat pozorovanou časovou řadu modelem MA(q). Věta 3.2: Důkaz: Kovarianční maticová funkce Γ(k) posloupnosti MA(q) je nulová pro všechna k > q. Pro každé k N 0 je podle definic 1.4 a 2.5 [ ] [( q )( q ) T ] Γ(k) = E X t X T t+k = E Θ s Y t s Θ l Y t+k l = s=0 [( q )( q+k = E Θ s Y t s s=0 l=k Y T t lθ T l k l=0 )] = q+k q s=0 l=k [ ] Θ s E Y t s Yt l T Θ T l k. Protože E[Y t s Yt l T ] = 0 je nulová matice pro s l, je Γ(k) = 0 pro k > q. Uvážíme-li, že Γ( k) = Γ(k) T, pak Γ(k) = 0 pro k > q. Řád q se tedy volí takový, jaké je poslední k, pro které je ještě kovarianční matice Γ(k) statisticky významně nenulová. Poznámka 3.3: Výpočet uvedený v důkazu předchozí věty ukazuje tvar kovarianční maticové funkce pro posloupnost MA(q), ten je konkrétně q k s=0 Θ s+kσθ T s, 0 k q, Γ(k) = Γ( k) T, q k 0, 0, k > q. Pro posloupnosti AR a ARMA je výpočet kovarianční maticové funkce složitější. Uvažujme stacionární posloupnost ARMA(p,q) danou rovnicí X t +Φ 1 X t 1 +Φ 2 X t 2 +...+Φ p X t p = Y t +Θ 1 Y t 1 +Θ 2 Y t 2 +...+Θ q Y t q. Vynásobíme-li tuto rovnici postupně pro k = 1, 2,... zprava vektorem X T t k, pak rovnost středních hodnot transpozic obou stran dává soustavu rovnic Γ(0) + Γ(1) T Φ T 1 +... + Γ(p) T Φ T p = Γ(1) + Γ(0)Φ T 1 +... + Γ(p 1) T Φ T p =. q E[X t Yt s]θ T T s, s=0 q E[X t 1 Yt s]θ T T s, s=0 19

Γ(p) + Γ(p 1)Φ T 1 +... + Γ(0)Φ T p = Γ(k) + Γ(k 1)Φ T 1 +... + Γ(k p)φ T p = q E[X t p Yt s]θ T T s, s=0 q E[X t k Yt s]θ T T s pro k > p. Přitom výrazy na pravé straně lze rovněž vyčíslit. Předně je pravá strana nulová pro k > q, neboť X t k a Y t s jsou nekorelované pro k > s. Dále lze pro k q vypočítat q s=0 E[X t kyt s]θ T T s podobným postupem, jakým se počítá kovarianční maticová funkce posloupnosti MA, když se dosadí X t k = s=0 Ψ sy t k s ze stacionarity procesu {X t k }, konkrétně vychází q s=0 E[X t kyt s]θ T T s = q s=k Ψ s kσθ T s. Soustava rovnic s takto dosazenými pravými stranami se nazývá Yule-Walkerova soustava rovnic. Pro testování hypotéz o nulovosti kovarianční matice je vhodné definovat ještě korelační a výběrovou korelační matici. Definice 3.4: Korelační matice Nechť {X t } je slabě stacionární náhodná posloupnost s kovarianční maticovou funkcí Γ(k) = [γ ij (k)] i,j=1,2,...,m. Označme diagonální matici { 1 = diag γ11 (0), 1 γ22 (0),..., 1 }. γmm (0) Pak pro každé k Z definujeme korelační matici ρ(k) jako ρ(k) = Γ(k). s=0 Poznámka 3.5: Matice ρ(k) má na místě i, j prvek ρ ij (k) = γ ij (k) γii (0)γ jj (0), což je korelační koeficient i-té složky vektoru X t a j-té složky vektoru X t+k. Odtud je mimo jiné patrné, že korelační matice je nulová, právě když je nulová kovarianční matice. Definice 3.6: Výběrová korelační matice Nechť časová řada {x t, t = 1, 2,..., n}, n N je realizací náhodné posloupnosti {X t, t N}. Pak se matice ˆρ(k) s prvky n k t=1 ˆρ ij (k) = (x t,i x i )(x t+k,j x j ) ( n t=1 (x t,i x i ) ) 1/2 2 n t=1 (x t,j x j ) 2 nazývá výběrová korelační matice. 20

Úmluva 3.7: Zde i v dalším textu bude x i = 1 n n i=1 x i,t, i = 1, 2,..., m značit odhad střední hodnoty pro jednotlivé složky časové řady. Věta 3.8: Asymptotické vlastnosti výběrové korelační matice Pokud pro prvky korelační maticové funkce platí ρ ij (k) = 0 pro k > q pro nějaké q, pak pro k > q a pro velká n má ˆρ ij (k) asymptoticky normální rozdělení s nulovou střední hodnotou a rozptylem σ ij (k) 2 = 1 (1 + 2 k n k s=1 ρ ii(s)ρ jj (s)). Navíc pro k > q má statistika R(k) = m i=1 m j=1 ( ˆρij (k) ) 2 σ ij (k) Důkaz: asymptoticky chí-kvadrát rozdělení o m 2 stupních volnosti. Rozptyl ˆρ ij (k) je vypočítán v [5] na str. 350 jako 1 (1 + 2 q n k s=1 ρ ii(s)ρ jj (s)), tento výraz lze za uvedeného předpokladu, že ρ ij (k) = 0 pro k > q, nahradit výrazem 1 (1 + 2 k n k s=1 ρ ii(s)ρ jj (s)). Asymptotická normalita je dokázána v [2] na str. 228. Rozdělení statistiky R(k) pak plyne přímo z definice chí-kvadrát rozdělení. Test nulovosti prvků korelační matice Asymptotického rozdělení prvků výběrové korelační matice ˆρ ij (k) z věty 3.8 lze využít k testování hypotézy o nulovosti jednotlivých korelačních koeficientů. Testujme nulovou hypotézu, že ρ ij (k) = 0 pro k > q pro zvolené q (tzn. zkoumaná časová řada je posloupnost MA řádu q), proti alternativní hypotéze ρ ij (k) 0 pro nějaké k > q. Pak vzhledem k asymptoticky normálnímu rozdělení ˆρ ij (k) zamítáme na hladině α nulovou hypotézu ve prospěch alternativní, pokud ˆρ ij (k) ˆσ ij (k) > u 1 α 2 pro některé k, kde u β značí β-kvantil standardního normálního rozdělení a ˆσ ij (k) = 1 n k (1 + 2 k 1/2. ˆρ ii (s)ˆρ jj (s)) Vzhledem k tomu, že ρ ij (k) = ρ ji ( k) pro k 0, stačí ˆρ ij (k) uvažovat pouze pro kladná k. V případě, že za hladinu α volíme často používaných 5%, je u 1 α 2 s=1. = 2 a testování hypotézy o nulovosti prvků korelační matice se redukuje na porovnání absolutní hodnoty odhadu ˆρ ij (k) s dvojnásobkem odhadnuté směrodatné odchylky ˆσ ij (k). 21

Pro zjednodušení zápisu výsledku testu se v literatuře ustálila následující symbolika: Prvek ˆρ ij (k) se v matici ˆρ(k) nahradí symbolem + pokud ˆρ ij (k) > 2 ˆσ ij (k), symbolem pokud ˆρ ij (k) < 2 ˆσ ij (k) a symbolem jinak. Praktický postup je tedy takový, že se pro jednotlivá k porovná hodnota ˆρ ij (k) se součinem u 1 α ˆσ ij(k), pokud existuje q takové, že pro k > q již ˆρ 2 ij (k) nepřesahují u 1 α ˆσ ij(k), 2 zkoumaná časová řada je pravděpodobně posloupnost MA(q). Obvykle se doporučuje hledat takto pouze velmi malá q (například nejvýše 2), pokud je nalezené q příliš velké nebo se žádné vhodné nepodaří najít, zkoumaná časová řada pravděpodobně není posloupnost MA, ale spíše posloupnost AR nebo ARMA. Na tomto místě dále rozvedeme myšlenku z úvodu kapitoly, že je potřeba k tomuto testu přistupovat s jistou rezervou způsobenou možným zkreslením odhadů ˆρ ij (k). V případě, že bychom na základě tohoto testu měli pro nějakou malou skupinu i, j a k nulovost ρ ij (k) zamítat, prozkoumáme ještě, jak významně výběrové korelační koeficienty překročily dvojnásobek příslušné odhadnuté směrodatné odchylky, pokud se překročení nejeví příliš významné, je možné připustit, že nulovou hypotézu nezamítneme. Test nulovosti korelační matice S využitím chí-kvadrát rozdělení statistiky R(k) z věty 3.8 lze testovat také přímo nulovost celé korelační matice. Její nulovost zamítáme, pokud R(k) > χ 2 m2(1 α), kde χ 2 m (β) značí β-kvantil chí-kvadrát rozdělení o m 2 stupních volnosti. Poznamenejme, 2 že v R(k) jsou v tomto případě místo hodnot σ ij (k) dosazeny jejich odhady ˆσ ij (k). 3.1.2 Parciální autoregresní maticová funkce Parciální autoregresní matice je v jistém smyslu analogickým pojmem k parciálnímu autokorelačnímu koeficientu, který se v případě jednorozměrných časových řad často používá k volbě řádu autoregrese p. Jak je dokázáno například v [5] na str. 14-16, parciální autokorelační koeficient řádu k je roven poslednímu regresnímu parametru φ k,k v případě lineárního regresního modelu X t+k = φ k,1 X t+k 1 + φ k,2 X t+k 2 +... + φ k,k X t + e k,t+k. Definice 3.9: Parciální autoregresní maticová funkce Nechť {X t } je slabě stacionární náhodná posloupnost, uvažujme mnohorozměrný lineární regresní model X t+k = Φ k,1 X t+k 1 + Φ k,2 X t+k 2 +... + Φ k,k X t + e k,t+k, kde X t+k je vysvětlovaná, X t+k 1, X t+k 2,..., X t jsou vysvětlující proměnné a e k,t+k je reziduální vektor. Pak se funkce ζ(k) = Φ k,k definovaná pro k = 1, 2,... nazývá parciální autoregresní maticová funkce náhodné posloupnosti {X t }. 22

Poznámka 3.10: V [5] na str. 351-352 je odvozen způsob výpočtu parciální autoregresní maticové funkce pro náhodnou posloupnost s kovarianční maticovou funkcí Γ(s). Zaveďme nejprve následující označení blokových matic: Γ(0) Γ(1) T... Γ(k 2) T Γ(1) Γ(0)... Γ(k 3) T A(k) =......, Γ(k 2) Γ(k 3)... Γ(0) b(k) = Γ(k 1) T Γ(k 2) T. Γ(1) T, c(k) = Γ(1) Γ(2). Γ(k 1) Pak { Γ(1) T (Γ(0)) 1, k = 1, ζ(k) = ( )( 1, Γ(k) T c(k) T (A(k)) 1 b(k) Γ(0) b(k) T (A(k)) b(k)) 1 k > 1.. Věta 3.11: Důkaz: Parciální autoregresní maticová funkce ζ(k) posloupnosti AR(p) je nulová pro k > p. Navíc platí ζ(p) = Φ p, uvažujeme-li Φ p z definice 2.8. Předpokládejme, že {X t } je posloupnost AR(p), pak se mnohorozměrný lineární regresní model uvedený v definici 3.9 X t+k = Φ k,1 X t+k 1 + Φ k,2 X t+k 2 +... + Φ k,k X t + e k,t+k pro k = p a po přeznačení shoduje s rovností definující posloupnost AR(p) v definici 2.8 X t = Φ 1 X t 1 Φ 2 X t 2... Φ p X t p + Y t, proto je ζ(p) = Φ p. Podobnou úvahou vychází, že pro k > p je ζ(k) = Φ k = 0. 23

Definice 3.12: Výběrová parciální autoregresní matice Nechť časová řada {x t, t = 1, 2,..., n}, n N je realizací náhodné posloupnosti {X t, t N}. Pak se matice ˆζ(k) vypočtená podle poznámky 3.10, kde se místo Γ(s) pro s = 0, 1,..., k 1 dosadí matice ˆΓ(s) s prvky ˆγ ij (s) = 1 n s (x t,i x i )(x t+s,j x j ), n t=1 nazývá výběrová parciální autoregresní matice. Pokud regresní model uvedený v definici 3.9 pro nějaké k aplikujeme na pozorovanou časovou řadu, jsou jeho výstupem nejen odhady ˆΦ k,1, ˆΦ k,2,..., ˆΦ k,k, ale také odhad rozptylové matice bílého šumu S(k) = ˆΣ = 1 S(k), kde n k n t=k+1 (x t ˆΦ k,1 x t 1 ˆΦ k,2 x t 2... ˆΦ k,k x t k ) Statistika S(k) se použije v následující větě. (x t ˆΦ k,1 x t 1 ˆΦ k,2 x t 2... ˆΦ k,k x t k ) T. Věta 3.13: Asymptotické vlastnosti výběrové parciální autoregresní matice Důkaz: Nechť časová řada {x t, t = 1, 2,..., n}, n N je realizací posloupnosti AR(p), pak pro k > p a pro velká n má statistika M(k) = (n k 1 ) 2 km det(s(k)) log det(s(k 1)) asymptoticky chí-kvadrát rozdělení o m 2 stupních volnosti. Věta je odvozena v [5] na str. 353-355. Test nulovosti parciální autoregresní matice Testujme nulovou hypotézu, že ζ(k) = 0 pro zvolené k (tzn. zkoumaná časová řada je posloupnost AR řádu nejvýše k 1) proti alternativní hypotéze ζ(k) 0. Pak s ohledem na předchozí větu zamítáme nulovou hypotézu na hladině α ve prospěch alternativní, pokud M(k) > χ 2 m2(1 α). Uvedená testová statistika se tedy vypočte například pro k = 1, 2,..., 10 (nebo například až do 20) a porovná se s příslušným kvantilem chí-kvadrát rozdělení, pokud existuje takové p, že pro k p zamítáme nulovost ζ(k) a pro k > p ji nezamítáme, zkoumaná časová řada je pravděpodobně posloupnost AR(p). Stejně jako v případě testu nulovosti korelačních matic je vhodné volit poměrně malá p, jinak se pravděpodobně nejedná o posloupnost AR. Opět připomeňme, že popsaný postup není potřeba dodržovat zcela striktně, je vhodné kromě samotného výsledku testu zkoumat také velikost překročení příslušného kvantilu pro jednotlivé hodnoty ζ(k). 24

3.1.3 Parciální korelační maticová funkce Parciální korelační maticová funkce je opět mnohorozměrnou analogií parciálního autokorelačního koeficientu, tentokrát v tom smyslu, že parciální korelační maticová funkce v bodě k je korelační maticí mezi X t a X t+k po vyloučení lineární závislosti na vektorech X t+1, X t+2,..., X t+k 1. Definice 3.14: Parciální korelační maticová funkce Nechť {X t } je slabě stacionární náhodná posloupnost, mějme t Z a k N a zaveďme vektory u k 1,t+k = X t+k α k 1,1 X t+k 1 α k 1,2 X t+k 2... α k 1,k 1 X t+1 a v k 1,t = X t β k 1,1 X t+1 β k 1,2 X t+2... β k 1,k 1 X t+k 1, kde α k 1,s, β k 1,s pro s = 1, 2,..., k 1 jsou matice minimalizující E(u k 1,t+k ) 2, resp. E(v k 1,t ) 2 a pro které označíme V u (k) = var(u k 1,t+k ), V v (k) = var(v k 1,t ) a V vu (k) = cov(u k 1,t+k, v k 1,t ). Označme dále D v (k) diagonální matici, která má na diagonále odmocniny příslušných diagonálních prvků matice V v (k), a D u (k) diagonální matici analogicky odvozenou z V u (k). Pak se funkce ξ(k) = (D v (k)) 1 V vu (k)(d u (k)) 1 definovaná pro k = 1, 2,... nazývá parciální korelační maticová funkce náhodné posloupnosti {X t }. Poznámka 3.15: Matice ξ(k) má na místě i, j korelační koeficient i-té složky vektoru u k 1,t+k a j-té složky vektoru v k 1,t. Poznámka 3.16: V [5] na str. 359-361 je odvozen rekurentní algoritmus pro výpočet parciální kovarianční maticové funkce pro náhodnou posloupnost s kovarianční maticovou funkcí Γ(s). Pro k = 1 je V u (1) = V v (1) = Γ(0), Dále pro k 2 a s = 1, 2,..., k 1 V vu (1) = Γ(1), α 1,1 = Γ(1) T (Γ(0)) 1 a β 1,1 = Γ(1)(Γ(0)) 1. k 1 V u (k) = Γ(0) α k 1,s Γ(s), 25 s=1

k 1 V v (k) = Γ(0) β k 1,s Γ(s) T, s=1 k 1 V vu (k) = Γ(k) Γ(k s)αk 1,s, T s=1 α k,k = V vu (k) T (V v (k)) 1, α k,s = α k 1,s α k,k β k 1,k s, β k,k = V vu (k)(v u (k)) 1, β k,s = β k 1,s β k,k β k 1,k s. Nechť D v (k) a D u (k) jsou jako v definici 3.14. Pak ξ(k) = (D v (k)) 1 V vu (k)(d u (k)) 1. Tvrzení 3.17: Důkaz: Nechť {X t } je slabě stacionární náhodná posloupnost, ζ(k) její parciální autoregresní maticová funkce a ξ(k) její parciální korelační maticová funkce. Pak je ζ(k) = 0 právě pro taková k, pro něž je ξ(k) = 0. Podrobně je důkaz proveden v [5] na str. 358-359, poznamenejme jen, že vztah pro ζ(k) uvedený v poznámce 3.10 lze přepsat do tvaru ζ(k) = Vvu(k)(V T v (k)) 1, odkud již tvrzení snadno plyne. S ohledem na toto tvrzení je tedy možné pro určení řádu autoregrese zvolit jeden ze dvou rovnocenných nástrojů - parciální autoregresní maticovou funkci, nebo parciální korelační maticovou funkci. Věta 3.18: Parciální korelační maticová funkce ξ(k) posloupnosti AR(p) je nulová pro k > p. Důkaz: Věta je přímým důsledkem věty 3.11 a tvrzení 3.17. Definice 3.19: Výběrová parciální korelační matice Nechť časová řada {x t, t = 1, 2,..., n}, n N je realizací náhodné posloupnosti {X t, t N}. Pak se matice ˆξ(k) vypočtená podle poznámky 3.16, kde se místo Γ(s) pro s = 0, 1,..., k dosadí matice ˆΓ(s) s prvky ˆγ ij (s) = 1 n s (x t,i x i )(x t+s,j x j ), n t=1 nazývá výběrová parciální korelační matice. 26

Věta 3.20: Asymptotické vlastnosti výběrové parciální korelační matice Důkaz: Nechť časová řada {x t, t = 1, 2,..., n}, n N je realizací posloupnosti AR(p), pak pro k > p a pro velká n má ˆξ ij (k) asymptoticky normální rozdělení s nulovou střední hodnotou a rozptylem 1. n k Navíc pro k > p má statistika X(k) = (n k) m i=1 m 2 (ˆξij (k)) asymptoticky chí-kvadrát rozdělení o m 2 stupních volnosti. Jak je zmíněno v [5] na str. 362, za uvedeného předpokladu, že se jedná o posloupnost AR(p), jsou posloupnosti {u k 1,t+k, t = 1, 2,..., n k} a {v k 1,t, t = 1, 2,..., n k} vzájemně nekorelované posloupnosti téhož bílého šumu. Použitím věty 3.8 pro bílý šum s ohledem na poznámku 3.15, podle níž je ˆξ ij (k) korelační maticí vektorů u k 1,t+k a v k 1,t, vychází pro ˆξ ij (k) asymptoticky normální rozdělení s nulovou střední hodnotou a rozptylem 1. n k Odtud již z definice chí-kvadrát rozdělení plyne rozdělení statistiky X(k). j=1 Test nulovosti prvků parciální korelační matice Test nulovosti jednotlivých prvků parciální korelační matice využívá jejich asymptoticky normálního rozdělení podle věty 3.20. Postup je stejný jako v případě testu nulovosti prvků korelační maticové funkce, nulovost zamítáme na hladině α, pokud ˆξ ij (k) > u 1 α 2 1 n k, resp. ˆξ ij (k) > 2 n k pro α = 0, 05. Pro zápis je opět možno použít symboly +, a zmíněné v odstavci o testování nulovosti prvků korelační matice. Test nulovosti parciální korelační matice Test nulovosti celé parciální korelační matice je založen na asymptotickém rozdělení statistiky X(k) z věty 3.20, nulovost zamítáme na hladině α, pokud X(k) > χ 2 m2(1 α). 3.1.4 Shrnutí volby řádu modelu Přestože výpočet výběrové korelační maticové funkce a výběrové parciální autoregresní nebo parciální korelační maticové funkce je k odhadu řádu příslušné posloupnosti nezbytný, univerzální návod k volbě řádů p a q obvykle nedává. Zřejmým nedostatkem výše popsaných metod je fakt, že nedávají návod, jak volit řády smíšeného modelu ARMA(p,q). Navíc i v případě, že se podaří zvolit konkrétní model AR, MA nebo ARMA, jedná se do značné míry o subjektivní odhad, který by bylo vhodné nějakým exaktním způsobem zhodnotit nebo jej porovnat s jinou volbou. Proto nyní popíšeme možnosti volby řádů 27

smíšeného modelu a také statistická kritéria pro porovnávání jednotlivých zvolených modelů. Volba řádů smíšeného modelu ARMA Uvedeme zde dvě možnosti přístupu k volbě řádů smíšeného modelu: První možností vhodnou zejména pro mnohorozměrné časové řady s méně složkami je zkoumat korelační strukturu po jednotlivých složkách a přistupovat k ní jako v případě jednorozměrných časových řad. Za tímto účelem zde zapíšeme rozhodovací schéma uvedené v [1] na str. 120. AR(p) MA(q) ARMA(p,q) ρ k neexistuje k 0, k 0 = q neexistuje k 0, ρ k ve tvaru U ρ k ve tvaru U po prvních q p hodnotách ξ k k 0 = p neexistuje k 0, neexistuje k 0, ξ k omezená křivkou tvaru U ξ k omezená křivkou tvaru U po prvních p q hodnotách V tabulce je použit symbol U, který označuje křivku ve tvaru lineární kombinace klesajících geometrických posloupností a sinusoid s geometricky klesající amplitudou, dále k 0 je takové, že pro k > k 0 je ρ k = 0, resp. ξ k = 0. Za p a q pro zkoumanou mnohorozměrnou řadu pak volíme maximální hodnoty z p a q nalezených pro jednotlivé složky. Další možností v případě, že se nepodařilo zvolit žádný AR ani MA model, je zvolit pro zkoumanou řadu model ARMA(1,1) nebo (se snahou do jisté míry se přidržet rozhodovacích kritérií z předchozího odstavce) například model ARMA(2,1) nebo ARMA (1,2) a pro tento model provést odhad parametrů a verifikaci modelu. Pokud jsou zvolené řády příliš vysoké, projeví se tato skutečnost ve fázi odhadu parametrů, kde odhady některých parametrů budou statisticky nevýznamné. Naopak volba příliš nízkých řádů se odhalí ve fázi verifikace modelu. Statistická rozhodovací kritéria Dosud popsaný postup identifikace modelu má zjevnou slabinu v tom, že velmi závisí na subjektivním rozhodnutí a je tudíž stěží automatizovatelný, navíc obvykle pro danou časovou řadu nabízí více alternativ. Proto jsou požadována objektivní kritéria, která by byla bez jakéhokoliv subjektivního zásahu schopna model identifikovat a postup identifikace tak automatizovat. Taková kritéria zde uvedeme dvě, jejich nejčastější použití je v případě, kdy se na základě subjektivního posouzení časové řady nabízí několik alternativ. Ještě poznamenejme, že rozhodovací kritéria sice uvádíme pro zachování struktury textu na tomto místě, ale pro jejich výpočet je potřeba znát odhady některých parametrů modelu, které budou popsány dále. Prvním a nejpoužívanějším kritériem je Akaikeho informační kritérium (Akaike s Information Criterion, AIC), které má tvar ( ) AIC(p, q) = log det(ˆσ p,q ) + 2m2 (p + q), n 28

kde p a q jsou řády modelu a ˆΣ p,q příslušný odhad rozptylové matice bílého šumu. Za optimální model by pak měl být považován ten, který AIC minimalizuje. Z dalších kritérií zde jmenujme Baysovské informační kritérium (Bayesian Information Criterion, BIC), které má tvar ( ) BIC(p, q) = log det(ˆσ p,q ) + 2m 2 (p + q) log n n a se kterým se zachází stejně jako s AIC. 3.2 Odhad parametrů modelu V případě, že jsou již určeny řády modelu, je možno přistoupit k odhadu parametrů Θ 1, Θ 2,..., Θ q, Φ 1, Φ 2,..., Φ p a Σ modelu ARMA(p,q). 3.2.1 Momentová metoda Momentová metoda odhadu parametrů spočívá ve využití Yule-Walkerovy soustavy rovnic definované v poznámce 3.3. Pokud se do této soustavy místo Γ(k) dosadí ˆΓ(k), lze z ní vypočítat parametry Θ 1,..., Θ q, Φ 1, Φ 2,..., Φ p a Σ. Odhad momentovou metodou pro jednorozměrný případ je možno nalézt například v [4] na str. 139-140 a 143-145, v mnohorozměrném případě je postup analogický, problémem může být nutnost řešit větší množství maticových rovností. 3.2.2 Metoda maximální věrohodnosti Konkrétně budeme pojednávat o podmíněné metodě maximální věrohodnosti. Odhad parametrů modelu metodou maximální věrohodnosti vyžaduje dodatečnou podmínku na rozdělení bílého šumu. Nejčastěji se předpokládá, že bílý šum {Y t } má mnohorozměrné normální rozdělení s nulovou střední hodnotou a rozptylovou maticí Σ. Věrohodnostní funkce má formálně shodný tvar s hustotou sdruženého rozdělení {Y 1, Y 2,..., Y n }, kde jednotlivé vektory Y t pro t = 1, 2,..., n jsou vzájemně nezávislé a mají normální rozdělení s nulovou střední hodnotou a rozptylovou maticí Σ, vyčíslenou v bodech odpovídajících pozorované časové řadě {x 1, x 2,..., x n }, tedy L(Θ, Φ, Σ x 1, x 2,..., x n ) = n t=1 ( (2π) m det(σ)) 1/2e 1 2 yt t Σ 1 y t = = (2π) mn 2 det(σ) n 2 n e 1 2 yt t Σ 1 y t, kde y t = x t + Φ 1 x t 1 +... + Φ p x t p Θ 1 y t 1... Θ q y t q. Protože známe pouze konečnou historii {x 1, x 2,..., x n }, nejsme schopni spočítat y t pro t = 1, 2,..., max(p, q), přejdeme tedy (při označení r = max(p, q)) k funkci L (Θ, Φ, Σ x 1, x 2,..., x n ) = (2π) m(n r) 2 det(σ) n r 2 29 t=1 n t=r+1 e 1 2 yt t Σ 1 y t.

Maximálně věrohodné odhady parametrů jsou takové hodnoty Θ, Φ, Σ, které maximalizují věrohodnostní funkci L (Θ, Φ, Σ x 1, x 2,..., x n ). Pro nalezení maxima funkce L je vhodné přejít k úloze hledání maxima jejího logaritmu m(n r) log L (Θ, Φ, Σ x 1, x 2,..., x n ) = log(2π) n r ( ) log det(σ) 1 2 2 2 n t=r+1 Tvrzení 3.21: Asymptotické vlastnosti odhadů metodou maximální věrohodnosti Nechť časová řada {x t, t = 1, 2,..., n}, n N je realizací stacionární a invertibilní posloupnosti ARMA(p,q), kde navíc příslušný bílý šum má normální rozdělení. Označme η sloupcový vektor všech jejích parametrů (tj. vektor všech prvků matic Θ 1,..., Θ q, Φ 1, Φ 2,..., Φ p a Σ) a ˆη jeho odhad metodou maximální věrohodnosti. Pak náhodná veličina n(ˆη η) konverguje v distribuci k normálnímu rozdělení s nulovou střední hodnotou a rozptylovou maticí Σˆη = ( [ 2 log L (η x 1, x 2,..., x n ) ]) 1 E. η η T y T t Σ 1 y t. Důkaz: Důkaz je uveden [5] str. 363. Test nulovosti parametrů Za účelem snížení výpočtové náročnosti může být vhodné nahradit nulami ty parametry, které se jeví statisticky nevýznamné. Na základě tvrzení 3.21 zamítáme nulovost některého parametru označeného v tomto tvrzení η i na hladině α, pokud ˆη i > u 1 α 2 σˆη,ii, resp. ˆη i > 2 σˆη,ii pro α = 0, 05, kde σˆη,ii značí i-tý diagonální prvek matice Σˆη. 3.3 Verifikace modelu Verifikace modelu spočívá v analýze reziduí ŷ t = x t + ˆΦ 1 x t 1 +... + ˆΦ p x t p ˆΘ 1 ŷ t 1... ˆΘ q ŷ t q. Pokud je model zvolen správně, tzn. správně jsme určili řád modelu a odhady parametrů, rezidua ŷ t budou realizacemi mnohorozměrného bílého šumu, tudíž by měla mít nulovou střední hodnotu a nebýt navzájem korelovaná. Pro upřesnění poznamenejme, že jednotlivé složky konkrétního vektoru ŷ t korelované být mohou. Protože máme k dispozici pozorování x t pouze pro t = 1, 2,..., n, je možno vypočítat rezidua ŷ t pouze pro t = r + 1, r + 2,..., n, kde r = max(p, q) v závislosti na řádech zvoleného modelu. 30

Test nulovosti reziduí Test nulovosti reziduí je založen na skutečnosti, že za nulové hypotézy jsou rezidua ŷ t realizacemi bílého šumu, u kterého předpokládáme nulovou střední hodnotu, nekorelovanost pro různá t a pro který máme odhad ˆΣ rozptylové matice Σ (jejich prvky označme ˆσ ij, resp. σ ij ). Za předpokladu normality a použití centrální limitní věty (např. Lévyho- Lindebergovy centrální limitní věty uvedené v [3] na str. 101) to znamená, že výběrové průměry ȳ i = 1 n n r i=r+1 ŷi,t, i = 1, 2,..., m mají za nulové hypotézy asymptoticky normální rozdělení s nulovou střední hodnotou a rozptylem σ ii n r Nulovou hypotézu zamítáme na hladině α v případě, že pro nějaké i je ȳ i > u 1 α 2 ˆσii n r, resp. ȳ i > 2 ˆσii n r pro α = 0, 05. Pokud navíc předpokládáme, že bílý šum má normální rozdělení (takový předpoklad například umožní pro odhad parametrů použít metodu maximální věrohodnosti), je možné testovat přímo nulovost jednotlivých reziduí, konkrétně nulovost y i,t zamítáme na hladině α, pokud ŷ i,t > u 1 α σii, resp. ŷ 2 i,t > 2 σ ii pro α = 0, 05. Posouzení normality reziduí Posouzení normality reziduí je do značné míry subjektivním procesem, během něhož je například možno posuzovat histogramy jednotlivých složek reziduí, jejich výběrovou šikmost či špičatost a porovnávat je s příslušnými ukazateli pro případ normálního rozdělení. Test nekorelovanosti reziduí K testu nekorelovanosti reziduí se použije výběrová korelační matice vypočtená pro řadu {ŷ t }, neboť za nulové hypotézy jsou jednotlivá rezidua realizací bílého šumu, jehož korelační maticová funkce ρ(k) je nulová pro k 0. Z věty 3.8 použité na bílý šum pak plyne, že ˆρ ij (k) mají asymptoticky normální rozdělení s nulovou střední hodnotou a rozptylem 1 n k. Nulovost nějakého ρ ij (k) zamítáme na hladině α, pokud ˆρ ij (k) > u 1 α 2 1 n k, resp. ˆρ ij (k) > 2 n k pro α = 0, 05. I v tomto případě je možné tolerovat několik ojedinělých výjimek. 31

Kapitola 4 Konstrukce předpovědí Pokud již máme dostatečně správně určeny řády ARMA modelu a odhadnuty jeho parametry, můžeme přikročit ke konstrukci předpovědí, která bývá zpravidla účelem celé analýzy časové řady. Definice 4.1: Předpověď hodnoty X t+k konstruovaná v čase t (tj. na základě hodnot x t, x t 1,...) se nazývá předpověď v čase t o k kroků dopředu a značí se ˆX t+k (t). Předpověď ˆX t+k (t) budeme konstruovat takovou, aby minimalizovala střední čtvercovou chybu E( ˆX t+k (t) X t+k ) T ( ˆX t+k (t) X t+k ). Věta 4.2: Důkaz: Nechť {X t, t N} je slabě stacionární náhodná posloupnost a t, k N. Pak předpovědí v čase t o k kroků dopředu, která minimalizuje střední kvadratickou chybu, je podmíněná střední hodnota E[X t+k X t, X t 1,...]. Pro potřeby důkazu označme X t vektor všech složek vektorů X t, X t 1,... a předpověď hledejme ve tvaru g(x t ), kde g(x t ) je m-rozměrná vektorová funkce se složkami g i (X t ), i = 1, 2...., m. Pak je ) T ) E (g(x t ) X t+k (g(x t ) X t+k = m i=1 ( ) 2. E g i (X t ) X i,t+k Tudíž je možno postupovat po složkách a pro i = 1, 2,..., m platí ( ) 2 ( ) 2 E g i (X t ) X i,t+k = E g i (X t ) E[X i,t+k X t ] + E[X i,t+k X t ] X i,t+k = ( ) 2 ( ) 2 = E g i (X t ) E[X i,t+k X t ] + E E[X i,t+k X t ] X i,t+k + [( )] +2E g i (X t ) E[X i,t+k X t ] )(E[X i,t+k X t ] X i,t+k, 32

přičemž pro poslední sčítanec platí [( )] E g i (X t ) E[X i,t+k X t ] )(E[X i,t+k X t ] X i,t+k = Je tedy [ [( )] ] Xt = E E g i (X t ) E[X i,t+k X t ] )(E[X i,t+k X t ] X i,t+k = [( )( )] = E g i (X t ) E[X i,t+k X t ] E[X i,t+k X t ] E[X i,t+k X t ] = 0. ( ) 2 ( ) 2 ( ) 2 E g i (X t ) X i,t+k = E g i (X t ) E[X i,t+k X t ] + E E[X i,t+k X t ] X i,t+k ) 2 E (E[X i,t+k X t ] X i,t+k a rovnost nastává pro g i (X t ) = E[X i,t+k X t ]. Po opětovném sdružení do vektoru je g(x t ) = E[X t+k X t ]. Úmluva 4.3: Podmíněné střední hodnoty E[X t+k X t, X t 1,...] a E[Y t+k X t, X t 1,...] budeme pro zjednodušení značit [X t+k ] a [Y t+k ]. Uvažujme posloupnost ARMA tvaru pak lze psát X t+k = Y t+k + Θ 1 Y t+k 1 +... + Θ q Y t+k q Φ 1 X t+k 1... Φ p X t+k p, ˆX t+k (t) = [X t+k ] = = [Y t+k ] + Θ 1 [Y t+k 1 ] +... + Θ q [Y t+k q ] Φ 1 [X t+k 1 ]... Φ p [X t+k p ]. Tento vztah již dává návod k výpočtu předpovědí, pokud dosadíme následující zřejmé rovnosti: [X t+j ] = ˆX t+j (t) pro j > 0, [X t+j ] = X t+j pro j 0, [Y t+j ] = 0 pro j > 0 a [Y t+j ] = Y t+j = X t+j ˆX t+j (t + j 1) pro j 0. Konstrukce předpovědí Nyní uveďme rekurentní algoritmus pro výpočet prvních k předpovědí na základě známého pozorování časové řady v rozsahu {x 1, x 2,..., x n } (tj. v souladu s předchozím značením předpovědí ˆx n+1 (n),..., ˆx n+k (n)) založený na výše odvozených vztazích. 33