MASARYKOVA UNIVERZITA ÚSTAV MATEMATIKY A STATISTIKY

Transkript

1 MASARYKOVA UNIVERZITA PŘÍRODOVĚDECKÁ FAKULTA ÚSTAV MATEMATIKY A STATISTIKY Bakalářská práce BRNO 2013 PETR BOŘIL

2 MASARYKOVA UNIVERZITA PŘÍRODOVĚDECKÁ FAKULTA ÚSTAV MATEMATIKY A STATISTIKY Modelování a predikce spotových cen elektrické energie Bakalářská práce Petr Bořil Vedoucí práce: Ing. Daniel Němec, Ph.D. Brno 2013

3 Bibliografický záznam Autor: Název práce: Studijní program: Studijní obor: Vedoucí práce: Petr Bořil Přírodovědecká fakulta, Masarykova univerzita Ústav matematiky a statistiky Modelování a predikce spotových cen elektrické energie Matematika Finanční a pojistná matematika Ing. Daniel Němec, Ph.D. Akademický rok: 2012/2013 Počet stran: vii + 33 Klíčová slova: časové řady; spotová cena elektřiny; rekurzivní predikce; nelineární modely

4 Bibliographic Entry Author: Title of Thesis: Degree Programme: Field of Study: Supervisor: Petr Bořil Faculty of Science, Masaryk University Department of Mathematics and Statistics Modelling and forecasting spot electricity prices Mathematics Financial and Insurence Mathematics Ing. Daniel Němec, Ph.D. Academic Year: 2012/2013 Number of Pages: vii + 33 Keywords: time series; spot electricity prices; recursive prediction; nonlinear models

5 Abstrakt V této bakalářské práci se věnujeme modelování a předpovědím spotových cen elektřiny. Na datech z pražské energetické burzy odhadneme lineární a více-režimové nelineární modely a pomocí vhodného kritéria porovnáme jejich predikční schopnosti. Analyzujeme ceny na hodinové, denní, týdenní a měsíční frekvenci a pro každou časovou řadu vybereme model, který bude nejlépe předpovídat budoucí cenu. Abstract This thesis deals with the problem of modelling and forecasting spot electricity prices. We estimate linear and non-linear threshold autoregressive models using electricity prices from Power Exchange Central Europe and compare them in the term of their prediction capabilities. We analyse time series based on hourly, daily, weekly and monthly frequency and choose the best model for prediction purposes.

6

7 Poděkování Na tomto místě bych chtěl poděkovat Ing. Danielu Němcovi, Ph.D. za cenné rady a připomínky při vedení této bakalářské práce. Zároveň děkuji rodičům za jejich podporu při studiu. Prohlášení Prohlašuji, že jsem svoji bakalářskou práci vypracoval samostatně s využitím informačních zdrojů, které jsou v práci citovány. Brno 28. května Petr Bořil

8 Obsah Úvod Kapitola 1. Úvod do problematiky modelování cen elektřiny Kapitola 2. Vhodné modely časových řad Box - Jenkinsonova metodologie Nelineární modely časových řad Testy nelinearity Tvorba předpovědí Shrnutí Kapitola 3. Empirická analýza Data Prohlídka časových řad Odhad lineárního modelu Testy nelinearity Odhad nelineárních modelů Predikční schopnosti modelů Hodinové ceny Denní ceny Týdenní ceny Měsíční ceny Sezónně očištěné hodinové ceny Dodatek k předpovědím Shrnutí Závěr Seznam použité literatury Příloha vii

9 Úvod Trhy s elektrickou energií prošly v posledních desetiletích velkými změnami. Proces deregulace zasáhl dříve či později většinu významných světových trhů a z plně centralizovaného trhu se najednou stal trh s otevřenou soutěží. Následkem toho se pro důležité hráče na trhu vyvinula potřeba umět správně odhadnout cenu a předpokládané množství elektřiny, které bude poptáváno. O rozšíření této problematiky svědčí také velké množství vědeckých článku, které se zabývají různými přístupy k modelování ceny elektřiny. Cílem této práce bude odhadnout nejlepší lineární a nelineární více-režimové modely a porovnat jejich predikční schopnosti na daném vzorku dat. Zaměříme se na spotové ceny z pražské energetické burzy Power Exchange Central Europe. Budeme modelovat a předpovídat ceny na více časových frekvencích - hodinových, denních, týdenních a měsíčních. Práce bude strukturovaná do tři kapitol. V první kapitole si ukážeme možné přístupy k modelování cen elektřiny. Při odhadování cen pomocí modelů časových řad lze postupovat mnoha způsoby - na některé z nich poukážeme s odkazem na příslušný článek, kde byly použity. Ve druhé kapitole představíme potřebnou teorii k samotné analýze daných časových řad. Lineární modely, které vycházejí z Box-Jenkinsonovy metodologie, jsou dobře známy a popsány. Více-režimové nelineární modely, které vycházejí z modelů lineárních, byly s úspěchem aplikovány na řadu ekonomických časových řad. Spolu s nimi budou ještě ve druhé kapitole představeny a zmíněny základní techniky a nástroje, které využijeme v další části práce. Empirickou analýzu dat provedeme ve třetí kapitole. Časové řady si zobrazíme a podíváme se, zda je nutné je transformovat. Postupně odhadneme nejlepší lineární a nelineární modely a podíváme se také na to, zda jsou ceny elektřiny vůbec vhodné pro modelování pomocí více-režimových modelů. Pomocí definovaného kritéria porovnáme jejich predikční schopnosti, přičemž u každé časové řady vybereme model, který bude minimalizovat chybu předpovědi. 1

10 Kapitola 1 Úvod do problematiky modelování cen elektřiny K modelování cen elektřiny se využívá velké množství metod, což je dáno také tím, že trhy s elektřinou jsou v mnoha ohledech specifické. Samotná energie je neskladovatelná, je tedy vyžadována konstantní rovnost mezi poptávkou a nabídkou. Spotřeba elektřiny během dne ovšem značně kolísá, souběžně s tím se mění i cena (je zde extrémní volatilita). Výše uvedená podmínka rovnosti nabídky a poptávky někdy vede k situacím, kdy je cena elektřiny záporná, pro dodavatele elektřiny je tedy výhodnější elektřinu zničit než odstavit výrobní zdroj. U nás jsou záporné ceny nově povoleny od 1. ledna , a hned v první den platnosti tohoto zákona byla cena na pražské energetické burze několik hodin záporná. Tato situaci nastává zřídka, zejména v noci a na krátkou dobu, může ale nastat i v případě, kdy se neočekávaně zvýší produkce elektřiny z obnovitelných zdrojů. Cena elektřiny je zároveň také velmi neelastická - většině spotřebitelů je víceméně lhostejné, jaká je aktuální spotová cena elektřiny. Autoři Misiorek et. al [7] uvádí dva možné způsoby dělení modelování a predikce cen elektřiny - podle délky předpovědi a aplikované metodologie. Podle horizontu předpovědi dělíme modelování na: Dlouhodobá předpověd - je plánovaná v rocích. Využívá se při analýze návratu investic a při rozhodování u dlouhodobých projektů. Středně-dlouhodobá předpověd - dobou předpovědi jsou měsíce. Pomáhají při tvorbě a kalkulaci rozvahy podniků, jsou důležité pro risk management a odvozování budoucích cen. Často se nehledí na na přesný odhad spotové ceny, ale na pravděpodobnostní rozdělení ceny na dané období. Krátkodobá předpověd - horizont předpovědi je od několika hodin po několik dnů. Těší se velké pozornosti všech účastníků na burze, kde se cena stanovuje na základě aukcí. Ti musí vyjádřit své nabídky co se týče ceny a množství. Na takových to burzách jsou přijímány nabídky/poptávky, zatímco se cena zvyšuje/snižuje až je konečně dosažena rovnováha mezi danou poptávkou a nabídkou. Pokud tedy dodavatel energie dokáže správně odhadnout cenu a množství, které bude poptáváno, 1 Zákon 165/2012 Sb. o podporovaných zdrojích energie a o změně některých zákonů, 11 odstavec (9) 2

11 Kapitola 1. Úvod do problematiky modelování cen elektřiny 3 může maximalizovat svůj zisk správným nastavením produkce. Tímto přístupem k modelování se budeme v dalších kapitolách zabývat. Dalším možným kritériem pro rozlišování modelování je podle aplikované metodologie: Production cost models - simulují operace, které produkují požadované zboží za nejnižší cenu. Dokážou modelovat situace z hodiny na hodinu, nicméně nejsou schopny zahrnout vliv nabídky a poptávky na ceny, který je charakteristický pro trh v dnešní době. Equilibrium models - Modely rovnováhy - můžeme je chápat jako zobecnění předchozích modelů, na rozdíl od nich také dokáží pracovat s interakcemi, které probíhají na daném trhu. Dokáží předpovídat, zda cena bude nad mezními náklady a jak to ovlivní výdaje zúčastněných. Ani tyto modely ale nejsou úplně ideální - řadu věcí si musíme přednastavit, abychom se dobrali konkrétních výsledků. Fundamentální analýza - sleduje, jak důležité fyzické a ekonomické faktory ovlivňují změnu cen elektřiny. Je předpokládán úzký vztah mezi fundamentálními faktory, jako jsou třeba počasí, celková zátěž atd. a výstupy, které jsou potom nezávisle modelovány a predikovány, často pomocí statistických a ekonometrických technik. Tyto modely jsou používány především pro dlouhodobější předpovědi. Kvantitativní modely - Mají za úkol popsat základní statistické charakteristiky cen elektřiny. Jejich úkolem není předpovídat cenu z hodiny na hodinu, používají se spíše pro odvození ohodnocení produktů a pro management rizik. Statistická a technická analýza - snaží se najít model, který by nejlépe sloužil k předpovídání. Při tom se využívá základních statistických a ekonometrických postupů a modelů. Nejvíce oblíbené metody jsou pomocí vícenásobné regrese a časových řad. Zatímco na finančních trzích je efektivnost technické analýzy často diskutována - při předpovídání cen elektřiny si vede o mnoho lépe. Je to dáno především tím, že na cenách lze velmi dobře rozpoznat sezónnost - at už denní nebo týdenní, a také rozdíl mezi pracovními dny a víkendem. Modely s umělou inteligencí - Artificial based models - konečně posledním přístupem k modelování jsou modely s umělou inteligencí. Ty jsou založeny na neparamatrických nástrojích, jako je např. využití umělé neuronové sít e, expertní systémy nebo fuzzy logika. Tyto modely dokáží být velmi flexibilní a zvládají výborně nelineární modelování. Díky tomu se výborně hodí k předpovědi spotových cen elektřiny. Nicméně při srovnání s předchozím typem modelů (konkrétně s modelem ARIMA) jsou méně přesné - více lze dohledat v článku autorů Conejo et al. [2]. V naší práci se budeme zabývat statistickými a ekonometrickými metodami při modelování cen elektřiny, důraz bude dán na využití časových řad. Můžeme se zde setkat s celou řadou přístupů - např. autoři již zmíněného článku Misiorek et. al (2006) [7] porovnávají předpovědi modelů AR/ARX (rozšíření X značí zahrnutí exogenní proměnné - poptávky po elektřině), nelineárních TAR/TARX, AR-G/ARX-G ( G značí rozšíření pomocí modelování rozptylu náhodných složek modelem GARCH) a pomocí Markov regime switching

12 Kapitola 1. Úvod do problematiky modelování cen elektřiny 4 models. Nejlepší intervalové a bodové předpovědi na datech z kalifornské burzy byly dosaženy pomocí modelu TARX následovány jednoduchým ARX modelem. Autoři Garcia et al. [5] porovnávají na cenách ze španělské a kalifornské burzy model ARIMA a jeho rozšíření modelem GARCH, přičemž výsledky upřednostňují model GARCH. Další články se věnují možnému rozšíření modelování náhodných složek (např. Weron [9]). Zajímavý přístup (při modelování cen elektřiny ale ne tak neobvyklý) zvolili autoři Weron, R., Misiorek, A. [10] - ve svém článku porovnávají předpovědi modelu označovaného jako p-ar (spike preprocessed AR model - extrémní hodnoty jsou zde nahrazeny normálnějšími ) s predikcemi modelů TAR, Mean-reverting jump diffusions modely a autoregresními modely s neparametrickými inovacemi (označované jako semiparametrické modely). Cena je predikována také pomocí exogenní proměnné teploty vzduchu. Poslední ze zmíněných modelů má pro bodové odhady nejlepší výsledky.

13 Kapitola 2 Vhodné modely časových řad V této kapitole budou definovány modely časových řad a nástroje pro práci s nimi, které využijeme k modelování cen elektřiny v třetí kapitole. Cílem této kapitoly není podrobný výklad vybraných partií z teorie časových řad, ale stručné shrnutí metod a modelů využívaných v další části práce. Teorie vychází z Enderse[3] a Cipry [1]. V první části této kapitoly zmíníme základy Box - Jenkinsonovy metodologie, druhá část bude zaměřena pouze na nelineární modely. 2.1 Box - Jenkinsonova metodologie V ekonometrické teorii časových řad je tato metodologie široce přijímána. Lze ji úspěšně aplikovat na téměř jakoukoliv časovou řadu. V dalších částech práce se bude předpokládat, že čtenář je seznámen s pojmy časové řady, stacionarity, invertibility časových řad, výběrovou autokorelační funkcí, výběrovou parciální autokorelační funkcí a bílého šumu (lze dohledat např. zde - Forbelská [4]). Autoregresní model AR Autoregresní model řádu p značený jako AR(p) má tvar po přepsání lze zapsat takto y t = ϕ 1 y t ϕ p y t p + ε t, (2.1) y t ϕ 1 y t 1... ϕ p y t p = Φ(B)y t = ε t, (2.2) kde ϕ 1,...,ϕ p jsou parametry, Φ(B) = 1 ϕ 1 B... ϕ p B p je autoregresní operátor a ε t je bílý šum. V modelu (2.1) stejně jako u všech ostatních lineárních modelů předpokládáme nulovou střední hodnotu - v případě nenulové střední hodnoty by bylo možné model doplnit parametrem µ. Model klouzavých součtů MA Model klouzavých součtů řádu q, značený jako MA(q) má tvar y t = ε t + θ 1 ε t θ q ε t q = Θ(B)ε t = ε t, (2.3) 5

14 Kapitola 2. Vhodné modely časových řad 6 kde θ 1,...,θ q jsou parametry a Θ(B) = 1+θ 1 B+...+θ q B q je operátor klouzavých součtů. Smíšený ARMA model Kombinací dvou předchozích modelů lze vytvořit smíšený model řádu p,q, značený jako ARMA(p,q). Vypadá takto y t ϕ 1 y t 1... ϕ p y t p = ε t + θ 1 ε t θ q ε t q, (2.4) pomocí operátorů definovaných v v předešlých částech textu lze také zapsat jako Integrované ARMA modely Φ(B)y t = Θ(B)ε t (2.5) Pomocí ARIMA modelů lze modelovat i nestacionární časové řady. Zavedením diferenčního operátoru d y t = (1 B) d y t můžeme tyto modely zapisovat jako a značíme je ARIMA (p,d,q). Φ(B) d y t = Θ(B)ε t (2.6) Sezónní ARIMA modely Box - Jenkinsonova metodologie nabízí také modelování sezónosti pomocí tzv. multiplikativního sezónního modelu, běžně označováného jako SARIMA model. Definujme si sezónní autoregresní operátor řádu P Π(B L ) = 1 π 1 B L... π P B PL, dále sezónní operátor klouzavých součtů řádu L a sezónní diferenční operátor Ψ(B L ) = 1 + ψ 1 B L ψ Q B QL D L = (1 B L ) D. Formálně zapíšeme SARIMA(p,d,q) (P,D,Q) L model takto kde L je délka sezónnosti. Φ(B)Π(B L ) d D L y t = Θ(B)Ψ(B L )ε t (2.7)

15 Kapitola 2. Vhodné modely časových řad Nelineární modely časových řad V posledních letech byly více-režimové nelineární modely s úspěchem aplikovány na různé ekonomické časové řady. Tato podkapitola obsahuje stručný přehled těchto modelů, které použijeme pro modelování cen elektřiny. Důraz bude kladen na obecnou třídu modelů s proměnlivými režimy - regime switching models. Těmito modely se dají popsat časové řady, u kterých se v čase mění jejich charakteristika s ohledem na to, v jakém se nacházejí režimu (pro představu jeden režim může popisovat danou řadu v případě, kdy jsou její hodnoty menší než určená hodnota, druhý režim modeluje tu stejnou řadu v opačném případě). Pro lepší přiblížení realitě tyto modely popisují časovou řadu pomocí několika spojitých lineárních funkcí právě v závislosti na daném režimu. Lze rozlišit dva druhy modelů - pokud se režim určuje na základě proměnné, kterou známe nebo dokážeme vypozorovat, jedná se o modely se známými režimy (např. TAR, STAR, SETAR), mění-li se režimy náhodně na základě skryté proměnné, jedná se o modely označovaní jako MSW - The Markov switching model. Konstrukce těchto modelů je značně obtížná, v praxi se pracuje častěji s prvním typem modelů, se kterými se budeme zabývat i v této práci. Podle způsobu určení přepínače režimu (také se hovoří o tzv. prahu) a přechodu mezi jednotlivými funkcemi pro každý režim lze modely rozdělit do několika skupin. TAR modely Pomocí již zmíněných TAR modelů (z anglického threshold autoregressive models) lze pro více režimů modelovat jednotlivé AR modely. Pro dva režimy vypadá model takto { α 0 + α 1 y t α 1p y t p + ε 1t pro y t 1 τ y t = (2.8) β 0 + β 1 y t β 1r y t r + ε 2t pro y t 1 < τ, kde je prahovou proměnou přímo vysvětlovaná proměnná s řádem zpoždění 1. Pokud je tato proměnná větší než prahová hodnota τ- threshold value, je model určován AR(p) modelem s koeficienty α a naopak. Prahová hodnota se obvykle vybírá z hodnot minulých pozorování. Pro zjednodušení se předpokládá, že ε 1t a ε 1t jsou vzájemně nezávislé bílé šumy obvykle typu i.i.d. se stejným rozptylem, tedy D(ε 1t ) = D(ε 2t ). Pro odhad parametrů je výhodné si model přepsat do jiné podoby. Nejdříve si definujme indikátorovou funkci I t takto { 1 pro y t 1 τ I t = 0 pro y t 1 < τ. Dále si definujeme vektor složený z minulých hodnot y t model TAR nyní můžeme zapsat takto x t = (1,y t 1,y t 2,...,y t p ), y t = x tαi t + x tβ(1 I t ) + ε t. (2.9) V tomto tvaru je možné model odhadnout metodou nejmenších čtverců.

16 Kapitola 2. Vhodné modely časových řad 8 SETAR modely V předchozím modelu je režim determinován pozorovanou proměnnou s řádem zpoždění 1. Často se stává, že změna chování časové řady se projeví až po určité době. Pokud se tato situace vyskytne, bylo by rozumné zajistit, aby se režim měnil na základě hodnoty y t d, kde d=1,2,3,... Tyto modely se nazývají SETAR (z anglického Self-exciting threshold AR models) a pro dva režimy jsou definovány takto { α 0 + α 1 y t α 1p y t p + ε 1t pro y t d τ y t = (2.10) β 0 + β 1 y t β 1r y t r + ε 2t pro y t d < τ, kde τ je prahová hodnota. Předpoklady jsou stejné jako v předchozím modelu, tedy ε 1t a ε 2t jsou vzájemně nezávislé bílé šumy typu i.i.d., D(ε 1t ) = D(ε 2t ), a (r = p). Podobně jako v minulém modelu by šlo model přepsat do výhodnější podoby pro odhad parametrů. M-TAR modely Dalším možným rozšířením modelu TAR je model M-TAR (Momentum TAR), ve kterém se režim nemění na základě hodnoty y t d, nýbrž v důsledku velikosti změny u jedné z předcházejících hodnot - diference y t d. Tento model dobře popisuje situaci, kdy je výrazný rozdíl v chování sledované řady, pokud řada roste nebo klesá. Prahová hodnota τ může ovšem nabývat libovolné hodnoty. Model vypadá takto { α 0 + α 1 y t α 1p y t p + ε 1t pro y t d τ y t = (2.11) β 0 + β 1 y t β 1r y t r + ε 2t pro y t d < τ. STAR modely Modely typu TAR mají tu vlastnost, že přechod mezi režimy je skokový. Parametry v modelu se tedy mění okamžitě a tyto modely nemají spojitou podmíněnou střední hodnotu. Modely STAR - Smooth Transition AR models byly proto navrženy tak, aby přechod mezi režimy byl spojitý. Model pro dva režimy je definován takto y t =(α 0 + α 1 y t α 1p y t p + ε 1t )(1 G(y t d,γ,τ))+ (β 0 + β 1 y t β 1r y t r + ε 2t )(G(y t d,γ,τ)), (2.12) kde G(y t d,γ,τ) je spojitá přechodová funkce. Parametr τ je prahová hodnota, y t d je prahová proměnná a γ je parametr hladkosti - (smoothnes parameter). Podle typu přechodové funkce se modely dají dále rozlišit. LSTAR modely Nejpoužívanějším typem modelu STAR je model Logistic-STAR, kde přechodová funkce je logistická funkce tvaru G(y t d,γ,τ) = exp[ γ(y t d τ)]. (2.13)

17 Kapitola 2. Vhodné modely časových řad 9 Pokud jde v limitě γ 0, model se blíží k lineárnímu AR(p) modelu (přechodová funkce je rovna 0.5); jde-li v limitě γ, LSTAR se blíží modelu typu SETAR (přechodová funkce je rovna bud 0 nebo 1 v závislosti na znaménku výrazu (y t d τ)). Odhad parametrů v modelů LSTAR již nelze odvodit tak snadno, jako tomu bylo v případě modelu SETAR. 2.3 Testy nelinearity Před začátkem samotného hledání nejlepšího nelineárního modelu je nutné ověřit nelinearitu dat. Literatura zmiňuje několik možných testů, některé zde ve stručnosti uvedu. U většinu testu je nulová hypotéza přítomnost linearity v datech. McLeod - Li Test Podstatou tohoto testu je testování nulovosti prvních m autokorelací čtverců reziduí odhadnutého lineárního modelů. Nejdříve tedy odhadneme vhodný lineární model a uložíme si rezidua ε t. Ty využijeme při výpočtu Ljung-Boxovi statistiky dané vzorcem LB = n(n + 2) m i=1 ρ(i) 2 n i, (2.14) kde ρ(i) je výběrová autokorelační funkce mezi ε t 2 a ε t i 2. Testová statistika má za platnosti nulové hypotézy (prvních m autokorelací je rovno 0) asymptotické χ(m) 2 rozdělení. Pokud statistika LB překročí kritickou hodnotu, zamítáme nulovou hypotézu a přijímáme hypotézu o nelinearitě modelu. Dalším možné provedení tohoto testu spočívá v odhadnutí regrese ε t 2 = α + α1 ε 2 t α n ε 2 t n, (2.15) kde za předkpokladu linearity by α 1 až α n mělo být rovno nule. RESET test Dalším známým testem je Regression error specification test. Opět testujeme nulovou hypotézu linearity proti alternativní hypotéze nelinearity. Myšlenka tohoto testu využívá toho, že pokud jsou rezidua z předem odhadnutého nejlepšího lineárního modelu nezávislá (označíme je ε t ), neměla by být korelována s odhadnutými vyrovnanými hodnotami ze stejného modelu - ŷ t. Nyní odhadneme regresi ε t = Z tb + H h=2 α h ŷ h t + ε t, (2.16) kde Z t je vektor obsahující proměnné zahrnuté v předem odhadnutém lineárním modelu, B je vektor neznámých parametrů a H se obvykle volí mezi 3 a 4. Klasickým F-testem nyní můžeme testovat nulovou hypotézu α 2,...,α H = 0. Linearitu můžeme zamítnout, pokud F-statistika přesáhne kritickou hodnotu standardního F-rozdělení. Dalším obecným testem nelinearity je Portmanteau Test a Test Lagrangeových multiplikátorů, jehož vícenásobným použitím můžeme dokonce vybrat nejvhodnější formu nelinearity. Lze také testovat vhodnost nelineárních modelů uvedených výše.

18 Kapitola 2. Vhodné modely časových řad 10 Supremum test Jedním z těchto testů je supremum test (více Enders [3]), který testuje vhodnost modelu TAR. SSR u označíme součet čtverců reziduí nejlepšího SETAR modelu, podobně SSR r označíme součet čtverců reziduí u lineárního modelu. Tradiční F-statistika pro porovnání omezeného a neomezeného modelů daná vzorcem F = (SSR r SSR u )/q, (2.17) SSR u /(n k) kde q je počet omezení, n počet pozorování a k je počet odhadovaných parametů v neomezeném modelu, které ovšem nepochází z F-rozdělení. Pro dosažení požadovaného rozdělení budeme generovat n vzorků (stejně jako počet pozorování) ze standardizovaného normálního rozdělení. Vygenerovaná náhodné čísla označíme jako ε t a provedeme regrese s vysvětlovanou proměnnou ε t a vysvětlujícími proměnnými stejnými jako u lineárního a nelineárního modelu. Součet čtverců reziduí u regrese s vysvětlujícími proměnnými z lineárního modelu nyní označíme SSR r, podobně SSR u bude značit součet čtverců reziduí u regrese s vysvětlujícími proměnnými z nelineárního modelu. Nyní vypočítáme F = (SSR r SSR u)/q SSR. (2.18) u/(n k) Tento postup zopakujeme nejméně 1000krát, abychom dostali požadované rozdělení F. Původní F-statistiku porovnáme s nově získaným rozdělením - pokud tato hodnota překročí 95% percentil rozdělení F, můžeme na hladině významnosti 0,05 zamítnout nulovou hypotézu o lineárním modelu. U všech časových řad je třeba provést test jednotkového kořene pro ověření stacionarity. Nejpoužívanějším testem je Dickey-Fullerův test, jehož obohacená verze spočívá v odhadu následujícího modelu y t = α 0 + α 1 t + γy t 1 + p i=1 β i y t i+1 + ε t, (2.19) přičemž budeme testovat parametr γ = 0. Pokud t-statistika překročí hranici Dickey- Fullerova rozdělení na dané hladině významnosti, můžeme zamítnout nulovou hypotézu jednotkového kořene. Dalším testem pro ověření stacionarity je Kwiatkowski - Phillips - Schmidt - Shinův test. Autoři tohoto testu poukazovali na fakt, že test jednotkového kořene z různých důvodů často selhává v zamítnutí nepravdivé nulové hypotézy. V tomto testu je tedy nulová hypotéza ověření stacionarity oproti alternativní hypotéze jednotkového kořene. Podrobnější informace o tomto testu lze najít v tomto článku autorů Kwiatkowski et al. [6] Kontrolou správnosti modelu jsou náhodné složky ε t, které by měly odpovídat procesu bílého šumu - tedy být nekorelované s nulovou střední hodnotou, konstantním rozptylem a měly by pocházet z normálního rozdělení. Předchozí požadavky je snadné ověřit sérií následujících testů - normalitu testuje Shapiro - Wilkův test, homoskedasticitu pomocí Breuch - Paganava testu a nezávislost reziduí pomocí Box - Pierceho testu. Jedná se o široce používané testy, které jsou popsány v řadě učebnic ekonometrie (např Enders [3]).

19 Kapitola 2. Vhodné modely časových řad Tvorba předpovědí Nejdříve se budeme věnovat předpovědím v lineárním modelu, posléze v nelineárních modelech. Zde budeme čerpat z článku autorů van Dijk, Terasvirta, Franses [8]. Lineární modely Enders[3] na jednoduchém AR(1) modelu ukazuje, jak lze odvodit předpovědi v ARMA modelech. Uvažujme model y t = a 0 + a 1 y t 1 + ε t. Nyní lze snadno vyjádřit hodnota y t+1 jako y t+1 = a 0 + a 1 y t + ε t+1. Pokud známe koeficienty a 0 a a 1, můžeme předpověd y t+1 podmíněnou informacemi v čase t vypočítat jako ŷ t+1 = E[y t+1 Ω t ] = a 0 + a 1 y t, (2.20) kde ŷ t+1 značí optimální předpověd v čase t a Ω t je množina informací dostupná v čase t. Protože y t+2 = a 0 + a 1 y t+1 + ε t+2, lze snadno odvodit, že předpověd y t+2 podmíněná informacemi v čase t vypadá takto Po dosazení (2.20) do (2.21) dostáváme ŷ t+2 = E[y t+2 Ω t ] = a 0 + a 1 E[y t+1 Ω t ]. (2.21) Pokud bychom takto pokračovali dále, zjistíme, že ŷ t+2 = a 0 + a 1 (a 0 + a 1 y t ). (2.22) ŷ t+ j = E[y t+ j Ω t ] = a 0 (1 + a 1 + a a j 1 1 ) + a j 1 y t. (2.23) Předchozí rovnice nám popisuje předpovědi v čase t + j jako funkci, ve které jsou brány informace pouze známé v čase t. Nevýhodou tohoto přístupu je, že pro rostoucí j se kvalita předpovědí značně zmenšuje. Za předpokladu, že a 1 < 1 lze dokázat, že při j se výraz ŷ t+ j a 0 /(1 a 1 ). Výsledek se dá zobecnit na jakýkoliv stacionární ARMA model - při j podmíněná předpověd y t+ j konverguje na nepodmíněnou střední hodnotu. 1 Nelineární modely Uvažujme obecný nelineární model tvaru y t = F(x t ;θ) + ε t, (2.24) kde F(x t ;θ) je nelineární funkce s parametry θ a x t = (1,y t 1,...,y t p ). Označme optimální předpověd y t+h v čase t jako ŷ t+h t = E[y t+h Ω t ], kde Ω t obsahuje všechny známe informace v čase t, chybu predikce označíme e t+h t = y t+h ŷ t+h t. Využijeme-li toho, že E[ε t+1 Ω t ] = 0, lze jednokroková predikce snadno vyjádřit jako ŷ t+1 = E[y t+1 Ω t ] = F(x t+1 ;θ), což je analogické k lineárním předpovědím. Pro h > 1 tyto úvahy neplatí. Dvou-kroková predikce bude vypadat takto 1 Pro uvedený AR(1) model je to hodnota a 0 /(1 a 1 ) ŷ t+2 = E[y t+2 Ω t ] = E[F( x t+2 ;θ) Ω t ), (2.25)

20 Kapitola 2. Vhodné modely časových řad 12 kde x t+2 t = (1,ŷ t+1 t + ε t+1,y t,...,y t (p 2) ). Výraz se dá vyjádřit jako ŷ t+2 = F( x t+2 ;θ) f (ε)dε, (2.26) kde f značí hustotu ε t+1. Numerické řešení tohoto integrálu je pro delší horizont předpověd i velmi časově náročné, v praxi se tedy používají jiné metody. Jeden z možných způsobů je nezohlednit nelinearitu a vypočítat předpověd přímo ŷ t+2 t = F( x t+2 ;θ). (2.27) Protože ovšem pro h > 1 neplatí, že E[F( x t+h t ;Ω t )] F(E[ x t+h t ;Ω t ]), vede tento přístup ke zkresleným odhadům. Oblíbenou metodou aproximace podmíněné střední hodnoty z výrazu (2.25) je Monte Carlo simulace. Dvou-kroková předpověd by vypadala takto ŷ t+2 t = 1 k k i=1 F( x (i) t+2 t ;θ), (2.28) kde k je dostatečně velké číslo a hodnoty ε t+1 obsažené ve výrazu x t+2 t jsou brány z předpokládaného rozdělení ε t. Metoda bootstrap je obdobná předchozí metodě, hodnoty ε t+1 jsou ovšem brány ze skutečných reziduí v odhadnutém modelu.výhodou poslední metody oproti Monte Carlo je, že na ε t se nemusí klást žádné předpoklady. Při tvorbě předpovědí pomocí Monte Carlo a bootstrap metody lze snadno z kvantilů u získaných rozdělení předpovědí pro h > 1 tvořit intervalové předpovědi. Pro porovnání předpovědí se běžně používá Root mean squared prediction error, která je definována RMSPE = 1 m kde m je počet h-krokových předpovědí. m 1 j=0 (ŷ t+h+ j t+ j y t+h+ j ) 2, (2.29) 2.5 Shrnutí V této kapitole jsme představili teorii potřebnou k analýze časových řad v další části práce. Uvedli jsme si zástupce lineárních (ARIMA) i nelineárních modelů (SETAR, MTAR, LSTAR), které budeme odhadovat. Pro test jednotkového kořene můžeme využít Dickey- Fullerův test, KPSS test pro odhalení nestacionarity a případnou nelinearitu ověříme pomocí McLeod-Li a RESET testu. Supremum test dokáže posoudit vhodnost SETAR modelu. Předpovědi budeme tvořit pomocí metod ukázaných v předposlední podkapitole.

21 Kapitola 3 Empirická analýza V této kapitole se budeme zabývat odhadem modelů uvedených ve druhé kapitole, jejich posouzením a ověřením a dále jejich predikčními schopnostmi. Databáze cen bude popsána hned v úvodu kapitoly. Všechny výpočty a grafy byly provedeny ve volně dostupném softwaru R [14]. Pro ověřování hypotéz si v celé práci pevně zvolíme hladinu významnosti 0,05 (pokud nebude uvedeno jinak). Náš postup bude ve shodě s tradičními postupy při analýze časových řad. Pro nelineární časové řady doporučuje Enders [3] tento postup. 1. V prvé řadě je vhodné si visuálně prohlédnout danou řadu. Díky tomu můžeme lépe pochopit formu nelinearity a odhalit některé vlastnosti řady (např. deterministický trend, strukturální zlomy). Dále je třeba ověřit stacionaritu řady a případně řadu vhodně transformovat. 2. Klasickými metody Box - Jenkinsonovy metodologie odhadneme nejlepší lineární ARMA model a ověřit jeho platnost. 3. Pomocí popsaných testů ve druhé kapitole otestujeme, zda řada vykazuje nelineární chování. Můžeme provést supremum test pro posouzení vhodnosti SETAR modelu oproti modelu lineárnímu. 4. Pokud je v předchozím kroku detekována forma nelinearity, odhadneme nelineární modely a podle vhodného kritéria je porovnáme. Provedeme kontrolu správnosti modelu pomocí analýzy reziduí a můžeme takovéto modely porovnat s lineárními modely. 5. Provedeme předpovědi jednotlivých modelů a pomocí vhodného kritéria je porovnáme. 3.1 Data V této kapitole velmi stručně popíšu situaci s energetickými burzami u nás i ve světě a představím data, se kterými budeme pracovat v další části práce. 13

22 Kapitola 3. Empirická analýza 14 V úvodu jsme zmínili postupný proces deregulace trhu s elektřinou - s tím vznikala potřeba míst, kde by si obchodníci mohli nakoupit elektřinu od výrobců a následně ji prodat zákazníkům. První burza, na které se obchodovalo se spotovými cenami elektrické energie, vznikla v roce 1990 ve Velké Británii. V dalších letech vzniklo velké množství burz v zemích Evropy i Severní Ameriky. Pražská energetická burza byla založena 8. ledna 2007, první obchody se zde provedly v červenci tohoto roku. Obchoduje se zde s elektřinou nejen pro Českou republiku, ale i Slovensko a Mad arsko. PXE nabízí více druhů produktů můžeme je rozdělit na základě dvou hledisek. Podle časového rozdílu mezi platbou a dodáním elektřiny dělíme kontrakty na futures a spotové kontrakty. Dalším kritériem je způsob vyrovnání - obchodníci na burze můžou zvolit finanční vyrovnání, kdy nevzniká závazek elektřinu skutečně dodat/odebrat, nýbrž zde dochází pouze k zaplacení určité částky na základě spotové ceny a fyzické vyrovnání, kdy vzniká povinnost dodat/odebrat elektřinu ze sítě (více na webových stránkách burzy [13]). Spotový trh pro PXE zajišt uje OTE Operátor trhu s elektřinou. OTE rozlišuje trh s elektřinou na blokový, denní a vnitrodenní (více zde [12]). Ceny jsou na všech trzích určovány na základě nabídky a poptávky. V rámci blokového trhu se obchoduje s denními krátkodobými kontrakty (dodávka elektřiny je realizována v konkrétní časový blok určitého dne) Denní trh cena je zde stanovena každou hodinu. Objemy obchodů na tomto trhu jsou mnohonásobně větší než na ostatních trzích. Vnitrodenní trh doplňuje vhodně blokový a denní trh. Obchodníci anonymně poptávají nebo nabízejí elektřinu až do určitého času (běžně 60 minut) před konečnou realizací dodávky či odběru. Pro naši ekonometrickou analýzu budeme používat data z denního trhu. Ta jsou volně dostupná na webových stránkách OTE. V závislosti na frekvenci dat budeme pracovat se čtyřmi druhy časových řad. Hodinová data - časová řada od do , celkem 7296 pozorování. Denní data - časová řada od do , dohromady ji tvoří 681 pozorování. Tato časová řada vznikla (stejně jako další dvě) jako vážený průměr hodinových cen na základě objemu, který se za daný čas zobchodoval. Týdenní data - časová řada od prvního týdne roku 2008 do 49. týdne roku 2012, obsahuje 259 pozorování. Měsíční data - časová řada od ledna roku 2008 do listopadu roku 2012, tvoří ji 70 pozorování. Všechny ceny jsou uvedené v eurech za megawatthodinu a jsou volně dostupné z uvedených webových stránek. Pro větší stručnost a přehlednost textu budou méně podstatné výsledky a grafy u denních, týdenních a měsíčních cen uvedeny pouze v příloze.

23 Kapitola 3. Empirická analýza Prohlídka časových řad V této podkapitole si graficky zobrazíme všechny časové řady, se kterými budeme pracovat. Prohlédneme si výběrové autokorelační a parciální autokorelační funkce a pomocí Dickey - Fullerova testu jednotkového kořene a KPSS testu ověříme jejich stacionaritu. Hodinové ceny Graf časové řady hodinových cen elektřiny je na obrázku 3.1. V první části grafu je cena za celé období, v druhé částí je cena pouze v prvním týdnu roku 2012 (šedě označená část řady v první části). Modrou barvou jsou vyznačeny ceny z října roku 2012, které budou sloužit pro porovnání předpovědí (celkem 744 pozorování), na předcházejícím datovém vzorku budou odhadnuty modely právě pro predikční účely (více v podkapitole 3.6). Obrázek 3.1: Hodinové ceny elektřiny Z grafu je vidět, že se cena pohybovala v rozmezí Euro/Mwh (střední hodnota je 42,9 a směrodatná odchylka 15), jsou zde ale i odlehlé hodnoty okolo 150Eur/Mwh. Z druhé části grafu je patrná denní sezónnost na vývoji cen. Na obrázku 3.2 vidíme výběrovou ACF a PACF. Hodnoty všech autokorelací jsou statisticky významné, opět zde je vidět sezónní chování. Velké hodnoty autokorelací u zpožděných proměnných signalizují možnost výskytu jednotkového kořene, který budeme testovat pomocí Dickey-Fullerova test. Pro naši časovou řadu vychází t-statistika , přičemž kritické hodnoty z Dickey-Fullerova rozdělení jsou pro náš model následující: pro hladinu významnosti α = 0, 01 je kritická hodnota rovna -2.58, pro α = 0,05 je rovna a pro α = 0,1 je kritická hodnota rovna

24 Kapitola 3. Empirická analýza 16 Obrázek 3.2: Výběrová ACF a PACF u hodinových cen elektřiny Na hladině významnosti 0,01 tedy nemůžeme zamítnout hypotézu o jednotkovém kořenu. Protože výsledek předchozího testu nebyl úplně jednoznačný, vyzkoušíme KPSS test pro otestování stacionarity. Testovací statistika vychází a p-hodnota testu je menší než 0,01, můžeme tedy spolehlivě zamítnout hypotézu o stacionaritě. Z předchozích výsledků je zřejmé, že pro další práci bude nutné řadu diferencovat. Graf nově vzniklé časové řady je na obrázku 3.3. První část grafu je diferencovaná časová řada za celé období, šedě podbarvená část je v detailním výřezu v druhé části grafu. Pohled na výběrovou autokorelační a parciální autokorelační funkci na obrázku 3.4 nám prozradí, že zpožděné proměnné jsou stále korelované (nyní i záporně) a že je zde opět pozorovaná sezónnost. Pro kontrolu stacionarity otestujeme přítomnost jednotkového kořene - t-statistika u Dickey-Fullerova testu vychází -44,89, zamítáme tedy nulovou hypotézu jednotkového kořene. Potvrzení tohoto výsledku dostaneme i u KPSS testu. Podobně jako u původní řady jsou i u diferencované řady vidět velké výkyvy cen elektřiny v únoru. U spotových cen elektřiny nejsou tyto náhlé výkyvy vůbec neobvyklé, objevují se na většině trzích s elektřinou a mohou vzniknout z více různých důvodu (nepředvídané změny v počasí a s tím související změna v poptávce po elektřině, příp. změna nabídky elektřiny z obnovitelných zdrojů). Teplotní průměr v České republice za měsíc únor byl -5,1 C, odchylka od průměrné teploty byla -4,1 C [11], může to být tedy jeden z důvodu vysoké ceny. Mohlo by nás zajímat, nakolik tyto výkyvy ovlivní výsledný odhad modelu. Jednou z možných metod je prozkoumání stability parametrů v čase. Na obrázku 3.5 vidíme rekurzivní odhad parametru u první zpožděné proměnné v modelu AR(10). Zatímco v druhé polovině datového vzorku je parametr relativně stabilní, v první části odpovídající výkyvům v cenách je parametr velmi nestabilní. Pro naše odhady tedy použijeme datový vzorek bez prvních dvou měsíců.

25 Kapitola 3. Empirická analýza 17 Obrázek 3.3: Diference hodinových cen Obrázek 3.4: Výběrová ACF a PACF u diferencované řady hodinových cen Denní ceny Graf denních cen je v příloze na obrázku A.1. Pro porovnání předpovědí použijeme data z posledních tří měsíců (celkem 92 pozorování). V roce 2011 cena fluktuovala okolo 50 Eur/Mwh, podobně jako u hodinových cen jsou na začátku roku 2012 patrné velké

26 Kapitola 3. Empirická analýza 18 Obrázek 3.5: Stabilita parametru v čase výkyvy. V další části roku se již cena ustálila a pohybuje se okolo 40 Eur/Mwh. Z pohledu na výběrovou ACF a PACF na obrázku A.2 vidíme opět sezónní chování s periodou 7 dní. Korelace zpožděných proměnných jsou statisticky významné až do řádu zpoždění 17. T-statistika u Dickey - Fullerova testu vychází -0,63, přijímáme nulovou hypotézu jednotkového kořene. Testovací statistika u KPSS testu vychází a p-hodnota testu je menší než 0,01, zamítáme tedy nulovou hypotézu stacionarity. Diferencovaná časová řada je na obrázku A.3. Z výběrové ACF a PACF na obrázku A.4 vidíme stále přítomnou sezónnost. Test jednotkového kořene i KPSS test nám potvrzují stacionaritu. Parametry jsou v čase relativně stabilní. Týdenní ceny Graf týdenních cen je na obrázku A.5. Pro porovnání předpovědí použijeme pozorování z roku Je zde vidět rozdíl v průměrné ceně mezi lety 2008 až 2009 a zbytkem období. Patrné jsou také již zmíněné velké výkyvy na začátku roku Z výběrové ACF na obrázku A.6 je zřejmé, že je řada nestacionární, což nám potvrdí i Dickey - Fullerův a KPSS test, kdy na hladině významnosti 0,01 můžeme zamítnou hypotézu o stacionaritě. Diferencovaná řada je na obrázku A.7. Z pohledu na výběrovou ACF na obrázku A.8 je vidět, že by zde již neměl být problém s nestacionaritou, což nám potvrdí i test jednotkového kořene a KPSS test. Měsíční ceny Měsíční ceny jsou na obrázku A.9. Pro porovnání předpovědí použijeme data z roku 2011 a 2012 (celkem 23 pozorování). Ceny se pohybovali na úrovni Euro/Mwh (kromě již zmíněného nárůstu ceny v roce 2008). Výběrová ACF a PACF jsou na obrázku A.10. Dickey - Fullerův test i test KPSS potvrzují stacionaritu.

27 Kapitola 3. Empirická analýza Odhad lineárního modelu Výběr vhodného modelu pomocí Box - Jenkinsonovy metodologie je známý a dobře popsaný v literatuře. Využívá se tvaru výběrových autokorelačních a parciálních autokorelačních funkcí, další možností je porovnání modelů pomocí informačních kritérií. V naší práci využijeme již naprogramovanou funkci, která vybere ze všech možných lineárních modelů ten nejlepší model na základě námi určeného informačního kritéria. Při výběru vhodného počtu proměnných bude postupovat pomocí stepwise selection. Pro porovnání modelů zvolíme Akaikeho kritérium, které je interně definováno v programu R. Bohužel je rozdílný způsob výpočtu informačních kritéria pro lineární a nelineární modely, proto pro naše potřeby porovnání modelů můžeme kromě predikčních schopností použít pouze součet čtverců reziduí. Odhadnuté lineární modely jsou v tabulce 3.1. Značení parametrů je stejné jako v druhé kapitole - tedy φ jsou koeficienty autoregresního operátoru, θ jsou koeficienty operátoru klouzavých součtů, π jsou koeficienty sezónního autoregresního operátoru, ψ jsou koeficienty sezónního operátoru klouzavých součtů, µ je střední hodnota a L je délka sezónnosti (v závorce jsou směrodatné odchylky). Hodinové ceny Denní ceny Týdenní ceny Měsíční ceny L µ (0.029) (0.021) ( ) (3.271) ϕ 1 (0.002) (0.038) (0.080) (0.077) ϕ 2 (0.006) (0.047) ( 0.069) ( ) ϕ 3 ( ) (0.039) ( ) ( ) θ 1 (0.010) (0.006) (0.052) ( ) θ 2 (0.021) ( ) ( ) ( ) θ 3 (0.009) ( ) ( ) ( ) π 1 (0.041) (0.038) ( ) ( ) π 2 (0.038) (0.039) ( ) ( ) ψ 1 (0.040) ( ) ( ) ( ) ψ 2 (0.030) ( ) ( ) ( ) Tabulka 3.1: Odhady lineárních modelů

28 Kapitola 3. Empirická analýza 20 Pro ověření platnosti modelu je zapotřebí zkontrolovat rezidua z odhadnutého modelu. V tabulce 3.5 jsou p-hodnoty Shapiro-Wilkova testu pro ověření normality, Box-Pierce testu pro ověření nezávislosti reziduí a Bresch-Paganova testu pro ověření homoskedasticity rozptylu u reziduí. Pro všechny časové řady zamítáme nulovou hypotézu normality. Hodinové ceny Denní ceny Týdenní ceny Měsíční ceny Shapiro - Wilkův test 2.2e e e Breusch - Paganův test 1.158e Box - Piercův test Tabulka 3.2: P-hodnoty testů pro ověření bílého šumu u lineárních modelů Homoskedasticitu zamítáme pouze u hodinových cen, hypotézu nezávislosti reziduí přijímáme pro všechny řady. 3.4 Testy nelinearity Ve druhé kapitole jsme si uvedli testy pro ověření linearity. Jejich použitím ovšem dokážeme nejvýše detekovat případnou nelinearitu, nikoliv však to, jakou formu nelinearita má. McLeod-Li test Připomeňme si, že pomocí tohoto testu můžeme ověřit, zda se prvních m autokorelací u čtverců reziduí odhadnutého lineárního modelu rovná nule. Na obrázku 3.6 vidíme p-hodnoty McLeod-Li testu pro jednotlivé zpoždění m. U hodinových, denních i týdenních cen můžeme na dané hladině významnosti pro všechny zpoždění zamítnout nulovou hypotézu linearity. Pro měsíční data některá zpoždění detekují linearitu, nemůžeme ji ovšem přijmout pro všechny zpoždění. Pomocí McLeod - Li testu tedy zamítáme pro data se všemi frekvenci linearitu. RESET test Pomocí Ramsey RESET testu ověříme, zda je lineární model správně specifikován. Zamítnutím nulové hypotézy připouštíme, že je zde možná nelinearita. P-hodnotu tohoto testu pro odhadnuté lineární modely můžeme vidět v tabulce 3.3. Na dané hladině významnosti zamítáme nulovou hypotézu pro hodinová a týdenní data, zatímco pro denní a měsíční ceny připouštíme linearitu. Supremum test Posledním z testu je Supremum test, který testuje lineární AR model oproti SETAR modelu (ten je popsán v následující podkapitole). P-hodnoty tohoto testu nalezneme opět v tabulce 3.3. Pro všechny časové řady je tedy vhodnější model SETAR oproti lineárnímu AR modelu.

29 Kapitola 3. Empirická analýza 21 Obrázek 3.6: McLeod-Li test pro jednotlivé řady Hodinové ceny Denní ceny Týdenní ceny Měsíční ceny RESET test 1.51e Supremum test Tabulka 3.3: P-hodnoty RESET testu a Supremum testu pro jednotlivé řady Protože nám předchozí testy detekovali možnou nelinearitu, můžeme odhadnout nelineární modely. 3.5 Odhad nelineárních modelů V této podkapitole se budeme zabývat odhadem nelineárních modelů uvedených ve druhé kapitole. Při výběru modelu se budeme řídit Akaikeho informačním kritériem, které je definováno takto AIC = nln( 1 n m i=1 ε 2 i ) + 2k, kde n je počet použitých pozorování, m je počet reziduí a k je počet parametrů v modelu. Postup bude následující - pomocí Akaikeho informačního kritéria a t-statistiky u jednotlivých proměnných vybereme nejvhodnější řád zpoždění pro jednotlivé režimy a pro prahovou proměnnou - přičemž pro každou možnou kombinaci těchto zpoždění zároveň odhadneme optimální hodnotu prahové proměnné. Všechny odhadnuté modely porovnáme a podle definovaného kritéria vybereme ten nejlepší (preferovaný model bude tedy s nejmenší hodnotou AIC). Bohužel pro model LSTAR není v v prostředí R možnost vybírat pouze

30 Kapitola 3. Empirická analýza 22 jednotlivé zpožděné proměnné k odhadu ceny v čase t, výsledný model tedy obsahuje proměnné včetně nevýznamných proměnných. Při prezentaci výsledných odhadů budeme dodržovat stejné značení parametrů jako v druhé kapitole - tedy τ je práh, který určuje daný režim, d je zpoždění prahové proměnné a γ je parametr u přechodové funkce (pouze u LSTAR modelu), φ 1,...φ p,r jsou koeficienty u jednotlivých vysvětlujících proměnných (v závorkách jsou směrodatné odchylky). Jednotlivé režimy jsou značeny zkratkou LR - Low Regime (Y t d < τ, resp. Y t d < τ pro MTAR model) a HR - High Regime (opačné znaménka u nerovností). U všech režimů je také uvedeno, jaké procento pozorování z celkového počtu spadá do jednotlivého režimu. Nelineární modely je možné přímo porovnat pomocí uvedeného informačního kritéria (nejlepší model je zvýrazněn). Nebudou zde uvedeny výsledky pro model TAR - model SETAR je jeho zobecněním. Hodinové ceny V tabulce 3.4 jsou výsledky našich odhadů pro hodinová data. Pro všechny modely jsou velmi vysoké prahové hodnoty - procento pozorování v nižším režimu je poměrně velké. Hodnota parametru τ u LSTAR modelu je velmi nízká - model se tedy blíží AR modelu. Tento model je také nejlepší z pohledu Akaikeho informačního kritéria. Grafy odhadnutých hodnot a skutečné ceny ze dne (pondělí) jsou zobrazeny na obrázku 3.7. Černou barvou je zde zobrazena skutečná cena, barevně jsou vykresleny jednotlivé lineární a nelineární modely. V šedě zobrazené části grafu je cena modelována pomocí vyššího režimu. Z grafu je patrné, že nejlépe fituje cenu elektřiny sezónní lineární model. Obrázek 3.7: Odhadnuté lineární a nelineární modely hodinových cen

31 Kapitola 3. Empirická analýza 23 SETAR MTAR LSTAR τ d γ LR HR LR HR LR HR α (0.053) ( 0.453) ( 0.055) (0.329) (0.094) ( 0.922) 0, φ 1 (0,014) ( ) (0.015) (0.023) (0.018) (0.035) φ 2 ( ) (0.043) (0.016) ( 0.023) (0.023) (0.057) φ 3 (0.013) (0.033) ( ) (0.047) (0.016) (0.052) -0, φ 4 (0,014) ( ) (0.0156) (0.049) (0.014) ( ) -0, φ 5 (0,014) (0.067) ( 0.016) (0.027) ( 0.015) (0.088) -0, φ 6 (0,014) ( 0.057) (0.015) (0.036) (0.015) (-0.703) -0, φ 7 (0,014) (0.053) (0.015) (0.032) (0.016) ( ) -0, φ 8 (0,014) (0.048) (0.015) (0.032) (0.015) (-0.117) -0, φ 9 (0,013) (0.042) (0.013) (0.036) (0.015) (-0.289) # 87.34% 12.66% 84.49% 15.51% 88.47% 11.52% AIC 15361, , Tabulka 3.4: Výsledky odhadů nelineárních modelů pro hodinové ceny Hodnota prahové proměnné byla určena na základě informačního kritéria. Enders [3] ovšem navrhuje i jiný způsob určení. Pro každou potenciální hodnotu τ (přičemž 15% nejnižších a nejvyšších hodnot se vyřadí) se odhadne odpovídající model a vybere se taková hodnota τ, která minimalizuje součet čtverců reziduí. Setřídíme-li potencionální prahové hodnoty podle velikosti, můžeme vykreslit graf velikosti SSR v závislosti na hodnotě τ. Pro řadu hodinových cen je tento graf v příloze na obrázku A.11. Z grafu je patrné, že ideální prahová hodnota, která minimalizuje SSR, vyšla velmi podobně jako při odhadu pomocí informačního kritéria (pro potenciální hodnotu τ bylo ovšem potřeba zahrnout více, než zmíněných 70% pozorování).

32 Kapitola 3. Empirická analýza 24 Denní ceny Výsledky jednotlivých modelů pro denní data jsou v příloze v tabulce B.1. Prahové hodnoty u modelu SETAR a LSTAR mají přibližně stejnou hodnotu, na rozdíl od hodinových cen jsou nyní nízké a větší procento pozorování je ve vyšším režimu. Parametr hladkosti u LSTAR modelu je poměrně velký - nyní se model blíží spíše SETAR modelu. SETAR model je také vybrán pomocí informačního kritéria jako nejlepší. Týdenní ceny V tabulce B.2 jsou odhadnuté modely pro data s týdenní frekvencí. Prahové hodnoty vycházejí u modelu SETAR a LSTAR velmi podobně (nyní je vyšším režimem stejně jako u hodinových cen modelováno zhruba 15% největších pozorování). Vysoká hodnota parametru hladkosti LSTAR modelu značí jeho přiblížení k modelu SETAR, který má nejmenší hodnotu AIC. Měsíční ceny Pro měsíční data jsou výsledky odhadnutých modelů v tabulce B.3. Na rozdíl od předchozích řad jsou prahové hodnoty modelu SETAR a LSTAR odlišné. Parametr hladkosti u modelu LSTAR nyní neupřednostňuje žádný z modelů SETAR nebo AR. Podle informačního kritéria je model se spojitou přechodovou funkcí z daných modelů nejlepší. Diagnostická kontrola reziduí V tabulce 3.5 jsou p-hodnoty Shapiro - Wilkova testu (SW) pro ověření normality reziduí, Box - Pierceho testu (BoP) pro ověření nezávislosti reziduí a Bresch - Paganova testu (BP) pro ověření homoskedasticity rozptylu reziduí všech odhadnutých nelineárních modelů. SETAR MTAR LSTAR Hodinové ceny Denní ceny Týdenní ceny Měsíční ceny SW 2.2e e BP BoP SW 2.2e e BP BoP SW 2.2e e BP BoP Tabulka 3.5: P-hodnoty testů pro ověření bílého šumu u lineárních modelů Pro všechny modely zamítáme normalitu reziduí, nekonstantní rozptyl v čase je v modelu MTAR u týdenních cen.

Zobrazit více