MASARYKOVA UNIVERZITA ÚSTAV MATEMATIKY A STATISTIKY

Rozměr: px
Začít zobrazení ze stránky:

Download "MASARYKOVA UNIVERZITA ÚSTAV MATEMATIKY A STATISTIKY"

Transkript

1 MASARYKOVA UNIVERZITA PŘÍRODOVĚDECKÁ FAKULTA ÚSTAV MATEMATIKY A STATISTIKY Bakalářská práce BRNO 2013 PETR BOŘIL

2 MASARYKOVA UNIVERZITA PŘÍRODOVĚDECKÁ FAKULTA ÚSTAV MATEMATIKY A STATISTIKY Modelování a predikce spotových cen elektrické energie Bakalářská práce Petr Bořil Vedoucí práce: Ing. Daniel Němec, Ph.D. Brno 2013

3 Bibliografický záznam Autor: Název práce: Studijní program: Studijní obor: Vedoucí práce: Petr Bořil Přírodovědecká fakulta, Masarykova univerzita Ústav matematiky a statistiky Modelování a predikce spotových cen elektrické energie Matematika Finanční a pojistná matematika Ing. Daniel Němec, Ph.D. Akademický rok: 2012/2013 Počet stran: vii + 33 Klíčová slova: časové řady; spotová cena elektřiny; rekurzivní predikce; nelineární modely

4 Bibliographic Entry Author: Title of Thesis: Degree Programme: Field of Study: Supervisor: Petr Bořil Faculty of Science, Masaryk University Department of Mathematics and Statistics Modelling and forecasting spot electricity prices Mathematics Financial and Insurence Mathematics Ing. Daniel Němec, Ph.D. Academic Year: 2012/2013 Number of Pages: vii + 33 Keywords: time series; spot electricity prices; recursive prediction; nonlinear models

5 Abstrakt V této bakalářské práci se věnujeme modelování a předpovědím spotových cen elektřiny. Na datech z pražské energetické burzy odhadneme lineární a více-režimové nelineární modely a pomocí vhodného kritéria porovnáme jejich predikční schopnosti. Analyzujeme ceny na hodinové, denní, týdenní a měsíční frekvenci a pro každou časovou řadu vybereme model, který bude nejlépe předpovídat budoucí cenu. Abstract This thesis deals with the problem of modelling and forecasting spot electricity prices. We estimate linear and non-linear threshold autoregressive models using electricity prices from Power Exchange Central Europe and compare them in the term of their prediction capabilities. We analyse time series based on hourly, daily, weekly and monthly frequency and choose the best model for prediction purposes.

6

7 Poděkování Na tomto místě bych chtěl poděkovat Ing. Danielu Němcovi, Ph.D. za cenné rady a připomínky při vedení této bakalářské práce. Zároveň děkuji rodičům za jejich podporu při studiu. Prohlášení Prohlašuji, že jsem svoji bakalářskou práci vypracoval samostatně s využitím informačních zdrojů, které jsou v práci citovány. Brno 28. května Petr Bořil

8 Obsah Úvod Kapitola 1. Úvod do problematiky modelování cen elektřiny Kapitola 2. Vhodné modely časových řad Box - Jenkinsonova metodologie Nelineární modely časových řad Testy nelinearity Tvorba předpovědí Shrnutí Kapitola 3. Empirická analýza Data Prohlídka časových řad Odhad lineárního modelu Testy nelinearity Odhad nelineárních modelů Predikční schopnosti modelů Hodinové ceny Denní ceny Týdenní ceny Měsíční ceny Sezónně očištěné hodinové ceny Dodatek k předpovědím Shrnutí Závěr Seznam použité literatury Příloha vii

9 Úvod Trhy s elektrickou energií prošly v posledních desetiletích velkými změnami. Proces deregulace zasáhl dříve či později většinu významných světových trhů a z plně centralizovaného trhu se najednou stal trh s otevřenou soutěží. Následkem toho se pro důležité hráče na trhu vyvinula potřeba umět správně odhadnout cenu a předpokládané množství elektřiny, které bude poptáváno. O rozšíření této problematiky svědčí také velké množství vědeckých článku, které se zabývají různými přístupy k modelování ceny elektřiny. Cílem této práce bude odhadnout nejlepší lineární a nelineární více-režimové modely a porovnat jejich predikční schopnosti na daném vzorku dat. Zaměříme se na spotové ceny z pražské energetické burzy Power Exchange Central Europe. Budeme modelovat a předpovídat ceny na více časových frekvencích - hodinových, denních, týdenních a měsíčních. Práce bude strukturovaná do tři kapitol. V první kapitole si ukážeme možné přístupy k modelování cen elektřiny. Při odhadování cen pomocí modelů časových řad lze postupovat mnoha způsoby - na některé z nich poukážeme s odkazem na příslušný článek, kde byly použity. Ve druhé kapitole představíme potřebnou teorii k samotné analýze daných časových řad. Lineární modely, které vycházejí z Box-Jenkinsonovy metodologie, jsou dobře známy a popsány. Více-režimové nelineární modely, které vycházejí z modelů lineárních, byly s úspěchem aplikovány na řadu ekonomických časových řad. Spolu s nimi budou ještě ve druhé kapitole představeny a zmíněny základní techniky a nástroje, které využijeme v další části práce. Empirickou analýzu dat provedeme ve třetí kapitole. Časové řady si zobrazíme a podíváme se, zda je nutné je transformovat. Postupně odhadneme nejlepší lineární a nelineární modely a podíváme se také na to, zda jsou ceny elektřiny vůbec vhodné pro modelování pomocí více-režimových modelů. Pomocí definovaného kritéria porovnáme jejich predikční schopnosti, přičemž u každé časové řady vybereme model, který bude minimalizovat chybu předpovědi. 1

10 Kapitola 1 Úvod do problematiky modelování cen elektřiny K modelování cen elektřiny se využívá velké množství metod, což je dáno také tím, že trhy s elektřinou jsou v mnoha ohledech specifické. Samotná energie je neskladovatelná, je tedy vyžadována konstantní rovnost mezi poptávkou a nabídkou. Spotřeba elektřiny během dne ovšem značně kolísá, souběžně s tím se mění i cena (je zde extrémní volatilita). Výše uvedená podmínka rovnosti nabídky a poptávky někdy vede k situacím, kdy je cena elektřiny záporná, pro dodavatele elektřiny je tedy výhodnější elektřinu zničit než odstavit výrobní zdroj. U nás jsou záporné ceny nově povoleny od 1. ledna , a hned v první den platnosti tohoto zákona byla cena na pražské energetické burze několik hodin záporná. Tato situaci nastává zřídka, zejména v noci a na krátkou dobu, může ale nastat i v případě, kdy se neočekávaně zvýší produkce elektřiny z obnovitelných zdrojů. Cena elektřiny je zároveň také velmi neelastická - většině spotřebitelů je víceméně lhostejné, jaká je aktuální spotová cena elektřiny. Autoři Misiorek et. al [7] uvádí dva možné způsoby dělení modelování a predikce cen elektřiny - podle délky předpovědi a aplikované metodologie. Podle horizontu předpovědi dělíme modelování na: Dlouhodobá předpověd - je plánovaná v rocích. Využívá se při analýze návratu investic a při rozhodování u dlouhodobých projektů. Středně-dlouhodobá předpověd - dobou předpovědi jsou měsíce. Pomáhají při tvorbě a kalkulaci rozvahy podniků, jsou důležité pro risk management a odvozování budoucích cen. Často se nehledí na na přesný odhad spotové ceny, ale na pravděpodobnostní rozdělení ceny na dané období. Krátkodobá předpověd - horizont předpovědi je od několika hodin po několik dnů. Těší se velké pozornosti všech účastníků na burze, kde se cena stanovuje na základě aukcí. Ti musí vyjádřit své nabídky co se týče ceny a množství. Na takových to burzách jsou přijímány nabídky/poptávky, zatímco se cena zvyšuje/snižuje až je konečně dosažena rovnováha mezi danou poptávkou a nabídkou. Pokud tedy dodavatel energie dokáže správně odhadnout cenu a množství, které bude poptáváno, 1 Zákon 165/2012 Sb. o podporovaných zdrojích energie a o změně některých zákonů, 11 odstavec (9) 2

11 Kapitola 1. Úvod do problematiky modelování cen elektřiny 3 může maximalizovat svůj zisk správným nastavením produkce. Tímto přístupem k modelování se budeme v dalších kapitolách zabývat. Dalším možným kritériem pro rozlišování modelování je podle aplikované metodologie: Production cost models - simulují operace, které produkují požadované zboží za nejnižší cenu. Dokážou modelovat situace z hodiny na hodinu, nicméně nejsou schopny zahrnout vliv nabídky a poptávky na ceny, který je charakteristický pro trh v dnešní době. Equilibrium models - Modely rovnováhy - můžeme je chápat jako zobecnění předchozích modelů, na rozdíl od nich také dokáží pracovat s interakcemi, které probíhají na daném trhu. Dokáží předpovídat, zda cena bude nad mezními náklady a jak to ovlivní výdaje zúčastněných. Ani tyto modely ale nejsou úplně ideální - řadu věcí si musíme přednastavit, abychom se dobrali konkrétních výsledků. Fundamentální analýza - sleduje, jak důležité fyzické a ekonomické faktory ovlivňují změnu cen elektřiny. Je předpokládán úzký vztah mezi fundamentálními faktory, jako jsou třeba počasí, celková zátěž atd. a výstupy, které jsou potom nezávisle modelovány a predikovány, často pomocí statistických a ekonometrických technik. Tyto modely jsou používány především pro dlouhodobější předpovědi. Kvantitativní modely - Mají za úkol popsat základní statistické charakteristiky cen elektřiny. Jejich úkolem není předpovídat cenu z hodiny na hodinu, používají se spíše pro odvození ohodnocení produktů a pro management rizik. Statistická a technická analýza - snaží se najít model, který by nejlépe sloužil k předpovídání. Při tom se využívá základních statistických a ekonometrických postupů a modelů. Nejvíce oblíbené metody jsou pomocí vícenásobné regrese a časových řad. Zatímco na finančních trzích je efektivnost technické analýzy často diskutována - při předpovídání cen elektřiny si vede o mnoho lépe. Je to dáno především tím, že na cenách lze velmi dobře rozpoznat sezónnost - at už denní nebo týdenní, a také rozdíl mezi pracovními dny a víkendem. Modely s umělou inteligencí - Artificial based models - konečně posledním přístupem k modelování jsou modely s umělou inteligencí. Ty jsou založeny na neparamatrických nástrojích, jako je např. využití umělé neuronové sít e, expertní systémy nebo fuzzy logika. Tyto modely dokáží být velmi flexibilní a zvládají výborně nelineární modelování. Díky tomu se výborně hodí k předpovědi spotových cen elektřiny. Nicméně při srovnání s předchozím typem modelů (konkrétně s modelem ARIMA) jsou méně přesné - více lze dohledat v článku autorů Conejo et al. [2]. V naší práci se budeme zabývat statistickými a ekonometrickými metodami při modelování cen elektřiny, důraz bude dán na využití časových řad. Můžeme se zde setkat s celou řadou přístupů - např. autoři již zmíněného článku Misiorek et. al (2006) [7] porovnávají předpovědi modelů AR/ARX (rozšíření X značí zahrnutí exogenní proměnné - poptávky po elektřině), nelineárních TAR/TARX, AR-G/ARX-G ( G značí rozšíření pomocí modelování rozptylu náhodných složek modelem GARCH) a pomocí Markov regime switching

12 Kapitola 1. Úvod do problematiky modelování cen elektřiny 4 models. Nejlepší intervalové a bodové předpovědi na datech z kalifornské burzy byly dosaženy pomocí modelu TARX následovány jednoduchým ARX modelem. Autoři Garcia et al. [5] porovnávají na cenách ze španělské a kalifornské burzy model ARIMA a jeho rozšíření modelem GARCH, přičemž výsledky upřednostňují model GARCH. Další články se věnují možnému rozšíření modelování náhodných složek (např. Weron [9]). Zajímavý přístup (při modelování cen elektřiny ale ne tak neobvyklý) zvolili autoři Weron, R., Misiorek, A. [10] - ve svém článku porovnávají předpovědi modelu označovaného jako p-ar (spike preprocessed AR model - extrémní hodnoty jsou zde nahrazeny normálnějšími ) s predikcemi modelů TAR, Mean-reverting jump diffusions modely a autoregresními modely s neparametrickými inovacemi (označované jako semiparametrické modely). Cena je predikována také pomocí exogenní proměnné teploty vzduchu. Poslední ze zmíněných modelů má pro bodové odhady nejlepší výsledky.

13 Kapitola 2 Vhodné modely časových řad V této kapitole budou definovány modely časových řad a nástroje pro práci s nimi, které využijeme k modelování cen elektřiny v třetí kapitole. Cílem této kapitoly není podrobný výklad vybraných partií z teorie časových řad, ale stručné shrnutí metod a modelů využívaných v další části práce. Teorie vychází z Enderse[3] a Cipry [1]. V první části této kapitoly zmíníme základy Box - Jenkinsonovy metodologie, druhá část bude zaměřena pouze na nelineární modely. 2.1 Box - Jenkinsonova metodologie V ekonometrické teorii časových řad je tato metodologie široce přijímána. Lze ji úspěšně aplikovat na téměř jakoukoliv časovou řadu. V dalších částech práce se bude předpokládat, že čtenář je seznámen s pojmy časové řady, stacionarity, invertibility časových řad, výběrovou autokorelační funkcí, výběrovou parciální autokorelační funkcí a bílého šumu (lze dohledat např. zde - Forbelská [4]). Autoregresní model AR Autoregresní model řádu p značený jako AR(p) má tvar po přepsání lze zapsat takto y t = ϕ 1 y t ϕ p y t p + ε t, (2.1) y t ϕ 1 y t 1... ϕ p y t p = Φ(B)y t = ε t, (2.2) kde ϕ 1,...,ϕ p jsou parametry, Φ(B) = 1 ϕ 1 B... ϕ p B p je autoregresní operátor a ε t je bílý šum. V modelu (2.1) stejně jako u všech ostatních lineárních modelů předpokládáme nulovou střední hodnotu - v případě nenulové střední hodnoty by bylo možné model doplnit parametrem µ. Model klouzavých součtů MA Model klouzavých součtů řádu q, značený jako MA(q) má tvar y t = ε t + θ 1 ε t θ q ε t q = Θ(B)ε t = ε t, (2.3) 5

14 Kapitola 2. Vhodné modely časových řad 6 kde θ 1,...,θ q jsou parametry a Θ(B) = 1+θ 1 B+...+θ q B q je operátor klouzavých součtů. Smíšený ARMA model Kombinací dvou předchozích modelů lze vytvořit smíšený model řádu p,q, značený jako ARMA(p,q). Vypadá takto y t ϕ 1 y t 1... ϕ p y t p = ε t + θ 1 ε t θ q ε t q, (2.4) pomocí operátorů definovaných v v předešlých částech textu lze také zapsat jako Integrované ARMA modely Φ(B)y t = Θ(B)ε t (2.5) Pomocí ARIMA modelů lze modelovat i nestacionární časové řady. Zavedením diferenčního operátoru d y t = (1 B) d y t můžeme tyto modely zapisovat jako a značíme je ARIMA (p,d,q). Φ(B) d y t = Θ(B)ε t (2.6) Sezónní ARIMA modely Box - Jenkinsonova metodologie nabízí také modelování sezónosti pomocí tzv. multiplikativního sezónního modelu, běžně označováného jako SARIMA model. Definujme si sezónní autoregresní operátor řádu P Π(B L ) = 1 π 1 B L... π P B PL, dále sezónní operátor klouzavých součtů řádu L a sezónní diferenční operátor Ψ(B L ) = 1 + ψ 1 B L ψ Q B QL D L = (1 B L ) D. Formálně zapíšeme SARIMA(p,d,q) (P,D,Q) L model takto kde L je délka sezónnosti. Φ(B)Π(B L ) d D L y t = Θ(B)Ψ(B L )ε t (2.7)

15 Kapitola 2. Vhodné modely časových řad Nelineární modely časových řad V posledních letech byly více-režimové nelineární modely s úspěchem aplikovány na různé ekonomické časové řady. Tato podkapitola obsahuje stručný přehled těchto modelů, které použijeme pro modelování cen elektřiny. Důraz bude kladen na obecnou třídu modelů s proměnlivými režimy - regime switching models. Těmito modely se dají popsat časové řady, u kterých se v čase mění jejich charakteristika s ohledem na to, v jakém se nacházejí režimu (pro představu jeden režim může popisovat danou řadu v případě, kdy jsou její hodnoty menší než určená hodnota, druhý režim modeluje tu stejnou řadu v opačném případě). Pro lepší přiblížení realitě tyto modely popisují časovou řadu pomocí několika spojitých lineárních funkcí právě v závislosti na daném režimu. Lze rozlišit dva druhy modelů - pokud se režim určuje na základě proměnné, kterou známe nebo dokážeme vypozorovat, jedná se o modely se známými režimy (např. TAR, STAR, SETAR), mění-li se režimy náhodně na základě skryté proměnné, jedná se o modely označovaní jako MSW - The Markov switching model. Konstrukce těchto modelů je značně obtížná, v praxi se pracuje častěji s prvním typem modelů, se kterými se budeme zabývat i v této práci. Podle způsobu určení přepínače režimu (také se hovoří o tzv. prahu) a přechodu mezi jednotlivými funkcemi pro každý režim lze modely rozdělit do několika skupin. TAR modely Pomocí již zmíněných TAR modelů (z anglického threshold autoregressive models) lze pro více režimů modelovat jednotlivé AR modely. Pro dva režimy vypadá model takto { α 0 + α 1 y t α 1p y t p + ε 1t pro y t 1 τ y t = (2.8) β 0 + β 1 y t β 1r y t r + ε 2t pro y t 1 < τ, kde je prahovou proměnou přímo vysvětlovaná proměnná s řádem zpoždění 1. Pokud je tato proměnná větší než prahová hodnota τ- threshold value, je model určován AR(p) modelem s koeficienty α a naopak. Prahová hodnota se obvykle vybírá z hodnot minulých pozorování. Pro zjednodušení se předpokládá, že ε 1t a ε 1t jsou vzájemně nezávislé bílé šumy obvykle typu i.i.d. se stejným rozptylem, tedy D(ε 1t ) = D(ε 2t ). Pro odhad parametrů je výhodné si model přepsat do jiné podoby. Nejdříve si definujme indikátorovou funkci I t takto { 1 pro y t 1 τ I t = 0 pro y t 1 < τ. Dále si definujeme vektor složený z minulých hodnot y t model TAR nyní můžeme zapsat takto x t = (1,y t 1,y t 2,...,y t p ), y t = x tαi t + x tβ(1 I t ) + ε t. (2.9) V tomto tvaru je možné model odhadnout metodou nejmenších čtverců.

16 Kapitola 2. Vhodné modely časových řad 8 SETAR modely V předchozím modelu je režim determinován pozorovanou proměnnou s řádem zpoždění 1. Často se stává, že změna chování časové řady se projeví až po určité době. Pokud se tato situace vyskytne, bylo by rozumné zajistit, aby se režim měnil na základě hodnoty y t d, kde d=1,2,3,... Tyto modely se nazývají SETAR (z anglického Self-exciting threshold AR models) a pro dva režimy jsou definovány takto { α 0 + α 1 y t α 1p y t p + ε 1t pro y t d τ y t = (2.10) β 0 + β 1 y t β 1r y t r + ε 2t pro y t d < τ, kde τ je prahová hodnota. Předpoklady jsou stejné jako v předchozím modelu, tedy ε 1t a ε 2t jsou vzájemně nezávislé bílé šumy typu i.i.d., D(ε 1t ) = D(ε 2t ), a (r = p). Podobně jako v minulém modelu by šlo model přepsat do výhodnější podoby pro odhad parametrů. M-TAR modely Dalším možným rozšířením modelu TAR je model M-TAR (Momentum TAR), ve kterém se režim nemění na základě hodnoty y t d, nýbrž v důsledku velikosti změny u jedné z předcházejících hodnot - diference y t d. Tento model dobře popisuje situaci, kdy je výrazný rozdíl v chování sledované řady, pokud řada roste nebo klesá. Prahová hodnota τ může ovšem nabývat libovolné hodnoty. Model vypadá takto { α 0 + α 1 y t α 1p y t p + ε 1t pro y t d τ y t = (2.11) β 0 + β 1 y t β 1r y t r + ε 2t pro y t d < τ. STAR modely Modely typu TAR mají tu vlastnost, že přechod mezi režimy je skokový. Parametry v modelu se tedy mění okamžitě a tyto modely nemají spojitou podmíněnou střední hodnotu. Modely STAR - Smooth Transition AR models byly proto navrženy tak, aby přechod mezi režimy byl spojitý. Model pro dva režimy je definován takto y t =(α 0 + α 1 y t α 1p y t p + ε 1t )(1 G(y t d,γ,τ))+ (β 0 + β 1 y t β 1r y t r + ε 2t )(G(y t d,γ,τ)), (2.12) kde G(y t d,γ,τ) je spojitá přechodová funkce. Parametr τ je prahová hodnota, y t d je prahová proměnná a γ je parametr hladkosti - (smoothnes parameter). Podle typu přechodové funkce se modely dají dále rozlišit. LSTAR modely Nejpoužívanějším typem modelu STAR je model Logistic-STAR, kde přechodová funkce je logistická funkce tvaru G(y t d,γ,τ) = exp[ γ(y t d τ)]. (2.13)

17 Kapitola 2. Vhodné modely časových řad 9 Pokud jde v limitě γ 0, model se blíží k lineárnímu AR(p) modelu (přechodová funkce je rovna 0.5); jde-li v limitě γ, LSTAR se blíží modelu typu SETAR (přechodová funkce je rovna bud 0 nebo 1 v závislosti na znaménku výrazu (y t d τ)). Odhad parametrů v modelů LSTAR již nelze odvodit tak snadno, jako tomu bylo v případě modelu SETAR. 2.3 Testy nelinearity Před začátkem samotného hledání nejlepšího nelineárního modelu je nutné ověřit nelinearitu dat. Literatura zmiňuje několik možných testů, některé zde ve stručnosti uvedu. U většinu testu je nulová hypotéza přítomnost linearity v datech. McLeod - Li Test Podstatou tohoto testu je testování nulovosti prvních m autokorelací čtverců reziduí odhadnutého lineárního modelů. Nejdříve tedy odhadneme vhodný lineární model a uložíme si rezidua ε t. Ty využijeme při výpočtu Ljung-Boxovi statistiky dané vzorcem LB = n(n + 2) m i=1 ρ(i) 2 n i, (2.14) kde ρ(i) je výběrová autokorelační funkce mezi ε t 2 a ε t i 2. Testová statistika má za platnosti nulové hypotézy (prvních m autokorelací je rovno 0) asymptotické χ(m) 2 rozdělení. Pokud statistika LB překročí kritickou hodnotu, zamítáme nulovou hypotézu a přijímáme hypotézu o nelinearitě modelu. Dalším možné provedení tohoto testu spočívá v odhadnutí regrese ε t 2 = α + α1 ε 2 t α n ε 2 t n, (2.15) kde za předkpokladu linearity by α 1 až α n mělo být rovno nule. RESET test Dalším známým testem je Regression error specification test. Opět testujeme nulovou hypotézu linearity proti alternativní hypotéze nelinearity. Myšlenka tohoto testu využívá toho, že pokud jsou rezidua z předem odhadnutého nejlepšího lineárního modelu nezávislá (označíme je ε t ), neměla by být korelována s odhadnutými vyrovnanými hodnotami ze stejného modelu - ŷ t. Nyní odhadneme regresi ε t = Z tb + H h=2 α h ŷ h t + ε t, (2.16) kde Z t je vektor obsahující proměnné zahrnuté v předem odhadnutém lineárním modelu, B je vektor neznámých parametrů a H se obvykle volí mezi 3 a 4. Klasickým F-testem nyní můžeme testovat nulovou hypotézu α 2,...,α H = 0. Linearitu můžeme zamítnout, pokud F-statistika přesáhne kritickou hodnotu standardního F-rozdělení. Dalším obecným testem nelinearity je Portmanteau Test a Test Lagrangeových multiplikátorů, jehož vícenásobným použitím můžeme dokonce vybrat nejvhodnější formu nelinearity. Lze také testovat vhodnost nelineárních modelů uvedených výše.

18 Kapitola 2. Vhodné modely časových řad 10 Supremum test Jedním z těchto testů je supremum test (více Enders [3]), který testuje vhodnost modelu TAR. SSR u označíme součet čtverců reziduí nejlepšího SETAR modelu, podobně SSR r označíme součet čtverců reziduí u lineárního modelu. Tradiční F-statistika pro porovnání omezeného a neomezeného modelů daná vzorcem F = (SSR r SSR u )/q, (2.17) SSR u /(n k) kde q je počet omezení, n počet pozorování a k je počet odhadovaných parametů v neomezeném modelu, které ovšem nepochází z F-rozdělení. Pro dosažení požadovaného rozdělení budeme generovat n vzorků (stejně jako počet pozorování) ze standardizovaného normálního rozdělení. Vygenerovaná náhodné čísla označíme jako ε t a provedeme regrese s vysvětlovanou proměnnou ε t a vysvětlujícími proměnnými stejnými jako u lineárního a nelineárního modelu. Součet čtverců reziduí u regrese s vysvětlujícími proměnnými z lineárního modelu nyní označíme SSR r, podobně SSR u bude značit součet čtverců reziduí u regrese s vysvětlujícími proměnnými z nelineárního modelu. Nyní vypočítáme F = (SSR r SSR u)/q SSR. (2.18) u/(n k) Tento postup zopakujeme nejméně 1000krát, abychom dostali požadované rozdělení F. Původní F-statistiku porovnáme s nově získaným rozdělením - pokud tato hodnota překročí 95% percentil rozdělení F, můžeme na hladině významnosti 0,05 zamítnout nulovou hypotézu o lineárním modelu. U všech časových řad je třeba provést test jednotkového kořene pro ověření stacionarity. Nejpoužívanějším testem je Dickey-Fullerův test, jehož obohacená verze spočívá v odhadu následujícího modelu y t = α 0 + α 1 t + γy t 1 + p i=1 β i y t i+1 + ε t, (2.19) přičemž budeme testovat parametr γ = 0. Pokud t-statistika překročí hranici Dickey- Fullerova rozdělení na dané hladině významnosti, můžeme zamítnout nulovou hypotézu jednotkového kořene. Dalším testem pro ověření stacionarity je Kwiatkowski - Phillips - Schmidt - Shinův test. Autoři tohoto testu poukazovali na fakt, že test jednotkového kořene z různých důvodů často selhává v zamítnutí nepravdivé nulové hypotézy. V tomto testu je tedy nulová hypotéza ověření stacionarity oproti alternativní hypotéze jednotkového kořene. Podrobnější informace o tomto testu lze najít v tomto článku autorů Kwiatkowski et al. [6] Kontrolou správnosti modelu jsou náhodné složky ε t, které by měly odpovídat procesu bílého šumu - tedy být nekorelované s nulovou střední hodnotou, konstantním rozptylem a měly by pocházet z normálního rozdělení. Předchozí požadavky je snadné ověřit sérií následujících testů - normalitu testuje Shapiro - Wilkův test, homoskedasticitu pomocí Breuch - Paganava testu a nezávislost reziduí pomocí Box - Pierceho testu. Jedná se o široce používané testy, které jsou popsány v řadě učebnic ekonometrie (např Enders [3]).

19 Kapitola 2. Vhodné modely časových řad Tvorba předpovědí Nejdříve se budeme věnovat předpovědím v lineárním modelu, posléze v nelineárních modelech. Zde budeme čerpat z článku autorů van Dijk, Terasvirta, Franses [8]. Lineární modely Enders[3] na jednoduchém AR(1) modelu ukazuje, jak lze odvodit předpovědi v ARMA modelech. Uvažujme model y t = a 0 + a 1 y t 1 + ε t. Nyní lze snadno vyjádřit hodnota y t+1 jako y t+1 = a 0 + a 1 y t + ε t+1. Pokud známe koeficienty a 0 a a 1, můžeme předpověd y t+1 podmíněnou informacemi v čase t vypočítat jako ŷ t+1 = E[y t+1 Ω t ] = a 0 + a 1 y t, (2.20) kde ŷ t+1 značí optimální předpověd v čase t a Ω t je množina informací dostupná v čase t. Protože y t+2 = a 0 + a 1 y t+1 + ε t+2, lze snadno odvodit, že předpověd y t+2 podmíněná informacemi v čase t vypadá takto Po dosazení (2.20) do (2.21) dostáváme ŷ t+2 = E[y t+2 Ω t ] = a 0 + a 1 E[y t+1 Ω t ]. (2.21) Pokud bychom takto pokračovali dále, zjistíme, že ŷ t+2 = a 0 + a 1 (a 0 + a 1 y t ). (2.22) ŷ t+ j = E[y t+ j Ω t ] = a 0 (1 + a 1 + a a j 1 1 ) + a j 1 y t. (2.23) Předchozí rovnice nám popisuje předpovědi v čase t + j jako funkci, ve které jsou brány informace pouze známé v čase t. Nevýhodou tohoto přístupu je, že pro rostoucí j se kvalita předpovědí značně zmenšuje. Za předpokladu, že a 1 < 1 lze dokázat, že při j se výraz ŷ t+ j a 0 /(1 a 1 ). Výsledek se dá zobecnit na jakýkoliv stacionární ARMA model - při j podmíněná předpověd y t+ j konverguje na nepodmíněnou střední hodnotu. 1 Nelineární modely Uvažujme obecný nelineární model tvaru y t = F(x t ;θ) + ε t, (2.24) kde F(x t ;θ) je nelineární funkce s parametry θ a x t = (1,y t 1,...,y t p ). Označme optimální předpověd y t+h v čase t jako ŷ t+h t = E[y t+h Ω t ], kde Ω t obsahuje všechny známe informace v čase t, chybu predikce označíme e t+h t = y t+h ŷ t+h t. Využijeme-li toho, že E[ε t+1 Ω t ] = 0, lze jednokroková predikce snadno vyjádřit jako ŷ t+1 = E[y t+1 Ω t ] = F(x t+1 ;θ), což je analogické k lineárním předpovědím. Pro h > 1 tyto úvahy neplatí. Dvou-kroková predikce bude vypadat takto 1 Pro uvedený AR(1) model je to hodnota a 0 /(1 a 1 ) ŷ t+2 = E[y t+2 Ω t ] = E[F( x t+2 ;θ) Ω t ), (2.25)

20 Kapitola 2. Vhodné modely časových řad 12 kde x t+2 t = (1,ŷ t+1 t + ε t+1,y t,...,y t (p 2) ). Výraz se dá vyjádřit jako ŷ t+2 = F( x t+2 ;θ) f (ε)dε, (2.26) kde f značí hustotu ε t+1. Numerické řešení tohoto integrálu je pro delší horizont předpověd i velmi časově náročné, v praxi se tedy používají jiné metody. Jeden z možných způsobů je nezohlednit nelinearitu a vypočítat předpověd přímo ŷ t+2 t = F( x t+2 ;θ). (2.27) Protože ovšem pro h > 1 neplatí, že E[F( x t+h t ;Ω t )] F(E[ x t+h t ;Ω t ]), vede tento přístup ke zkresleným odhadům. Oblíbenou metodou aproximace podmíněné střední hodnoty z výrazu (2.25) je Monte Carlo simulace. Dvou-kroková předpověd by vypadala takto ŷ t+2 t = 1 k k i=1 F( x (i) t+2 t ;θ), (2.28) kde k je dostatečně velké číslo a hodnoty ε t+1 obsažené ve výrazu x t+2 t jsou brány z předpokládaného rozdělení ε t. Metoda bootstrap je obdobná předchozí metodě, hodnoty ε t+1 jsou ovšem brány ze skutečných reziduí v odhadnutém modelu.výhodou poslední metody oproti Monte Carlo je, že na ε t se nemusí klást žádné předpoklady. Při tvorbě předpovědí pomocí Monte Carlo a bootstrap metody lze snadno z kvantilů u získaných rozdělení předpovědí pro h > 1 tvořit intervalové předpovědi. Pro porovnání předpovědí se běžně používá Root mean squared prediction error, která je definována RMSPE = 1 m kde m je počet h-krokových předpovědí. m 1 j=0 (ŷ t+h+ j t+ j y t+h+ j ) 2, (2.29) 2.5 Shrnutí V této kapitole jsme představili teorii potřebnou k analýze časových řad v další části práce. Uvedli jsme si zástupce lineárních (ARIMA) i nelineárních modelů (SETAR, MTAR, LSTAR), které budeme odhadovat. Pro test jednotkového kořene můžeme využít Dickey- Fullerův test, KPSS test pro odhalení nestacionarity a případnou nelinearitu ověříme pomocí McLeod-Li a RESET testu. Supremum test dokáže posoudit vhodnost SETAR modelu. Předpovědi budeme tvořit pomocí metod ukázaných v předposlední podkapitole.

21 Kapitola 3 Empirická analýza V této kapitole se budeme zabývat odhadem modelů uvedených ve druhé kapitole, jejich posouzením a ověřením a dále jejich predikčními schopnostmi. Databáze cen bude popsána hned v úvodu kapitoly. Všechny výpočty a grafy byly provedeny ve volně dostupném softwaru R [14]. Pro ověřování hypotéz si v celé práci pevně zvolíme hladinu významnosti 0,05 (pokud nebude uvedeno jinak). Náš postup bude ve shodě s tradičními postupy při analýze časových řad. Pro nelineární časové řady doporučuje Enders [3] tento postup. 1. V prvé řadě je vhodné si visuálně prohlédnout danou řadu. Díky tomu můžeme lépe pochopit formu nelinearity a odhalit některé vlastnosti řady (např. deterministický trend, strukturální zlomy). Dále je třeba ověřit stacionaritu řady a případně řadu vhodně transformovat. 2. Klasickými metody Box - Jenkinsonovy metodologie odhadneme nejlepší lineární ARMA model a ověřit jeho platnost. 3. Pomocí popsaných testů ve druhé kapitole otestujeme, zda řada vykazuje nelineární chování. Můžeme provést supremum test pro posouzení vhodnosti SETAR modelu oproti modelu lineárnímu. 4. Pokud je v předchozím kroku detekována forma nelinearity, odhadneme nelineární modely a podle vhodného kritéria je porovnáme. Provedeme kontrolu správnosti modelu pomocí analýzy reziduí a můžeme takovéto modely porovnat s lineárními modely. 5. Provedeme předpovědi jednotlivých modelů a pomocí vhodného kritéria je porovnáme. 3.1 Data V této kapitole velmi stručně popíšu situaci s energetickými burzami u nás i ve světě a představím data, se kterými budeme pracovat v další části práce. 13

22 Kapitola 3. Empirická analýza 14 V úvodu jsme zmínili postupný proces deregulace trhu s elektřinou - s tím vznikala potřeba míst, kde by si obchodníci mohli nakoupit elektřinu od výrobců a následně ji prodat zákazníkům. První burza, na které se obchodovalo se spotovými cenami elektrické energie, vznikla v roce 1990 ve Velké Británii. V dalších letech vzniklo velké množství burz v zemích Evropy i Severní Ameriky. Pražská energetická burza byla založena 8. ledna 2007, první obchody se zde provedly v červenci tohoto roku. Obchoduje se zde s elektřinou nejen pro Českou republiku, ale i Slovensko a Mad arsko. PXE nabízí více druhů produktů můžeme je rozdělit na základě dvou hledisek. Podle časového rozdílu mezi platbou a dodáním elektřiny dělíme kontrakty na futures a spotové kontrakty. Dalším kritériem je způsob vyrovnání - obchodníci na burze můžou zvolit finanční vyrovnání, kdy nevzniká závazek elektřinu skutečně dodat/odebrat, nýbrž zde dochází pouze k zaplacení určité částky na základě spotové ceny a fyzické vyrovnání, kdy vzniká povinnost dodat/odebrat elektřinu ze sítě (více na webových stránkách burzy [13]). Spotový trh pro PXE zajišt uje OTE Operátor trhu s elektřinou. OTE rozlišuje trh s elektřinou na blokový, denní a vnitrodenní (více zde [12]). Ceny jsou na všech trzích určovány na základě nabídky a poptávky. V rámci blokového trhu se obchoduje s denními krátkodobými kontrakty (dodávka elektřiny je realizována v konkrétní časový blok určitého dne) Denní trh cena je zde stanovena každou hodinu. Objemy obchodů na tomto trhu jsou mnohonásobně větší než na ostatních trzích. Vnitrodenní trh doplňuje vhodně blokový a denní trh. Obchodníci anonymně poptávají nebo nabízejí elektřinu až do určitého času (běžně 60 minut) před konečnou realizací dodávky či odběru. Pro naši ekonometrickou analýzu budeme používat data z denního trhu. Ta jsou volně dostupná na webových stránkách OTE. V závislosti na frekvenci dat budeme pracovat se čtyřmi druhy časových řad. Hodinová data - časová řada od do , celkem 7296 pozorování. Denní data - časová řada od do , dohromady ji tvoří 681 pozorování. Tato časová řada vznikla (stejně jako další dvě) jako vážený průměr hodinových cen na základě objemu, který se za daný čas zobchodoval. Týdenní data - časová řada od prvního týdne roku 2008 do 49. týdne roku 2012, obsahuje 259 pozorování. Měsíční data - časová řada od ledna roku 2008 do listopadu roku 2012, tvoří ji 70 pozorování. Všechny ceny jsou uvedené v eurech za megawatthodinu a jsou volně dostupné z uvedených webových stránek. Pro větší stručnost a přehlednost textu budou méně podstatné výsledky a grafy u denních, týdenních a měsíčních cen uvedeny pouze v příloze.

23 Kapitola 3. Empirická analýza Prohlídka časových řad V této podkapitole si graficky zobrazíme všechny časové řady, se kterými budeme pracovat. Prohlédneme si výběrové autokorelační a parciální autokorelační funkce a pomocí Dickey - Fullerova testu jednotkového kořene a KPSS testu ověříme jejich stacionaritu. Hodinové ceny Graf časové řady hodinových cen elektřiny je na obrázku 3.1. V první části grafu je cena za celé období, v druhé částí je cena pouze v prvním týdnu roku 2012 (šedě označená část řady v první části). Modrou barvou jsou vyznačeny ceny z října roku 2012, které budou sloužit pro porovnání předpovědí (celkem 744 pozorování), na předcházejícím datovém vzorku budou odhadnuty modely právě pro predikční účely (více v podkapitole 3.6). Obrázek 3.1: Hodinové ceny elektřiny Z grafu je vidět, že se cena pohybovala v rozmezí Euro/Mwh (střední hodnota je 42,9 a směrodatná odchylka 15), jsou zde ale i odlehlé hodnoty okolo 150Eur/Mwh. Z druhé části grafu je patrná denní sezónnost na vývoji cen. Na obrázku 3.2 vidíme výběrovou ACF a PACF. Hodnoty všech autokorelací jsou statisticky významné, opět zde je vidět sezónní chování. Velké hodnoty autokorelací u zpožděných proměnných signalizují možnost výskytu jednotkového kořene, který budeme testovat pomocí Dickey-Fullerova test. Pro naši časovou řadu vychází t-statistika , přičemž kritické hodnoty z Dickey-Fullerova rozdělení jsou pro náš model následující: pro hladinu významnosti α = 0, 01 je kritická hodnota rovna -2.58, pro α = 0,05 je rovna a pro α = 0,1 je kritická hodnota rovna

24 Kapitola 3. Empirická analýza 16 Obrázek 3.2: Výběrová ACF a PACF u hodinových cen elektřiny Na hladině významnosti 0,01 tedy nemůžeme zamítnout hypotézu o jednotkovém kořenu. Protože výsledek předchozího testu nebyl úplně jednoznačný, vyzkoušíme KPSS test pro otestování stacionarity. Testovací statistika vychází a p-hodnota testu je menší než 0,01, můžeme tedy spolehlivě zamítnout hypotézu o stacionaritě. Z předchozích výsledků je zřejmé, že pro další práci bude nutné řadu diferencovat. Graf nově vzniklé časové řady je na obrázku 3.3. První část grafu je diferencovaná časová řada za celé období, šedě podbarvená část je v detailním výřezu v druhé části grafu. Pohled na výběrovou autokorelační a parciální autokorelační funkci na obrázku 3.4 nám prozradí, že zpožděné proměnné jsou stále korelované (nyní i záporně) a že je zde opět pozorovaná sezónnost. Pro kontrolu stacionarity otestujeme přítomnost jednotkového kořene - t-statistika u Dickey-Fullerova testu vychází -44,89, zamítáme tedy nulovou hypotézu jednotkového kořene. Potvrzení tohoto výsledku dostaneme i u KPSS testu. Podobně jako u původní řady jsou i u diferencované řady vidět velké výkyvy cen elektřiny v únoru. U spotových cen elektřiny nejsou tyto náhlé výkyvy vůbec neobvyklé, objevují se na většině trzích s elektřinou a mohou vzniknout z více různých důvodu (nepředvídané změny v počasí a s tím související změna v poptávce po elektřině, příp. změna nabídky elektřiny z obnovitelných zdrojů). Teplotní průměr v České republice za měsíc únor byl -5,1 C, odchylka od průměrné teploty byla -4,1 C [11], může to být tedy jeden z důvodu vysoké ceny. Mohlo by nás zajímat, nakolik tyto výkyvy ovlivní výsledný odhad modelu. Jednou z možných metod je prozkoumání stability parametrů v čase. Na obrázku 3.5 vidíme rekurzivní odhad parametru u první zpožděné proměnné v modelu AR(10). Zatímco v druhé polovině datového vzorku je parametr relativně stabilní, v první části odpovídající výkyvům v cenách je parametr velmi nestabilní. Pro naše odhady tedy použijeme datový vzorek bez prvních dvou měsíců.

25 Kapitola 3. Empirická analýza 17 Obrázek 3.3: Diference hodinových cen Obrázek 3.4: Výběrová ACF a PACF u diferencované řady hodinových cen Denní ceny Graf denních cen je v příloze na obrázku A.1. Pro porovnání předpovědí použijeme data z posledních tří měsíců (celkem 92 pozorování). V roce 2011 cena fluktuovala okolo 50 Eur/Mwh, podobně jako u hodinových cen jsou na začátku roku 2012 patrné velké

26 Kapitola 3. Empirická analýza 18 Obrázek 3.5: Stabilita parametru v čase výkyvy. V další části roku se již cena ustálila a pohybuje se okolo 40 Eur/Mwh. Z pohledu na výběrovou ACF a PACF na obrázku A.2 vidíme opět sezónní chování s periodou 7 dní. Korelace zpožděných proměnných jsou statisticky významné až do řádu zpoždění 17. T-statistika u Dickey - Fullerova testu vychází -0,63, přijímáme nulovou hypotézu jednotkového kořene. Testovací statistika u KPSS testu vychází a p-hodnota testu je menší než 0,01, zamítáme tedy nulovou hypotézu stacionarity. Diferencovaná časová řada je na obrázku A.3. Z výběrové ACF a PACF na obrázku A.4 vidíme stále přítomnou sezónnost. Test jednotkového kořene i KPSS test nám potvrzují stacionaritu. Parametry jsou v čase relativně stabilní. Týdenní ceny Graf týdenních cen je na obrázku A.5. Pro porovnání předpovědí použijeme pozorování z roku Je zde vidět rozdíl v průměrné ceně mezi lety 2008 až 2009 a zbytkem období. Patrné jsou také již zmíněné velké výkyvy na začátku roku Z výběrové ACF na obrázku A.6 je zřejmé, že je řada nestacionární, což nám potvrdí i Dickey - Fullerův a KPSS test, kdy na hladině významnosti 0,01 můžeme zamítnou hypotézu o stacionaritě. Diferencovaná řada je na obrázku A.7. Z pohledu na výběrovou ACF na obrázku A.8 je vidět, že by zde již neměl být problém s nestacionaritou, což nám potvrdí i test jednotkového kořene a KPSS test. Měsíční ceny Měsíční ceny jsou na obrázku A.9. Pro porovnání předpovědí použijeme data z roku 2011 a 2012 (celkem 23 pozorování). Ceny se pohybovali na úrovni Euro/Mwh (kromě již zmíněného nárůstu ceny v roce 2008). Výběrová ACF a PACF jsou na obrázku A.10. Dickey - Fullerův test i test KPSS potvrzují stacionaritu.

27 Kapitola 3. Empirická analýza Odhad lineárního modelu Výběr vhodného modelu pomocí Box - Jenkinsonovy metodologie je známý a dobře popsaný v literatuře. Využívá se tvaru výběrových autokorelačních a parciálních autokorelačních funkcí, další možností je porovnání modelů pomocí informačních kritérií. V naší práci využijeme již naprogramovanou funkci, která vybere ze všech možných lineárních modelů ten nejlepší model na základě námi určeného informačního kritéria. Při výběru vhodného počtu proměnných bude postupovat pomocí stepwise selection. Pro porovnání modelů zvolíme Akaikeho kritérium, které je interně definováno v programu R. Bohužel je rozdílný způsob výpočtu informačních kritéria pro lineární a nelineární modely, proto pro naše potřeby porovnání modelů můžeme kromě predikčních schopností použít pouze součet čtverců reziduí. Odhadnuté lineární modely jsou v tabulce 3.1. Značení parametrů je stejné jako v druhé kapitole - tedy φ jsou koeficienty autoregresního operátoru, θ jsou koeficienty operátoru klouzavých součtů, π jsou koeficienty sezónního autoregresního operátoru, ψ jsou koeficienty sezónního operátoru klouzavých součtů, µ je střední hodnota a L je délka sezónnosti (v závorce jsou směrodatné odchylky). Hodinové ceny Denní ceny Týdenní ceny Měsíční ceny L µ (0.029) (0.021) ( ) (3.271) ϕ 1 (0.002) (0.038) (0.080) (0.077) ϕ 2 (0.006) (0.047) ( 0.069) ( ) ϕ 3 ( ) (0.039) ( ) ( ) θ 1 (0.010) (0.006) (0.052) ( ) θ 2 (0.021) ( ) ( ) ( ) θ 3 (0.009) ( ) ( ) ( ) π 1 (0.041) (0.038) ( ) ( ) π 2 (0.038) (0.039) ( ) ( ) ψ 1 (0.040) ( ) ( ) ( ) ψ 2 (0.030) ( ) ( ) ( ) Tabulka 3.1: Odhady lineárních modelů

28 Kapitola 3. Empirická analýza 20 Pro ověření platnosti modelu je zapotřebí zkontrolovat rezidua z odhadnutého modelu. V tabulce 3.5 jsou p-hodnoty Shapiro-Wilkova testu pro ověření normality, Box-Pierce testu pro ověření nezávislosti reziduí a Bresch-Paganova testu pro ověření homoskedasticity rozptylu u reziduí. Pro všechny časové řady zamítáme nulovou hypotézu normality. Hodinové ceny Denní ceny Týdenní ceny Měsíční ceny Shapiro - Wilkův test 2.2e e e Breusch - Paganův test 1.158e Box - Piercův test Tabulka 3.2: P-hodnoty testů pro ověření bílého šumu u lineárních modelů Homoskedasticitu zamítáme pouze u hodinových cen, hypotézu nezávislosti reziduí přijímáme pro všechny řady. 3.4 Testy nelinearity Ve druhé kapitole jsme si uvedli testy pro ověření linearity. Jejich použitím ovšem dokážeme nejvýše detekovat případnou nelinearitu, nikoliv však to, jakou formu nelinearita má. McLeod-Li test Připomeňme si, že pomocí tohoto testu můžeme ověřit, zda se prvních m autokorelací u čtverců reziduí odhadnutého lineárního modelu rovná nule. Na obrázku 3.6 vidíme p-hodnoty McLeod-Li testu pro jednotlivé zpoždění m. U hodinových, denních i týdenních cen můžeme na dané hladině významnosti pro všechny zpoždění zamítnout nulovou hypotézu linearity. Pro měsíční data některá zpoždění detekují linearitu, nemůžeme ji ovšem přijmout pro všechny zpoždění. Pomocí McLeod - Li testu tedy zamítáme pro data se všemi frekvenci linearitu. RESET test Pomocí Ramsey RESET testu ověříme, zda je lineární model správně specifikován. Zamítnutím nulové hypotézy připouštíme, že je zde možná nelinearita. P-hodnotu tohoto testu pro odhadnuté lineární modely můžeme vidět v tabulce 3.3. Na dané hladině významnosti zamítáme nulovou hypotézu pro hodinová a týdenní data, zatímco pro denní a měsíční ceny připouštíme linearitu. Supremum test Posledním z testu je Supremum test, který testuje lineární AR model oproti SETAR modelu (ten je popsán v následující podkapitole). P-hodnoty tohoto testu nalezneme opět v tabulce 3.3. Pro všechny časové řady je tedy vhodnější model SETAR oproti lineárnímu AR modelu.

29 Kapitola 3. Empirická analýza 21 Obrázek 3.6: McLeod-Li test pro jednotlivé řady Hodinové ceny Denní ceny Týdenní ceny Měsíční ceny RESET test 1.51e Supremum test Tabulka 3.3: P-hodnoty RESET testu a Supremum testu pro jednotlivé řady Protože nám předchozí testy detekovali možnou nelinearitu, můžeme odhadnout nelineární modely. 3.5 Odhad nelineárních modelů V této podkapitole se budeme zabývat odhadem nelineárních modelů uvedených ve druhé kapitole. Při výběru modelu se budeme řídit Akaikeho informačním kritériem, které je definováno takto AIC = nln( 1 n m i=1 ε 2 i ) + 2k, kde n je počet použitých pozorování, m je počet reziduí a k je počet parametrů v modelu. Postup bude následující - pomocí Akaikeho informačního kritéria a t-statistiky u jednotlivých proměnných vybereme nejvhodnější řád zpoždění pro jednotlivé režimy a pro prahovou proměnnou - přičemž pro každou možnou kombinaci těchto zpoždění zároveň odhadneme optimální hodnotu prahové proměnné. Všechny odhadnuté modely porovnáme a podle definovaného kritéria vybereme ten nejlepší (preferovaný model bude tedy s nejmenší hodnotou AIC). Bohužel pro model LSTAR není v v prostředí R možnost vybírat pouze

30 Kapitola 3. Empirická analýza 22 jednotlivé zpožděné proměnné k odhadu ceny v čase t, výsledný model tedy obsahuje proměnné včetně nevýznamných proměnných. Při prezentaci výsledných odhadů budeme dodržovat stejné značení parametrů jako v druhé kapitole - tedy τ je práh, který určuje daný režim, d je zpoždění prahové proměnné a γ je parametr u přechodové funkce (pouze u LSTAR modelu), φ 1,...φ p,r jsou koeficienty u jednotlivých vysvětlujících proměnných (v závorkách jsou směrodatné odchylky). Jednotlivé režimy jsou značeny zkratkou LR - Low Regime (Y t d < τ, resp. Y t d < τ pro MTAR model) a HR - High Regime (opačné znaménka u nerovností). U všech režimů je také uvedeno, jaké procento pozorování z celkového počtu spadá do jednotlivého režimu. Nelineární modely je možné přímo porovnat pomocí uvedeného informačního kritéria (nejlepší model je zvýrazněn). Nebudou zde uvedeny výsledky pro model TAR - model SETAR je jeho zobecněním. Hodinové ceny V tabulce 3.4 jsou výsledky našich odhadů pro hodinová data. Pro všechny modely jsou velmi vysoké prahové hodnoty - procento pozorování v nižším režimu je poměrně velké. Hodnota parametru τ u LSTAR modelu je velmi nízká - model se tedy blíží AR modelu. Tento model je také nejlepší z pohledu Akaikeho informačního kritéria. Grafy odhadnutých hodnot a skutečné ceny ze dne (pondělí) jsou zobrazeny na obrázku 3.7. Černou barvou je zde zobrazena skutečná cena, barevně jsou vykresleny jednotlivé lineární a nelineární modely. V šedě zobrazené části grafu je cena modelována pomocí vyššího režimu. Z grafu je patrné, že nejlépe fituje cenu elektřiny sezónní lineární model. Obrázek 3.7: Odhadnuté lineární a nelineární modely hodinových cen

31 Kapitola 3. Empirická analýza 23 SETAR MTAR LSTAR τ d γ LR HR LR HR LR HR α (0.053) ( 0.453) ( 0.055) (0.329) (0.094) ( 0.922) 0, φ 1 (0,014) ( ) (0.015) (0.023) (0.018) (0.035) φ 2 ( ) (0.043) (0.016) ( 0.023) (0.023) (0.057) φ 3 (0.013) (0.033) ( ) (0.047) (0.016) (0.052) -0, φ 4 (0,014) ( ) (0.0156) (0.049) (0.014) ( ) -0, φ 5 (0,014) (0.067) ( 0.016) (0.027) ( 0.015) (0.088) -0, φ 6 (0,014) ( 0.057) (0.015) (0.036) (0.015) (-0.703) -0, φ 7 (0,014) (0.053) (0.015) (0.032) (0.016) ( ) -0, φ 8 (0,014) (0.048) (0.015) (0.032) (0.015) (-0.117) -0, φ 9 (0,013) (0.042) (0.013) (0.036) (0.015) (-0.289) # 87.34% 12.66% 84.49% 15.51% 88.47% 11.52% AIC 15361, , Tabulka 3.4: Výsledky odhadů nelineárních modelů pro hodinové ceny Hodnota prahové proměnné byla určena na základě informačního kritéria. Enders [3] ovšem navrhuje i jiný způsob určení. Pro každou potenciální hodnotu τ (přičemž 15% nejnižších a nejvyšších hodnot se vyřadí) se odhadne odpovídající model a vybere se taková hodnota τ, která minimalizuje součet čtverců reziduí. Setřídíme-li potencionální prahové hodnoty podle velikosti, můžeme vykreslit graf velikosti SSR v závislosti na hodnotě τ. Pro řadu hodinových cen je tento graf v příloze na obrázku A.11. Z grafu je patrné, že ideální prahová hodnota, která minimalizuje SSR, vyšla velmi podobně jako při odhadu pomocí informačního kritéria (pro potenciální hodnotu τ bylo ovšem potřeba zahrnout více, než zmíněných 70% pozorování).

32 Kapitola 3. Empirická analýza 24 Denní ceny Výsledky jednotlivých modelů pro denní data jsou v příloze v tabulce B.1. Prahové hodnoty u modelu SETAR a LSTAR mají přibližně stejnou hodnotu, na rozdíl od hodinových cen jsou nyní nízké a větší procento pozorování je ve vyšším režimu. Parametr hladkosti u LSTAR modelu je poměrně velký - nyní se model blíží spíše SETAR modelu. SETAR model je také vybrán pomocí informačního kritéria jako nejlepší. Týdenní ceny V tabulce B.2 jsou odhadnuté modely pro data s týdenní frekvencí. Prahové hodnoty vycházejí u modelu SETAR a LSTAR velmi podobně (nyní je vyšším režimem stejně jako u hodinových cen modelováno zhruba 15% největších pozorování). Vysoká hodnota parametru hladkosti LSTAR modelu značí jeho přiblížení k modelu SETAR, který má nejmenší hodnotu AIC. Měsíční ceny Pro měsíční data jsou výsledky odhadnutých modelů v tabulce B.3. Na rozdíl od předchozích řad jsou prahové hodnoty modelu SETAR a LSTAR odlišné. Parametr hladkosti u modelu LSTAR nyní neupřednostňuje žádný z modelů SETAR nebo AR. Podle informačního kritéria je model se spojitou přechodovou funkcí z daných modelů nejlepší. Diagnostická kontrola reziduí V tabulce 3.5 jsou p-hodnoty Shapiro - Wilkova testu (SW) pro ověření normality reziduí, Box - Pierceho testu (BoP) pro ověření nezávislosti reziduí a Bresch - Paganova testu (BP) pro ověření homoskedasticity rozptylu reziduí všech odhadnutých nelineárních modelů. SETAR MTAR LSTAR Hodinové ceny Denní ceny Týdenní ceny Měsíční ceny SW 2.2e e BP BoP SW 2.2e e BP BoP SW 2.2e e BP BoP Tabulka 3.5: P-hodnoty testů pro ověření bílého šumu u lineárních modelů Pro všechny modely zamítáme normalitu reziduí, nekonstantní rozptyl v čase je v modelu MTAR u týdenních cen.

Úvod do analýzy časových řad

Úvod do analýzy časových řad Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2... } se nazývá stochastický

Více

Modely stacionárních časových řad

Modely stacionárních časových řad Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Proces bílého šumu Proces {ɛ t} nazveme bílým šumem s nulovou střední hodnotou a rozptylem σ 2 a

Více

Cvičení 9 dekompozice časových řad a ARMA procesy

Cvičení 9 dekompozice časových řad a ARMA procesy Cvičení 9 dekompozice časových řad a ARMA procesy Příklad 1: Dekompozice časové řady Soubor 18AEK-cv09.xls obsahuje dvě časové řady (X a Y) se 72 pozorováními. Použijte časovou řadu Y. a) Pokuste se na

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie ZS 2015/16 Cvičení 7: Časově řady, autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Časové řady Data: HDP.wf1

Více

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Stochastický proces Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2 } se nazývá stochastický proces

Více

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů Časové řady, typy trendových funkcí a odhady trendů Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Jiří Neubauer (Katedra ekonometrie UO Brno) Časové

Více

Modely pro nestacionární časové řady

Modely pro nestacionární časové řady Modely pro nestacionární časové řady Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Modely pro nestacionární

Více

Ilustrační příklad odhadu LRM v SW Gretl

Ilustrační příklad odhadu LRM v SW Gretl Ilustrační příklad odhadu LRM v SW Gretl Podkladové údaje Korelační matice Odhad lineárního regresního modelu (LRM) Verifikace modelu PEF ČZU Praha Určeno pro posluchače předmětu Ekonometrie Needitovaná

Více

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy Ekonometrická analýza proces, skládající se z následujících fází: a) specifikace b) kvantifikace c) verifikace d) aplikace Postupné zpřesňování jednotlivých

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO

Více

12. cvičení z PST. 20. prosince 2017

12. cvičení z PST. 20. prosince 2017 1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

KORELACE. Komentované řešení pomocí programu Statistica

KORELACE. Komentované řešení pomocí programu Statistica KORELACE Komentované řešení pomocí programu Statistica Vstupní data I Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná

Více

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

Matematické modelování Náhled do ekonometrie. Lukáš Frýd Matematické modelování Náhled do ekonometrie Lukáš Frýd Výnos akcie vs. Výnos celého trhu - CAPM model r it = r ft + β 1. (r mt r ft ) r it r ft = α 0 + β 1. (r mt r ft ) + ε it Ekonomický (finanční model)

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie LS 2014/15 Cvičení 7: Autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Autokorelace - teorie Zopakujte si G-M

Více

Základy ekonometrie. XI. Vektorové autoregresní modely. Základy ekonometrie (ZAEK) XI. VAR modely Podzim / 28

Základy ekonometrie. XI. Vektorové autoregresní modely. Základy ekonometrie (ZAEK) XI. VAR modely Podzim / 28 Základy ekonometrie XI. Vektorové autoregresní modely Základy ekonometrie (ZAEK) XI. VAR modely Podzim 2015 1 / 28 Obsah tématu 1 Prognózování s VAR modely 2 Vektorové modely korekce chyb (VECM) 3 Impulzní

Více

Statistika II. Jiří Neubauer

Statistika II. Jiří Neubauer Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Časová řada konečná posloupnost reálných hodnot určitého sledovaného ukazatele měřeného v určitých

Více

Ekonometrie. Jiří Neubauer

Ekonometrie. Jiří Neubauer Úvod do analýzy časových řad Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Úvod do analýzy

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Korelační a regresní analýza

Korelační a regresní analýza Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná

Více

SEMINÁRNÍ PRÁCE Z 4ST432 Tereza Michlíková (xmict05) ZS 06/07

SEMINÁRNÍ PRÁCE Z 4ST432 Tereza Michlíková (xmict05) ZS 06/07 SEMINÁRNÍ PRÁCE Z 4ST432 Tereza Michlíková (xmict05) ZS 06/07 Nesezónní časová řada - Základní údaje o časové řadě Časová řada příjmy z daní z příjmu v Austrálii ( http://www.economagic.com/emcgi/data.exe/tmp/213-220-208-205!20061203093308

Více

18AEK Aplikovaná ekonometrie a teorie časových řad. Řešení domácích úkolů č. 1 a 2 příklad 1

18AEK Aplikovaná ekonometrie a teorie časových řad. Řešení domácích úkolů č. 1 a 2 příklad 1 18AEK Aplikovaná ekonometrie a teorie časových řad Řešení domácích úkolů č. 1 a 2 příklad 1 Obecné pravidlo pro všechny testy Je stanovena nulová hypotéza: H 0 Je stanovena alternativní hypotéza: H A Je

Více

Modely pro nestacionární časové řady

Modely pro nestacionární časové řady Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Modely ARIMA Transformace Proces náhodné procházky Random Walk Process Proces Y t = Y t 1 + ɛ t je

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných)

Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných) Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných) 1. SPECIFIKACE (12 bodů): (1) Graf průběhu proměnných (1) Obě řady se chovají stejně, lze předpokládat jejich lineární vztah

Více

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) cvičení z PSI 0-4 prosince 06 Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) Z realizací náhodných veličin X a Y s normálním rozdělením) jsme z výběrů daného rozsahu obdrželi

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK11 Základy ekonometrie Autokorelace Cvičení 5 Zuzana Dlouhá Gauss-Markovy předpoklady Náhodná složka: Gauss-Markovy předpoklady 1. E(u) = náhodné vlivy se vzájemně vynulují. E(uu T ) = σ I n konečný

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK Základy ekonometrie Odhad klasického lineárního regresního modelu II Cvičení 3 Zuzana Dlouhá Klasický lineární regresní model - zadání příkladu Soubor: CV3_PR.xls Data: y = maloobchodní obrat potřeb

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

Lineární regrese. Komentované řešení pomocí MS Excel

Lineární regrese. Komentované řešení pomocí MS Excel Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními

Více

REGRESNÍ ANALÝZA NESTACIONÁRNÍCH EKONOMICKÝCH ČASOVÝCH ŘAD

REGRESNÍ ANALÝZA NESTACIONÁRNÍCH EKONOMICKÝCH ČASOVÝCH ŘAD Politická ekonomie 45: (2), str. 281-289, VŠE Praha, 1997. ISSN 0032-3233. (Rukopis) REGRESNÍ ANALÝZA NESTACIONÁRNÍCH EKONOMICKÝCH ČASOVÝCH ŘAD Josef ARLT, Vysoká škola ekonomická, Praha 1. Úvod Pro modelování

Více

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel: NÁHODNÁ ČÍSLA TYPY GENERÁTORŮ, LINEÁRNÍ KONGRUENČNÍ GENERÁTORY, TESTY NÁHODNOSTI, VYUŽITÍ HODNOT NÁHODNÝCH VELIČIN V SIMULACI CO JE TO NÁHODNÉ ČÍSLO? Náhodné číslo definujeme jako nezávislé hodnoty z rovnoměrného

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D. Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost

Více

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Příklad č. 1 Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Zadání : Stanovení manganu ve vodách se provádí oxidací jodistanem v kyselém prostředí až na manganistan. (1) Sestrojte

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných

Více

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti

Více

Inovace bakalářského studijního oboru Aplikovaná chemie

Inovace bakalářského studijního oboru Aplikovaná chemie http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Regrese Závislostproměnných funkční y= f(x) regresní y= f(x)

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině

Více

Aplikovaná ekonometrie 7. Lukáš Frýd

Aplikovaná ekonometrie 7. Lukáš Frýd Aplikovaná ekonometrie 7 Lukáš Frýd Nestacionární časové řady Možné příčinny Sezonost Deterministický trend (time trend) Jednotkový kořen (Stochastický trend) Strukturní zlomy Časový trend (deterministický

Více

Základy ekonometrie. X. Regrese s časovými řadami. Základy ekonometrie (ZAEK) X. Regrese s časovými řadami Podzim / 47

Základy ekonometrie. X. Regrese s časovými řadami. Základy ekonometrie (ZAEK) X. Regrese s časovými řadami Podzim / 47 Základy ekonometrie X. Regrese s časovými řadami Základy ekonometrie (ZAEK) X. Regrese s časovými řadami Podzim 2015 1 / 47 Obsah tématu 1 ADL model 2 Regrese se stacionárními řadami 3 Regrese s řadami

Více

Diagnostika regrese pomocí grafu 7krát jinak

Diagnostika regrese pomocí grafu 7krát jinak StatSoft Diagnostika regrese pomocí grafu 7krát jinak V tomto článečku si uděláme exkurzi do teorie regresní analýzy a detailně se podíváme na jeden jediný diagnostický graf. Jedná se o graf Předpovědi

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie LS 2014/15 Cvičení 10: Heteroskedasticita LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Heteroskedasticita - teorie Druhý

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457. 0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti

Více

z dat nasbíraných v letech 1959 1994. Ke zpracování dat byl použit statistický software R. Základní model poptávkové funkce, ze kterého vycházíme,

z dat nasbíraných v letech 1959 1994. Ke zpracování dat byl použit statistický software R. Základní model poptávkové funkce, ze kterého vycházíme, Úloha 1: V naší studii se zabýváme poptávkovou funkcí životního pojištění, vycházíme z dat nasbíraných v letech 1959 1994. Ke zpracování dat byl použit statistický software R. Základní model poptávkové

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie Predikce Multikolinearita Cvičení 4 Zuzana Dlouhá Aplikace EM predikce obecně ekonomické prognózování, předpověď, předvídání hlavním cílem je odhad hodnot vysvětlované proměnné

Více

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0. 11 cvičení z PSI 12-16 prosince 2016 111 (Test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota 0 1 2 3 4 5 6 pozorovaná četnost 29 15

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA STATISTICKÉ TESTOVÁNÍ HYPOTÉZ 22.11.2016 Opakování: CLV příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců

Více

Časové řady a jejich periodicita pokračování

Časové řady a jejich periodicita pokračování Časové řady a jejich periodicita pokračování Jana Klicnarová Katedra aplikované matematiky a informatiky Jihočeská Univerzita v Českých Budějovicích, Ekonomická fakulta 2010 Dekompozice časových řad Jak

Více

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica Úloha A) koncentrace glukózy v krvi V této části posoudíme pomocí párového testu, zda nový lék prokazatelně snižuje koncentraci

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

Periodicita v časové řadě, její popis a identifikace, exponenciální vyrovnáván

Periodicita v časové řadě, její popis a identifikace, exponenciální vyrovnáván Periodicita v časové řadě, její popis a identifikace, exponenciální vyrovnávání Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Periodicita v časových

Více

Korelace. Komentované řešení pomocí MS Excel

Korelace. Komentované řešení pomocí MS Excel Korelace Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A2:B84 (viz. obrázek) Prvotní představu o tvaru a síle závislosti docházky a počtu bodů nám poskytne

Více

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely ) Úloha M608 Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely ) Zadání : Při kvantitativní analýze lidského krevního séra ovlivňují hodnotu obsahu vysokohustotního

Více

8 Coxův model proporcionálních rizik I

8 Coxův model proporcionálních rizik I 8 Coxův model proporcionálních rizik I Předpokládané výstupy z výuky: 1. Student umí formulovat Coxův model proporcionálních rizik 2. Student rozumí významu regresních koeficientů modelu 3. Student zná

Více

Pearsonův korelační koeficient

Pearsonův korelační koeficient I I.I Pearsonův korelační koeficient Úvod Předpokládejme, že náhodně vybereme n objektů (nebo osob) ze zkoumané populace. Často se stává, že na každém z objektů měříme ne pouze jednu, ale několik kvantitativních

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých

Více

Návrh a vyhodnocení experimentu

Návrh a vyhodnocení experimentu Návrh a vyhodnocení experimentu Návrh a vyhodnocení experimentů v procesech vývoje a řízení kvality vozidel Ing. Bohumil Kovář, Ph.D. FD ČVUT Ústav aplikované matematiky kovar@utia.cas.cz Mladá Boleslav

Více

AVDAT Výběr regresorů v mnohorozměrné regresi

AVDAT Výběr regresorů v mnohorozměrné regresi AVDAT Výběr regresorů v mnohorozměrné regresi Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Výběr správného lineárního modelu y = Xβ + ε, ale v matici X typu n (p + 1) je

Více

Metoda backward výběru proměnných v lineární regresi a její vlastnosti

Metoda backward výběru proměnných v lineární regresi a její vlastnosti Metoda backward výběru proměnných v lineární regresi a její vlastnosti Aktuárský seminář, 13. dubna 2018 Milan Bašta 1 / 30 1 Metody výběru proměnných do modelu 2 Monte Carlo simulace, backward metoda

Více

UNIVERZITA PARDUBICE

UNIVERZITA PARDUBICE UNIVERZITA PARDUBICE Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie na téma Tvorba nelineárních regresních modelů v analýze dat Vedoucí licenčního studia Prof. RNDr.

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,

Více

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

Testování předpokladů pro metodu chain-ladder. Seminář z aktuárských věd Petra Španihelová

Testování předpokladů pro metodu chain-ladder. Seminář z aktuárských věd Petra Španihelová Testování předpokladů pro metodu chain-ladder Seminář z aktuárských věd 4. 11. 2016 Petra Španihelová Obsah Datová struktura Posouzení dat Předpoklady metody chain-ladder dle T. Macka Běžná lineární regrese

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y Xβ ε Předpoklady: Matice X X n,k je matice realizací. Předpoklad: n > k, h(x) k - tj. matice

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 11. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 27 Obsah 1 Testování statistických hypotéz 2

Více

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I 5EN306 Aplikované kvantitativní metody I Přednáška 5 Zuzana Dlouhá Předmět a struktura kurzu 1. Úvod: struktura empirických výzkumů 2. Tvorba ekonomických modelů: teorie 3. Data: zdroje a typy dat, význam

Více

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel Regresní analýza Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Regresní analýza 1 / 23

Více

AVDAT Klasický lineární model, metoda nejmenších

AVDAT Klasický lineární model, metoda nejmenších AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i

Více

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné

Více

Testy statistických hypotéz

Testy statistických hypotéz Testy statistických hypotéz Statistická hypotéza je jakýkoliv předpoklad o rozdělení pravděpodobnosti jedné nebo několika náhodných veličin. Na základě náhodného výběru, který je reprezentativním vzorkem

Více

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

AVDAT Nelineární regresní model

AVDAT Nelineární regresní model AVDAT Nelineární regresní model Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Nelineární regresní model Ey i = f (x i, β) kde x i je k-členný vektor vysvětlujících proměnných

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

MÍRY ZÁVISLOSTI (KORELACE A REGRESE) zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky

Více

TECHNICKÁ UNIVERZITA V LIBERCI

TECHNICKÁ UNIVERZITA V LIBERCI TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce z předmětu Statistický rozbor dat z dotazníkového šetření Jméno: Lucie Krechlerová, Karel Kozma, René Dubský, David Drobík Ročník: 2015/2016

Více

Fakulta elektrotechnická. Komponenta pro měření a predikci spotřeby elektrické energie

Fakulta elektrotechnická. Komponenta pro měření a predikci spotřeby elektrické energie ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická DIPLOMOVÁ PRÁCE Komponenta pro měření a predikci spotřeby elektrické energie Praha, 2014 Autor: Tomáš Reichl i Poděkování Chtěl bych na tomto

Více

Neuronové časové řady (ANN-TS)

Neuronové časové řady (ANN-TS) Neuronové časové řady (ANN-TS) Menu: QCExpert Prediktivní metody Neuronové časové řady Tento modul (Artificial Neural Network Time Series ANN-TS) využívá modelovacího potenciálu neuronové sítě k predikci

Více

Regresní analýza. Eva Jarošová

Regresní analýza. Eva Jarošová Regresní analýza Eva Jarošová 1 Obsah 1. Regresní přímka 2. Možnosti zlepšení modelu 3. Testy v regresním modelu 4. Regresní diagnostika 5. Speciální využití Lineární model 2 1. Regresní přímka 3 nosnost

Více

Value at Risk. Karolína Maňáková

Value at Risk. Karolína Maňáková Value at Risk Karolína Maňáková Value at risk Historická metoda Model-Building přístup Lineární model variance a kovariance Metoda Monte Carlo Stress testing a Back testing Potenciální ztráta s danou pravděpodobností

Více

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Statistika, Biostatistika pro kombinované studium. Jan Kracík Statistika, Biostatistika pro kombinované studium Letní semestr 2014/2015 Tutoriál č. 6: ANOVA Jan Kracík jan.kracik@vsb.cz Obsah: Testování hypotéz opakování ANOVA Testování hypotéz (opakování) Testování

Více