MASARYKOVA UNIVERZITA ÚSTAV MATEMATIKY A STATISTIKY
|
|
- Renata Sedláčková
- před 7 lety
- Počet zobrazení:
Transkript
1 MASARYKOVA UNIVERZITA PŘÍRODOVĚDECKÁ FAKULTA ÚSTAV MATEMATIKY A STATISTIKY Bakalářská práce BRNO 2013 PETR BOŘIL
2 MASARYKOVA UNIVERZITA PŘÍRODOVĚDECKÁ FAKULTA ÚSTAV MATEMATIKY A STATISTIKY Modelování a predikce spotových cen elektrické energie Bakalářská práce Petr Bořil Vedoucí práce: Ing. Daniel Němec, Ph.D. Brno 2013
3 Bibliografický záznam Autor: Název práce: Studijní program: Studijní obor: Vedoucí práce: Petr Bořil Přírodovědecká fakulta, Masarykova univerzita Ústav matematiky a statistiky Modelování a predikce spotových cen elektrické energie Matematika Finanční a pojistná matematika Ing. Daniel Němec, Ph.D. Akademický rok: 2012/2013 Počet stran: vii + 33 Klíčová slova: časové řady; spotová cena elektřiny; rekurzivní predikce; nelineární modely
4 Bibliographic Entry Author: Title of Thesis: Degree Programme: Field of Study: Supervisor: Petr Bořil Faculty of Science, Masaryk University Department of Mathematics and Statistics Modelling and forecasting spot electricity prices Mathematics Financial and Insurence Mathematics Ing. Daniel Němec, Ph.D. Academic Year: 2012/2013 Number of Pages: vii + 33 Keywords: time series; spot electricity prices; recursive prediction; nonlinear models
5 Abstrakt V této bakalářské práci se věnujeme modelování a předpovědím spotových cen elektřiny. Na datech z pražské energetické burzy odhadneme lineární a více-režimové nelineární modely a pomocí vhodného kritéria porovnáme jejich predikční schopnosti. Analyzujeme ceny na hodinové, denní, týdenní a měsíční frekvenci a pro každou časovou řadu vybereme model, který bude nejlépe předpovídat budoucí cenu. Abstract This thesis deals with the problem of modelling and forecasting spot electricity prices. We estimate linear and non-linear threshold autoregressive models using electricity prices from Power Exchange Central Europe and compare them in the term of their prediction capabilities. We analyse time series based on hourly, daily, weekly and monthly frequency and choose the best model for prediction purposes.
6
7 Poděkování Na tomto místě bych chtěl poděkovat Ing. Danielu Němcovi, Ph.D. za cenné rady a připomínky při vedení této bakalářské práce. Zároveň děkuji rodičům za jejich podporu při studiu. Prohlášení Prohlašuji, že jsem svoji bakalářskou práci vypracoval samostatně s využitím informačních zdrojů, které jsou v práci citovány. Brno 28. května Petr Bořil
8 Obsah Úvod Kapitola 1. Úvod do problematiky modelování cen elektřiny Kapitola 2. Vhodné modely časových řad Box - Jenkinsonova metodologie Nelineární modely časových řad Testy nelinearity Tvorba předpovědí Shrnutí Kapitola 3. Empirická analýza Data Prohlídka časových řad Odhad lineárního modelu Testy nelinearity Odhad nelineárních modelů Predikční schopnosti modelů Hodinové ceny Denní ceny Týdenní ceny Měsíční ceny Sezónně očištěné hodinové ceny Dodatek k předpovědím Shrnutí Závěr Seznam použité literatury Příloha vii
9 Úvod Trhy s elektrickou energií prošly v posledních desetiletích velkými změnami. Proces deregulace zasáhl dříve či později většinu významných světových trhů a z plně centralizovaného trhu se najednou stal trh s otevřenou soutěží. Následkem toho se pro důležité hráče na trhu vyvinula potřeba umět správně odhadnout cenu a předpokládané množství elektřiny, které bude poptáváno. O rozšíření této problematiky svědčí také velké množství vědeckých článku, které se zabývají různými přístupy k modelování ceny elektřiny. Cílem této práce bude odhadnout nejlepší lineární a nelineární více-režimové modely a porovnat jejich predikční schopnosti na daném vzorku dat. Zaměříme se na spotové ceny z pražské energetické burzy Power Exchange Central Europe. Budeme modelovat a předpovídat ceny na více časových frekvencích - hodinových, denních, týdenních a měsíčních. Práce bude strukturovaná do tři kapitol. V první kapitole si ukážeme možné přístupy k modelování cen elektřiny. Při odhadování cen pomocí modelů časových řad lze postupovat mnoha způsoby - na některé z nich poukážeme s odkazem na příslušný článek, kde byly použity. Ve druhé kapitole představíme potřebnou teorii k samotné analýze daných časových řad. Lineární modely, které vycházejí z Box-Jenkinsonovy metodologie, jsou dobře známy a popsány. Více-režimové nelineární modely, které vycházejí z modelů lineárních, byly s úspěchem aplikovány na řadu ekonomických časových řad. Spolu s nimi budou ještě ve druhé kapitole představeny a zmíněny základní techniky a nástroje, které využijeme v další části práce. Empirickou analýzu dat provedeme ve třetí kapitole. Časové řady si zobrazíme a podíváme se, zda je nutné je transformovat. Postupně odhadneme nejlepší lineární a nelineární modely a podíváme se také na to, zda jsou ceny elektřiny vůbec vhodné pro modelování pomocí více-režimových modelů. Pomocí definovaného kritéria porovnáme jejich predikční schopnosti, přičemž u každé časové řady vybereme model, který bude minimalizovat chybu předpovědi. 1
10 Kapitola 1 Úvod do problematiky modelování cen elektřiny K modelování cen elektřiny se využívá velké množství metod, což je dáno také tím, že trhy s elektřinou jsou v mnoha ohledech specifické. Samotná energie je neskladovatelná, je tedy vyžadována konstantní rovnost mezi poptávkou a nabídkou. Spotřeba elektřiny během dne ovšem značně kolísá, souběžně s tím se mění i cena (je zde extrémní volatilita). Výše uvedená podmínka rovnosti nabídky a poptávky někdy vede k situacím, kdy je cena elektřiny záporná, pro dodavatele elektřiny je tedy výhodnější elektřinu zničit než odstavit výrobní zdroj. U nás jsou záporné ceny nově povoleny od 1. ledna , a hned v první den platnosti tohoto zákona byla cena na pražské energetické burze několik hodin záporná. Tato situaci nastává zřídka, zejména v noci a na krátkou dobu, může ale nastat i v případě, kdy se neočekávaně zvýší produkce elektřiny z obnovitelných zdrojů. Cena elektřiny je zároveň také velmi neelastická - většině spotřebitelů je víceméně lhostejné, jaká je aktuální spotová cena elektřiny. Autoři Misiorek et. al [7] uvádí dva možné způsoby dělení modelování a predikce cen elektřiny - podle délky předpovědi a aplikované metodologie. Podle horizontu předpovědi dělíme modelování na: Dlouhodobá předpověd - je plánovaná v rocích. Využívá se při analýze návratu investic a při rozhodování u dlouhodobých projektů. Středně-dlouhodobá předpověd - dobou předpovědi jsou měsíce. Pomáhají při tvorbě a kalkulaci rozvahy podniků, jsou důležité pro risk management a odvozování budoucích cen. Často se nehledí na na přesný odhad spotové ceny, ale na pravděpodobnostní rozdělení ceny na dané období. Krátkodobá předpověd - horizont předpovědi je od několika hodin po několik dnů. Těší se velké pozornosti všech účastníků na burze, kde se cena stanovuje na základě aukcí. Ti musí vyjádřit své nabídky co se týče ceny a množství. Na takových to burzách jsou přijímány nabídky/poptávky, zatímco se cena zvyšuje/snižuje až je konečně dosažena rovnováha mezi danou poptávkou a nabídkou. Pokud tedy dodavatel energie dokáže správně odhadnout cenu a množství, které bude poptáváno, 1 Zákon 165/2012 Sb. o podporovaných zdrojích energie a o změně některých zákonů, 11 odstavec (9) 2
11 Kapitola 1. Úvod do problematiky modelování cen elektřiny 3 může maximalizovat svůj zisk správným nastavením produkce. Tímto přístupem k modelování se budeme v dalších kapitolách zabývat. Dalším možným kritériem pro rozlišování modelování je podle aplikované metodologie: Production cost models - simulují operace, které produkují požadované zboží za nejnižší cenu. Dokážou modelovat situace z hodiny na hodinu, nicméně nejsou schopny zahrnout vliv nabídky a poptávky na ceny, který je charakteristický pro trh v dnešní době. Equilibrium models - Modely rovnováhy - můžeme je chápat jako zobecnění předchozích modelů, na rozdíl od nich také dokáží pracovat s interakcemi, které probíhají na daném trhu. Dokáží předpovídat, zda cena bude nad mezními náklady a jak to ovlivní výdaje zúčastněných. Ani tyto modely ale nejsou úplně ideální - řadu věcí si musíme přednastavit, abychom se dobrali konkrétních výsledků. Fundamentální analýza - sleduje, jak důležité fyzické a ekonomické faktory ovlivňují změnu cen elektřiny. Je předpokládán úzký vztah mezi fundamentálními faktory, jako jsou třeba počasí, celková zátěž atd. a výstupy, které jsou potom nezávisle modelovány a predikovány, často pomocí statistických a ekonometrických technik. Tyto modely jsou používány především pro dlouhodobější předpovědi. Kvantitativní modely - Mají za úkol popsat základní statistické charakteristiky cen elektřiny. Jejich úkolem není předpovídat cenu z hodiny na hodinu, používají se spíše pro odvození ohodnocení produktů a pro management rizik. Statistická a technická analýza - snaží se najít model, který by nejlépe sloužil k předpovídání. Při tom se využívá základních statistických a ekonometrických postupů a modelů. Nejvíce oblíbené metody jsou pomocí vícenásobné regrese a časových řad. Zatímco na finančních trzích je efektivnost technické analýzy často diskutována - při předpovídání cen elektřiny si vede o mnoho lépe. Je to dáno především tím, že na cenách lze velmi dobře rozpoznat sezónnost - at už denní nebo týdenní, a také rozdíl mezi pracovními dny a víkendem. Modely s umělou inteligencí - Artificial based models - konečně posledním přístupem k modelování jsou modely s umělou inteligencí. Ty jsou založeny na neparamatrických nástrojích, jako je např. využití umělé neuronové sít e, expertní systémy nebo fuzzy logika. Tyto modely dokáží být velmi flexibilní a zvládají výborně nelineární modelování. Díky tomu se výborně hodí k předpovědi spotových cen elektřiny. Nicméně při srovnání s předchozím typem modelů (konkrétně s modelem ARIMA) jsou méně přesné - více lze dohledat v článku autorů Conejo et al. [2]. V naší práci se budeme zabývat statistickými a ekonometrickými metodami při modelování cen elektřiny, důraz bude dán na využití časových řad. Můžeme se zde setkat s celou řadou přístupů - např. autoři již zmíněného článku Misiorek et. al (2006) [7] porovnávají předpovědi modelů AR/ARX (rozšíření X značí zahrnutí exogenní proměnné - poptávky po elektřině), nelineárních TAR/TARX, AR-G/ARX-G ( G značí rozšíření pomocí modelování rozptylu náhodných složek modelem GARCH) a pomocí Markov regime switching
12 Kapitola 1. Úvod do problematiky modelování cen elektřiny 4 models. Nejlepší intervalové a bodové předpovědi na datech z kalifornské burzy byly dosaženy pomocí modelu TARX následovány jednoduchým ARX modelem. Autoři Garcia et al. [5] porovnávají na cenách ze španělské a kalifornské burzy model ARIMA a jeho rozšíření modelem GARCH, přičemž výsledky upřednostňují model GARCH. Další články se věnují možnému rozšíření modelování náhodných složek (např. Weron [9]). Zajímavý přístup (při modelování cen elektřiny ale ne tak neobvyklý) zvolili autoři Weron, R., Misiorek, A. [10] - ve svém článku porovnávají předpovědi modelu označovaného jako p-ar (spike preprocessed AR model - extrémní hodnoty jsou zde nahrazeny normálnějšími ) s predikcemi modelů TAR, Mean-reverting jump diffusions modely a autoregresními modely s neparametrickými inovacemi (označované jako semiparametrické modely). Cena je predikována také pomocí exogenní proměnné teploty vzduchu. Poslední ze zmíněných modelů má pro bodové odhady nejlepší výsledky.
13 Kapitola 2 Vhodné modely časových řad V této kapitole budou definovány modely časových řad a nástroje pro práci s nimi, které využijeme k modelování cen elektřiny v třetí kapitole. Cílem této kapitoly není podrobný výklad vybraných partií z teorie časových řad, ale stručné shrnutí metod a modelů využívaných v další části práce. Teorie vychází z Enderse[3] a Cipry [1]. V první části této kapitoly zmíníme základy Box - Jenkinsonovy metodologie, druhá část bude zaměřena pouze na nelineární modely. 2.1 Box - Jenkinsonova metodologie V ekonometrické teorii časových řad je tato metodologie široce přijímána. Lze ji úspěšně aplikovat na téměř jakoukoliv časovou řadu. V dalších částech práce se bude předpokládat, že čtenář je seznámen s pojmy časové řady, stacionarity, invertibility časových řad, výběrovou autokorelační funkcí, výběrovou parciální autokorelační funkcí a bílého šumu (lze dohledat např. zde - Forbelská [4]). Autoregresní model AR Autoregresní model řádu p značený jako AR(p) má tvar po přepsání lze zapsat takto y t = ϕ 1 y t ϕ p y t p + ε t, (2.1) y t ϕ 1 y t 1... ϕ p y t p = Φ(B)y t = ε t, (2.2) kde ϕ 1,...,ϕ p jsou parametry, Φ(B) = 1 ϕ 1 B... ϕ p B p je autoregresní operátor a ε t je bílý šum. V modelu (2.1) stejně jako u všech ostatních lineárních modelů předpokládáme nulovou střední hodnotu - v případě nenulové střední hodnoty by bylo možné model doplnit parametrem µ. Model klouzavých součtů MA Model klouzavých součtů řádu q, značený jako MA(q) má tvar y t = ε t + θ 1 ε t θ q ε t q = Θ(B)ε t = ε t, (2.3) 5
14 Kapitola 2. Vhodné modely časových řad 6 kde θ 1,...,θ q jsou parametry a Θ(B) = 1+θ 1 B+...+θ q B q je operátor klouzavých součtů. Smíšený ARMA model Kombinací dvou předchozích modelů lze vytvořit smíšený model řádu p,q, značený jako ARMA(p,q). Vypadá takto y t ϕ 1 y t 1... ϕ p y t p = ε t + θ 1 ε t θ q ε t q, (2.4) pomocí operátorů definovaných v v předešlých částech textu lze také zapsat jako Integrované ARMA modely Φ(B)y t = Θ(B)ε t (2.5) Pomocí ARIMA modelů lze modelovat i nestacionární časové řady. Zavedením diferenčního operátoru d y t = (1 B) d y t můžeme tyto modely zapisovat jako a značíme je ARIMA (p,d,q). Φ(B) d y t = Θ(B)ε t (2.6) Sezónní ARIMA modely Box - Jenkinsonova metodologie nabízí také modelování sezónosti pomocí tzv. multiplikativního sezónního modelu, běžně označováného jako SARIMA model. Definujme si sezónní autoregresní operátor řádu P Π(B L ) = 1 π 1 B L... π P B PL, dále sezónní operátor klouzavých součtů řádu L a sezónní diferenční operátor Ψ(B L ) = 1 + ψ 1 B L ψ Q B QL D L = (1 B L ) D. Formálně zapíšeme SARIMA(p,d,q) (P,D,Q) L model takto kde L je délka sezónnosti. Φ(B)Π(B L ) d D L y t = Θ(B)Ψ(B L )ε t (2.7)
15 Kapitola 2. Vhodné modely časových řad Nelineární modely časových řad V posledních letech byly více-režimové nelineární modely s úspěchem aplikovány na různé ekonomické časové řady. Tato podkapitola obsahuje stručný přehled těchto modelů, které použijeme pro modelování cen elektřiny. Důraz bude kladen na obecnou třídu modelů s proměnlivými režimy - regime switching models. Těmito modely se dají popsat časové řady, u kterých se v čase mění jejich charakteristika s ohledem na to, v jakém se nacházejí režimu (pro představu jeden režim může popisovat danou řadu v případě, kdy jsou její hodnoty menší než určená hodnota, druhý režim modeluje tu stejnou řadu v opačném případě). Pro lepší přiblížení realitě tyto modely popisují časovou řadu pomocí několika spojitých lineárních funkcí právě v závislosti na daném režimu. Lze rozlišit dva druhy modelů - pokud se režim určuje na základě proměnné, kterou známe nebo dokážeme vypozorovat, jedná se o modely se známými režimy (např. TAR, STAR, SETAR), mění-li se režimy náhodně na základě skryté proměnné, jedná se o modely označovaní jako MSW - The Markov switching model. Konstrukce těchto modelů je značně obtížná, v praxi se pracuje častěji s prvním typem modelů, se kterými se budeme zabývat i v této práci. Podle způsobu určení přepínače režimu (také se hovoří o tzv. prahu) a přechodu mezi jednotlivými funkcemi pro každý režim lze modely rozdělit do několika skupin. TAR modely Pomocí již zmíněných TAR modelů (z anglického threshold autoregressive models) lze pro více režimů modelovat jednotlivé AR modely. Pro dva režimy vypadá model takto { α 0 + α 1 y t α 1p y t p + ε 1t pro y t 1 τ y t = (2.8) β 0 + β 1 y t β 1r y t r + ε 2t pro y t 1 < τ, kde je prahovou proměnou přímo vysvětlovaná proměnná s řádem zpoždění 1. Pokud je tato proměnná větší než prahová hodnota τ- threshold value, je model určován AR(p) modelem s koeficienty α a naopak. Prahová hodnota se obvykle vybírá z hodnot minulých pozorování. Pro zjednodušení se předpokládá, že ε 1t a ε 1t jsou vzájemně nezávislé bílé šumy obvykle typu i.i.d. se stejným rozptylem, tedy D(ε 1t ) = D(ε 2t ). Pro odhad parametrů je výhodné si model přepsat do jiné podoby. Nejdříve si definujme indikátorovou funkci I t takto { 1 pro y t 1 τ I t = 0 pro y t 1 < τ. Dále si definujeme vektor složený z minulých hodnot y t model TAR nyní můžeme zapsat takto x t = (1,y t 1,y t 2,...,y t p ), y t = x tαi t + x tβ(1 I t ) + ε t. (2.9) V tomto tvaru je možné model odhadnout metodou nejmenších čtverců.
16 Kapitola 2. Vhodné modely časových řad 8 SETAR modely V předchozím modelu je režim determinován pozorovanou proměnnou s řádem zpoždění 1. Často se stává, že změna chování časové řady se projeví až po určité době. Pokud se tato situace vyskytne, bylo by rozumné zajistit, aby se režim měnil na základě hodnoty y t d, kde d=1,2,3,... Tyto modely se nazývají SETAR (z anglického Self-exciting threshold AR models) a pro dva režimy jsou definovány takto { α 0 + α 1 y t α 1p y t p + ε 1t pro y t d τ y t = (2.10) β 0 + β 1 y t β 1r y t r + ε 2t pro y t d < τ, kde τ je prahová hodnota. Předpoklady jsou stejné jako v předchozím modelu, tedy ε 1t a ε 2t jsou vzájemně nezávislé bílé šumy typu i.i.d., D(ε 1t ) = D(ε 2t ), a (r = p). Podobně jako v minulém modelu by šlo model přepsat do výhodnější podoby pro odhad parametrů. M-TAR modely Dalším možným rozšířením modelu TAR je model M-TAR (Momentum TAR), ve kterém se režim nemění na základě hodnoty y t d, nýbrž v důsledku velikosti změny u jedné z předcházejících hodnot - diference y t d. Tento model dobře popisuje situaci, kdy je výrazný rozdíl v chování sledované řady, pokud řada roste nebo klesá. Prahová hodnota τ může ovšem nabývat libovolné hodnoty. Model vypadá takto { α 0 + α 1 y t α 1p y t p + ε 1t pro y t d τ y t = (2.11) β 0 + β 1 y t β 1r y t r + ε 2t pro y t d < τ. STAR modely Modely typu TAR mají tu vlastnost, že přechod mezi režimy je skokový. Parametry v modelu se tedy mění okamžitě a tyto modely nemají spojitou podmíněnou střední hodnotu. Modely STAR - Smooth Transition AR models byly proto navrženy tak, aby přechod mezi režimy byl spojitý. Model pro dva režimy je definován takto y t =(α 0 + α 1 y t α 1p y t p + ε 1t )(1 G(y t d,γ,τ))+ (β 0 + β 1 y t β 1r y t r + ε 2t )(G(y t d,γ,τ)), (2.12) kde G(y t d,γ,τ) je spojitá přechodová funkce. Parametr τ je prahová hodnota, y t d je prahová proměnná a γ je parametr hladkosti - (smoothnes parameter). Podle typu přechodové funkce se modely dají dále rozlišit. LSTAR modely Nejpoužívanějším typem modelu STAR je model Logistic-STAR, kde přechodová funkce je logistická funkce tvaru G(y t d,γ,τ) = exp[ γ(y t d τ)]. (2.13)
17 Kapitola 2. Vhodné modely časových řad 9 Pokud jde v limitě γ 0, model se blíží k lineárnímu AR(p) modelu (přechodová funkce je rovna 0.5); jde-li v limitě γ, LSTAR se blíží modelu typu SETAR (přechodová funkce je rovna bud 0 nebo 1 v závislosti na znaménku výrazu (y t d τ)). Odhad parametrů v modelů LSTAR již nelze odvodit tak snadno, jako tomu bylo v případě modelu SETAR. 2.3 Testy nelinearity Před začátkem samotného hledání nejlepšího nelineárního modelu je nutné ověřit nelinearitu dat. Literatura zmiňuje několik možných testů, některé zde ve stručnosti uvedu. U většinu testu je nulová hypotéza přítomnost linearity v datech. McLeod - Li Test Podstatou tohoto testu je testování nulovosti prvních m autokorelací čtverců reziduí odhadnutého lineárního modelů. Nejdříve tedy odhadneme vhodný lineární model a uložíme si rezidua ε t. Ty využijeme při výpočtu Ljung-Boxovi statistiky dané vzorcem LB = n(n + 2) m i=1 ρ(i) 2 n i, (2.14) kde ρ(i) je výběrová autokorelační funkce mezi ε t 2 a ε t i 2. Testová statistika má za platnosti nulové hypotézy (prvních m autokorelací je rovno 0) asymptotické χ(m) 2 rozdělení. Pokud statistika LB překročí kritickou hodnotu, zamítáme nulovou hypotézu a přijímáme hypotézu o nelinearitě modelu. Dalším možné provedení tohoto testu spočívá v odhadnutí regrese ε t 2 = α + α1 ε 2 t α n ε 2 t n, (2.15) kde za předkpokladu linearity by α 1 až α n mělo být rovno nule. RESET test Dalším známým testem je Regression error specification test. Opět testujeme nulovou hypotézu linearity proti alternativní hypotéze nelinearity. Myšlenka tohoto testu využívá toho, že pokud jsou rezidua z předem odhadnutého nejlepšího lineárního modelu nezávislá (označíme je ε t ), neměla by být korelována s odhadnutými vyrovnanými hodnotami ze stejného modelu - ŷ t. Nyní odhadneme regresi ε t = Z tb + H h=2 α h ŷ h t + ε t, (2.16) kde Z t je vektor obsahující proměnné zahrnuté v předem odhadnutém lineárním modelu, B je vektor neznámých parametrů a H se obvykle volí mezi 3 a 4. Klasickým F-testem nyní můžeme testovat nulovou hypotézu α 2,...,α H = 0. Linearitu můžeme zamítnout, pokud F-statistika přesáhne kritickou hodnotu standardního F-rozdělení. Dalším obecným testem nelinearity je Portmanteau Test a Test Lagrangeových multiplikátorů, jehož vícenásobným použitím můžeme dokonce vybrat nejvhodnější formu nelinearity. Lze také testovat vhodnost nelineárních modelů uvedených výše.
18 Kapitola 2. Vhodné modely časových řad 10 Supremum test Jedním z těchto testů je supremum test (více Enders [3]), který testuje vhodnost modelu TAR. SSR u označíme součet čtverců reziduí nejlepšího SETAR modelu, podobně SSR r označíme součet čtverců reziduí u lineárního modelu. Tradiční F-statistika pro porovnání omezeného a neomezeného modelů daná vzorcem F = (SSR r SSR u )/q, (2.17) SSR u /(n k) kde q je počet omezení, n počet pozorování a k je počet odhadovaných parametů v neomezeném modelu, které ovšem nepochází z F-rozdělení. Pro dosažení požadovaného rozdělení budeme generovat n vzorků (stejně jako počet pozorování) ze standardizovaného normálního rozdělení. Vygenerovaná náhodné čísla označíme jako ε t a provedeme regrese s vysvětlovanou proměnnou ε t a vysvětlujícími proměnnými stejnými jako u lineárního a nelineárního modelu. Součet čtverců reziduí u regrese s vysvětlujícími proměnnými z lineárního modelu nyní označíme SSR r, podobně SSR u bude značit součet čtverců reziduí u regrese s vysvětlujícími proměnnými z nelineárního modelu. Nyní vypočítáme F = (SSR r SSR u)/q SSR. (2.18) u/(n k) Tento postup zopakujeme nejméně 1000krát, abychom dostali požadované rozdělení F. Původní F-statistiku porovnáme s nově získaným rozdělením - pokud tato hodnota překročí 95% percentil rozdělení F, můžeme na hladině významnosti 0,05 zamítnout nulovou hypotézu o lineárním modelu. U všech časových řad je třeba provést test jednotkového kořene pro ověření stacionarity. Nejpoužívanějším testem je Dickey-Fullerův test, jehož obohacená verze spočívá v odhadu následujícího modelu y t = α 0 + α 1 t + γy t 1 + p i=1 β i y t i+1 + ε t, (2.19) přičemž budeme testovat parametr γ = 0. Pokud t-statistika překročí hranici Dickey- Fullerova rozdělení na dané hladině významnosti, můžeme zamítnout nulovou hypotézu jednotkového kořene. Dalším testem pro ověření stacionarity je Kwiatkowski - Phillips - Schmidt - Shinův test. Autoři tohoto testu poukazovali na fakt, že test jednotkového kořene z různých důvodů často selhává v zamítnutí nepravdivé nulové hypotézy. V tomto testu je tedy nulová hypotéza ověření stacionarity oproti alternativní hypotéze jednotkového kořene. Podrobnější informace o tomto testu lze najít v tomto článku autorů Kwiatkowski et al. [6] Kontrolou správnosti modelu jsou náhodné složky ε t, které by měly odpovídat procesu bílého šumu - tedy být nekorelované s nulovou střední hodnotou, konstantním rozptylem a měly by pocházet z normálního rozdělení. Předchozí požadavky je snadné ověřit sérií následujících testů - normalitu testuje Shapiro - Wilkův test, homoskedasticitu pomocí Breuch - Paganava testu a nezávislost reziduí pomocí Box - Pierceho testu. Jedná se o široce používané testy, které jsou popsány v řadě učebnic ekonometrie (např Enders [3]).
19 Kapitola 2. Vhodné modely časových řad Tvorba předpovědí Nejdříve se budeme věnovat předpovědím v lineárním modelu, posléze v nelineárních modelech. Zde budeme čerpat z článku autorů van Dijk, Terasvirta, Franses [8]. Lineární modely Enders[3] na jednoduchém AR(1) modelu ukazuje, jak lze odvodit předpovědi v ARMA modelech. Uvažujme model y t = a 0 + a 1 y t 1 + ε t. Nyní lze snadno vyjádřit hodnota y t+1 jako y t+1 = a 0 + a 1 y t + ε t+1. Pokud známe koeficienty a 0 a a 1, můžeme předpověd y t+1 podmíněnou informacemi v čase t vypočítat jako ŷ t+1 = E[y t+1 Ω t ] = a 0 + a 1 y t, (2.20) kde ŷ t+1 značí optimální předpověd v čase t a Ω t je množina informací dostupná v čase t. Protože y t+2 = a 0 + a 1 y t+1 + ε t+2, lze snadno odvodit, že předpověd y t+2 podmíněná informacemi v čase t vypadá takto Po dosazení (2.20) do (2.21) dostáváme ŷ t+2 = E[y t+2 Ω t ] = a 0 + a 1 E[y t+1 Ω t ]. (2.21) Pokud bychom takto pokračovali dále, zjistíme, že ŷ t+2 = a 0 + a 1 (a 0 + a 1 y t ). (2.22) ŷ t+ j = E[y t+ j Ω t ] = a 0 (1 + a 1 + a a j 1 1 ) + a j 1 y t. (2.23) Předchozí rovnice nám popisuje předpovědi v čase t + j jako funkci, ve které jsou brány informace pouze známé v čase t. Nevýhodou tohoto přístupu je, že pro rostoucí j se kvalita předpovědí značně zmenšuje. Za předpokladu, že a 1 < 1 lze dokázat, že při j se výraz ŷ t+ j a 0 /(1 a 1 ). Výsledek se dá zobecnit na jakýkoliv stacionární ARMA model - při j podmíněná předpověd y t+ j konverguje na nepodmíněnou střední hodnotu. 1 Nelineární modely Uvažujme obecný nelineární model tvaru y t = F(x t ;θ) + ε t, (2.24) kde F(x t ;θ) je nelineární funkce s parametry θ a x t = (1,y t 1,...,y t p ). Označme optimální předpověd y t+h v čase t jako ŷ t+h t = E[y t+h Ω t ], kde Ω t obsahuje všechny známe informace v čase t, chybu predikce označíme e t+h t = y t+h ŷ t+h t. Využijeme-li toho, že E[ε t+1 Ω t ] = 0, lze jednokroková predikce snadno vyjádřit jako ŷ t+1 = E[y t+1 Ω t ] = F(x t+1 ;θ), což je analogické k lineárním předpovědím. Pro h > 1 tyto úvahy neplatí. Dvou-kroková predikce bude vypadat takto 1 Pro uvedený AR(1) model je to hodnota a 0 /(1 a 1 ) ŷ t+2 = E[y t+2 Ω t ] = E[F( x t+2 ;θ) Ω t ), (2.25)
20 Kapitola 2. Vhodné modely časových řad 12 kde x t+2 t = (1,ŷ t+1 t + ε t+1,y t,...,y t (p 2) ). Výraz se dá vyjádřit jako ŷ t+2 = F( x t+2 ;θ) f (ε)dε, (2.26) kde f značí hustotu ε t+1. Numerické řešení tohoto integrálu je pro delší horizont předpověd i velmi časově náročné, v praxi se tedy používají jiné metody. Jeden z možných způsobů je nezohlednit nelinearitu a vypočítat předpověd přímo ŷ t+2 t = F( x t+2 ;θ). (2.27) Protože ovšem pro h > 1 neplatí, že E[F( x t+h t ;Ω t )] F(E[ x t+h t ;Ω t ]), vede tento přístup ke zkresleným odhadům. Oblíbenou metodou aproximace podmíněné střední hodnoty z výrazu (2.25) je Monte Carlo simulace. Dvou-kroková předpověd by vypadala takto ŷ t+2 t = 1 k k i=1 F( x (i) t+2 t ;θ), (2.28) kde k je dostatečně velké číslo a hodnoty ε t+1 obsažené ve výrazu x t+2 t jsou brány z předpokládaného rozdělení ε t. Metoda bootstrap je obdobná předchozí metodě, hodnoty ε t+1 jsou ovšem brány ze skutečných reziduí v odhadnutém modelu.výhodou poslední metody oproti Monte Carlo je, že na ε t se nemusí klást žádné předpoklady. Při tvorbě předpovědí pomocí Monte Carlo a bootstrap metody lze snadno z kvantilů u získaných rozdělení předpovědí pro h > 1 tvořit intervalové předpovědi. Pro porovnání předpovědí se běžně používá Root mean squared prediction error, která je definována RMSPE = 1 m kde m je počet h-krokových předpovědí. m 1 j=0 (ŷ t+h+ j t+ j y t+h+ j ) 2, (2.29) 2.5 Shrnutí V této kapitole jsme představili teorii potřebnou k analýze časových řad v další části práce. Uvedli jsme si zástupce lineárních (ARIMA) i nelineárních modelů (SETAR, MTAR, LSTAR), které budeme odhadovat. Pro test jednotkového kořene můžeme využít Dickey- Fullerův test, KPSS test pro odhalení nestacionarity a případnou nelinearitu ověříme pomocí McLeod-Li a RESET testu. Supremum test dokáže posoudit vhodnost SETAR modelu. Předpovědi budeme tvořit pomocí metod ukázaných v předposlední podkapitole.
21 Kapitola 3 Empirická analýza V této kapitole se budeme zabývat odhadem modelů uvedených ve druhé kapitole, jejich posouzením a ověřením a dále jejich predikčními schopnostmi. Databáze cen bude popsána hned v úvodu kapitoly. Všechny výpočty a grafy byly provedeny ve volně dostupném softwaru R [14]. Pro ověřování hypotéz si v celé práci pevně zvolíme hladinu významnosti 0,05 (pokud nebude uvedeno jinak). Náš postup bude ve shodě s tradičními postupy při analýze časových řad. Pro nelineární časové řady doporučuje Enders [3] tento postup. 1. V prvé řadě je vhodné si visuálně prohlédnout danou řadu. Díky tomu můžeme lépe pochopit formu nelinearity a odhalit některé vlastnosti řady (např. deterministický trend, strukturální zlomy). Dále je třeba ověřit stacionaritu řady a případně řadu vhodně transformovat. 2. Klasickými metody Box - Jenkinsonovy metodologie odhadneme nejlepší lineární ARMA model a ověřit jeho platnost. 3. Pomocí popsaných testů ve druhé kapitole otestujeme, zda řada vykazuje nelineární chování. Můžeme provést supremum test pro posouzení vhodnosti SETAR modelu oproti modelu lineárnímu. 4. Pokud je v předchozím kroku detekována forma nelinearity, odhadneme nelineární modely a podle vhodného kritéria je porovnáme. Provedeme kontrolu správnosti modelu pomocí analýzy reziduí a můžeme takovéto modely porovnat s lineárními modely. 5. Provedeme předpovědi jednotlivých modelů a pomocí vhodného kritéria je porovnáme. 3.1 Data V této kapitole velmi stručně popíšu situaci s energetickými burzami u nás i ve světě a představím data, se kterými budeme pracovat v další části práce. 13
22 Kapitola 3. Empirická analýza 14 V úvodu jsme zmínili postupný proces deregulace trhu s elektřinou - s tím vznikala potřeba míst, kde by si obchodníci mohli nakoupit elektřinu od výrobců a následně ji prodat zákazníkům. První burza, na které se obchodovalo se spotovými cenami elektrické energie, vznikla v roce 1990 ve Velké Británii. V dalších letech vzniklo velké množství burz v zemích Evropy i Severní Ameriky. Pražská energetická burza byla založena 8. ledna 2007, první obchody se zde provedly v červenci tohoto roku. Obchoduje se zde s elektřinou nejen pro Českou republiku, ale i Slovensko a Mad arsko. PXE nabízí více druhů produktů můžeme je rozdělit na základě dvou hledisek. Podle časového rozdílu mezi platbou a dodáním elektřiny dělíme kontrakty na futures a spotové kontrakty. Dalším kritériem je způsob vyrovnání - obchodníci na burze můžou zvolit finanční vyrovnání, kdy nevzniká závazek elektřinu skutečně dodat/odebrat, nýbrž zde dochází pouze k zaplacení určité částky na základě spotové ceny a fyzické vyrovnání, kdy vzniká povinnost dodat/odebrat elektřinu ze sítě (více na webových stránkách burzy [13]). Spotový trh pro PXE zajišt uje OTE Operátor trhu s elektřinou. OTE rozlišuje trh s elektřinou na blokový, denní a vnitrodenní (více zde [12]). Ceny jsou na všech trzích určovány na základě nabídky a poptávky. V rámci blokového trhu se obchoduje s denními krátkodobými kontrakty (dodávka elektřiny je realizována v konkrétní časový blok určitého dne) Denní trh cena je zde stanovena každou hodinu. Objemy obchodů na tomto trhu jsou mnohonásobně větší než na ostatních trzích. Vnitrodenní trh doplňuje vhodně blokový a denní trh. Obchodníci anonymně poptávají nebo nabízejí elektřinu až do určitého času (běžně 60 minut) před konečnou realizací dodávky či odběru. Pro naši ekonometrickou analýzu budeme používat data z denního trhu. Ta jsou volně dostupná na webových stránkách OTE. V závislosti na frekvenci dat budeme pracovat se čtyřmi druhy časových řad. Hodinová data - časová řada od do , celkem 7296 pozorování. Denní data - časová řada od do , dohromady ji tvoří 681 pozorování. Tato časová řada vznikla (stejně jako další dvě) jako vážený průměr hodinových cen na základě objemu, který se za daný čas zobchodoval. Týdenní data - časová řada od prvního týdne roku 2008 do 49. týdne roku 2012, obsahuje 259 pozorování. Měsíční data - časová řada od ledna roku 2008 do listopadu roku 2012, tvoří ji 70 pozorování. Všechny ceny jsou uvedené v eurech za megawatthodinu a jsou volně dostupné z uvedených webových stránek. Pro větší stručnost a přehlednost textu budou méně podstatné výsledky a grafy u denních, týdenních a měsíčních cen uvedeny pouze v příloze.
23 Kapitola 3. Empirická analýza Prohlídka časových řad V této podkapitole si graficky zobrazíme všechny časové řady, se kterými budeme pracovat. Prohlédneme si výběrové autokorelační a parciální autokorelační funkce a pomocí Dickey - Fullerova testu jednotkového kořene a KPSS testu ověříme jejich stacionaritu. Hodinové ceny Graf časové řady hodinových cen elektřiny je na obrázku 3.1. V první části grafu je cena za celé období, v druhé částí je cena pouze v prvním týdnu roku 2012 (šedě označená část řady v první části). Modrou barvou jsou vyznačeny ceny z října roku 2012, které budou sloužit pro porovnání předpovědí (celkem 744 pozorování), na předcházejícím datovém vzorku budou odhadnuty modely právě pro predikční účely (více v podkapitole 3.6). Obrázek 3.1: Hodinové ceny elektřiny Z grafu je vidět, že se cena pohybovala v rozmezí Euro/Mwh (střední hodnota je 42,9 a směrodatná odchylka 15), jsou zde ale i odlehlé hodnoty okolo 150Eur/Mwh. Z druhé části grafu je patrná denní sezónnost na vývoji cen. Na obrázku 3.2 vidíme výběrovou ACF a PACF. Hodnoty všech autokorelací jsou statisticky významné, opět zde je vidět sezónní chování. Velké hodnoty autokorelací u zpožděných proměnných signalizují možnost výskytu jednotkového kořene, který budeme testovat pomocí Dickey-Fullerova test. Pro naši časovou řadu vychází t-statistika , přičemž kritické hodnoty z Dickey-Fullerova rozdělení jsou pro náš model následující: pro hladinu významnosti α = 0, 01 je kritická hodnota rovna -2.58, pro α = 0,05 je rovna a pro α = 0,1 je kritická hodnota rovna
24 Kapitola 3. Empirická analýza 16 Obrázek 3.2: Výběrová ACF a PACF u hodinových cen elektřiny Na hladině významnosti 0,01 tedy nemůžeme zamítnout hypotézu o jednotkovém kořenu. Protože výsledek předchozího testu nebyl úplně jednoznačný, vyzkoušíme KPSS test pro otestování stacionarity. Testovací statistika vychází a p-hodnota testu je menší než 0,01, můžeme tedy spolehlivě zamítnout hypotézu o stacionaritě. Z předchozích výsledků je zřejmé, že pro další práci bude nutné řadu diferencovat. Graf nově vzniklé časové řady je na obrázku 3.3. První část grafu je diferencovaná časová řada za celé období, šedě podbarvená část je v detailním výřezu v druhé části grafu. Pohled na výběrovou autokorelační a parciální autokorelační funkci na obrázku 3.4 nám prozradí, že zpožděné proměnné jsou stále korelované (nyní i záporně) a že je zde opět pozorovaná sezónnost. Pro kontrolu stacionarity otestujeme přítomnost jednotkového kořene - t-statistika u Dickey-Fullerova testu vychází -44,89, zamítáme tedy nulovou hypotézu jednotkového kořene. Potvrzení tohoto výsledku dostaneme i u KPSS testu. Podobně jako u původní řady jsou i u diferencované řady vidět velké výkyvy cen elektřiny v únoru. U spotových cen elektřiny nejsou tyto náhlé výkyvy vůbec neobvyklé, objevují se na většině trzích s elektřinou a mohou vzniknout z více různých důvodu (nepředvídané změny v počasí a s tím související změna v poptávce po elektřině, příp. změna nabídky elektřiny z obnovitelných zdrojů). Teplotní průměr v České republice za měsíc únor byl -5,1 C, odchylka od průměrné teploty byla -4,1 C [11], může to být tedy jeden z důvodu vysoké ceny. Mohlo by nás zajímat, nakolik tyto výkyvy ovlivní výsledný odhad modelu. Jednou z možných metod je prozkoumání stability parametrů v čase. Na obrázku 3.5 vidíme rekurzivní odhad parametru u první zpožděné proměnné v modelu AR(10). Zatímco v druhé polovině datového vzorku je parametr relativně stabilní, v první části odpovídající výkyvům v cenách je parametr velmi nestabilní. Pro naše odhady tedy použijeme datový vzorek bez prvních dvou měsíců.
25 Kapitola 3. Empirická analýza 17 Obrázek 3.3: Diference hodinových cen Obrázek 3.4: Výběrová ACF a PACF u diferencované řady hodinových cen Denní ceny Graf denních cen je v příloze na obrázku A.1. Pro porovnání předpovědí použijeme data z posledních tří měsíců (celkem 92 pozorování). V roce 2011 cena fluktuovala okolo 50 Eur/Mwh, podobně jako u hodinových cen jsou na začátku roku 2012 patrné velké
26 Kapitola 3. Empirická analýza 18 Obrázek 3.5: Stabilita parametru v čase výkyvy. V další části roku se již cena ustálila a pohybuje se okolo 40 Eur/Mwh. Z pohledu na výběrovou ACF a PACF na obrázku A.2 vidíme opět sezónní chování s periodou 7 dní. Korelace zpožděných proměnných jsou statisticky významné až do řádu zpoždění 17. T-statistika u Dickey - Fullerova testu vychází -0,63, přijímáme nulovou hypotézu jednotkového kořene. Testovací statistika u KPSS testu vychází a p-hodnota testu je menší než 0,01, zamítáme tedy nulovou hypotézu stacionarity. Diferencovaná časová řada je na obrázku A.3. Z výběrové ACF a PACF na obrázku A.4 vidíme stále přítomnou sezónnost. Test jednotkového kořene i KPSS test nám potvrzují stacionaritu. Parametry jsou v čase relativně stabilní. Týdenní ceny Graf týdenních cen je na obrázku A.5. Pro porovnání předpovědí použijeme pozorování z roku Je zde vidět rozdíl v průměrné ceně mezi lety 2008 až 2009 a zbytkem období. Patrné jsou také již zmíněné velké výkyvy na začátku roku Z výběrové ACF na obrázku A.6 je zřejmé, že je řada nestacionární, což nám potvrdí i Dickey - Fullerův a KPSS test, kdy na hladině významnosti 0,01 můžeme zamítnou hypotézu o stacionaritě. Diferencovaná řada je na obrázku A.7. Z pohledu na výběrovou ACF na obrázku A.8 je vidět, že by zde již neměl být problém s nestacionaritou, což nám potvrdí i test jednotkového kořene a KPSS test. Měsíční ceny Měsíční ceny jsou na obrázku A.9. Pro porovnání předpovědí použijeme data z roku 2011 a 2012 (celkem 23 pozorování). Ceny se pohybovali na úrovni Euro/Mwh (kromě již zmíněného nárůstu ceny v roce 2008). Výběrová ACF a PACF jsou na obrázku A.10. Dickey - Fullerův test i test KPSS potvrzují stacionaritu.
27 Kapitola 3. Empirická analýza Odhad lineárního modelu Výběr vhodného modelu pomocí Box - Jenkinsonovy metodologie je známý a dobře popsaný v literatuře. Využívá se tvaru výběrových autokorelačních a parciálních autokorelačních funkcí, další možností je porovnání modelů pomocí informačních kritérií. V naší práci využijeme již naprogramovanou funkci, která vybere ze všech možných lineárních modelů ten nejlepší model na základě námi určeného informačního kritéria. Při výběru vhodného počtu proměnných bude postupovat pomocí stepwise selection. Pro porovnání modelů zvolíme Akaikeho kritérium, které je interně definováno v programu R. Bohužel je rozdílný způsob výpočtu informačních kritéria pro lineární a nelineární modely, proto pro naše potřeby porovnání modelů můžeme kromě predikčních schopností použít pouze součet čtverců reziduí. Odhadnuté lineární modely jsou v tabulce 3.1. Značení parametrů je stejné jako v druhé kapitole - tedy φ jsou koeficienty autoregresního operátoru, θ jsou koeficienty operátoru klouzavých součtů, π jsou koeficienty sezónního autoregresního operátoru, ψ jsou koeficienty sezónního operátoru klouzavých součtů, µ je střední hodnota a L je délka sezónnosti (v závorce jsou směrodatné odchylky). Hodinové ceny Denní ceny Týdenní ceny Měsíční ceny L µ (0.029) (0.021) ( ) (3.271) ϕ 1 (0.002) (0.038) (0.080) (0.077) ϕ 2 (0.006) (0.047) ( 0.069) ( ) ϕ 3 ( ) (0.039) ( ) ( ) θ 1 (0.010) (0.006) (0.052) ( ) θ 2 (0.021) ( ) ( ) ( ) θ 3 (0.009) ( ) ( ) ( ) π 1 (0.041) (0.038) ( ) ( ) π 2 (0.038) (0.039) ( ) ( ) ψ 1 (0.040) ( ) ( ) ( ) ψ 2 (0.030) ( ) ( ) ( ) Tabulka 3.1: Odhady lineárních modelů
28 Kapitola 3. Empirická analýza 20 Pro ověření platnosti modelu je zapotřebí zkontrolovat rezidua z odhadnutého modelu. V tabulce 3.5 jsou p-hodnoty Shapiro-Wilkova testu pro ověření normality, Box-Pierce testu pro ověření nezávislosti reziduí a Bresch-Paganova testu pro ověření homoskedasticity rozptylu u reziduí. Pro všechny časové řady zamítáme nulovou hypotézu normality. Hodinové ceny Denní ceny Týdenní ceny Měsíční ceny Shapiro - Wilkův test 2.2e e e Breusch - Paganův test 1.158e Box - Piercův test Tabulka 3.2: P-hodnoty testů pro ověření bílého šumu u lineárních modelů Homoskedasticitu zamítáme pouze u hodinových cen, hypotézu nezávislosti reziduí přijímáme pro všechny řady. 3.4 Testy nelinearity Ve druhé kapitole jsme si uvedli testy pro ověření linearity. Jejich použitím ovšem dokážeme nejvýše detekovat případnou nelinearitu, nikoliv však to, jakou formu nelinearita má. McLeod-Li test Připomeňme si, že pomocí tohoto testu můžeme ověřit, zda se prvních m autokorelací u čtverců reziduí odhadnutého lineárního modelu rovná nule. Na obrázku 3.6 vidíme p-hodnoty McLeod-Li testu pro jednotlivé zpoždění m. U hodinových, denních i týdenních cen můžeme na dané hladině významnosti pro všechny zpoždění zamítnout nulovou hypotézu linearity. Pro měsíční data některá zpoždění detekují linearitu, nemůžeme ji ovšem přijmout pro všechny zpoždění. Pomocí McLeod - Li testu tedy zamítáme pro data se všemi frekvenci linearitu. RESET test Pomocí Ramsey RESET testu ověříme, zda je lineární model správně specifikován. Zamítnutím nulové hypotézy připouštíme, že je zde možná nelinearita. P-hodnotu tohoto testu pro odhadnuté lineární modely můžeme vidět v tabulce 3.3. Na dané hladině významnosti zamítáme nulovou hypotézu pro hodinová a týdenní data, zatímco pro denní a měsíční ceny připouštíme linearitu. Supremum test Posledním z testu je Supremum test, který testuje lineární AR model oproti SETAR modelu (ten je popsán v následující podkapitole). P-hodnoty tohoto testu nalezneme opět v tabulce 3.3. Pro všechny časové řady je tedy vhodnější model SETAR oproti lineárnímu AR modelu.
29 Kapitola 3. Empirická analýza 21 Obrázek 3.6: McLeod-Li test pro jednotlivé řady Hodinové ceny Denní ceny Týdenní ceny Měsíční ceny RESET test 1.51e Supremum test Tabulka 3.3: P-hodnoty RESET testu a Supremum testu pro jednotlivé řady Protože nám předchozí testy detekovali možnou nelinearitu, můžeme odhadnout nelineární modely. 3.5 Odhad nelineárních modelů V této podkapitole se budeme zabývat odhadem nelineárních modelů uvedených ve druhé kapitole. Při výběru modelu se budeme řídit Akaikeho informačním kritériem, které je definováno takto AIC = nln( 1 n m i=1 ε 2 i ) + 2k, kde n je počet použitých pozorování, m je počet reziduí a k je počet parametrů v modelu. Postup bude následující - pomocí Akaikeho informačního kritéria a t-statistiky u jednotlivých proměnných vybereme nejvhodnější řád zpoždění pro jednotlivé režimy a pro prahovou proměnnou - přičemž pro každou možnou kombinaci těchto zpoždění zároveň odhadneme optimální hodnotu prahové proměnné. Všechny odhadnuté modely porovnáme a podle definovaného kritéria vybereme ten nejlepší (preferovaný model bude tedy s nejmenší hodnotou AIC). Bohužel pro model LSTAR není v v prostředí R možnost vybírat pouze
30 Kapitola 3. Empirická analýza 22 jednotlivé zpožděné proměnné k odhadu ceny v čase t, výsledný model tedy obsahuje proměnné včetně nevýznamných proměnných. Při prezentaci výsledných odhadů budeme dodržovat stejné značení parametrů jako v druhé kapitole - tedy τ je práh, který určuje daný režim, d je zpoždění prahové proměnné a γ je parametr u přechodové funkce (pouze u LSTAR modelu), φ 1,...φ p,r jsou koeficienty u jednotlivých vysvětlujících proměnných (v závorkách jsou směrodatné odchylky). Jednotlivé režimy jsou značeny zkratkou LR - Low Regime (Y t d < τ, resp. Y t d < τ pro MTAR model) a HR - High Regime (opačné znaménka u nerovností). U všech režimů je také uvedeno, jaké procento pozorování z celkového počtu spadá do jednotlivého režimu. Nelineární modely je možné přímo porovnat pomocí uvedeného informačního kritéria (nejlepší model je zvýrazněn). Nebudou zde uvedeny výsledky pro model TAR - model SETAR je jeho zobecněním. Hodinové ceny V tabulce 3.4 jsou výsledky našich odhadů pro hodinová data. Pro všechny modely jsou velmi vysoké prahové hodnoty - procento pozorování v nižším režimu je poměrně velké. Hodnota parametru τ u LSTAR modelu je velmi nízká - model se tedy blíží AR modelu. Tento model je také nejlepší z pohledu Akaikeho informačního kritéria. Grafy odhadnutých hodnot a skutečné ceny ze dne (pondělí) jsou zobrazeny na obrázku 3.7. Černou barvou je zde zobrazena skutečná cena, barevně jsou vykresleny jednotlivé lineární a nelineární modely. V šedě zobrazené části grafu je cena modelována pomocí vyššího režimu. Z grafu je patrné, že nejlépe fituje cenu elektřiny sezónní lineární model. Obrázek 3.7: Odhadnuté lineární a nelineární modely hodinových cen
31 Kapitola 3. Empirická analýza 23 SETAR MTAR LSTAR τ d γ LR HR LR HR LR HR α (0.053) ( 0.453) ( 0.055) (0.329) (0.094) ( 0.922) 0, φ 1 (0,014) ( ) (0.015) (0.023) (0.018) (0.035) φ 2 ( ) (0.043) (0.016) ( 0.023) (0.023) (0.057) φ 3 (0.013) (0.033) ( ) (0.047) (0.016) (0.052) -0, φ 4 (0,014) ( ) (0.0156) (0.049) (0.014) ( ) -0, φ 5 (0,014) (0.067) ( 0.016) (0.027) ( 0.015) (0.088) -0, φ 6 (0,014) ( 0.057) (0.015) (0.036) (0.015) (-0.703) -0, φ 7 (0,014) (0.053) (0.015) (0.032) (0.016) ( ) -0, φ 8 (0,014) (0.048) (0.015) (0.032) (0.015) (-0.117) -0, φ 9 (0,013) (0.042) (0.013) (0.036) (0.015) (-0.289) # 87.34% 12.66% 84.49% 15.51% 88.47% 11.52% AIC 15361, , Tabulka 3.4: Výsledky odhadů nelineárních modelů pro hodinové ceny Hodnota prahové proměnné byla určena na základě informačního kritéria. Enders [3] ovšem navrhuje i jiný způsob určení. Pro každou potenciální hodnotu τ (přičemž 15% nejnižších a nejvyšších hodnot se vyřadí) se odhadne odpovídající model a vybere se taková hodnota τ, která minimalizuje součet čtverců reziduí. Setřídíme-li potencionální prahové hodnoty podle velikosti, můžeme vykreslit graf velikosti SSR v závislosti na hodnotě τ. Pro řadu hodinových cen je tento graf v příloze na obrázku A.11. Z grafu je patrné, že ideální prahová hodnota, která minimalizuje SSR, vyšla velmi podobně jako při odhadu pomocí informačního kritéria (pro potenciální hodnotu τ bylo ovšem potřeba zahrnout více, než zmíněných 70% pozorování).
32 Kapitola 3. Empirická analýza 24 Denní ceny Výsledky jednotlivých modelů pro denní data jsou v příloze v tabulce B.1. Prahové hodnoty u modelu SETAR a LSTAR mají přibližně stejnou hodnotu, na rozdíl od hodinových cen jsou nyní nízké a větší procento pozorování je ve vyšším režimu. Parametr hladkosti u LSTAR modelu je poměrně velký - nyní se model blíží spíše SETAR modelu. SETAR model je také vybrán pomocí informačního kritéria jako nejlepší. Týdenní ceny V tabulce B.2 jsou odhadnuté modely pro data s týdenní frekvencí. Prahové hodnoty vycházejí u modelu SETAR a LSTAR velmi podobně (nyní je vyšším režimem stejně jako u hodinových cen modelováno zhruba 15% největších pozorování). Vysoká hodnota parametru hladkosti LSTAR modelu značí jeho přiblížení k modelu SETAR, který má nejmenší hodnotu AIC. Měsíční ceny Pro měsíční data jsou výsledky odhadnutých modelů v tabulce B.3. Na rozdíl od předchozích řad jsou prahové hodnoty modelu SETAR a LSTAR odlišné. Parametr hladkosti u modelu LSTAR nyní neupřednostňuje žádný z modelů SETAR nebo AR. Podle informačního kritéria je model se spojitou přechodovou funkcí z daných modelů nejlepší. Diagnostická kontrola reziduí V tabulce 3.5 jsou p-hodnoty Shapiro - Wilkova testu (SW) pro ověření normality reziduí, Box - Pierceho testu (BoP) pro ověření nezávislosti reziduí a Bresch - Paganova testu (BP) pro ověření homoskedasticity rozptylu reziduí všech odhadnutých nelineárních modelů. SETAR MTAR LSTAR Hodinové ceny Denní ceny Týdenní ceny Měsíční ceny SW 2.2e e BP BoP SW 2.2e e BP BoP SW 2.2e e BP BoP Tabulka 3.5: P-hodnoty testů pro ověření bílého šumu u lineárních modelů Pro všechny modely zamítáme normalitu reziduí, nekonstantní rozptyl v čase je v modelu MTAR u týdenních cen.
Úvod do analýzy časových řad
Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2... } se nazývá stochastický
VíceModely stacionárních časových řad
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Proces bílého šumu Proces {ɛ t} nazveme bílým šumem s nulovou střední hodnotou a rozptylem σ 2 a
VíceCvičení 9 dekompozice časových řad a ARMA procesy
Cvičení 9 dekompozice časových řad a ARMA procesy Příklad 1: Dekompozice časové řady Soubor 18AEK-cv09.xls obsahuje dvě časové řady (X a Y) se 72 pozorováními. Použijte časovou řadu Y. a) Pokuste se na
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie ZS 2015/16 Cvičení 7: Časově řady, autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Časové řady Data: HDP.wf1
VíceČasové řady, typy trendových funkcí a odhady trendů
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Stochastický proces Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2 } se nazývá stochastický proces
VíceČasové řady, typy trendových funkcí a odhady trendů
Časové řady, typy trendových funkcí a odhady trendů Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Jiří Neubauer (Katedra ekonometrie UO Brno) Časové
VíceModely pro nestacionární časové řady
Modely pro nestacionární časové řady Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Modely pro nestacionární
VíceIlustrační příklad odhadu LRM v SW Gretl
Ilustrační příklad odhadu LRM v SW Gretl Podkladové údaje Korelační matice Odhad lineárního regresního modelu (LRM) Verifikace modelu PEF ČZU Praha Určeno pro posluchače předmětu Ekonometrie Needitovaná
VíceEKONOMETRIE 7. přednáška Fáze ekonometrické analýzy
EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy Ekonometrická analýza proces, skládající se z následujících fází: a) specifikace b) kvantifikace c) verifikace d) aplikace Postupné zpřesňování jednotlivých
VíceTestování hypotéz o parametrech regresního modelu
Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO
Více12. cvičení z PST. 20. prosince 2017
1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace
VíceTestování hypotéz o parametrech regresního modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,
VíceKORELACE. Komentované řešení pomocí programu Statistica
KORELACE Komentované řešení pomocí programu Statistica Vstupní data I Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná
VíceMatematické modelování Náhled do ekonometrie. Lukáš Frýd
Matematické modelování Náhled do ekonometrie Lukáš Frýd Výnos akcie vs. Výnos celého trhu - CAPM model r it = r ft + β 1. (r mt r ft ) r it r ft = α 0 + β 1. (r mt r ft ) + ε it Ekonomický (finanční model)
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie LS 2014/15 Cvičení 7: Autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Autokorelace - teorie Zopakujte si G-M
VíceZáklady ekonometrie. XI. Vektorové autoregresní modely. Základy ekonometrie (ZAEK) XI. VAR modely Podzim / 28
Základy ekonometrie XI. Vektorové autoregresní modely Základy ekonometrie (ZAEK) XI. VAR modely Podzim 2015 1 / 28 Obsah tématu 1 Prognózování s VAR modely 2 Vektorové modely korekce chyb (VECM) 3 Impulzní
VíceStatistika II. Jiří Neubauer
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Časová řada konečná posloupnost reálných hodnot určitého sledovaného ukazatele měřeného v určitých
VíceEkonometrie. Jiří Neubauer
Úvod do analýzy časových řad Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Úvod do analýzy
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceKorelační a regresní analýza
Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná
VíceSEMINÁRNÍ PRÁCE Z 4ST432 Tereza Michlíková (xmict05) ZS 06/07
SEMINÁRNÍ PRÁCE Z 4ST432 Tereza Michlíková (xmict05) ZS 06/07 Nesezónní časová řada - Základní údaje o časové řadě Časová řada příjmy z daní z příjmu v Austrálii ( http://www.economagic.com/emcgi/data.exe/tmp/213-220-208-205!20061203093308
Více18AEK Aplikovaná ekonometrie a teorie časových řad. Řešení domácích úkolů č. 1 a 2 příklad 1
18AEK Aplikovaná ekonometrie a teorie časových řad Řešení domácích úkolů č. 1 a 2 příklad 1 Obecné pravidlo pro všechny testy Je stanovena nulová hypotéza: H 0 Je stanovena alternativní hypotéza: H A Je
VíceModely pro nestacionární časové řady
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Modely ARIMA Transformace Proces náhodné procházky Random Walk Process Proces Y t = Y t 1 + ɛ t je
VíceNormální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký
VíceTeorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných)
Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných) 1. SPECIFIKACE (12 bodů): (1) Graf průběhu proměnných (1) Obě řady se chovají stejně, lze předpokládat jejich lineární vztah
VíceJEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica
JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu
Více1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou
Více12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)
cvičení z PSI 0-4 prosince 06 Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) Z realizací náhodných veličin X a Y s normálním rozdělením) jsme z výběrů daného rozsahu obdrželi
Více4EK211 Základy ekonometrie
4EK11 Základy ekonometrie Autokorelace Cvičení 5 Zuzana Dlouhá Gauss-Markovy předpoklady Náhodná složka: Gauss-Markovy předpoklady 1. E(u) = náhodné vlivy se vzájemně vynulují. E(uu T ) = σ I n konečný
Více4EK211 Základy ekonometrie
4EK Základy ekonometrie Odhad klasického lineárního regresního modelu II Cvičení 3 Zuzana Dlouhá Klasický lineární regresní model - zadání příkladu Soubor: CV3_PR.xls Data: y = maloobchodní obrat potřeb
VíceOdhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
VíceLineární regrese. Komentované řešení pomocí MS Excel
Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních
VíceNormální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními
VíceREGRESNÍ ANALÝZA NESTACIONÁRNÍCH EKONOMICKÝCH ČASOVÝCH ŘAD
Politická ekonomie 45: (2), str. 281-289, VŠE Praha, 1997. ISSN 0032-3233. (Rukopis) REGRESNÍ ANALÝZA NESTACIONÁRNÍCH EKONOMICKÝCH ČASOVÝCH ŘAD Josef ARLT, Vysoká škola ekonomická, Praha 1. Úvod Pro modelování
VíceNÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:
NÁHODNÁ ČÍSLA TYPY GENERÁTORŮ, LINEÁRNÍ KONGRUENČNÍ GENERÁTORY, TESTY NÁHODNOSTI, VYUŽITÍ HODNOT NÁHODNÝCH VELIČIN V SIMULACI CO JE TO NÁHODNÉ ČÍSLO? Náhodné číslo definujeme jako nezávislé hodnoty z rovnoměrného
Více1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceProblematika analýzy rozptylu. Ing. Michael Rost, Ph.D.
Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít
VíceKGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost
VíceStanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )
Příklad č. 1 Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Zadání : Stanovení manganu ve vodách se provádí oxidací jodistanem v kyselém prostředí až na manganistan. (1) Sestrojte
VíceRNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných
VíceTestování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti
VíceInovace bakalářského studijního oboru Aplikovaná chemie
http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Regrese Závislostproměnných funkční y= f(x) regresní y= f(x)
VíceTestování statistických hypotéz. Ing. Michal Dorda, Ph.D.
Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině
VíceAplikovaná ekonometrie 7. Lukáš Frýd
Aplikovaná ekonometrie 7 Lukáš Frýd Nestacionární časové řady Možné příčinny Sezonost Deterministický trend (time trend) Jednotkový kořen (Stochastický trend) Strukturní zlomy Časový trend (deterministický
VíceZáklady ekonometrie. X. Regrese s časovými řadami. Základy ekonometrie (ZAEK) X. Regrese s časovými řadami Podzim / 47
Základy ekonometrie X. Regrese s časovými řadami Základy ekonometrie (ZAEK) X. Regrese s časovými řadami Podzim 2015 1 / 47 Obsah tématu 1 ADL model 2 Regrese se stacionárními řadami 3 Regrese s řadami
VíceDiagnostika regrese pomocí grafu 7krát jinak
StatSoft Diagnostika regrese pomocí grafu 7krát jinak V tomto článečku si uděláme exkurzi do teorie regresní analýzy a detailně se podíváme na jeden jediný diagnostický graf. Jedná se o graf Předpovědi
VíceTomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie LS 2014/15 Cvičení 10: Heteroskedasticita LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Heteroskedasticita - teorie Druhý
VíceIntervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
Více10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.
0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti
Vícez dat nasbíraných v letech 1959 1994. Ke zpracování dat byl použit statistický software R. Základní model poptávkové funkce, ze kterého vycházíme,
Úloha 1: V naší studii se zabýváme poptávkovou funkcí životního pojištění, vycházíme z dat nasbíraných v letech 1959 1994. Ke zpracování dat byl použit statistický software R. Základní model poptávkové
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie Predikce Multikolinearita Cvičení 4 Zuzana Dlouhá Aplikace EM predikce obecně ekonomické prognózování, předpověď, předvídání hlavním cílem je odhad hodnot vysvětlované proměnné
Více11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.
11 cvičení z PSI 12-16 prosince 2016 111 (Test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota 0 1 2 3 4 5 6 pozorovaná četnost 29 15
VícePravděpodobnost a aplikovaná statistika
Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA STATISTICKÉ TESTOVÁNÍ HYPOTÉZ 22.11.2016 Opakování: CLV příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců
VíceČasové řady a jejich periodicita pokračování
Časové řady a jejich periodicita pokračování Jana Klicnarová Katedra aplikované matematiky a informatiky Jihočeská Univerzita v Českých Budějovicích, Ekonomická fakulta 2010 Dekompozice časových řad Jak
VíceDVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica
DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica Úloha A) koncentrace glukózy v krvi V této části posoudíme pomocí párového testu, zda nový lék prokazatelně snižuje koncentraci
VíceIntervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
VícePeriodicita v časové řadě, její popis a identifikace, exponenciální vyrovnáván
Periodicita v časové řadě, její popis a identifikace, exponenciální vyrovnávání Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Periodicita v časových
VíceKorelace. Komentované řešení pomocí MS Excel
Korelace Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A2:B84 (viz. obrázek) Prvotní představu o tvaru a síle závislosti docházky a počtu bodů nám poskytne
VíceZávislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )
Úloha M608 Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely ) Zadání : Při kvantitativní analýze lidského krevního séra ovlivňují hodnotu obsahu vysokohustotního
Více8 Coxův model proporcionálních rizik I
8 Coxův model proporcionálních rizik I Předpokládané výstupy z výuky: 1. Student umí formulovat Coxův model proporcionálních rizik 2. Student rozumí významu regresních koeficientů modelu 3. Student zná
VícePearsonův korelační koeficient
I I.I Pearsonův korelační koeficient Úvod Předpokládejme, že náhodně vybereme n objektů (nebo osob) ze zkoumané populace. Často se stává, že na každém z objektů měříme ne pouze jednu, ale několik kvantitativních
VíceJednofaktorová analýza rozptylu
I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých
VíceNávrh a vyhodnocení experimentu
Návrh a vyhodnocení experimentu Návrh a vyhodnocení experimentů v procesech vývoje a řízení kvality vozidel Ing. Bohumil Kovář, Ph.D. FD ČVUT Ústav aplikované matematiky kovar@utia.cas.cz Mladá Boleslav
VíceAVDAT Výběr regresorů v mnohorozměrné regresi
AVDAT Výběr regresorů v mnohorozměrné regresi Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Výběr správného lineárního modelu y = Xβ + ε, ale v matici X typu n (p + 1) je
VíceMetoda backward výběru proměnných v lineární regresi a její vlastnosti
Metoda backward výběru proměnných v lineární regresi a její vlastnosti Aktuárský seminář, 13. dubna 2018 Milan Bašta 1 / 30 1 Metody výběru proměnných do modelu 2 Monte Carlo simulace, backward metoda
VíceUNIVERZITA PARDUBICE
UNIVERZITA PARDUBICE Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie na téma Tvorba nelineárních regresních modelů v analýze dat Vedoucí licenčního studia Prof. RNDr.
VíceTestování statistických hypotéz
Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,
VíceStatistika. Regresní a korelační analýza Úvod do problému. Roman Biskup
Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009
VícePravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1
Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu
VíceOdhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
VíceRegresní analýza 1. Regresní analýza
Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému
VíceTestování předpokladů pro metodu chain-ladder. Seminář z aktuárských věd Petra Španihelová
Testování předpokladů pro metodu chain-ladder Seminář z aktuárských věd 4. 11. 2016 Petra Španihelová Obsah Datová struktura Posouzení dat Předpoklady metody chain-ladder dle T. Macka Běžná lineární regrese
VíceJednofaktorová analýza rozptylu
Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y Xβ ε Předpoklady: Matice X X n,k je matice realizací. Předpoklad: n > k, h(x) k - tj. matice
VíceTestování statistických hypotéz
Testování statistických hypotéz Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 11. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 27 Obsah 1 Testování statistických hypotéz 2
Více5EN306 Aplikované kvantitativní metody I
5EN306 Aplikované kvantitativní metody I Přednáška 5 Zuzana Dlouhá Předmět a struktura kurzu 1. Úvod: struktura empirických výzkumů 2. Tvorba ekonomických modelů: teorie 3. Data: zdroje a typy dat, význam
VíceRegresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel
Regresní analýza Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Regresní analýza 1 / 23
VíceAVDAT Klasický lineární model, metoda nejmenších
AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i
Více676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368
Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540
Více15. T e s t o v á n í h y p o t é z
15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
VíceTestování statistických hypotéz
Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné
VíceTesty statistických hypotéz
Testy statistických hypotéz Statistická hypotéza je jakýkoliv předpoklad o rozdělení pravděpodobnosti jedné nebo několika náhodných veličin. Na základě náhodného výběru, který je reprezentativním vzorkem
VíceÚvodem Dříve les než stromy 3 Operace s maticemi
Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová
VíceAVDAT Nelineární regresní model
AVDAT Nelineární regresní model Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Nelineární regresní model Ey i = f (x i, β) kde x i je k-členný vektor vysvětlujících proměnných
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceMÍRY ZÁVISLOSTI (KORELACE A REGRESE)
zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky
VíceTECHNICKÁ UNIVERZITA V LIBERCI
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce z předmětu Statistický rozbor dat z dotazníkového šetření Jméno: Lucie Krechlerová, Karel Kozma, René Dubský, David Drobík Ročník: 2015/2016
VíceFakulta elektrotechnická. Komponenta pro měření a predikci spotřeby elektrické energie
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická DIPLOMOVÁ PRÁCE Komponenta pro měření a predikci spotřeby elektrické energie Praha, 2014 Autor: Tomáš Reichl i Poděkování Chtěl bych na tomto
VíceNeuronové časové řady (ANN-TS)
Neuronové časové řady (ANN-TS) Menu: QCExpert Prediktivní metody Neuronové časové řady Tento modul (Artificial Neural Network Time Series ANN-TS) využívá modelovacího potenciálu neuronové sítě k predikci
VíceRegresní analýza. Eva Jarošová
Regresní analýza Eva Jarošová 1 Obsah 1. Regresní přímka 2. Možnosti zlepšení modelu 3. Testy v regresním modelu 4. Regresní diagnostika 5. Speciální využití Lineární model 2 1. Regresní přímka 3 nosnost
VíceValue at Risk. Karolína Maňáková
Value at Risk Karolína Maňáková Value at risk Historická metoda Model-Building přístup Lineární model variance a kovariance Metoda Monte Carlo Stress testing a Back testing Potenciální ztráta s danou pravděpodobností
VíceStatistika, Biostatistika pro kombinované studium. Jan Kracík
Statistika, Biostatistika pro kombinované studium Letní semestr 2014/2015 Tutoriál č. 6: ANOVA Jan Kracík jan.kracik@vsb.cz Obsah: Testování hypotéz opakování ANOVA Testování hypotéz (opakování) Testování
Více