Zdánlivá regrese ekonomických
|
|
- Silvie Jaroslava Zemanová
- před 8 lety
- Počet zobrazení:
Transkript
1 Univerzita Karlova v Praze Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE Magdalena Komzáková Zdánlivá regrese ekonomických ukazatelů Katedra pravděpodobnosti a matematické statistiky Vedoucí diplomové práce: Doc. RNDr. Petr Lachout, CSc. Studijní program: Matematika Studijní obor: Pravděpodobnost, matematická statistika a ekonometrie Studijní plán: Ekonometrie Praha 2006
2 Poděkování Poděkování patří především vedoucímu mé diplomové práce Doc. RNDr. Petru Lachoutovi, CSc. za cenné připomínky. Dále bych ráda poděkovala své rodině a přátelům za potřebnou podporu v průběhu celého studia. Prohlašuji, že jsem svou diplomovou práci napsala samostatně a výhradně s použitím citovaných pramenů. Souhlasím se zapůjčováním práce. V Praze dne Magdalena Komzáková
3 Obsah Úvod i 1 Základní definice Náhodný proces Stacionarita Ergodicita Bílý šum Procesy klouzavých součtů MA(1) proces MA(q) proces MA( ) proces Autoregresní procesy AR(1) proces AR(p) proces Smíšené autoregresní procesy klouzavých součtů ARMA(p,q) proces Nestacionární procesy Procesy s deterministickým trendem Procesy se stochastickým trendem Jednotkové kořeny Jednoduché příklady Integrované procesy ARIMA(p,d,q) proces SARIMA(p,d,q) (P,D,Q) s proces Zdánlivá regrese Vlastnosti I(0) a I(1) procesů Ekvilibrium Durbin-Watsonův test Zdánlivá regrese: Granger & Newbold Příklad Zdánlivá regrese obecně Léky zdánlivé regrese
4 OBSAH 3 4 Rozpoznání zdánlivé regrese Kointegrace Příklad Definice Testy jednotkového kořene a stacionarity Testy jednotkového kořene Testy stacionarity Testy kointegrace Příklad 39 6 Závěr 42 Literatura 43
5 Název práce: Zdánlivá regrese ekonomických ukazatelů Autor: Magdalena Komzáková Katedra: Katedra pravděpodobnosti a matematické statistiky Vedoucí diplomové práce: Doc. RNDr. Petr Lachout, CSc. vedoucího: Petr.Lachout@mff.cuni.cz Abstrakt: V analýze časových řad je častým jevem, že se dvě nebo více časových řad navzájem ovlivňuje. Pokud ovšem generující náhodné procesy těchto řad nemají stacionární strukturu, ale jsou stochasticky nestacionární, tj. jejich charakteristický polynom obsahuje jednotkový kořen, stává se nezřídka, že i regrese modelující vzájemnou závislost několika naprosto nesouvisejících řad dává statisticky významné odhady parametrů a statistiky běžné k posuzování výstižnosti použitého modelu nenaznačují nic o jeho nevhodnosti. Tento problém se nazývá zdánlivou regresí a je řešen teorií kointegrace, nebot můžeme prohlásit, že pokud jsou řady kointegrované, ukazuje jejich model skutečnou závislost, nikoliv jen zdánlivou. Proto jsou testy kointegrace současně využívány i k testování přítomnosti zdánlivé regrese. Tyto testy vycházejí z testů přítomnosti jednotkového kořene v generujícím pocesu (nebo z testů stacionarity řady), protože časové řady mohou být kointegrované pouze v případě, kdy jejich lineární kombinace je sama stacionární řadou. Klíčová slova: zdánlivá regrese, kointegrace, procesy s jednotkovým kořenem Title: Seeming regression of economic indices Author: Magdalena Komzáková Department: Department of Probability and Mathematical Statistics Supervisor: Doc. RNDr. Petr Lachout, CSc. Supervisor s address: Petr.Lachout@mff.cuni.cz Abstract: In the time series analysis it often appears that two or more time series influence each other. When the generating stochastic processes of these series do not have stationary structure but they are stochastically non-stationary, i.e. the characteristic polynomial has a unit root, it happens that the regression modelling the dependence of some absolutely independent series gives statistically significant parameter estimations and statistics used to judge the model fitting do not indicate anything about its impropriety. This phenomenon is called seeming regression (spurious regression) and is solved with the theory of cointegration. We can say that when the series are cointegrated, their model shows their real dependence, not only the seeming one. Due to this fact, cointegration tests are also used for testing for the presence of seeming regression. These tests are based on unit root tests in generating process (or on stationarity tests), because time series can be cointegrated only if their linear combination is a stationary series. Keywords: seeming regression, spurious regression, cointegration, unit root processes
6 Úvod Pro modelování vztahů mezi ekonomickými veličinami jsou v ekonometrii často používané jednorovnicové regresní modely. Při tomto postupu je jedna ekonomická veličina určená jako závislá proměnná (vysvětlovaná, endogenous) a druhá jako nezávislá (vysvětlující, exogenous), s jejíž pomocí se závislá proměnná modeluje. Obě proměnné mohou být prostorově i časově uspořádané, a právě díky specifickým vlastnostem časového uspořádání může při tomto modelování docházet k určitým problémům. Jedním z nich je i fenomén zvaný Zdánlivá regrese. Lze ji ilustrovat situací, kdy máme k dispozici dvě časové řady, které jsou nezávislé. Pokud ale provedeme regresi jedné na druhou, tj. budeme jednu řadu považovat za vysvětlovanou a druhou za vysvětlující, může se stát, že metodou nejmenších čtverců získáme statisticky významné odhady parametrů dané regresní funkce. Z logiky věci (z nezávislosti zkoumaných řad) však vyplývá, že je tento závěr chybný. Tato skutečnost pak v praxi často vede k mylným závěrům o vztazích ekonomických veličin. Problém zdánlivé regrese je znám již 80 let, přesto je stále aktuální a ne mnoho praktikujících ekonomů s ním umí zacházet. Na toto téma již bylo sepsáno hodně článků, ne tak však v české literatuře. Proto je cílem této práce shrnout základní známé informace o zdánlivé regresi ze zahraniční literatury, které by mohly nadále posloužit zájemcům jako startovní čára pro hlubší studium. Předpokladem pro porozumění následujícího textu je alespoň základní znalost matematické statistiky a teorie náhodných procesů. Historie Zdánlivá regrese, neboli nesmyslná korelace, jak byla původně nazývána, má ve statistice dlouhou minulost. Poprvé byl tento problém zaznamenán v práci G.U.Yulea v roce V ekonometrické a statistické literatuře je uvedeno mnoho zajímavých, často však spíše humorných příkladů tohoto zvláštního - a na první pohled nepochopitelného - úkazu. Jedním z nich je například vysoká korelace mezi počtem ministrů a mírou alkoholismu ve Velké Británii v 19. století. Další vyslovil sám Yule, když zjistil korelaci i
7 ÚVOD ii 0,95 mezi poměrem sňatků v anglikánské církvi k celkovému počtu sňatků (ve Velké Británii) a mírou úmrtnosti v období let 1866 až A do třetice ekonometrický příklad, který zmínil Hendry (1980) a který prokazuje vysokou spojitost mezi cenovou hladinou a kumulativními srážkami ve Spojeném království. Tento vztah pak byl svým autorem žertovně nazván novou teorií inflace. Díky těmto příkladům se tedy zdánlivá regrese dostala do povědomí mnoha lidí. V roce 1974 vyšel v časopise Journal of Econometrics článek od autorů Grangera a Newbolda, který se stal velice známým. Autoři zde na základě Monte Carlo simulací prokázali, že se zdánlivá regrese projeví, pokud testujeme závislost mezi dvěma nezávislými náhodnými procházkami. Regresní koeficient ve většině případů vyšel statisticky signifikantní a hodnota koeficientu determinace tohoto modelu velice blízká jedničce. Tento článek zahájil moderní diskusi o problému zdánlivé regrese a vedl k vytvoření konceptu kointegrace. Uved me na tomto místě pro zajímavost ještě jeden kuriózní příklad: za vysvětlovanou proměnnou považujme míru úmrtnosti novorozeňat v Egyptě v letech 1971 až 1990 (roční údaje), za vysvětlující pak příjem amerických farmářů a celkovou zásobu peněz Hondurasu. Pak klíčové statistiky vycházejí následovně: R 2 = 0, 918, F = 95, 17, což ukazuje na významnou vzájemnou závislost použitých ekonomických ukazatelů.
8 Kapitola 1 Základní definice V této úvodní kapitole si připomeneme některé základní definice a pojmy z teorie časových řad, jako náhodný proces, stacionarita, ergodicita, a zavedeme MA, AR, ARMA procesy. 1.1 Náhodný proces Definice 1.1: Náhodný proces je rodina náhodných veličin {Y t, t T }, T R, definovaných na pravděpodobnostním prostoru (Ω, A, P). Pokud platí, že T = Z nebo T Z, jedná se o náhodný proces s diskrétním časem neboli o časovou řadu. V případě, že T = [a, b], kde a < b, mluvíme o náhodném procesu se spojitým časem. V naší analýze se budeme zabývat prvním z výše zmíněných, tedy časovou řadou. Přitom nebudeme rozlišovat mezi samotným náhodným procesem a jeho realizací. Je dobré si také připomenout, že rozdělení náhodného procesu {Y t, t T } je jednoznačně určeno, a to rozdělením všech konečněrozměrných náhodných vektorů (Y t1,..., Y tn ), n N, což vyplývá z Daniellovy-Kolmogrovovy věty. Její plné znění viz např. Prášková, Lachout (1998). Pro náhodný proces {Y t, t T } definujeme následující: střední hodnota: µ t = EY t, pokud pro všechna t T existuje. Pokud µ t = 0 pro t T, nazveme {Y t, t T } centrovaným procesem. autokovarianční funkce: γ(s, t) = cov(y s, Y t ), pokud pro t T : E Y t 2 <. Rozptyl procesu {Y t, t T } je speciálním případem autokovarianční funkce, když s = t. Tedy V ar(y t ) = γ(t, t) je rozptyl procesu v čase t. 1
9 KAPITOLA 1. ZÁKLADNÍ DEFINICE 2 autokorelační funkce: pokud γ(t, t) > 0 pro t T. ρ(s, t) = γ(s, t) γ(s, s)γ(t, t), Distribuce náhodného procesu je určena prvními a druhými momenty (střední hodnotou a autokorelační funkcí). Pokud je proces gaussovský, tj. všechna jeho konečněrozměrná rozdělení jsou normální, je jeho distribuce těmito momenty určena jednoznačně Stacionarita Definice 1.2: Náhodný proces {Y t, t Z} nazveme striktně stacionárním, pokud sdružené distribuční funkce vektorů (Y t1,...,y tn ) a (Y t1 +h,...,y tn+h) jsou stejné po všechna n N a všechna t 1,...,t n, h Z. Pokud je náhodný proces striktně stacionární, nemění se distribuční vlastnosti (střední hodnota, rozptyl,...) náhodných veličin Y t v čase. Tato definice je poměrně přísná, proto uvedeme slabší verzi stacionarity. Definice 1.3: Náhodný proces {Y t, t Z} nazveme slabě (kovariančně) stacionárním, pokud splňuje následující podmínky: E Y t 2 < E(Y t ) = µ, t Z γ(s, t) = γ(s + r, t + r), t, s, r Z Pokud je proces slabě stacionární, lze jeho autokovarianční funkci vyjádřit jako funkci jedné proměnné, protože závisí pouze na časovém intervalu mezi dvěma pozorováními: γ(s, t) = γ(t s, 0) Proto předefinujeme autokovarianční funkci pro slabě stacionární procesy: γ(h) = γ(h, 0) = cov(y t, Y t h ) h, t Z. Dále platí, že autokovarianční funkce je symetrická podle nuly: γ(h) = γ( h) h Z.
10 KAPITOLA 1. ZÁKLADNÍ DEFINICE 3 Z výše uvedeného je vidět, že pro slabě stacionární proces také platí, že jeho rozptyl je konstantní: V ar(y t ) = γ(0) a autokorelační funkce vypadá následovně: ρ(t) = γ(t) γ(0). Věta 1.1: Každý striktně stacionární náhodný proces {Y t, t Z} s konečnými druhými momenty je i slabě stacionární. Důkaz je velmi snadný, viz. např. Prášková (2004). Opačná implikace bohužel neplatí obecně. Platí ovšem, pokud je náhodný proces gaussovský. Pro analýzu časových řad se málokdy používají striktně stacionární řady, protože se velmi zřídka objevují v praxi. Proto v následujícím textu budeme pokaždé výrazem stacionární myslet slabě stacionární procesy Ergodicita Jelikož máme pro každou časovou řadu pouze jednu realizaci (nemůžeme se vrátit v čase zpět a nechat ji běžet znova), zavádíme pojem ergodicity, který nám zajistí jistou dávku stability procesu. Definice 1.4: Řekneme, že stacionární proces {Y t, t Z} je ergodický podle (kvadratického) středu, pokud platí: Y = 1 T T Y P t EY t = µ t=1 pro T. Stacionární proces je ergodický podle středu, pokud je jeho kovarianční funkce absolutně sčítatelná, tj. splňuje následující podmínku: γ(h) <. h=0 Tato podmínka nám zajišt uje, že s rostoucím časem jde kovarianční funkce dostatečně rychle k nule. Důkaz uvedl např. Hamilton (1994).
11 KAPITOLA 1. ZÁKLADNÍ DEFINICE 4 Definice 1.5: Řekneme, že stacionární proces {Y t, t Z} je ergodický do druhých momentů, pokud platí: pro T a h Z. γ(h) = 1 T h T (Y t µ)(y t h µ) P γ(h) t=h+1 V mnoha případech se podmínky stacionarity a ergodicity slučují ve stejné požadavky. Není tomu tak ale vždy, proto nelze ergodicitu zanedbávat. 1.2 Bílý šum Bílý šum je základním stavebním kamenem pro většinu dalších procesů, proto je jeho znalost nezbytně nutná. Definice 1.6: Náhodný proces {ǫ t, t Z} nazýváme procesem bílého šumu právě tehdy, když splňuje následující podmínky: E(ǫ t ) = 0 pro t Z E(ǫ t ǫ s ) = { σ 2, t = s 0, jinak Z definice je zřejmé, že proces bílého šumu je vždy stacionární. Někdy se proces bílého šumu značí WN, z anglického white noise. V tomto případě se můžeme setkat se zápisem: {ǫ t, t Z} WN(0, σ 2 ). Pokud jsou navíc ǫ t a ǫ s nezávislá pro t s, jedná se o nezávislý bílý šum a značí se {ǫ t } IWN(0, σ 2 ) (I pochází z anglického independent ). Pokud ještě kromě toho pro všechna t platí, že ǫ t N(0, σ 2 ), pak nazýváme bílý šum gaussovským a značíme ho {ǫ t } GWN(0, σ 2 ). 1.3 Procesy klouzavých součtů MA(1) proces Definice 1.7: Necht je {ǫ t } bílý šum. Uvažujme proces Y t = µ + ǫ t + θǫ t 1, kde µ a θ jsou libovolné konstanty. Tato časová řada se nazývá proces klouzavých součtů prvního řádu a značí se MA(1).
12 KAPITOLA 1. ZÁKLADNÍ DEFINICE 5 Základní vlastnosti MA(1) procesu jsou následující: E(Y t ) = µ pro t σ 2 (1 + θ 2 ), h = 0 γ(h) = θσ 2, h = 1 0, h > 1 Z toho vyplývá, že MA(1) proces je vždy stacionární a ergodický podle středu MA(q) proces Definice 1.8: Necht je {ǫ t } bílý šum. Uvažujme proces Y t = µ + ǫ t + θ 1 ǫ t 1 + θ 2 ǫ t θ q ǫ t q, kde µ a (θ 1, θ 2,...,θ q ) jsou libovolné konstanty. Tato časová řada se nazývá proces klouzavých součtů q-tého řádu a značí se MA(q). MA(q) proces se dá také zapsat pomocí sumy: kde θ 0 = 1. Y t = µ + q θ j ǫ t j, Další častý způsob zápisu je pomocí operátoru zpětného posunutí L (z anglického lag ), který je definován tak, že L j (Y t ) = Y t j : kde θ(l) značí polynom a θ 0 = 1. j=0 Y t = µ + θ(l)ǫ t, θ(l) = q θ j L j j=0 Řekneme, že MA(q) proces je invertibilní, pokud je splněna tzv. podmínka invertibility: všechny kořeny charakteristického polynomu θ(z) = q j=0 θ jz j (pro z C) leží vně jednotkového kruhu, tj. pro z C taková, že θ(z) = 0, platí: z > 1. Potom existuje AR reprezentace (viz dále) MA(q) procesu. Základní vlastnosti MA(q) procesu jsou následující: E(Y t ) = µ pro t { σ γ(h) = 2 (θ h + θ 1 θ h θ q h θ q ), h q 0, h > q Z toho vyplývá, že MA(q) proces je vždy stacionární a ergodický podle středu.
13 KAPITOLA 1. ZÁKLADNÍ DEFINICE MA( ) proces Definice 1.9: Necht je {ǫ t } bílý šum. Uvažujme proces Y t = µ + ψ j ǫ t j = µ + ψ 0 ǫ t + ψ 1 ǫ t 1 + ψ 2 ǫ t 2 +, j=0 kde µ a (ψ 1, ψ 2,...) jsou libovolné konstanty, ψ 0 = 1. Tato časová řada se nazývá proces klouzavých součtů -ného řádu a značí se MA( ). MA( ) proces lze opět zapsat pomocí operátoru zpětného posunutí L: kde ψ(l) značí polynom a ψ 0 = 1. Y t = µ + ψ(l)ǫ t, ψ(l) = ψ j L j Řekneme, že MA( ) proces je dobře definován, pokud koeficienty ψ splňují následující podmínku kvadratické sčítatelnosti: j=0 ψ j 2 <. j=0 Často bývá ovšem zvykem pracovat s poněkud silnější podmínkou absolutní sčítatelnosti: ψ j <. j=0 Základní vlastnosti MA( ) procesu jsou následující, jedná se o limitní vlastnosti procesu MA(q) pro q : E(Y t ) = µ pro t γ(h) = σ 2 j=0 ψ jψ j+h pro h = 0, 1, 2,... Z toho tedy vyplývá, že MA( ) proces, který je dobře definován (tj. splňuje podmínku kvadratické sčítatelnosti koeficientů), je vždy stacionární a ergodický podle středu.
14 KAPITOLA 1. ZÁKLADNÍ DEFINICE Autoregresní procesy AR(1) proces Definice 1.10: Necht je {ǫ t } bílý šum. Uvažujme proces Y t = c + φy t 1 + ǫ t, kde c a φ jsou libovolné konstanty. Tato časová řada se nazývá autoregresní proces prvního řádu a značí se AR(1).. AR(1) proces lze také pomocí rekurze zapsat následujícím způsobem: Y t = φ j (c + ǫ t j ) j=0 Pokud je navíc φ < 1, existuje jednoznačně určený náhodný proces, který splňuje danou AR(1) rovnici. Tento proces je stacionární a navíc kauzální, tj. existuje jeho MA( ) reprezentace. Základní vlastnosti stacionárního AR(1) procesu jsou následující: E(Y t ) = µ = c 1 φ pro t γ(h) = σ2 φ h 1 φ 2 pro h Stacionární AR(1) proces je vždy také ergodický podle středu AR(p) proces Definice 1.11: Necht je {ǫ t } bílý šum. Uvažujme proces Y t = c + φ 1 Y t φ p Y t p + ǫ t, kde c a (φ 1,...,φ p ) jsou libovolné konstanty. Tato časová řada se nazývá autoregresní proces p-tého řádu a značí se AR(p). AR(p) proces se často zapisuje pomocí operátoru zpětného posunutí L: φ(l)y t c = ǫ t, kde φ(l) značí polynom p φ(l) = 1 φ j L j. j=1
15 KAPITOLA 1. ZÁKLADNÍ DEFINICE 8 Proces AR(p) je stacionární, pokud splňuje tzv. podmínku stacionarity: Pokud všechny kořeny charakteristického polynomu φ(z) = 1 p j=1 φ jz j (pro z C) leží vně jednotkového kruhu, tj. pokud pro z C taková, že φ(z) = 0, platí: z > 1, pak existuje jednoznačně určený náhodný proces, který splňuje danou AR(p) rovnici. Tento proces je stacionární a navíc kauzální, tj. existuje jeho MA( ) reprezentace: kde ψ(l) = φ(l) 1. Y t = µ + ψ(l)ǫ t = µ + ψ j ǫ t j, Můžeme si všimnout, že požadavek kladený na koeficient φ AR(1) procesu je totožný s podmínkou stacionarity. Základní vlastnosti stacionárního AR(p) procesu jsou následující: j=0 E(Y t ) = µ = c 1 p j=1 φ j = c φ(1) pro t γ(h) = { p j=1 φ jγ(h j), h > 0 p j=1 φ jγ(j) + σ 2, h = 0 Stacionární AR(p) proces je vždy také ergodický podle středu. 1.5 Smíšené autoregresní procesy klouzavých součtů ARMA(p, q) proces Definice 1.12: Necht je {ǫ t } bílý šum. Uvažujme proces Y t = c + φ 1 Y t φ p Y t p + ǫ t + θ 1 ǫ t θ q ǫ t q, kde c, (φ 1,...,φ p ) a (θ 1,...,θ q ) jsou libovolné konstanty. Tato časová řada se nazývá autoregresní proces klouzavých součtů řádu p, q a značí se ARMA(p, q). Z definice je vidět, že se ARMA(p, q) proces skládá z autoregresní části a z části klouzavých součtů. Pomocí operátoru zpětného posunutí má následující tvar: φ(l)y t = c + θ(l)ǫ t, kde p φ(l) = 1 φ j L j, j=1
16 KAPITOLA 1. ZÁKLADNÍ DEFINICE 9 a θ 0 = 1. Platí: q θ(l) = θ j L j j=0 ARMA(p, 0) = AR(p), p 1, ARMA(0, q) = MA(q), q 0. ARMA(p, q) proces je stacionární, když je splněna podmínka stacionarity pro autoregresní část. Pokud tedy platí, že všechny kořeny charakteristického polynomu p φ(z) = 1 φ j z j = 0 j=1 leží vně jednotkového kruhu, existuje jednoznačně určený náhodný proces, který splňuje danou ARMA(p, q) rovnici. Tento proces je stacionární a navíc kauzální, tj. existuje jeho MA( ) reprezentace. Základní vlastnosti stacionárního ARMA(p, q) procesu jsou následující: E(Y t ) = µ = c 1 p j=1 φ j = c φ(1) pro t γ(h) = { p j=1 φ jγ(h j), h > q p j=1 φ jγ(h j) + σ 2 q k=h θ kψ k h, 0 h q, kde ψ j jsou koeficienty z MA( ) reprezentace ARMA(p, q) procesu.
17 Kapitola 2 Nestacionární procesy V minulé kapitole jsme uvažovali procesy stacionární a ergodické podle středu, tj. náš požadavek byl, aby 1. střední hodnota procesu Y t, t Z byla nezávislá na čase: E(Y t ) = µ 2. předpověd procesu konvergovala ke střední hodnotě procesu: lim Ŷ t+s t = lim Ê(Y t+s Y t, Y t 1,...) = µ. s s Tyto požadavky jsou ale pro mnoho ekonomických a finančních časových řad nerealistické. Existují dva důvody pro nestacionaritu řad: nestálá střední hodnota kvůli deterministickému trendu, sezónním komponentám či zlomům v deterministických trendech tyto řady se pak nazývají deterministicky nestacionární; jednotkový kořen v AR-polynomu pak se jedná o stochasticky nestacionární řady. V této kapitole se budeme věnovat právě těmto nestacionárním procesům a doplníme výčet používaných procesů o ARIMA a sezónní ARIMA (SARIMA) procesy. 10
18 KAPITOLA 2. NESTACIONÁRNÍ PROCESY Procesy s deterministickým trendem Příkladem procesu s deterministickým trendem je následující proces vycházející z MA( ) reprezentace: Y t = c + βt + ψ(l)ǫ t, kde {ǫ t } je bílý šum a ψ(l) je definován v předchozí kapitole. Někdy se takovým procesům říká trendově stacionární, protože po odečtení trendu βt získáme klasický MA( ) proces, který je vždy stacionární. Samozřejmě musí i zde být splněna podmínka: j=0 ψ j 2 <. Nejjednodušším případem je proces, kde ψ(l) = 1: ǫ t WN(0, σ 2 ), t = 1,...,T. Y t = c + βt + ǫ t, Takto dostáváme vlastně klasický lineární regresní model s maticí regresorů X =.. 1 T a s neznámými parametry c a β, které lze odhadnout pomocí metody nejmenších čtverců. Dalším příkladem je stacionární ARMA(p, q) proces kolem deterministického trendu: Y t = c + βt + φ 1 Y t φ p Y t p + ǫ t + + θ q ǫ t q, kde ǫ t WN(0, σ 2 ). Pomocí operátoru zpětného posunutí pak vypadá takto: Pro stacionaritu musí platit: φ(l)y t = c + βt + θ(l)ǫ t. φ(z) 0 pro z : z 1. Tento proces se po několika úpravách dá také zapsat jako součet deterministického lineárního trendu a ARMA(p, q) procesu X t s nulovou střední hodnotou: Y t = µ 0 + µ 1 t + X t, kde µ 0 = c φ(1) κ,
19 KAPITOLA 2. NESTACIONÁRNÍ PROCESY 12 a je stacionární proces s E(X t ) = 0. µ 1 = β φ(1), κ = β p j=1 jφ j φ(1) 2 X t = φ 1 (L)θ(L)ǫ t S takto upraveným procesem je nadále výhodnější pracovat, nebot platí: E(Y t ) = µ 0 + µ 1 t. Uved me ještě několik příkladů, jak je možné deterministickou složku trendu rozšířit. Uvažujme proces Y t = d t + X t, kde d t znázorňuje deterministickou složku a X t stacionární ARMA(p, q) proces s nulovou střední hodnotou. Platí: d t = µ 0 + µ 1 t + b t, kde b t značí rozšiřující zlomovou funkci ( break function ). Následují příklady takové zlomové funkce, se kterou je možné se v praxi setkat: { ω t = m b t = 0 jinak odlehlé pozorování v bodě t = m { ω t m b t = 0 jinak posunutí úrovně { ω(t m) t m b t = 0 jinak změna v trendu
20 KAPITOLA 2. NESTACIONÁRNÍ PROCESY Procesy se stochastickým trendem Jednotkové kořeny Definice 2.1: Necht je {Y t, t Z} AR(p) proces: Y t = c + p φ j Y t j + ǫ t, j=1 φ(l)y t = c + ǫ t, kde ǫ t WN(0, σ 2 ). Proces Y t nazveme procesem s jednotkovým kořenem, pokud platí: p φ(z) = 1 φ j z j = 0 pro z 1 = 1 a z i > 1, i = 2,..., p. Kořen z 1 se nazývá jednotkovým kořenem polynomu φ(z). Pak také platí: kde φ (L) je AR(p 1) - polynom Jednoduché příklady j=1 φ(l) = (1 L)φ (L), 1. Nejjednodušším příkladem procesu s jednotkovým kořenem je proces, kde p = 1 a φ 1 = 1: Y t = Y t 1 + ǫ t. Tento proces se nazývá náhodná procházka, anglicky random walk. Pokud použijeme rekurzi, dostaneme zápis ve tvaru Y t = Y 0 + t ǫ j. Pokud proces začal v čase t = 0 s počáteční hodnotou Y 0 = 0, vychází nám j=1 Y t = t ǫ j. j=1 Náhodná procházka je nestacionární proces, nebot obsahuje stochastický trend t j=1 ǫ j. Z tohoto zápisu je vidět, že každá inovace ǫ t má trvalý vliv na hodnotu procesu. Tato vlastnost je typická pro procesy se stochastickým trendem.
21 KAPITOLA 2. NESTACIONÁRNÍ PROCESY 14 Základní statistické vlastnosti náhodné procházky jsou následující: střední hodnota: E(Y t ) = 0 rozptyl: V ar(y t ) = tσ 2 tj. závisí na čase autokovarianční funkce: γ(t, t h) = (t h)σ 2 také závisí na čase a platí, že γ(t, t h), když (t h) a h/t c < 1. Z těchto vlastností je vidět, že Y t a Y t h jsou silně korelované, i když je h vysoké (tj. časový rozdíl mezi oběma veličinami je značný). 2. Dalším často používaným příkladem je tzv. modifikovaná náhodná procházka. Je založená na tom, že k původní náhodné procházce přičteme konstantu: Y t = µ + Y t 1 + ǫ t. Stále platí, že ǫ t WN(0, σ 2 ). Pokud i nadále předpokládáme, že proces začal v čase t = 0 s počáteční hodnotou Y 0 = 0, lze ho vyjádřit jako Y t = µt + t ǫ j. Kromě stochastického trendu tedy tento proces obsahuje i deterministický trend µt. Základní statistické vlastnosti modifikované náhodné procházky jsou následující: střední hodnota: E(Y t ) = µt j=1 oproti minulému příkladu tedy nepodmíněná střední hodnota závisí na čase rozptyl a autokovarianční funkce: zůstávají stejné I když modifikovaná náhodná procházka obsahuje deterministický trend, nemůžeme s ní zacházet jako s procesem s deterministickým trendem, protože odečtením tohoto trendu nedostaneme stacionární proces. Proto je potřeba pro tento druh procesů vyvinout jinou koncepci jejich stacionarizace.
22 KAPITOLA 2. NESTACIONÁRNÍ PROCESY Integrované procesy Definice 2.2: Proces s jedním jednotkovým kořenem v AR-polynomu se nazývá integrovaný proces řádu jedna a značí se Y t I(1). Proces bez jednotkového kořene v AR-polynomu (tj. stacionární proces) se značí Y t I(0). Náhodná procházka i modifikovaná náhodná procházka jsou tedy integrované procesy řádu jedna. Takové procesy lze stacionarizovat jejich první diferencí. Platí: Y t I(1) Y t I(0), kde Y t = Y t Y t 1. Definujme obecně k-tou diferenci procesu jako k Y t = (1 L) k Y t. Platí, že k Y t = k 1 ( Y t ). Je zřejmé, že Y t = Y t Y t 1 a 2 Y t = Y t 2Y t 1 + Y t 2 = (1 L) 2 Y t. Definice 2.3: Proces {Y t, t Z} se nazývá integrovaným procesem d-tého řádu, pokud d Y t I(0) a d 1 Y t I(1), tj. AR-polynom má d jednotkových kořenů a po d-té diferenci se z něj stane stacionární proces. Platí, že pokud je Y t I(0), pak je i Y t I(0). Časové řady generované procesy I(d) se označují jako řady typu I(d) ARIMA(p, d, q) proces Zkratka ARIMA značí autoregresní integrovaný proces klouzavých součtů. Definice 2.4: Necht p, d, q N. Proces {Y t, t Z} nazveme ARIMA(p, d, q) procesem, pokud X t = d Y t = (1 L) d Y t je stacionární ARMA(p, q) proces, kde d nazýváme integračním řádem procesu. Pokud je Y t ARIMA(p, d, q) proces, pak platí, že Y t I(d)
23 KAPITOLA 2. NESTACIONÁRNÍ PROCESY 16 a Y t splňuje: φ(l)y t = φ (L)(1 L) d Y t = φ (L)X t = c + θ(l)ǫ t, kde ǫ t WN(0, σ 2 ), φ (z) je polynom řádu p, θ(z) je polynom řádu q, φ (z) 0 pro z : z 1, φ(z) má kořen 1 řádu d. Proces {Y t } je stacionární právě tehdy, když d = 0. Platí: ARIMA(p, 0, q) = ARMA(p, q). Poznamenejme, že pokud d 1, můžeme k ARIMA(p, d, q) procesu přidat polynomiální trend až do řádu (d 1) bez ohrožení stacionarity ARMA procesu po d-té diferenci. Je zřejmé, že náhodná procházka je ARIMA(0, 1, 0) proces. Nyní rozšiřme tuto koncepci integrovaných procesů o sezónní složku SARIMA(p, d, q) (P, D, Q) s proces Nejprve si definujeme sezónní ARMA proces. Definice 2.5: Necht p, q, P, Q, s N. Necht s označuje délku jedné periody (sezóny). Proces {Y t, t Z} nazveme SARMA(p, q) (P, Q) s procesem, pokud φ(l)φ(l s )Y t = c + θ(l)θ(l s )ǫ t, kde ǫ t WN(0, σ 2 ) a q θ(z) = θ j z j, j=0 p φ(z) = 1 φ j z j, j=1 Θ(z) = Q Θ j z j, j=0
24 KAPITOLA 2. NESTACIONÁRNÍ PROCESY 17 s θ 0 = 1 a Θ 0 = 1. P Φ(z) = 1 Φ j z j, j=1 Měli bychom také pro jednoznačnost zápisu předpokládat, že φ(z), Φ(z), θ(z) a Θ(z) nemají společné kořeny. Ty by se totiž pak mohly vykrátit a tím by se snížily hodnoty p, P, q a Q. Aby byl SARMA(p, q) (P, Q) s proces stacionární, musí platit, že všechny kořeny polynomů φ(z) a Φ(z) leží vně jednotkového kruhu. Dá se snadno dokázat, že každý SARMA(p, q) (P, Q) s proces může být zapsaný jako ARMA(p + P s, q + Qs) proces s určitými omezujícími podmínkami na parametry. Nyní proces SARMA zevšeobecníme a dovolíme polynomům φ(z) a Φ(z) mít jednotkové kořeny. Definice 2.6: Necht p, d, q, P, D, Q, s N. Necht s označuje délku jedné periody (sezóny). Proces {Y t, t Z} nazveme SARIMA(p, d, q) (P, D, Q) s procesem, pokud X t = d D s Y t = (1 L) d (1 L s ) D Y t je stacionární SARMA(p, q) (P, Q) s proces. Platí: φ (L)Φ (L s )X t = c + θ(l)θ(l s )ǫ t, kde ǫ t WN(0, σ 2 ) a q θ(z) = θ j z j, j=0 p φ (z) = 1 φ j zj, j=1 Θ(z) = Q Θ j z j, j=0 s θ 0 = 1 a Θ 0 = 1. P Φ (z) = 1 Φ j zj, j=1
25 Kapitola 3 Zdánlivá regrese V této kapitole bude naší snahou vysvětlit problémy, které mohou nastat při modelování vztahů mezi více časovými řadami. Jelikož se v praxi téměř nesetkáme s I(0) řadami, zaměříme se na častější skupinu I(1) řad. V první části se budeme věnovat některým dalším vlastnostem I(0) a I(1) procesů, a to právě v souvislosti s modelováním jejich vztahů. Dále si vysvětlíme pojem ekvilibria, které chceme modelováním vystihnout. Hlavní částí této kapitoly však bude zdánlivá regrese, jak ji poprvé vystihli Granger a Newbold (1974). 3.1 Vlastnosti I(0) a I(1) procesů Při modelování vztahů více časových řad musíme brát ohled na řády jejich integrace, protože platí následující jednoduchá pravidla. Necht a, b R: 1. jestliže {y t } I(0), potom {a + by t } I(0), 2. jestliže {y t } I(1), potom {a + by t } I(1), 3. jestliže {y t } I(0) a {z t } I(0), potom {ay t + bz t } I(0), 4. jestliže {y t } I(1) a {z t } I(0), potom {ay t + bz t } I(1), 5. obecně platí, že jestliže {y t } I(1) a {z t } I(1), potom {ay t +bz t } I(1). Pokud existuje takové a, b R, že {y t } I(1), {z t } I(1) a současně {ay t + bz t } I(0), pak jsou řady {y t } a {z t } kointegrované. O kointegraci časových řad se blíže zmíníme ve 4. kapitole této práce. 18
26 KAPITOLA 3. ZDÁNLIVÁ REGRESE Ekvilibrium Při modelování vícerozměrných ekonomických časových řad je potřeba rozlišovat mezi krátkodobými ( short-run ) a dlouhodobými vztahy ( long-run relationships ). Krátkodobé vztahy většinou vyvstanou po nějakém šoku, kterému je ekonomika vystavena, a zpravidla po určité době odeznívají. Oproti tomu dlouhodobé vztahy s časem nemizí, vyjadřují jistou stabilitu ekonomického systému. Toto velmi úzce souvisí s pojmem ekvilibria. Můžeme si ho představit jako určitý stav, ke kterému je systém stále přitahován. Nadále budeme předpokládat, že se jedná o stabilní ekvilibrium, tj. neměnící se v čase. Obecně ho lze vyjádřit jako funkci n proměnných f(x 1,...,x n ) = 0. Jelikož je však každý ekonomický systém stále vystaven šokům, nemůže nikdy v ekvilibriu permanentně setrvat. Proto budeme uvažovat dlouhodobé ekvilibrium, tj. ekvilibrium, ke kterému systém konverguje v čase. 3.3 Durbin-Watsonův test V dalším textu bude potřeba znát Durbin-Watsonův test autokorelovanosti reziduí. Uvažujme lineární model Y t = X t β + ǫ t, (3.1) kde pro chybu ǫ platí: ǫ t = ρǫ t 1 + v t. (3.2) Chyby v t jsou nekorelované, platí {v t } WN(0, σ 2 v ). Je zřejmé, že chybový vektor {ǫ t } je uvažován jako řada typu AR(1). Aby byl stacionární, musí pro koeficient autokorelace ρ platit, že ρ < 1. Durbin-Watsonův test testuje hypotézu autokorelace reziduí prvního řádu, kde H 0 : ρ = 0, a jako testovou statistiku uvažujeme statistiku DW: DW = T t=2 (ˆǫ t ˆǫ t 1 ) 2 T t=1 ˆǫ t 2, (3.3) kde ˆǫ t značí reziduum modelu (3.1). Statistiku DW lze také pomocí vektorů zapsat ve tvaru DW = ˆǫ Aˆǫ ˆǫ ˆǫ,
27 KAPITOLA 3. ZDÁNLIVÁ REGRESE 20 kde ˆǫ značí vektor všech reziduí ˆǫ t a A = Pro Durbin-Watsonovu statistiku platí: 0 < DW < 4, DW 2 nekorelovanost reziduí, DW > 2 negativní korelovanost reziduí (ρ < 0), DW < 2 pozitivní korelovanost reziduí (ρ > 0). DW statistiku můžeme po několika matematických úpravách zapsat pomocí odhadu metodou nejmenších čtverců ˆρ z rovnice (3.2) jako DW = 2 γ 1 2γ 2ˆρ, kde γ 1 = ˆǫ2 1 + ˆǫ 2 T T, t=1 ˆǫ2 t γ 2 = T t=2 ˆǫ2 t 1 T, t=1 ˆǫ2 t ˆρ = T t=2 ˆǫ tˆǫ t 1 T. t=2 ˆǫ2 t 1 Pro vysokou hodnotu T platí: γ 1 0, γ 2 1, a tudíž DW ˆρ 2 2ˆρ, 1 1DW. 2 Jelikož ale DW stále závisí na matici vysvětlujících proměnných X, Durbin a Watson získali pomocí metody Monte Carlo pravděpodobnostní rozdělení jiných dvou statistik DW L a DW U, které nejsou závislé na X a které ohraničují DW: DW L < DW < DW U. Pro tyto statistiky jsou kritické hodnoty DW L a DW U tabelovány.
28 KAPITOLA 3. ZDÁNLIVÁ REGRESE Zdánlivá regrese: Granger & Newbold Při modelování a odhadování rovnovážného stavu (ekvilibria) se v praxi často uplatňuje klasická regresní analýza. Základním předpokladem pro asymptotickou teorii odhadů metodou nejmenších čtverců je stacionarita a vzájemná nezávislost vysvětlující i vysvětlované proměnné. Někdy však statistici možnost závislosti či nestacionarity neprověří a z analýzy pak získávají nesprávné výsledky. Na tento již dříve známý problém upozornili svým článkem Granger a Newbold (1974), kteří ukázali nejjednodušší příklad zdánlivé regrese u odhadování závislosti mezi dvěma nezávislými náhodnými procházkami. Tento článek se stal velice slavným a často citovaným. Uvažujme dvě časové řady: y t = y t 1 + ǫ 1t, (3.4) x t = x t 1 + ǫ 2t, (3.5) kde {ǫ 1t } IWN(0, σ 2 1) a {ǫ 2t } IWN(0, σ 2 2), obě řady {ǫ 1t } a {ǫ 2t } jsou nezávisle stejně rozdělené (i.i.d. = identicaly independent distributed). Z definice bílého šumu je zřejmé, že jsou i obě řady (3.4) a (3.5) navzájem nezávislé. Granger a Newbold se pokusili vyjádřit vztah mezi náhodnými procházkami jako regresi typu y t = β 0 + β 1 x t + u t. (3.6) U tohoto typu regresního modelu se parametry běžně odhadují metodou nejmenších čtverců, jak to učinili i výše zmínění autoři. Pro použití této metody je základním předpokladem nezávislost a nekorelovanost procesu {u t }, tj. {u t } musí být i.i.d., navíc nezávislého na procesu {x t }. Při testování signifikantnosti takto odhadnutých parametrů pomocí t-testu často vychází, že odhady jsou signifikantní na velmi vysoké hladině spolehlivosti, tj. často je zamítána hypotéza o nulové hodnotě parametrů β 0 a především β 1. Také vysoká hodnota koeficientu determinace (statistika R 2 ) ukazuje, že model je odhadnutými parametry dobře vystižen. Jediný problém tedy nastal u Durbin-Watsononvy statistiky, která testuje autokorelovanost reziduí odhadnutého modelu. Zde, zatím bez ohledu na známost nezávislosti vysvětlující a vysvětlované proměnné, by bylo logické předpokládat, že pokud je vztah mezi y t a x t odhadnutým modelem dobře vystižen, neměla by se autokorelovanost reziduí prokázat, což ale neodpovídá výsledkům testů. Hodnota DW statistiky totiž autorům vyšla jako velice nízká (blízká 0), což poukazuje na velký problém s předpokladem nezávislosti reziduí. Jelikož je však od začátku znám fakt nezávislosti vysvětlované a vysvětlující proměnné, je namístě předpokládat, že celý regresní model (3.6) nemůže být smysluplný a že pomocí klasického t-testu bude potvrzena hypotéza nulovosti
29 KAPITOLA 3. ZDÁNLIVÁ REGRESE 22 koeficientů β 0 a β 1. Toto je ale v rozporu s dosaženými výsledky. Z tvrzení v kapitole 3.1 také víme, že když jsou obě řady {y t } a {x t } náhodné procházky, tedy I(1) řady, měla by být jejich lineární kombinace {u t } ve většině případů také I(1). Z DW statistiky plyne, že je nesplněn základní požadavek na použití metody nejmenších čtverců, tedy stacionarita reziduí modelu, což při odhadování parametru β 1 vede ke zdánlivé regresi. Granger a Newbold ve svém článku navrhli, aby nerovnost R 2 > DW (3.7) byla považována za znamení zdánlivé regrese modelu, nebot tento vztah může znamenat, že rezidua mají nestacionární charakter Příklad V této části práce se pokusíme po vzoru Grangera a Newbolda nasimulovat dvě nezávislé náhodné procházky a ukážeme, jak se zdánlivá regrese projevuje v praxi. Pro simulaci použijeme statistický program R, výsledky uvedené v textu najdeme v tabulce 3.1. Na základě procesů (3.4) a (3.5) generujeme časové řady y t a x t, chybové vektory {ǫ 1t } a {ǫ 2t } bereme z normovaného normálního rozdělení, tedy σ 2 1 = σ2 2 = 1 a ǫ 1t N(0, 1), ǫ 2t N(0, 1). Časové řady y t a x t mají délku 150 hodnot a jsou zachycené na obrázku 3.1. Protože jsou časové řady generovány podle procesů (3.4) a (3.5), jsou navzájem nezávislé a nestacionární. Již z pohledu na obrázek je zřejmé, že obě vykazují trend a že v jejich průběhu můžeme vysledovat jisté podobnosti. Pomocí metody nejmenších čtverců odhadneme model jejich závislosti jako y t = 2, , 57520x t. (3.8) Na základě t-testů jednotlivých parametrů zjistíme, že oba parametry jsou statisticky významné (dokonce na 1% hladině významnosti). Pomocí F-testu také zjistíme, že celkový model je vhodný k modelování závislosti mezi našimi dvěma řadami (opět na 1% hladině významnosti). Koeficient determinace R 2 je 0, Durbin-Watsonův test vykazuje silnou míru autokorelace reziduí modelu: DW = 0, Protože platí, že koeficient determinace je vyšší než DW statistika (R 2 > DW), můžeme konstatovat, že mezi řadami je vztah zvaný zdánlivá regrese. To je vidět i z obrázku 3.2, na kterém jsou vyznačena rezidua modelu (3.8). Je zřejmé, že tato časová řada není stacionární.
30 KAPITOLA 3. ZDÁNLIVÁ REGRESE Obrázek 3.1: Vygenerované náhodné procházky 3.5 Zdánlivá regrese obecně Uvažujme nyní regresi ve tvaru y t = x t β + u t, (3.9) kde veličiny y t a x t mohou být nestacionární. Pokud neexistuje žádná hodnota parametru β, pro kterou by rezidua u t = x t β y t byla I(0), je velice pravděpodobné, že metodou nejmenších čtverců budou vycházet podezřelé výsledky. Tyto výsledky analyticky vysvětlil ve svém článku Phillips (1986). Odvodil asymptotickou teorii regrese, která je aplikovatelná na obecně integrované procesy, což objasňuje i poznatky Grangera a Newbolda. Nyní shrneme základní fakta, která z jeho studie vyplývají. Předpokládejme tedy, že máme regresi typu (3.6), kde ale na chybové vektory ǫ 1t a ǫ 2t ze (3.4) a (3.5) klademe daleko slabší požadavky než v kapitole 3.4. Tyto požadavky (matematicky vyjádřené v článku Phillips (1986) jako Předpoklad 1) dovolují chybovým vektorům být obecně integrovanými procesy (řádu jedna), jejichž diference mohou být závislé a heterogenně rozdělené. Na základě těchto předpokladů Phillips odvodil následující: 1. Obvyklé t-statistiky odhadů parametrů β 0 a β 1 (t β0 a t β1 ), které jsou používané k posouzení signifikantnosti koeficientů v regresní analýze, nemají
31 KAPITOLA 3. ZDÁNLIVÁ REGRESE 24 Call: lm(formula = y x) R esiduals: Min 1Q Median 3Q Max C oefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-15 *** x < 2e-16 *** Signif. codes: 0 *** ** 0.01 * Residual standard error: on 148 degrees of freedom Multiple R-Squared: , Adjusted R-squared: F-statistic: on 1 and 148 DF, p-value: < 2.2e-16 Tabulka 3.1: Model pro závislost dvou náhodných procházek - výstup z R v tomto případě limitní rozdělení. Navíc rozdělení t β0 a t β1 divergují s T, takže neexistují asymptoticky správné kritické hodnoty pro tyto obvyklé testy signifikance. Je zřejmé, že pro jakoukoliv kritickou hodnotu poměr zamítnutí nulové hypotézy β 1 = 0 roste s rostoucím počtem pozorování. 2. Na rozdíl od běžných výsledků regresní teorie koeficienty ˆβ 0 a ˆβ 1 nekonvergují v pravděpodobnosti s rostoucím T ke konstantám. Konkrétně ˆβ 1 má nedegenerované limitní rozdělení při T a rozdělení ˆβ0 diverguje při T. Tento rozdíl oproti běžné regresní teorii vyvstane ještě zřetelněji, pokud vezmeme za x t a y t dva nezávislé stacionární autoregresní procesy. Pak oba parametry ˆβ 0 i ˆβ1 konvergují dle očekávání v pravděpodobnosti k nule. 3. Durbin-Watsonova statistika konverguje v pravděpodobnosti k nule, zatímco pokud spolu řady x t a y t skutečně souvisí, konverguje k nenulové hodnotě. Tím je vysvětleno chování DW, které odhalili Granger a Newbold, a je teorií ospravedlněné, že tuto statistiku můžeme použít k rozpoznání zdánlivé regrese. 4. Koeficient determinace R 2 má nedegenerované limitní rozdělení při T. Všechny tyto výsledky se odlišují od konvenční regresní teorie stacionárních procesů. Důvodem k těmto charakteristickým vlastnostem je fakt, že procesy x t a y t nejsou ergodické. Ve skutečnosti jejich výběrové momenty a sdružené výběrové momenty nekonvergují ke konstantám, jak tomu je u ergodických procesů. Základní důkaz konzistence odhadů získaných metodou nejmenších čtverců vychází z předpokladu, že plim(1/t)(x X) = Q, kde X je matice dat a Q je pevná matice. Tento předpoklad však v našem případě splněn není. Navíc víme, že problém zdánlivé regrese není možné vyřešit větším počtem pozorování. S rostoucím T se vše naopak zhoršuje.
32 KAPITOLA 3. ZDÁNLIVÁ REGRESE Obrázek 3.2: Rezidua modelu (3.8) Když budeme chtít výše uvedené výsledky rozšířit na vícerozměrný model, tj. budeme jako základní uvažovat model typu (3.9), dojdeme ke stejným výsledkům jako při hledání souvislosti mezi dvěma nezávislými náhodnými procházkami. Je potřeba ještě dodat, že i F-test pro testování signifikance modelu (3.9) diverguje s rostoucím T. Navíc pokud jsou y t a x t obecně korelované časové řady, došel Phillips ke stejným výsledkům, což znamená, že se tedy nemusíme v této teorii zabývat pouze nezávislými časovými řadami. 3.6 Léky zdánlivé regrese Z výše uvedeného je zřejmé, že zdrojem existence zdánlivé regrese je přítomnost stochastických trendů v generujících procesech časových řad obsažených v regresním modelu. Existují dva jednoduché způsoby, kterými můžeme problémům spojeným se zdánlivou regresí zabránit. Prvním přístupem je přidat do modelu časově zpožděné hodnoty závislé i nezávislé proměnné. Uvažujme například následující model jako alternativu k modelu (3.6): y t = β 0 + αy t 1 + β 1 x t + γx t 1 + u t. (3.10) Lze dokázat, že metoda nejmenších čtverců poskytuje konzistentní odhady všech parametrů tohoto modelu (3.10). Každý z koeficientů ˆβ 1 a ˆγ konverguje ke gaussov-
33 KAPITOLA 3. ZDÁNLIVÁ REGRESE 26 skému rozdělení a t-testy hypotéz, že β 1 = 0 a γ = 0, jsou asymptoticky normální. Přesto F-test sdružené nulové hypotézy, že oba koeficienty β 1 i γ jsou nulové, má nestandardní limitní rozdělení. Proto zahrnutí zpožděných proměnných do modelu vyřeší mnoho problémů, avšak ne všechny. Druhou metodou je všechna data před odhadováním vztahu diferencovat. Pak získáme místo modelu (3.6) model následující: y t = β 0 + β 1 x t + u t. (3.11) Protože je zřejmé, že v tomto případě jsou vysvětlující i vysvětlovaná proměnná stacionární, tedy I(0), je i chybový vektor u t stacionární časovou řadou. Potom se jedná o běžný typ regrese, odhady ˆβ 0 a ˆβ 1 jsou konzistentní a konvergují ke gaussovským proměnným. Všechny t a F testy založené na modelu (3.11) mají obvyklá limitní rozdělení. Jelikož se model (3.11) vyhýbá problémům se zdánlivou regresí stejně tak jako nestandardním rozdělením určitých hypotéz spojných s úrovňovým modelem (3.6), mnoho analytiků doporučuje rutinně diferencovat zjevně nestacionární řady ještě před odhadováním vzájemné závislosti. Přestože se tento způsob zdá být ideálním, existují dvě rozdílné situace, ve kterých by rutinní diferencování bylo nevhodné. Nejprve uvažujme situaci, kdy hodnota α v modelu (3.10) je rovna spíše například 0, 9 než 1, tj. data jsou skutečně stacionární. Potom by diferenciace jako v modelu (3.11) vedla ke špatně specifikované regresi. Ve druhé situaci uvažujeme takovou regresi, kde i když obě řady y t a x t jsou skutečně I(1) procesy, chybový vektor u t je stacionární I(0) řada. Této zajímavé třídě řad se říká kointegrované řady a budeme se jim částečně věnovat v následující kapitole.
34 Kapitola 4 Rozpoznání zdánlivé regrese Jak už bylo řečeno v minulé kapitole, zdrojem zdánlivé regrese je přítomnost stochastických trendů v generujících procesech časových řad obsažených v regresním modelu. To znamená, že tento problém nastává, pokud jsou procesy integrované minimálně řádem jedna. Avšak i u těchto procesů dochází k situaci, kdy regrese mezi nimi nemusí být nutně zdánlivá, a to tehdy, pokud chybový vektor u t, tedy lineární kombinace nestacionárních procesů, je sám stacionární. V takovém případě nazýváme procesy kointegrovanými. Můžeme tedy prohlásit, že ke zdánlivé regresi nedochází, pokud jsou integrované procesy v regresním modelu kointegrované. Z tohoto důvodu si v této kapitole povíme něco o kointegrovaných procesech a o testování kointegrace, která nám zajišt uje nepřítomnost zdánlivé regrese. 4.1 Kointegrace Příklad Uved me nejprve příklad kointegrovaných časových řad převzatý z knihy Hamilton (1994). Uvažujme jednoduchý systém dvou časových řad y t = γx t + u 1t (4.1) x t = x t 1 + u 2t, (4.2) kde u 1t a u 2t jsou nekorelované procesy bílého šumu. Z reprezentace x t vidíme, že se jedná o náhodnou procházku a z rovnice (4.1) diferencováním získáme x t = u 2t, (4.3) y t = γ x t + u 1t = γu 2t + u 1t u 1,t 1. (4.4) 27
35 KAPITOLA 4. ROZPOZNÁNÍ ZDÁNLIVÉ REGRESE 28 Vidíme, že na pravé straně rovnice (4.4) se nachází lineární kombinace I(0) procesů, a jak již bylo uvedeno v kapitole 3.1, taková kombinace je také sama I(0) procesem. Nebot x t je I(1) proces, platí, že y t je lineární kombinací I(1) a I(0) procesů; navíc z rovnice (4.4) víme, že se po první diferenci stává sám I(0) procesem. Můžeme tedy konstatovat, že y t je také I(1) proces. Z rovnice (4.1) je vidět, že lineární kombinace obou procesů (y t γx t ) je definovaná jako stacionární časová řada, tedy řada typu I(0). O tomto případu jsme již dříve hovořili jako o příkladu kointegrace. Řekneme tedy, že řady y t a x t jsou kointegrované, a vektor (1, γ) nazveme kointegračním vektorem. Na obrázku 4.1 jsou zakresleny vygenerované časové řady y t a x t podle modelu (4.1) a (4.2), kde γ = 1 a u 1t a u 2t jsou dvě nezávislé N(0, 1) proměnné. Poznamenejme, že je z obrázku vidět, že se obě řady y t a x t mohou libovolně daleko vzdálit od počáteční hodnoty, avšak od sebe navzájem se vzdálí vždy maximálně jen do pevně dané vzdálenosti. Tomuto vztahu pak říkáme také dlouhodobé ekvilibrium (viz kapitola 3.2) Obrázek 4.1: Model kointegrace Definice Uved me nyní obecnou definici, jak tento vztah kointegrace ve své práci uveřejnili Engle a Granger (1987). Pro dva procesy ji lze vyjádřit následujícím způsobem:
36 KAPITOLA 4. ROZPOZNÁNÍ ZDÁNLIVÉ REGRESE 29 Definice 4.1: Procesy {x t } a {y t } se nazývají kointegrované řádu d, b a označují se {x t }, {y t } CI(d, b), pokud: a) oba jsou typu I(d), b) existuje lineární kombinace {ax t + cy t } I(d b), kde b > 0. Vektor (a, c) se nazývá kointegrační vektor. Definici lze zobecnit na množinu N proměnných: Definice 4.2: Komponenty vektoru y t se nazývají kointegrované řádu d, b (y t CI(d, b)), pokud: a) všechny komponenty jsou typu I(d), b) existuje vektor α (α 0) takový, že z t = α y t I(d b), b > 0. Vektor α se nazývá kointegrační vektor. V empirické ekonometrii je nejzajímavější případ, kdy d = b, tj. kdy kointegrační vektor vede ke stacionární lineární kombinaci. Vztah popisuje dlouhodobé ekvilibrium a výraz α y t = 0 (4.5) α y t = z t (4.6) představuje odchylku od dlouhodobého ekvilibria, a proto se nazývá chyba ekvilibria. Všeobecně mezi N procesy může existovat maximálně N 1 kointegračních vektorů. V případě dvou procesů může existovat pouze jeden kointegrační vektor, tedy jen jedna lineární kombinace, která je stacionární. V případě dvou I(1) procesů lze dlouhodobé ekvilibrium zapsat ve tvaru y t = β 0 + β 1 x t (4.7) a kointegrační vektor se tudíž rovná (1, β 1 ). Je vidět, že vyjádření kointegračního vektoru není jednoznačné, protože po vynásobení obou stran rovnice (4.6) stejným nenulovým číslem nám rovnost zůstane zachována.
37 KAPITOLA 4. ROZPOZNÁNÍ ZDÁNLIVÉ REGRESE Testy jednotkového kořene a stacionarity Před tím, než se začneme věnovat samotným testům kointegrace, je třeba zjistit, jakého typu jsou analyzované časové řady. Jelikož se zde zabýváme integrovanými řadami, potřebujeme vědět, jakého řádu jejich integrace je, tj. kolik má řada jednotkových kořenů. Prvním krokem v analýze časové řady bývá prozkoumání jejího grafu a subjektivní posouzení jeho tvaru. Většinou tímto postupem můžeme zjistit, zda je daná časová řada stacionární, či zda ji k její stacionarizaci potřebujeme jednou nebo vícekrát diferencovat. Dalším krokem pak je posouzení tvaru autokorelační funkce analyzované řady. Je-li první hodnota této funkce blízká jedné a ostatní hodnoty se zmenšují jen velmi pomalu, lze očekávat, že daná řada nebude stacionární. Toto je ovšem také jen subjektivní metoda. I když výše zmíněné subjektivní metody mohou často pomoci ke konkrétní představě o tvaru analyzované řady, většinou nám poradí pouze v tom, zda je daná řada stacionární či nikoliv. Proto musíme na tomto místě použít přesné statistické metody ke zjištění, zda naše časová řada obsahuje jednotkový kořen (tedy i stochastický trend). Existují dva druhy statistických testů: jedna skupina je založena na testování nulové hypotézy o existenci jednotkového kořene, zatímco druhá testuje nulovou hypotézu stacionarity generujícího procesu. Podrobněji se budeme zbývat první skupinou testů Testy jednotkového kořene Dickey-Fullerův test Nejznámější test se jmenuje podle svých autorů Dickey-Fullerův test a zkráceně se často označuje jako DF test. Tento test se používá pro rozlišení, zda je časová řada typu I(1) nebo I(0). Uvažujme jednoduchý AR(1) proces bez deterministického trendu y t = φy t 1 + ǫ t, (4.8) kde y 0 = 0, t = 1...T a {ǫ t } WN(0, σ 2 ǫ ). Při testování hypotézy H 0 : φ = φ 0 můžeme použít klasický t-test pouze v případě, že φ 0 < 0, tedy pokud je y t stacionární časová řada. Pak testové kritérium vypadá následovně: t = ˆφ φ 0, (4.9) Sˆφ kde Sˆφ je odhad směrodatné odchylky parametru φ definovaný jako s Sˆφ = 2 T, t=1 y2 t 1
38 KAPITOLA 4. ROZPOZNÁNÍ ZDÁNLIVÉ REGRESE 31 s 2 = RSS n 1 a ˆφ je odhad parametru pomocí metody nejmenších čtverců. Za platnosti nulové hypotézy má t statistika v malých výběrech přibližně rozdělení t s (T 1) stupni volnosti. Ovšem v případě testování jednotkového kořene H 0 : φ = 1 výše uvedené výsledky neplatí. Model (4.8) lze odečtením y t 1 od obou stran upravit následně: y t y t 1 = (φ 1)y t 1 + ǫ t y t = ρy t 1 + ǫ t, (4.10) kde ρ = φ 1. Potom testování toho, že φ = 1, je totéž jako testování ρ = 0. Naopak pokud je řada stacionární a φ < 1, platí také ρ < 0. Proto definujeme nulovou a alternativní hypotézu jako H 0 : ρ = 0 vs. H 1 : ρ < 0. Dickey a Fuller pak uvažovali t statistiku pro testování platnosti nulové hypotézy: t DF ρ = ˆρ Sˆρ, (4.11) kde ˆρ je odhad parametru ρ pomocí metody nejmenších čtverců v modelu (4.10) a Sˆρ je odhad směrodatné odchylky parametru ρ v modelu (4.10). Statistika t DF ρ má za platnosti nulové hypotézy takzvané Dickey-Fullerovo (DF) rozdělení, jehož kritické hodnoty byly tabelovány právě Dickeym a Fullerem v roce Dosud jsme uvažovali hypotézu o generujícím procesu jako náhodné procházce proti alternativní hypotéze AR(1) procesu s nulovou střední hodnotou. V časových řadách je však zajímavější zabývat se takovými procesy, ve kterých jsou navíc obsaženy další parametry jako konstanta a lineární trend. Dickey a Fuller tedy dále zkoumali procesy tvaru y t = α + ρy t 1 + ǫ t (4.12) y t = α + βt + ρy t 1 + ǫ t. (4.13) Pro oba procesy (4.12) a (4.13) je nulová hypotéza o existenci jednotkového kořene totožná: H 0 : ρ = 1. Jelikož se ale rozdělení testové statistiky pro tyto modely oproti modelu (4.10) změní, je nutné zavést rozlišující označení. Testová statistika modelu (4.12) se značí t DF,µ ρ, pro model (4.13) pak t DF,t ρ. Kritické hodnoty opět
REGRESNÍ ANALÝZA NESTACIONÁRNÍCH EKONOMICKÝCH ČASOVÝCH ŘAD
Politická ekonomie 45: (2), str. 281-289, VŠE Praha, 1997. ISSN 0032-3233. (Rukopis) REGRESNÍ ANALÝZA NESTACIONÁRNÍCH EKONOMICKÝCH ČASOVÝCH ŘAD Josef ARLT, Vysoká škola ekonomická, Praha 1. Úvod Pro modelování
Úvod do analýzy časových řad
Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2... } se nazývá stochastický
Časové řady, typy trendových funkcí a odhady trendů
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Stochastický proces Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2 } se nazývá stochastický proces
Časové řady, typy trendových funkcí a odhady trendů
Časové řady, typy trendových funkcí a odhady trendů Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Jiří Neubauer (Katedra ekonometrie UO Brno) Časové
Modely pro nestacionární časové řady
Modely pro nestacionární časové řady Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Modely pro nestacionární
Modely pro nestacionární časové řady
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Modely ARIMA Transformace Proces náhodné procházky Random Walk Process Proces Y t = Y t 1 + ɛ t je
Modely stacionárních časových řad
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Proces bílého šumu Proces {ɛ t} nazveme bílým šumem s nulovou střední hodnotou a rozptylem σ 2 a
5 Časové řady. Definice 16 Posloupnost náhodných veličin {X t, t T } nazveme slabě stacionární, pokud
5 Časové řady Časovou řadou rozumíme posloupnost reálných náhodných veličin X 1,..., X n, přičemž indexy t = 1,..., n interpretujeme jako časové okamžiky. Někdy však uvažujeme i nekonečné posloupnosti
Testování hypotéz o parametrech regresního modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,
Testování hypotéz o parametrech regresního modelu
Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO
4EK211 Základy ekonometrie
4EK211 Základy ekonometrie LS 2014/15 Cvičení 7: Autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Autokorelace - teorie Zopakujte si G-M
Základy ekonometrie. X. Regrese s časovými řadami. Základy ekonometrie (ZAEK) X. Regrese s časovými řadami Podzim / 47
Základy ekonometrie X. Regrese s časovými řadami Základy ekonometrie (ZAEK) X. Regrese s časovými řadami Podzim 2015 1 / 47 Obsah tématu 1 ADL model 2 Regrese se stacionárními řadami 3 Regrese s řadami
AVDAT Geometrie metody nejmenších čtverců
AVDAT Geometrie metody nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model klasický lineární regresní model odhad parametrů MNČ y = Xβ + ε, ε
Regresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
Odhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
Základy ekonometrie. XI. Vektorové autoregresní modely. Základy ekonometrie (ZAEK) XI. VAR modely Podzim / 28
Základy ekonometrie XI. Vektorové autoregresní modely Základy ekonometrie (ZAEK) XI. VAR modely Podzim 2015 1 / 28 Obsah tématu 1 Prognózování s VAR modely 2 Vektorové modely korekce chyb (VECM) 3 Impulzní
Regresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
4EK211 Základy ekonometrie
4EK211 Základy ekonometrie ZS 2015/16 Cvičení 7: Časově řady, autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Časové řady Data: HDP.wf1
1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Vícenásobná regresní a korelační analýza 1 1 Tto materiál bl vtvořen za pomoci grantu FRVŠ číslo 1145/2004. O vícenásobné závislosti mluvíme tehd, jestliže je závisle proměnná závislá na více nezávislých
4EK211 Základy ekonometrie
4EK11 Základy ekonometrie Autokorelace Cvičení 5 Zuzana Dlouhá Gauss-Markovy předpoklady Náhodná složka: Gauss-Markovy předpoklady 1. E(u) = náhodné vlivy se vzájemně vynulují. E(uu T ) = σ I n konečný
VEKTOROVÉ AUTOREGRESE. APLIKACE V PROGNÓZOVÁNÍ.
VEKTOROVÉ AUTOREGRESE. APLIKACE V PROGNÓZOVÁNÍ. Vektorové autoregrese (VAR se používají tehdy, když chceme zkoumat časové řady dvou či více proměnných. Je sice možné za tím účelem použít dynamické modely
Normální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký
AVDAT Klasický lineární model, metoda nejmenších
AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i
1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou
Diagnostika regrese pomocí grafu 7krát jinak
StatSoft Diagnostika regrese pomocí grafu 7krát jinak V tomto článečku si uděláme exkurzi do teorie regresní analýzy a detailně se podíváme na jeden jediný diagnostický graf. Jedná se o graf Předpovědi
Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných)
Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných) 1. SPECIFIKACE (12 bodů): (1) Graf průběhu proměnných (1) Obě řady se chovají stejně, lze předpokládat jejich lineární vztah
Cvičení 9 dekompozice časových řad a ARMA procesy
Cvičení 9 dekompozice časových řad a ARMA procesy Příklad 1: Dekompozice časové řady Soubor 18AEK-cv09.xls obsahuje dvě časové řady (X a Y) se 72 pozorováními. Použijte časovou řadu Y. a) Pokuste se na
Testování statistických hypotéz
Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné
Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel
Regresní analýza Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Regresní analýza 1 / 23
Přednáška 4. Lukáš Frýd
Přednáška 4 Lukáš Frýd Časová řada: stochastický (náhodný) proces, sekvence náhodných proměnných indexovaná časem Pozorovaná časová řada: jedna realizace stochastického procesu Analogie: Průřezový výběr,
Regresní analýza 1. Regresní analýza
Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému
PRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
z dat nasbíraných v letech 1959 1994. Ke zpracování dat byl použit statistický software R. Základní model poptávkové funkce, ze kterého vycházíme,
Úloha 1: V naší studii se zabýváme poptávkovou funkcí životního pojištění, vycházíme z dat nasbíraných v letech 1959 1994. Ke zpracování dat byl použit statistický software R. Základní model poptávkové
Regresní analýza. Eva Jarošová
Regresní analýza Eva Jarošová 1 Obsah 1. Regresní přímka 2. Možnosti zlepšení modelu 3. Testy v regresním modelu 4. Regresní diagnostika 5. Speciální využití Lineární model 2 1. Regresní přímka 3 nosnost
Aplikovaná ekonometrie 7. Lukáš Frýd
Aplikovaná ekonometrie 7 Lukáš Frýd Nestacionární časové řady Možné příčinny Sezonost Deterministický trend (time trend) Jednotkový kořen (Stochastický trend) Strukturní zlomy Časový trend (deterministický
LWS při heteroskedasticitě
Stochastické modelování v ekonomii a financích Petr Jonáš 7. prosince 2009 Obsah 1 2 3 4 5 47 1 Předpoklad 1: Y i = X i β 0 + e i i = 1,..., n. (X i, e i) je posloupnost nezávislých nestejně rozdělených
Báze a dimenze vektorových prostorů
Báze a dimenze vektorových prostorů Buď (V, +, ) vektorový prostor nad tělesem (T, +, ). Nechť u 1, u 2,..., u n je konečná posloupnost vektorů z V. Existují-li prvky s 1, s 2,..., s n T, z nichž alespoň
Matematické modelování Náhled do ekonometrie. Lukáš Frýd
Matematické modelování Náhled do ekonometrie Lukáš Frýd Výnos akcie vs. Výnos celého trhu - CAPM model r it = r ft + β 1. (r mt r ft ) r it r ft = α 0 + β 1. (r mt r ft ) + ε it Ekonomický (finanční model)
Regresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
Regresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
4EK211 Základy ekonometrie
4EK Základy ekonometrie Odhad klasického lineárního regresního modelu II Cvičení 3 Zuzana Dlouhá Klasický lineární regresní model - zadání příkladu Soubor: CV3_PR.xls Data: y = maloobchodní obrat potřeb
Statistika II. Jiří Neubauer
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Časová řada konečná posloupnost reálných hodnot určitého sledovaného ukazatele měřeného v určitých
Výběrové charakteristiky a jejich rozdělení
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový
12. cvičení z PST. 20. prosince 2017
1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace
Statistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
Ilustrační příklad odhadu LRM v SW Gretl
Ilustrační příklad odhadu LRM v SW Gretl Podkladové údaje Korelační matice Odhad lineárního regresního modelu (LRM) Verifikace modelu PEF ČZU Praha Určeno pro posluchače předmětu Ekonometrie Needitovaná
Ekonometrie. Jiří Neubauer
Úvod do analýzy časových řad Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Úvod do analýzy
4EK211 Základy ekonometrie
4EK211 Základy ekonometrie LS 2014/15 Cvičení 4: Statistické vlastnosti MNČ LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Upřesnění k pojmům a značení
Odhady Parametrů Lineární Regrese
Odhady Parametrů Lineární Regrese Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké
Odhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
1. Přednáška. Ing. Miroslav Šulai, MBA
N_OFI_2 1. Přednáška Počet pravděpodobnosti Statistický aparát používaný ve financích Ing. Miroslav Šulai, MBA 1 Počet pravděpodobnosti -náhodné veličiny 2 Počet pravděpodobnosti -náhodné veličiny 3 Jevy
18AEK Aplikovaná ekonometrie a teorie časových řad. Řešení domácích úkolů č. 1 a 2 příklad 1
18AEK Aplikovaná ekonometrie a teorie časových řad Řešení domácích úkolů č. 1 a 2 příklad 1 Obecné pravidlo pro všechny testy Je stanovena nulová hypotéza: H 0 Je stanovena alternativní hypotéza: H A Je
12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)
cvičení z PSI 0-4 prosince 06 Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) Z realizací náhodných veličin X a Y s normálním rozdělením) jsme z výběrů daného rozsahu obdrželi
Regresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení
2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků
MATEMATICKÁ STATISTIKA - XP01MST
MATEMATICKÁ STATISTIKA - XP01MST 1. Úvod. Matematická statistika (statistics) se zabývá vyšetřováním zákonitostí, které v sobě obsahují prvek náhody. Zpracováním hodnot, které jsou výstupem sledovaného
AVDAT Nelineární regresní model
AVDAT Nelineární regresní model Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Nelineární regresní model Ey i = f (x i, β) kde x i je k-členný vektor vysvětlujících proměnných
1 Linearní prostory nad komplexními čísly
1 Linearní prostory nad komplexními čísly V této přednášce budeme hledat kořeny polynomů, které se dále budou moci vyskytovat jako složky vektorů nebo matic Vzhledem k tomu, že kořeny polynomu (i reálného)
10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.
0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti
Bodové a intervalové odhady parametrů v regresním modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model Mějme lineární regresní model (LRM) Y = Xβ + e, kde y 1 e 1 β y 2 Y =., e
odpovídá jedna a jen jedna hodnota jiných
8. Regresní a korelační analýza Problém: hledání, zkoumání a hodnocení souvislostí, závislostí mezi dvěma a více statistickými znaky (veličinami). Typy závislostí: pevné a volné Pevná závislost každé hodnotě
Ing. Michael Rost, Ph.D.
Úvod do testování hypotéz, jednovýběrový t-test Ing. Michael Rost, Ph.D. Testovaná hypotéza Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru, např. o parametru Θ, pak takovéto tvrzení
PRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti
Korelační a regresní analýza
Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná
Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.
1 Statistické odhady Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. Odhad lze provést jako: Bodový odhad o Jedna číselná hodnota Intervalový
Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.
1. Korelační analýza V životě většinou nesledujeme pouze jeden statistický znak. Sledujeme více statistických znaků zároveň. Kromě vlastností statistických znaků nás zajímá také jejich těsnost (velikost,
Stavový model a Kalmanův filtr
Stavový model a Kalmanův filtr 2 prosince 23 Stav je veličina, kterou neznáme, ale chtěli bychom znát Dozvídáme se o ní zprostředkovaně prostřednictvím výstupů Příkladem může býapř nějaký zašuměný signál,
3 Bodové odhady a jejich vlastnosti
3 Bodové odhady a jejich vlastnosti 3.1 Statistika (Skripta str. 77) Výběr pořizujeme proto, abychom se (více) dověděli o souboru, ze kterého jsme výběr pořídili. Zde se soustředíme na situaci, kdy známe
You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)
Závislost náhodných veličin Úvod Předchozí přednášky: - statistické charakteristiky jednoho výběrového nebo základního souboru - vztahy mezi výběrovým a základním souborem - vztahy statistických charakteristik
Regresní a korelační analýza
Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Regresní analýza Cíl regresní analýzy: stanovení formy (trendu, tvaru, průběhu)
FREDHOLMOVA ALTERNATIVA
FREDHOLMOVA ALTERNATIVA Pavel Jirásek 1 Abstrakt. V tomto článku se snažíme shrnout dosavadní výsledky týkající se Fredholmovy alternativy (FA). Postupně zmíníme FA na prostorech konečné dimenze, FA pro
Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup
Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009
V předchozí kapitole jsme podstatným způsobem rozšířili naši představu o tom, co je to číslo. Nadále jsou pro nás důležité především vlastnosti
Kapitola 5 Vektorové prostory V předchozí kapitole jsme podstatným způsobem rozšířili naši představu o tom, co je to číslo. Nadále jsou pro nás důležité především vlastnosti operací sčítání a násobení
PRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOS A SAISIKA Regresní analýza - motivace Základní úlohou regresní analýzy je nalezení vhodného modelu studované závislosti. Je nutné věnovat velkou pozornost tomu aby byla modelována REÁLNÁ
Časové řady a jejich periodicita pokračování
Časové řady a jejich periodicita pokračování Jana Klicnarová Katedra aplikované matematiky a informatiky Jihočeská Univerzita v Českých Budějovicích, Ekonomická fakulta 2010 Dekompozice časových řad Jak
Normální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními
Lineární regrese. Komentované řešení pomocí MS Excel
Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních
Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.
Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost
Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace
Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace Jan Slovák Masarykova univerzita Fakulta informatiky 28. 11 2. 12. 2016 Obsah přednášky 1 Literatura 2 Střední
4EK211 Základy ekonometrie
4EK211 Základy ekonometrie LS 2014/15 Cvičení 10: Heteroskedasticita LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Heteroskedasticita - teorie Druhý
Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
Teorie náhodných matic aneb tak trochu jiná statistika
Teorie náhodných matic aneb tak trochu jiná statistika B. Vlková 1, M.Berg 2, B. Martínek 3, O. Švec 4, M. Neumann 5 Gymnázium Uničov 1, Gymnázium Václava Hraběte Hořovice 2, Mendelovo gymnázium Opava
Odhady - Sdružené rozdělení pravděpodobnosti
Odhady - Sdružené rozdělení pravděpodobnosti 4. listopadu 203 Kdybych chtěl znát maximum informací o náhodné veličině, musel bych znát všechny hodnoty, které mohou padnout, a jejich pravděpodobnosti. Tedy
LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica
LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná
Testování statistických hypotéz
Testování statistických hypotéz Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 11. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 27 Obsah 1 Testování statistických hypotéz 2
Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,
Aplikovaná numerická matematika
Aplikovaná numerická matematika 6. Metoda nejmenších čtverců doc. Ing. Róbert Lórencz, CSc. České vysoké učení technické v Praze Fakulta informačních technologií Katedra počítačových systémů Příprava studijních
Texty k přednáškám z MMAN3: 4. Funkce a zobrazení v euklidovských prostorech
Texty k přednáškám z MMAN3: 4. Funkce a zobrazení v euklidovských prostorech 1. července 2008 1 Funkce v R n Definice 1 Necht n N a D R n. Reálnou funkcí v R n (reálnou funkcí n proměnných) rozumíme zobrazení
Pravděpodobnost a aplikovaná statistika
Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 2. KAPITOLA PODMÍNĚNÁ PRAVDĚPODOBNOST 3. KAPITOLA NÁHODNÁ VELIČINA 9.11.2017 Opakování Uveďte příklad aplikace geometrické definice pravděpodobnosti
Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
Univerzita Karlova v Praze procesy II. Zuzana. funkce
Náhodné 1 1 Katedra pravděpodobnosti a matematické statistiky Univerzita Karlova v Praze email: praskova@karlin.mff.cuni.cz 11.-12.3. 2010 1 Outline Lemma 1: 1. Nechť µ, ν jsou konečné míry na borelovských
Vektory a matice. Obsah. Aplikovaná matematika I. Carl Friedrich Gauss. Základní pojmy a operace
Vektory a matice Aplikovaná matematika I Dana Říhová Mendelu Brno Obsah 1 Vektory Základní pojmy a operace Lineární závislost a nezávislost vektorů 2 Matice Základní pojmy, druhy matic Operace s maticemi
Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jestliže opakujeme nezávisle nějaký pokus, můžeme z pozorovaných hodnot sestavit rozdělení relativních četností
Vícerozměrná rozdělení
Vícerozměrná rozdělení 7. září 0 Učivo: Práce s vícerozměrnými rozděleními. Sdružené, marginální, podmíněné rozdělení pravděpodobnosti. Vektorová střední hodnota. Kovariance, korelace, kovarianční matice.
1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě
EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy
EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy Ekonometrická analýza proces, skládající se z následujících fází: a) specifikace b) kvantifikace c) verifikace d) aplikace Postupné zpřesňování jednotlivých
PRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Náhodný výběr Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
Aproximace binomického rozdělení normálním
Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Příklad Sybilla a Kassandra tvrdí, že mají telepatické schopnosti, a chtějí to dokázat následujícím pokusem: V jedné