Přednáška 4. Lukáš Frýd

Podobné dokumenty
Přepoklady KLM a Gauss Markov teorém. Blue odhad - GM. KLM Klasický lineární model. 1) Lineární v parametrech. 2) E ε = 0

Aplikovaná ekonometrie 7. Lukáš Frýd

4EK211 Základy ekonometrie

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

5EN306 Aplikované kvantitativní metody I

Základy ekonometrie. XI. Vektorové autoregresní modely. Základy ekonometrie (ZAEK) XI. VAR modely Podzim / 28

REGRESNÍ ANALÝZA NESTACIONÁRNÍCH EKONOMICKÝCH ČASOVÝCH ŘAD

4EK211 Základy ekonometrie

LINEÁRNÍ REGRESE. Lineární regresní model

4EK211 Základy ekonometrie

5EN306 Aplikované kvantitativní metody I

Úvod do analýzy časových řad

Základy ekonometrie. X. Regrese s časovými řadami. Základy ekonometrie (ZAEK) X. Regrese s časovými řadami Podzim / 47

AVDAT Klasický lineární model, metoda nejmenších

Statistika II. Jiří Neubauer

PRAVDĚPODOBNOST A STATISTIKA

Ekonometrie. Jiří Neubauer

5EN306 Aplikované kvantitativní metody I

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Cross-section pozorování Firma, člověk Časový úsek

1. Přednáška. Ing. Miroslav Šulai, MBA

Pravděpodobnost a aplikovaná statistika

Inovace bakalářského studijního oboru Aplikovaná chemie

4EK211 Základy ekonometrie

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

4EK211 Základy ekonometrie

VEKTOROVÉ AUTOREGRESE. APLIKACE V PROGNÓZOVÁNÍ.

n = 2 Sdružená distribuční funkce (joint d.f.) n. vektoru F (x, y) = P (X x, Y y)

STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ. J. Pruška, T. Parák

Téma 22. Ondřej Nývlt

AVDAT Náhodný vektor, mnohorozměrné rozdělení

Testování hypotéz o parametrech regresního modelu

4EK211 Základy ekonometrie

Testování hypotéz o parametrech regresního modelu

Statistická analýza jednorozměrných dat

LWS při heteroskedasticitě

5EN306 Aplikované kvantitativní metody I

18AEK Aplikovaná ekonometrie a teorie časových řad. Řešení domácích úkolů č. 1 a 2 příklad 1

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

Odhad parametrů N(µ, σ 2 )

Odhady Parametrů Lineární Regrese

Dynamické metody pro predikci rizika

Měření závislosti statistických dat

Vícerozměrná rozdělení

AVDAT Nelineární regresní model

odpovídá jedna a jen jedna hodnota jiných

Lekce 1 úvod do ekonometrie

5 Časové řady. Definice 16 Posloupnost náhodných veličin {X t, t T } nazveme slabě stacionární, pokud

Odhad parametrů N(µ, σ 2 )

Úvodem Dříve les než stromy 3 Operace s maticemi

4EK211 Základy ekonometrie

PRAVDĚPODOBNOST A STATISTIKA

Regresní a korelační analýza

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy

6. Lineární regresní modely

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

PRAVDĚPODOBNOST A STATISTIKA

4EK211 Základy ekonometrie

Regresní analýza 1. Regresní analýza

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných)

AVDAT Geometrie metody nejmenších čtverců

EKONOMETRIE 9. přednáška Zobecněný lineární regresní model

MATEMATICKÁ STATISTIKA - XP01MST

Příklady ke čtvrtému testu - Pravděpodobnost

Intervalová data a výpočet některých statistik

Regresní a korelační analýza

6. Lineární regresní modely

PRAVDĚPODOBNOST A STATISTIKA

4EK211 Základy ekonometrie

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

Fakulta stavební GEOSTATISTIKA. Martin Dzurov, Kristýna Kitzbergerová, Lucie Šindelářová

Statistická analýza jednorozměrných dat

Matematika pro chemické inženýry

PRAVDĚPODOBNOST A STATISTIKA

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika vektory

Chyby měření 210DPSM

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Intervalové Odhady Parametrů

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.

BAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni

Korelační a regresní analýza

Praktikum z ekonometrie Panelová data

Regresní analýza. Eva Jarošová

STATISTICKÉ ODHADY Odhady populačních charakteristik

Cvičení ze statistiky - 5. Filip Děchtěrenko

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

Lineární regrese. Komentované řešení pomocí MS Excel

Náhodné signály. Honza Černocký, ÚPGM

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

Stavový model a Kalmanův filtr

Transkript:

Přednáška 4 Lukáš Frýd

Časová řada: stochastický (náhodný) proces, sekvence náhodných proměnných indexovaná časem Pozorovaná časová řada: jedna realizace stochastického procesu Analogie: Průřezový výběr, u kterého pozorujeme jen jednu jednotku v každém časovém období. Všechny možné realizace stochastického procesu mají stejnou roli jako populace u průřezové analýzy

y = Xβ + ε Cross-section pozorování Firma, člověk ds = αsdt + σsdw Časový úsek Základní soubor Výběrový soubor Základní soubor Je Proces 1 konkrétní realizace Jedná se o soubor dat Z JEDNÉ realizace stochastického procesu Přidej simulace

Statický model y t = β 0 + β 1 x t + ε t t = 1,2,3,, T, kdy T je počet pozorování y i = β 0 + β 1 x i + ε i Vztah mezi y a x je contemporaneus Změna v x okamžitě ovlivní y Δy t = β 1 Δx t kdy Δε t = 0 inflace t = β 0 + β 1 nezaměstnanost + ε t

Finite Distributed Lag Model (FDL) Z ekonomie známe například zpoždění v dopadu měnové/fiskální politiky na dané cíle (proměnné) Nevystačíme si tak se statickým modelem, kdy nezávislá proměnná x v čase t(rok, měsíc, den. ) ovlivní závisle proměnnou y v témže čase t (rok, měsíc, den ) V modelu tak přibude zpožděná(é) nezávislá(é) proměnné Zpoždění může nabít různých úrovní y t = β 0 + β 1 x t + β 2 x t 1 + β 3 x t 2 + ε t FDL řádu 2

gfr t = β 0 + β 1 pe t + β 2 pe t 1 + β 3 pe t 2 + ε t gfr t general fertility rate kolik dětí na 1000 žen v chilbearing age pe t real dollar value of the personal tax exemption

Finite sample properties OLS pro klasický lineární model KLM Klasický lineární model Blue odhad - GM Nezkreslený odhad 1) Lineární v parametrech 2) E ε = 0 3) E( ȁ ε X)= 0 4) Není dokonalá multikolinearita 5) Var( ȁ ε X) = σ 2 I 6) ε~n(0, σ 2 I)

Vlastnosti pro konečný výběr. (finite sample properties) 1) Linearita v parametrech 2) Není perfektní multikolinearita 3) Podmíněná střední hodnota náhodné složky je rovna nule 4) Homoskedasticita 5) Není autokorelace Poté metoda nejmenších čtverců vede k nezkreslenému, konzistentnímu odhadu. Odhad je zároveň BLUE

y t = β 0 + β 1 x t + ε t 3) E( εȁx)= 0 3) E( ε i ȁx i )= 0 3) E( ε i ȁx j )= 0 Pro průřezová data byl předpoklad náhodného výběru Pro časové řady 3TS) E( ε t ȁx s )= 0 pro t, s = 1,, T Slovy: náhodná složka v čase t nezávisí na nezávislé proměnné ve všech časech Představme si, že máme časovou řadu délky 5 (1 UPLYNULÝ pracovní týden) 3TS) E( ε pátek หX pátek, X čtvrtek, X středa, X úterý, X pondělí )= 0 Tedy podmíněná hodnota náhodné složky v pátek nezávisí nejenom na hodnotě nezávislé proměnné v pátek Ale na všech ostatních pozorování v minulosti Náhodná složka nereaguje na to co se stalo dnes v pátek Ale ani na to co se stalo v pondělí MLUVÍME O STRIKTNÍ EXOGENITĚ!!!

Změnu náhodné složky dnes, nesmí ovlivnit x v budoucnu y t = β 0 + β 1 x t + ε t Budoucí reklama bude záviset na dnešním sales a tedy i na dnešní ε t Porušení striktní exogenity mrdrte t = β 0 + β 1 polpc t + ε t Corr ε t, polpc t+1 = 0 Nemusí platit, že korelace je 0 Město upravuje množství policistů na základě minulých vražd. Ekonomická krize (v náhodné složce), dopad na počet vražd Město reaguje např. se zpožděním 1 období polpc t+1 = f mrdrte t = f(β 0 + β 1 polpc t + ε t ) X t nesmí reagovat na minulé y

HDP t = β 0 + β 1 M t + β 2 M t 1 + ε t HDP t = β 0 + β 1 M t + v t = β 0 + β 1 M t + (β 2 M t 1 + ε t ) Cov v t, M t = Cov β 2 M t 1 + ε t, M t 0 Odhad β 1 bude zkreslený Autoregresní proces M t = β 1 + β 2 M t 1 + ε t Cov ε t, M t 1 = Cov ε t, β 1 + β 2 M t 2 + ε t 1 = 0 Cov ε t, M t = Cov ε t, β 1 + β 2 M t 1 + ε t = Cov ε t, ε t = Var ε t 0 Porušení předpokladu striktní exogenity

M t = β 1 + β 2 M t 1 + v t = β 1 + β 2 M t 1 + ρ 1 v t 1 + ε t Cov v t, M t 1 = Cov ρ 1 v t 1 + ε t, β 1 + β 2 M t 2 + v t 1 0

HDP t = β 0 + β 1 M t + v t = β 0 + β 1 M t + (ρ 1 v t 1 + ε t ) Cov v t, M t = Cov ρ 1 v t 1 + ε t, M t = v t 1 = HDP t 1 β 0 + β 1 M t 1 = Cov ρ 1 (HDP t 1 β 0 + β 1 M t 1) + ε t, M t = 0 HDP t = β 0 + β 1 M t + β 2 M t 1 + v t = β 0 + β 1 M t + β 2 M t 1 + (ρ 1 v t 1 + ε t ) v t 1 = HDP t 1 β 0 + β 1 M t 1 β 2 M t 2 Cov v t, M t = Cov ρ 1 v t 1 + ε t, M t = = Cov ρ 1 (HDP t 1 β 0 + β 1 M t 1 β 2 M t 2 ) + ε t, M t 0

Statický model vs. FDL model V časových řadách nám většinou nebude stačit statický model Proces přizpůsobení, určitá dynamika

5) Var( ȁ ε X) = σ 2 I 5a) Var ȁ ε t X = Var ε t = σ 2, t = 1,2,, n 5b) Corr ȁ ε t, ε s X = 0, t s Rozptyl náhodné složky je nezávislý na X a je konstantní v čase Porušení vede k heteroskedasticitě Porušení vede k seriové korelaci i3 t = β 0 + β 1 inft t + β 2 def t + ε t Vše nepozorovatelné, co ovlivňuje úrokovou sazbu, musí mít konstantní rozptyl v čase Co když opomeneme některou proměnnou?

5b) Corr ȁ ε t, ε s X = 0, t s Porušení vede k seriové korelaci i3 t = β 0 + β 1 inft t + β 2 def t + ε t Určitý vzorec ve vývoji úrokové sazby.

Gauss-Markov theorem: Pokud jsou splněny podmínky: 1) Linearita v parametrech 2) Není perfektní multikolinearita 3) Striktní exogenita 4) Homoskedasticita 5) Není autokorelace Metoda nejmenších čtverců je BLUE

Příčinny nestacionárních časových řad Časový (deterministický) trend Stochastický trend Sezonní trend Zlom

Stacionarita časových řad Rozdělujeme na: Striktní stacionaritu Slabou (weak) stacionaritu, také říkáme kovariančně stacionární proces Praktické důvody řešení stacionarity pro odhad neznámých parametrů potřebujeme určitou stabilitu Teoretické důvody aplikace LLN a CLV

Striktní stacionarita Striktně stacionární proces je takový proces, kdy pro každé t 1, t 2, t T Z, a k Z platí, že Hustota pravděpodobnosti je stabilní v čase Nemění se charakteristiky (vlastnosti) časové řady Pokud vybereme z určitého intervalu data A to samé uděláme v dalším kroku h, Musí zůstat sdružená distribuční funkce neměnná

Kovariančně stacionární proces Stochastický proces {y t : t = 1,2, } budeme nazývat stacionárním pokud platí: 1. E y t = μ pro všechna t konstantí 2. Var y t = σ 2 < pro všechna t konstantí 3. Cov y t, y t+h = γ h pro všechna t závisí pouze na h a ne na čase Kovarianční stacionarita se soustředí pouze na první 2 momenty stochastického procesu A kovariance mezi y t, y t+h Pokud má stochastický proces konečný druhý moment Pak je kovariančně stacionární Předpoklad striktní stacionarity je silnější než kovarianční stacionarity Je proces s časovým trendem stacionární? Není mění se střední hodnota Řešíme zde pouze nepodmíněné momenty Podmíněné se mohou měnit

Podmínky pro kovarianční stacionaritu střední hodnota Stochastický proces {y t : t = 1,2, } budeme nazývat kovariančně stacionárním pokud platí: 1. E y t = μ pro všechna t 2. Var y t = σ 2 < pro všechna t 3. Cov y t, y t+h = γ h pro všechna t

Podmínky pro kovarianční stacionaritu rozptyl Stochastický proces {y t : t = 1,2, } budeme nazývat kovariančně stacionárním pokud platí: 1. E y t = μ pro všechna t 2. Var y t = σ 2 < pro všechna t 3. Cov y t, y t+h = γ h pro všechna t

Podmínky pro kovarianční stacionaritu kovariance Stochastický proces {y t : t = 1,2, } budeme nazývat kovariančně stacionárním pokud platí: 1. E y t = μ pro všechna t 2. Var y t = σ 2 < pro všechna t 3. Cov y t, y t+h = γ h pro všechna t Neplet si to s weak dependence!!!! Cov y t, y t+h Cov y t, y t+h = f h g(t) Kovariance závisí pouze na zpoždění h a ne na čase!! Kovariance se bude měnit se změnou délky kroku, ne času Porušení například díky zlomu. Viz. Switching methods

Sezonost a trendy Zdánlivá regrese Deterministický vs. Stochastický Některé časové řady se vyvíjejí společně v čase Z důvodu vlivu nepozorovaných společných faktorů Nerespektování takové struktury může vést k chybným závěrům Kvadratický trend Lineární trend y t = α 0 + α 1 t + α 2 t 2 + ε t y t = α 0 + α 1 t + ε t E(y t ) = α 0 + α 1 t α 1 > 0, rostoucí trend α < 0, klesající trend ε t ~i. i. d(0, σ 2 ) Exponenciální trend y t = exp(β 0 + β 1 t + ε t ) log(y t ) = β 0 + β 1 t + ε t

Zdánlivá regrese Některé proměnné se v čase mění obsahují trend Automaticky neznamená porušení předpokladů KLM (většinou však bude problém s omitted variable bias ) Problémem je tzv. zdánlivá regrese. Statisticky významný vztah vzniká pouze vlivem společného trendu Řešením je zahrnout časový trend (zatím uvažujeme pouze deterministický)

HSEINV.RAW log invpc t = β 0 + β 1 log price t + ε t log invpc t = β 0 + β 1 log price t + β 3 t + ε t Existuje zdánlivá regrese? Výsledek může být i opačný, po zahrnutí trendu se některá z proměnných stane statisticky významnou log prepop t = β 0 + β 1 log mincov t + β 2 log(usgnp t ) + ε t log prepop t = β 0 + β 1 log mincov t + β 2 log usgnp t + β 3 t + ε t

Odstranění trendu 1) Provedeme regresi závislé proměnné na časovém trendu a uložíme residua 2) Residua jsou vlastně závislá proměnná bez trendu 3) Uděláme novou regresi, kdy jako závisle proměnnou použijeme residua z kroku 1 y = β 0 + β 1 x + β 2 t + ε y = γ 0 + γ 1 t + ε e = y γ 0 + γ 1 t Hlavní výhodou regrese po odstranění trendu oproti regresi s trendem je v možnosti interpretace koeficientu determinace

Koeficient determinace při trendu Pokud má závisle proměnná trend, je koeficient determinace přestřelený Pokud odfiltrujeme trend, tak z následné regrese má koeficient determinace již vypovídací schopnost U časových řad také problém s agregovanými daty Mikroekonomie vs makroekonomie