Přednáška 4 Lukáš Frýd
Časová řada: stochastický (náhodný) proces, sekvence náhodných proměnných indexovaná časem Pozorovaná časová řada: jedna realizace stochastického procesu Analogie: Průřezový výběr, u kterého pozorujeme jen jednu jednotku v každém časovém období. Všechny možné realizace stochastického procesu mají stejnou roli jako populace u průřezové analýzy
y = Xβ + ε Cross-section pozorování Firma, člověk ds = αsdt + σsdw Časový úsek Základní soubor Výběrový soubor Základní soubor Je Proces 1 konkrétní realizace Jedná se o soubor dat Z JEDNÉ realizace stochastického procesu Přidej simulace
Statický model y t = β 0 + β 1 x t + ε t t = 1,2,3,, T, kdy T je počet pozorování y i = β 0 + β 1 x i + ε i Vztah mezi y a x je contemporaneus Změna v x okamžitě ovlivní y Δy t = β 1 Δx t kdy Δε t = 0 inflace t = β 0 + β 1 nezaměstnanost + ε t
Finite Distributed Lag Model (FDL) Z ekonomie známe například zpoždění v dopadu měnové/fiskální politiky na dané cíle (proměnné) Nevystačíme si tak se statickým modelem, kdy nezávislá proměnná x v čase t(rok, měsíc, den. ) ovlivní závisle proměnnou y v témže čase t (rok, měsíc, den ) V modelu tak přibude zpožděná(é) nezávislá(é) proměnné Zpoždění může nabít různých úrovní y t = β 0 + β 1 x t + β 2 x t 1 + β 3 x t 2 + ε t FDL řádu 2
gfr t = β 0 + β 1 pe t + β 2 pe t 1 + β 3 pe t 2 + ε t gfr t general fertility rate kolik dětí na 1000 žen v chilbearing age pe t real dollar value of the personal tax exemption
Finite sample properties OLS pro klasický lineární model KLM Klasický lineární model Blue odhad - GM Nezkreslený odhad 1) Lineární v parametrech 2) E ε = 0 3) E( ȁ ε X)= 0 4) Není dokonalá multikolinearita 5) Var( ȁ ε X) = σ 2 I 6) ε~n(0, σ 2 I)
Vlastnosti pro konečný výběr. (finite sample properties) 1) Linearita v parametrech 2) Není perfektní multikolinearita 3) Podmíněná střední hodnota náhodné složky je rovna nule 4) Homoskedasticita 5) Není autokorelace Poté metoda nejmenších čtverců vede k nezkreslenému, konzistentnímu odhadu. Odhad je zároveň BLUE
y t = β 0 + β 1 x t + ε t 3) E( εȁx)= 0 3) E( ε i ȁx i )= 0 3) E( ε i ȁx j )= 0 Pro průřezová data byl předpoklad náhodného výběru Pro časové řady 3TS) E( ε t ȁx s )= 0 pro t, s = 1,, T Slovy: náhodná složka v čase t nezávisí na nezávislé proměnné ve všech časech Představme si, že máme časovou řadu délky 5 (1 UPLYNULÝ pracovní týden) 3TS) E( ε pátek หX pátek, X čtvrtek, X středa, X úterý, X pondělí )= 0 Tedy podmíněná hodnota náhodné složky v pátek nezávisí nejenom na hodnotě nezávislé proměnné v pátek Ale na všech ostatních pozorování v minulosti Náhodná složka nereaguje na to co se stalo dnes v pátek Ale ani na to co se stalo v pondělí MLUVÍME O STRIKTNÍ EXOGENITĚ!!!
Změnu náhodné složky dnes, nesmí ovlivnit x v budoucnu y t = β 0 + β 1 x t + ε t Budoucí reklama bude záviset na dnešním sales a tedy i na dnešní ε t Porušení striktní exogenity mrdrte t = β 0 + β 1 polpc t + ε t Corr ε t, polpc t+1 = 0 Nemusí platit, že korelace je 0 Město upravuje množství policistů na základě minulých vražd. Ekonomická krize (v náhodné složce), dopad na počet vražd Město reaguje např. se zpožděním 1 období polpc t+1 = f mrdrte t = f(β 0 + β 1 polpc t + ε t ) X t nesmí reagovat na minulé y
HDP t = β 0 + β 1 M t + β 2 M t 1 + ε t HDP t = β 0 + β 1 M t + v t = β 0 + β 1 M t + (β 2 M t 1 + ε t ) Cov v t, M t = Cov β 2 M t 1 + ε t, M t 0 Odhad β 1 bude zkreslený Autoregresní proces M t = β 1 + β 2 M t 1 + ε t Cov ε t, M t 1 = Cov ε t, β 1 + β 2 M t 2 + ε t 1 = 0 Cov ε t, M t = Cov ε t, β 1 + β 2 M t 1 + ε t = Cov ε t, ε t = Var ε t 0 Porušení předpokladu striktní exogenity
M t = β 1 + β 2 M t 1 + v t = β 1 + β 2 M t 1 + ρ 1 v t 1 + ε t Cov v t, M t 1 = Cov ρ 1 v t 1 + ε t, β 1 + β 2 M t 2 + v t 1 0
HDP t = β 0 + β 1 M t + v t = β 0 + β 1 M t + (ρ 1 v t 1 + ε t ) Cov v t, M t = Cov ρ 1 v t 1 + ε t, M t = v t 1 = HDP t 1 β 0 + β 1 M t 1 = Cov ρ 1 (HDP t 1 β 0 + β 1 M t 1) + ε t, M t = 0 HDP t = β 0 + β 1 M t + β 2 M t 1 + v t = β 0 + β 1 M t + β 2 M t 1 + (ρ 1 v t 1 + ε t ) v t 1 = HDP t 1 β 0 + β 1 M t 1 β 2 M t 2 Cov v t, M t = Cov ρ 1 v t 1 + ε t, M t = = Cov ρ 1 (HDP t 1 β 0 + β 1 M t 1 β 2 M t 2 ) + ε t, M t 0
Statický model vs. FDL model V časových řadách nám většinou nebude stačit statický model Proces přizpůsobení, určitá dynamika
5) Var( ȁ ε X) = σ 2 I 5a) Var ȁ ε t X = Var ε t = σ 2, t = 1,2,, n 5b) Corr ȁ ε t, ε s X = 0, t s Rozptyl náhodné složky je nezávislý na X a je konstantní v čase Porušení vede k heteroskedasticitě Porušení vede k seriové korelaci i3 t = β 0 + β 1 inft t + β 2 def t + ε t Vše nepozorovatelné, co ovlivňuje úrokovou sazbu, musí mít konstantní rozptyl v čase Co když opomeneme některou proměnnou?
5b) Corr ȁ ε t, ε s X = 0, t s Porušení vede k seriové korelaci i3 t = β 0 + β 1 inft t + β 2 def t + ε t Určitý vzorec ve vývoji úrokové sazby.
Gauss-Markov theorem: Pokud jsou splněny podmínky: 1) Linearita v parametrech 2) Není perfektní multikolinearita 3) Striktní exogenita 4) Homoskedasticita 5) Není autokorelace Metoda nejmenších čtverců je BLUE
Příčinny nestacionárních časových řad Časový (deterministický) trend Stochastický trend Sezonní trend Zlom
Stacionarita časových řad Rozdělujeme na: Striktní stacionaritu Slabou (weak) stacionaritu, také říkáme kovariančně stacionární proces Praktické důvody řešení stacionarity pro odhad neznámých parametrů potřebujeme určitou stabilitu Teoretické důvody aplikace LLN a CLV
Striktní stacionarita Striktně stacionární proces je takový proces, kdy pro každé t 1, t 2, t T Z, a k Z platí, že Hustota pravděpodobnosti je stabilní v čase Nemění se charakteristiky (vlastnosti) časové řady Pokud vybereme z určitého intervalu data A to samé uděláme v dalším kroku h, Musí zůstat sdružená distribuční funkce neměnná
Kovariančně stacionární proces Stochastický proces {y t : t = 1,2, } budeme nazývat stacionárním pokud platí: 1. E y t = μ pro všechna t konstantí 2. Var y t = σ 2 < pro všechna t konstantí 3. Cov y t, y t+h = γ h pro všechna t závisí pouze na h a ne na čase Kovarianční stacionarita se soustředí pouze na první 2 momenty stochastického procesu A kovariance mezi y t, y t+h Pokud má stochastický proces konečný druhý moment Pak je kovariančně stacionární Předpoklad striktní stacionarity je silnější než kovarianční stacionarity Je proces s časovým trendem stacionární? Není mění se střední hodnota Řešíme zde pouze nepodmíněné momenty Podmíněné se mohou měnit
Podmínky pro kovarianční stacionaritu střední hodnota Stochastický proces {y t : t = 1,2, } budeme nazývat kovariančně stacionárním pokud platí: 1. E y t = μ pro všechna t 2. Var y t = σ 2 < pro všechna t 3. Cov y t, y t+h = γ h pro všechna t
Podmínky pro kovarianční stacionaritu rozptyl Stochastický proces {y t : t = 1,2, } budeme nazývat kovariančně stacionárním pokud platí: 1. E y t = μ pro všechna t 2. Var y t = σ 2 < pro všechna t 3. Cov y t, y t+h = γ h pro všechna t
Podmínky pro kovarianční stacionaritu kovariance Stochastický proces {y t : t = 1,2, } budeme nazývat kovariančně stacionárním pokud platí: 1. E y t = μ pro všechna t 2. Var y t = σ 2 < pro všechna t 3. Cov y t, y t+h = γ h pro všechna t Neplet si to s weak dependence!!!! Cov y t, y t+h Cov y t, y t+h = f h g(t) Kovariance závisí pouze na zpoždění h a ne na čase!! Kovariance se bude měnit se změnou délky kroku, ne času Porušení například díky zlomu. Viz. Switching methods
Sezonost a trendy Zdánlivá regrese Deterministický vs. Stochastický Některé časové řady se vyvíjejí společně v čase Z důvodu vlivu nepozorovaných společných faktorů Nerespektování takové struktury může vést k chybným závěrům Kvadratický trend Lineární trend y t = α 0 + α 1 t + α 2 t 2 + ε t y t = α 0 + α 1 t + ε t E(y t ) = α 0 + α 1 t α 1 > 0, rostoucí trend α < 0, klesající trend ε t ~i. i. d(0, σ 2 ) Exponenciální trend y t = exp(β 0 + β 1 t + ε t ) log(y t ) = β 0 + β 1 t + ε t
Zdánlivá regrese Některé proměnné se v čase mění obsahují trend Automaticky neznamená porušení předpokladů KLM (většinou však bude problém s omitted variable bias ) Problémem je tzv. zdánlivá regrese. Statisticky významný vztah vzniká pouze vlivem společného trendu Řešením je zahrnout časový trend (zatím uvažujeme pouze deterministický)
HSEINV.RAW log invpc t = β 0 + β 1 log price t + ε t log invpc t = β 0 + β 1 log price t + β 3 t + ε t Existuje zdánlivá regrese? Výsledek může být i opačný, po zahrnutí trendu se některá z proměnných stane statisticky významnou log prepop t = β 0 + β 1 log mincov t + β 2 log(usgnp t ) + ε t log prepop t = β 0 + β 1 log mincov t + β 2 log usgnp t + β 3 t + ε t
Odstranění trendu 1) Provedeme regresi závislé proměnné na časovém trendu a uložíme residua 2) Residua jsou vlastně závislá proměnná bez trendu 3) Uděláme novou regresi, kdy jako závisle proměnnou použijeme residua z kroku 1 y = β 0 + β 1 x + β 2 t + ε y = γ 0 + γ 1 t + ε e = y γ 0 + γ 1 t Hlavní výhodou regrese po odstranění trendu oproti regresi s trendem je v možnosti interpretace koeficientu determinace
Koeficient determinace při trendu Pokud má závisle proměnná trend, je koeficient determinace přestřelený Pokud odfiltrujeme trend, tak z následné regrese má koeficient determinace již vypovídací schopnost U časových řad také problém s agregovanými daty Mikroekonomie vs makroekonomie