Přepoklady KLM a Gauss Markov teorém. Blue odhad - GM. KLM Klasický lineární model. 1) Lineární v parametrech. 2) E ε = 0

Podobné dokumenty
4EK211 Základy ekonometrie

Přednáška 4. Lukáš Frýd

4EK211 Základy ekonometrie

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

AVDAT Klasický lineární model, metoda nejmenších

18AEK Aplikovaná ekonometrie a teorie časových řad. Řešení domácích úkolů č. 1 a 2 příklad 1

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

5EN306 Aplikované kvantitativní metody I

PRAVDĚPODOBNOST A STATISTIKA

5EN306 Aplikované kvantitativní metody I

4EK211 Základy ekonometrie

PRAVDĚPODOBNOST A STATISTIKA

6. Lineární regresní modely

Regresní analýza. Eva Jarošová

4EK211 Základy ekonometrie

Ekonometrie. Jiří Neubauer

ZOBECNĚNÝ LINEÁRNÍ REGRESNÍ MODEL. METODA ZOBECNĚNÝCH NEJMENŠÍCH ČTVERCŮ

LINEÁRNÍ REGRESE. Lineární regresní model

Statistika II. Jiří Neubauer

Základy ekonometrie. XI. Vektorové autoregresní modely. Základy ekonometrie (ZAEK) XI. VAR modely Podzim / 28

AVDAT Geometrie metody nejmenších čtverců

4EK211 Základy ekonometrie

EKONOMETRIE 9. přednáška Zobecněný lineární regresní model

Základy ekonometrie. V. Uvolnění klasických předpokladů heteroskedasticita. Základy ekonometrie (ZAEK) V. Heteroskedasticita Podzim / 56

Ilustrační příklad odhadu LRM v SW Gretl

Korelační a regresní analýza

Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných)

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba lineárních regresních modelů. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.

Časové řady, typy trendových funkcí a odhady trendů

odpovídá jedna a jen jedna hodnota jiných

INDUKTIVNÍ STATISTIKA

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Časové řady, typy trendových funkcí a odhady trendů

Pravděpodobnost a aplikovaná statistika

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Heteroskedasticita. Vysoká škola ekonomická Praha. Fakulta informatiky a statistiky. Katedra statistiky a pravděpodobnosti

PRAVDĚPODOBNOST A STATISTIKA

Regresní a korelační analýza

Bodové a intervalové odhady parametrů v regresním modelu

5EN306 Aplikované kvantitativní metody I

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

6. Lineární regresní modely

Inovace bakalářského studijního oboru Aplikovaná chemie

Normální (Gaussovo) rozdělení

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

PRAVDĚPODOBNOST A STATISTIKA

Tomáš Karel LS 2012/2013

Testování statistických hypotéz

Regresní analýza 1. Regresní analýza

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy

Přednáška II. Lukáš Frýd

AVDAT Nelineární regresní model

4EK211 Základy ekonometrie

FJFJ Cvičení 1. Lukáš Frýd

Úvodem Dříve les než stromy 3 Operace s maticemi

STATISTICKÉ ZJIŠŤOVÁNÍ

Kalibrace a limity její přesnosti

Statistická analýza jednorozměrných dat

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Lekce 1 úvod do ekonometrie

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Tomáš Karel LS 2012/2013

Cross-section pozorování Firma, člověk Časový úsek

4EK211 Základy ekonometrie

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Praktikum z ekonometrie Panelová data

STATISTICKÉ HYPOTÉZY

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

4EK201 Matematické modelování. 11. Ekonometrie

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

PRAVDĚPODOBNOST A STATISTIKA

VEKTOROVÉ AUTOREGRESE. APLIKACE V PROGNÓZOVÁNÍ.

LWS při heteroskedasticitě

Regresní a korelační analýza

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

5EN306 Aplikované kvantitativní metody I

4EK211 Základy ekonometrie

Intervalová data a výpočet některých statistik

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

BAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni

Pravděpodobnost, náhoda, kostky

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Dynamické metody pro predikci rizika

Normální (Gaussovo) rozdělení

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pojem endogenity a exogenity

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

Regresní a korelační analýza

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

UNIVERZITA KARLOVA V PRAZE. Flexicurita na českém trhu práce: aplikace v evropském kontextu

Transkript:

Heteroskedasticita

Přepoklady KLM a Gauss Markov teorém KLM Klasický lineární model 1) Lineární v parametrech ) E ε = 0 Blue odhad - GM Nezkreslený odhad 1) Lineární v parametrech ) E ε = 0 3) E( ȁ ε X)= 0 4) Není dokonalá multikolinearita 5) Var( ȁ ε X) = σ I 6) ε~n(0, σ ) 3) X je nestochastická (nenáhodná) matice 4) Není dokonalá multikolinearita - X má plnou hodnost 5) E εε = σ I 6) ε~n(0, σ )

Homoskedasticita Podmíněný rozptyl je konstatní Heteroskedasticita Podmíněný rozptyl NENÍ konstatní Var ȁ ε x = σ I Rozptyl ε, který je dán x, se nemění v závislosti se změnami x Rozptyl y, který je dán x, se nemění v závislosti se změnami x Platí Var ε i ȁx i = Var y i ȁx i = σ Rozptyl ε, který je dán x, se mění v závislosti se změnami x Rozptyl y, který je dán x, se mění v závislosti se změnami x Var ε i ȁx i = σ i wage Var( ε i ȁedu i ) = σ Podmíněný rozptyl náhodné složky se bude měnit v závislosti na hodnotě nezávislé proměnné (x) wage edu edu

Jak se mění rozptyl y, když se mění (roste) x? f( yȁx) y E( yȁx) = β 0 + β 1. x x 1 x x

Jak se mění rozptyl y, když se mění (roste) x? f( yȁx) y E( yȁx) = β 0 + β 1. x x 1 x x 3 x

5) E εε = σ I 5) Var( ȁ ε X) = σ I Var ε = E εε = E ε 1 ε. ε 1 ε ε 3 = ε 3 Var ȁ ε X = E ȁ εε X = E ε 1 ε. ε 1 ε ε 3 X = ε 3 = E ε 1 ε 1 ε 1 ε ε 1 ε 3 ε ε 1 ε ε ε ε 3 = ε 3 ε 1 ε 3 ε ε 3 ε 3 = E ε 1 ε 1 ε 1 ε ε 1 ε 3 ε ε 1 ε ε ε ε 3 ȁx = ε 3 ε 1 ε 3 ε ε 3 ε 3 E(ε 1 ε 1 ȁx) E(ε 1 ε ȁx) E(ε 1 ε 3 ȁx) E(ε ε 1 ȁx) E(ε ε ȁx) E(ε ε 3 ȁx) E(ε 3 ε 1 ȁx) E(ε 3 ε ȁx) E(ε 3 ε 3 ȁx) = E(ε 1 ε 1 ) E(ε 1 ε ) E(ε 1 ε 3 ) E(ε ε 1 ) E(ε ε ) E(ε ε 3 ) E(ε 3 ε 1 ) E(ε 3 ε ) E(ε 3 ε 3 ) σ 0 0 0 σ 0 = σ 0 0 σ 1 0 0 0 1 0 0 0 1 = σ I Nebudeme předpokládat autokorelaci Prvky mimo diagonálu budou =0

5) E εε = σ I Var(b) = Var(β + X X 1 X ϵ) 5) Var( ȁ ε X) = σ I Var b X = Var β + X X 1 X ϵ X Var b = Var[ X X 1 X ϵ] Var b X = Var X X 1 X ϵ X Var(b) = X X 1 X Var(ε) X X 1 X Var b X = X X 1 X Var ϵ X X X 1 X Var(b) = X X 1 X Var(ε)X X X 1 Var b = X X 1 X σ I X X X 1 X X 1 X X = I σ konstanta, lze vytknout před Var b = σ X X 1 Var b X = X X 1 X Var ϵ X X X X 1 Var b = X X 1 X σ I X X X 1 X X 1 X X = I σ konstanta, lze vytknout před Var b = σ X X 1 Pro nás reálnější předpoklad, že X je náhodná matice Můj osobní názor je, že se to pak dá i lépe pochopit Proto budu pracovat s podmíněným rozptylem, závěry jsou však stejné

Porušené klasického lineárního modelu heteroskedasticita Var ȁ ε X = E ȁ εε X = E ε 1 ε. ε 1 ε ε n X = ε n = E ε 1 ε 1 ε 1 ε ε 1 ε n ε ε 1 ε ε ε ε n ȁx = ε n ε 1 ε n ε ε n ε n E(ε 1 ε 1 ȁx) E(ε 1 ε ȁx) E(ε 1 ε n ȁx) E(ε ε 1 ȁx) E(ε ε ȁx) E(ε ε n ȁx) E(ε n ε 1 ȁx) E(ε n ε ȁx) E(ε n ε n ȁx) = σ 1 0 0 0 σ 0 0 0 σ n = V Var ε i ȁx i = σ i = E ε 1 ε 1 ε 1 ε ε 1 ε 3 ε ε 1 ε ε ε ε 3 ȁx = ε 3 ε 1 ε 3 ε ε 3 ε 3 σ 1 0 0 0 σ 0 0 0 σ 3 = V

b OLS = X X 1. X y = X X 1. X Xβ + ε = β + X X 1. X ε Var ȁ b OLS X = X X 1. X. Var εȁx. X. X X 1 σ 1 0 0 0 σ 0 0 0 σ n = V Var ε X = V Var ε X = σ I Var b OLS ȁx = X X 1. X. V. X. X X 1 Var b = X X 1 X σ I X X X 1 Var b hetero = X X 1 X V X X X 1 Var b OLS ȁx = σ X X 1 Var b homo = σ X X 1 OLS již není BLUE

Porušené klasického lineárního modelu heteroskedasticita Var(b) = X X 1 X Var(ε)X X X 1 Var(ε) σ I Var b X = X X 1 X Var ϵ X X X X 1 Var ϵ X σ I Var(b) σ X X 1 Var b X σ X X 1 b j t = sd b j KOVARIANČNÍ MATICE 5) Var( ȁ ε X) = σ I 5) Var(ε) = σ I Var b X = σ X X 1 Var b = σ X X 1 NEPLÉST

Důsledky heteroskedasticity Var(b) σ X X 1 Odhad rozptylu bodového odhadu (b) je zkreslený Var b j σn i=1 σ ε x ij xҧ (1 R j ) Nelze použít t-test, F-test, LM-test Konfidenční intervaly t = b j sd b j Var b j σn i=1 σ ε x ij xҧ (1 R j ) NEMÁ DOPAD NA ODHAD PARAMETRŮ β NEOVLIVNÍ ZKRESLENOST/NEZKRESLENOST pro konečný počet pozorování Pro velký počet pozorování large sample nemá vliv na konzistenci odhadu OLS odhad již není BLUE má vliv na vydatnost odhadu Tím, že pozoruje určitý vzorec jak residua (náhodná složka) např. rostou tak jsme nepostihli všechny informace v modelu a proto nemůže být BLUE (best) Bude jiný lepší (BLUE) estimator, který postihne tuto informaci Pro large sample velký počet pozorování Var b j nebude ani asymptoticky vydatny

Heteroskedasticita v průřezových datech Rozptyl náhodné složky, bude funkcí nezávislé (nezávislých) proměnných Var ȁ ε x = Var ȁ y x ε~n 0, σ I Var ε i ȁx i = σ i sav = β 0 + β 1 inc + ε Homoskedasticita Var ε inc = σ Var ε i ȁinc i = σ Var Var ȁ ε i x i = σ h(x i ) ȁ ε X = σ h(x) Heteroskedasticita Var ε inc = σ. h(inc) Var sav inc = σ. h(inc) Var ε i ȁ inc i = σ i sav S rostoucím příjmem roste variabilita úspor např. více možností S rostoucím vzděláním roste možnost uplatnění a tedy i mezd inc

Var ε x = σ. h(x) E ε X = σ. h(x) Var ȁ ε X = E ε 1 ε 1 ε ε 1 ε 3 ε ε 1 ε ε ε 3 ቮ ε 3 ε 1 ε 3 ε ε 3 X = E[ε 1 หX] E[ ε ε 1 ȁx] ȁ E[ε 3 ε 1 X] ȁ E[ε 1 ε X] E[ε หX] ȁ E[ε 3 ε X] ȁ E[ε 1 ε 3 X] ȁ E[ε ε 3 X] E[ε 3 หX] = E[ε 1 หX] 0 0 0 E[ε หX] 0 0 0 E[ε 3 หX] = σ. Ω Ω = h(x) 0 0 0 h(x) 0 0 0 h(x) Ω = h(inc) 0 0 0 h(inc) 0 0 0 h(inc)

sav = β Var εȁinc = σ 0 + β 1 inc + ε h(x) Var ε i ȁx i Víme = σ inc i S rostoucím příjmem roste variabilita úspor např. více možností Var ȁ ε X = E ε 1 ε 1 ε ε 1 ε 3 ε ε 1 ε 3 ε ε 3 ቮ ε 3 ε 1 ε 3 ε ε 3 inc = E[ε 1 หinc] 0 0 0 E[ε หinc] 0 0 0 E[ε 3 หinc] = = σ inc 1 0 0 0 inc 0 0 0 inc 3 Ω = h(inc) 0 0 0 h(inc) 0 0 0 h(inc) Ω = inc 1 0 0 0 inc 0 0 0 inc 3

Víme sav = β Var εȁinc = σ 0 + β 1 inc + ε h(x) Var ε i ȁx i = σ inc i S rostoucím příjmem roste variabilita úspor např. více možností Var ȁ ε X = E ε 1 ε 1 ε ε 1 ε 3 ε ε 1 ε 3 ε ε 3 ቮ ε 3 ε 1 ε 3 ε ε 3 inc = E[ε 1 หinc] 0 0 0 E[ε หinc] 0 0 0 E[ε 3 หinc] = = σ 0 inc 0 inc 1 0 0 0 0 inc 3 Ω = h(inc) 0 0 0 h(inc) 0 0 0 h(inc) Ω = inc 1 0 0 0 inc 0 0 0 inc 3

b OLS = X X 1. X y = X X 1. X Xβ + ε = β + X X 1. X ε E[ε 1 หX] 0 0 Var ȁ b OLS X = X X 1. X. Var εȁx. X. X X 1 0 E[ε หX] 0 0 0 E[ε 3 หX] = σ. Ω Var ε X = σ Ω Var ε X = σ I Ω = h(x) 0 0 0 h(x) 0 0 0 h(x) Var b OLS ȁx = X X 1. X. σ Ω. X. X X 1 Var b = X X 1 X σ I X X X 1 Var b hetero = σ X X 1 X Ω X X X 1 Var b OLS ȁx = σ X X 1 Var b homo = σ X X 1 OLS již není BLUE

Var ȁ ε x = Var ȁ y x Var ε x = σ Var sav inc = σ Var ε inc = σ y ε, e Homoskedasticita x x ε, e ε, e σ x, y x, y

Var ȁ ε x = Var ȁ y x y Var ε x = σ. h(x) ε, e Var sav inc = σ. h(inc) Var ε inc = σ. h(inc) Heteroskedasticita x x Nejprve předpokládejme, že známe h(x) h x = x Var ε x = σ. x ε, e ε, e h x = x Var ε x = σ. x h x = e x Var ε x = σ. e x x, y x, y

Příčiny existence heteroskedasticity Průřezová data Značně odlišné hodnoty v jednom modelu - outlier Variabilita závislé proměnné (y) závisí na některé nezávislé proměnné (x) Chybná specifikace modelu Vynechání důležité nezávislé proměnné Nevhodná funkční forma modelu log(wage) = β 0 + β 1 educ + ε wage = β 0 + β 1 educ + ε Chyby v měření S rostoucí hodnotou endogenní proměnné dochází ke kumulaci chyb měření to zvyšuje rozptyl endogenní proměnné a tedy i rozptyl reziduí

Přestože se dá usuzovat, že přímka proloží data nejlépe Po zobrazení residuí pozorujeme vzorec v residuích Zakřivení, trend atd. Uděláme log-transformaci, odmocninu Jak poznat kterou použít? Někdy matematická logika, ekonomická teorie A někdy prostě pokus/omyl Porovnat podle R - který lineární vztah je silnější pozor na rozdílné tvary závislé proměnné!!

brain = β 0 + β 1 weight + ε log brain = β 0 + β 1 log weight + ε

wage = β 0 + β 1 educ + ε log(wage) = β 0 + β 1 educ + ε

Var ε x = σ. h(x) Na ose y je hodnota vygenerované náhodné veličiny, ne její rozptyl!

Var ε x = σ. h(x)

Parametrické vs. Neparametrické testy Parametrické testy Známe (předpokládáme) konkrétní rozdělení základního souboru Park test Breusch-Pagan test (BP) Glejser test White test Neparametrické testy Neznáme konkrétní rozdělení základního souboru Spearman test korelace pořadí Goldfeld-Quandt test

Testování heteroskedasticity-parametrické testy Základní myšlenka ovlivňují nezávislé (X) proměnné rozptyl náhodné složky? y = β 0 + β 1. x 1 + β. x + + β k. x k + ε H0: Var ε x 1, x,, x k = σ H0: Var ε X = σ Var ε X = E(ε ȁx) = E ε = σ Var X = E X E X Var ε X = E ε X E ε X Reg.fce ε = γ 0 + γ 1. x 1 + γ. x + + γ k. x k + v H0: γ 1 = γ = = γ k = 0 γ 0 = σ H1: neplatí H0 F-test/LM test

Breusch-Pagan test Nepozorujeme náhodnou složku ε = γ 0 + γ 1. x 1 + γ. x + + γ k. x k + v H0: γ 1 = γ = = γ k = 0 H1: neplatí H0 H0: homoskedasticita H1: heteroskedasticita F-test/LM test e = γ 0 + γ 1. x 1 + γ. x + + γ k. x k + v LM = n. R e ~χ (k) při platnosti H0 málm asymptotické chi kvadrát rozdělení s k stupni volnosti Nevýhoda postihuje pouze lineární vztahy Rozptyl náhodné složky může záviset na X, X

White test Pro BP test jsme si řekli, že nepostihne nelineární vztah mezi rozptylem náhodné složky a X Jedno z možných řešení White test y = β 0 + β 1. x 1 + β. x + β 3. x 3 + ε Pomocná regrese x i x j kdy i j cross products e = α 0 + α 1 x 1 + α x + α 3 x 3 + α 4 x 1 + α 5 x + α 6 x 3 + α 7 x 1 x + α 8 x 1 x 3 + α 9 x x 3 + v Využití F testu, nebo LM testu H0: homoskedasticita H1: heteroskedasticita n. R ~χ (k) V případě více proměnných Snížený počet stupňů volnosti 10 x a 30 pozorování

V případě více proměnných snížený počet stupňů volnosti -10 x a 30 pozorování e = α 0 + α 1 y + α y + v H0: α 1 = α = 0 H1: neplatí H0 Postup: 1) Odhadnu rovnici a získám residua (e) a nafitované hodnoty y ) Pomocná regrese z kvadrátů residuí na nafitované hodnoty + jejich kvadráty 3) Vyhodnotím pomocí LM/F-testu Test lze využít i pro testování zvoleného funkčního tvaru

Glejser test Princip podobný jako u BP testu Má nezávislá proměnná vliv na kvadrát residuí Zde na residua v absolutní hodnotě Výhoda testu Můžeme testovat různé formy heteroskedasticity Různé funkční závislosti Vyhodnotíme na základě adjr Odhadneme pomocí MNČ e = β 0 + β 1 x + v e = β 0 + β 1 x + v e = β 0 + β 1 1 x + v e = β 0 + β 1 1 x + v H0: β 1 = 0 H1: β 1 0 homoskedasticita heteroskedasticita Jedná se o t-test

Heteroskedasticity-Robust inference Rozptyl bodobého odhadu (b) je v případě heteroskedasticity zkreslený Nemůžeme použít t,f,lm test, ani spoléhat na jejich asymptotické chování Potřebujeme takový odhad rozptylu, který nebude citlivý na přítomnost heteroskedasticity Říkáme, že bude robustní vůči heteroskedasticitě Například White dokázal, že pro velký počet pozorování je n Var(b 1 ) = σ i=1 σn i=1 x i xҧ e i x i xҧ Var(b 1 ) = σn i=1 σ x i xҧ Konzistentním odhadem rozptylu Můžeme tak použít t-test Pamatovat, že se však jedná o asymptotickou vlastnost t-test má pouze asymptotické t-rozdělení, F test má pouze asymptotické F rozdělení heteroskedastic robust t,lm-statistic Při malém počtu pozorování můžeme být úplně mimo Robustní odhad chyb může být větší i menší, než klasický odhad Nemusíme znát přesný tvar heteroskedasticity

White robust estimator Var(b 1 ) = σ n i=1 x i xҧ e i SST x Pro případ velkých výběrů je daný odhad robustní Přestože je v datech obsažena heteroskedasticita y = Xβ + ε e i residua z OLS nepozorujeme ε, tedy ani σ musíme odhadnout b = X X 1 X y b = β + X X 1 X ε Var b = X X 1 X Var(ε) X X X 1 Var b = X X 1 σ i x i x i X X 1 n i=1 n σ i x i x i i=1 Proč automaticky nevyužíváme tento robustní odhad? Asymptotické vlastnosti testů! V případě, kdy nebude přítomna heteroskedasticita A náhodná složka bude mít normální rozdělení t-test má právě studentovo rozdělení Var b = X X 1 n e i x i x i X X 1 V případě použití robustního odhadu chyb Bude mít t-test pouze asymptoticky studentovo rozdělení i=1

Autokorelace

6) Náhodné chyby jsou nekorelovaná mezi sebou E ε i ε j = 0 Corr ε i, ε j ȁx = 0 kdy i j Problém v časových řadách Náhodná chyba v čase (t), ovlivní náhodnou chybu v čase (t+1) Nezaměstnanost, HDP v 000 má vliv na HDP v 001 Corr ε i, ε j Chování souseda ovlivní další sousedy Dopad na OLS odhad: Obdobné jako heteroskedasticita Odhad parametrů stále nezkreslený a konzistentní (po splnění 1-4GM) Odhad rozptylu náhodné složky zkreslený Problém s testováním hypotéz = 0 kdy i j y y = β 0 + β 1 t + ε t

Dynamický charakter ekonomických veličin Minulost má dopad na přítomnost (budoucnost) Daný proces má paměť Dlouhou vs. Krátkou AR proces HDP t = γ 0 + γ 1 HDP t 1 + + γ 13 HDP t 1 + v t v t ~N(0, σ v ) Dynamický charakter zajistí Zpožděná závisle proměnná (y) Zpožděná nezávisle proměnná(é) Zpožděná náhodná složka (ε)

Zpožděná náhodná složka Faktory obsažené v náhodné složce v čase t, závisí na předchozí(ch) hodnotě(ách) náhodné složky ε t = ρ 1 ε t 1 + v t ρ 1 koeficient autokorelace (parametr) Autokorelace není závislost mezi dvěma a více proměnnými Ale jedná se o závislost mezi různými hodnotami JEDNÉ proměnné Zde náhodné složky ε t = ρ 1 ε t 1 + v t v t ~N(0, σ v ) ρ 1 < 1 autokorelační koeficient Daný proces má paměť Dlouhou vs. Krátkou ε t = ρ 1 ε t 1 + ρ ε t + + ρ j ε t j + v t y t = β 0 + β 1 x t + ε t ε t = ρ 1 ε t 1 + v t V průřezových datech mluvíme o prostorové autokorelaci

ε t = 0,9ε t 1 + v t ε t = 0,9ε t 1 + v t v t Znalost náhodné složky v konkrétním okamžiku, nám pomůže určit hodnotu náhodné složky v následujícím kroku

ε, e ε, e ε, e t t t ε, e ε, e ε, e t t t

Var ȁ ε X = E ȁ εε X = E ε 1 ε. ε 1 ε ε 3 X = E ε 3 ε 1 ε 1 ε 1 ε ε 1 ε 3 ε ε 1 ε ε ε ε 3 ȁx = ε 3 ε 1 ε 3 ε ε 3 ε 3 = E(ε 1 ε 1 ȁx) E(ε 1 ε ȁx) E(ε 1 ε 3 ȁx) E(ε ε 1 ȁx) E(ε ε ȁx) E(ε ε 3 ȁx) E(ε 3 ε 1 ȁx) E(ε 3 ε ȁx) E(ε 3 ε 3 ȁx) = seriová závislost/nezávislost = Var(ε 1 ) Cov(ε 1, ε ) Cov(ε 1, ε 3 ) Cov(ε, ε 1 ) Var(ε ) Cov(ε, ε 3 ) Cov(ε 3, ε 1 ) Cov(ε 3, ε ) Var(ε 3 ) σ 0 0 0 σ 0 = σ I 0 0 σ = σ Cov(ε 1, ε ) Cov(ε 1, ε 3 ) Cov(ε, ε 1 ) σ Cov(ε, ε 3 ) Cov(ε 3, ε 1 ) Cov(ε 3, ε ) σ Cov ε, ε 1 = ε. ε 1 = 0 ε t = ρ 1 ε t 1 + v t

Var ȁ ε X = E ȁ εε X = E ε 1 ε. ε 1 ε ε n X = ε n = E ε 1 ε 1 ε 1 ε ε 1 ε n ε ε 1 ε ε ε ε n ȁx = ε n ε 1 ε n ε ε n ε n E(ε 1 ε 1 ȁx) E(ε 1 ε ȁx) E(ε 1 ε n ȁx) E(ε ε 1 ȁx) E(ε ε ȁx) E(ε ε n ȁx) E(ε n ε 1 ȁx) E(ε n ε ȁx) E(ε n ε n ȁx) E(ε 1 ε ȁx) E(ε 1 ε n ȁx) Budeme rovnou uvažovat případ časových řad Jaký vztah je mezi náhodnou složkou v čase t a t-1 Jaký vztah je mezi náhodnou složkou v čase t a t-n ε t = ρ 1 ε t 1 + v t ε t = ρ 1 ε t 1 + ρ ε t + + ρ n ε t n + v t Bude záviset na řádu autokorelace

Příčiny vzniku Setrvačnost ekonomických veličin (paměť) HDP, export, import, volatilita, Zpožděná vysvětlující nezahrnutí zpožděných jak exogenních (X), tak endogenní proměnné (y) Chybná specifikace modelu Použijeme lineární model na nelineární vztah ukaž Chyby v měření Vynechaná důležitá nezávisle proměnná

Dopad na OLS odhad: Obdobné jako heteroskedasticita Odhad parametrů stále nezkreslený a konzistentní (po splnění 1-4GM) Odhad rozptylu náhodné složky zkreslený ε~n(0, σ ) Dopad na rozptyl bodových odhadů (b) Tím pádem i na t-test, F-test, LM test Var b je zkreslený Odhady již nejsou BLUE nejsou již vydatné (minimální rozptyl) Pro large sample ani asymptoticky vydatné

y t = β 0 + β 1 x t + ε t ε t = ρε t 1 + v t v t ~i. i. d. (0, σ v ) ρ < 1 b = β + X X 1 X ε E(b) = β + E X X 1 X ε E(b) = β + X X 1 X E(ε) Var b X = Var β + X X 1 X ϵ X Var b X = Var X X 1 X ϵ X Var b X = X X 1 X Var ϵ X X X X 1 Var b = X X 1 X σ I X X X 1 Var b = σ X X 1 Var b = X X 1 X σ Ω X X X 1

Testování autokorelace ε t = ρε t 1 + v t v t ~i. i. d. (0, σ v ) ρ < 1 autokorelační koeficient H0: ρ = 0 není sériová korelace H1: ρ 0 serivoá korelace Durbin-Watson Test-DW přísné podmínky použití Striktní exogenita nezávislých proměnných (nejsou ve zpoždění) Pouze pro autokorelaci prvního řádu Model obsahuje úrovňovou konstantu

Durbin-Watson Test-DW přísné podmínky použití Striktní exogenita nezávislých proměnných (nejsou ve zpoždění) Pouze pro autokorelaci prvního řádu Model obsahuje úrovňovou konstantu H0: ρ = 0 není sériová korelace H1: ρ 0 seriová korelace DW = σ n t= e t e t 1 σn t=1 e t DW. (1 ρ) H0: DW = H1: DW ρ = 0 DW ρ > 0 DW < ρ < 0 DW > okolí 4 negativní autokorelace okolí 0 pozitivní autokorelace okolí bez autokorelace DW statistika má symetrické rozdělení <0,4> se střední hodnotou = Závisí na: n-počet pozorování k-počet vysvětlujících proměnných Alfa-hladině významnosti

Problematické určení rozdělení DW pro H0 Máme kritické hodnoty d L dolní a d U horní DW < d L zamítneme H0 pro H1: ρ > 0 DW > d U Nezamítneme H0 d L DW d U neprukazný DW je z intervali 0, d L nebo 4 d L, 4 významná autokorelace DW je z intervali d U, 4 d U NEvýznamná autokorelace DW jinak, test je neprůkazný

Testy pro vyšší řády autokorelace house price = β 0 + β 1 GDP + ε ε t = ρ 1 ε t 1 + ρ ε t + ρ j ε t j + v t e t = ρ 1 e t 1 + ρ e t + ρ 3 e t 3 + ρ 4 e t 4 + v t H0: ρ 1 = ρ = ρ 3 = ρ 4 = 0 H1: neplatí H0