5EN306 Aplikované kvantitativní metody I Přednáška 5 Zuzana Dlouhá
Předmět a struktura kurzu 1. Úvod: struktura empirických výzkumů 2. Tvorba ekonomických modelů: teorie 3. Data: zdroje a typy dat, význam popisných charakteristik 4. Vicenásobná regrese v ekonomické analýze 5. Vicenásobná regrese: DUMMY proměnné a jejich interakce 6. Difference in differences estimator 7. First Differencing a Fixed Effects 8. Instrumentální proměnné, Panelová data 9. Testy robustnosti 10. Úvod do časových řad (zbyde-li čas) témata se prolínají 2
Základy ekonometrie vícenásobná regrese kap. 3 vícenásobný lineární regresní model lepší analýza ceteris paribus, protože explicitně umožňuje kontrolovat ostatní faktory, které simultánně ovlivňují vysvětlovanou proměnnou vytvořit lepší model pro predikci vysvětlované proměnné zahrnout obecnější funkční formy lineární regrese lineární v parametrech, ne v proměnných!!! 3
Základy ekonometrie vícenásobná regrese MNČ ve vícenásobné regresi: náhodný výběr rezidua (odchylky) regrese minimalizuji sumu čtverců rezidui interpretace ceteris paribus 4
Základy ekonometrie vlastnosti MNČ vlastnosti MNČ pro každý výběr odhadnuté (fitované) hodnoty a rezidua algebraické vlastnosti MNČ: suma reziduí je rovna 0 korelace reziduí a vysvětlujících proměnných je rovna 0 výběrové průměry regresorů x a y leží na regresní přímce koeficient determinace 5
Základy ekonometrie G-M předpoklady Gauss-Markovy předpoklady 1. Populační model je lineární v parametrech: 2. Výběrový soubor o velikosti n je získán z populace náhodným výběrem: 3. Neexistuje perfektní kolinearita mezi regresory malý výběr: vztahy mezi regresory: 4. Podmíněná střední hodnota náhodné složky je rovna 0: 6
Základy ekonometrie G-M předpoklady Endogenní vs. exogenní proměnné předpoklad 4 je splněn, pokud jsou všechny vysvětlující (exogenní) proměnné nezávislé na náhodné složce, v případě závislosti jsou endogenní, endogenita je tedy porušení předpokladu 4 naopak, závislá (endogenní) proměnná modelu je funkcí systematické i náhodné složky pokud jsou splněny předpoklady 1 až 4 je MNČ estimátor nestranný (Theorem 3.1 Unbiasedness of OLS) Irelevantní a chybějící proměnné chyby specifikace modelu (ne)zahrnutí regresorů pokud zahrneme do modelu irelevantní proměnnou (přespecifikujeme model), nemá chyba specifikace žádný efekt na nestrannost estimátorů (očekávaná hodnota příslušného koeficientu je nula) pozor, může mít negativní efekt na rozptyl estimátorů pokud nezahrneme do modelu relevantní proměnnou (model podspecifikujeme), estimátory mohou být vychýlené 7
Základy ekonometrie G-M předpoklady Zahrnutí irelevantní proměnné skutečná (populační) regresní funkce: odhadovaná rovnice (v populační regresní funkci platí β 3 = 0): při dohadu MNČ platí pro konkrétní výběr (i = 1, 2,, n) obecně platí β 3 0 je-li výběrová korelace mezi x 3 a ostatními regresory nenulová, pak se rozptyl estimátorů zvýší 8
Základy ekonometrie chybějící regresory Chybějící regresory skutečná (populační) regresní funkce: odhadovaná rovnice (vynechám důležitou proměnnou x 2 ): jsou-li x 1 a x 2 korelované, předpokládejme mezi nimi lineární regresní vztah ve formě: odhadnuté koeficienty budou vychýlené (biased) β 1 = β 1 + β 2 δ 1 E β 1 = β 1 + β 2 δ 1 Bias β 1 = E β 1 β 1 = β 2 δ 1 9
Základy ekonometrie chybějící regresory odchylka (bias) závisí na znaménku β 2 a na znaménku u korelace mezi regresory δ 1 při stejných znaménkách je odchylka pozitivní, při rozdílných negativní: předpokládejme obecnější model vynecháme x 3 nelze obecně/snadno popsat směr či mechanismus odchylky podobně komplikovaná situace nastane při vynechání více než jedné důležité vysvětlující proměnné 10
Základy ekonometrie chybějící regresory příklad skutečná (populační) regresní funkce platí kladné hodnoty když vynecháme abil: potom odhadnutý efekt vzdělání educ bude nadhodnocený (overestimated) Kdy není estimátor vychýlený při vynechání regresoru? regresory jsou navzájem nekorelované (δ 1 = 0) vynechaná proměnná je irelevantní (nepatří do skutečné (populační) regresní funkce) 11
Základy ekonometrie G-M předpoklady 5. Podmíněný rozptyl náhodné složky je konstantní a konečný (homoskedasticita) kde tento předpoklad 5 není pro nestrannost MNČ nutný (nedodržení negativně ovlivňuje rozptyl MNČ estimátorů) 12
Základy ekonometrie G-M předpoklady pokud jsou splněny předpoklady 1 až 5, jsou rozptyly estimátorů podmíněně na hodnotách vysvětlujících proměnných v daném výběru dány vztahem (Theorem 3.2 Sampling variances of OLS slope estimators) pomocné regrese x j ostatní regresory. pokud jsou splněny předpoklady 1 až 5, je nestranný estimátor rozptylu náhodné složky dán vztahem standardní chyba odhadu 13
Základy ekonometrie G-M předpoklady β j rozptyl každého estimátoru se zvyšuje s rostoucím rozptylem náhodných složek σ 2 a se zvyšující se lineární závislostí mezi x j a 2 ostatními regresory R j rozptyl každého estimátoru se snižuje s výberovým rozptylem příslušné proměnné SST j multikolinearita vysoká korelace mezi dvěma či více vysvětlujícími proměnnými (je vlastností konkrétního výběru) hodnota VIF by neměla přesahovat hodnotu 10 pro případ únosné multikolinearity zařazení irelevantní proměnné zvyšuje rozptyl estimátoru, pokud existuje lineární závislost mezi x j a irelevantním regresorem tj. pokud 2 irelevantní proměnná zvýší R j β j 14
Základy ekonometrie G-M předpoklady Vynechání důležité vysvětlující proměnné: odhady jsou zkreslené může dojít ke snížení rozptylu estimátorů pokud jsou splněny předpoklady 1 až 5, tak je nestranný estimátor rozptylu náhodné složky dán vztahem (Theorem 3.3 - Unbiased estimator of the error variance): pokud jsou splněny předpoklady 1 až 5, je MNČ nejlepším lineárním nestranným estimátorem β BLUE Best Linear Unbiased Estimator, kde lineární znamená: libovolná funkce výběrových pozorování všech regresorů a nejlepší - má mezi všemi lineárními nestrannými estimátory nejmenší rozptyl 15
Základy ekonometrie statistická indukce kap. 4 v KLRM je pro intervalový odhad k pěti G-M předpokladům přidán předpoklad normality (Theorem 4.1 Normal sampling distributions) náhodné složky jsou normálně rozdělené a nezávislé na předpoklad 6 dubluje G-M předpoklady 2, 4 a 5, navíc přidává normalitu náhodné složky pokud je splněno všech šest předpokladů KLRM, mají MNČ estimátory nejmenší rozptyl ze všech možných nestranných estimátorů pro KLRM předpoklady 1-5 (tj. G-M předpoklady) je MNČ nejlepší jen ze všech lineárních nestranných estimátorů Pokud je splněno všech šest předpokladů KLRM, platí: 1. variabilita y x pochází z náhodné složky 2. je-li náhodná složka normálně rozdělena, řídí se β také N-rozdělením 3. normovaná odchylka odhadnutého parametru od skutečného: 16
Základy ekonometrie statistická indukce pokud je splněno všech šest předpokladů KLRM, platí při rostoucích stupních volnosti se t-rozdělení přibližuje normovanému normálnímu rozdělení, pokud je počet stupňů volnosti vyšší než 120, je rozdíl prakticky zanedbatelný pravostranný (right-tail) pro t > t* zamítneme H 0 17
Základy ekonometrie statistická indukce levostranný (left-tail) pro t < -t* zamítneme H 0 oboustranný (two-sided / two-tail t-test) pro І t І > t* zamítneme H 0 18
Testy hypotéz v KLRM alternativní t-testy Oboustranný (two-sided / two-tail t-test) H 0 : β 1 = 0 H 0 : β 1 = 0,3 H 0 : β 1 = 0,3 H 1 : β 1 0 H 1 : β 1 0,3 H 1 : β 1 0,3 t = 0,5091 0 0,0357 = 14,24 t = 0,5091 0,3 0,0357 = 5,86 t = t* = 2,306 (α = 0,05, d.f. = 8), v tabulkách two-tailed 0,5091 ( 0,3) 0,0357 = 22,66 19
Testy hypotéz v KLRM alternativní t-testy Jednostranný (one-sided / one-tail t-test) pravostranný (right-tail) H 0 : β 1 0,3 H 1 : β 1 > 0,3 t = 0,5091 0,3 0,0357 = 5,86 t* = 1,860 (α = 0,05, d.f. = 8), v tabulkách one-tailed t > t* zamítám H 0 levostranný (left-tail) H 0 : β 1 0,3 H 1 : β 1 < 0,3 t = 0,5091 0,3 0,0357 = 5,86 t * = 1,860 (α = 0,05, d.f. = 8), v tabulkách one-tailed t > t * nezamítám H 0 20
Testy hypotéz v KLRM alternativní t-testy Jednostranný (one-sided / one-tail t-test) pravostranný (right-tail) H 0 : β 1 0,3 H 1 : β 1 > 0,3 t = 0,5091 ( 0,3) 0,0357 = 22,66 t* = 1,860 (α = 0,05, d.f. = 8), v tabulkách one-tailed t > t* zamítám H 0 levostranný (left-tail) H 0 : β 1 0,3 H 1 : β 1 < 0,3 t = 0,5091 ( 0,3) 0,0357 = 22,66 t * = 1,860 (α = 0,05, d.f. = 8), v tabulkách one-tailed t > t * nezamítám H 0 21
Testy hypotéz v KLRM alternativní t-testy 22
Testy hypotéz v KLRM dílčí F-test pro libovolnou podmnožinu regresorů zpravidla pro skupinu souvisejících proměnných (např. dummies) k včetně úrovňové konstanty neomezený (unrestricted) model omezený (restricted) model 23
Funkční tvar v LRM obecně nás zajímá, jaký efekt závislé proměnné vyvolá marginální změna j-té vysvětlující proměnné level-level FoodExp i = 94,201 + 0,437TotalExp i zvýšení celkových výdajů o 1 rupii vyvolá v průměru zvýšení výdajů na jídlo o 0,437 rupie level-log FoodExp i = 1283,910 + 257,270 ln TotalExp i zvýšení celkových výdajů o 1 % vyvolá v průměru zvýšení výdajů na jídlo o 2,573 rupie (dělím 100) log-level ln expservices t = 7,789 + 0,007time výdaje na služby rostli čtvrtletně v průměru o 0,7 % (násobím 100) log-log ln expdur t = 9,697 + 1,906 ln pcexp t elasticita zvýšení celkových výdajů o 1 % vyvolá v průměru zvýšení výdajů na předměty dlouhodobé spotřeby o 1,91 % 24