5EN306 Aplikované kvantitativní metody I

Podobné dokumenty
5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

Korelační a regresní analýza

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

4EK211 Základy ekonometrie

Bodové a intervalové odhady parametrů v regresním modelu

Testování hypotéz o parametrech regresního modelu

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

Testování hypotéz o parametrech regresního modelu

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

odpovídá jedna a jen jedna hodnota jiných

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I

4EK211 Základy ekonometrie

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

5EN306 Aplikované kvantitativní metody I

AVDAT Klasický lineární model, metoda nejmenších

Základy ekonometrie. XI. Vektorové autoregresní modely. Základy ekonometrie (ZAEK) XI. VAR modely Podzim / 28

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

4EK211 Základy ekonometrie

5EN306 Aplikované kvantitativní metody I

AVDAT Geometrie metody nejmenších čtverců

Inovace bakalářského studijního oboru Aplikovaná chemie

Regresní analýza 1. Regresní analýza

5EN306 Aplikované kvantitativní metody I

6. Lineární regresní modely

18AEK Aplikovaná ekonometrie a teorie časových řad. Řešení domácích úkolů č. 1 a 2 příklad 1

5EN306 Aplikované kvantitativní metody I

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných)

LINEÁRNÍ REGRESE. Lineární regresní model

4EK201 Matematické modelování. 11. Ekonometrie

Statistická analýza jednorozměrných dat

5EN306 Aplikované kvantitativní metody I

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Tomáš Karel LS 2012/2013

Základy lineární regrese

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

Aplikovaná statistika v R - cvičení 3

Přepoklady KLM a Gauss Markov teorém. Blue odhad - GM. KLM Klasický lineární model. 1) Lineární v parametrech. 2) E ε = 0

LINEÁRNÍ MODELY. Zdeňka Veselá

PRAVDĚPODOBNOST A STATISTIKA

6. Lineární regresní modely

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový.

Regresní analýza. Eva Jarošová

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Ilustrační příklad odhadu LRM v SW Gretl

Praktikum z ekonometrie Panelová data

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Ekonometrie. Jiří Neubauer

4EK211 Základy ekonometrie

Cvičící Kuba Kubina Kubinčák Body u závěrečného testu

Statistika II. Jiří Neubauer

Regresní a korelační analýza

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

EKONOMETRIE 9. přednáška Zobecněný lineární regresní model

Regrese. používáme tehdy, jestliže je vysvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

Základy ekonometrie. X. Regrese s časovými řadami. Základy ekonometrie (ZAEK) X. Regrese s časovými řadami Podzim / 47

4EK211 Základy ekonometrie

TECHNIKA UMĚLÝCH PROMĚNNÝCH V PRŮŘEZOVÉ ANALÝZE A V MODELECH ČASOVÝCH ŘAD

PRAVDĚPODOBNOST A STATISTIKA

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Základy ekonometrie. II. Netechnický úvod do regrese. Základy ekonometrie (ZAEK) II. Netechnický úvod do regrese Podzim / 67

Smíšené regresní modely a možnosti jejich využití. Karel Drápela

Úvodem Dříve les než stromy 3 Operace s maticemi

Přednáška 4. Lukáš Frýd

Odhady Parametrů Lineární Regrese

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

4EK211 Základy ekonometrie

Testování statistických hypotéz

PRAVDĚPODOBNOST A STATISTIKA

Bodové a intervalové odhady parametrů v regresním modelu

Regresní a korelační analýza

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Regresní a korelační analýza

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

AVDAT Nelineární regresní model

Metoda backward výběru proměnných v lineární regresi a její vlastnosti

ZOBECNĚNÝ LINEÁRNÍ REGRESNÍ MODEL. METODA ZOBECNĚNÝCH NEJMENŠÍCH ČTVERCŮ

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Ilustrační příklad odhadu SM v SW Gretl

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica

Statistická analýza jednorozměrných dat

Časové řady, typy trendových funkcí a odhady trendů

Transkript:

5EN306 Aplikované kvantitativní metody I Přednáška 5 Zuzana Dlouhá

Předmět a struktura kurzu 1. Úvod: struktura empirických výzkumů 2. Tvorba ekonomických modelů: teorie 3. Data: zdroje a typy dat, význam popisných charakteristik 4. Vicenásobná regrese v ekonomické analýze 5. Vicenásobná regrese: DUMMY proměnné a jejich interakce 6. Difference in differences estimator 7. First Differencing a Fixed Effects 8. Instrumentální proměnné, Panelová data 9. Testy robustnosti 10. Úvod do časových řad (zbyde-li čas) témata se prolínají 2

Základy ekonometrie vícenásobná regrese kap. 3 vícenásobný lineární regresní model lepší analýza ceteris paribus, protože explicitně umožňuje kontrolovat ostatní faktory, které simultánně ovlivňují vysvětlovanou proměnnou vytvořit lepší model pro predikci vysvětlované proměnné zahrnout obecnější funkční formy lineární regrese lineární v parametrech, ne v proměnných!!! 3

Základy ekonometrie vícenásobná regrese MNČ ve vícenásobné regresi: náhodný výběr rezidua (odchylky) regrese minimalizuji sumu čtverců rezidui interpretace ceteris paribus 4

Základy ekonometrie vlastnosti MNČ vlastnosti MNČ pro každý výběr odhadnuté (fitované) hodnoty a rezidua algebraické vlastnosti MNČ: suma reziduí je rovna 0 korelace reziduí a vysvětlujících proměnných je rovna 0 výběrové průměry regresorů x a y leží na regresní přímce koeficient determinace 5

Základy ekonometrie G-M předpoklady Gauss-Markovy předpoklady 1. Populační model je lineární v parametrech: 2. Výběrový soubor o velikosti n je získán z populace náhodným výběrem: 3. Neexistuje perfektní kolinearita mezi regresory malý výběr: vztahy mezi regresory: 4. Podmíněná střední hodnota náhodné složky je rovna 0: 6

Základy ekonometrie G-M předpoklady Endogenní vs. exogenní proměnné předpoklad 4 je splněn, pokud jsou všechny vysvětlující (exogenní) proměnné nezávislé na náhodné složce, v případě závislosti jsou endogenní, endogenita je tedy porušení předpokladu 4 naopak, závislá (endogenní) proměnná modelu je funkcí systematické i náhodné složky pokud jsou splněny předpoklady 1 až 4 je MNČ estimátor nestranný (Theorem 3.1 Unbiasedness of OLS) Irelevantní a chybějící proměnné chyby specifikace modelu (ne)zahrnutí regresorů pokud zahrneme do modelu irelevantní proměnnou (přespecifikujeme model), nemá chyba specifikace žádný efekt na nestrannost estimátorů (očekávaná hodnota příslušného koeficientu je nula) pozor, může mít negativní efekt na rozptyl estimátorů pokud nezahrneme do modelu relevantní proměnnou (model podspecifikujeme), estimátory mohou být vychýlené 7

Základy ekonometrie G-M předpoklady Zahrnutí irelevantní proměnné skutečná (populační) regresní funkce: odhadovaná rovnice (v populační regresní funkci platí β 3 = 0): při dohadu MNČ platí pro konkrétní výběr (i = 1, 2,, n) obecně platí β 3 0 je-li výběrová korelace mezi x 3 a ostatními regresory nenulová, pak se rozptyl estimátorů zvýší 8

Základy ekonometrie chybějící regresory Chybějící regresory skutečná (populační) regresní funkce: odhadovaná rovnice (vynechám důležitou proměnnou x 2 ): jsou-li x 1 a x 2 korelované, předpokládejme mezi nimi lineární regresní vztah ve formě: odhadnuté koeficienty budou vychýlené (biased) β 1 = β 1 + β 2 δ 1 E β 1 = β 1 + β 2 δ 1 Bias β 1 = E β 1 β 1 = β 2 δ 1 9

Základy ekonometrie chybějící regresory odchylka (bias) závisí na znaménku β 2 a na znaménku u korelace mezi regresory δ 1 při stejných znaménkách je odchylka pozitivní, při rozdílných negativní: předpokládejme obecnější model vynecháme x 3 nelze obecně/snadno popsat směr či mechanismus odchylky podobně komplikovaná situace nastane při vynechání více než jedné důležité vysvětlující proměnné 10

Základy ekonometrie chybějící regresory příklad skutečná (populační) regresní funkce platí kladné hodnoty když vynecháme abil: potom odhadnutý efekt vzdělání educ bude nadhodnocený (overestimated) Kdy není estimátor vychýlený při vynechání regresoru? regresory jsou navzájem nekorelované (δ 1 = 0) vynechaná proměnná je irelevantní (nepatří do skutečné (populační) regresní funkce) 11

Základy ekonometrie G-M předpoklady 5. Podmíněný rozptyl náhodné složky je konstantní a konečný (homoskedasticita) kde tento předpoklad 5 není pro nestrannost MNČ nutný (nedodržení negativně ovlivňuje rozptyl MNČ estimátorů) 12

Základy ekonometrie G-M předpoklady pokud jsou splněny předpoklady 1 až 5, jsou rozptyly estimátorů podmíněně na hodnotách vysvětlujících proměnných v daném výběru dány vztahem (Theorem 3.2 Sampling variances of OLS slope estimators) pomocné regrese x j ostatní regresory. pokud jsou splněny předpoklady 1 až 5, je nestranný estimátor rozptylu náhodné složky dán vztahem standardní chyba odhadu 13

Základy ekonometrie G-M předpoklady β j rozptyl každého estimátoru se zvyšuje s rostoucím rozptylem náhodných složek σ 2 a se zvyšující se lineární závislostí mezi x j a 2 ostatními regresory R j rozptyl každého estimátoru se snižuje s výberovým rozptylem příslušné proměnné SST j multikolinearita vysoká korelace mezi dvěma či více vysvětlujícími proměnnými (je vlastností konkrétního výběru) hodnota VIF by neměla přesahovat hodnotu 10 pro případ únosné multikolinearity zařazení irelevantní proměnné zvyšuje rozptyl estimátoru, pokud existuje lineární závislost mezi x j a irelevantním regresorem tj. pokud 2 irelevantní proměnná zvýší R j β j 14

Základy ekonometrie G-M předpoklady Vynechání důležité vysvětlující proměnné: odhady jsou zkreslené může dojít ke snížení rozptylu estimátorů pokud jsou splněny předpoklady 1 až 5, tak je nestranný estimátor rozptylu náhodné složky dán vztahem (Theorem 3.3 - Unbiased estimator of the error variance): pokud jsou splněny předpoklady 1 až 5, je MNČ nejlepším lineárním nestranným estimátorem β BLUE Best Linear Unbiased Estimator, kde lineární znamená: libovolná funkce výběrových pozorování všech regresorů a nejlepší - má mezi všemi lineárními nestrannými estimátory nejmenší rozptyl 15

Základy ekonometrie statistická indukce kap. 4 v KLRM je pro intervalový odhad k pěti G-M předpokladům přidán předpoklad normality (Theorem 4.1 Normal sampling distributions) náhodné složky jsou normálně rozdělené a nezávislé na předpoklad 6 dubluje G-M předpoklady 2, 4 a 5, navíc přidává normalitu náhodné složky pokud je splněno všech šest předpokladů KLRM, mají MNČ estimátory nejmenší rozptyl ze všech možných nestranných estimátorů pro KLRM předpoklady 1-5 (tj. G-M předpoklady) je MNČ nejlepší jen ze všech lineárních nestranných estimátorů Pokud je splněno všech šest předpokladů KLRM, platí: 1. variabilita y x pochází z náhodné složky 2. je-li náhodná složka normálně rozdělena, řídí se β také N-rozdělením 3. normovaná odchylka odhadnutého parametru od skutečného: 16

Základy ekonometrie statistická indukce pokud je splněno všech šest předpokladů KLRM, platí při rostoucích stupních volnosti se t-rozdělení přibližuje normovanému normálnímu rozdělení, pokud je počet stupňů volnosti vyšší než 120, je rozdíl prakticky zanedbatelný pravostranný (right-tail) pro t > t* zamítneme H 0 17

Základy ekonometrie statistická indukce levostranný (left-tail) pro t < -t* zamítneme H 0 oboustranný (two-sided / two-tail t-test) pro І t І > t* zamítneme H 0 18

Testy hypotéz v KLRM alternativní t-testy Oboustranný (two-sided / two-tail t-test) H 0 : β 1 = 0 H 0 : β 1 = 0,3 H 0 : β 1 = 0,3 H 1 : β 1 0 H 1 : β 1 0,3 H 1 : β 1 0,3 t = 0,5091 0 0,0357 = 14,24 t = 0,5091 0,3 0,0357 = 5,86 t = t* = 2,306 (α = 0,05, d.f. = 8), v tabulkách two-tailed 0,5091 ( 0,3) 0,0357 = 22,66 19

Testy hypotéz v KLRM alternativní t-testy Jednostranný (one-sided / one-tail t-test) pravostranný (right-tail) H 0 : β 1 0,3 H 1 : β 1 > 0,3 t = 0,5091 0,3 0,0357 = 5,86 t* = 1,860 (α = 0,05, d.f. = 8), v tabulkách one-tailed t > t* zamítám H 0 levostranný (left-tail) H 0 : β 1 0,3 H 1 : β 1 < 0,3 t = 0,5091 0,3 0,0357 = 5,86 t * = 1,860 (α = 0,05, d.f. = 8), v tabulkách one-tailed t > t * nezamítám H 0 20

Testy hypotéz v KLRM alternativní t-testy Jednostranný (one-sided / one-tail t-test) pravostranný (right-tail) H 0 : β 1 0,3 H 1 : β 1 > 0,3 t = 0,5091 ( 0,3) 0,0357 = 22,66 t* = 1,860 (α = 0,05, d.f. = 8), v tabulkách one-tailed t > t* zamítám H 0 levostranný (left-tail) H 0 : β 1 0,3 H 1 : β 1 < 0,3 t = 0,5091 ( 0,3) 0,0357 = 22,66 t * = 1,860 (α = 0,05, d.f. = 8), v tabulkách one-tailed t > t * nezamítám H 0 21

Testy hypotéz v KLRM alternativní t-testy 22

Testy hypotéz v KLRM dílčí F-test pro libovolnou podmnožinu regresorů zpravidla pro skupinu souvisejících proměnných (např. dummies) k včetně úrovňové konstanty neomezený (unrestricted) model omezený (restricted) model 23

Funkční tvar v LRM obecně nás zajímá, jaký efekt závislé proměnné vyvolá marginální změna j-té vysvětlující proměnné level-level FoodExp i = 94,201 + 0,437TotalExp i zvýšení celkových výdajů o 1 rupii vyvolá v průměru zvýšení výdajů na jídlo o 0,437 rupie level-log FoodExp i = 1283,910 + 257,270 ln TotalExp i zvýšení celkových výdajů o 1 % vyvolá v průměru zvýšení výdajů na jídlo o 2,573 rupie (dělím 100) log-level ln expservices t = 7,789 + 0,007time výdaje na služby rostli čtvrtletně v průměru o 0,7 % (násobím 100) log-log ln expdur t = 9,697 + 1,906 ln pcexp t elasticita zvýšení celkových výdajů o 1 % vyvolá v průměru zvýšení výdajů na předměty dlouhodobé spotřeby o 1,91 % 24