5EN306 Aplikované kvantitativní metody I

Podobné dokumenty
5EN306 Aplikované kvantitativní metody I

5. PŘEDNÁŠKA EKONOMETRICKÝ MODEL REGRESNÍ ANALÝZA DUMMIES VÍCENÁSOBNÁ REGRESE

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I

Praktikum z ekonometrie Panelová data

5EN306 Aplikované kvantitativní metody I

4EK211 Základy ekonometrie

Pojem endogenity a exogenity

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I

AVDAT Klasický lineární model, metoda nejmenších

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

Časové řady, typy trendových funkcí a odhady trendů

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Časové řady, typy trendových funkcí a odhady trendů

4EK211 Základy ekonometrie

5EN306 Aplikované kvantitativní metody I

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Základy ekonometrie. XI. Vektorové autoregresní modely. Základy ekonometrie (ZAEK) XI. VAR modely Podzim / 28

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy

4EK201 Matematické modelování. 11. Ekonometrie

4EK211 Základy ekonometrie

Měření dat Filtrace dat, Kalmanův filtr

Optimalizace provozních podmínek. Eva Jarošová

Karta předmětu prezenční studium

Základy ekonometrie. X. Regrese s časovými řadami. Základy ekonometrie (ZAEK) X. Regrese s časovými řadami Podzim / 47

6 Vícerovnicové ekonometrické soustavy 1

Odhady Parametrů Lineární Regrese

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Korelační a regresní analýza

5EN306 Aplikované kvantitativní metody I

LINEÁRNÍ MODELY. Zdeňka Veselá

Statistická analýza jednorozměrných dat

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných)

Cross-section pozorování Firma, člověk Časový úsek

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

Klasická a robustní ortogonální regrese mezi složkami kompozice

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Přednáška 4. Lukáš Frýd

T T. Think Together Marta Gryčová THINK TOGETHER

Lekce 1 úvod do ekonometrie

6. Lineární regresní modely

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

4EK211 Základy ekonometrie

FJFJ Cvičení 1. Lukáš Frýd

Testování hypotéz o parametrech regresního modelu

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

4EK211 Základy ekonometrie

Vícerozměrné metody. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Schematický úvod

Testování hypotéz a měření asociace mezi proměnnými

Úvodem Dříve les než stromy 3 Operace s maticemi

Tomáš Karel LS 2012/2013

4EK211 Základy ekonometrie

Regresní a korelační analýza

Zákony hromadění chyb.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

TECHNIKA UMĚLÝCH PROMĚNNÝCH V PRŮŘEZOVÉ ANALÝZE A V MODELECH ČASOVÝCH ŘAD

WORKSHEET 1: LINEAR EQUATION 1

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

Cvičení 9 dekompozice časových řad a ARMA procesy

Regresní analýza 1. Regresní analýza

6. Lineární regresní modely

Metoda backward výběru proměnných v lineární regresi a její vlastnosti

Intervalová data a výpočet některých statistik

AVDAT Nelineární regresní model

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Testování hypotéz o parametrech regresního modelu

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.

ELLENBERGOVY INDIKAČNÍ HODNOTY. David Zelený Zpracování dat v ekologii společenstev

4ST201 STATISTIKA CVIČENÍ Č. 10

Regresní a korelační analýza

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Regresní analýza. Eva Jarošová

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Aplikovaná statistika v R - cvičení 3

Bodové a intervalové odhady parametrů v regresním modelu

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA

Téma 9: Vícenásobná regrese

odpovídá jedna a jen jedna hodnota jiných

4EK211 Základy ekonometrie

Jemný úvod do statistických metod v netržním oceňování

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

PROGNÓZOVÁNÍ POMOCÍ EKONOMETRICKÝCH MODELŮ. ÚLOHA OČEKÁVÁNÍ V EKONOMII.

Diagnostika regrese pomocí grafu 7krát jinak

Tomáš Karel LS 2012/2013

Měření dat Filtrace dat, Kalmanův filtr

Transkript:

5EN306 Aplikované kvantativní metody I Přednáška 8 Zuzana Dlouhá

Předmět a struktura kurzu 1. Úvod: struktura empirických výzkumů 2. Tvorba ekonomických modelů: teorie 3. Data: zdroje a typy dat, význam popisných charakteristik 4. Vicenásobná regrese v ekonomické analýze 5. Vicenásobná regrese: DUMMY proměnné a jejich interakce 6. Difference in differences estimator 7. First Differencing a Fixed Effects 8. Instrumentální proměnné, Panelová data 9. Testy robustnosti 10. Úvod do časových řad (zbyde-li čas) témata se prolínají 2

Instrumentální proměnné minule: difference-in-differences identifikační strategie = způsob, jakým výzkumník využívá napozorovaná data (tedy data negenerována náhodně) k přiblížení se k reálnému (přirozenému) experimentu pozorovaná korelace X a Y nemusí nutně znamenat existenci kauzaly z důvodu možné existence nepozorovaných faktorů dnes: instrumentální proměnné (zkratka IV instrumental variables) Wooldridge kap. 15 3

Instrumentální proměnné instrumentální proměnné slouží k řešení problému endogeny endogena je v sociálních vědách a ekonomii prakticky všudepřítomná mnohé důležé proměnné se nedají měř velmi často jsou korelované s pozorovanými vysvětlujícími proměnnými endogenu způsobují i chyby měření vyskytuje se vždy vždy v modelech simultánních rovnic způsobuje, že odhady jsou vychýlené a nekonzistentní endogena se případně dá ignorovat, pokud u odhadů klíčových parametrů můžeme urč směr výchylky a udělat nějaký smysluplný závěr endogena se dá taky někdy řeš proxy proměnnými pokud máme panelová data metodami pro modely s fixními efekty (FD, FE, RE estimátory) 4

Instrumentální proměnné Definice instrumentálních proměnných nejsou v regresi jsou korelovány (kladně či záporně) s endogenní proměnnou instrument je relevantní; dá se testovat nejsou korelovány s chybou (IQ proto není dobrá IV); nedá se mnohdy testovat možné instrumentální proměnné: vzdělání otce, vzdělání matky, počet sourozenců, blízkost školy, měsíc narození (děti narozené po srpnu chodívají do školy až další školní rok) jednoduchý LRM předpokládáme exogenu: výše uvedené platí, když výběrové rozptyly a kovariance konvergují k populačním při zvyšování rozsahu souboru, OLS odhad je tedy konzistentní pouze při exogeně 5

Instrumentální proměnné jednoduchá regrese za předpokladu existence instrumentální proměnné z instrumentální proměnná z je nekorelována s chybou ale instrumentální proměnná z je korelována s vysvětlující proměnnou x 6

Statistická indukce s IV estimátorem IV estimátor má ve velkých souborech přibližně normální rozdělení pro výpočet standardních chyb obvykle potřebujeme předpoklad homoskedasticy podmíněně na instrumentální proměnné asymptotický rozptyl IV estimátoru je vždy větší než u OLS estimátoru čím větší je korelace mezi z a x, tím menší je asymptotický rozptyl IV estimátoru kak endogenní vysvětlující proměnná tak instrumentální proměnná mohou být binární proměnné pokud máme špatnou instrumentální proměnnou, může být IV estimátor mnohem nekonzistentnější než OLS estimátor IV estimátor horší než OLS estimátor když: slabý instrument: korelace mezi z a x je malá 7

Statistická indukce s IV estimátorem koeficient determinace po odhadu IV metodou může být záporný, protože SSR může být větší než SST při této metodě nemá přirozenou interpretaci a velký význam IV metoda je zaměřena na odhad ceteris paribus efektu, nikoliv na maximalizaci koeficientu determinace (pro potřeby predikce) IV odhad při vícenásobné regresi strukturní rovnice redukovaná rovnice proměnná z k je vyloučená exogenní proměnná (ze strukturní rovnice), je instrumentální proměnnou pro y 2 a koeficient u ní musí být nenulový 8

Statistická indukce s IV estimátorem podmínky exogeny k+1 rovnic pro k+1 odhadovaných parametrů podmínky pro z k nemůže být v odhadované strukturní rovnici musí být korelovaná s y 2 nesmí být korelovaná s u 1 můžeme mít i více instrumentálních proměnných, všechny musí splňovat výše uvedené podmínky (exclusion restrictions) nejlepší IV je pak lineární kombinace, která je nejvíce korelována s y 2 (ta je dána redukovanou formou) 9

Instrumentální proměnné v redukované formě jsou jednak původní exogenní proměnné (ze strukturní rovnice), jednak vyloučené (z původní strukturní rovnice) exogenní proměnné aspoň některý z koeficientů u vyloučených exogenních proměnných musí být nenulový, jinak by byla perfektní kolineara mezi instrumentální proměnnou danou redukovanou formou a původními exogenními proměnnými. Jinak řečeno nebyla by splněna tzv. hodnostní podmínka identifikace. IV odhad je ekvivalentní následujícímu postupu: 1. stupeň: regrese redukované formy 2. stupeň: ve 2. stupni jsou všechny proměnné exogenní, protože y 2 bylo nahrazeno svou predikovanou hodnotou závisející pouze na exogenní informaci. Jinak řečeno, y 2 je očištěno o svou endogenní část (část, která je vzájemně závislá s chybou). 10

2SLS = TSLS Vlastnosti 2SLS pozor při počítání obou stupňů zvlášť. Standardní chyby z 2. stupně nejsou platné. 2SLS ze software dodává správné. při jedné endogenní proměnné a jednom instrumentu IV=2SLS 2SLS můžeme použít i při více endogenních proměnných. Musí ale být splněny podmínky identifikace. Podmínky identifikace: řádová podmínka: Musíme mít alespoň stejný počet vyloučených exogenních proměnných jako je endogenních vysvětlujících proměnných ve strukturní rovnici. Tato podmínka je nutná podmínka pro identifikaci. hodnostní podmínka: narazili jsme na ni výše, je postačující podmínkou pro identifikaci. Použí 2SLS/IV při chybách měření pokud máme druhé měření proměnné s chybou měření, můžeme ho použít jako instrument 11

2SLS = TSLS Statistické vlastnosti 2SLS/IV estimátoru 2SLS/IV je konzistentní a asymptoticky normální za předpokladů analogických OLS, pouze podmiňujeme na instrumentálních proměnných 2SLS/IV je mnohem méně vydatnější než OLS rozptyl vyrovnané y 2 je menší než skutečné y 2 korelace mezi vyrovnanou y 2 a exogenními proměnnými je často mnohem větší než korelace mezi skutečnou y 2 a exogenními proměnnými často výrazný problém multikolineary tyto dva faktory působí na zvyšování rozptylu 2SLS estimátoru korekce heteroskedasticy/sériové korelace analogické OLS 2SLS/IV analogicky použelné pro časové řady a panelová data. 12

Test endogeny teorie, dosavadní výzkumy potřebujeme nějaký statistický test např. Hausmanův test (Gretl) kde z j jsou exogenní proměnné předpokládejme existenci dalších exogenních proměnných z 3 a z 4, které nejsou ve výše uvedené rovnici Postup 1. 2. y x z z u 1 0 1 2 1 3 2 x z z z z v y x z z v w 0 1 1 2 2 3 3 4 4 1 0 ˆ 1 2 1 3 2 3. t-test o δ: H 0 : δ = 0 H 1 : δ 0 pokud je x exogenní, pak 2SLS poskytuje vyšší standardní chyby odhadů (OLS je vydatnější) 13

Mzda vs. vzdělání (4) porovnáme odhad 0.075 vs 0.132 (konfidenční interval <0.024; 0.239>) co standardní chyby? neporovnávám R 2 u OLS vs IV (R 2 u OLS bude vždy vyšší, R 2 u IV může být i negativní R 2 = 1- SSR/SST, SSR > SST R 2 0) 14

Ukázka 1 Asensio Dráhy Asensio, J.: The success story of Spanish suburban railways: determinant of demand and policy, Transport Policy, Volume 7, Issue 4, October 2000, pp. 295-302 k dispozici na stránkách http://nb.vse.cz/~figlova/vyuka_5en306.html log RIDERSHIP 6 13 dummy log price lag _ rider e 14 0 1 log qualy 2 log 3 petrol log 4 pop suburb 5 RIDERSHIP - measured in passenger-kms (in area i, in time t) PRICE - is calculated as the ratio of total revenue in real terms over passengers-km at each urban area () QUALITY - the number of places_km offered by RENFE, divided by the length of the suburban rail network at each cy () PETROL - the real price of petrol () POP - total population living in the municipalies covered by RENFE's suburban network () SUB - the ratio of peripheral to central cy population () 15

Ukázka 1 Asensio Dráhy možný problém s endogenou regresorů? PRICE - is calculated as the ratio of total revenue in real terms over passengers-km at each urban area () změny cen pod kontrolou vlády OK QUALITY - the number of places_km offered by RENFE, divided by the length of the suburban rail network at each cy () zde by mohl být problém (počet míst mění RENFE v závislosti na poptávce) - IV 16

17 e rider lag dummy suburb pop petrol qualy price RIDERSHIP _ log log log log log 14 13 6 5 4 3 2 1 0 Ukázka 1 Asensio Dráhy

Ukázka 2 Levt Police force Levt (1997): what is the effect of increasing the police force on the crime rate? Aby byl efekt počtu policistů na kriminalu identifikován, je potřeba proměnná, která ovlivňuje počet policistů, ale není přímo spojena s kriminalou 59 měst USA, 1970-1992 This is a classic case of simultaneous causaly (high crime areas tend to need large police forces) resulting in an incorrectly-signed (posive) coefficient. To address this problem, Levt uses the timing of mayoral and gubernatorial elections as an instrumental variable. Is this instrument valid? Relevance: police force increases in election years Exogeney: election cycles are pre-determined. 18

Ukázka 2 Levt Police force Two-stage least squares: Stage 1: Decompose police hires into the component that can be predicted by the electoral cycle and the problematic component police = 0 + 1 election + Stage 2: Use the predicted value of police i from the first-stage regression to estimate s effect on crime i crime = 0 + 1 police-hat + Finding: an increased police force reduces violent crime (but has ltle effect on property crime) počet policistů snižuje zločinnost statisticky významný výsledek jen u násilných činů počet policistů ve velkých městech je pod optimální hranicí (ale pozor: velmi hrubé odhady) 19