5EN306 Aplikované kvantitativní metody I

Podobné dokumenty
5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I

Praktikum z ekonometrie Panelová data

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I

Přednáška 4. Lukáš Frýd

5EN306 Aplikované kvantitativní metody I

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

5EN306 Aplikované kvantitativní metody I

4EK211 Základy ekonometrie

5EN306 Aplikované kvantitativní metody I

Cross-section pozorování Firma, člověk Časový úsek

TECHNIKA UMĚLÝCH PROMĚNNÝCH V PRŮŘEZOVÉ ANALÝZE A V MODELECH ČASOVÝCH ŘAD

Základy ekonometrie. XI. Vektorové autoregresní modely. Základy ekonometrie (ZAEK) XI. VAR modely Podzim / 28

5EN306 Aplikované kvantitativní metody I

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Přepoklady KLM a Gauss Markov teorém. Blue odhad - GM. KLM Klasický lineární model. 1) Lineární v parametrech. 2) E ε = 0

5EN306 Aplikované kvantitativní metody I

4EK211 Základy ekonometrie

4EK201 Matematické modelování. 11. Ekonometrie

4EK211 Základy ekonometrie

5EN306 Aplikované kvantitativní metody I

Testování hypotéz o parametrech regresního modelu

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů

18AEK Aplikovaná ekonometrie a teorie časových řad. Řešení domácích úkolů č. 1 a 2 příklad 1

Testování hypotéz o parametrech regresního modelu

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

AVDAT Klasický lineární model, metoda nejmenších

Lekce 1 úvod do ekonometrie

Korelační a regresní analýza

Pojem endogenity a exogenity

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

5EN306 Aplikované kvantitativní metody I

Zkušenosti s použitím metod Counterfactual Impact Evaluation při evaluaci ESF v České republice. Jan Brůha IREAS

Statistická analýza jednorozměrných dat

5. PŘEDNÁŠKA EKONOMETRICKÝ MODEL REGRESNÍ ANALÝZA DUMMIES VÍCENÁSOBNÁ REGRESE

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

Regresní analýza. Eva Jarošová

Tomáš Karel LS 2012/2013

4EK211 Základy ekonometrie

Pravděpodobnost a aplikovaná statistika

4EK211 Základy ekonometrie

Základy ekonometrie. X. Regrese s časovými řadami. Základy ekonometrie (ZAEK) X. Regrese s časovými řadami Podzim / 47

Cvičení 9 dekompozice časových řad a ARMA procesy

Úvod do ekonometrie Minitesty

Tomáš Karel LS 2012/2013

Regrese. používáme tehdy, jestliže je vysvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA

Ilustrační příklad odhadu LRM v SW Gretl

AVDAT Geometrie metody nejmenších čtverců

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

PRAVDĚPODOBNOST A STATISTIKA

10. Předpovídání - aplikace regresní úlohy

Regresní analýza 1. Regresní analýza

5EN306 Aplikované kvantitativní metody I

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

Ekonometrie. Jiří Neubauer

PRAVDĚPODOBNOST A STATISTIKA

4EK211 Základy ekonometrie

Analýza rozptylu. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Srovnávání více než dvou průměrů

Úvodem Dříve les než stromy 3 Operace s maticemi

T T. Think Together Marta Gryčová THINK TOGETHER

Statistika II. Jiří Neubauer

4EK211 Základy ekonometrie

REGRESNÍ ANALÝZA NESTACIONÁRNÍCH EKONOMICKÝCH ČASOVÝCH ŘAD

AVDAT Nelineární regresní model

Inovace bakalářského studijního oboru Aplikovaná chemie

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Jednofaktorová analýza rozptylu

odpovídá jedna a jen jedna hodnota jiných

You created this PDF from an application that is not licensed to print to novapdf printer (

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Testování hypotéz a měření asociace mezi proměnnými

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

4EK211 Základy ekonometrie

Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných)

SEMINÁRNÍ PRÁCE Z 4ST432 Tereza Michlíková (xmict05) ZS 06/07

Základy ekonometrie. II. Netechnický úvod do regrese. Základy ekonometrie (ZAEK) II. Netechnický úvod do regrese Podzim / 67

Odhad parametrů N(µ, σ 2 )

Statistická analýza jednorozměrných dat

4EK211 Základy ekonometrie

EKONOMETRIE 9. přednáška Zobecněný lineární regresní model

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

INDUKTIVNÍ STATISTIKA

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Náklady a přínosy firemní diverzity

Prostorová variabilita

Zákony hromadění chyb.

METODY ODHADU REDUKOVANÉHO A STRUKTURNÍHO TVARU MODELŮ SIMULTÁNNÍCH ROVNIC.

Základy ekonometrie. I. Úvod do ekonometrie a práce s daty. Základy ekonometrie (ZAEK) I. Úvod do ekonometrie a práce s daty Podzim / 66

Transkript:

5EN306 Aplikované kvantitativní metody I Přednáška 9 Zuzana Dlouhá

Předmět a struktura kurzu 1. Úvod: struktura empirických výzkumů 2. Tvorba ekonomických modelů: teorie 3. Data: zdroje a typy dat, význam popisných charakteristik 4. Vicenásobná regrese v ekonomické analýze 5. Vicenásobná regrese: DUMMY proměnné a jejich interakce 6. Difference in differences estimator 7. First Differencing a Fixed Effects 8. Instrumentální proměnné, Panelová data 9. Testy robustnosti 10. Úvod do časových řad (zbyde-li čas) témata se prolínají 2

Panelová data (First differencing, Fixed Effects, ) minule: instrumentální proměnné identifikační strategie = způsob, jakým výzkumník využívá napozorovaná data (tedy data negenerována náhodně) k přiblížení se k reálnému (přirozenému) experimentu pozorovaná korelace X a Y nemusí nutně znamenat existenci kauzality z důvodu možné existence nepozorovaných faktorů Panelová data data, u kterých opakovaně pozorujeme charakteristiky statistických jednotek: roční míra nezaměstnanosti každého státu za několik let čtvrtletní prodeje každé z poboček Tesca za několik čtvrtletí mzda jedince v několika zaměstnáních podstata měříme stále stejnou statistickou jednotku (na rozdíl od pooled cross-section data náhodný výběr) definice vyrovnaného a nevyrovnaného panelu (balanced / unbalanced) krátký vs. dlouhý panel (práce s krátkými panely je podobnější práci s průřezovými údaji, práce s dlouhými panely práci s časovými řadami) Wooldridge kap. 13 a 14 3

Unobserved heterogeneity (unobserved effect) forma omitted variable bias problém k řešení: statistické jednotky i (jedinci, domácnosti, firmy, státy, ) se od sebe můžou lišit o specifické charakteristiky, které jsou v čase neměnné (nebo téměř neměnné): demografické geografické atd. to má vliv na měřenou (závislou) veličinu úrovňová konstanta pro každou ze statistických jednotek unobserved effect model nebo fixed effect model (v čase neměnné) příklad crime rate (různé způsoby reportování zločinů v různých státech USA, lokace) mzda vs. vzdělání (různá barva pleti, genetická zátěž, sociální zázemí apod.) neměřitelné vlivy (neměřitelný vliv je náhodná složka) tak dělíme na v čase neměnné fixed effects v čase proměnlivé náhodná složka u it jak bychom to řešili (odhad modelu)? přidat regresory? binární proměnné? 4

Vymezení problému panelová data (datová kostka) základní model: y t x w it it it je zde problematizován heterogenitou jednotek: y t x a u it it i it kde w it = a i + u it, a i = fixní, nepozorovaný efekt (nemění se v čase, ale je jiný pro každou pozorovanou jednotku) také nepozorovaná či individuální heterogenita u it = idiosynkratická chyba a i ovlivňuje Y a může být korelována i s X! a i jsou konstantní v čase, neměřitelné i když u it a x it jsou nekorelované, problém, pokud a i a x it korelované, tj. platí, že E(a i x it ) 0 omitted variable bias = heterogeneity bias pozn.: trend může být definován formou dummies 5

First differencing (první diference) princip: diference sousedních časových period ztrácíme jedno období pro každou jednotku (n) nejjednodušší - pro dvě časové periody y d2 x a u i 0 0 t 1 it i it Period 2: y ( ) x a u Period 1: i2 0 0 1 i2 i i2 y x a u i1 0 1 i1 i i1 First-differencing: y y ( x x ) u u i2 i1 0 1 i2 i1 i2 i1 y x u i2 0 1 i2 i2 fixní efekty jsou odstraněny (stále ale mohou být v čase proměnné faktory, které v modelu nemáme) 6

First differencing (první diference) Předpoklady Δu i není skorelované s Δx i (platí, pokud je u it nekorelovaná s x it v každém t) nenastáva podstatná heterogenita proměnlivá v čase homoskedasticita Δu i pro více časových period neautokorelace Δu it Δx i musí mít nějakou variabilitu přes i (problém, pokud x se v čase nemění nebo se mění o stejnou hodnotu neodseparujeme od a i ) příklad? Nedostatky redukce variability x (ztrácíme informaci) někdy se dá do určité míry obejít velkým počtem pozorování) někdy se používají diference přes delší časové periody hodně nízká variabilita (vysoké standardní chyby) některé charakteristiky se v čase vůbec nemění, či o konstantu nelze je použít (nelze je odseparovat od a i ) ztráta n pozorování stále tu mohou být faktory v čase proměnné 7

First differencing (první diference) Více časových period nezbavíme se faktoru času musíme řešit autokorelaci Δu it pro t = 2, 3, pokud je u it neautokorelovaná, pak Δu it autokorelovaná je: sousední pozorování náhodné složky ve FD u it u it-1 a u it+1 u it pokud u it ~ AR(1) pak Δu it autokorelované pokud u it ~ RW pak Δu it nekorelované 8

First differencing příklad 1 mzda příklad s více nezávislými proměnnými závislá proměnná: y it = logaritmus mzdy pracovníka i v čase t nezávislé proměnné: x it1 = lokální míra nezaměstnanosti pracovníka i v čase t = počet měsíců zkušeností pracovníka i v čase t x it2 x i3 a i = počet let vzdělání pracovníka i (v čase neměnná!!!) = talent pracovníka i (neměřitelná a zároveň v čase neměnná) Δy i2 = δ 0 + β 1 Δx i21 + β 2 Δx i22 + Δu i2 x i3 počet let vzdělání + a i talent pracovníka jsme metodou FD odstranili!!! Δx i22 bude rovna 12 pro skoro všechny pracovníky (méně než 12 pro nezaměstnané) nízká variabilita nepřesně odhadnut koeficient β 2 vysoké standardní chyby významný heterogeneity bias!!! 9

First differencing příklad 2 kriminalita míra kriminality: období 1982 a 1987 46 měst USA míra nezaměstnanosti (v %) a míra kriminality (počet zločinů na 1000 obyvatel) hledám negativní vztah a významnost!!! rok 1987 po FD Interpretace 15,4 = nárůst kriminality o 15,40 na 1000 obyvatel mezi obdobími 1982 až 1987 bez změny nezaměstnanosti 2,22 = vzroste-li nezaměstnanost o 1 %, vzroste počet zločinů o 2,22 na 1000 obyvatel 10

First differencing příklad 3 školení Účastníci školení měřím kauzální efekt účastníků školení nezávislé proměnné účast na školení, individuální charakteristiky, závislá proměnná mzdy, produktivita práce, t = 2 období po absolvování školení y d2 prog a u, t 1,2 it t it i it first differencing model: y prog u i i i model OLS: y treat y control náhodná složka v it = a i + u it kontroluje v čase neměnné charakteristiky firem: účastník školení: prog it = 1 nezúčastnil se školení: prog it = 0 11

Fixed effects model přístup č. 2 k dohadu panelových dat Jak odseparovat fixní efekty a i + neztratit pozorování? uvažujme model: zprůměrujme rovnici v čase pro každé i: kde např.: odečtu obě rovnice od sebe tímto jsme odstranili fixní efekty a i poslední rovnice je tzv. time-demeaned odhadneme pooled data OLS metodou tento estimátor se nazývá within-estimátor, protože využívá rozptyl v čase v rámci (within) průřezových jednotek pokud bychom odhadli model přímo z průměrů (neodečetli bychom rovnice mezi sebou) metodou OLS, jednalo by se o betweenestimátor není nestranný 12

Fixed effects model Předpoklady opět striktní exogenita x it homoskedasticita u it neautokorelace u it (musíme řešit i pro 2 periody) Nedostatky ztratíme proměnné konstantní v čase (wage = f(sex, race, ) proměnné konstantní v čase můžeme použít v interakcích (educ*časová dummy) proměnné měnící se o konstantu neodlišíme od trendu jestli do modelu dáme všechny časové dummies, nemůžeme odhadnout efekt proměnných, jejichž změna v čase je konstantní (např. počet let zkušeností) počet stupňů volnosti je N*T-N-k (tato úprava je nutná, protože navíc odhadujeme N*průměry) 13

Fixed effects model Předpoklady opět striktní exogenita x it homoskedasticita u it neautokorelace u it (musíme řešit i pro 2 periody) Nedostatky ztratíme proměnné konstantní v čase (wage = f(sex, race, )) proměnné konstantní v čase můžeme použít v interakcích (educ*časová dummy) proměnné měnící se o konstantu neodlišíme od trendu jestli do modelu dáme všechny časové dummies, nemůžeme odhadnout efekt proměnných, jejichž změna v čase je konstantní (např. počet let zkušeností) počet stupňů volnosti je N*T-N-k (tato úprava je nutná, protože navíc odhadujeme N*průměry) Pozitiva neztrácíme pozorování po FE odhadu můžeme fixní efekty odhadnout: 14

Fixed effects model nebo First difference? když T = 2, FE a FD jsou identické když T > 2, FE je vydatnější než FD, pokud jsou splněny předpoklady KLRM pokud náhodná složka u it neautokorelovaná, pak lepší FE pokud náhodná složka u it generována RW, pak lepší FD obecně se spíše používají FE, ale je vhodné aplikovat obojí a porovnávají se výsledky pokud dlouhé časové řady (T velké) a problém s nestacionaritou (hrozí zdánlivá regrese), pak může být FD lepší variantou (speciálně máme-li málo jednotek) také závisí, zda nás zajímají odhady a i 15

Fixed Effects příklad Cornwell, Trumbull (1994) Cornwell, Ch., Trumbull, W. N.: Estimating the Economic Model of Crime with Panel Data; The Review of Economics and Statistics, Vol. 76, No. 2 (May, 1994), pp. 360-366 k dispozici na stránkách: https://webhosting.vse.cz/figlova/5en306/ cíl: zpřesnit odhady elasticit nabídky zločinů (elasticita proto použili log-log model): Pa pravděpodobnost zadržení Pc pravděpodobnost odsouzení Pp pravděpodobnost uvěznění S závažnost trestu logicky odhady elasticit by měli být záporné (zvyšují očekávané náklady nebo-li znižují očekávaný užitek) dosavadní výzkum: Ehrlich (1973) -0,52 Pp; -0,59 S; Carr-Hill &Stern (1973) -0,59 Pp; -0,17 S 16

Fixed Effects příklad Cornwell, Trumbull (1994) založeno na maximalizaci očekávaného užitku rozhodnutí porovnání výnosů a nákladů max Y i = zisk ze zločinu (monetární ekvivalent) E(u i ) = očekávaný užitek jedince F i = monetární ekvivalent trestu v případě dopadení, předpoklad Y i < F i p i = pravděpodobnost potrestání u i = užitková funkce 17

Fixed Effects příklad Cornwell, Trumbull (1994) Data: panelová data agregátní za jednotlivé kraje Severní Karolína, N = 90; T = 7 Zdroje: FBI's Uniform Crime Reports věznice probation files of the North Carolina Department of Correction Motivace: města mohou mít specifické kulturní a jiná charakteristiky Zdroje endogeneity: unobserved heterogeneity simultaneita Strategie: kontrola fixních efektů jednotlivých oblastí mnoho důvodů k obavám o odlišnostech 18

Fixed Effects příklad Cornwell, Trumbull (1994) Model ALL BETWEEN (průměry) Fixed effects model R it podíl zločinů zaznamenaných FBI na populaci X it návratnost z legálních aktivit (mzda, věk, rasa, ) P it pravděpodobnosti (zadržení, odsouzení, ) α i fixní efekty (můžou být skorelovány s X it a P it ) ε i náhodná složka Between (průměry) použít v případě, když X it a P it jsou neskorelovány s nepozorovanou heterogenitou (unobserved heterogeneity) 19

Cornwell, Trumbull odhad Between model 20

Cornwell, Trumbull odhad Fixed Effects model F-test: fixní efekty jsou významné 21

Dummy variable regresssion další způsob odhadu fixních efektů dummy proměnná pro každé pozorování (každou statistickou jednotku) máme N+k parametrů oproti FE máme hodně odhadovaných parametrů relativně vysoký koeficient determinace 22

Random Effects Model předpoklad: a i a X nejsou korelovány: cov(a i, x itj ) = 0 za tohoto předpokladu je náhodná chyba a i + u it nekorelovaná s vysvětlujícími proměnnými, ale je sériově korelovaná pro pozorování pocházející z jednoho i: y x v, t 1,2,..., T vit ai uit it it it vysvětlující proměnné jsou exogenní, takže pooled OLS estimátor je konzistentní v tomto případě musíme upravit standardní chyby, protože chyby pro dané i jsou korelovány v čase (clusterované standardní chyby) OLS není kvůli sériové korelaci vydatný následujícím způsobem můžeme transformovat model, aby splňoval G- M předpoklady: y y (1 ) ( x x )... ( v v ), t 1,2,..., T it i it i it i parametr λ neznáme, ale můžeme ho odhadnout RE estimátor 23

Random Effects Model pokud je náhodný efekt relativně nevýznamný vzhledem k idiosynkratické chybě, dá RE estimátor výsledek blízký pooled OLS estimátoru ( λ 0) pokud je náhodný efekt relativně významný vzhledem k idiosynkratické chybě, dá RE estimátor výsledek blízký FE estimátoru (λ 1) RE estimátor funguje i pro časově invariantní proměnné v ekonomii jsou nepozorované individuální efekty málokdy nekorelované s vysvětlujícími proměnnými, což svědčí ve prospěch FE estimátoru možno otestovat, jestli máme použít spíše FE nebo RE (Hausmanův test v Gretlu) 24

Cornwell, Trumbull odhad Random Effects model 25

Cornwell, Trumbull odhad Random Effects model Breusch-Pagan LM test: zamítam hypotézu o tom, že efekty nejsou náhodné (tj. efekty jsou náhodné Hausman test: existuje systematický rozdíl mezi FE a RE odhadem RE odhady nekonzistentní, FE odhady konzistentní (volím) 26

Random Effects Model Výhody: můžeme do modelu vložit proměnné, které se v čase nemění neztrácíme stupně volnosti Nevýhody: přísný a silný předpoklad exogenity a i v případě, že a i jsou korelovány s některými vysvětlujícími proměnnými musíme použít FD anebo FEM 27

Shrnutí předpokladů pro FE estimátor máme náhodný výběr z průřezových jednotek všechny vysvětlující proměnné se aspoň pro některá i mění v čase a neexistuje perfektní lineární kombinace mezi vysvětlujícími proměnnými regresory jsou striktně exogenní podmíněně na fixním efektu rozptyl idiosynkratických chyb podmíněně na všech regresorech je konstantní neexistuje autokorelace mezi idiosynkratickými chybami idiosynkratické chyby mají normální rozdělení podmíněně na všech regresorech 28

Shrnutí předpokladů pro RE estimátor máme náhodný výběr z průřezových jednotek neexistuje perfektní lineární kombinace mezi vysvětlujícími proměnnými regresory jsou striktně exogenní v tom je obsaženo, že E(a i X i ) = const Rozptyl chyb podmíněně na všech regresorech je konstantní v tom je obsaženo, že Var(a i X i ) = const neexistuje autokorelace mezi chybami chyby mají normální rozdělení podmíněně na všech regresorech 29