5EN306 Aplikované kvantitativní metody I

Podobné dokumenty
5EN306 Aplikované kvantitativní metody I

4EK211 Základy ekonometrie

5. PŘEDNÁŠKA EKONOMETRICKÝ MODEL REGRESNÍ ANALÝZA DUMMIES VÍCENÁSOBNÁ REGRESE

4EK211 Základy ekonometrie

5EN306 Aplikované kvantitativní metody I

4EK211 Základy ekonometrie

5EN306 Aplikované kvantitativní metody I

4EK211 Základy ekonometrie

Korelační a regresní analýza

5EN306 Aplikované kvantitativní metody I

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

4EK211 Základy ekonometrie

5EN306 Aplikované kvantitativní metody I

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

Testování hypotéz o parametrech regresního modelu

5EN306 Aplikované kvantitativní metody I

Testování hypotéz o parametrech regresního modelu

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

5EN306 Aplikované kvantitativní metody I

Tomáš Karel LS 2012/2013

LINEÁRNÍ REGRESE. Lineární regresní model

4EK211 Základy ekonometrie

Tomáš Karel LS 2012/2013

5EN306 Aplikované kvantitativní metody I

Bodové a intervalové odhady parametrů v regresním modelu

TECHNIKA UMĚLÝCH PROMĚNNÝCH V PRŮŘEZOVÉ ANALÝZE A V MODELECH ČASOVÝCH ŘAD

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

AVDAT Klasický lineární model, metoda nejmenších

18AEK Aplikovaná ekonometrie a teorie časových řad. Řešení domácích úkolů č. 1 a 2 příklad 1

4EK211 Základy ekonometrie

5EN306 Aplikované kvantitativní metody I

4EK211 Základy ekonometrie

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Lineární regrese. Komentované řešení pomocí MS Excel

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Ilustrační příklad odhadu LRM v SW Gretl

Odhady Parametrů Lineární Regrese

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

odpovídá jedna a jen jedna hodnota jiných

4EK201 Matematické modelování. 11. Ekonometrie

Inovace bakalářského studijního oboru Aplikovaná chemie

Přepoklady KLM a Gauss Markov teorém. Blue odhad - GM. KLM Klasický lineární model. 1) Lineární v parametrech. 2) E ε = 0

Regresní a korelační analýza

Regrese. používáme tehdy, jestliže je vysvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA

Regresní analýza. Eva Jarošová

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

Statistická analýza jednorozměrných dat

Základy ekonometrie. XI. Vektorové autoregresní modely. Základy ekonometrie (ZAEK) XI. VAR modely Podzim / 28

Odhad parametrů N(µ, σ 2 )

INDUKTIVNÍ STATISTIKA

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

5EN306 Aplikované kvantitativní metody I

Regresní analýza 1. Regresní analýza

PRAVDĚPODOBNOST A STATISTIKA

5EN306 Aplikované kvantitativní metody I

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

EKONOMETRIE 9. přednáška Zobecněný lineární regresní model

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

Základy lineární regrese

Regresní a korelační analýza

5EN306 Aplikované kvantitativní metody I

ZOBECNĚNÝ LINEÁRNÍ REGRESNÍ MODEL. METODA ZOBECNĚNÝCH NEJMENŠÍCH ČTVERCŮ

Cvičící Kuba Kubina Kubinčák Body u závěrečného testu

Praktikum z ekonometrie Panelová data

Téma 9: Vícenásobná regrese

Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných)

Úvodem Dříve les než stromy 3 Operace s maticemi

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

Zkušenosti s použitím metod Counterfactual Impact Evaluation při evaluaci ESF v České republice. Jan Brůha IREAS

Regresní a korelační analýza

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

Lineární a logistická regrese

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.

5EN306 Aplikované kvantitativní metody I

EKONOMICKÁ APLIKACE KOMPOZIČNÍHO REGRESNÍHO MODELU

StatSoft Jak poznat vliv faktorů vizuálně

4ST201 STATISTIKA CVIČENÍ Č. 10

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Pravděpodobnost a matematická statistika

Odhad parametrů N(µ, σ 2 )

PRAVDĚPODOBNOST A STATISTIKA

6. Lineární regresní modely

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Základy ekonometrie. V. Uvolnění klasických předpokladů heteroskedasticita. Základy ekonometrie (ZAEK) V. Heteroskedasticita Podzim / 56

AVDAT Geometrie metody nejmenších čtverců

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Jana Vránová, 3. lékařská fakulta, UK Praha

Jemný úvod do statistických metod v netržním oceňování

REGRESNÍ ANALÝZA NESTACIONÁRNÍCH EKONOMICKÝCH ČASOVÝCH ŘAD

KORELACE. Komentované řešení pomocí programu Statistica

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Korelace. Komentované řešení pomocí MS Excel

Transkript:

5EN306 Aplikované kvantitativní metody I Přednáška 6 Zuzana Dlouhá

Předmět a struktura kurzu 1. Úvod: struktura empirických výzkumů 2. Tvorba ekonomických modelů: teorie 3. Data: zdroje a typy dat, význam popisných charakteristik 4. Vicenásobná regrese v ekonomické analýze 5. Vicenásobná regrese: DUMMY proměnné a jejich interakce 6. Difference in differences estimator 7. First Differencing a Fixed Effects 8. Instrumentální proměnné, Panelová data 9. Testy robustnosti 10. Úvod do časových řad (zbyde-li čas) témata se prolínají 2

Základy ekonometrie funkční formy kap. 6 k logaritmům nepřesnost se zvyšuje s množstvím procent výpočet přesné procentuální změny (když Δx = 1): % y = 100(e β 1) Kvadratická závislost první rok zkušeností (exper) zvyšuje mzdu o cca 0,30 USD, druhý rok zvyšuje o 0,298 2*(0,0061)*1 = 0,029 USD atd. maximální mzda: znamená to, že po 24,4 roce klesají výnosy ze zkušeností? (ne, záleží kolik dat leží vpravo od 24,4, je to 28%, např. problém specifikace) 3

Základy ekonometrie funkční formy další př. efekt znečištění na cenu domu minimum funkce: nárůst místností z 5 na 6 můžeme ignorovat (pouze 1% z celkového počtu) nárůst místností ze 6 na 7 4

Základy ekonometrie funkční formy Kubická závislost Interagující proměnné (interaction terms) efekt počtu ložnic (bdrms) závisí na její rozloze (sqrft) interakční efekt důležité je vyhodnocení efektu jedné interagující proměnné při zajímavých hodnotách druhé interagující proměnné (např. průměr) 5

Základy ekonometrie funkční formy + výběr regresorů Reparametrizace modelu interagujících proměnných Výhody efekt x 2 za předpokladu průměrných hodnot všech ostatních proměnných jednoduchá interpretace všech parametrů k dispozici standardní chyby parciálních efektů na průměrné hodnotě v případě potřeby možný nápočet efektů na jiných hodnotách než na průměru 6

Základy ekonometrie funkční formy + výběr regresorů Výběr regresorů pokud přidáme do modelu libovolnou další vysvětlující proměnnou, koeficient determinace neklesne (obvykle se zvýší) nemá smysl se bezhlavě snažit o zvyšování koeficientu determinace nestrannost nijak nesouvisí s velikostí koeficientu determinace, záleží na splnění G-M předpokladů nízký koeficient determinace znamená, že SSR je vysoký v porovnání s SST pokud ale máme velký soubor, můžeme se i tak dostat k relativně přesným odhadům koeficientů adjustovaný (korigovaný) koeficient determinace při přidání proměnné může i klesnout 7

Základy ekonometrie výběr regresorů Výběr regresorů - zahnízděné modely (nested models) modely jsou zahnízděné, pokud je můžeme dostat ze vše zahrnujícího modelu (tj. zahrnujícího všechny proměnné, které přicházejí v úvahu a jejich mocniny - tzv. obecný model) lineárními omezeními parametrů vždy se snažíme o co nejjednodušší model u obecného modelu otestujeme F-testem (nebo LM testem) příslušná lineární omezení parametrů a pokud můžeme, přejdeme k jednoduššímu modelu Výběr regresorů - nezahnízděné modely vybírám model 2 8

Základy ekonometrie výběr regresorů Výběr regresorů jiná forma závislé proměnné tady výběr modelu na základě statistické významnosti a hodnot koeficientů (vybírám druhý model) 9

Základy ekonometrie výběr regresorů Kontrola na příliš mnoho faktorů v regresní analýze nemá cenu dávat zároveň proměnnou tax a beercons pamatujte na ceteris paribus interpretaci zvýšení daně zvýší cenu piva a tedy sníží spotřebu piva a to bude mít efekt na nehody když máme v modelu obě proměnné, koeficient u daně nám říká, jaký je efekt daně na nehodovost při nezměněné spotřebě piva, a to moc nedává smysl 10

Dummy proměnné a jejich interakce kap. 7 kvalitativní informace pohlaví, region, rasa, rating, jedním ze způsobů jak zahrnout kvalitativní proměnnou je její použití jako dummy proměnnou závislá i nezávislá 11

Dummy proměnné a jejich interakce Dummy proměnná trap (past) perfektní kolinearita mezi male a female vynechám buď male nebo female nebo odhadnu model bez konstanty: složitě testovat rozdíly mezi parametry koeficient determinace platný jenom u modelů s konstantou příklad 12

Dummy proměnné a jejich interakce příklad - je účinný grantový program pro školení při zaměstnání? dummy proměnná v regresi s log(y) 13

Dummy proměnné a jejich interakce Víc kategorií důležité která kategorie bude vynechána základní máme 4 vynechán single man, vůči němu pak interpretuji koeficienty Ordinální informace vhodnější formulace 14

Dummy proměnné a jejich interakce Interakce?? muži a?? ženy hypotéza výnosy ze vzdělání stejné pro muže i ženy: hypotéza celá rovnice stejná pro muže i ženy: 15

Dummy proměnné a jejich interakce Chowův test testuje jestli je regresní funkce různá pro různé skupiny neomezený model (všechny interakce) College grade point average Standardized aptitude test score High school rank percentile Total hours spent in college courses omezený model nulová hypotéza (všechny interakční efekty jsou nulové, tedy regresní koeficienty jsou stejné pro muže i ženy) 16

Dummy proměnné a jejich interakce Chowův test pokračování testovací statistika sdružený test Testujeme-li individuálně, nemůžeme odmítnout hypotézu, že jednotlivé interakční efekty jsou nulové. zamítám hypotézu H 0 17

Dummy proměnné a jejich interakce Asensio, J.: The success story of Spanish suburban railways: determinants of demand and policy implications, Transport Policy, Volume 7 (4), 10/2000, pp. 295-302 k dispozici na stránkách https://webhosting.vse.cz/figlova/5en306/ 18

Dummy proměnné a jejich interakce Zietz et al. : Determinants of House Prices: A Quantile Regression Approach: Department of Economics and Finance Working Paper Series; Middle Tennessee State University, May 2007 k dispozici na stránkách https://webhosting.vse.cz/figlova/5en306/ 19

Binární závislá proměnná lineární pravděpodobnostní model 20

Binární závislá proměnná příklad zaměstnanost ženy graf pro nwifeinc=50, exper=5, age=30, kindslt6=1, kidsge6=0 21

Binární závislá proměnná náhodná složka nemá normální rozdělení (má binomické rozdělení), čili důležité jsou asymptotické vlastnosti estimátorů je zde heteroskedasticita, takže na standardní chyby odhadů se nemůžeme moc spoléhat predikovaná pravděpodobnost může být mimo přípustný interval efekt vysvětlující proměnné na predikovanou pravděpodobnost je lineární většinou se chová dobře kolem průměrných hodnot vysvětlujících proměnných pro posouzení kvality modelu se zejména používá procento správně predikovaných hodnot logit a probit modely (přesahují rámec kurzu) také pracují s binární závislou proměnnou a některé nedostatky LPM odstraňují 22

Heteroskedasticita - příčiny kap. 8 chybná specifikace modelu vynechání podstatné vysvětlující proměnné nevhodná funkční forma modelu odhad z prostorových dat se značnou variabilitou v jednom náhodném výběru variabilita endogenní proměnné (a tedy i reziduí) může být závislá na některé exogenní proměnné chyby měření s rostoucí hodnotou endogenní proměnné dochází ke kumulaci chyb měření to zvyšuje rozptyl endogenní proměnné a tedy i rozptyl reziduí odhad z upravených dat odhad nikoliv na původních pozorováních, ale např. ze skupinových průměrů získaných z tříděných dat u lineárního pravděpodobnostního modelu vždy 23

Heteroskedasticita - důsledky nemá vliv na nestrannost a konzistenci MNČ estimátoru interpretace koeficientu determinace se nemění odhady směrodatných chyb bodových odhadů (s bi ) a rozptylu sigma (s 2 ) jsou vychýlené intervalové odhady nejsou směrodatné statistické testy (t-testy, F-test) ztrácejí na síle byly vyvinuty asymptoticky platné vzorečky pro OLS standardní chyby a související statistiky robustní vůči heteroskedasticitě neznámé formy White-Eickerovy standardní chyby, gretl: HC0 obvyklý t-test je asymptoticky platný (použijeme-li robustní standardní chyby) obvyklá F-statistika při heteroskedasticitě platná není, ale většina softwaru poskytuje verzi robustní vůči heteroskedasticitě 24

Heteroskedasticita Whiteův test nemá vliv na nestrannost a konzistenci MNČ estimátoru parametrický test 25

Heteroskedasticita WLS vážené nejmenší čtverce je známá funkční forma heteroskedasticity příklad 26

Heteroskedasticita WLS transformovaný model je homoskedastický WLS je vydatnější než OLS v původním modelu, protože pozorování s velkým rozptylem a tedy méně informativní než ta s malým rozptylem mají při odhadu menší váhu WLS je speciálním případem Metody zobecněných nejmenších čtverců GLS (generalized least squares) Důležitý zvláštní případ heteroskedasticity pokud jsou pozorované údaje průměry (za město, oblast, zemi, firmu...), měly by být váženy velikostí příslušné jednotky pokud nevíme, jestli jsou chyby na úrovni individuí homoskedastické, můžeme při OLS na transformovaném modelu aplikovat robustní chyby 27

Heteroskedasticita FGLS feasible generalized LS použije se, když neznáme funkční formu heteroskedasticity předpoklad exponenciální funkční formy (rozptyl nemůže být záporný) inverzní hodnoty této odhadnuté funkce použijeme jako váhy při WLS FGLS je konzistentní a asymptoticky vydatnější než OLS 28

Heteroskedasticita FGLS příklad odhad MNČ odhad FGLS 29

Heteroskedasticita FGLS pokud použijeme chybnou funkční formu heteroskedasticity, jsou FGLS (WLS) estimátory konzistentní (za předpokladu, že jsou ostatní G-M předpoklady splněny), ale měli bychom pracovat s robustními standardními chybami pokud se OLS a FGLS (WLS) odhady velmi liší, obvykle to indikuje, že některý další G-M předpoklad není splněn, může indikovat také chybnou specifikaci LRM při silné heteroskedasticitě je často lepší použít chybnou funkční formu heteroskedasticity než žádnou zvýšíme tím vydatnost použití exponenciální funkční formy ve FGLS je poměrně sofistikované, můžeme ale vyjít i z mnohem jednodušší funkční formy, historicky se využíval třeba Whiteův test 30

Heteroskedasticita WLS v LPM v LPM známe přesně funkční formu heteroskedasticity WLS neproveditelné, pokud jsou LPM predikce menší než nula či větší než jedna pokud těchto případů není mnoho, můžeme takové predikce nahradit třeba hodnotami 0,01 či 0,99 (resp. jinými ad-hoc zvolenými hodnotami blízkými hranici intervalu 0-1) Další možnosti řešení heteroskedasticity v LPM: lze použít FGLS (ignorujeme známou funkční formu heteroskedasticity) lze vynechat všechna pozorování vedoucí k predikcím mimo interval 0-1 (nenáhodný výběr!) lze použít OLS s robustními standardními chybami (odhad není vydatný) 31