5EN306 Aplikované kvantitativní metody I



Podobné dokumenty
5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I

5. PŘEDNÁŠKA EKONOMETRICKÝ MODEL REGRESNÍ ANALÝZA DUMMIES VÍCENÁSOBNÁ REGRESE

5EN306 Aplikované kvantitativní metody I

4EK211 Základy ekonometrie

5EN306 Aplikované kvantitativní metody I

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

5EN306 Aplikované kvantitativní metody I

4EK211 Základy ekonometrie

PRAVDĚPODOBNOST A STATISTIKA

Transportation Problem

Cross-section pozorování Firma, člověk Časový úsek

Praktikum z ekonometrie Panelová data

4EK211 Základy ekonometrie

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

Next line show use of paragraf symbol. It should be kept with the following number. Jak může státní zástupce věc odložit zmiňuje 159a.

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

4ST201 STATISTIKA CVIČENÍ Č. 10

4EK211 Základy ekonometrie

FJFJ Cvičení 1. Lukáš Frýd

PRAVDĚPODOBNOST A STATISTIKA

Téma 8. Náklady kapitálu. Kapitálová struktura a její optimalizace

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Aplikovaná statistika v R - cvičení 3

Zkušenosti s použitím metod Counterfactual Impact Evaluation při evaluaci ESF v České republice. Jan Brůha IREAS

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Daně a odvody zaměstnanců :

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Úvodem Dříve les než stromy 3 Operace s maticemi

Regresní analýza. Eva Jarošová

Abychom věděli, o čem mluvíme

4EK211 Základy ekonometrie

Korelační a regresní analýza

2.2 Kalibrace a limity její p esnosti

LINEÁRNÍ REGRESE. Lineární regresní model

Design Experimentu a Statistika - AGA46E

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

Karta předmětu prezenční studium

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

WORKSHEET 1: LINEAR EQUATION 1

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Základy ekonometrie. XI. Vektorové autoregresní modely. Základy ekonometrie (ZAEK) XI. VAR modely Podzim / 28

Social Media a firemní komunikace

5EN306 Aplikované kvantitativní metody I

Automatizované metody výběru podmnožiny vysvětlujících proměnných v regresním modelu a problémy s nimi spojené

Gymnázium, Brno, Slovanské nám. 7 WORKBOOK. Mathematics. Teacher: Student:

Využití a zneužití statistických metod v medicíně

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Téma 9: Vícenásobná regrese

Příprava dat a) Kontrola dat

Obrábění robotem se zpětnovazební tuhostí

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Základy ekonometrie. X. Regrese s časovými řadami. Základy ekonometrie (ZAEK) X. Regrese s časovými řadami Podzim / 47

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Introduction to MS Dynamics NAV

Klasická a robustní ortogonální regrese mezi složkami kompozice

Just write down your most recent and important education. Remember that sometimes less is more some people may be considered overqualified.

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

/ 1. I nadále budeme vyhledávat možnosti uplatnění na zahraničních aktivitách, kde jsme v předešlých letech načerpali dostatek zkušeností

Litosil - application

Zubní pasty v pozměněném složení a novém designu

T T. Think Together Marta Gryčová THINK TOGETHER

Semestrální práce. 2. semestr

Měření dat Filtrace dat, Kalmanův filtr

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy

Uni- and multi-dimensional parametric tests for comparison of sample results

Tomáš Karel LS 2012/2013

KULOVÝ STEREOTEPLOMĚR NOVÝ přístroj pro měření a hodnocení NEROVNOMĚRNÉ TEPELNÉ ZÁTĚŽE

Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných)

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

odpovídá jedna a jen jedna hodnota jiných

Compression of a Dictionary

Czech Republic. EDUCAnet. Střední odborná škola Pardubice, s.r.o.

Aplikácia viac ekonomického prístupu v oblasti vertikálnych obmedzení

TECHNIKA UMĚLÝCH PROMĚNNÝCH V PRŮŘEZOVÉ ANALÝZE A V MODELECH ČASOVÝCH ŘAD

STATISTICA Téma 8. Regresní a korelační analýza, regrese prostá

4EK211 Základy ekonometrie

Dobrovolná bezdětnost v evropských zemích Estonsku, Polsku a ČR

SoSIReČR Sociální síť informatiků v regionech České republiky, Peter Vojtáš, MFFUK

Příloha č. 1 Grafy a protokoly výstupy z adstatu

Proč by se průmysl měl zabývat výzkumem nanomateriálů

4EK211 Základy ekonometrie

INDUKTIVNÍ STATISTIKA

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Transkript:

5EN306 Aplikované kvantitativní metody I Přednáška 10 Zuzana Dlouhá

Předmět a struktura kurzu 1. Úvod: struktura empirických výzkumů 2. Tvorba ekonomických modelů: teorie 3. Data: zdroje a typy dat, význam popisných charakteristik 4. Vicenásobná regrese v ekonomické analýze 5. Vicenásobná regrese: DUMMY proměnné a jejich interakce 6. Difference in differences estimator 7. First Differencing a Fixed Effects 8. Instrumentální proměnné, Panelová data 9. Testy robustnosti a citlivosti 10. Úvod do časových řad (zbyde-li čas) témata se prolínají 2

Kontrola stávajícího modelu Nejčastější chyby a problémy: outliers, distribuce a charakter dat, jednotky měření výběr a vztahy proměnných, jejich definice, způsob měření funkční forma modelu endogenita (= simultaneita, korelace e a y): omitted variable, selekce, proč nezahrnout X? strukturní změny ve vzorku (časové řady, panel) konzistence v datech (zejména dotazníky) => všechny kroky poctivě (a kontrolovat) 3

Kontrola stávajícího modelu multikolinearita = není porušením GM (to je pouze perfektní kolinearita), ale kontrolovat perfektní kolinearita téměř vždy chyba specifikace modelu heteroskedasticita = je porušením, důvod: špatná forma funkce, opomenutí X, outliers autokorelace = u časových dat, téměř vždy u dat ČR a SR zdánlivé vztahy (nestacionarita, ) ne vyjmenovat!!! ale aplikovat a diskutovat v kontextu práce 4

Testy robustnosti (1) Princip: výsledek vydrží (smysluplné!!) externí šoky; hledáme slabá místa, testujeme stabilitu modelu: jiná funkční forma nelineární, logaritmizace proměnných, mocniny, interakce jiná specifikace (FE, IV, FE vs FD, ) zejména v případě očekávaných problémů jiná definice proměnných z absolutních na míru normuji jinou proměnnou měřím věc jinak jiná definice (ability - IQ, KWW) 5

Testy robustnosti (2) odlehlá pozorování různé odhadové techniky (IV, FD x FE x RE, pro autokorelaci, ) robustní st. chyby přidání, ubrání proměnných změna vzorku (nový vzorek, změna rozsahu) citlivost parametrů na změny variantní analýza kontrolní proměnné jiná definice kontrolní skupiny (diff-in-diff), (př. spalovna jiná definice vzdálenosti (treat x control)), (př. Bronzini, De Blasio) 6

Testy robustnosti (3) strukturní změny v rámci vzorku (Chow, ) změna definice vysvětlované proměnné, změna vysvětlující proměnné rozdělení vzorku dle některé charakteristiky změna funkční formy modelu zkoumáme, zda se nejdůležitější příliš koeficienty nezměnily R 2 může pomoci; není však rozhodující ne data-mining, ani stepwise regression, ale pořádná ekonometrie: model jen jednou, pak testy reportovat všechno; i nula je výsledek, i nesignifikantní vliv je výsledek ZAPSAT: cílem není NĚCO naměřit hledáme TRUE POPULATION MODEL radši nic než špatně 7

Odlehlá pozorování transformace dat (logaritmická), LAD regrese odstranění odlehlých pozorování, jak? nahrazení průměry, apod. př. t-testy (s menším n se zlepšují?!?) asymetrie zvyšuje rozptyl 8

Změna funkční formy 9

Robustní standardní chyby 10

Rozdělení vzorku vliv kouření matek během těhotenství na porodní váhu dítěte celý dataset birwt <= 2500 g birwt >= 4000 g 11

Kontrolní proměnné Kontrolní proměnné pro redukci omitted variable bias 12

Jiná odhadová technika př. Asensio (2006) IV pro kvalitu př. kvantilová regrese (lze i pro odlehlá pozorování) 13

Různé odhadové techniky 14

Různé odh. techniky pooled cross-section RE - FE The drop in the marriage premium is consistent with the idea that men who are more able - as captured by a higher unobserved effect, ai - are more likely to be married. Therefore, in the pooled OLS stimation, a large part of the marriage premium reflects the fact that men who are married would earn more even if they were not married. The remaining 4.7% has at least two possible explanations: (1) marriage really makes men more productive or (2) employers pay married men a premium because marriage is a signal of stability. We cannot distinguish between these two hypotheses. Wooldridge, str 451. 15

Jiná kontrolní skupina INCINERATOR (Kiel, McClain (1995)) nearinc = 1, pokud dist <= 15840 stop zkusme nearinc2 = 1, pokud dist <= 15000 16

Změna distribuce Meyer (2008) Workers' Compensation and Injury Duration: Evidence from a Natural Experiment Změna distribuce zranění (změna délky a závažnosti zranění) We emphasize the mean of the logarithm of duration because this statistic is likely to be more precisely measured and less susceptible to the influence of a few large observations. This issue of robustness is important here since the distribution of claim lengths has a few large values, but most values are small. 17

Změna distribuce 18

Změna distribuce The mean of costs in Kentucky shows a relative decrease in severity for the high-earnings group. We should emphasize, though, that none of the difference-in-differencee stimates is significantly different from zero. The comparability of the claims from the year before the increases to those the year after the benefit increases is generally supported by the numbers on total medical costs associated with the claims. These numbers, reported in the second panel of Table 4, show that the high- and low-earnings groups experience similar increases in median costs, probably due to a general rise in medical costs. 19

Změna struktury ve vzorku Chowův test (tzv. Chowův 1. test) liší se regresní parametry modelu pro různé podmnožiny pozorování (podvzorky)? H 0 H 1 : struktura je stejná :struktura se v čase mění T celkový počet pozorování T = T1 + T2 podmínka: T1 > k a T2 > k (test je možné použít i pro více podvýběrů) SSR ( SSR SSR ) / k 1 2 1 2 ( SSR SSR ) / ( T 2 k) F( k, T 2 k) zamítnutí nulové hypotézy znamená, že model není vhodný pro predikce 20

Použití: Bronzini Investice Bronzini, R., Blasio, G. (2006): Evaluating the Impact of Investment Incentives: The Case of Italy s Law 488/1992. Bank of Italy k dispozici na stránkách http://nb.vse.cz/~figlova/vyuka_5en306.htm výzkumní otázka: Jaké jsou rozdíly ve výši investic u podpořených a nepodpořených firem? motivace: Zjistit účinnost vládní politiky zapříčiňuje zvýšení investic nebo pouze platí za projekty, které by byly realizovány stejně Kontext: Italská vláda od r. 1996 poskytuje investiční pobídky do vybraných regionů na základě aukce v každém regionu jsou nabídky investorů seřazeny dle předem známých kritérií (podíl vlastních zdrojů, počet vytvořených prac. míst, environmentální a regionální charakteristiky ) Možné problémy: jiné granty? plnění investice v čase zánik či špatná situace firem, které grant nedostaly 21

Použití: Bronzini Investice DATA: z každého kola aukce získali vzorek cca 1000 firem; typ: panelová data o investicích jednotlivých firem; mají časovou řadu, vyvářejí vyvážený panel JAK NA TO? co by bylo nejlepší pro měření?? co srovnat firmy s grantem s ostatníma firmami v ekonomice? MODEL: y it I t /K t-1 Z it sales, ROA, own capital/debt 22

Použití: Bronzini Investice jednoduché rozdíly průměrů/mediánů výsledek regresní rovnice (diffs in diffs) koeficienty γ t 23

Použití: Bronzini Investice Co když program akceleroval prodeje/odpisy starého majetku a tudíž nadhodnotil I/K? (positive bias) kontrolujeme náhradou vysvětlované proměnné za I/sales; I/assets; výsledky: stejné! Co když program zachránil některé firmy a jiné díky jeho nedostání nepřežily? (survivorship bias - negative) využijeme nevyvážený panel: všechny firmy, které mají alespoň 1 PRE a jedno POST pozorování výsledky: o málo vyšší, ale nevýznamné co to znamená? jak na to jinak? Jiný faktor než INCENTIVES kontrolujeme dalšími proměnnými výsledky: velmi podobné! 24

Použití: Bronzini Investice Vliv regionu nebo velikosti firmy - rozdělíme vzorek podle R (např. vybereme nejbohatší, pak nejchudší) - rozdělíme vzorek podle velikosti firem (pak např. vybereme 10% největších apod.) - výsledky: efekty pro menší firmy jsou silnější, ale γ t přibližně stejné tj. až na výjimky nevýznamné a POST významně negativní! Špatný výběr kontrolní skupiny? 25