4EK211 Základy ekonometrie

Podobné dokumenty
4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

ZOBECNĚNÝ LINEÁRNÍ REGRESNÍ MODEL. METODA ZOBECNĚNÝCH NEJMENŠÍCH ČTVERCŮ

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

Přepoklady KLM a Gauss Markov teorém. Blue odhad - GM. KLM Klasický lineární model. 1) Lineární v parametrech. 2) E ε = 0

4EK211 Základy ekonometrie

Zadání Máme data hdp.wf1, která najdete zde: Bodová předpověď: Intervalová předpověď:

4EK211 Základy ekonometrie

Tomáš Karel LS 2012/2013

18AEK Aplikovaná ekonometrie a teorie časových řad. Řešení domácích úkolů č. 1 a 2 příklad 1

AVDAT Klasický lineární model, metoda nejmenších

Bodové a intervalové odhady parametrů v regresním modelu

Regresní analýza. Eva Jarošová

5EN306 Aplikované kvantitativní metody I

4EK211 Základy ekonometrie

EKONOMETRIE 9. přednáška Zobecněný lineární regresní model

4EK211 Základy ekonometrie

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

Tomáš Karel LS 2012/2013

Ilustrační příklad odhadu LRM v SW Gretl

12. cvičení z PST. 20. prosince 2017

5EN306 Aplikované kvantitativní metody I

Základy ekonometrie. V. Uvolnění klasických předpokladů heteroskedasticita. Základy ekonometrie (ZAEK) V. Heteroskedasticita Podzim / 56

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

4EK211 Základy ekonometrie

Korelační a regresní analýza

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

4EK211 Základy ekonometrie

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy

4EK211 Základy ekonometrie

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Normální (Gaussovo) rozdělení

AVDAT Nelineární regresní model

Tomáš Karel LS 2012/2013

You created this PDF from an application that is not licensed to print to novapdf printer (

odpovídá jedna a jen jedna hodnota jiných

4EK211 Základy ekonometrie

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Normální (Gaussovo) rozdělení

ADDS cviceni. Pavlina Kuranova

AVDAT Geometrie metody nejmenších čtverců

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Testy. Pavel Provinský. 19. listopadu 2013

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

LINEÁRNÍ REGRESE. Lineární regresní model

Lineární regrese. Komentované řešení pomocí MS Excel

Inovace bakalářského studijního oboru Aplikovaná chemie

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Statistika (KMI/PSTAT)

Regresní analýza 1. Regresní analýza

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

Heteroskedasticita. Vysoká škola ekonomická Praha. Fakulta informatiky a statistiky. Katedra statistiky a pravděpodobnosti

PRAVDĚPODOBNOST A STATISTIKA

Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných)

Ekonometrie. Jiří Neubauer

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

KGG/STG Statistika pro geografy

Statistika II. Jiří Neubauer

5EN306 Aplikované kvantitativní metody I

Tomáš Karel LS 2012/2013

METODY ODHADU REDUKOVANÉHO A STRUKTURNÍHO TVARU MODELŮ SIMULTÁNNÍCH ROVNIC.

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Kontingenční tabulky, korelační koeficienty

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

STATISTICA Téma 7. Testy na základě více než 2 výběrů

4EK211 Základy ekonometrie

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD

Základy lineární regrese

Pravděpodobnost a aplikovaná statistika

4ST201 STATISTIKA CVIČENÍ Č. 10

Přednáška IX. Analýza rozptylu (ANOVA)

Stručný úvod do testování statistických hypotéz

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

VEKTOROVÉ AUTOREGRESE. APLIKACE V PROGNÓZOVÁNÍ.

12. prosince n pro n = n = 30 = S X

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

6. Lineární regresní modely

Transkript:

4EK211 Základy ekonometrie LS 2014/15 Cvičení 10: Heteroskedasticita LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE

1. Heteroskedasticita - teorie Druhý GM předpoklad: týká se kovarianční matice náhodné složky 2. E(uu T ) = σ 2 I n Rozptyl náhodných složek je konečný a konstantní: E u i 2 = σ 2 homoskedasticita

1. Heteroskedasticita - teorie Pokud platí, že E u 2 i = σ 2 i heteroskedasticita Rozptyl náhodných složek není stejný pro všechna pozorování. Př: Zdroj: http://www.acastat.com/statbook/molsassump018.jpg

1. Heteroskedasticita - příčiny Průřezová data: variabilita vysvětlované proměnné, a tedy i reziduí, může být závislá na některé vysvětlující proměnné Chyby měření: s rostoucí hodnotou endogenní proměnné dochází ke kumulaci chyb měření, což zvyšuje rozptyl endogenní proměnné, a tedy i rozptyl reziduí Chybná specifikace modelu: vynechání podstatné proměnné, nevhodná funkční forma Odhad z upravených dat (skupinové průměry apod.) Zdroj: Zuzana Dlouhá - prezentace

1. Heteroskedasticita - důsledky Odhady jsou nestranné a konzistentní, ale nejsou vydatné ani asymptoticky vydatné Odhad rozptylu náhodné složky a odhady směrodatných chyb odhadnutých koeficientů jsou vychýlené (problém - potřebujeme je při testování hypotéz a konstrukci intervalů spolehlivosti)

Data: vacation.wf1 Zdroj: ECON2300, University of Queensland, 2012 Proměnné: miles: počet mil ujetých za rok income: roční příjem (tis. USD) age: průměrný věk dospělých členů domácnosti kids: počet dětí

miles = β 0 + β 1 income + β 2 age + β 3 kids + u Vykreslete rezidua oproti proměnným age a income.

2,000 2,000 1,500 1,500 1,000 1,000 E 500 0 E 500 0-500 -500-1,000-1,000-1,500 20 25 30 35 40 45 50 55 60 AGE -1,500 0 20 40 60 80 100 120 INCOME

Goldfeldův-Quandův test (neparametrický) H 0 : homoskedasticita H 1 : heteroskedasticita 1. Seřadíme pozorování podle proměnné income (sestupně) Proc Sort Current Page (income, descending)

Goldfeldův-Quandův test (neparametrický) 2. Rozdělíme data na dvě stejné poloviny, kolem středu můžeme vynechat q hodnot (q n/4) 3. Vypočteme stupně volnosti: v = n q k 1 = 96 4. Odhadneme dvě regrese pro jednotlivé poloviny dat - zjistíme součty čtverců reziduí s 1 a s 2 a spočítáme testovou statistiku: F(v,v) = s 2 / s 1 5. Porovnáme s F* s (v, v) stupni volnosti 2

sample 1 100

sample 101 200

Goldfeldův-Quandův test (neparametrický) 4. Odhadneme dvě regrese pro jednotlivé poloviny dat - zjistíme součty čtverců reziduí s 1 a s 2 a spočítáme testovou statistiku: F(v,v) = s 2 / s 1 = 29635382 / 10251955 = 2,89 5. Porovnáme s F* s (v, v) stupni volnosti - 5% hladina významnosti

Goldfeldův-Quandův test (neparametrický) 4. Odhadneme dvě regrese pro jednotlivé poloviny dat - zjistíme součty čtverců reziduí s 1 a s 2 a spočítáme testovou statistiku: F(v,v) = s 2 / s 1 = 29635382 / 10251955 = 2,89 5. Porovnáme s F 0,95 (96, 96) = 1,405

Goldfeldův-Quandův test (neparametrický) 2,89 > 1,405 zamítáme nulovou hypotézu o homoskedasticitě

Parametrické testy pomocné regrese k posouzení, zda rozptyl náhodné složky závisí na některé / některých z vysvětlujících proměnných. Hodnoty náhodné složky neznáme, používáme rezidua.

Parametrické testy H 0 : homoskedasticita H 1 : heteroskedasticita Parkův: lne i 2 = β 0 + β 1 lnx i + v i t-test Glejserův: e i = β 0 + β 1 X i + v i e i = β 0 + β 1 X i + v i 1 e i = β 0 + β 1 + v X i i t-test

Parametrické testy H 0 : homoskedasticita H 1 : heteroskedasticita Whiteův: Závislost druhé mocniny reziduí na vysvětlujících proměnných z původní regrese, jejich druhých mocninách, příp. i násobcích e i 2 = β 0 +β 1 X 1i +β 2 X 2i + β 3 X 1i 2 +β 4 X 2i 2 +β 5 X 1i X 2i + v i n R 2 ~ chí-kvadrát rozdělení s k stupni volnosti (n počet pozorování, k počet vysvětlujících proměnných v pomocné regresi) n R 2 > χ 2 k zamítáme nulovou hypotézu o homoskedasticitě

2. Heteroskedasticita View Residual Tests Heteroskedasticity tests

Metoda zobecněných nejmenších čtverců Zvolíme vhodnou transformační matici T. Pronásobíme maticí T proměnné původního modelu a odhadneme nový model s takto upravenými proměnnými. Náhodná složka tohoto nového modelu už bude splňovat G-M předpoklady. Musíme však zvolit vhodnou matici T.

Metoda zobecněných nejmenších čtverců Př: rozptyl je funkcí čtverců některé vysvětlující proměnné x σ 2 i = σ 2 x 2 i vydělíme x i Zdroj: Zuzana Dlouhá, prezentace

Metoda zobecněných nejmenších čtverců Př: rozptyl je funkcí čtverců některé vysvětlující proměnné x σ 2 i = σ 2 x 2 i vydělíme x i y i = β 0 + β 1 x i + u i kde σ i 2 = E(u i 2 ) = σ 2 x i 2 y i x i = β 0 x i + β 1 + u i x i tzn.: E( u i x i ) 2 = 1 x i 2 E(u i 2 ) = 1 x i 2 (σ 2 x i 2 ) = σ 2

Metoda zobecněných nejmenších čtverců Př: rozptyl je funkcí některé vysvětlující proměnné x σ i 2 = σ 2 x i vydělíme x i Zdroj: Zuzana Dlouhá, prezentace

Na původní model miles = β 0 + β 1 income + β 2 age + β 3 kids + u použijte metodu zobecněných nejmenších čtverců. Předpokládejte přitom, že σ i 2 = σ 2 income i 2 Estimate Equation Options Weighted LS/TSLS Weight 1/income (EViews 6) Estimate Equation -> Options -> type = Standard deviation, weight series = income (Eviews 8) Přesvědčte se Whiteovým testem, že se nám podařilo odstranit heteroskedasticitu.

Na původní model miles = β 0 + β 1 income + β 2 age + β 3 kids + u použijte metodu zobecněných nejmenších čtverců. Předpokládejte přitom, že σ i 2 = σ 2 income i 2 Ručně: 1) Odhadnout model: miles income = β 0 2) Pronásobit zpět proměnnou income 1 income + β 1+ β 2 age income + β 3 kids income + u

3. Heteroskedasticita - příklad 2 Data: research.wf1 (zdroj: Zuzana Dlouhá, prezentace) Proměnné: rd = výdaje na výzkum a vývoj, sales = prodeje (obojí mil. USD) Odhadněte model: rd = β 0 + β 1 sales + u Otestujte Whiteovým testem, jestli je v modelu heteroskedasticita (na 10% hladině významnosti), a pokud ano, pokuste se ji odstranit.

Na doma: Co byste měli umět 1. Co je to heteroskedasticita? 2. Co je příčinou a důsledkem heteroskedasticity? 3. Jaké existují testy na heteroskedasticitu? 4. Jak otestovat přítomnost heteroskedasticity Whiteovým testem? 5. Co je to MZNČ? 6. Jak odstranit z modelu heteroskedasticitu?