4EK211 Základy ekonometrie LS 2014/15 Cvičení 10: Heteroskedasticita LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE
1. Heteroskedasticita - teorie Druhý GM předpoklad: týká se kovarianční matice náhodné složky 2. E(uu T ) = σ 2 I n Rozptyl náhodných složek je konečný a konstantní: E u i 2 = σ 2 homoskedasticita
1. Heteroskedasticita - teorie Pokud platí, že E u 2 i = σ 2 i heteroskedasticita Rozptyl náhodných složek není stejný pro všechna pozorování. Př: Zdroj: http://www.acastat.com/statbook/molsassump018.jpg
1. Heteroskedasticita - příčiny Průřezová data: variabilita vysvětlované proměnné, a tedy i reziduí, může být závislá na některé vysvětlující proměnné Chyby měření: s rostoucí hodnotou endogenní proměnné dochází ke kumulaci chyb měření, což zvyšuje rozptyl endogenní proměnné, a tedy i rozptyl reziduí Chybná specifikace modelu: vynechání podstatné proměnné, nevhodná funkční forma Odhad z upravených dat (skupinové průměry apod.) Zdroj: Zuzana Dlouhá - prezentace
1. Heteroskedasticita - důsledky Odhady jsou nestranné a konzistentní, ale nejsou vydatné ani asymptoticky vydatné Odhad rozptylu náhodné složky a odhady směrodatných chyb odhadnutých koeficientů jsou vychýlené (problém - potřebujeme je při testování hypotéz a konstrukci intervalů spolehlivosti)
Data: vacation.wf1 Zdroj: ECON2300, University of Queensland, 2012 Proměnné: miles: počet mil ujetých za rok income: roční příjem (tis. USD) age: průměrný věk dospělých členů domácnosti kids: počet dětí
miles = β 0 + β 1 income + β 2 age + β 3 kids + u Vykreslete rezidua oproti proměnným age a income.
2,000 2,000 1,500 1,500 1,000 1,000 E 500 0 E 500 0-500 -500-1,000-1,000-1,500 20 25 30 35 40 45 50 55 60 AGE -1,500 0 20 40 60 80 100 120 INCOME
Goldfeldův-Quandův test (neparametrický) H 0 : homoskedasticita H 1 : heteroskedasticita 1. Seřadíme pozorování podle proměnné income (sestupně) Proc Sort Current Page (income, descending)
Goldfeldův-Quandův test (neparametrický) 2. Rozdělíme data na dvě stejné poloviny, kolem středu můžeme vynechat q hodnot (q n/4) 3. Vypočteme stupně volnosti: v = n q k 1 = 96 4. Odhadneme dvě regrese pro jednotlivé poloviny dat - zjistíme součty čtverců reziduí s 1 a s 2 a spočítáme testovou statistiku: F(v,v) = s 2 / s 1 5. Porovnáme s F* s (v, v) stupni volnosti 2
sample 1 100
sample 101 200
Goldfeldův-Quandův test (neparametrický) 4. Odhadneme dvě regrese pro jednotlivé poloviny dat - zjistíme součty čtverců reziduí s 1 a s 2 a spočítáme testovou statistiku: F(v,v) = s 2 / s 1 = 29635382 / 10251955 = 2,89 5. Porovnáme s F* s (v, v) stupni volnosti - 5% hladina významnosti
Goldfeldův-Quandův test (neparametrický) 4. Odhadneme dvě regrese pro jednotlivé poloviny dat - zjistíme součty čtverců reziduí s 1 a s 2 a spočítáme testovou statistiku: F(v,v) = s 2 / s 1 = 29635382 / 10251955 = 2,89 5. Porovnáme s F 0,95 (96, 96) = 1,405
Goldfeldův-Quandův test (neparametrický) 2,89 > 1,405 zamítáme nulovou hypotézu o homoskedasticitě
Parametrické testy pomocné regrese k posouzení, zda rozptyl náhodné složky závisí na některé / některých z vysvětlujících proměnných. Hodnoty náhodné složky neznáme, používáme rezidua.
Parametrické testy H 0 : homoskedasticita H 1 : heteroskedasticita Parkův: lne i 2 = β 0 + β 1 lnx i + v i t-test Glejserův: e i = β 0 + β 1 X i + v i e i = β 0 + β 1 X i + v i 1 e i = β 0 + β 1 + v X i i t-test
Parametrické testy H 0 : homoskedasticita H 1 : heteroskedasticita Whiteův: Závislost druhé mocniny reziduí na vysvětlujících proměnných z původní regrese, jejich druhých mocninách, příp. i násobcích e i 2 = β 0 +β 1 X 1i +β 2 X 2i + β 3 X 1i 2 +β 4 X 2i 2 +β 5 X 1i X 2i + v i n R 2 ~ chí-kvadrát rozdělení s k stupni volnosti (n počet pozorování, k počet vysvětlujících proměnných v pomocné regresi) n R 2 > χ 2 k zamítáme nulovou hypotézu o homoskedasticitě
2. Heteroskedasticita View Residual Tests Heteroskedasticity tests
Metoda zobecněných nejmenších čtverců Zvolíme vhodnou transformační matici T. Pronásobíme maticí T proměnné původního modelu a odhadneme nový model s takto upravenými proměnnými. Náhodná složka tohoto nového modelu už bude splňovat G-M předpoklady. Musíme však zvolit vhodnou matici T.
Metoda zobecněných nejmenších čtverců Př: rozptyl je funkcí čtverců některé vysvětlující proměnné x σ 2 i = σ 2 x 2 i vydělíme x i Zdroj: Zuzana Dlouhá, prezentace
Metoda zobecněných nejmenších čtverců Př: rozptyl je funkcí čtverců některé vysvětlující proměnné x σ 2 i = σ 2 x 2 i vydělíme x i y i = β 0 + β 1 x i + u i kde σ i 2 = E(u i 2 ) = σ 2 x i 2 y i x i = β 0 x i + β 1 + u i x i tzn.: E( u i x i ) 2 = 1 x i 2 E(u i 2 ) = 1 x i 2 (σ 2 x i 2 ) = σ 2
Metoda zobecněných nejmenších čtverců Př: rozptyl je funkcí některé vysvětlující proměnné x σ i 2 = σ 2 x i vydělíme x i Zdroj: Zuzana Dlouhá, prezentace
Na původní model miles = β 0 + β 1 income + β 2 age + β 3 kids + u použijte metodu zobecněných nejmenších čtverců. Předpokládejte přitom, že σ i 2 = σ 2 income i 2 Estimate Equation Options Weighted LS/TSLS Weight 1/income (EViews 6) Estimate Equation -> Options -> type = Standard deviation, weight series = income (Eviews 8) Přesvědčte se Whiteovým testem, že se nám podařilo odstranit heteroskedasticitu.
Na původní model miles = β 0 + β 1 income + β 2 age + β 3 kids + u použijte metodu zobecněných nejmenších čtverců. Předpokládejte přitom, že σ i 2 = σ 2 income i 2 Ručně: 1) Odhadnout model: miles income = β 0 2) Pronásobit zpět proměnnou income 1 income + β 1+ β 2 age income + β 3 kids income + u
3. Heteroskedasticita - příklad 2 Data: research.wf1 (zdroj: Zuzana Dlouhá, prezentace) Proměnné: rd = výdaje na výzkum a vývoj, sales = prodeje (obojí mil. USD) Odhadněte model: rd = β 0 + β 1 sales + u Otestujte Whiteovým testem, jestli je v modelu heteroskedasticita (na 10% hladině významnosti), a pokud ano, pokuste se ji odstranit.
Na doma: Co byste měli umět 1. Co je to heteroskedasticita? 2. Co je příčinou a důsledkem heteroskedasticity? 3. Jaké existují testy na heteroskedasticitu? 4. Jak otestovat přítomnost heteroskedasticity Whiteovým testem? 5. Co je to MZNČ? 6. Jak odstranit z modelu heteroskedasticitu?