4EK211 Základy ekonometrie Predikce Multikolinearita Cvičení 4 Zuzana Dlouhá
Aplikace EM predikce obecně ekonomické prognózování, předpověď, předvídání hlavním cílem je odhad hodnot vysvětlované proměnné mimo interval pozorování s užitím minulé i současné informace extrapolace modelu do budoucna extrapolace modelu do minulosti tj. před interval pozorování (tzv. retrospektiva) predikcí získáváme vyrovnané hodnoty (tj. hodnoty fitted ) Predikce ex-ante (resp. dopředu) tzv. podmíněná podmíněná volbou vysvětlujících proměnných na napozorované hodnoty musíme čekat Predikce ex-post (resp. dozadu) tzv. pseudopředpověď slouží k testování kvality modelu napozorované hodnoty jsou již k dispozici 2
Aplikace EM predikce ex-ante volba podmíněných exogenních proměnných, možné způsoby: zadáno z jiné analýzy zadáno pomocí procentuální změny oproti minulému období (např. o 10 %) zadáno pomocí diferencí predikce bodová predikce intervalová se směrodatnou odchylkou sigma: se směrodatnou odchylkou : s ~ s ve vzorci je sigma, výpočet viz předchozí cvičení nebo to je S.E. of regression ve výstupu v EViews vždy platí: s ~ p sigma intervalový odhad se sigma bývá podhodnocený p ŷ s ~ p p ˆ p ± sigma * t1 α / 2( n ( k 1)) y s 1 x X s ~ p X ) x ( T 1 T p p 3
Aplikace EM predikce ex-ante + příklad Soubor: CV4_PR1.xls Data: Mira_nezam_obec = obecná míra nezaměstnanosti (%) x Inflace = míra inflace (%) y Zadání: Odhadněte závislost míry inflace (y) na obecné míře nezam (x). Proveďte bodovou předpověď ex-ante ručně i pomocí EViews, víte-li, že hodnota Mira_nezam_obec v roce 2008 je 4,4. Proveďte intervalovou předpověď ex-ante ručně i pomocí EViews, víte-li, že hodnota Mira_nezam_obec v roce 2008 je 4,4 a α = 1 %. y t = β 0 + β 1 x t + u t, t = 1, 2,...,15 EViews: range 1993 2008 (příkazový řádek) doplnit do dat Mira_nezam_obec hodnotu 4.4 smpl 1993 2007 (příkazový řádek) ls inflace c mira_nezam_obec (příkazový řádek) okno Equation Forecast S.E. jako sp + 1993 2008 predikci vidím v inflacef a naleznu v sp s ~ p 4
Aplikace EM predikce ex-post testuje se kvalita modelu vyřadíme určitý počet pozorování z modelu odhadneme model provedeme predikci vynechaných hodnot porovnáme získané předpovědi se skutečnými hodnotami obecně platí, že predikce je dobrá, pokud je průměrná absolutní hodnota chyby predikce menší než 5 % ze skutečné hodnoty pro dané období (EViews Mean Absolute Percent Error) 5
Aplikace EM predikce ex-post + příklad Příklad: Proveďte predikci/předpověď ex-post pro roky 2006 a 2007 na datech CV4_PR1.xls. inflace 2006 = 20,606 2,157 7,1 = 5,29 % EViews: smpl 1993 2005 (příkazový řádek) ls inflace c mira_nezam_obec (příkazový řádek) okno Equation Forecast 2006 2006 Mean Abs. Percent Error = 111,72 % > 5% model není vhodný k predikci 6
Aplikace EM predikce ex-post + příklad Příklad: Proveďte predikci/předpověď ex-post pro roky 2006 a 2007 na datech CV4_PR1.xls. inflace 2007 = 20,606 2,157 5,3 = 9,18 % EViews: smpl 1993 2005 (příkazový řádek) ls inflace c mira_nezam_obec (příkazový řádek) okno Equation Forecast 2007 2007 Mean Abs. Percent Error = 227,68 % > 5% model není vhodný k predikci 7
Gauss-Markovy předpoklady Náhodná složka: Gauss-Markovy předpoklady 1. E(u) = 0 náhodné vlivy se vzájemně vynulují 2. E(u u T ) = σ 2 I n konečný a konstantní rozptyl = homoskedasticita porušení: heteroskedasticita náhodné složky jsou sériově nezávislé porušení: autokorelace 3. X je nestochastická matice E(X T u) = 0 veškerá náhodnost je obsažena v náhodné složce 4. X má plnou hodnost k matice X neobsahuje žádné perfektně lineárně závislé sloupce pozorování vysvětlujících proměnných porušení: multikolinearita 8
Multikolinearita - definice momentová matice X T X není singulární, existuje determinant matice různý od 0, lze spočítat odhadovou funkci b lineární nezávislost sloupců matice X porušení vede k multikolinearitě multikolinearita = existence více než jednoho vztahu lineární závislosti mezi pozorováními vysvětlujících proměnných kolinearita = existence pouze jednoho lineárního vztahu týká se pouze výběrového vzorku, nikoliv abstraktního modelu multikolinearita se NETESTUJE, jen měří v jednom konkrétním výběru podstata zkoumání: intenzita závislosti mezi dvěma nebo více vysvětlujícími proměnnými, zda je či není multikolinearita únosná perfektní multikolinearita: x 1, x 2 = 2x 1 +5, neplatí ceteris paribus!!! v modelech je téměř vždy nějaká mutikolinearita problém jak velká a jestli to je problém 9
Multikolinearita příčiny a důsledky Příčiny tendence časových řad ekonomických ukazatelů (makroúdajů) vyvíjet se stejným směrem (např. HDP, C, I, S, Ex, Im) průřezová analýza (velikost firmy, objem kapitálu, příjmy) zahrnutí zpožděné endogenní nebo exogenní proměnné špatně diskretizovaná proměnné pomocí 0, 1 (v cvičení o umělých proměnných) Důsledky snížená přesnost odhadů regresních koeficientů velké standardní chyby odhadové funkce MNČ pochybnosti či nejistotu pokud jde o správnost specifikace modelu odhady zůstávají nestranné, vydatné velká citlivost odhadové funkce MNČ na velmi malé změny v matici X obtížné vyjádření odděleného působení silně kolineárních proměnných 10
Měření multikolinearity metoda I použití párových korelačních koeficientů pro pouze 2 vysvětlující proměnné: r cov( x 1 2 x, 1, x 2 sx sx 1 1 1 multikolinearita je únosná, pokud: 0 9 a současně r x 1, x, 2 x 2 ) r x R 2 ( y.x x 2 1 x2 1 2 ) koeficient vícenásobné determinace modelu EViews cor x1 x2 (příkazový řádek) 11
Měření multikolinearity příklad na metodu I Soubor: CV3_PR1.xls Data: y = maloobchodní obrat potřeb pro domácnost v mld. CZK x 1 = disponibilní příjem v mld. CZK x 2 = cenový index v % Zadání: Odhadněte závislost maloobchodního obratu (y) na disponibilním příjmu (x 1 ) a cenovém indexu (x 2 ). Vyhodnoťte multikolinearitu. y i = β 0 + β 1 x 1i + β 2 x 2i + u i, i = 1, 2,...,8 12
Měření multikolinearity metoda II více vysvětlujících proměnných (tj. nelze dělat párové korelační koeficienty) využívá se koeficientů pomocné regrese R i 2 y = f(x 1, x 2, x 3 ) z modelu R 2 x 1 = f(x 2, x 3 ) R 1 2 x 2 = f(x 1, x 3 ) R 2 2 x 3 = f(x 1, x 2 ) R 3 2 jsou-li všechna R i2 < R 2, pak je multikolinearita únosná 13
Měření multikolinearity příklad na metodu II Soubor: CV4_PR2.xls Data: y = počet prodaných kuřat (v desítkách milionů kusů) x 1 = výše dotace do zemědělství (v mld. Kč) x 2 = cena za kuře (Kč/kg) x 3 = cena vepřového (Kč/kg) Zadání: Odhadněte závislost počtu prodaných kuřat (y) na proměnných x 1, x 2 a x 3. Vyhodnoťte multikolinearitu. y t = β 0 + β 1 x 1t + β 2 x 2t + β 3 x 3t + u t, t = 1, 2,...,23 Eviews ls y c x1 x2 x3 R-squared ls x1 c x2 x3 R-squared ls x2 c x1 x3 R-squared ls x3 c x1 x2 R-squared 14
Měření multikolinearity příklad na metodu I a II Soubor: CV4_PR3.xls Data: HDP = hrubý domácí produkt (v mld. Kč) C = spotřeba (v mld. Kč) I = investice (v mld. Kč) G = vládní výdaje (v mld. Kč) Zadání metoda I: Odhadněte závislost HDP na proměnných C a I. Vyhodnoťte multikolinearitu. HDP t = β 0 + β 1 C t + β 2 I t + u t, t = 1, 2,...,19 Zadání metoda II: Odhadněte závislost HDP na proměnných C, I a G. Vyhodnoťte multikolinearitu. HDP t = β 0 + β 1 C t + β 2 I t + β 3 G t + u t, t = 1, 2,...,19 15
Multikolinearita řešení získání dalších pozorování snížení počtu exogenních proměnných (pozor, jestli tam podle teorie proměnná patří, ponechám ji tam) použití jinak specifikovaného modelu použití jiné odhadové techniky transformace pozorování první diference - pozor na autokorelaci poměrové veličiny - pozor na heteroskedasticitu 16