4EK211 Základy ekonometrie ZS 2014/15 Cvičení 6: Dummy proměnné, úvod do časových řad LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE
1. Multikolinearita - příklad k procvičení Otevřete si soubor rice.wf1 Zdroj: ECON2300, University of Queensland, 2012. Proměnné: Prod: množství sklizené rýže (tuny) Area: osevná plocha (hektary) Labour: počet odpracovaných dní na poli Fert: množství hnojiva (kg) CVIČENÍ 6 DUMMY PROMĚNNÉ, ÚVOD DO ČASOVÝCH ŘAD 2
1. Multikolinearita - příklad k procvičení Odhadněte sami model: ln prod = β 0 + β 1 ln area + β 2 ln labour + β 3 ln(fert) 1. Interpretujte parametry (nezapomeňte, že proměnné jsou zlogaritmované) 2. Ověřte přítomnost multikolinearity pomocí párových korelačních koeficientů a pomocných regresí. CVIČENÍ 6 DUMMY PROMĚNNÉ, ÚVOD DO ČASOVÝCH ŘAD 3
2. Umělé proměnné Otevřete si data z minula. Upravte proměnnou price (vydělte 1000). Data: pizza.wf1 Zdroj: ECON2300, University of Queensland, 2012, upraveno Co budeme zkoumat: kolik utrácí lidi za pizzu v závislosti na různých faktorech CVIČENÍ 6 DUMMY PROMĚNNÉ, ÚVOD DO ČASOVÝCH ŘAD 4
2. Umělé proměnné Proměnné: - pizza: roční útrata za pizzu v dolarech - zena: = 1 pro ženy, jinak 0 (umělá proměnná, dummy variable) - muz: = 1 pro muže, jinak 0 (umělá proměnná, dummy variable) - prijem roční příjem v dolarech - vek věk (v letech) - hranolky roční útrata za hranolky v dolarech - hamburgery roční útrata za hamburgery v dolarech - salaty roční útrata za saláty v dolarech CVIČENÍ 6 DUMMY PROMĚNNÉ, ÚVOD DO ČASOVÝCH ŘAD 5
2. Umělé proměnné Minule jsme začali mluvit o umělých proměnných. Zkuste nyní odhadnout následující dva modely: 1 pizza = β 0 + β 1 prijem+ β 2 zena + u 2 pizza = β 0 + β 1 prijem+ β 2 (prijem zena) + u Interpretujte koeficienty a nakreslete v obou případech regresní přímku pro muže a pro ženy. CVIČENÍ 6 DUMMY PROMĚNNÉ, ÚVOD DO ČASOVÝCH ŘAD 6
2. Umělé proměnné 1 pizza = β 0 + β 1 prijem+ β 2 zena + u pizza = 226 + 1,41 prijem 182 zena Střední hodnota vysvětlované proměnné: Muž: E(pizza) = 226 + 1,41 prijem Žena: E pizza = 44 + 1,41 prijem CVIČENÍ 6 DUMMY PROMĚNNÉ, ÚVOD DO ČASOVÝCH ŘAD 7
2. Umělé proměnné 2 pizza = β 0 + β 1 prijem+ β 2 (prijem zena) + u pizza = 106 + 3,57 prijem 3 prijem zena Střední hodnota vysvětlované proměnné: Muž: E(pizza) = 106 + 3,57 prijem Žena: E pizza = 106 + 0,57 prijem CVIČENÍ 6 DUMMY PROMĚNNÉ, ÚVOD DO ČASOVÝCH ŘAD 8
2. Umělé proměnné 1. Kdybyste chtěli zkoumat útratu za pizzu v závislosti na tom, zda má člověk základní, střední či vyšší vzdělání, jaká data byste museli nasbírat a jak byste takový model specifikovali? 2. Napadá vás, jak by se mohly použít umělé proměnné při analýze časových řad? CVIČENÍ 6 DUMMY PROMĚNNÉ, ÚVOD DO ČASOVÝCH ŘAD 9
3. Kvadratická regrese Otevřete si soubor test.wf1 Proměnné: Body: počet bodů ze závěrečné písemky (0 až 100 bodů) Čas: počet hodin věnovaný přípravě Přítomnost: počet přednášek, na kterých byl student přítomen (0 až 13) CVIČENÍ 6 DUMMY PROMĚNNÉ, ÚVOD DO ČASOVÝCH ŘAD 10
3. Kvadratická regrese 1. Odhadněte regresi: body = β 0 + β 1 pritomnost + β 2 cas + u 2. Pomocí párového korelačního koeficientu zhodnoťte, zda jsou zde potíže s multikolinearitou. 3. Nakreslete graf závislosti počtu bodů na čase. Myslíte, že je funkční vztah mezi nimi lineární? Zakomponujte případnou nelinearitu do modelu. CVIČENÍ 6 DUMMY PROMĚNNÉ, ÚVOD DO ČASOVÝCH ŘAD 11
3. Kvadratická regrese Graph cas body Scatter 110 Graf naznačuje, že od určitého okamžiku jsou dodatečné hodiny studia spíš na škodu a student nejspíš v důsledku únavy získá spíše méně bodů v testu, než kdyby se šel místo učení vypsat. (jde o čistě hypotetický příklad) Odhadneme tedy regresi: body = β 0 + β 1 pritomnost + β 2 cas + β 3 cas 2 + u Jaké znaménko byste čekali u β 3? BODY 100 90 80 70 60 50 40 30 0 4 8 12 16 20 24 28 32 CAS CVIČENÍ 6 DUMMY PROMĚNNÉ, ÚVOD DO ČASOVÝCH ŘAD 12
3. Kvadratická regrese body = β 0 + β 1 pritomnost + β 2 cas + β 3 cas 2 + u body = 33,6 + 1,06 pritomnost + 3 cas 0,07 cas 2 Otestuje nulovou hypotézu, že čas přípravy nemá vliv na počet bodů v testu. CVIČENÍ 6 DUMMY PROMĚNNÉ, ÚVOD DO ČASOVÝCH ŘAD 13
3. Kvadratická regrese body = β 0 + β 1 pritomnost + β 2 cas + β 3 cas 2 + u body = 33,6 + 1,06 pritomnost + 3 cas 0,07 cas 2 Otestuje nulovou hypotézu, že čas přípravy nemá vliv na počet bodů v testu. Sdružená nulová hypotéza: β 2 = β 3 = 0 děláme F-test F = (RSS 0 RSS N )/q RSS N /(n k 1) = (7940 4584)/2 4584/(50 3 1) = 16,8 porovnáme s F*(2,46) V EViews stačí: View Coefficient Tests Wald Coefficient Restrictions C(3) = C(4) = 0 CVIČENÍ 6 DUMMY PROMĚNNÉ, ÚVOD DO ČASOVÝCH ŘAD 14
3. Kvadratická regrese CVIČENÍ 6 DUMMY PROMĚNNÉ, ÚVOD DO ČASOVÝCH ŘAD 15
3. Kvadratická regrese body = β 0 + β 1 pritomnost + β 2 cas + β 3 cas 2 + u body = 33,6 + 1,06 pritomnost + 3 cas 0,07 cas 2 Jaký je podle modelu ideální počet hodin, které by student měl strávit přípravou? CVIČENÍ 6 DUMMY PROMĚNNÉ, ÚVOD DO ČASOVÝCH ŘAD 16
4. Časové řady Data: HDP.wf1 Zdroj: Zouhar, J.: http://nb.vse.cz/~zouharj/zek.html Proměnné: hdp: HDP ČR v letech 1993 až 2007 v mld CZK Budeme zkoumat vývoj HDP a předpovídat jeho hodnoty. CVIČENÍ 7 ČASOVÉ ŘADY, AUTOKORELACE
4. Časové řady - lineární trend 1. Odhadněte model: hdp t = β 0 + β 1 t + u t Použijte všechna data (1995-2007). 2. Předpovězte hodnotu HDP pro rok 2008 ručně i v EViews. Jde o ex-post nebo ex-ante predikci? CVIČENÍ 7 ČASOVÉ ŘADY, AUTOKORELACE
4. Časové řady - ex-ante předpověď 1. Odhadněte model: hdp t = 1459 + 156,3 t V EViews: Quick Estimate Equation hdp c @trend Pozn. @trend je funkce, která generuje řadu 0, 1, 2 (začíná od nuly) 2. Předpovězte hodnotu HDP pro rok 2008 ručně i v EViews. Jde o ex-post nebo ex-ante predikci? Jde o ex-ante predikci. Bodová předpověď: hdp 2008 = 1459 + 156,3 13 = 3491 V EViews: Proc Structure/Resize current page 1995 2008 Forecast zadat Forecast sample, Forecast name, S.E., CVIČENÍ 7 ČASOVÉ ŘADY, AUTOKORELACE
4. Časové řady - ex-post předpověď 1. Odhadněte model: hdp t = β 0 + β 1 t + u t Použijte pouze data 1995 až 2003. 2. Předpovězte hodnotu HDP pro roky 2004 až 2007 v EViews. Jde o ex-post nebo ex-ante predikci? CVIČENÍ 7 ČASOVÉ ŘADY, AUTOKORELACE
4. Časové řady 1. Odhadněte model: hdp t = 1532 + 134,3 t V EViews: Quick Estimate Equation hdp c @trend Sample 1995 až 2003 2. Předpovězte hodnotu HDP pro roky 2004 až 2007 v EViews. Jde o ex-post nebo ex-ante predikci? Jde o ex-post predikci. Často se tak testuje kvalita modelu. Ve výstupu EViews jsou hodnoty RMSE, Mean Absolute Error, Mean Abs. Percent Error. Poslední zmiňovaná by měla být nejvýše kolem 5 %. CVIČENÍ 7 ČASOVÉ ŘADY, AUTOKORELACE
4. Časové řady - exponenciální trend 1. Odhadněte model: ln(hdp t ) = β 0 + β 1 t + u t 2. Jak se liší interpretace parametru β 1 od předchozího případu? CVIČENÍ 7 ČASOVÉ ŘADY, AUTOKORELACE
4. Časové řady - exponenciální trend 1. Odhadněte model: ln( hdp t ) = 7,35 + 0,07t + u t 2. Je-li vysvětlovaná proměnná zlogaritmovaná, zjistíme, o kolik procent se přibližně v průměru změní vysvětlovaná proměnná s jednotkovou změnou vysvětlující proměnné. CVIČENÍ 7 ČASOVÉ ŘADY, AUTOKORELACE
Na doma: Co byste měli umět 1. Co jsou umělé proměnné, jak s nimi pracovat? 2. Jak zakomponovat nelineární vztahy do modelu? 3. Jak otestovat sdruženou hypotézu, že se více parametrů rovná nule? 4. Co je to ex-post a ex-ante predikce? 5. Jak se dělají predikce v EViews? CVIČENÍ 6 DUMMY PROMĚNNÉ, ÚVOD DO ČASOVÝCH ŘAD 24