4EK Základy ekonometrie Odhad klasického lineárního regresního modelu II Cvičení 3 Zuzana Dlouhá
Klasický lineární regresní model - zadání příkladu Soubor: CV3_PR.xls Data: y = maloobchodní obrat potřeb pro domácnost v mld. CZK x = disponibilní příjem v mld. CZK x = cenový index v % Zadání: Odhadněte závislost maloobchodního obratu (y) na disponibilním příjmu (x ) a cenovém indexu (x ). Proveďte specifikaci kvantifikaci verifikaci a aplikaci EM. y i = β 0 + β x i + β x i + u i i =...8 pozor jenom cvičný příklad v BP/DP je potřebný velký počet pozorování (alespoň 5-30!)
Klasický lineární regresní model - specifikace Specifikace EM určení proměnných y = endogenní (vysvětlovaná) proměnná x = exogenní (vysvětlující) proměnná x = exogenní (vysvětlující) proměnná určení vzájemných vazeb mezi proměnnými (forma závislosti) + formulace hypotéz y i = β 0 + β x i + β x i + u i i =...8 předpokládané znaménka očekávané hodnoty odhadnutých parametrů β = v intervalu (0) pokud nepracujeme s úsporami nebo > 0 s úsporami β = by mělo být < 0 3
Klasický lineární regresní model - kvantifikace Kvantifikace EM odhad modelu MNČ MS Excel nebo EViews Dependent Variable: Y Method: Least Squares Date: 0/07/3 Time: 9:46 Sample: 966 973 Included observations: 8 Y=C()+C()*X+C(3)*X Coefficient Std. Error t-statistic Prob. C() 3.0698.03888.999 0.039 C() 0.0355 0.00455.7590 0 C(3) -0.097964 0.0588-6.8978 0.006 R-squared 0.997094 Mean dependent var 0.5 Adjusted R-squared 0.99593 S.D. dependent var.89089 S.E. of regression 0.068 Akaike info criterion -.36 Sum squared resid 0.078 Schwarz criterion -.08536 Log likelihood 7.445305 Hannan-Quinn criter. -.35 F-statistic 857.838 Durbin-Watson stat.949445 Prob(F-statistic) 0 4
Klasický lineární regresní model - kvantifikace Kvantifikace EM zápis odhadnutého regresního modelu (regresní nadroviny) napozorované hodnoty: Coefficient Std. Error t-statistic Prob. C() 3.0698.0389.999 0.039 C() 0.0355 0.00455.7590 0 C(3) -0.09796 0.0583-6.8978 0.006 y = 306 + 004x 0098x + e vyrovnané hodnoty: ŷ = 306 + 004x 0098x je to tzv. bodový odhad 5
Verifikace ekonomická předpokládané znaménka očekávané hodnoty odhadnutých parametrů β = v intervalu (0) pokud nepracujeme s úsporami nebo > 0 s úsporami b splňuje předpoklad β = by mělo být < 0 b splňuje předpoklad ekonomická interpretace b 0 bez interpretace b absolutní (příjmová) pružnost b y x b = 004 vzroste-li disponibilní příjem (x ) o mld. CZK (tj. o jednotku) a cenový index (x ) se nezmění vzroste maloobchodní obrat potřeb pro domácnost v průměru o 004 mld. CZK 6
Verifikace ekonomická b absolutní (cenová) pružnost b y x b = -0098 vzroste-li cenový index (x ) o jeden procentní bod a disponibilní příjem (x ) se nezmění klesne maloobchodní obrat potřeb pro domácnost v průměru o 0098 mld. CZK b i b jsou definovány v daných jednotkách!!! každou absolutní pružnost lze převést na pružnost relativní definuje se koeficient relativní pružnosti q počítá se vždy vzhledem k nějakému datu v %! koeficient příjmové pružnosti koeficient cenové pružnosti y x x q x b x y y y x x b x y y q x 7
Verifikace ekonomická relativní pružnost pro rok 973 y (73) = 36 x (73) = 09 x (73) = 3 koeficient příjmové pružnosti x y 09 004 3 6 q x ( 73) b 60 zvýší-li se v roce 973 disponibilní příjem (x ) o % a cenový index (x ) se nezmění vzroste maloobchodní obrat potřeb pro domácnost o 60 % koeficient cenové pružnosti x y 3 0 098 3 6 q x ( 73) b 0 8 zvýši-li se v roce 973 cenový index (x ) o % a disponibilní příjem (x ) se nezmění klesne maloobchodní obrat potřeb pro domácnost o 08 % 8
Verifikace statistická Coefficient Std. Error t-statistic Prob. C() 3.0698.0389.999 0.039 C() 0.0355 0.00455.7590 0 C(3) -0.09796 0.0583-6.8978 0.006 Standard error standardní chyba regresního koeficientu slouží k určení významnosti parametrů k intervalovým odhadům T s i s ( X X) b kde s ii ( n ( k )) e T e nebo S.E. of regresion ve výstupu ii prvek z diagonály momentové matice pro náš příklad: ( X T X) 73 0 34 06 0 34 0 00 0 004 06 0 004 0 07 s b 0 0 073 ( 8 3) 73 03 9
Verifikace statistická t-statistic t-statistika slouží k určení významnosti jednotlivých parametrů v modelu testuje se hypotéza: H 0 : β j = 0 bj βj H : β j 0 t j obecně pro t-statistiku platí * t t ) Coefficient Std. Error t-statistic Prob. C() 3.0698.0389.999 0.039 C() 0.0355 0.00455.7590 0 C(3) -0.09796 0.0583-6.8978 0.006 t j j α/ ( nk nezamítám hypotézu H o významnosti proměnné v modelu proměnná je tedy statisticky významná na α * t j t α/ ( nk) nezamítám hypotézu H 0 o nevýznamnosti proměnné v modelu proměnná je tedy statisticky nevýznamná na α b s j b j s b j Coefficient Std.error 0
Verifikace statistická Coefficient Std. Error t-statistic Prob. C() 3.0698.0389.999 0.039 C() 0.0355 0.00455.7590 0 C(3) -0.09796 0.0583-6.8978 0.006 Prob. pravděpodobnost že nulová hypotéza je pravdivá (tj. daná vysvětlující proměnná je v modelu nevýznamná) Prob. < 005 proměnná je statisticky významná na 5% hladině Prob. < 00 proměnná je statisticky významná na % hladině pokud nemáme tabulkovou hodnotu t-statistiky pro srovnání postupujeme podle Prob.
Verifikace statistická R-squared 0.997094 Mean dependent var 0.5 Adjusted R-squared 0.99593 S.D. dependent var.8909 S.E. of regression 0.068 Akaike info criterion -.33 Sum squared resid 0.078 Schwarz criterion -.0854 Log likelihood 7.445305 Hannan-Quinn criter. -.35 F-statistic 857.838 Durbin-Watson stat.94945 Prob(F-statistic) 0 S.E. of regression standardní chyba regrese [u~n(0σ )] charakteristika výběrového rozptylu který dostaneme po kvantifikaci abstraktního modelu vzorec T s e e 0 073 006 ( n ( k )) ( 8 3) užívá se při výpočtu standardní chyby regresního koeficientu Sum squared resid součet čtverců reziduí e i = e T e min
Verifikace statistická R-squared 0.997094 Mean dependent var 0.5 Adjusted R-squared 0.99593 S.D. dependent var.8909 S.E. of regression 0.068 Akaike info criterion -.33 Sum squared resid 0.078 Schwarz criterion -.0854 Log likelihood 7.445305 Hannan-Quinn criter. -.35 F-statistic 857.838 Durbin-Watson stat.94945 Prob(F-statistic) 0 R-squared R koeficient vícenásobné determinace hodnotí celkovou kvalitu modelu určuje jak se model shoduje s daty VSČ NSČ R CSČ CSČ CSČ ( yi y) n R VSČ n 0 ( ŷ i y) NSČ n ( y i ŷ i ) 3
Verifikace statistická R koeficient vícenásobné determinace je-li NSČ = 0 pak R = dokonalý model v případě že koeficient R není statisticky významný (viz F-poměr) doporučují se úpravy: přidání další vysvětlující proměnné zvýšení počtu pozorování změna funkčního tvaru regresní rovnice nezohledňuje počet vysvětlujících proměnných hodnota R nikdy neklesne přidáním dalších vysvětlujících proměnných do modelu řeší to tzv. korigovaný koeficient determinace (tj. R adj nebo ) v EViews Adjusted R-squared n R ( R ) n ( k ) R R < R zvyšováním počtu proměnných roste R ale ne rovnost jen pokud R = nebo k = stejná závislá proměnná a stejný počet pozorování!!! R 4
Verifikace statistická R-squared 0.997094 Mean dependent var 0.5 Adjusted R-squared 0.99593 S.D. dependent var.8909 S.E. of regression 0.068 Akaike info criterion -.33 Sum squared resid 0.078 Schwarz criterion -.0854 Log likelihood 7.445305 Hannan-Quinn criter. -.35 F-statistic 857.838 Durbin-Watson stat.94945 Prob(F-statistic) 0 Log likelihood hodnota věrohodnostní funkce při odhadové metodě metoda maximální věrohodnosti (MMV) oba odhady (pomocí MNČ i MMV) dávají stejné výsledky pokud se pracuje s normálním regresním modelem 5
Verifikace statistická R-squared 0.997094 Mean dependent var 0.5 Adjusted R-squared 0.99593 S.D. dependent var.8909 S.E. of regression 0.068 Akaike info criterion -.33 Sum squared resid 0.078 Schwarz criterion -.0854 Log likelihood 7.445305 Hannan-Quinn criter. -.35 F-statistic 857.838 Durbin-Watson stat.94945 Prob(F-statistic) 0 F-statistic F-poměr testuje statistickou významnost modelu (využívá se Fischerovo rozdělení) H 0 : R statisticky nevýznamné β 0 = β =... β j = 0 H : R statisticky významné β j 0 F R R n ( k ) k 6
Verifikace statistická F > F* (kn-k-) zamítáme H 0 ve prospěch H F F* (kn-k-) nezamítáme H 0 ve prospěch H Prob(F-statistic) počítá nám p-value Prob(F-statistic) α nezamítám hypotézu H model je tedy statisticky významný na α Prob(F-statistic) > α nezamítám hypotézu H 0 model je tedy statisticky nevýznamný na α 7
Verifikace statistická R-squared 0.997094 Mean dependent var 0.5 Adjusted R-squared 0.99593 S.D. dependent var.8909 S.E. of regression 0.068 Akaike info criterion -.33 Sum squared resid 0.078 Schwarz criterion -.0854 Log likelihood 7.445305 Hannan-Quinn criter. -.35 F-statistic 857.838 Durbin-Watson stat.94945 Prob(F-statistic) 0 Mean dependent var průměr vysvětlované (tj. endogenní) proměnné S.D. dependent var standardní odchylka vysvětlované (tj. endogenní) proměnné Akaike Schwarz Hannan-Quinn criterion informační kritéria výběr správného modelu vybírám minimální hodnotu neuvádět interpretaci v testu u prof. Pánkové!!! 8
Verifikace statistická R-squared 0.997094 Mean dependent var 0.5 Adjusted R-squared 0.99593 S.D. dependent var.8909 S.E. of regression 0.068 Akaike info criterion -.33 Sum squared resid 0.078 Schwarz criterion -.0854 Log likelihood 7.445305 Hannan-Quinn criter. -.35 F-statistic 857.838 Durbin-Watson stat.94945 Prob(F-statistic) 0 Durbin-Watson stat Durbinova-Watsonova (DW) statistika d užívá se pro testování vlastností náhodných složek test autokorelace prvního řádu 9
Verifikace ekonometrická ověřuje splnění podmínek pro použití MNČ testuje se heteroskedasticita autokorelace multikolinearita DW Durbin-Watson testuje autokorelaci prvního řádu budeme řešit později!!! 0
Klasický lineární regresní model - aplikace Aplikace predikce apod. ukládání vyrovnaných hodnot reziduí... predikce dosazení konkrétních hodnot do regresní funkce podrobně na cvičení 4
Klasický lineární regresní model - kvantifikace Kvantifikace EM intervalový odhad n = počet pozorování k = počet vysvětlujících proměnných α = hladina významnosti předpokládejme pro náš příklad = 5 % EViews Equation (objekt) View Coefficient Diagnostics Confidence Intervals 058 0 09 57 0 0046 004 0 0046 57 8 05 0 8 05 0 α α α ; ) ( ) ( ) ( ) ( ) ( β * t s b s t t t s b β t s P b * / b b * / * k n / * k n / b i i * k n / b i i i
Klasický lineární regresní model - zadání příkladu Soubor: CV3_PR.xls Data: pocet_clenu = počet členů v domácnosti prijem = disponibilní příjem v tis. CZK vydaje = výdaje domácnosti na určité zboží v CZK 3