4EK Základy ekonometrie Odhad klasického lineárního regresního modelu II Cvičení 3 Zuzana Dlouhá
Klasický lineární regresní model - zadání příkladu Soubor: CV3_PR.xls Data: y = maloobchodní obrat potřeb pro domácnost v mld. CZK x = disponibilní příjem v mld. CZK x = cenový index v % Zadání: Odhadněte závislost maloobchodního obratu (y) na disponibilním příjmu (x ) a cenovém indexu (x ). Proveďte specifikaci, kvantifikaci, verifikaci a aplikaci EM. y t = β 0 + β x t + β x t + u t, t = 966, 967,...,973 pozor jenom cvičný příklad, v BP/DP je potřebný velký počet pozorování (alespoň 5-30!)
Klasický lineární regresní model - specifikace Specifikace EM určení proměnných y = závislá / endogenní / vysvětlovaná proměnná x = nezávislá / exogenní / vysvětlující proměnná x = nezávislá / exogenní / vysvětlující proměnná určení vzájemných vazeb mezi proměnnými (forma závislosti) + formulace hypotéz y t = β 0 + β x t + β x t + u t, t = 966, 967,...,973 předpokládané znaménka, očekávané hodnoty odhadnutých parametrů β = v intervalu (0,) pokud nepracujeme s úsporami nebo > 0 s úsporami β = by mělo být < 0 3
Klasický lineární regresní model - kvantifikace Kvantifikace EM odhad modelu MNČ, MS Excel + EViews (ls y c x x) Dependent Variable: Y Method: Least Squares Date: 0//5 Time: 4:46 Sample: 966 973 Included observations: 8 Variable Coefficient Std. Error t-statistic Prob. C 3.0698.03888.999 0.039 X 0.03550 0.004550.7590 0.0000 X -0.097964 0.0588-6.8978 0.006 R-squared 0.997094 Mean dependent var 0.50000 Adjusted R-squared 0.99593 S.D. dependent var.89089 S.E. of regression 0.068 Akaike info criterion -.36 Sum squared resid 0.0780 Schwarz criterion -.08536 Log likelihood 7.445305 Hannan-Quinn criter. -.35 F-statistic 857.838 Durbin-Watson stat.949445 Prob(F-statistic) 0.000000 4
Klasický lineární regresní model - kvantifikace Kvantifikace EM zápis odhadnutého regresního modelu (regresní nadroviny) Variable Coefficient Std. Error t-statistic Prob. C 3.0698.03888.999 0.039 X 0.03550 0.004550.7590 0.0000 X -0.097964 0.0588-6.8978 0.006 napozorované hodnoty: y = 3,06 + 0,04x 0,098x + e vyrovnané hodnoty: ŷ = 3,06 + 0,04x 0,098x oba zápisy jsou ekvivaletní (stačí jenom jeden) je to tzv. bodový odhad 5
Verifikace ekonomická předpokládané znaménka, očekávané hodnoty odhadnutých parametrů β = v intervalu (0,) pokud nepracujeme s úsporami nebo > 0 s úsporami b splňuje předpoklad β = by mělo být < 0 b splňuje předpoklad ekonomická interpretace b 0 bez interpretace b absolutní (příjmová) pružnost b y x b = 0,04 vzroste-li disponibilní příjem (x ) o mld. CZK (tj. o jednotku) a cenový index (x ) se nezmění, vzroste maloobchodní obrat potřeb pro domácnost v průměru o 0,04 mld. CZK 6
Verifikace ekonomická b absolutní (cenová) pružnost b y x b = -0,098 vzroste-li cenový index (x ) o jeden procentní bod a disponibilní příjem (x ) se nezmění, klesne maloobchodní obrat potřeb pro domácnost v průměru o 0,098 mld. CZK b i b jsou definovány v daných jednotkách!!! každou absolutní pružnost lze převést na pružnost relativní definuje se koeficient relativní pružnosti q počítá se vždy vzhledem k nějakému datu, v %! koeficient příjmové pružnosti koeficient cenové pružnosti y x x q x b x y y y x x b x y y q x 7
Verifikace ekonomická relativní pružnost pro rok 973 y (73) = 3,6 x (73) = 09 x (73) = 3 koeficient příjmové pružnosti x y 09 0, 04 3, 6 q x ( 73) b, 60 zvýší-li se v roce 973 disponibilní příjem (x ) o % a cenový index (x ) se nezmění, vzroste maloobchodní obrat potřeb pro domácnost o,60 % koeficient cenové pružnosti x y 3 0, 098 3, 6 q x ( 73) b, 0 8 zvýši-li se v roce 973 cenový index (x ) o % a disponibilní příjem (x ) se nezmění, klesne maloobchodní obrat potřeb pro domácnost o 0,8 % 8
Verifikace statistická Variable Coefficient Std. Error t-statistic Prob. Std. Error standardní chyba regresního koeficientu slouží k určení významnosti parametrů, k intervalovým odhadům s i s (X T X) b kde s C 3.0698.03888.999 0.039 X 0.03550 0.004550.7590 0.0000 X -0.097964 0.0588-6.8978 0.006 ( n ( k ii )) e T e najdu S.E. of regresion ve výstupu EViews ii prvek z diagonály momentové matice, pro náš příklad: 73, 0, 34, 06 (X T X) 0, 34 0, 00 0, 004 s b 0, 073 73,, 03 0 ( 8 3), 06 0, 004 0, 07 9
Verifikace statistická Variable Coefficient Std. Error t-statistic Prob. C 3.0698.03888.999 0.039 X 0.03550 0.004550.7590 0.0000 X -0.097964 0.0588-6.8978 0.006 t-statistic t-statistika slouží k určení významnosti jednotlivých parametrů v modelu dvoustranný test: H 0 : β j = 0 H : β j 0 bj β b j j Coefficient obecně pro t-statistiku platí: t j nebo: t j s s Std. error * t j t α/ ( n( k )) podařilo se zamítnout hypotézu H 0 o statistické nevýznamnosti odhadnutého regresního koeficientu na hladině výz. α * t j t α/ ( n( k )) nepodařilo se zamítnout hypotézu H 0 o statistické nevýznamnosti odhadnutého regresního koeficientu na hladině výz. α b j b j 0
Verifikace statistická Variable Coefficient Std. Error t-statistic Prob. C 3.0698.03888.999 0.039 X 0.03550 0.004550.7590 0.0000 X -0.097964 0.0588-6.8978 0.006 Prob. p-hodnota pravděpodobnost, že nulová hypotéza je pravdivá (nejnižší hladina významnosti, na které zamítám H 0 ) zvolím hladinu významnosti α a pokud p-hodnota < α zamítám H 0
Verifikace statistická R-squared 0.997094 Mean dependent var 0.50000 Adjusted R-squared 0.99593 S.D. dependent var.89089 S.E. of regression 0.068 Akaike info criterion -.36 Sum squared resid 0.0780 Schwarz criterion -.08536 Log likelihood 7.445305 Hannan-Quinn criter. -.35 F-statistic 857.838 Durbin-Watson stat.949445 Prob(F-statistic) 0.000000 S.E. of regression standardní chyba regrese [u~n(0,σ )] charakteristika výběrového rozptylu, který dostaneme po kvantifikaci abstraktního modelu vzorec s e T e 0, 073 0, 06 ( n ( k )) (8 3) užívá se při výpočtu standardní chyby regresního koeficientu Sum squared resid součet čtverců reziduí e i = e T e / vyzkoušet v MS Excel
Verifikace statistická R-squared 0.997094 Mean dependent var 0.50000 Adjusted R-squared 0.99593 S.D. dependent var.89089 S.E. of regression 0.068 Akaike info criterion -.36 Sum squared resid 0.0780 Schwarz criterion -.08536 Log likelihood 7.445305 Hannan-Quinn criter. -.35 F-statistic 857.838 Durbin-Watson stat.949445 Prob(F-statistic) 0.000000 R-squared R koeficient vícenásobné determinace hodnotí celkovou kvalitu modelu, určuje, jak se model shoduje s daty VSČ CSČ CSČ n R R, ( y i NSČ CSČ y ) VSČ n 0 ( yˆ i y ) CSČ celková suma čtverců, VSČ vysvětlená suma čtverců, NSČ nevysvětlená (reziduální) suma čtverců NSČ n ( y i yˆ i ) 3
Verifikace statistická R koeficient vícenásobné determinace je-li NSČ = 0, pak R = dokonalý model nezohledňuje počet vysvětlujících proměnných hodnota R nikdy neklesne přidáním dalších vysvětlujících proměnných do modelu řeší to tzv. korigovaný koeficient determinace (tj. R adj nebo R ) v EViews Adjusted R-squared R ( R n ) n ( k ) R < R zvyšováním počtu proměnných roste R, ale ne rovnost jen pokud R = nebo k = stejná závislá proměnná a stejný počet pozorování!!! R 4
Verifikace statistická R-squared 0.997094 Mean dependent var 0.50000 Adjusted R-squared 0.99593 S.D. dependent var.89089 S.E. of regression 0.068 Akaike info criterion -.36 Sum squared resid 0.0780 Schwarz criterion -.08536 Log likelihood 7.445305 Hannan-Quinn criter. -.35 F-statistic 857.838 Durbin-Watson stat.949445 Prob(F-statistic) 0.000000 Log likelihood hodnota věrohodnostní funkce při odhadové metodě metoda maximální věrohodnosti (MMV) oba odhady (pomocí MNČ i MMV) dávají stejné výsledky, pokud se pracuje s normálním regresním modelem 5
Verifikace statistická R-squared 0.997094 Mean dependent var 0.50000 Adjusted R-squared 0.99593 S.D. dependent var.89089 S.E. of regression 0.068 Akaike info criterion -.36 Sum squared resid 0.0780 Schwarz criterion -.08536 Log likelihood 7.445305 Hannan-Quinn criter. -.35 F-statistic 857.838 Durbin-Watson stat.949445 Prob(F-statistic) 0.000000 F-statistic F-poměr testuje statistickou významnost modelu = významnost modelu jako celku (využívá se Fischerovo rozdělení) H 0 : R statisticky nevýznamné, β 0 = β =... β j = 0 H : R statisticky významné, β j 0 F R R n ( k k ) 6
Verifikace statistická F > F* (k,n-(k+)) podařilo se zamítnout H 0 na hladině významnosti α F F* (k,n-(k+)) nepodařilo se zamítnout H 0 na hladině významnosti α v případě, že koeficient R není statisticky významný (viz F-poměr), doporučují se úpravy: přidání další vysvětlující proměnné zvýšení počtu pozorování změna funkčního tvaru regresní rovnice Prob(F-statistic) p-hodnota pravděpodobnost, že nulová hypotéza je pravdivá (nejnižší hladina významnosti, na které zamítám H 0 ) zvolím hladinu významnosti α a pokud p-hodnota < α zamítám H 0 7
Verifikace statistická R-squared 0.997094 Mean dependent var 0.50000 Adjusted R-squared 0.99593 S.D. dependent var.89089 S.E. of regression 0.068 Akaike info criterion -.36 Sum squared resid 0.0780 Schwarz criterion -.08536 Log likelihood 7.445305 Hannan-Quinn criter. -.35 F-statistic 857.838 Durbin-Watson stat.949445 Prob(F-statistic) 0.000000 Mean dependent var průměr vysvětlované (tj. endogenní) proměnné S.D. dependent var standardní odchylka vysvětlované (tj. endogenní) proměnné Akaike, Schwarz, Hannan-Quinn criterion informační kritéria výběr správného modelu vybírám minimální hodnotu neuvádět interpretaci v testu u prof. Pánkové!!! 8
Verifikace statistická R-squared 0.997094 Mean dependent var 0.50000 Adjusted R-squared 0.99593 S.D. dependent var.89089 S.E. of regression 0.068 Akaike info criterion -.36 Sum squared resid 0.0780 Schwarz criterion -.08536 Log likelihood 7.445305 Hannan-Quinn criter. -.35 F-statistic 857.838 Durbin-Watson stat.949445 Prob(F-statistic) 0.000000 Durbin-Watson stat Durbinova-Watsonova (DW) statistika d užívá se pro testování vlastností náhodných složek test autokorelace prvního řádu 9
Verifikace ekonometrická ověřuje splnění podmínek pro použití MNČ testuje se heteroskedasticita, autokorelace, měří se multikolinearita Aplikace predikce ex-post a ex-ante podrobně na cvičení 4 0
Klasický lineární regresní model - kvantifikace Kvantifikace EM intervalový odhad pokud vypočtený interval spolehlivosti obsahuje nulu (na zvolené hladině významnosti), je zároveň odhadnutý regresní koeficient statisticky nevýznamný (t-test neodmítne H 0 : β j = 0). EViews Equation (objekt) View Coefficient Diagnostics Confidence Intervals 0 58 0 09 0 0046* 57 0 04 0 0046 57 * 8 05 / 0 * 8 05 / 0 * / * / * /, ;,,,,,, ) (, ) (, ) ( ) ( ) ( β t s b s t t t s b β t s P b b b k n α k n α b j j k n α b j j j
Klasický lineární regresní model - zadání příkladu Soubor: CV3_PR.xls Data: pocet_clenu = počet členů v domácnosti prijem = disponibilní příjem v tis. CZK vydaje = výdaje domácnosti na určité zboží v CZK