Predikce Text o predikci pro upřesnění pro ty, které zajímá, kde se v EViews všechna ta čísla berou. Ruční výpočty u průběžného testu nebudou potřeba. Co bude v závěrečném testu, to nevím. Ale přečíst si to můžete všichni, jsou tam nějaké užitečné věci. Zadání Máme data hdp.wf1, která najdete zde: http://jakplavejak.cz/node/49 Odhadneme model: hdp t = β 0 + β 1 t + u t pro roky 1995 až 2007, kde t = 0, 1, 2, 12. Uděláme bodovou a intervalovou předpověď pro rok 2008. Bodová předpověď: Intervalová předpověď: Dosadíme t = 13: hdp 2008 = 1459 + 156,3 13 = 3491 Odhadneme rozptyl náhodné složky Ke stanovení intervalového odhadu potřebujeme znát rozptyl předpovědi. K tomu bychom potřebovali znát rozptyl náhodné složky, což je problém, protože hodnoty náhodných složek neznáme. Nemusíme ale truchlit: máme totiž k dispozici rezidua, pomocí kterých můžeme rozptyl náhodné složky odhadnout. Odhad rozptylu náhodné složky označíme s 2 a získáme ho jako: n s 2 1 = n k 1 e t 2 Příklad: uvažujme náš výše odhadnutý model. Je v něm 13 pozorování (n = 13) a jedna vysvětlující proměnná (čas, k = 1). Hodnoty reziduí po odhadu modelu se uloží do resid, nebo si je můžeme uložit a pojmenovat pomocí Proc Make Residual Series. Jejich hodnoty t=1
umocníme na druhou, sečteme, a získáme tak hodnotu 84638,32, což je vlastně součet čtverců reziduí (o tom jsme mluvili například v souvislosti s koeficientem determinace). EViews jej počítá automaticky a říká mu Sum squared resid. Pak spočítáme odhad rozptylu jako: s 2 = 1 n k 1 e t 2 n t=1 = 1 13 1 1 84638,32= 7694,388. Odmocnina z něj je odhadem směrodatné odchylky náhodné složky a je rovna 87,72. EViews ji počítá automaticky a nazývá ji S.E. of regression. Abychom lépe pochopili, jakou roli hraje rozptyl náhodné složky (resp. odmocnina z něj jakožto směrodatná odchylka), vygenerujeme si hodnoty y pro t = 0, 1,, 12 následovně: a) y t = 1459 + 156t + u t, kde u t ~N(0; 10 2 ) b) y t = 1459 + 156t + u t, kde u t ~N(0; 88 2 ) c) y t = 1459 + 156t + u t, kde u t ~N(0; 200 2 ) Tedy u t je normálně rozdělená náhodná složka se střední hodnotou 0 a směrodatnou odchylkou postupně a) 10 b) 88 c) 200. a) b) c)
Odhadneme rozptyl předpovědi Jakmile známe odhad rozptylu náhodné složky s 2, můžeme zjistit i odhad rozptylu předpovědi s. 2 p Spočítá se takto: s 2 p = s 2 T [1 + x T+1 (X T X) 1 x T+1 ] V tomto vzorci se skrývá: s 2 = odhad rozptylu náhodné složky, který jsme si spočítali výše a je roven 7694,388 T x T+1 = transponovaný vektor vysvětlujících proměnných v období předpovědi, pro náš případ [1 13] x T+1 = ten samý vektor vysvětlujících proměnných v období předpovědi, který není transponovaný, takže [ 1 ]. Existuje totiž konvence, podle níž jsou transponované 13 vektory řádkové, netransponované pak sloupcové. (X T X) 1 = což dostaneme tak, že vynásobíme tyto matice (pozn. v matici X je sloupec jedniček, protože je v modelu úrovňová konstanta) X T X 1 1 1 1 1 1 1 1 1 1 1 1 1. 1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 1 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 1 10 1 11 1 12 čímž dostaneme matici X T X 13 78 78 650 kterou pak invertujeme. (X T X) -1 0,275-0,033-0,033 0,005
Teď to můžeme dosadit do vzorce uvedeného výše: s 2 p = s 2 T [1 + x T+1 (X T X) 1 x T+1 ] s 2 0,275 0,033 p = 7694,388 [1 + [1 13] [ 0,033 0,005 ] [ 1 ]] = 10 358. 13 Odmocnina z 10 358 je směrodatná chyba předpovědi a je rovna 101,78. Teď už si můžeme spočítat intervalovou předpověď: 3492 ± 2 101,78 = (3288; 3695) Pozn. číslo 2 je přibližně, správně bychom se měli podívat do tabulek Studentova rozdělení. V Eviews - Odhadneme regresi na datech 1995 až 2007 - Proc Structure/Resize Current Page 1995 2008 (je potřeba mít aktivní okno s daty) - Klikneme zpět do okna s odhadnutou regresí a klikneme na forecast, zadáme název Forecast Name a SE, například hdpf, sef. Přepovídané hodnoty (bodovou předpověď) a jejich směrodatné chyby se nám uloží jako nové datové řady. Když si je rozklikneme, uvidíme něco takového:
Zároveň nám EViews vykreslí tento obrázek. Červené čáry představují hranice intervalu spolehlivosti. 4,000 3,500 3,000 2,500 2,000 1,500 Forecast: HDPF Actual: HDP Forecast sample: 1995 2008 Included observations: 13 Root Mean Squared Error 80.68851 Mean Absolute Error 63.63077 Mean Abs. Percent Error 2.549543 Theil Inequality Coefficient 0.016345 Bias Proportion 0.000000 Variance Proportion 0.004711 Covariance Proportion 0.995289 1,000 95 96 97 98 99 00 01 02 03 04 05 06 07 08 HDPF ± 2 S.E. Pokud zadáme po kliknutí na forecast období 2008 2008 (dvakrát, od do) vykreslí se graf jen pro rok 2008. Vidíme, že červené tečky odpovídají hranicím intervalu spolehlivosti, který jsme si spočítali výše: (3288; 3695) 3,700 3,600 3,500 3,400 3,300 3,200 2008 HDPF ± 2 S.E.