Zadání Máme data hdp.wf1, která najdete zde: Bodová předpověď: Intervalová předpověď:

Podobné dokumenty
4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

Bodové a intervalové odhady parametrů v regresním modelu

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

AVDAT Klasický lineární model, metoda nejmenších

Protokol č. 1. Tloušťková struktura. Zadání:

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

Stavový model a Kalmanův filtr

Regresní analýza 1. Regresní analýza

Bodové odhady parametrů a výstupů

4EK211 Základy ekonometrie

Bodové a intervalové odhady parametrů v regresním modelu

Opravená data Úloha (A) + (E) Úloha (C) Úloha (B) Úloha (D) Lineární regrese

Lineární regrese. Komentované řešení pomocí MS Excel

4EK211 Základy ekonometrie

Regresní a korelační analýza

PRAVDĚPODOBNOST A STATISTIKA

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Regresní a korelační analýza

Téma 9: Vícenásobná regrese

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Testování hypotéz o parametrech regresního modelu

4EK211 Základy ekonometrie

Testování hypotéz o parametrech regresního modelu

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

odpovídá jedna a jen jedna hodnota jiných

Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných)

AVDAT Nelineární regresní model

Odhady - Sdružené rozdělení pravděpodobnosti

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

KGG/STG Statistika pro geografy

Inovace bakalářského studijního oboru Aplikovaná chemie

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Příloha č.1 Vypočtené hodnoty jednotlivých proměnných indexu OCA pro MUBS za období

4EK211 Základy ekonometrie

Cvičení 9 dekompozice časových řad a ARMA procesy

Studentská limitovaná verze je ke stažení na stránkách GiveWin otevření datového souboru

Nejdřív spočítáme jeden příklad na variaci konstant pro lineární diferenciální rovnici 2. řádu s kostantními koeficienty. y + y = 4 sin t.

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

Odhady parametrů základního souboru. Cvičení 6 Statistické metody a zpracování dat 1 (podzim 2016) Brno, říjen listopad 2016 Ambrožová Klára

Regresní analýza. Eva Jarošová

Analýza reziduí gyroskopu umístěného na kyvadle p.1

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

Regresní a korelační analýza

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

UNIVERZITA PARDUBICE

Regresní a korelační analýza

STATISTICA Téma 8. Regresní a korelační analýza, regrese prostá

Regresní a korelační analýza

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

Cvičení ze statistiky - 3. Filip Děchtěrenko

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

AVDAT Geometrie metody nejmenších čtverců

Kontrola: Sečteme-li sloupec,,četnost výskytu musí nám vyjít hodnota rozsahu souboru (našich 20 žáků)

Odhad parametrů N(µ, σ 2 )

LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

Odhad parametrů N(µ, σ 2 )

Regresní a korelační analýza

Semestrální práce. 3.3 Tvorba nelineárních regresních modelů v analýze dat

Design Experimentu a Statistika - AGA46E

Regrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly:

Cvičení ze statistiky - 8. Filip Děchtěrenko

8 ANALÝZA ČASOVÝCH ŘAD SEZÓNNÍ SLOŽKA

TEST 1 (40 bodů) (9 4)! 2. Nejméně kolikrát musíme hodit kostkou, abychom měli alespoň 80% pravděpodobnost, že padne alespoň jedna šestka?

Popisná statistika. Komentované řešení pomocí MS Excel

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Statistická analýza dat

Testování předpokladů pro metodu chain-ladder. Seminář z aktuárských věd Petra Španihelová

Chyba predikce při rezervování metodou Chain Ladder u korelovaných vývojových trojúhelníků

Charakteristika datového souboru

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

(Cramerovo pravidlo, determinanty, inverzní matice)

Protokol č. 5. Vytyčovací údaje zkusných ploch

Základní statistické modely Statistické vyhodnocování exp. dat M. Čada ~ cada

Základy ekonometrie. XI. Vektorové autoregresní modely. Základy ekonometrie (ZAEK) XI. VAR modely Podzim / 28

5EN306 Aplikované kvantitativní metody I

Popisná statistika. Komentované řešení pomocí programu R. Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze

KGG/STG Statistika pro geografy

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů

ANALYTICKÁ GEOMETRIE LINEÁRNÍCH ÚTVARŮ V ROVINĚ

Pracovní text a úkoly ke cvičením MF002

Příloha č. 1 Grafy a protokoly výstupy z adstatu

Zpracování a vyhodnocování analytických dat

Kontingenční tabulky a testy shody

0.1 Úvod do lineární algebry

Tomáš Karel LS 2012/2013

Plánování experimentu

Regrese. používáme tehdy, jestliže je vysvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA

Transkript:

Predikce Text o predikci pro upřesnění pro ty, které zajímá, kde se v EViews všechna ta čísla berou. Ruční výpočty u průběžného testu nebudou potřeba. Co bude v závěrečném testu, to nevím. Ale přečíst si to můžete všichni, jsou tam nějaké užitečné věci. Zadání Máme data hdp.wf1, která najdete zde: http://jakplavejak.cz/node/49 Odhadneme model: hdp t = β 0 + β 1 t + u t pro roky 1995 až 2007, kde t = 0, 1, 2, 12. Uděláme bodovou a intervalovou předpověď pro rok 2008. Bodová předpověď: Intervalová předpověď: Dosadíme t = 13: hdp 2008 = 1459 + 156,3 13 = 3491 Odhadneme rozptyl náhodné složky Ke stanovení intervalového odhadu potřebujeme znát rozptyl předpovědi. K tomu bychom potřebovali znát rozptyl náhodné složky, což je problém, protože hodnoty náhodných složek neznáme. Nemusíme ale truchlit: máme totiž k dispozici rezidua, pomocí kterých můžeme rozptyl náhodné složky odhadnout. Odhad rozptylu náhodné složky označíme s 2 a získáme ho jako: n s 2 1 = n k 1 e t 2 Příklad: uvažujme náš výše odhadnutý model. Je v něm 13 pozorování (n = 13) a jedna vysvětlující proměnná (čas, k = 1). Hodnoty reziduí po odhadu modelu se uloží do resid, nebo si je můžeme uložit a pojmenovat pomocí Proc Make Residual Series. Jejich hodnoty t=1

umocníme na druhou, sečteme, a získáme tak hodnotu 84638,32, což je vlastně součet čtverců reziduí (o tom jsme mluvili například v souvislosti s koeficientem determinace). EViews jej počítá automaticky a říká mu Sum squared resid. Pak spočítáme odhad rozptylu jako: s 2 = 1 n k 1 e t 2 n t=1 = 1 13 1 1 84638,32= 7694,388. Odmocnina z něj je odhadem směrodatné odchylky náhodné složky a je rovna 87,72. EViews ji počítá automaticky a nazývá ji S.E. of regression. Abychom lépe pochopili, jakou roli hraje rozptyl náhodné složky (resp. odmocnina z něj jakožto směrodatná odchylka), vygenerujeme si hodnoty y pro t = 0, 1,, 12 následovně: a) y t = 1459 + 156t + u t, kde u t ~N(0; 10 2 ) b) y t = 1459 + 156t + u t, kde u t ~N(0; 88 2 ) c) y t = 1459 + 156t + u t, kde u t ~N(0; 200 2 ) Tedy u t je normálně rozdělená náhodná složka se střední hodnotou 0 a směrodatnou odchylkou postupně a) 10 b) 88 c) 200. a) b) c)

Odhadneme rozptyl předpovědi Jakmile známe odhad rozptylu náhodné složky s 2, můžeme zjistit i odhad rozptylu předpovědi s. 2 p Spočítá se takto: s 2 p = s 2 T [1 + x T+1 (X T X) 1 x T+1 ] V tomto vzorci se skrývá: s 2 = odhad rozptylu náhodné složky, který jsme si spočítali výše a je roven 7694,388 T x T+1 = transponovaný vektor vysvětlujících proměnných v období předpovědi, pro náš případ [1 13] x T+1 = ten samý vektor vysvětlujících proměnných v období předpovědi, který není transponovaný, takže [ 1 ]. Existuje totiž konvence, podle níž jsou transponované 13 vektory řádkové, netransponované pak sloupcové. (X T X) 1 = což dostaneme tak, že vynásobíme tyto matice (pozn. v matici X je sloupec jedniček, protože je v modelu úrovňová konstanta) X T X 1 1 1 1 1 1 1 1 1 1 1 1 1. 1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 1 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 1 10 1 11 1 12 čímž dostaneme matici X T X 13 78 78 650 kterou pak invertujeme. (X T X) -1 0,275-0,033-0,033 0,005

Teď to můžeme dosadit do vzorce uvedeného výše: s 2 p = s 2 T [1 + x T+1 (X T X) 1 x T+1 ] s 2 0,275 0,033 p = 7694,388 [1 + [1 13] [ 0,033 0,005 ] [ 1 ]] = 10 358. 13 Odmocnina z 10 358 je směrodatná chyba předpovědi a je rovna 101,78. Teď už si můžeme spočítat intervalovou předpověď: 3492 ± 2 101,78 = (3288; 3695) Pozn. číslo 2 je přibližně, správně bychom se měli podívat do tabulek Studentova rozdělení. V Eviews - Odhadneme regresi na datech 1995 až 2007 - Proc Structure/Resize Current Page 1995 2008 (je potřeba mít aktivní okno s daty) - Klikneme zpět do okna s odhadnutou regresí a klikneme na forecast, zadáme název Forecast Name a SE, například hdpf, sef. Přepovídané hodnoty (bodovou předpověď) a jejich směrodatné chyby se nám uloží jako nové datové řady. Když si je rozklikneme, uvidíme něco takového:

Zároveň nám EViews vykreslí tento obrázek. Červené čáry představují hranice intervalu spolehlivosti. 4,000 3,500 3,000 2,500 2,000 1,500 Forecast: HDPF Actual: HDP Forecast sample: 1995 2008 Included observations: 13 Root Mean Squared Error 80.68851 Mean Absolute Error 63.63077 Mean Abs. Percent Error 2.549543 Theil Inequality Coefficient 0.016345 Bias Proportion 0.000000 Variance Proportion 0.004711 Covariance Proportion 0.995289 1,000 95 96 97 98 99 00 01 02 03 04 05 06 07 08 HDPF ± 2 S.E. Pokud zadáme po kliknutí na forecast období 2008 2008 (dvakrát, od do) vykreslí se graf jen pro rok 2008. Vidíme, že červené tečky odpovídají hranicím intervalu spolehlivosti, který jsme si spočítali výše: (3288; 3695) 3,700 3,600 3,500 3,400 3,300 3,200 2008 HDPF ± 2 S.E.