Tomáš Karel LS 2012/2013
Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chb v této presentaci mě prosím upozorněte. Děkuji. Tto slid berte pouze jako doplňkový materiál není v nich obsaženo zdaleka všechno, co bste měli umět. Dalším studijním materiálem je učebnice, cvičebnice a také poznámk z přednášek a cvičení! Tomáš Karel - 4ST201 16.12.2013 2
cv. Program cvičení 1. Úvod, popisná statistika 2. Popisná statistika 3. Mír variabilit, pravděpodobnost 4. Pravděpodobnost, náhodné veličin a jejich charakteristik 5. Pravděpodobnostní rozdělení 6. TEST, odhad parametrů 7. Testování hpotéz 8. Chí kvadrát test dobré shod, kontingenční tabulk, ANOVA 9. Regrese 10. Regrese, korelace 11. TEST, časové řad (bazické a řetězové index) 12. Časové řad 13. Indexní analýza
intervalové (tokové): HDP počet sňatků počet narozených dětí počet vítězství v zápasech za určité období okamžikové (stavové) index spotřebitelských cen počet nezaměstnaných ke konci roku cena akcie teplota k určitému okamžiku
Roční časová řada (údaje získáváme po rocích) Intervalová časová řada (hodnot představují údaje za časový interval, tj. počet dětí narozených za daný rok) Data převzata z: Arlt, J., Arltová, M., Rublíková, E.: Analýza ekonomických časových řad s příklad. VŠE, Praha, 2002, 2004.
Čtvrtletní časová řada (údaje máme po čtvrtletích) Intervalová časová řada (hodnot představují údaje za časový interval, tj. HDP za dané čtvrtletí) Data převzata z: Arlt, J., Arltová, M., Rublíková, E.: Analýza ekonomických časových řad s příklad. VŠE, Praha, 2002, 2004.
Denní časová řada (údaje máme po obchodních dnech) Okamžiková časová řada (hodnot jsou stanoven k danému okamžiku, tj. představují cenu akcií k okamžiku uzavření burz daný obchodní den) Data převzata z: Arlt, J., Arltová, M., Rublíková, E.: Analýza ekonomických časových řad s příklad. VŠE, Praha, 2002, 2004.
průměr pro intervalové řad prostý aritmetický průměr (stejně dlouhé interval) - vážený aritmetický průměr (nestejně dlouhé interval) pro okamžikové řad chronologický průměr prostý v případě stejných vzdáleností mezi okamžik pozorování vážený v případě nestejných vzdáleností mír dnamik 1. diference 2. diference průměrný absolutní přírůstek koeficient růstu průměrný koeficient růstu
absolutní přírůstek (1. diference) o kolik vzrostla (klesla) hodnota časové řad v období t oproti t-1 2. diference rozdíl dvou sousedních prvních diferencí průměrný absolutní přírůstek o kolik v průměru vzrostla/klesla hodnota časové řad za celé sledované období 1 t t t 1 2 t t t 1 1 1 ) (... ) ( ) ( 1 2 1 2 3 1 2 T T T T T t t T T
koeficient růstu (tempo růstu) na kolik procent vzrostla/klesla hodnota časové řad v období t oproti t-1 průměrný koeficient růstu (průměrné tempo růstu) na kolik procent v průměru vzrostla/klesla hodnota časové řad za celé sledované období 1 1 1 2 3 1 2 1 3 2...... T T T T T k k k k 1 t t t k
V tabulce jsou uveden údaje o počtu zaměstnanců určitého podniku. Charakterizujte průměrný počet zaměstnanců tohoto podniku v roce 2008. Datum Počet zaměstnanců 1.1.2008 280 1.4.2008 260 1.7.2008 260 1.10.2008 220 1.1.2009 200 Jedná se o okamžikovou časovou řadu, tudíž nemůžeme údaje jednoduše sčítat, ale je třeba použít (vážený) chronologický průměr.
Datum Počet zaměstnanců 1.1.2008 280 1.4.2008 260 1.7.2008 260 1.10.2008 220 1.1.2009 200 d d... d 2 2 2 d d... d 1 2 2 3 n1 n 1 2 n1 1 2 n1 280 260 260 260 260 220 220 200 91 91 92 92 2 2 2 2 91 91 92 92 27091 26091 24092 21092 244,89 366
V tabulce jsou údaje o středním stavu obvatel Slovenska v období 1990 až 1997 (v tisících). Určete: a) 1. diference b) 2. diference c) meziroční tempa růstu (neboli koeficient růstu) d) průměrné tempo růstu (neboli průměrný koeficient růstu) Rok t Y t 1990 1 5 298 1991 2 5 283 1992 3 5 306 1993 4 5 325 1994 5 5 347 1995 6 5 364 1996 7 5 374 1997 8 5 383
Rok t Y t 1990 1 5 298 1991 2 5 283 1992 3 5 306 1993 4 5 325 1994 5 5 347 1995 6 5 364 1996 7 5 374 1997 8 5 383
d) průměrný koeficient růstu
Adaptivní přístup Metoda klouzavých průměrů m=3; 5; 9; Hodnotu parametru můžeme považovat za konstantní pouze v krátkém časovém intervalu -> v čase se mění Deterministický přístup Trendová funkce Hodnota parametru je konstantní lineární kvadratický parabolický exponenciální
pokud chceme očistit časovou řadu od náhodných nebo sezónních vlivů, můžeme použít klouzavé průměr pokud chceme z časové řad odstranit sezónnost liché délk a zachtit trend, používáme prosté klouzavé průměr té samé délk jako je délka sezónnosti čím větší délka klouzavého průměru, tím větší vhlazení časové řad t t p... t m... t p
Vrovnejte následující časovou řadu těžb dřeva v ČR v letech 1989 1997 (v 1000 m 3 ) jednoduchými klouzavými průměr délk 3 a 5. Rok Y t 1989 12 303 1990 13 332 1991 10 751 1992 9 850 1993 10 406 1994 11 950 1995 12 365 1996 12 584 1997 13 491
1 2 3 2;3 3 12303 13332 10751 12129 3 1 2 3 4 5 3;5 3 12303 13332 10751 9850 10406 5 11328
Pokud chceme z časové řad odstranit sezónnost SUDÉ DÉLKY a zachtit trend, používáme CENTROVANÉ klouzavé průměr DÉLKY O JEDNIČKU VĚTŠÍ než je délka sezónnosti. Pokud chceme z časové řad odstranit sezónnost LICHÉ DÉLKY a zachtit trend, používáme PROSTÉ klouzavé průměr TÉ SAMÉ DÉLKY jako je délka sezónnosti.
V tabulce je čtvrtletní časová řada HDP ČR (v mld. Kč) v období od 1.1. 1994 do 31.12. 2000. Vrovnejte tuto ČR centrovanými klouzavými průměr délk 5.
regresní přístup k trendu časovou řadu můžeme vrovnávat regresní přímkou, parabolou, exponenciálou (je to analogické tomu, co jsme dělali v regresi vsvětlující proměnná > t - čas) trendové funkce: konstantní trend lineární trendová funkce T t 0 T t 0 1 t kvadratická trendová funkce T t 2 0 1t 2t exponenciální trendová funkce t Tt 0 1 odhad parametrů pomocí MNČ
V tabulce jsou uveden hodnot (v mld.) roční časové řad exportu ČR za období 1999-2006. Vrovnejte tuto časovou řadu trendovou přímkou a určete předpověď pro rok 2010 (t = 12). rok export 1999 909 2000 1121 2001 1268 2002 1255 2003 1371 2004 1723 2005 1869 2006 2144
časovou řadu můžeme vrovnávat regresní přímkou, parabolou, exponenciálou... je to analogické tomu, co jsme dělali v regresi! Takže si ukážeme pouze exponenciálu, kterou jsme v regresi nedělali. Jakou zvolit trendovou funkci? při odhadu trendu si můžeme pomoci tzv. analýzou diferencí spočívá v tom, že na vývoje hodnot diferencí příp. koeficientů růstu můžeme odhadnout, jaký tp trendu se v časové řadě vsktuje přímka: 1. diference = okolo konstant 2. diference = okolo 0 parabola: 1. diference = lineární trend 2. diference = okolo konstant exponenciála: koeficient růstu = okolo konstant
K dispozici jsou tto údaje o počtu hostů v rekreačním středisku Trnávka. Na základě elementárních charakteristik vberte vhodnou trendovou funkci. Rok 2000 2001 2002 2003 2004 2005 2006 2007 Počet hostů 9480 10000 10480 10920 11320 11680 12000 12280
Střední čtvercová chba MSE Slouží k posouzení, která z trendových křivek je pro vrovnání časové řad vhodnější Volí se nejmenší MSE Původní hodnota v čase t Odhad trendové funkce v čase t
Na základě údajů o počtu vvezených ledniček (v tis. ks) do určité země v letech 1999-2007 jsme provedli trendovou analýzu. a) rozhodněte, která trendová funkce lépe vstihuje vývoj časové řad a uveďte na základě čeho tak usuzujete b) zapište rovnici odhadnutého trendu c) na základě vhodné trendové funkce odhadněte počet vvezených ledniček v roce 2008
Linear Exponencial Tpe t ln t N 9 9 Hranice 37,6667 3,7459 X 5,3333 0,0786 MSE 52,7619 0,0096 Hodnota spolehlivosti R 0,7264 0,8464 Nast. Hodnota spol. R 0,8221 0,8245
Časovou řadu v tabulce vrovnejte exponenciálou. Při analýze přiřaďte časový index t=1 (rok 1999). Nalezněte předpověď pro rok 2008.
1,18761 = b 0 = ln b0 => b 0 = e 1,18761 = 3,729 0,13185 = b 1 = ln b1 => b 1 = e 0,13185 = 1,141 = b 0 b 1 t = 3,729*1,141 t Předpověď na r. 2008 = 3,729*1,141 10 = 12,257
kvantifikace sezónních výkvů a možnost provedení sezónního očištění regresní přístup pomocí umělých proměnných trend modelujeme trendovou funkcí sezónní složku modelujeme pomocí umělých nula-jedničkových proměnných
Regresní přístup Konstantní sezónnost