Tomáš Karel LS 2012/2013



Podobné dokumenty
Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013

STATISTIKA I Metodický list č. 1 Název tématického celku:

Analýza časových řad. John Watters: Jak se stát milionářem.

KGG/STG Statistika pro geografy. Mgr. David Fiedor 4. května 2015

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA Sylabus pro předmět STATISTIKA Pomůcky... 7

LINEÁRNÍ REGRESE. Lineární regresní model

MATEMATIKA III V PŘÍKLADECH

4EK211 Základy ekonometrie

10. Předpovídání - aplikace regresní úlohy

Měření závislosti statistických dat

Statistika (KMI/PSTAT)

Časové řady, typy trendových funkcí a odhady trendů

Tomáš Karel LS 2012/2013

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

Časové řady, typy trendových funkcí a odhady trendů

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

odpovídá jedna a jen jedna hodnota jiných

Regrese. používáme tehdy, jestliže je vysvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

Bodové a intervalové odhady parametrů v regresním modelu

1. Příklad U automobilu byla měřena spotřeba benzínu v závislosti na rychlosti:

Bodové a intervalové odhady parametrů v regresním modelu

4EK211 Základy ekonometrie

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

4EK211 Základy ekonometrie

Úvodem Dříve les než stromy 3 Operace s maticemi

Regresní analýza 1. Regresní analýza

Statistická analýza jednorozměrných dat

Cvičící Kuba Kubina Kubinčák Body u závěrečného testu

4EK211 Základy ekonometrie

Manažerská ekonomika KM IT

8 ANALÝZA ČASOVÝCH ŘAD SEZÓNNÍ SLOŽKA

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

otec syn

Časové řady. Ing. Michal Dorda, Ph.D.

Regresní a korelační analýza

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Funkce jedné reálné proměnné. lineární kvadratická racionální exponenciální logaritmická s absolutní hodnotou

Interpolace pomocí splajnu

Ukázka závěrečného testu

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více

KGG/STG Statistika pro geografy

Časové řady - Cvičení

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ

Regresní analýza. Eva Jarošová

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

4EK211 Základy ekonometrie

Odhad parametrů N(µ, σ 2 )

Hodina 50 Strana 1/14. Gymnázium Budějovická. Hodnocení akcií

4EK211 Základy ekonometrie

2011 (datový soubor life expectancy CR.txt). Budeme predikovat vývoj očekávané doby dožití pomocí

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.

Vybrané statistické metody. You created this PDF from an application that is not licensed to print to novapdf printer (

Pravděpodobnost a matematická statistika

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

You created this PDF from an application that is not licensed to print to novapdf printer (

Korelační a regresní analýza

Obsah Úvod...3 Cíl práce...4 Literární p ehled...5 Teoretická ást...6 Vlastní práce...21

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Informační technologie a statistika 1

VÝVOJ INDEXŮ SPOTŘEBITELSKÝCH CEN

4EK211 Základy ekonometrie

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Ilustrační příklad odhadu LRM v SW Gretl

Diferenciální počet funkcí jedné proměnné

Testování hypotéz o parametrech regresního modelu

4EK211 Základy ekonometrie

Testování hypotéz o parametrech regresního modelu

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

INDUKTIVNÍ STATISTIKA

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Regrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly:

Úloha 1. Napište matici pro případ lineárního regresního spline vyjádřeného přes useknuté

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Aplikovaná statistika v R - cvičení 2

PRAVDĚPODOBNOST A STATISTIKA

Prostorová variabilita

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Časové řady a jejich periodicita úvod

Statistika pro geografy

4ST201 STATISTIKA CVIČENÍ Č. 10

5EN306 Aplikované kvantitativní metody I

4EK201 Matematické modelování. 11. Ekonometrie

Transkript:

Tomáš Karel LS 2012/2013

Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chb v této presentaci mě prosím upozorněte. Děkuji. Tto slid berte pouze jako doplňkový materiál není v nich obsaženo zdaleka všechno, co bste měli umět. Dalším studijním materiálem je učebnice, cvičebnice a také poznámk z přednášek a cvičení! Tomáš Karel - 4ST201 16.12.2013 2

cv. Program cvičení 1. Úvod, popisná statistika 2. Popisná statistika 3. Mír variabilit, pravděpodobnost 4. Pravděpodobnost, náhodné veličin a jejich charakteristik 5. Pravděpodobnostní rozdělení 6. TEST, odhad parametrů 7. Testování hpotéz 8. Chí kvadrát test dobré shod, kontingenční tabulk, ANOVA 9. Regrese 10. Regrese, korelace 11. TEST, časové řad (bazické a řetězové index) 12. Časové řad 13. Indexní analýza

intervalové (tokové): HDP počet sňatků počet narozených dětí počet vítězství v zápasech za určité období okamžikové (stavové) index spotřebitelských cen počet nezaměstnaných ke konci roku cena akcie teplota k určitému okamžiku

Roční časová řada (údaje získáváme po rocích) Intervalová časová řada (hodnot představují údaje za časový interval, tj. počet dětí narozených za daný rok) Data převzata z: Arlt, J., Arltová, M., Rublíková, E.: Analýza ekonomických časových řad s příklad. VŠE, Praha, 2002, 2004.

Čtvrtletní časová řada (údaje máme po čtvrtletích) Intervalová časová řada (hodnot představují údaje za časový interval, tj. HDP za dané čtvrtletí) Data převzata z: Arlt, J., Arltová, M., Rublíková, E.: Analýza ekonomických časových řad s příklad. VŠE, Praha, 2002, 2004.

Denní časová řada (údaje máme po obchodních dnech) Okamžiková časová řada (hodnot jsou stanoven k danému okamžiku, tj. představují cenu akcií k okamžiku uzavření burz daný obchodní den) Data převzata z: Arlt, J., Arltová, M., Rublíková, E.: Analýza ekonomických časových řad s příklad. VŠE, Praha, 2002, 2004.

průměr pro intervalové řad prostý aritmetický průměr (stejně dlouhé interval) - vážený aritmetický průměr (nestejně dlouhé interval) pro okamžikové řad chronologický průměr prostý v případě stejných vzdáleností mezi okamžik pozorování vážený v případě nestejných vzdáleností mír dnamik 1. diference 2. diference průměrný absolutní přírůstek koeficient růstu průměrný koeficient růstu

absolutní přírůstek (1. diference) o kolik vzrostla (klesla) hodnota časové řad v období t oproti t-1 2. diference rozdíl dvou sousedních prvních diferencí průměrný absolutní přírůstek o kolik v průměru vzrostla/klesla hodnota časové řad za celé sledované období 1 t t t 1 2 t t t 1 1 1 ) (... ) ( ) ( 1 2 1 2 3 1 2 T T T T T t t T T

koeficient růstu (tempo růstu) na kolik procent vzrostla/klesla hodnota časové řad v období t oproti t-1 průměrný koeficient růstu (průměrné tempo růstu) na kolik procent v průměru vzrostla/klesla hodnota časové řad za celé sledované období 1 1 1 2 3 1 2 1 3 2...... T T T T T k k k k 1 t t t k

V tabulce jsou uveden údaje o počtu zaměstnanců určitého podniku. Charakterizujte průměrný počet zaměstnanců tohoto podniku v roce 2008. Datum Počet zaměstnanců 1.1.2008 280 1.4.2008 260 1.7.2008 260 1.10.2008 220 1.1.2009 200 Jedná se o okamžikovou časovou řadu, tudíž nemůžeme údaje jednoduše sčítat, ale je třeba použít (vážený) chronologický průměr.

Datum Počet zaměstnanců 1.1.2008 280 1.4.2008 260 1.7.2008 260 1.10.2008 220 1.1.2009 200 d d... d 2 2 2 d d... d 1 2 2 3 n1 n 1 2 n1 1 2 n1 280 260 260 260 260 220 220 200 91 91 92 92 2 2 2 2 91 91 92 92 27091 26091 24092 21092 244,89 366

V tabulce jsou údaje o středním stavu obvatel Slovenska v období 1990 až 1997 (v tisících). Určete: a) 1. diference b) 2. diference c) meziroční tempa růstu (neboli koeficient růstu) d) průměrné tempo růstu (neboli průměrný koeficient růstu) Rok t Y t 1990 1 5 298 1991 2 5 283 1992 3 5 306 1993 4 5 325 1994 5 5 347 1995 6 5 364 1996 7 5 374 1997 8 5 383

Rok t Y t 1990 1 5 298 1991 2 5 283 1992 3 5 306 1993 4 5 325 1994 5 5 347 1995 6 5 364 1996 7 5 374 1997 8 5 383

d) průměrný koeficient růstu

Adaptivní přístup Metoda klouzavých průměrů m=3; 5; 9; Hodnotu parametru můžeme považovat za konstantní pouze v krátkém časovém intervalu -> v čase se mění Deterministický přístup Trendová funkce Hodnota parametru je konstantní lineární kvadratický parabolický exponenciální

pokud chceme očistit časovou řadu od náhodných nebo sezónních vlivů, můžeme použít klouzavé průměr pokud chceme z časové řad odstranit sezónnost liché délk a zachtit trend, používáme prosté klouzavé průměr té samé délk jako je délka sezónnosti čím větší délka klouzavého průměru, tím větší vhlazení časové řad t t p... t m... t p

Vrovnejte následující časovou řadu těžb dřeva v ČR v letech 1989 1997 (v 1000 m 3 ) jednoduchými klouzavými průměr délk 3 a 5. Rok Y t 1989 12 303 1990 13 332 1991 10 751 1992 9 850 1993 10 406 1994 11 950 1995 12 365 1996 12 584 1997 13 491

1 2 3 2;3 3 12303 13332 10751 12129 3 1 2 3 4 5 3;5 3 12303 13332 10751 9850 10406 5 11328

Pokud chceme z časové řad odstranit sezónnost SUDÉ DÉLKY a zachtit trend, používáme CENTROVANÉ klouzavé průměr DÉLKY O JEDNIČKU VĚTŠÍ než je délka sezónnosti. Pokud chceme z časové řad odstranit sezónnost LICHÉ DÉLKY a zachtit trend, používáme PROSTÉ klouzavé průměr TÉ SAMÉ DÉLKY jako je délka sezónnosti.

V tabulce je čtvrtletní časová řada HDP ČR (v mld. Kč) v období od 1.1. 1994 do 31.12. 2000. Vrovnejte tuto ČR centrovanými klouzavými průměr délk 5.

regresní přístup k trendu časovou řadu můžeme vrovnávat regresní přímkou, parabolou, exponenciálou (je to analogické tomu, co jsme dělali v regresi vsvětlující proměnná > t - čas) trendové funkce: konstantní trend lineární trendová funkce T t 0 T t 0 1 t kvadratická trendová funkce T t 2 0 1t 2t exponenciální trendová funkce t Tt 0 1 odhad parametrů pomocí MNČ

V tabulce jsou uveden hodnot (v mld.) roční časové řad exportu ČR za období 1999-2006. Vrovnejte tuto časovou řadu trendovou přímkou a určete předpověď pro rok 2010 (t = 12). rok export 1999 909 2000 1121 2001 1268 2002 1255 2003 1371 2004 1723 2005 1869 2006 2144

časovou řadu můžeme vrovnávat regresní přímkou, parabolou, exponenciálou... je to analogické tomu, co jsme dělali v regresi! Takže si ukážeme pouze exponenciálu, kterou jsme v regresi nedělali. Jakou zvolit trendovou funkci? při odhadu trendu si můžeme pomoci tzv. analýzou diferencí spočívá v tom, že na vývoje hodnot diferencí příp. koeficientů růstu můžeme odhadnout, jaký tp trendu se v časové řadě vsktuje přímka: 1. diference = okolo konstant 2. diference = okolo 0 parabola: 1. diference = lineární trend 2. diference = okolo konstant exponenciála: koeficient růstu = okolo konstant

K dispozici jsou tto údaje o počtu hostů v rekreačním středisku Trnávka. Na základě elementárních charakteristik vberte vhodnou trendovou funkci. Rok 2000 2001 2002 2003 2004 2005 2006 2007 Počet hostů 9480 10000 10480 10920 11320 11680 12000 12280

Střední čtvercová chba MSE Slouží k posouzení, která z trendových křivek je pro vrovnání časové řad vhodnější Volí se nejmenší MSE Původní hodnota v čase t Odhad trendové funkce v čase t

Na základě údajů o počtu vvezených ledniček (v tis. ks) do určité země v letech 1999-2007 jsme provedli trendovou analýzu. a) rozhodněte, která trendová funkce lépe vstihuje vývoj časové řad a uveďte na základě čeho tak usuzujete b) zapište rovnici odhadnutého trendu c) na základě vhodné trendové funkce odhadněte počet vvezených ledniček v roce 2008

Linear Exponencial Tpe t ln t N 9 9 Hranice 37,6667 3,7459 X 5,3333 0,0786 MSE 52,7619 0,0096 Hodnota spolehlivosti R 0,7264 0,8464 Nast. Hodnota spol. R 0,8221 0,8245

Časovou řadu v tabulce vrovnejte exponenciálou. Při analýze přiřaďte časový index t=1 (rok 1999). Nalezněte předpověď pro rok 2008.

1,18761 = b 0 = ln b0 => b 0 = e 1,18761 = 3,729 0,13185 = b 1 = ln b1 => b 1 = e 0,13185 = 1,141 = b 0 b 1 t = 3,729*1,141 t Předpověď na r. 2008 = 3,729*1,141 10 = 12,257

kvantifikace sezónních výkvů a možnost provedení sezónního očištění regresní přístup pomocí umělých proměnných trend modelujeme trendovou funkcí sezónní složku modelujeme pomocí umělých nula-jedničkových proměnných

Regresní přístup Konstantní sezónnost