Univerzita Palackého v Olomouci , Ostrava

Podobné dokumenty
1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů

KGG/STG Statistika pro geografy. Mgr. David Fiedor 4. května 2015

odpovídá jedna a jen jedna hodnota jiných

Bodové a intervalové odhady parametrů v regresním modelu

Tomáš Karel LS 2012/2013

Statistika (KMI/PSTAT)

Regresní analýza 1. Regresní analýza

Vybrané metody analýzy časových řad s programem STATISTICA

AVDAT Klasický lineární model, metoda nejmenších

Úvod do analýzy časových řad

Strukturální regresní modely. určitý nadhled nad rozličnými typy modelů

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Odhad parametrů N(µ, σ 2 )

Periodicita v časové řadě, její popis a identifikace, exponenciální vyrovnáván

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

AVDAT Nelineární regresní model

Statistická analýza jednorozměrných dat

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

Aplikovaná matematika I

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Odhad parametrů N(µ, σ 2 )

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

Regresní a korelační analýza

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

T t. S t krátkodobé náhodná složka. sezónní. Trend + periodická složka = deterministická složka

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Regresní analýza. Eva Jarošová

Charakterizace rozdělení

Odhady Parametrů Lineární Regrese

4EK211 Základy ekonometrie

Regrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly:

Modelování nákladů. Modely závislosti nákladů na 1 činiteli

ODHADY BUDOUCÍCH POČTŮ POJIŠTĚNCŮ VZP ČR NA BÁZI JEDNOLETÝCH ČASOVÝCH ŘAD. ROBUST 2018 RYBNÍK u Domažlic,

Metoda nejmenších čtverců Michal Čihák 26. listopadu 2012

4EK211 Základy ekonometrie

7. Analýza rozptylu.

Statistické metody v marketingu. Ing. Michael Rost, Ph.D.

AVDAT Mnohorozměrné metody, metody klasifikace

3 Bodové odhady a jejich vlastnosti

UNIVERZITA PARDUBICE

MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ

Regresní a korelační analýza

Semestrální práce. 3.3 Tvorba nelineárních regresních modelů v analýze dat

STATISTIKA I Metodický list č. 1 Název tématického celku:

13.1. Úvod Cílem regresní analýzy je popsat závislost hodnot znaku Y na hodnotách

LWS při heteroskedasticitě

4EK211 Základy ekonometrie

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Regresní a korelační analýza

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

INDUKTIVNÍ STATISTIKA

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Statistické metody v marketingu. Ing. Michael Rost, Ph.D.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Regresní a korelační analýza

4ST201 STATISTIKA CVIČENÍ Č. 10

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

Interpolace pomocí splajnu

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Statistické metody v marketingu. Ing. Michael Rost, Ph.D.

Testování statistických hypotéz

15. T e s t o v á n í h y p o t é z

Opravená data Úloha (A) + (E) Úloha (C) Úloha (B) Úloha (D) Lineární regrese

Téma je podrobně zpracováno ve skriptech [1], kapitola 6, strany

Bodové a intervalové odhady parametrů v regresním modelu

Numerická stabilita algoritmů

Zákony hromadění chyb.

Chyby nepřímých měření

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

Normální (Gaussovo) rozdělení

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ

Lineární regrese. Komentované řešení pomocí MS Excel

Kalibrace a limity její přesnosti

Statistická analýza jednorozměrných dat

4. Aplikace matematiky v ekonomii

Robustní odhady statistických parametrů

SIGNÁLY A LINEÁRNÍ SYSTÉMY

PRAVDĚPODOBNOST A STATISTIKA

Inovace bakalářského studijního oboru Aplikovaná chemie

Základy ekonometrie. XI. Vektorové autoregresní modely. Základy ekonometrie (ZAEK) XI. VAR modely Podzim / 28

Regresní a korelační analýza

ODBORNÉ DOPORUČENÍ ČSpA č.1 STANOVENÍ BEZRIZIKOVÉ VÝNOSOVÉ KŘIVKY

5EN306 Aplikované kvantitativní metody I

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

UNIVERZITA PARDUBICE. 4.4 Aproximace křivek a vyhlazování křivek

ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

časovém horizontu na rozdíl od experimentu lépe odhalit chybné poznání reality.

Měření závislosti statistických dat

Pravděpodobnost a aplikovaná statistika

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

PRAVDĚPODOBNOST A STATISTIKA

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Vlastnosti odhadů ukazatelů způsobilosti

Numerické metody a programování. Lekce 7

Transkript:

Časové řady I Ondřej Vencálek Univerzita Palackého v Olomouci ondrej.vencalek@upol.cz seminář pro VŠB-TUO 2015-03-13, Ostrava

Nové kreativní týmy v prioritách vědeckého bádání CZ.1.07/2.3.00/30.0055 Tento projekt je spolufinancován z ESF a státního rozpočtu ČR.

Dekompoziční přístup o čem bude řeč... Trendová složka Popis trendu matematickými křivkami lineární, kvadratický, exponenciální, modifikovaný exponenciální, logistický, zobecněný logistický trend Adaptivní přístupy k trendové složce metoda klouzavých průměrů exponenciální vyrovnávání Sezónní složka Regresní přístup k sezónnosti Holtova-Wintersova metoda Náhodná složka Testy náhodnosti

Lineární trend Zaledneni Arktidy, mesic brezen plocha v mil. km2 14.5 15.0 15.5 16.0 16.5 1980 1985 1990 1995 2000 2005 2010 2015 t Tr(t) = β 0 +β 1 t, pro t = 1,...,n

Příklad trend zalednění Arktidy obrázek

Příklad trend zalednění Arktidy Data: Monthly Sea Ice Extent veřejně přístupná na stránkách National Snow & Ice Data Center http://nsidc.org/ http://nsidc.org/data/docs/noaa/g02135 seaice index/#monthly extent image ftp://sidads.colorado.edu/datasets/noaa/g02135/mar/n 03 area.txt

year mo data_type region extent area 1979 3 Goddard N 16.45 13.13 1980 3 Goddard N 16.13 12.92 1981 3 Goddard N 15.61 12.62 1982 3 Goddard N 16.15 12.99 1983 3 Goddard N 16.10 12.84 1984 3 Goddard N 15.62 12.48 1985 3 Goddard N 16.06 12.66 1986 3 Goddard N 16.08 12.65 1987 3 Goddard N 15.95 12.75 1988 3 Goddard N 16.13 13.84 1989 3 Goddard N 15.52 13.14 1990 3 Goddard N 15.88 13.44 1991 3 Goddard N 15.50 13.35 1992 3 Goddard N 15.47 13.41 1993 3 Goddard N 15.88 13.71 1994 3 Goddard N 15.58 13.47 1995 3 Goddard N 15.32 13.28 1996 3 Goddard N 15.13 12.83 1997 3 Goddard N 15.58 13.24 1998 3 Goddard N 15.66 13.50 1999 3 Goddard N 15.40 13.47 2000 3 Goddard N 15.27 13.10 2001 3 Goddard N 15.61 13.57 2002 3 Goddard N 15.44 13.36 2003 3 Goddard N 15.49 13.36 2004 3 Goddard N 15.05 12.93 2005 3 Goddard N 14.74 12.67 2006 3 Goddard N 14.43 12.44 2007 3 Goddard N 14.65 12.49 2008 3 Goddard N 15.22 13.20 2009 3 Goddard N 15.14 13.08 2010 3 Goddard N 15.11 13.19 2011 3 Goddard N 14.58 12.48 2012 3 Goddard N 15.24 13.08 2013 3 Goddard N 15.05 13.10 2014 3 NRTSI-G N 14.76 12.52

Lineární trend trocha teorie Y(t) = Tr(t)+E(t), Tr(t) = β 0 +β 1 t E(t) N(0,σ 2 ), nezávislé pro t = 1,...,n Odhad (vektorového) parametru β = (β 0,β 1 ) metodou nejmenších čtverců, tj. minimalizujeme n t=1 (Y(t) (β 0 +β 1 t)) 2 X = 1 1 1 2. b = (X X) 1 X Y, s 2 = 1 n n 2 t=1 (Y(t) b 0 b 1 t) 2 Vlastnosti odhadu: Eb = β Varb = σ 2 (X X) 1 b má normální rozdělení. 1 n

Predikce hodnoty Y(T) Bodový odhad: Y(T) = Tr(T)+E(T) = β 0 +β 1 T +E(T) Ŷ(T) = Tr(T)+Ê(T) Ŷ(T) = b 0 +b 1 T Intervalový odhad: Y(T) (b 0 +b 1 T) = (β 0 +β 1 T +E(T)) (b 0 +b 1 T) N ( 0,σ 2 +(1,T)Var(b)(1,T) ) ( b 0 +b 1 T ±t n 2 1 α ) s 1+(1,T)(X X) 2 1 (1,T), ( ) kde t n 2 1 α 2 je (1 α 2 )-kvantil Studentova rozdělení o n 2 stupních volnosti (viz následující poznámka).

Připomenutí: pojem kvantil (pro spojitá rozdělení) Máme dáno rozdělení náhodné veličiny X (např. Studentovo rozdělení o 34 stupních volnosti) α (0,1) Ptáme se, pro jaké x platí P(X < x) = α. Tuto hodnotu nazýváme α-kvantilem daného rozdělení.

Lineární trend: predikce Zaledneni Arktidy, mesic brezen, predikce na rok 2015 plocha v mil. km2 14.5 15.0 15.5 16.0 16.5 1980 1985 1990 1995 2000 2005 2010 2015 t

Kvadratický trend Zaledneni Arktidy, mesic rijen plocha v mil. km2 7.0 7.5 8.0 8.5 9.0 9.5 10.0 1980 1985 1990 1995 2000 2005 2010 2015 t Tr(t) = β 0 +β 1 t +β 2 t 2, pro t = 1,...,n

Lineární nebo kvadratický trend? Zaledneni Arktidy, mesic rijen plocha v mil. km2 7.0 8.0 9.0 10.0 1980 1985 1990 1995 2000 2005 2010 2015 residua pri linearnim trendu residua 1.0 0.5 0.0 0.5 1980 1985 1990 1995 2000 2005 2010 2015 residua pri kvadratickem trendu residua 1.0 0.5 0.0 0.5 1980 1985 1990 1995 2000 2005 2010 2015

Lineární nebo kvadratický trend? Tr(t) = β 0 +β 1 t +β 2 t 2, Testujeme hypotézu H: β 2 = 0 (proti oboustranné alternativě) > model2 = lm(y~t+i(t^2)) > summary(model2)... Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) -8.366e+03 2.872e+03-2.913 0.00638 ** t 8.451e+00 2.877e+00 2.937 0.00599 ** I(t^2) -2.132e-03 7.205e-04-2.959 0.00567 ** P value = 0.00567 < 0.05, tedy zamítáme hypotézu nulovosti paremtru β 2, voĺıme kvadratický trend.

Kvadratický trend trocha teorie Y(t) = Tr(t)+E(t), Tr(t) = β 0 +β 1 t+β 2 t 2 E(t) N(0,σ 2 ), nezávislé pro t = 1,...,n Odhad (vektorového) parametru β = (β 0,β 1,β 2 ) metodou nejmenších čtverců, tj. minimalizujeme n t=1 (Y(t) (β 0 +β 1 t+β 2 t 2 )) 2 X = 1 1 1 1 2 4... 1 n n 2 b = (X X) 1 X Y, s 2 = 1 n n 3 t=1 (Y(t) b 0 b 1 t b 2 t 2 ) 2 Vlastnosti odhadu: Eb = β Varb = σ 2 (X X) 1 b má normální rozdělení

Predikce hodnoty Y(T) Bodový odhad: Y(T) = Tr(T)+E(T) = β 0 +β 1 T+β 2 T 2 +E(T) Ŷ(T) = Tr(T)+Ê(T) Ŷ(T) = b 0 +b 1 T+b 2 T 2 Intervalový odhad:y(t) (b 0 +b 1 T+b 2 T 2 ) N ( 0,σ 2 +(1,T,T 2 )Var(b)(1,T,T 2 ) ) ( b 0 +b 1 T+b 2 T 2 ±t n 3 1 α ) s 1+(1,T,T 2 2 )(X X) 1 (1,T,T 2 ), ( ) kde t n 3 1 α 2 je (1 α 2 )-kvantil Studentova rozdělení o n 3 stupních volnosti.

Varování před polynomy vyššího stupně Zaledneni Arktidy, mesic rijen, roky 1979 1984 plocha v mil. km2 9.0 9.4 9.8 10.2 0 1 2 3 4 5 6 prolozeni polynomem 4. stupne

Varování před polynomy vyššího stupně Zaledneni Arktidy, mesic rijen, roky 1979 1984 plocha v mil. km2 9.0 9.4 9.8 10.2 0 1 2 3 4 5 6 prolozeni polynomem 4. stupne

Exponenciální trend Pocet tranzistoru v mikroprocesorech 5 000 000 000 4 000 000 000 3 000 000 000 2 000 000 000 1 000 000 000 0 1970 1975 1980 1985 1990 1995 2000 2005 2010 2015 rok Tr(t) = α β t, pro t = 1,...,n

Exponenciální trend příklad (Mooreův zákon) Moorův zákon je empirické pravidlo, které roku 1965 vyslovil chemik a spoluzakladatel firmy Intel Gordon Moore. Původní znění bylo: počet tranzistorů, které mohou být umístěny na integrovaný obvod se při zachování stejné ceny zhruba každých 18 měsíců zdvojnásobí. Takovýto růst se nazývá exponenciální. Složitost dnešních procesorů se poměřuje především počtem tranzistorů v nich zapojených. Rychlost růstu počtu tranzistorů na plošné jednotce se časem zpomalila a nyní se jejich počet zdvojnásobuje přibližně jednou za dva roky. http://cs.wikipedia.org/wiki/mooreův_zákon

Mooreův zákon data Processor Transistor.count Date.of.introduct. 1 Intel 4004 2300 1971 2 Intel 8008 3500 1972 3 MOS Technology 6502 3510.00 1975 4 Motorola 6800 4100 1974 5 Intel 8080 4500 1974 6 RCA 1802 5000 1974 7 Intel 8085 6500 1976 8 Zilog Z80 8500 1976 9 Motorola 6809 9000 1978 10 Intel 8086 29000 1978.... 80 12-core POWER8 4200000000 2013 81 15-core Xeon Ivy Bridge-EX 4310000000 2014 82 62-core Xeon Phi 5000000000 2012 83 Apple A7 ( mobile SoC ) 1000000000 2013 84 Xbox One main SoC 5000000000 2013

Graf I Pocet tranzistoru v mikroprocesorech pocet 0e+00 2e+09 4e+09 1970 1980 1990 2000 2010 rok

Graf II po logaritmické transformaci Pocet tranzistoru v mikroprocesorech 1 000 000 000 100 000 000 10 000 000 1 000 000 100 000 10 000 1970 1975 1980 1985 1990 1995 2000 2005 2010 2015 rok

Exponenciální trend Tr(t) = α β t log(tr(t)) = log(α)+tlog(β) log(tr(t)) = α 0 +tβ 0 Při označení α 0 := log(α), β 0 := log(β).

Lineární chování logaritmované veličiny Pocet tranzistoru v mikroprocesorech 1 000 000 000 100 000 000 10 000 000 1 000 000 100 000 10 000 1970 1975 1980 1985 1990 1995 2000 2005 2010 2015 t

Jaký logaritmus mám použít? (To je jedno!) log 2 (Tr(t)) = α 0 +β 0 t : log 10 2 log 10 (Tr(t)) = α 0 +β 0t : ln10 ln(tr(t)) = α 0 +β 0 t

Odlogaritmování Při použití logaritmu o základu 2: log 2 (Tr(t)) = α 0 +β 0 t Tr(t) = 2 α 0+β 0 t = 2 α0 (2 β 0 ) t = α β t tedy α = 2 α 0,β = 2 β 0 Při použití logaritmu o základu 10: log 10 (Tr(t)) = α 0 +β 0t Tr(t) = 10 α 0 +β 0 t = 10 α 0 (10 β 0 ) t = α β t tedy α = 10 α 0,β = 10 β 0 Při použití logaritmu o základu e: ln(tr(t)) = α0 +β0 t Tr(t) = e α 0 +β 0 t = e α 0 (e β 0 ) t = α β t tedy α = e α 0,β = e β0

Význam parametru β Tr(t) = α β t Tr(t +1) = α β t+1 Tr(t +1) Tr(t) = α βt+1 α β t = β Hodnota sledované veličiny se za jednotku času β-násobí. (podíl je konstantní v čase tempo růstu je stálé)

Za jak dlouho se počet tranzistorů zdvojnásobí? Hledáme takovou hodnotu, pro kterou platí Tr(t + ) Tr(t) = 2 Upravme Tr(t + ) Tr(t) Řešme (logaritmováním) = αβt+ αβ t = β = 2 log 2 β = 1 Odtud = 1/log 2 β

Exponenciální růst počtu tranzistorů v mikroprocesorech Tr(t) = 668,5 1,428 t, kde za t dosazujeme 1,...,44 pro roky 1971,...,2014. = 1,95 Naše analýza potvrzuje zdvojnásobení počtu tranzistorů za dobu přibližně 2 let.

Omezení modelu Dne 13. září 1995 Gordon Moore v rozhovoru uvedl, že toto (jeho) pravidlo nemůže fungovat v neomezeném měřítku: Tak to nemůže pokračovat napořád. Povaha exponenciál je taková, že je tlačíme mimo limity a následně nastane pohroma. Také poznamenal, že tranzistory eventuálně dosáhnou limitu miniaturizace (zmenšování) na atomární úrovni... http://cs.wikipedia.org/wiki/mooreův_zákon

Exponenciální růst šachová legenda Sissa ben Dahir 1+2+4+8+... 1+2 1 +2 2 +2 3 +...+2 63 = 2 64 1 =18000000000000000000

Exponenciální růst šachová legenda Sissa ben Dahir 1+2+4+8+... 1+2 1 +2 2 +2 3 +...+2 63 = 2 64 1 =18000000000000000000

Poznámka k odhadu parametrů Místo minimalizace výrazu (logy t logα tlogβ) 2 t se někdy doporučuje uvažovat metodu nejmenších vážených čtverců, tj. minimalizujeme w t (logy t logα tlogβ) 2 Typicky se voĺı w t = y 2 t. t

α > 0,β > 1... a>0, b>1 a > 0, 0 < b < 1 Tr(t) Tr(t) a < 0, 0 < b < 1 a < 0, b > 1 Tr(t) Tr(t)

Modifikovaný exponenciální trend Pocet obyvatel Japonska 1971 2000 pocet obyvatel 105000 115000 125000 1970 1975 1980 1985 1990 1995 2000 rok Tr(t) = γ +α β t, pro t = 1,...,n

Odhad parametrů Logaritmování nám nepomůže. Možná řešení: metoda postupných součtů metoda vybraných bodů metody nelineární regrese (doporučeno, R-ko: nls())...

Metoda postupných součtů Rozděĺıme řadu na tři stejně dlouhé úseky délky m (pokud počet pozorování není dělitelný třemi, jedno nebo dvě první vynecháme) m t=1 y t Podobně = m Tr(t) = (γ +αβ 1 )+(γ +αβ 2 )+...+(γ +αβ m ) = t=1 m m (γ +αβ t ) = mγ +α β t = mγ +α β(βm 1) β 1 t=1 2m t=m+1 3m t=2m+1 t=1 y t mγ +α βm+1 (β m 1) β 1 y t mγ +α β2m+1 (β m 1) β 1

Metoda postupných součtů ( β = 3y t 2 y ) 1/m t 2 y t 1 y t β 1 α = β( β m 1) 2( y t y t ) 2 1 [ ] γ = 1 y t α β( β m 1)/( β 1) m 1

Nelineární regrese - metoda nejmenších vážených čtverců R: nls() Nutno zadat počáteční odhady parametrů. K jejich získání využijeme interpretace parametrů: γ = lim t γ +αβ t = lim t Tr(t) nebot (0 < beta < 1) α = γ Tr(0) β : průměrný podíl Tr(t+1) γ Tr(t) γ

Residua Residua pri pouziti modif.exp.trendu resid 100 50 0 50 100 0 5 10 15 20 25 30 Index cyklická složka (proměnlivé délky i amplitudy)

Logistický trend Rust slunecnice vyska (cm) 50 100 150 200 250 7 14 21 28 35 42 49 56 63 70 77 84 Tr(t) = den α 1+e γ(t δ), pro t = 1,...,n

Logistický trend další možné parametrizace Tr(t) = Tr(t) = Tr(t) = Tr(t) = α 1+e γ(t δ) α 1+e δ +γ t α 1+δ e γ t α 1+δ γ t Při označení γ = γ δ = γδ γ = e γ δ = e δ

Logistický trend interpretace parametrů Logisticka krivka Derivace logisticke krivky Tr(t) 0 α 2 α derivace(tr(t)) 0 αγ 4 δ t δ t α... asymptota δ... čas nejrychlejšího růstu γ... konstanta určující měřítko x-ové osy

Logistický trend odvození Tr(t) t Tr(t) [α Tr(t)] Více viz Vencálek, O: Stochastické modelování epidemíı (DP) https://is.cuni.cz/webapps/zzp/detail/44266/

Zobecněný logistický trend Richardsova křivka Rychlost růstu: Tr(t) = α [1 (1 ω)e γ(t δ)] 1 1 ω ω < 2... na počátku rychlý vzestup, pozvolný pokles na konci ω = 2... stejně rychlý vzestup jako pokles (logistická křivka) ω > 2... na počátku pozvolný nárůst, rychlý pokles na konci Terminologická poznámka: ω 1... Gomperzova křivka, ω = 0... von Bertalanffyho křivka Růstové křivky, S-křivky, sigmoidální křivky

Metoda klouzavých průměrů Kurz EUR/CZK rok 2014 Kurz 27.4 27.6 27.8 28.0 02/01 03/03 02/05 01/07 01/09 03/11 31/12 Tr(t) = β 0 (t)+β 1 (t)τ+...+β r (t)τ r, pro τ = t m,...,t+m

Kurz EUR/CZK Data: https://www.cnb.cz/cs/financni_trhy/devizovy_trh/ kurzy_devizoveho_trhu/vybrane_form.jsp

Jednoduché (prosté) klouzavé průměry při délce okna 15 Okno delky 15 na pocatku rady 1 8 15 Kurz EUR/CZK rok 2014 Kurz 27.4 27.6 27.8 28.0 02/01 03/03 02/05 01/07 01/09 03/11 31/12 m = 7, tj. délka okna 2m+1 = 15, r = 0, tj. lokálně konstantní trend, pak ŷ t = 1 2m+1 m τ= m y t+τ pro t = m+1,...,n m.

Otázky k zodpovězení Jak volit délku okna, tj. jak volit m? (délka okna je 2m+1) Může být délka okna sudá? Jak volit řád polynomu, kterým řadu lokálně prokládáme, tj. jak volit r? Jak se vypořádat s počátečním a s koncovým úsekem řady a jak postupovat při predikci?

Kurz EUR/CZK rok 2014 Kurz 27.4 27.6 27.8 28.0 02/01 03/02 03/03 01/04 02/05 02/06 01/07 01/08 01/09 01/10 03/11 01/12 31/12 Klouzave prumery pri delce okna 5 (trend) Kurz 27.4 27.6 27.8 28.0 02/01 03/02 03/03 01/04 02/05 02/06 01/07 01/08 01/09 01/10 03/11 01/12 31/12 Residua residua 0.2 0.05 0.1 0.2 02/01 03/02 03/03 01/04 02/05 02/06 01/07 01/08 01/09 01/10 03/11 01/12 31/12

Kurz EUR/CZK rok 2014 Kurz 27.4 27.6 27.8 28.0 02/01 03/02 03/03 01/04 02/05 02/06 01/07 01/08 01/09 01/10 03/11 01/12 31/12 Klouzave prumery pri delce okna 15 (trend) Kurz 27.4 27.6 27.8 28.0 02/01 03/02 03/03 01/04 02/05 02/06 01/07 01/08 01/09 01/10 03/11 01/12 31/12 Residua residua 0.2 0.05 0.1 0.2 02/01 03/02 03/03 01/04 02/05 02/06 01/07 01/08 01/09 01/10 03/11 01/12 31/12

Kurz EUR/CZK rok 2014 Kurz 27.4 27.6 27.8 28.0 02/01 03/02 03/03 01/04 02/05 02/06 01/07 01/08 01/09 01/10 03/11 01/12 31/12 Klouzave prumery pri delce okna 25 (trend) Kurz 27.4 27.6 27.8 28.0 02/01 03/02 03/03 01/04 02/05 02/06 01/07 01/08 01/09 01/10 03/11 01/12 31/12 Residua residua 0.2 0.05 0.1 0.2 02/01 03/02 03/03 01/04 02/05 02/06 01/07 01/08 01/09 01/10 03/11 01/12 31/12

Kdy potřebujeme sudou délku okna? Umele vytvorena rada s periodou delky 4 y 1 5 9 13 17 21 t Obrázek: vyrovnání časové řady s konstantním trendem a s délkou periody 4 pomocí klouz. průměrů při délce okna 5. Sudá délka periody sudá délka okna Centrované klouzavé průměry

Centrované klouzavé průměry Střed prvního okna délky 2m je v čase (1+2m)/2 = m+0.5, tj. ŷ m+0.5 = (y 1 +y 2 +...+y 2m )/(2m), Střed druhého okna délky 2m je v čase (2+2m+1)/2 = m+1.5, tj. ŷ m+1.5 = (y 2 +...+y 2m +y 2m+1 )/(2m), ŷ m+1 = (ŷ m+0.5 +ŷ m+1.5 )/2 = 1 2m y 1 + 1 m y 2 + 1 m y 3 +...+ 1 m y 2m + 1 2m y 2m+1.

Vážené klouzavé průměry Dá se ukázat, že proložení polynomu vyššího stupně (r > 1) je ekvivalentní výpočtu váženého průměru pozorování v okně. Váhy, které přitom dáváme jednotlivým pozorováním, je třeba dopočítat. Příklad: m = 3,r = 2, tj. prokládáme parabolu (polynom 2. studně) v okně délky 2m+1 = 7. Pak ŷ t = 2 21 y t 3+ 3 21 y t 2+ 6 21 y t 1+ 7 21 y t+ 6 21 y t+1+ 3 21 y t+2+ 2 21 y t+3

Porovnání prostých a vážených průměrů při stejné délce okna 7 Kurz EUR/CZK rok 2014 Kurz 27.4 27.6 27.8 28.0 02/01 03/02 03/03 01/04 02/05 02/06 01/07 01/08 01/09 01/10 03/11 01/12 31/12 Proste klouzave prumery Kurz 27.4 27.6 27.8 28.0 02/01 03/02 03/03 01/04 02/05 02/06 01/07 01/08 01/09 01/10 03/11 01/12 31/12 Vazene klouzave prumery Kurz 27.4 27.6 27.8 28.0 02/01 03/02 03/03 01/04 02/05 02/06 01/07 01/08 01/09 01/10 03/11 01/12 31/12

Jak se vypořádat s počátečním a s koncovým úsekem řady a jak postupovat při predikci? Zajedeme s oknem na začátek či na konec řady a tam proložíme příslušný polynom. (jako bychom zapomněli na všechna další porozování kromě posledních (prvních) 2m + 1, na nichž prokládáme příslušný polynom, který pak můžeme použít k predikci. Pozor: čím vyšší stupeň polynomu, tím bĺıže jsou vyhlazené hodnoty skutečně pozorovaným hodnotám, ale pozor, predikce mohou být dosti nestabilní (viz varování týkající se predikce pomocí polynomu).

Volba řádu použitého polynomu r Cipra popisuje objektivní kritérium volby řádu klouzavých průměrů (str. 49-51), dodává však: V poslední době se začínají také hledat numericky jednoduché metody, které by určily řád klouzavých průměrů jako hodnotu minimalizující vhodně zkonstruované kritérium. Poučení: Zkusme různé hodnoty pro r (řád polynomu): r = 0,1,2,3 a dívejme se, jak dobré budeme mít predikce. To můžeme zhodnotit např. pomocí střední čtvercové chyby (MSE = Mean Squared Error) n t=1 (y t ŷ t ) 2 /n, střední absolutní odchylky (MAD = Mean Absolute Deviation) n t=1 y t ŷ t /n, či jiné ztrátové funkce odrážející cenu chyby v předpovědi. Vyberemu tu hodnotu r, pro kterou jsou predikce nejlepší (mají nejnižší hodnotu některé z výše uvedených ztrátových funkcí).

Exponenciální vyrovnávání Kurz EUR/CZK rok 2014 Kurz EUR/CZK 27.4 27.6 27.8 28.0 02/01 03/03 02/05 01/07 01/09 03/11 31/12 Tr(t) = β 0 (t) JEDNODUCHÉ EXP.VYROV. Tr(t) = β 0 (t)+β 1 (t)τ pro τ = 1, 2,... DVOJITÉ EXP.V.

Exponenciální vyrovnávání určení parametrů Mějme dán pevně čas t, v němž se snažíme odhadnout hodnotu (lokál.) trendu, vyrovnávací konstantu α (0,1). Parametry β 0 (t),β 1 (t) popisující lokální trend určíme z rovnic Jednoduché exp. vyrovnávání min β 0 (t) τ=0 Dvojité exp. vyrovnávání min β 0 (t),β 1 (t) τ=0 [y t τ β 0 (t)] 2 α τ [y t τ (β 0 (t)+β 1 (t)( τ))] 2 α τ

Exponenciální vyrovnávání váhy alfa = 0.95 vahy 0.0 0.2 0.4 0.6 0.8 1.0 2 4 6 8 10 cas alfa = 0.7 vahy 0.0 0.2 0.4 0.6 0.8 1.0 2 4 6 8 10 cas alfa = 0.4 vahy 0.0 0.2 0.4 0.6 0.8 1.0 2 4 6 8 10 cas

Jednoduché exponenciální vyrovnávání Jednoduche exponencialni vyrovnavani Kurz EUR/CZK 27.4 27.6 27.8 28.0 data vyrovnane hodnoty, alfa = 0,9 vyrovnane hodnoty, alfa = 0,7 02/01 03/03 02/05 01/07 01/09 03/11 31/12

Jednoduché exponenciální vyrovnávání puvodni data kurz 27.4 27.7 28.0 0 50 100 150 200 250 Index vyrovnane hodnoty jednoduche exp. vyrovnavani, alfa = 0,9 kurz 27.4 27.7 28.0 0 50 100 150 200 250 Index vyrovnane hodnoty jednoduche exp. vyrovnavani, alfa = 0,7 kurz 27.4 27.7 28.0 0 50 100 150 200 250 Index

Dvojité exponenciální vyrovnávání Dvojite exponencialni vyrovnavani Kurz EUR/CZK 27.4 27.6 27.8 28.0 data vyrovnane hodnoty, alfa = 0,9 vyrovnane hodnoty, alfa = 0,7 02/01 03/03 02/05 01/07 01/09 03/11 31/12

Dvojité exponenciální vyrovnávání puvodni data kurz 27.4 27.7 28.0 0 50 100 150 200 250 Index vyrovnane hodnoty dvojite exp. vyrovnavani, alfa = 0,9 kurz 27.4 27.7 28.0 0 50 100 150 200 250 Index vyrovnane hodnoty dvojite exp. vyrovnavani, alfa = 0,7 kurz 27.4 27.7 28.0 0 50 100 150 200 250 Index

Jednoduché exponenciální vyrovnávání rekurentní vztah pro odhad hodnot β 0 (t) β 0 (t) τ=0 min β 0(t) τ=0 [y t τ β 0 (t)] 2 α τ [y t τ β 0 (t)] 2 α τ = 2 [y t τ β 0 (t)]α τ = 0 τ=0 τ=0 y t τ α τ = β 0 (t) α τ 1 = β 0 (t) 1 α β 0 (t) = (1 α) Poznámka: β 0 (t) = ŷ t (vyrovnaná hodnota) Poznámka: Problém určení ŷ 0 τ=0 y t τ α τ τ=0 = (1 α)y t +(1 α) y t τ α τ τ=1 = (1 α)y t +αβ 0 (t 1)

Dvojité exponenciální vyrovnávání volba α Volba alfa dvojite e.v. podle RSS residualni soucet ctvercu 0.0 0.1 0.2 0.3 0.4 0.5 0.2 0.4 0.6 0.8 alfa

Dvojité exponenciální vyrovnávání volba α Volba alfa dvojite e.v. celkova predikcni ctvercova chyba 0.3 0.4 0.5 0.6 0.7 0.8 0.2 0.4 0.6 0.8 alfa

Jednoduché exponenciální vyrovnávání volba α Volba alfa jednoduche e.v. celkova predikcni ctvercova chyba 0.3 0.4 0.5 0.6 0.7 0.8 0.2 0.4 0.6 0.8 alfa

Srovnání s cvičenou opicí Co dělá cvičená opice: predikuje zítřejší hodnotu hodnotou z dneška. Celková čtvercová chyba predikce: exp. třídění s optimalizovanou volbou α: 0,301 cvičená opice: 0,300 Závěr: cvičená opice v tomto případě vítězí nad exponenciálním vyrovnáváním. Poučení: ne vždy platí, že čím sofistikovanější metoda, tím lepší výsledek. Poznámka: kdo umí v predikci kurzu výrazně porazit cvičenou opici, zbohatne.

Teorie efektivních trhů 1965 Eugene Fama (NC 2013) Tzv. slabá forma teorie efektivních trhů říká, že na základě technické analýzy minulých statistických tvarů nelze ceny akcíı na burze předvídat. Grafařské techniky musejí tedy nevyhnutelně selhat.