Model finančních nákladů pevných linek

Rozměr: px
Začít zobrazení ze stránky:

Download "Model finančních nákladů pevných linek"

Transkript

1 Mendelova univerzita v Brně Provozně ekonomická fakulta Model finančních nákladů pevných linek Bakalářská práce Vedoucí práce: Ing. Luboš Střelec, Ph.D. Mgr. Jan Kopecký Brno 2013

2

3 Upřímně zde chci poděkovat vedoucímu své bakalářské práce panu Ing. Luboši Střelcovi, Ph.D. za cenné rady a připomínky, které mi velmi ochotně a pohotově poskytoval při tvorbě této práce. A dále bych chtěl poděkovat celé své rodině, zejména své manželce, za podporu během celého studia.

4 Prohlašuji, že jsem svou bakalářskou práci vypracoval samostatně a výhradě s použitím citovaných pramenů. V Boskovicích dne 1. května 2013

5 Abstract Kopecký, J., Model of landline financial costs. Bachelor thesis. Brno: MZLU in Brno, This bachelor thesis deals with comparison of statistical methods for analyzing time series of the costs of landlines being installed at a district court. The first part describes basic approaches to the analysis and modeling of time series. The second part compares various decomposition models and models of Box- Jenkins methodology. The most appropriate model is based on information criteria, pseudoprediction and Theil inequality coefficient. The next step is a verification of white noise residuals and the final goal is to use this model for predicting the landline costs in the following year. Keywords Time series, decomposition model, Box-Jenkins method, prediction of future values. Abstrakt Kopecký, J., Model finančních nákladů pevných linek. Bakalářská práce. Brno: MZLU v Brně, Bakalářská práce se zabývá problematikou porovnání statistických metod analýzy časové řady nákladů na pevné linky na okresním soudě. První část popisuje základní přístupy k analýze a modelování časových řad. Druhá část se zabývá porovnáním různých dekompozičních modelů a modelů Box-Jenkinsovy metodologie. Na základě informačních kritérií, pseudopredikce a Theilova koeficientu je vybrán nejvhodnější model, následně je u něj ověřeno, zda náhodná složka vykazuje vlastnosti bílého šumu. V případě, že ano, tak uvedený model poslouží pro predikci na následující rok. Klíčová slova Časová řada, dekompoziční metoda, Box-Jenkinsovská metoda, predikce budoucích hodnot.

6 Obsah 6 Obsah 1 Úvod a cíl práce Úvod Cíl práce Literární přehled Časová řada Cíle analýzy časových řad Typy časových řad Problémy analýzy časových řad Charakteristiky časových řad Metody analýzy časových řad Předpovědi Dekompozice časových řad Složky časové řady Typ dekompozice Metody dekompozice Naivní modely Vyrovnání trendu matematickou křivkou Vyrovnání trendu metodou klouzavých průměrů Exponenciální vyrovnávání Analýza sezónní složky Jednoduché metody odhadu sezónnosti Regresní přístup Wintersova metoda Box-Jenkinsovská analýza Stacionarita Autokorelační a parciální autokorelační funkce Základní procesy Integrované procesy... 31

7 Obsah 7 3 Materiál a metodika 32 4 Vlastní práce Charakteristiky časové řady Dekompoziční model Sezónní složka Box-Jenkinsova metoda Pseudopredikce Test náhodné složky Predikce hodnot časové řady Diskuze a závěr 59 6 Literatura 61 A Očištěná a neočištěná data 63 B t-testy modelů se sezónní složkou 65

8 Seznam obrázků 8 Seznam obrázků Obr. 1 Jednotlivé složky časové řady 21 Obr. 2 Naivní model typu konstantní hodnoty 23 Obr. 3 Naivní model typu konstantní dynamika 23 Obr. 4 Naivní model typu konstantní tempo 24 Obr. 5 Princip klouzavých průměrů 25 Obr. 6 Princip exponenciálního vyrovnávání 27 Obr. 7 Očištěná a neočištěná časová řada 33 Obr. 8 QLR test 34 Obr diference v 1. období a 2. období 35 Obr. 10 Lineární forma bez použití dummy proměnné 36 Obr. 11 Lineární forma bez sezónní složky 37 Obr. 12 Kvadratická forma bez sezónní složky 38 Obr. 13 Lineárně-logaritmická forma bez sezónní složky 39 Obr. 14 Lineární forma se sezónní složkou 41 Obr. 15 Kvadratická forma se sezónní složkou 41 Obr. 16 Lineárně-logaritmická forma se sezónní složkou 42 Obr. 17 Model ARIMA (2,1,2) 43 Obr. 18 Model SARIMA (2,1,2) (1,1,2) 45 Obr. 19 Pseudopredikce pro dekompoziční metody 47 Obr. 20 Pseudopredikce pro Box-Jenkinsovské metody 47 Obr. 21 Pseudopredikce pro lineární formu se sezónní složkou 49 Obr. 22 Graf reziduí v závislosti na čase 52

9 Seznam obrázků 9 Obr. 23 ACF a PACF graf 53 Obr. 24 ACF a PACF graf upraveného modelu 55 Obr. 25 Histogram reziduí 56 Obr. 26 Predikce na rok

10 Seznam tabulek 10 Seznam tabulek Tab. 1 Popisné statistiky 1.a 2. období 35 Tab. 2 t-testy parametrů lineárního modelu bez sezónní složky 37 Tab. 3 t-test kvadratického modelu bez sezónní složky 38 Tab. 4 t-testy lineárně-logaritmického modelu bez sezónní složky 39 Tab. 5 Statistická kritéria pro trendové křivky bez sezónní složky 40 Tab. 6 Další kritéria pro trendové křivky bez sezónní složky 40 Tab. 7 Statistická kritéria pro trendové křivky se sezónní složkou 42 Tab. 8 Další kritéria pro trendové křivky bez sezónní složky 42 Tab. 9 t- testy modelu ARIMA (2,1,2) 43 Tab. 10 Statistická kritéria pro model ARIMA (2,1,2) 44 Tab. 11 Další kritéria pro model ARIMA (2,1,2) 44 Tab. 12 t-testy modelu SARIMA (2,1,2)(1,1,2) 45 Tab. 13 Statistická kritéria pro model SARIMA (2,1,2)(1,1,2) 46 Tab. 14 Statistická kritéria pro model ARIMA (2,1,2) 46 Tab. 15 Označení modelů použitých pro pseudopredikci 46 Tab. 16 Přehled skutečných predikovaných hodnot jednotlivých modelů 48 Tab. 17 Porovnání výsledků pseudopredikce pomocí Theilova koeficientu 48 Tab. 18 Přehled skutečných a predikovaných hodnot nejlepších modelů 50 Tab. 19 Porovnání výsledků pseudopredikce pomocí Theilova koeficientu 50 Tab. 20 t-testy lineárního modelu se sezónní složkou včetně roku Tab. 21 t-testy vítězného modelu 54 Tab. 22 Predikované hodnoty a 95 procentní interval 57

11 Seznam tabulek 11 Tab. 23 Očištěná a neočištěná data 63 Tab. 24 t-testy parametrů lineárního modelu se sezónní složkou 65 Tab. 25 t-testy parametrů kvadratického modelu se sezónní složkou 65 Tab. 26 t-testy parametrů lineárně-logaritmického modelu se sezónní složkou 66

12 Úvod a cíl práce 12 1 Úvod a cíl práce 1.1 Úvod Během posledních čtyř desetiletí prodělala ekonometrie velký rozvoj. A to protože velká část kvantitativních informací o ekonomii je udávána ve formě časových řad. Jsou to důležité statistické údaje, pomocí nichž můžeme zkoumat dynamiku jevů v čase. Uplatnění analýzy časových řad je možné ve všech oborech lidské činnosti jako např. ve fyzice, v technice, v medicíně, ve společenských vědách. V ekonomii patří teorie časových řad k nejdůležitějším kvantitativním metodám při analýze ekonomických dat. Časové řady mají základní význam pro analýzu příčin, které na tyto jevy působily a ovlivňovaly jejich chování v minulosti, tak pro predikci jejich budoucího vývoje. Cílem analýzy časové řady je většinou konstrukce odpovídajícího modelu. To umožní především porozumět mechanismu, na jehož základě jsou generovány sledované údaje. Můžeme si představit, že znalost modelu odpovídá znalosti algoritmu, podle něhož data generuje počítač, přičemž do tohoto algoritmu jsou zapojeny také generátory náhodných čísel dodávající celému procesu generování náhodný charakter. Přestože jsme sice schopni typ těchto generátorů a jejich zapojení do systému přesně specifikovat, nejsme v žádném případě schopni stanovit konkrétní numerické hodnoty produkované těmito generátory v jednotlivých časových okamžicích. Znalost modelu dále umožňuje předpovídat budoucí vývoj systému. Konstrukce modelu také umožní do jisté míry řídit a optimalizovat činnost příslušného systému vhodnou volbou vstupních parametrů a počátečních podmínek. 1.2 Cíl práce Cílem bakalářské práce je nalezení vhodného modelu časové řady náklady pevných linek za roky na konkrétním okresním soudě. Při hledání vhodného modelu bude použito více přístupů a to konkrétně dekompoziční metody a Box-Jenkinsovské metody. Tyto metody budou porovnány a na základě různých kritérií bude jeden z těchto modelů vybrán pro predikci této časové řady. Dílčím cílem je právě také předpověď vývoje těchto nákladů pomocí vybraného modelu na rok 2013.

13 Literární přehled 13 2 Literární přehled Plánování je jednou z klíčových funkcí každého manažera. A jedním z nejdůležitějších předpokladů pro správné rozhodování je mít co nejlepší informace. Pokud bude vedoucí pracovník mít lepší přehled o tom, kolik finančních zdrojů bude potřebovat, umožní mu to lépe a efektivněji naplánovat rozložení finančních zdrojů. Nejrozumnější cestou se jeví sledování stávajících nákladů a na základě těchto hodnot pak predikce do budoucnosti. Samozřejmě předpokládáme podmínku ceteris paribus. V současné době se na Okresním soudě v Blansku náklady na provoz pevných linek žádnou statistickou metodou nesledují a předpověď do budoucnosti se děje pouze na kvalifikovaném odhadu vedoucího pracovníka. Na základě osobního průzkumu ve státní správě v jihomoravském kraji bylo zjištěno, že v naprosté většině případů je situace všude velmi podobná. Uvedené metody a postup je tedy možné použít nejen na Okresním soudě v Blansku, ale teoreticky v celé státní správě napříč celou republikou. V této kapitole je uveden přehled jednotlivých metod, které lze potenciálně použít k predikci časové řady. U jednotlivých metod jsou popsány jejich výhody a nevýhody, kde je lze použít, kdy ne apod. 2.1 Časová řada Hindls (2007) definuje časovou řadu jako posloupnost věcně a prostorově srovnatelných pozorování (dat), která jsou jednoznačně uspořádána z hlediska času ve směru minulost přítomnost. Z formálního hlediska je časová řada realizací náhodného procesu. Náhodný proces: kde je čas pro Realizace náhodného procesu: kde je čas pro 2.2 Cíle analýzy časových řad Podle Hindlse (2007) se analýzou časových řad rozumí soubor metod, které slouží k popisu těchto řad (a případně k předvídání jejich budoucího chování). Primárním cílem je pochopit principy, na základě kterých vznikají hodnoty časové řady. To znamená, že základním cílem je zkonstruovat vhodný model, který by charakterizoval mechanismus generování hodnot časové řady. Neméně podstatným cílem je pak využít tento model k předpovědi budoucích hodnot časové řady, popř. k výpočtu (s jistou přesností) hodnost mezi časovými okamžiky nebo využití modelu k optimalizaci (např. výrobního procesu). Za vhodný model považujeme ten, jehož reziduální složka má vlastnosti bílého šumu. Pod pojmem bílý šum rozumíme nekorelované (vzájemně nezávislé) náhodné veličiny, které mají nulovou střední hodnotu a konstantní rozptyl.

14 Literární přehled Typy časových řad Časové řady dělí Kvasnička (2001) podle několika hledisek. podle hlediska náhodnosti: deterministické neobsahují žádný prvek náhody a lze je tedy dokonale předpovídat (např. funkce sinus) stochastické obsahují prvek náhody, jsou to vesměs všechny ekonomické řady podle ekvidistantnosti: ekvidistantní časová vzdálenost mezi jednotlivými prvky je konstantní (např. výška HDP v jednotlivých rocích) neekvidistantní časová vzdálenost mezi prvky je různá (např. termíny vydávání státních dluhopisů) dle charakteru ukazatele: okamžikové časové řady údaje časové řady se vztahují jen k určitému okamžiku a součty tedy nedávají smysl (např. řada teplot) intervalové časové řady údaje se vztahují k určitému časovému úseku (např. HDP v daném roce) dle periodicity: krátkodobé časové řady s délkou kroku do 1 roku dlouhodobé časové řady s délkou kroku nad 1 rok dle druhu ukazatelů: řady absolutních ukazatelů řady, které vznikly původním měřením nebo pozorováním řady odvozených ukazatelů řady, které jsou nějakým způsobem transformované (např. klouzavé průměry) dle způsobu vyjádření: peněžní (např. průměrná mzda v Kč) naturální (např. produkce vyjádřená v tunách) 2.4 Problémy analýzy časových řad Cipra (1986) uvádí, že specifický charakter časových dat uspořádaných do časové řady může s sebou přinést několik druhů problémů: Problémy s volbou časových bodů pozorování Řady tvořené pozorováními v určitých nespojitých časových bodech mohou vznikat trojím způsobem: buď jsou diskrétní přímo svou povahou (např. úroda

15 Literární přehled 15 za jednotlivé roky za časovou jednotku) nebo vznikají diskretizací spojité časové řady (např. teplota v daném místě v danou dobu)nebo akumulací hodnot za dané časové období (např. denní množství srážek). Místo akumulace hodnot se často provádí jejich průměrování. Problémy s kalendářem Problémy vznikají díky nepravidelnostem v kalendáři, jako jsou např. různá délka kalendářních měsíců, čtyři nebo pět víkendů v měsíci, různý počet pracovních dní v měsíci a pohyblivé svátky. Tyto nepravidelnosti mohou časovou řadu někdy i značně ovlivnit a je proto potřeba časovou řadu od těchto nepravidelností očistit. Problémy s nesrovnalostí jednotlivých měření Nesrovnalost některých měření může například souviset s technickým rozvojem, se kterým se zvyšuje také technická vybavenost. Není proto vhodné srovnávat výrobu určitého výrobku nyní a před dvaceti lety. Problémy s délkou časových řad Délkou časové řady se rozumí počet měření, které danou časovou řadu tvoří. S rostoucí délkou časové řady se zvyšuje množství informací pro její analýzu. Neplatí ale, že při dvojnásobném počtu měření máme dvakrát více informací. Délka řady není jednoznačnou mírou informace obsažené v řadě k tomu je nutné navíc uvažovat i vnitřní strukturu řady. S touto problematikou souvisí i protichůdné tendence. Některé metody vyžadují určitou minimální délku časové řady např. Box-Jenkinsovská metoda se doporučuje používat na časové řady o minimální délce 50. Na druhé straně u velmi dlouhých řad může vzniknout riziko, že s průběhem času se podstatně změnily charakteristiky modelu, který tuto řadu generuje. Konstrukce modelu se pak s délkou časové řady bývá problematičtější. Problémy s odvozenými ukazateli Během práce s odvozenými ukazateli je typické, že často pracujeme ne přímo s hodnotami původní časové řady, ale s nějakou její transformací. Výsledkem těchto transformací je vždy nová časová řada, která se od původní řady liší svou nejen svou délkou, ale i charakterem. Mezi nejčastěji využívané transformace patří výpočet přírůstku, dynamiky a tempa. 2.5 Charakteristiky časových řad Prvním úkolem při analýze časové řady je obvykle obdržet rychlou a orientační představu o charakteru procesu, který tato řada reprezentuje. Mezi základní metody patří vizuální analýza grafů spolu s určením elementárních statistických charakteristik. K elementárním charakteristikám řadíme měření absolutních a relativních změn.

16 Literární přehled 16 Mezi charakteristiky absolutní změny patří diference různého řádu. Z časové řady délky lze zjistit absolutních změn (prvních diferencí): Kladná hodnota se označuje jako absolutní přírůstek a záporná jako absolutní úbytek. Druhou diferenci lze vypočítat: Z absolutních změn lze vypočítat průměrnou hodnotu (tato charakteristika je však vhodná pouze pro monotónní řady): pro pro Mezi charakteristiky relativní změny patří koeficient růstu, tempo růstu, koeficient přírůstku, tempo přírůstku. Z časové řady o velikosti lze vypočítat: koeficientů růstu: průměrný koeficient růstu: koeficientů přírůstku: pro průměrný koeficient přírůstku: Dalším možností je vyjádření koeficientu růstu a koeficientu přírůstku v procentech tj. a. Stejně tak lze vyjádřit tempo růstu a tempo přírůstku tj. a.

17 Literární přehled Metody analýzy časových řad V literatuře lze nalézt široké spektrum metod analýzy časových řad, které mají často odlišné použití. Mezi hlavní metody, které uvádí Kvasnička (2001) patří: Expertní metody Grafická analýza Dekompozice časových řad Box-Jenkinsovská analýza Lineární dynamické a regresní modely Spektrální analýza V bakalářské práci se zaměřím především na dekompozici časových řad a Box- Jenkinsovskou analýzu. Ostatní pokročilé metody překračují rámec bakalářské práce. Expertní metody Expertní metody je vhodné použít tehdy, když není možné kvantifikovat sledované veličiny a vlivy, které působí na jejich vývoj. Ukazuje se, že pro dlouhodobé předpovědi mají expertní metody velmi dobré výsledky. Problémem ale je, že jsou časově a finančně velmi náročné. Mezi hlavní metody patří Delphi metoda, metoda historické analogie, dotazování zákazníků, apod. Grafická analýza Grafická analýza je nejjednodušším a nejrychlejším způsobem, jak analyzovat časovou řadu. Umožňuje si lehce udělat obrázek o vývoji časové řady. Přes určitou primitivnost jde stále o prvotní krok, který nám pomáhá s výběrem správné metody analýzy. Dekompozice časových řad Dekompozice časových řad vychází z předpokladu, že náhodný proces, který generuje časovou řadu, je závislý pouze na čase. Dále se předpokládá, že časovou řadu je možné rozdělit na několik nezávislých složek. Tento rozklad se provádí proto, že je snazší identifikovat postupně chování jednotlivých složek než chování celé řady naráz. Časovou řadu tedy tvoří trend, sezónní, cyklická a náhodná složka. Trend, sezónní a cyklická složka jsou souhrnně nazývány systematickou složkou. Dekompozice časových řad klade důraz právě na analýzu této systematické složky. Náhodná složka je poněkud opomíjena. Jednotlivá pozorování se považují za nezávislá. Box-Jenkinsovská analýza Na rozdíl od metod dekompozice staví Box-Jenkinsovská analýza právě na analýze náhodné složky, která může být tvořena korelovanými (tj. závislými) veliči-

18 Literární přehled 18 nami. Právě v této korelační analýze spočívá jádro Box-Jenkinsovských metod. Jde tedy o to, vyšetřit vzájemnou závislost jednotlivých prvků řady s různým zpožděním a závislost na různě zpožděném (náhodném) vstupu. Tyto metody jsou mnohem flexibilnější než dekompoziční metody (mnohem rychleji se adaptují na změněný charakter časové řady). Základní modely se konstruují přímo z dat; na rozdíl od dekompozičních metod je tedy těžké vymyslet si strukturu modelu podle podkladové teorie. Existují ovšem i pokročilejší modely, které spojují přínos Box-Jenkinsovské metodologie a lineárních dynamických modelů. Tyto modely je pak částečně možné konstruovat podle podkladové teorie. Lineární dynamické a regresní modely Jedná se o kauzální modely, kde je vysvětlovaná proměnná vysvětlována pomocí jedné nebo více vysvětlujících proměnných. Snahou je tedy odhalit příčinné vazby mezi ekonomickými veličinami. Většinou se předpokládají lineární nebo linearizované závislosti mezi proměnnými. Modely se konstruují na základě teoretických předpokladů. Spektrální analýza Spektrální analýza je také nazývána analýza ve spektrální doméně (na rozdíl od předchozích dvou metod, které jsou analýzou v časové doméně). Spektrální analýza vychází z předpokladu, že časová řada je nekonečnou směsí sinusových a kosinusových křivek s různými frekvencemi a amplitudami. Analýza usiluje o to, aby vyšetřila spektrum řady (tj. zjistila intenzitu zastoupení jednotlivých frekvencí a jejich parametrů v časové řadě). Pomocí spektrální analýzy se také často posuzuje zpoždění ve vývoji mezi dvěma veličinami. 2.7 Předpovědi Konstrukcí předpovědi časové řady se zabývá Cipra (1986). Uvádí, že je jedním z nejdůležitějších úkolů analýzy časové řady. Předpovídat lze pouze s určitou chybou. Chyba skutečné předpovědi skutečné hodnoty je definována jako Její hodnota se samozřejmě zjistí až tehdy, když poznáme skutečnou hodnotu. Prvořadým zdrojem chyby předpovědi je výskyt reziduální složky v časové řadě, protože tato složka představuje nepředpověditelnou fluktuaci v datech. Jeli podíl této složky v řadě značný, pak možnost dodat přesnou předpověď je omezena. Na velikost chyby předpovědi má však také vliv, jak úspěšně zvládneme předpověď ostatních systematických složek řady. Proto velké chyby

19 Literární přehled 19 v předpovědi mohou indikovat buď značný podíl reziduální složky v řadě nebo také nevhodnost použité předpovědní techniky. Míry, které se nejčastěji používají pro oceňování kvality zkonstruovaných předpovědí, posuzují souhrnně vývoj předpovědi v čase. Nejčastěji se používá součet čtvercových chyb SSE (Sum of Squared Errors) tvaru střední chyba odhadu ME (Mean Error) střední čtvercová chyba MSE (Mean Squared Error) směrodatná odchylka RMSE (Rooted Mean Squared Error) střední absolutní odchylka MAE (Mean Absolute Error) střední procentuální chyba odhadu MPE (Mean Percentage Error) střední procentuální chyba odhadu MAPE (Mean Absolute Percentage Error)

20 Literární přehled 20 Další hodně využívanou možností, jak porovnat úspěšnost prognózy, se zabývá Kirchgässner (2008). Jedná se o Theilův koeficient nesouladu. Je-li Theilův koeficient roven 0, pak je predikce shodná se skutečností. Je-li koeficient roven 1, pak odpovídá naivní prognóze. Naivní prognóza definuje hodnotu daného indikátoru za období rovnu hodnotě tohoto indikátoru za období. 2.8 Dekompozice časových řad Jak bylo již dříve zmíněno, cílem dekompozice časových řad je rozdělit časovou složku na základnější složky : trend, cyklickou a sezónní a náhodnou složku. Touto problematikou se také zabývá Kvasnička (2001). Při dekompozici se implicitně předpokládá model časové řady, který nezávisí na žádných vysvětlujících proměnných, pouze na čase Složky časové řady Trend ( ) odpovídá hlavním tendencím dlouhodobého vývoje statistického ukazatele, který časová řada popisuje. Sezónní složka ( ) odpovídá periodicky se opakujícím odchylkám od trendu, ke kterým dochází pravidelně v rámci každého roku. Cyklická složka ( ) je nejspornější složkou časové řady. Odpovídá dlouhodobým, často nepravidelným cyklům s proměnlivou délkou i amplitudou. Typickým příkladem je střídání fází recese a konjunktury (obchodní cyklus) v tržních ekonomikách. Protože se dekompoziční metoda používá především na krátkodobé a střednědobé předpovědi, bývá cyklická složka někdy zanedbávána, tj. zahrnuta do trendu. Náhodná složka ( ) je také nazývána reziduální, zbytková, nesystematická. Jde o náhodné pohyby bez systematického charakteru. Zahrnuje také chyby měření a chyby ze zaokrouhlování při výpočtech. Při dekompozici časových řad se předpokládá, že se jedná o bílý šum, často dokonce nekorelovaný normálně rozdělený bílý šum.

21 Literární přehled 21 Obr. 1 Jednotlivé složky časové řady Zdroj: Kvasnička Typ dekompozice Artl (2005) dělí dekompozici časové řady na modely aditivní a multiplikativní. Kvasnička (2001) přidává ještě jejich kombinaci model smíšený. Tyto modely specifikují, jakým způsobem jsou jednotlivé časové složky skloubeny dohromady. Aditivní model předpokládá, že výsledná časová řada je součtem jednotlivých složek Multiplikativní model na druhou stranu předpokládá, že výsledná časová řada je spíše součinem jednotlivých složek Smíšený model je kombinací obou předchozích přístupů. Některé složky mohou být v součtu, jiné v součinu. Typickým příkladem může být například model

22 Literární přehled Metody dekompozice Při dekompozici se snažíme nejdříve identifikovat trend a potom teprve sezónní složku (v této práci se nebudeme zabývat složkou cyklickou, zahrneme ji do trendu). Někdy se však postupuje opačně, řada se nejdříve zbaví sezónních vlivů a pak se hledá trend. K identifikaci trendu se používají především čtyři následující modely: naivní modely proložení matematickou křivkou vyrovnání metodou klouzavých průměrů exponenciální vyrovnávání Naivní modely Naivní modely patří mezi nejjednodušší kvantitativní modely časové řady. Modely typu konstantní hodnoty Naivní modely typ I stojí na hypotéze, že budoucí hodnota je průměru stejná jako hodnota současná. Tedy kde je současná hodnota sledovaného ukazatele, je minulá hodnota tohoto ukazatele a je náhodná hodnota. Tento model je znázorněn na Obr. 2.

23 Literární přehled 23 Obr. 2 Naivní model typu konstantní hodnoty Zdroj: Kvasnička (2001) Modely typu konstantní dynamika Naivní modely typ II předpokládají, že veličina má stejnou hodnotu jako zvětšenou o změnu v předcházejícím období, tedy Tento model předpokládá konstantní dynamiku, tj. směrnice růstu je v čase konstantní. Tento model je znázorněn na Obr. 3. Obr. 3 Naivní model typu konstantní dynamika Zdroj: Kvasnička (2001)

24 Literární přehled 24 Modely typu konstantní tempo Naivní modely typu III předpokládají, že hodnota časové řady v čase se rovná minulé hodnotě násobené koeficientem růstu řady v minulém pozorování, tedy Tento model předpokládá konstantní tempo růstu v čase. Tento model je znázorněn na Obr. 4. Obr. 4 Naivní model typu konstantní tempo Zdroj: Kvasnička (2001) Vyrovnání trendu matematickou křivkou Vyrovnání trendu matematickou křivkou je základní neadaptivní metoda. Vychází z předpokladu, že trend se po celou dobu nemění a že je možné ho popsat některým typem matematické křivky. Celá úloha identifikace trendu se redukuje na výběr správného typu matematické křivky a odhadu jejích parametrů. Vychází se přitom z jednoduchého modelu časové řady kde je hodnota trendu a, který závisí jen na čase, a hodnota reziduální složky. Předpověď budoucích hodnot trendu je dána prostou extrapolací - dosažením příslušné hodnoty do vzorce matematické křivky, popisující trend. Mezi základní typy křivek, které se při odhadu trendu používají, patří: polynomy (proložení konstantou, přímkou, kvadratickou funkcí, ) exponenciální funkce

25 Literární přehled 25 logistická křivka Gompertzova křivka Při volbě vhodné matematické křivky pro vyrovnání trendu je také rozhodující podkladová ekonomická teorie. Příkladem může být např. marketingový předpoklad, že prodané množství určitého výrobku se v čase pohybuje zhruba po Gaussově křivce. U dekompozičních metod, zvláště při hledání trendu, je však taková teorie k dispozici jen zřídka. Druhým kritériem pro volbu vhodného trendu je vizuální vzhled dat zakreslených do grafu. Pokud se charakter časové řady v průběhu doby mění, takže nelze najít vhodnou matematickou křivku, kterou by bylo možné trend vyrovnat, nabízí se dvě možnosti: buď časovou řadu rozdělit na několik částí a každou z těchto částí vyrovnat zvlášť nebo použít některou z adaptivních metod Vyrovnání trendu metodou klouzavých průměrů Jinou metodou, jak vyřešit případy, kdy se trend v časové řadě mění, je vyrovnávání trendu metodou klouzavých průměrů. Jde o adaptivní metodu, tedy o metodu, která se plynule přizpůsobuje na změněný charakter trendu. Klouzavé průměrování je založeno na jednoduchém postupu. V časové řadě o n prvcích nejdříve zprůměrujeme vhodně vybraným typem průměru prvních 2m + 1 hodnot a takto získané hodnotě přiřadíme vhodný index (většinou se hodnota centruje do prostřed intervalu průměrovaných hodnot - proto se zpravidla volí délka liché tak, aby index padl na celé číslo); potom průměrujeme stejně dalších hodnot, posunutých o jeden člen. Vyrovnání prvních a posledních m hodnot, stejně jako případné předpovědi trendu se provádějí zvláštními metodami. Obr. 5 Princip klouzavých průměrů Zdroj: Kvasnička (2001) Co se týká vlastních průměrů, používá se většinou vážený aritmetický průměr, který se liší podle použitých vah.

26 Literární přehled 26 Jednoduché klouzavé průměry Nejjednodušší typ průměru je prostý (nevážený) aritmetický průměr. V případě, že je centrován, platí při délce vztah Polynomiální klouzavé průměry Metoda polynomiálních klouzavých průměrů vychází z předpokladu, že většinu funkcí lze aproximovat polynomem vhodného řádu. Nesnažíme se ale proložit celou řadu naráz, ale postupně klouzavě vždy členů. Délku klouzavého průměru je vhodné volit tak, aby byla stejně dlouhá jako celý násobek periody sezónní složky, pokud je sezónnost v časové řadě obsažena. V opačném případě dojde k zahrnutí části sezónnosti do trendu. Při volbě stupně polynomu (řádu klouzavého průměru) se snažíme z důvodu výpočetní složitosti použít co nejnižší možný řád. Volba řádu není také nezávislá na délce klouzavého průměru délka musí být dostatečně větší než stupeň polynomu, jinak numerický odhad parametrů bude nespolehlivý. Jako objektivnější kritérium pro volbu řádu klouzavého průměru se používá veličina kde je -tá diference řady. Postupně počítáme veličiny tak dlouho dokud nezačnou konvergovat k nějaké konstantě. Pokud jsou hodnoty už zhruba stejné a přibližně odpovídají hodnotě, ke které řada konverguje, použijeme při vyrovnávání polynom -tého stupně. Jistý problém může nastat, pokud veličina nebude konvergovat nebo bude oscilovat. V tom případě se musí o řádu polynomu rozhodnout subjektivně. Je zřejmé, že klouzavé průměry nemohou poskytnout žádnou analytickou informaci o trendu. Klouzavé průměrování se nejčastěji používá k sezónnímu očištění řady je tedy ji možné využít přímo k ekonomické analýze Exponenciální vyrovnávání Exponenciální vyrovnávání je další metodou adaptivního vyrovnávání trendu. Na rozdíl od klouzavých průměrů, které vyrovnávají vždy jen část pozorování, exponenciální vyrovnání se snaží stanovenou křivkou vyrovnat vždy všechna minulá pozorování. Přitom se předpokládá, že význam pozorování do minulosti exponenciálně klesá. Toho je dosaženo tak, že se starším pozorováním přiřadí exponenciálně klesající váhy Potom se tedy minimalizuje vztah

27 Literární přehled 27 Koeficient se nazývá koeficient zapomínání nebo alternativně vyrovnávací konstanta. K vlastnímu vyrovnávání se většinou používají polynomy nultého, prvního nebo druhého řádu. Odtud jsou odvozeny názvy jednotlivých metod jednoduché, dvojité nebo trojité exponenciální vyrovnávání. Obr. 6 Princip exponenciálního vyrovnávání Zdroj: Kvasnička (2001) 2.9 Analýza sezónní složky Cíle analýzy sezónní složky mohou být alternativně dva: Získat dodatečné informace o vývoji časové řady. Odhad sezónní složky prohlubuje znalost o chování sledovaného ekonomického ukazatele. V mnoha případech je tato znalost stejně důležitá jako znalost trendu. Sezónně očistit časovou řadu. Pro mnoho ekonomických aplikací a analýz je výhodnější nejprve časovou řadu očistit o sezónní vlivy a pak dál pracovat s takto upravenou řadou. Typickým příkladem je sezónní očišťování inflace nebo vývoje HDP. Bylo vyvinuto velké množství metod a filtrů k odhadu sezónní složky. Mezi nejjednodušší přístupy patří: jednoduché průměrování, regresní přístup a adaptivní Wintersova metoda Jednoduché metody odhadu sezónnosti Nejjednodušší přístup k odhadu sezónní složky vychází z předpokladu, že časová řada je tvořena trendem. Předpokládejme, že trend jsme odhadli některou již

28 Literární přehled 28 popsanou metodou. Potom odečtením trendu od časové řady získáme odhad sezónní a náhodné složky pro aditivní model sezónnosti a podobně pro multiplikativní model Pro smíšené modely se vypočítá obdobně i kombinace sezónní náhodné složky. Vliv náhodné složky lze potlačit průměrováním hodnot, resp. odpovídajících stejným sezónním obdobím. Výsledkem je pak odhad sezónní složky. V tomto případě jsou sezónní faktury odhadnuty neadaptivně, tj. jsou stejné pro všechny odpovídající sezóny v celé časové řadě. Na sezónní složku se často kladou další nároky požadujeme, aby součet aditivních složek byl nula, zatímco součet multiplikativních sezónních faktorů byl roven počtu sezón Regresní přístup Jinou metodou, jak identifikovat sezónní složku, je regrese. V nejjednodušším případě můžeme sezónní složku modelovat ve tvaru kde je neznámá hodnota sezónní složky a,, jsou neznámé parametry a jsou umělé proměnné, které nabývají hodnotu v případě, že čas odpovídá -té roční sezóně, jinak. Předpokládáme sezónních období v roce. U lineárních modelů trendu můžeme modelovat hodnotu řady = Wintersova metoda Wintersovou metodou se ve své práci popisuje Krištof (2006). Tato metoda se zabývá adaptivním odhadem sezónní složky, je zobecněním exponenciálního vyrovnávání. Liší se od něj tím, že popisuje i sezónní kolísání. Používá tři konstanty α, β a γ. Konstanty α, β mají podobný význam jako u modelu exponenciálního vyrovnávání. Konstanta γ je charakteristická pouze pro Wintersův model a slouží k modelování sezónní složky. Wintersův model má tedy své opodstatnění v případech, kdy časová řada kromě trendu obsahuje také sezónní kolísání. Tato metoda je zde uvedena pouze pro úplnost, protože přesahuje rámec bakalářské práce.

29 Literární přehled Box-Jenkinsovská analýza Box-Jenkinsovská analýza časových řad je naprosto odlišná od dekompozice časových řad. Touto metodou se zabývá např. Kvasnička (2001). Box- Jenkinsovské modely předpokládají, že současnou hodnotu sledovaného ekonomického ukazatele je možné popsat jako lineární kombinaci jeho minulých hodnot a minulých hodnot náhodné veličiny. Box-Jenkinsovská analýza je odvozena pouze pro stacionární časové řady. Naštěstí lze některé nestacionární řady pomocí snadných postupů převést na řady stacionární Stacionarita Existují dvě koncepce stacionarity silná (striktní) a slabá stacionarita. Silná stacionarita předpokládá, že pravděpodobností rozdělení svou odpovídajících si vektorů časové řady je stejné bez ohledu na to, kde v časové řadě se vektor nachází. Tento předpoklad je ale velmi silný a pro praktické účely se využívá slabší předpoklad, který odpovídá slabé stacionaritě. Slabá stacionarita znamená, že sledovaný proces má v čase konstantní střední hodnotu a kovarianční strukturu druhého řádu invariantní vůči posunům v čase, tj. Slabě stacionární proces má tedy v každém okamžiku stejnou střední hodnotu a stejný rozptyl. Kovariance dvou hodnot procesu ve dvou okamžicích závisí pouze na jejich vzdálenosti a ne na jejich konkrétním umístění v časové řadě. V dalším textu se pod pojmem stacionarita bude myslet vždy stacionarita slabá Autokorelační a parciální autokorelační funkce Pro stacionární časové řady je snadné popsat vzájemnou závislost jednotlivých pozorování pomocí (parciální) autokorelační funkce. Lze definovat autokovarianční funkci Tato funkce vrací hodnoty kovariance pro různá zpoždění. Autokovarianční funkci lze snadno normovat a získat tak autokorelační funkci

30 Literární přehled 30 Je zřejmé, že hodnota a ostatní hodnoty autokorelační funkce se pohybují v intervalu. Graf autokorelační funkce se nazývá korelogram. Problém ovšem je, že hodnoty autokorelační funkce jsou pro nás zatím neznámé. Je však možné je odhadnout přímo z pozorovaných dat řady. Odhad autokovarianční funkce lze získat ze vztahu A odhad autokorelační funkce ze vztahu kde je aritmetický průměr hodnot časové řady Základní procesy Autoregresní proces (AR) Autoregresní proces (AR) označuje takový proces, kdy je hodnota časové řady v čase tvořena lineární kombinací minulých hodnot této řady, tedy Kde jsou pozorované hodnoty řady v čase, jsou neznámé parametry a je hodnota náhodné veličiny v čase. Proces klouzavých součtů (MA) Proces klouzavých součtů (MA) označuje takový proces, kdy hodnota vysvětlované veličiny v čase je tvořena lineární kombinací současné a minulých hodnot náhodné veličiny. Tato veličina má opět charakter bílého šumu. Náhodnou veličinu samozřejmě nemůžeme změřit. Přesto však byly pro stacionární řady vyvinuty speciální techniky, které ji umožňují odhadnout přímo z dat. Zároveň se tedy odhadují parametry i hodnoty náhodné veličiny. Autoregresní proces klouzavých součtů (ARMA) Autoregresní proces klouzavých součtů (nebo také smíšený proces) (ARMA) má tvar

31 Literární přehled 31 Tento proces v sobě spojuje oba základní procesy AR i MA Integrované procesy Jak už bylo řečeno, Box-Jenkinsovské modely se omezují na modely stacionárních procesů. Takových je však v ekonomických aplikacích poměrně málo. Proto byly vyvinuty speciální modely pro práci s nestacionárními časovými řadami. Nejjednodušším případem je proces ARIMA, který je možné použít k modelování integrovaných procesů. Integrovaný proces je takový nestacionární proces, který lze diferenciací určitého řádu převést na stacionární proces. Pokud tedy časová řada není stacionární, zatímco řada stacionární je, pak říkáme, že původní časová řada je integrovaná řádu. Proces ARIMA pak není v zásadě nic jiného než ARMA model diferencí integrované časové řady. Rozšířením modelu ARIMA je pak proces SARIMA, kterou se zabývá Artl (2003). Jeho Základní myšlenkou je následující: jako v případě procesu ARIMA předpokládáme vzájemnou závislost mezi veličinami a protože tento proces obsahuje ještě sezónní kolísání, lze očekávat i závislost mezi sobě odpovídajícími veličinami v jednotlivých sezónách, tj. mezi veličinami kde je délka sezónní periody (např. u měsíčních časových řad 12, u čtvrtletních 4).

32 Materiál a metodika 32 3 Materiál a metodika Nejprve byly získány kompletní měsíční data za roky 2007 až 2012, tj. celkem 72 údajů. Tyto údaje tvoří časovou řadu, kterou bylo potřeba nejprve očistit viz kapitola 2.4 Problémy časových řad. Během těchto pozorovaných let se měnila výška DPH, proto i když okresní soud není plátce DPH, budeme počítat s hodnotami bez DPH a na závěr bude DPH přičteno podle aktuální výše. Dalším z problémů, který bylo potřeba vyřešit je problém s kalendářem. Aby byly hodnoty časové řady srovnatelné, bylo potřeba je přepočítat na stejný počet pracovních dnů. Pro toto očištění časové řady byl použit vzorec kde jsou hodnoty očištěné řady, jsou hodnoty původní (neočištěné) řady a je počet pracovních dnů v daném měsíci. Ze vzorce je vidět, že očištěná řada je přepočítána na hodnotu, jakou by měla, kdyby každý měsíc měl právě 20 pracovních dní. Předpokládáme, že časová řada bude obsahovat sezónní složku. Např. o letních prázdninách si většinou zaměstnanci vybírají více dovolenou. Na základě literárního přehledu bylo zjištěno, že je vhodné použít k modelování řady mimo dekompoziční metodu a také metodu SARIMA. Tyto metody budou porovnány na základě srovnávacích kritérií (ME, MAE., MSE apod.). Mimo tato kritéria bude řada uměle zkrácena o 1 rok, takže řadu budou tvořit jen pozorování za roky 2007 až 2011, tj. celkem 60 pozorování. Hodnoty řady za rok 2012 pak budou použity při pseudopredikci a výsledky pak využity jako další hodnotící kritérium pro porovnání jednotlivých modelů. Dle literárního přehledu je pro použití Box-Jenkinsovské metody nutné, aby časová řada měla alespoň 50 pozorování. Tento požadavek je ale splněn a můžeme tedy toto umělé zkrácení časové řady provést. Na závěr bude vybrán nejvhodnější model a následně pak bude provedena predikce časové řady na rok 2013.

33 Vlastní práce 33 4 Vlastní práce Nejdříve bylo nutné získat hodnoty časové řady. K dispozici byly měsíční náklady v Kč za roky 2007 až Jedná se o časovou řadu, která je stochastická, ekvidistantní, intervalová, krátkodobá a peněžní. Abychom mohli tyto hodnoty navzájem porovnávat, bylo nutné prvně časovou řadu očistit. Prvním problémem bylo, že během těchto let se postupně měnila výška DPH. Tento problém šlo snadno odstranit dále se vždy počítalo s hodnotami bez DPH. Druhým problémem byl nestejný počet pracovních dní v jednotlivých měsících. Abychom dosáhli srovnatelnost jednotlivých měsíčních pozorování, bylo nutné provést přepočet hodnot na stejný počet pracovních dnů v měsíci. V našem případě bylo zvoleno 20 pracovních dnů. Pro lepší představu ukazuje Obr. 7 spojnicový graf očištěné a neočištěné časové řady. Obr. 7 Očištěná a neočištěná časová řada Z grafu lze vidět, že v květnu roku 2010 nastala razantní změna. Tato změna vznikla v důsledku změny telefonní ústředny a operátora. Pokud by byly k dispozici staré ceníky a smlouvy, daly by se dopočítat i ceny, které by byly placeny za stávajících podmínek. Tím by vznikla nová přepočtená časová řada, která by byla konzistentní. Bohužel tyto údaje k dispozici nejsou. Z grafu je vidět, že změna nastala v květnu roku Tento předpoklad si ověříme QLR testem.

34 Vlastní práce 34 Na Obr. 8 lze vidět zlom v předpokládaném měsíci 5/2010. P-hodnota (4,103e-047) Chí-kvadrát testu je menší než hladina významnosti, proto nulovou hypotézu o neexistenci strukturálního zlomu zamítáme (Maxima F(2, 68) = 107,804 se dosahuje pro pozorování 2010:05). Obr. 8 QLR test Předpoklad se potvrdil a tedy rok 2007 až duben 2010 se tedy diametrálně liší od zbytku časové řady. 4.1 Charakteristiky časové řady V této podkapitole jsou uvedeny základní charakteristiky zkoumané časové řady. Protože jsme ověřili, že se v naší časové řadě objevil zlom, rozdělíme časovou řadu na 2 části a jednotlivé statistiky budeme počítat pro obě řady zvlášť. Tab. 1 ukazuje popisné statistiky pro jednotlivá období. Z tabulky je vidět, že se ceny v druhém období nesnížily jen o konstantu, ale zmenšil se i rozptyl (a také směrodatná odchylka). Naopak variační koeficient, který je nástrojem pro porovnání různých souborů, vychází podobně. Dokazuje tedy, že si jsou obě období podobná.

35 Vlastní práce 35 Tab. 1 Popisné statistiky 1.a 2. období 1. období 2. období Střední hodnota Medián Minimum Maximum Směrodatná odchylka 1610,2 703,8 Variační koeficient 0,0797 0,0675 Šikmost 0,4199-0,0049 Stand. špičatost -0,4665 1,3192 Obr. 9 graficky ukazuje 1. diference v obou obdobích. Je z něj také pěkně vidět (pokud pomineme zlom), že volatilita v druhém období je podstatně menší než v období prvním. Obr diference v 1. období a 2. období 4.2 Dekompoziční model V předchozí podkapitole se použily hodnoty celé časové řady. V následujících modelech je pak časová řada uměle zkrácena o rok 2012 a hodnoty z tohoto roku budou použity při pseudopredikci. Pro odhad parametrů je využita metoda nejmenších čtverců. Jak je vidět na Obr. 10, je potřeba nějak vyřešit změnu, která nastala v roce Pokud bychom provedli jen klasickou lineární regresi, neměl by graf moc velkou vypovídající hodnotu.

36 Vlastní práce 36 Obr. 10 Lineární forma bez použití dummy proměnné Stejně bychom dopadli, i kdybychom provedli proložení např. kvadratickou rovnicí apod. Z toho důvodu byla zavedena umělá (dummy) proměnná, která je definována jako 0, pokud se nachází v 1. období a jako 1, pokud se nachází v 2. období. Na Obr. 11 je pak vidět, jak vypadá vyrovnání lineární formou, pokud proměnnou využijeme.

37 Vlastní práce 37 Obr. 11 Lineární forma bez sezónní složky Vyrovnaná křivka má rovnici: Z Tab. 2 je vidět, že parametry a jsou na hladině významnosti statisticky významné a parametr je právě na hraně významnosti. Tab. 2 t-testy parametrů lineárního modelu bez sezónní složky koeficient směr. chyba t-podíl p-hodnota 20923,8 417,649 50,1 <0, ,89 642,588-13,38 <0, , ,4915-2,001 0,0502 Následně porovnáme tento model s kvadratickou formou. Vyrovnání křivkou je vidět na Obr. 12.

38 Vlastní práce 38 Obr. 12 Kvadratická forma bez sezónní složky Vyrovnaná kvadratická křivka má rovnici: Stejně jako u předchozího modelu jsou první dva parametry významné, parametr je opět na hraně významnosti. Navíc přidaný parametr významný není. Tab. 3 t-test kvadratického modelu bez sezónní složky koeficient směr. chyba t-podíl p-hodnota konstanta ,493 39,54 <0, ,85 805,46-11,47 <0, , ,6545-2,006 0,0497 1,061 0,8173 1,298 0,1996 V dalším modelu pak místo času použit jeho logaritmus. Názornou ukázku, jak vyrovnaná křivka vypadá, naznačuje Obr. 13.

39 Vlastní práce 39 Obr. 13 Lineárně-logaritmická forma bez sezónní složky Vyrovnaná křivka má rovnici: Tab. 4 nám ukazuje, že tentokrát jsou statisticky významné všechny složky. Tab. 4 t-testy lineárně-logaritmického modelu bez sezónní složky koeficient směr. chyba t-podíl p-hodnota konstanta 22072,7 692,393 31,88 <0, ,55 453,85-19,54 <0, , ,511-2,825 0,0065 Nyní máme k dispozici 3 modely a je vhodné je porovnat. K tomu lze použít statistická kritéria ME, MSE, atd. V následujících tabulkách budou vždy zeleným podbarvením naznačeny nejlepší hodnoty.

40 Vlastní práce 40 Tab. 5 Statistická kritéria pro trendové křivky bez sezónní složky lineární f. kvadratická f. lin-log f. ME MSE RMSE , MAE 993,64 968,92 951,39 MPE -0, , ,5064 MAPE 5,7494 5,6748 5,5405 Kromě těchto můžeme využít i další srovnávací kritéria jako např. Akaikovo informační kritérium (AIC), Schwarzovo kritérium (SC) a Hannan-Quinnovo kritérium (HQ). Tab. 6 Další kritéria pro trendové křivky bez sezónní složky lineární f. kvadratická f. lin-log f. AIC 1038, , ,73 SC 1044, , ,013 HQ 1040, , ,187 Jak je vidět z obou tabulek (a v podstatě i z grafů), hodnoty kritérií si jsou velmi podobná. Nejlépe však ze všech modelů vyšel model lineárně-logaritmický. 4.3 Sezónní složka Předpokládáme, že v modelu se vyskytuje také sezónní křivka. Zaměstnanci se v létě pravděpodobně vybírají dovolenou nebo naopak v lednu mohou narůst telefonní poplatky z důvodu různých výkazů, atp. Tyto fakty by nám mohla pomoci odhalit sezónní složky. Tato kapitola je velmi podobná jako kapitola 4.2, pouze zde budou i dummy proměnné pro jednotlivé měsíce. V modelu ve vysvětlujících parametrech tedy přibude celkem 11 dummy proměnných definovaných jako 1, pokud nastává daný měsíc a jako 0 jinak. Následující Obr. 14 až Obr. 16 ukazují postupně lineární, kvadratickou a lineárně-logaritmickou formu vždy se sezónní složkou. Jednotlivé t-testy jsou uvedeny v příloze B.

41 Vlastní práce 41 Obr. 14 Lineární forma se sezónní složkou Obr. 15 Kvadratická forma se sezónní složkou

42 Vlastní práce 42 Obr. 16 Lineárně-logaritmická forma se sezónní složkou Na první pohled si jsou vyrovnané křivky velmi podobné, proto samozřejmě opět použijeme pro srovnání statistická kritéria. Tab. 7 a Tab. 8 nám opět ukazují, že i hodnoty kritérií si jsou velmi podobné. Tentokrát sice lineárně-logaritmický model nevyšel z hodnocení jako jednoznačný vítěz, ale majoritu nejlepších výsledků má opět on. Tab. 7 Statistická kritéria pro trendové křivky se sezónní složkou lineární f. kvadratická f. lin-log f. ME MSE RMSE 1127,8 1116,6 1102,5 MAE 833,33 830,84 831,92 MPE -0,3563-0,3645-0,3533 MAPE 4,9545 4,9819 4,9639 Tab. 8 Další kritéria pro trendové křivky bez sezónní složky lineární f. kvadratická f. lin-log f. AIC 1041, , ,911 SC 1070, , ,232 HQ 1053, , ,38

43 Vlastní práce Box-Jenkinsova metoda Box-Jenkinsova metoda vychází z úplně jiných principů než dekompoziční metoda. Různí autoři mají různé metody, jak identifikovat nejlepší parametry modelů založených na Box-Jenkinsově metodě. Ale vzhledem k výpočetní síle dnešních počítačů jsem pro zjištění nejlepších parametrů použil hrubou sílu. Byly vyzkoušeny všechny kombinace až do druhého řádu u modelu ARIMA a nejlepších výsledků bylo dosaženo u modelu ARIMA (2,1,2). Obr. 17 zobrazuje vyrovnání metodou ARIMA (2,1,2). Pro porovnání modelu s ostatními využijeme opět statistická kritéria. Obr. 17 Model ARIMA (2,1,2) Z následující Tab. 9 lze vidět, že pouze parametry a jsou na hladině významnosti statisticky významné. Tab. 9 t- testy modelu ARIMA (2,1,2) koeficient směr. chyba t-podíl p-hodnota konstanta -195, ,8470-0,9511 0,3416-1,1328 0,2151-5,2670 <0,0001-0,9180 0,2613-3,5130 0,0004 0,9256 0,4959 1,8670 0,0619 0,7684 0,4539 1,6930 0,0905

44 Vlastní práce 44 Pokud porovnáme výsledky kriterií z Tab. 10 a Tab. 11 s výsledky dekompozičních modelů, zjistíme, že ARIMA (2,1,2) nám poskytuje výsledky podstatně horší. Tab. 10 Statistická kritéria pro model ARIMA (2,1,2) Tab. 11 Další kritéria pro model ARIMA (2,1,2) ME -8,6474 MSE RMSE 1792,6 MAE 1218,2 MPE -0,9448 MAPE 7,9076 AIC 1063,829 SC 1076,294 HQ 1068,695 Obdobně jako u modelu ARIMA byly vyzkoušeny všechny možné kombinace parametrů až do řádu 2 i u modelu SARIMA a nejlépe ohodnocený model je SARIMA (2,1,2) (1,1,2). Na Obr. 18 je vidět vyrovnání pomocí modelu SARIMA (2,1,2)(1,1,2). Pro srovnání opět využijeme statistická kritéria viz Tab. 13 a Tab. 14. Podle statistických kritérií je model SARIMA ještě horší než model modelu ARIMA. Pokud se podíváme i na další kritéria, tak z nich naopak vychází model SARIMA lépe.

45 Vlastní práce 45 Obr. 18 Model SARIMA (2,1,2) (1,1,2) Z Tab. 12 lze vidět, že u modelu SARIMA (2,1,2) (1,1,2) jsou na hladině významnosti statisticky významné kromě parametrů a také parametry, a. Tab. 12 t-testy modelu SARIMA (2,1,2)(1,1,2) koeficient směr. chyba t-podíl p-hodnota konstanta -94, ,1860-0,8459 0,3976-1,0849 0, ,2600 <0,0001-0,9612 0, ,7400 <0,0001 0,3822 0,4548 0,8403 0,4007 0,8730 0,1910 4,5710 <0,0001 0,7591 0,2045 3,7120 0,0002-1,9165 0,8487-2,2580 0,0239 1,0000 0,8016 1,2470 0,2122

46 Vlastní práce 46 Tab. 13 Statistická kritéria pro model SARIMA (2,1,2)(1,1,2) ME 43,593 MSE RMSE 1999,4 MAE 1418,3 MPE -0,4097 MAPE 9,4852 Tab. 14 Statistická kritéria pro model ARIMA (2,1,2) AIC 866,2398 SC 882,8912 HQ 872, Pseudopredikce Nyní máme k dispozici 4 nejlépe ohodnocené modely od různých přístupů. Pro lepší přehlednost budeme používat označení naznačené v Tab. 15. Tab. 15 Označení modelů použitých pro pseudopredikci model A Lineárně-logaritmická forma bez sezónní složky model B Lineárně-logaritmická forma se sezónní složkou model C ARIMA (2,1,2) model D SARIMA (2,1,2)(1,1,2) Jak je již výše uvedeno, časová řada byla uměle zkrácena o rok 2012, aby tento rok mohl být použitý pro pseudopredikci. Obr. 19 nám ukazuje pseudopredikci pro lineárně-logaritmický model bez sezónní složky (vlevo) a se sezónní složkou (vpravo). Od pohledu vypadá model se sezónní složkou lépe. Tuto skutečnost si ale ověříme pomocí Theilova koeficientu neurčitosti.

47 Vlastní práce 47 Obr. 19 Pseudopredikce pro dekompoziční metody Obr. 20 nám naopak ukazuje pseudopredikce pro Box-Jenkinsovské metody. Vlevo je model ARIMA a vpravo model SARIMA. Na první pohled jsou předpovědi u modelu ARIMA o řád horší než u dekompozičních metod a u model SA- RIM vykazuje výsledky nejhorší. Obr. 20 Pseudopredikce pro Box-Jenkinsovské metody Tab. 16 udává očištěné hodnoty časové řady a také hodnoty, které byly získány pseudopredikcí jednotlivými modely.

48 Vlastní práce 48 Tab. 16 Přehled skutečných predikovaných hodnot jednotlivých modelů Očištěné hodnoty model A model B model C model D leden únor březen duben květen červen červenec srpen září říjen listopad prosinec Zelenou barvou je naznačena vždy nejbližší hodnota v daném měsíci. Z tabulky je vidět, že nejvíce se skutečnosti přibližuje model A a následuje ho pak model B. Naopak model D od května dále ukazuje naprosto nereálné výsledky. Statistické ověření, který model nejlépe predikuje budoucnost, lze provést pomocí Theilova koeficientu. Opět zde platí, že čím nižší číslo, tím lepší predikce. Z Tab. 17 vidíme, že model A a model B jsou si velmi podobné, přičemž model B má o trochu lepší výsledky. Modely C a D mají Theilův koeficient větší než 1 a tedy mají horší výsledky než model naivní. Tab. 17 Porovnání výsledků pseudopredikce pomocí Theilova koeficientu model A model B model C model D Theilův koeficient 0,6624 0,6285 2,6533 8,8269 Vzhledem k tomu, že celkově zvítězil dekompoziční model se sezónní složkou a v této kategorii měly všechny modely srovnávací statistická kritéria velmi podobné výsledky, provedeme pro jistotu ještě pseudopredikci i pro lineární formu. Pokud bude výsledný Theilův koeficient lepší nebo podobný jako u lineárně-logaritmického modelu, bude přirozenější použít tento lineární tento model oproti lineárně-logaritmickému. Obr. 21 ukazuje pseudopredikci pro lineární formu se sezónní složkou.

49 Vlastní práce 49 Obr. 21 Pseudopredikce pro lineární formu se sezónní složkou Opět porovnáme jednak skutečné a predikované hodnoty a také Theilův koeficient. Pro zjednodušení označíme modelem E lineární dekompoziční model se sezónní složkou. Jak je vidět z Tab. 18, výsledky obou modelů jsou velmi podobné. Každý předpovídal lépe právě polovinu výsledků.

50 Vlastní práce 50 Tab. 18 Přehled skutečných a predikovaných hodnot nejlepších modelů Očištěné hodnoty model B model E leden únor březen duben květen červen červenec srpen září říjen listopad prosinec A při porovnání Theilova koeficientu zjišťujeme, že model E není jen podobný modelu B, ale dokonce je lepší. Tab. 19 Porovnání výsledků pseudopredikce pomocí Theilova koeficientu Jako vítěze tedy volíme model E. 4.6 Test náhodné složky model B model E Theilův koeficient 0,6285 0,6215 Nejlépe vyhodnocený model je model E. Ještě před vlastní predikcí ověříme, zda jeho náhodná složka má vlastnosti Gaussovského bílého šumu, tj. splňuje následující předpoklady: má nulovou střední hodnotu má konstantní rozptyl je párově nezávislá Pokud navíc splňuje podmínku normálního rozdělení, lze hovořit o normálně rozděleném bílém šumu. Je zapotřebí ještě model upravit tak, že přidáme i pozorování za rok 2012, o které byla řada nejprve uměle zkrácena. Tab. 20 ukazuje t-testy rozšířeného modelu o rok Na hladině významnosti jsou statisticky významné parametry,, a 8.

51 Vlastní práce 51 Tab. 20 t-testy lineárního modelu se sezónní složkou včetně roku 2012 koeficient směr. chyba t-podíl p-hodnota konstanta 20955, , ,4800 <0,0001 zlom -8441, , ,2400 <0,0001 t -34, ,2581-2,5950 0,0120 dm1 364, ,8520 0,5367 0,5935 dm2 1034, ,6880 1,5250 0,1327 dm3 165, ,7810 0,2443 0,8079 dm4-91, ,1320-0,1348 0,8933 dm5-415, ,3420-0,6095 0,5446 dm6 113, ,6630 0,1665 0,8683 dm7-977, ,2390-1,4410 0,1549 dm8-1508, ,0720-2,2280 0,0297 dm9 229, ,1630 0,3392 0,7357 dm10-324, ,5130-0,4806 0,6326 dm11 334, ,1220 0,4960 0,6218 Nulová střední hodnota Na Obr. 22 vidíme, že rezidua oscilují kolem nulové hodnoty. Tuto domněnku si ověříme pomocí klasického testu o střední hodnotě. Oboustranná p-hodnota (1,0) je větší než hladina významnosti, proto nezamítáme nulovou hypotézu o nulové střední hodnotě.

52 Vlastní práce 52 Obr. 22 Graf reziduí v závislosti na čase Konstantní rozptyl Konstantní rozptyl lze ověřit pomocí ARCH testu. Pro náš model je p-hodnota (0,7231) u ARCH testu pro zpoždění 12 větší než hladina významnosti, proto nulovou hypotézu o neexistenci ARCH efektu v modelu nezamítáme. Jinými slovy v modelu není porušen předpoklad konstantním rozptylu (v modelu není podmíněná heteroskedasticita). Párová nezávislost Párovou nezávislost (autokorelaci) lze ověřit pomocí Durbin-Watsonova testu. Jeho p-hodnota (0,2844) je větší než hladina významnosti, proto nulovou hypotézu o autokorelaci nezamítáme. Tento předpoklad ještě ověříme také pomocí ACF a PACF grafu. Z Obr. 23 lze vysledovat možné problémy u zpožděných proměnných řádu 3, 4, 6, 7 a 10. Evidentně nejde o nikterak závažný problém, ale je lepší ho raději vyřešit. Lze toho dosáhnout tak, že do vysvětlujících proměnných zkoumaného modelu zařadíme také zpožděné proměnné těchto řádů. Tím by se měl problém s autokorelací vyřešit a model by měl zůstat skoro v nezměněné podobě. Ověření bílého šumu se ale musí provést od začátku.

53 Vlastní práce 53 Obr. 23 ACF a PACF graf Tab. 21 ukazuje t-testy modelu rozšířeného o zpožděné proměnné. Je z ní patrno, že na hladině významnosti jsou statisticky významné parametry,, a. Za zmínku stojí určitě parametr, který naznačuje, že v únoru jsou náklady na telefonní linky podstatně vyšší. A parametr pak ukazuje na jistou periodicitu v řádu šesti měsíců.

54 Vlastní práce 54 Tab. 21 t-testy vítězného modelu koeficient směr. chyba t-podíl p-hodnota konstanta 18244, ,2400 8,5770 <0,0001 zlom -9008, , ,3000 <0,0001 t 4, ,4463 0,1843 0,8546 dm1 1051, ,4820 1,4870 0,1444 dm2 1509, ,0660 2,1870 0,0342 dm3 92, ,6490 0,1283 0,8985 dm4-92, ,6430-0,1307 0,8966 dm5-42, ,5810-0,0563 0,9554 dm6 589, ,4480 0,7492 0,4578 dm7-776, ,1350-1,0990 0,2777 dm8-1128, ,5530-1,5180 0,1364 dm9 33, ,7600 0,0472 0,9626 dm10-85, ,8500-0,1191 0,9058 dm11 878, ,1480 1,2860 0,2053 Kc_3 0,0517 0,1050 0,4925 0,6249 Kc_4-0,1425 0,0982-1,4510 0,1541 Kc_6 0,2371 0,1007 2,3530 0,0232 Kc_7-0,1131 0,1055-1,0730 0,2895 Kc_10 0,0309 0,0720 0,4298 0,6695 Nulová střední hodnota Oboustranná p-hodnota (1,0) má stejnou velikost jako v prvním případě a tedy nezamítáme nulovou hypotézu o nulové střední hodnotě. Konstantní rozptyl Pro náš nový model je p-hodnota (0,6799) u ARCH testu pro zpoždění 12 menší než v původním případě, ale stále je větší než hladina významnosti, a proto opět nulovou hypotézu o neexistenci ARCH efektu v modelu nezamítáme. Párová nezávislost P- hodnota (0,1353) Durbin-Watsonova testu je také nižší než v původním modelu, ale také je stále větší než hladina významnosti, proto nulovou hypotézu o autokorelaci nezamítáme. Tento předpoklad znovu ověříme také pomocí ACF a PACF grafu. Na Obr. 24 je už tentokrát vše v pořádku. Využijeme ještě jednu možnost pro otestování autokorelace a to Ljung-Boxův test. Jeho p-hodnota (0,653) je vyšší než hladina významnosti, proto nulovou hypotézu o autokorelaci nezamítáme.

55 Vlastní práce 55 Obr. 24 ACF a PACF graf upraveného modelu Upravený model splňuje všechny 3 nutné předpoklady a jeho reziduální složka má vlastnosti bílého šumu. Nyní zbývá jen ověřit, zda má náhodná složka normální rozdělení. Na Obr. 25 je znázorněn histogram reziduí. P-hodnota (0,0039) Chíkvadrát testu je menší než hladina významnosti, proto nulovou hypotézu o normálně rozdělených chybách zamítáme. Model tedy nemá normálně rozdělený chybový člen. S největší pravděpodobností lze tento fakt vysvětlit díky zlomu, který v časové řadě objevil v roce 2010.

56 Vlastní práce 56 Obr. 25 Histogram reziduí Náhodná složka modelu má vlastnosti bílého šumu, ale ne normálně rozděleného bílého šumu. Normalita reziduí je sice žádoucí vlastnost, ale není zásadní, a proto tento model můžeme využít pro predikci. 4.7 Predikce hodnot časové řady Pro předpověď hodnot na rok 2013 byl využit lineární sezónní model s přidanými zpožděnými proměnnými, který byl vyhodnocen jako model s největší vypovídající hodnotou a také, že jeho náhodná složka má vlastnosti bílého šumu. Model byl aplikován na kompletní data z let 2007 až Na Obr. 26 je graf predikovaných hodnot pro rok 2013.

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Stochastický proces Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2 } se nazývá stochastický proces

Více

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů Časové řady, typy trendových funkcí a odhady trendů Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Jiří Neubauer (Katedra ekonometrie UO Brno) Časové

Více

Úvod do analýzy časových řad

Úvod do analýzy časových řad Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2... } se nazývá stochastický

Více

KGG/STG Statistika pro geografy. Mgr. David Fiedor 4. května 2015

KGG/STG Statistika pro geografy. Mgr. David Fiedor 4. května 2015 KGG/STG Statistika pro geografy 11. Analýza časových řad Mgr. David Fiedor 4. května 2015 Motivace Úvod chceme získat představu o charakteru procesu, která časová řada reprezentuje Jaké jevy lze znázornit

Více

Cvičení 9 dekompozice časových řad a ARMA procesy

Cvičení 9 dekompozice časových řad a ARMA procesy Cvičení 9 dekompozice časových řad a ARMA procesy Příklad 1: Dekompozice časové řady Soubor 18AEK-cv09.xls obsahuje dvě časové řady (X a Y) se 72 pozorováními. Použijte časovou řadu Y. a) Pokuste se na

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1

Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1 Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1 1 ČHMÚ, OPZV, Na Šabatce 17, 143 06 Praha 4 - Komořany sosna@chmi.cz, tel. 377 256 617 Abstrakt: Referát

Více

Neuronové časové řady (ANN-TS)

Neuronové časové řady (ANN-TS) Neuronové časové řady (ANN-TS) Menu: QCExpert Prediktivní metody Neuronové časové řady Tento modul (Artificial Neural Network Time Series ANN-TS) využívá modelovacího potenciálu neuronové sítě k predikci

Více

AVDAT Nelineární regresní model

AVDAT Nelineární regresní model AVDAT Nelineární regresní model Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Nelineární regresní model Ey i = f (x i, β) kde x i je k-členný vektor vysvětlujících proměnných

Více

Ekonometrie. Jiří Neubauer

Ekonometrie. Jiří Neubauer Úvod do analýzy časových řad Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Úvod do analýzy

Více

Statistika II. Jiří Neubauer

Statistika II. Jiří Neubauer Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Časová řada konečná posloupnost reálných hodnot určitého sledovaného ukazatele měřeného v určitých

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie ZS 2015/16 Cvičení 7: Časově řady, autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Časové řady Data: HDP.wf1

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chb v této presentaci mě prosím upozorněte. Děkuji. Tto slid berte pouze jako doplňkový materiál není v nich

Více

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

MÍRY ZÁVISLOSTI (KORELACE A REGRESE) zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky

Více

STATISTIKA I Metodický list č. 1 Název tématického celku:

STATISTIKA I Metodický list č. 1 Název tématického celku: STATISTIKA I Metodický list č. 1 Analýza závislostí Základním cílem tohoto tématického celku je seznámit se s pokročilejšími metodami zpracování statistických údajů.. 1. kontingenční tabulky 2. regresní

Více

Měření závislosti statistických dat

Měření závislosti statistických dat 5.1 Měření závislosti statistických dat Každý pořádný astronom je schopen vám předpovědět, kde se bude nacházet daná hvězda půl hodiny před půlnocí. Ne každý je však téhož schopen předpovědět v případě

Více

STATISTIKA A JINÉ POHÁDKY

STATISTIKA A JINÉ POHÁDKY STATISTIKA A JINÉ POHÁDKY Autor: Gele Lutín City 2008 Kapitola 1 ZÁKLADNÍ statistické charakteristiky Pojmem ZÁKLADNÍ statistické charakteristiky se souhrnně rozumí popisná statistika, do které patří například

Více

MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ

MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ v praxi u jednoho prvku souboru se často zkoumá více veličin, které mohou na sobě různě záviset jednorozměrný výběrový soubor VSS X vícerozměrným výběrovým souborem VSS

Více

Periodicita v časové řadě, její popis a identifikace, exponenciální vyrovnáván

Periodicita v časové řadě, její popis a identifikace, exponenciální vyrovnáván Periodicita v časové řadě, její popis a identifikace, exponenciální vyrovnávání Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Periodicita v časových

Více

Analýza časových řad. John Watters: Jak se stát milionářem.

Analýza časových řad. John Watters: Jak se stát milionářem. 5.2 Analýza časových řad Nechal jsem si udělat prognózu růstu své firmy od třech nezávislých odborníků. Jejich analýzy se shodovaly snad pouze v jediném - nekřesťanské ceně, kterou jsem za ně zaplatil.

Více

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009

Více

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, KMA/SZZS1 Matematika 1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, operace s limitami. 2. Limita funkce

Více

1. Přednáška. Ing. Miroslav Šulai, MBA

1. Přednáška. Ing. Miroslav Šulai, MBA N_OFI_2 1. Přednáška Počet pravděpodobnosti Statistický aparát používaný ve financích Ing. Miroslav Šulai, MBA 1 Počet pravděpodobnosti -náhodné veličiny 2 Počet pravděpodobnosti -náhodné veličiny 3 Jevy

Více

7. Rozdělení pravděpodobnosti ve statistice

7. Rozdělení pravděpodobnosti ve statistice 7. Rozdělení pravděpodobnosti ve statistice Statistika nuda je, má však cenné údaje, neklesejte na mysli, ona nám to vyčíslí Jednou z úloh statistiky je odhad (výpočet) hodnot statistického znaku x i,

Více

4.1 Metoda horizontální a vertikální finanční analýzy

4.1 Metoda horizontální a vertikální finanční analýzy 4. Extenzívní ukazatelé finanční analýzy 4.1 Metoda horizontální a vertikální finanční analýzy 4.1.1 Horizontální analýza (analýza vývojových trendů -AVT) AVT = časové změny ukazatelů (nejen absolutních)

Více

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení 2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků

Více

Časové řady a jejich periodicita úvod

Časové řady a jejich periodicita úvod Časové řady a jejich periodicita úvod Jana Klicnarová Katedra aplikované matematiky a informatiky Jihočeská Univerzita v Českých Budějovicích, Ekonomická fakulta 2010 Časové řady Data, která získáváme

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

VÝVOJ INDEXŮ SPOTŘEBITELSKÝCH CEN

VÝVOJ INDEXŮ SPOTŘEBITELSKÝCH CEN ČESKÁ ZEMĚDĚLSKÁ UNIVERZITA V PRAZE Fakulta provozně ekonomická Katedra statistiky Studijní obor: Veřejná správa a regionální rozvoj Teze k diplomové práci VÝVOJ INDEXŮ SPOTŘEBITELSKÝCH CEN Vypracovala:

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Závislost náhodných veličin Úvod Předchozí přednášky: - statistické charakteristiky jednoho výběrového nebo základního souboru - vztahy mezi výběrovým a základním souborem - vztahy statistických charakteristik

Více

Lineární regrese. Komentované řešení pomocí MS Excel

Lineární regrese. Komentované řešení pomocí MS Excel Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních

Více

VYUŽITÍ WAVELETŮ PŘI ANALÝZE ČASOVÝCH ŘAD 2. PRAKTICKÁ ČÁST

VYUŽITÍ WAVELETŮ PŘI ANALÝZE ČASOVÝCH ŘAD 2. PRAKTICKÁ ČÁST EMI, Vol., Issue 3, ISSN: -99 (Print), 5-353X (Online) VYUŽITÍ WAVELETŮ PŘI ANALÝZE ČASOVÝCH ŘAD. PRAKTICKÁ ČÁST USING WAVELETS BY TIME SERIES ANALYSIS. PRACTICAL PART Vratislava Mošová Moravská vysoká

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO

Více

Modely stacionárních časových řad

Modely stacionárních časových řad Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Proces bílého šumu Proces {ɛ t} nazveme bílým šumem s nulovou střední hodnotou a rozptylem σ 2 a

Více

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu

Více

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

Matematické modelování Náhled do ekonometrie. Lukáš Frýd Matematické modelování Náhled do ekonometrie Lukáš Frýd Výnos akcie vs. Výnos celého trhu - CAPM model r it = r ft + β 1. (r mt r ft ) r it r ft = α 0 + β 1. (r mt r ft ) + ε it Ekonomický (finanční model)

Více

UNIVERZITA PARDUBICE. 4.4 Aproximace křivek a vyhlazování křivek

UNIVERZITA PARDUBICE. 4.4 Aproximace křivek a vyhlazování křivek UNIVERZITA PARDUBICE Licenční Studium Archimedes Statistické zpracování dat a informatika 4.4 Aproximace křivek a vyhlazování křivek Mgr. Jana Kubátová Endokrinologický ústav V Praze, leden 2012 Obsah

Více

Diagnostika regrese pomocí grafu 7krát jinak

Diagnostika regrese pomocí grafu 7krát jinak StatSoft Diagnostika regrese pomocí grafu 7krát jinak V tomto článečku si uděláme exkurzi do teorie regresní analýzy a detailně se podíváme na jeden jediný diagnostický graf. Jedná se o graf Předpovědi

Více

10. Předpovídání - aplikace regresní úlohy

10. Předpovídání - aplikace regresní úlohy 10. Předpovídání - aplikace regresní úlohy Regresní úloha (analýza) je označení pro statistickou metodu, pomocí nichž odhadujeme hodnotu náhodné veličiny (tzv. závislé proměnné, cílové proměnné, regresandu

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

Pearsonův korelační koeficient

Pearsonův korelační koeficient I I.I Pearsonův korelační koeficient Úvod Předpokládejme, že náhodně vybereme n objektů (nebo osob) ze zkoumané populace. Často se stává, že na každém z objektů měříme ne pouze jednu, ale několik kvantitativních

Více

Analýza dat na PC I.

Analýza dat na PC I. CENTRUM BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Analýza dat na PC I. Popisná analýza v programu Statistica IBA výuka Základní popisná statistika Popisná statistika

Více

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ Michal Kořenář 1 Abstrakt Rozvoj výpočetní techniky v poslední době umožnil také rozvoj výpočetních metod, které nejsou založeny na bázi

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie Predikce Multikolinearita Cvičení 4 Zuzana Dlouhá Aplikace EM predikce obecně ekonomické prognózování, předpověď, předvídání hlavním cílem je odhad hodnot vysvětlované proměnné

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK Základy ekonometrie Odhad klasického lineárního regresního modelu II Cvičení 3 Zuzana Dlouhá Klasický lineární regresní model - zadání příkladu Soubor: CV3_PR.xls Data: y = maloobchodní obrat potřeb

Více

Úvod do zpracování signálů

Úvod do zpracování signálů 1 / 25 Úvod do zpracování signálů Karel Horák Rozvrh přednášky: 1. Spojitý a diskrétní signál. 2. Spektrum signálu. 3. Vzorkovací věta. 4. Konvoluce signálů. 5. Korelace signálů. 2 / 25 Úvod do zpracování

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

UNIVERZITA PARDUBICE

UNIVERZITA PARDUBICE UNIVERZITA PARDUBICE Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie na téma Tvorba nelineárních regresních modelů v analýze dat Vedoucí licenčního studia Prof. RNDr.

Více

Popisná statistika kvantitativní veličiny

Popisná statistika kvantitativní veličiny StatSoft Popisná statistika kvantitativní veličiny Protože nám surová data obvykle žádnou smysluplnou informaci neposkytnou, je žádoucí vyjádřit tyto ve zhuštěnější formě. V předchozím dílu jsme začali

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti

Více

Statistika (KMI/PSTAT)

Statistika (KMI/PSTAT) Statistika (KMI/PSTAT) Cvičení dvanácté aneb Regrese a korelace Statistika (KMI/PSTAT) 1 / 18 V souboru 25 jedinců jsme měřili jejich výšku a hmotnost. Výsledky jsou v tabulce a grafu. Statistika (KMI/PSTAT)

Více

Chyby měření 210DPSM

Chyby měření 210DPSM Chyby měření 210DPSM Jan Zatloukal Stručný přehled Zdroje a druhy chyb Systematické chyby měření Náhodné chyby měření Spojité a diskrétní náhodné veličiny Normální rozdělení a jeho vlastnosti Odhad parametrů

Více

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7 Inovace předmětu STATISTIKA Obsah 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7 1 1. Inovace předmětu STATISTIKA Předmět Statistika se na bakalářském oboru

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných

Více

SEMESTRÁLNÍ PRÁCE X. Aproximace křivek Numerické vyhlazování

SEMESTRÁLNÍ PRÁCE X. Aproximace křivek Numerické vyhlazování KATEDRA ANALYTICKÉ CHEMIE FAKULTY CHEMICKO TECHNOLOGICKÉ UNIVERSITA PARDUBICE - Licenční studium chemometrie LS96/1 SEMESTRÁLNÍ PRÁCE X. Aproximace křivek Numerické vyhlazování Praha, leden 1999 0 Úloha

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými. POLYNOMICKÁ REGRESE Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými. y = b 0 + b 1 x + b 2 x 2 + + b n x n kde b i jsou neznámé parametry,

Více

TECHNIKA UMĚLÝCH PROMĚNNÝCH V PRŮŘEZOVÉ ANALÝZE A V MODELECH ČASOVÝCH ŘAD

TECHNIKA UMĚLÝCH PROMĚNNÝCH V PRŮŘEZOVÉ ANALÝZE A V MODELECH ČASOVÝCH ŘAD TECHNIKA UMĚLÝCH PROMĚNNÝCH V PRŮŘEZOVÉ ANALÝZE A V MODELECH ČASOVÝCH ŘAD Umělé (dummy) proměnné se používají, pokud chceme do modelu zahrnout proměnné, které mají kvalitativní či diskrétní charakter,

Více

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy Ekonometrická analýza proces, skládající se z následujících fází: a) specifikace b) kvantifikace c) verifikace d) aplikace Postupné zpřesňování jednotlivých

Více

INDUKTIVNÍ STATISTIKA

INDUKTIVNÍ STATISTIKA 10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ

Více

8 ANALÝZA ČASOVÝCH ŘAD SEZÓNNÍ SLOŽKA

8 ANALÝZA ČASOVÝCH ŘAD SEZÓNNÍ SLOŽKA 8 ANALÝZA ČASOVÝCH ŘAD SEZÓNNÍ SLOŽKA RYCHLÝ NÁHLED KAPITOLY Následující kapitolou pokračujeme v tématu analýza časových řad a blíže se budeme zabývat problematikou jich pravidelné kolísavost, která je

Více

Statistika pro geografy

Statistika pro geografy Statistika pro geografy 2. Popisná statistika Mgr. David Fiedor 23. února 2015 Osnova 1 2 3 Pojmy - Bodové rozdělení četností Absolutní četnost Absolutní četností hodnoty x j znaku x rozumíme počet statistických

Více

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti 3.3 v analýze dat Autor práce: Přednášející: Prof. RNDr. Milan Meloun, DrSc Pro

Více

Ilustrační příklad odhadu LRM v SW Gretl

Ilustrační příklad odhadu LRM v SW Gretl Ilustrační příklad odhadu LRM v SW Gretl Podkladové údaje Korelační matice Odhad lineárního regresního modelu (LRM) Verifikace modelu PEF ČZU Praha Určeno pro posluchače předmětu Ekonometrie Needitovaná

Více

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel Regresní analýza Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Regresní analýza 1 / 23

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých

Více

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Vybraná rozdělení spojitých náhodných veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Třídění Základním zpracováním dat je jejich třídění. Jde o uspořádání získaných dat, kde volba třídícího

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Hodina 50 Strana 1/14. Gymnázium Budějovická. Hodnocení akcií

Hodina 50 Strana 1/14. Gymnázium Budějovická. Hodnocení akcií Hodina 50 Strana /4 Gymnázium Budějovická Volitelný předmět Ekonomie - jednoletý BLOK ČÍSLO 8 Hodnocení akcií Předpokládaný počet : 9 hodin Použitá literatura : František Egermayer, Jan Kožíšek Statistická

Více

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel: NÁHODNÁ ČÍSLA TYPY GENERÁTORŮ, LINEÁRNÍ KONGRUENČNÍ GENERÁTORY, TESTY NÁHODNOSTI, VYUŽITÍ HODNOT NÁHODNÝCH VELIČIN V SIMULACI CO JE TO NÁHODNÉ ČÍSLO? Náhodné číslo definujeme jako nezávislé hodnoty z rovnoměrného

Více

Inovace bakalářského studijního oboru Aplikovaná chemie

Inovace bakalářského studijního oboru Aplikovaná chemie http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Regrese Závislostproměnných funkční y= f(x) regresní y= f(x)

Více

Regresní analýza. Eva Jarošová

Regresní analýza. Eva Jarošová Regresní analýza Eva Jarošová 1 Obsah 1. Regresní přímka 2. Možnosti zlepšení modelu 3. Testy v regresním modelu 4. Regresní diagnostika 5. Speciální využití Lineární model 2 1. Regresní přímka 3 nosnost

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Příklad č. 1 Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Zadání : Stanovení manganu ve vodách se provádí oxidací jodistanem v kyselém prostředí až na manganistan. (1) Sestrojte

Více

Úloha 1. Napište matici pro případ lineárního regresního spline vyjádřeného přes useknuté

Úloha 1. Napište matici pro případ lineárního regresního spline vyjádřeného přes useknuté Úloha 1. Napište matici pro případ lineárního regresního spline vyjádřeného přes useknuté polynomy pro případ dvou uzlových bodů ξ 1 = 1 a ξ 2 = 4. Experimentální body jsou x = [0.2 0.4 0.6 1.5 2.0 3.0

Více

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Studentská 2 461 17 Liberec 1 SEMESTRÁLNÍ PRÁCE STATISTICKÝ ROZBOR DAT Z DOTAZNÍKOVÝCH ŠETŘENÍ Gabriela Dlasková, Veronika Bukovinská Sára Kroupová, Dagmar

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y Xβ ε Předpoklady: Matice X X n,k je matice realizací. Předpoklad: n > k, h(x) k - tj. matice

Více

Korelační a regresní analýza

Korelační a regresní analýza Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK11 Základy ekonometrie Autokorelace Cvičení 5 Zuzana Dlouhá Gauss-Markovy předpoklady Náhodná složka: Gauss-Markovy předpoklady 1. E(u) = náhodné vlivy se vzájemně vynulují. E(uu T ) = σ I n konečný

Více

Regrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly:

Regrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly: Regrese 28. listopadu 2013 Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly: 1. Ukázat, že data jsou opravdu závislá. 2. Provést regresi. 3. Ukázat, že zvolená křivka

Více

Stochastické signály (opáčko)

Stochastické signály (opáčko) Stochastické signály (opáčko) Stochastický signál nemůžeme popsat rovnicí, ale pomocí sady parametrů. Hodit se bude statistika a pravděpodobnost (umíte). Tohle je jen miniminiminiopáčko, později probereme

Více

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D. Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní

Více

Bakalářská práce. Model časové řady počtu nezaměstnaných s ohledem na možné předpovědi

Bakalářská práce. Model časové řady počtu nezaměstnaných s ohledem na možné předpovědi Bakalářská práce Model časové řady počtu nezaměstnaných s ohledem na možné předpovědi Plzeň, 2013 Kateřina Svobodová Prohlášení Prohlašuji, že jsem bakalářskou práci vypracovala samostatně a výhradně s

Více

5 Časové řady. Definice 16 Posloupnost náhodných veličin {X t, t T } nazveme slabě stacionární, pokud

5 Časové řady. Definice 16 Posloupnost náhodných veličin {X t, t T } nazveme slabě stacionární, pokud 5 Časové řady Časovou řadou rozumíme posloupnost reálných náhodných veličin X 1,..., X n, přičemž indexy t = 1,..., n interpretujeme jako časové okamžiky. Někdy však uvažujeme i nekonečné posloupnosti

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOS A SAISIKA Regresní analýza - motivace Základní úlohou regresní analýzy je nalezení vhodného modelu studované závislosti. Je nutné věnovat velkou pozornost tomu aby byla modelována REÁLNÁ

Více

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz POPISNÉ STATISTIKY - OPAKOVÁNÍ jedna kvalitativní

Více

Praktická statistika. Petr Ponížil Eva Kutálková

Praktická statistika. Petr Ponížil Eva Kutálková Praktická statistika Petr Ponížil Eva Kutálková Zápis výsledků měření Předpokládejme, že známe hodnotu napětí U = 238,9 V i její chybu 3,3 V. Hodnotu veličiny zapíšeme na tolik míst, aby až poslední bylo

Více

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické

Více

2011 (datový soubor life expectancy CR.txt). Budeme predikovat vývoj očekávané doby dožití pomocí

2011 (datový soubor life expectancy CR.txt). Budeme predikovat vývoj očekávané doby dožití pomocí Příklady užití časových řad k predikci rizikových jevů 1 Očekávaná doba dožití v ČR Máme k dispozici časovou řadu udávající očekávanou dobu dožití v České republice od roku 1960 do roku 2011 (datový soubor

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie Predikce Multikolinearita Cvičení 4 Zuzana Dlouhá Aplikace EM predikce obecně ekonomické prognózování, předpověď, předvídání hlavním cílem je odhad hodnot vysvětlované proměnné

Více

STATISTICKÝ SOUBOR. je množina sledovaných objektů - statistických jednotek, které mají z hlediska statistického zkoumání společné vlastnosti

STATISTICKÝ SOUBOR. je množina sledovaných objektů - statistických jednotek, které mají z hlediska statistického zkoumání společné vlastnosti ZÁKLADNÍ STATISTICKÉ POJMY HROMADNÝ JEV Statistika pracuje s tzv. HROMADNÝMI JEVY cílem statistického zpracování dat je podání informace o vlastnostech a zákonitostech hromadných jevů: velkého počtu jedinců

Více

REGRESNÍ ANALÝZA NESTACIONÁRNÍCH EKONOMICKÝCH ČASOVÝCH ŘAD

REGRESNÍ ANALÝZA NESTACIONÁRNÍCH EKONOMICKÝCH ČASOVÝCH ŘAD Politická ekonomie 45: (2), str. 281-289, VŠE Praha, 1997. ISSN 0032-3233. (Rukopis) REGRESNÍ ANALÝZA NESTACIONÁRNÍCH EKONOMICKÝCH ČASOVÝCH ŘAD Josef ARLT, Vysoká škola ekonomická, Praha 1. Úvod Pro modelování

Více