Vysoká škola ekonomická v Praze



Podobné dokumenty
Dynamické metody pro predikci rizika

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

Regresní a korelační analýza

6. T e s t o v á n í h y p o t é z

FAKULTA PODNIKATELSKÁ ÚSTAV MANAGEMENTU FACULTY OF BUSINESS AND MANAGEMENT INSTITUTE OF MANAGEMENT

KGG/STG Statistika pro geografy

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více

Literatura učebnice z minulého semestru Jarošová, Pecáková sbírka příkladů pro statistiku B (2000 a novější)

4EK211 Základy ekonometrie

VÍCEROZMĚRNÝ STATISTICKÝ SOUBOR

ANALÝZA VÝVOJE INDEXŮ BCPP POMOCÍ ČASOVÝCH ŘAD

KGG/STG Statistika pro geografy. Mgr. David Fiedor 4. května 2015

Matematická statistika

Poznámky k předmětu Aplikovaná statistika, 9.téma

Zadání Máme data hdp.wf1, která najdete zde: Bodová předpověď: Intervalová předpověď:

4EK211 Základy ekonometrie

Biostatistika a matematické metody epidemiologie- stručné studijní texty

AVDAT Geometrie metody nejmenších čtverců

DOJÍŽĎKA A VYJÍŽĎKA DO ZAMĚSTNÁNÍ DO/Z HL. M. PRAHY

Česká zemědělská univerzita v Praze. Provozně ekonomická fakulta. Statistické softwarové systémy projekt

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

VYSOKÁ ŠKOLA POLYTECHNICKÁ JIHLAVA Obor Finance a řízení

Semestrální projekt. do předmětu Statistika. Vypracoval: Adam Mlejnek Oponenti: Patrik Novotný Jakub Nováček Click here to buy 2

Časové řady, typy trendových funkcí a odhady trendů

Organizační pokyny k přednášce. Matematická statistika. Přehled témat. Co je statistika?

ANALÝZA DEMOGRAFICKÉHO VÝVOJE OBCE POLICE

5. Maticová algebra, typy matic, inverzní matice, determinant.

4EK211 Základy ekonometrie

Testování hypotéz o parametrech regresního modelu

(Auto)korelační funkce Statistické vyhodnocování exp. dat M. Čada ~ cada

Testování hypotéz o parametrech regresního modelu

Regresní analýza. Eva Jarošová

Časové řady, typy trendových funkcí a odhady trendů

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ

Tomáš Karel LS 2012/2013

MODELOVÁNÍ V EPIDEMIOLOGII

Analýza vývoje ceny na kilometr přepravy v dopravní firmě

MODELY ROZDĚLENÝCH ZPOŽDĚNÍ. FRIEDMANOVA SPOTŘEBNÍ FUNKCE A PERMANENTNÍ DŮCHOD.

Hledání závislostí technologických a nákladových charakteristik při tavení oceli na elektrických obloukových pecích

1. Alternativní rozdělení A(p) (Bernoulli) je diskrétní rozdělení, kdy. p(0) = P (X = 0) = 1 p, p(1) = P (X = 1) = p, 0 < p < 1.

Některé zákony rozdělení pravděpodobnosti. 1. Binomické rozdělení

ACTA UNIVERSITATIS AGRICULTURAE ET SILVICULTURAE MENDELIANAE BRUNENSIS SBORNÍK MENDELOVY ZEMĚDĚLSKÉ A LESNICKÉ UNIVERZITY V BRNĚ

Tomáš Karel LS 2012/2013

Zpracování a vyhodnocování analytických dat

Skalár- veličina určená jedním číselným údajem čas, hmotnost (porovnej životní úroveň, hospodaření firmy, naše poloha podle GPS )

a) Základní informace o souboru Statistika: Základní statistika a tabulky: Popisné statistiky: Detaily

UNIVERSITA PALACKÉHO V OLOMOUCI PŘÍRODOVĚDECKÁ FAKULTA. KATEDRA MATEMATICKÉ ANALÝZY A APLIKACÍ MATEMATIKY školní rok 2009/2010 BAKALÁŘSKÁ PRÁCE

ANALÝZA VYBRANÉ FIRMY POMOCÍ ČASOVÝCH ŘAD

STATISTICA Téma 8. Regresní a korelační analýza, regrese prostá

Rozhodovací stromy a lesy

Statistika II. Jiří Neubauer

Analýza návštěvnosti ubytovacích zařízení v ČR

Regresní analýza nehodovosti na světelně řízených křižovatkách

Ekonometrie. Jiří Neubauer

Analýza rozptylu dvojného třídění

Analýza rozptylu. Přednáška STATISTIKA II - EKONOMETRIE. Jiří Neubauer

Téma je podrobně zpracováno ve skriptech [1], kapitola

Využití statistických metod v medicíně (teorie informace pro aplikace VaV, vícerozměrné metody, atd.)

Vývoj stavebního spoření jako nástroje podpory bydlení

MINISTERSTVO ŠKOLSTVÍ, MLÁDEŽE A TĚLOVÝCHOVY. Učební osnova předmětu MATEMATIKA. pro studijní obory SOŠ a SOU (13 15 hodin týdně celkem)

12. TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

POSOUZENÍ VYBRANÝCH UKAZATELŮ FIRMY POMOCÍ STATISTICKÝCH METOD ASSESSING SELECTED INDICATORS OF A COMPANY USING STATISTICAL METHODS

POROVNÁVÁNÍ VÝSLEDKŮ SČÍTÁNÍ LIDU, DOMŮ A BYTŮ

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Analýza rozptylu. Statistika II. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Ilustrační příklad odhadu LRM v SW Gretl

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

GRAFY A GRAFOVÉ ALGORITMY

Přehled učiva matematiky 7. ročník ZŠ

Lineární regrese. Komentované řešení pomocí MS Excel

VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE. Optimalizace trasy při revizích elektrospotřebičů

Zápočtová práce STATISTIKA I

z dat nasbíraných v letech Ke zpracování dat byl použit statistický software R. Základní model poptávkové funkce, ze kterého vycházíme,

3. Nominální a reálná konvergence ČR k evropské hospodářské a měnové unii

JIHOČESKÁ UNIVERZITA V ČESKÝCH BUDĚJOVICÍCH Ekonomická fakulta DIPLOMOVÁ PRÁCE Bc. Lucie Hlináková

1. Přednáška. Ing. Miroslav Šulai, MBA

HODNOCENÍ VÝVOJE AGRÁRNÍHO ZAHRANIČNÍHO OBCHODU V ČR ASSESMENT OF DEVELOPMENT OF THE CZECH AGRARIAN FOREIGN TRADE.

Gymnázium, Brno. Matice. Závěrečná maturitní práce. Jakub Juránek 4.A Školní rok 2010/11

NEPARAMETRICKÉ TESTY

Analýza časových řad. John Watters: Jak se stát milionářem.

Statistika (KMI/PSTAT)

MONITOR VYBRANÉ HOSPODÁŘSKÉ, MĚNOVÉ A SOCIÁLNÍ UKAZATELE

BAKALÁŘSKÁ PRÁCE. Numerické metody jednorozměrné minimalizace

Statistika - základní informační zdroj ekonomické analýzy

Vliv vzdělanostní úrovně na kriminalitu obyvatelstva

SYSTÉM TECHNICKO-EKONOMICKÉ ANALÝZY VÝROBY TEKUTÉHO KOVU - CESTA KE SNIŽOVÁNÍ NÁKLADŮ

+ ω y = 0 pohybová rovnice tlumených kmitů. r dr dt. B m. k m. Tlumené kmity

MSI LS 2006/2007 Ing. Pavla Hošková, Ph.D., 2. test

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

2 Spojité modely rozhodování

4EK211 Základy ekonometrie

Zhodnocení finančních ukazatelů sektorů obchodu, pohostinství a ubytování

(n, m) (n, p) (p, m) (n, m)

Matice se v některých publikacích uvádějí v hranatých závorkách, v jiných v kulatých závorkách. My se budeme držet zápisu s kulatými závorkami.

zejména Dijkstrův algoritmus pro hledání minimální cesty a hladový algoritmus pro hledání minimální kostry.

Analýza a vyhodnocení. zdravotního stavu. obyvatel. města TŘEBÍČ. Zdravá Vysočina, o.s. ve spolupráci se Státním zdravotním ústavem

ANALÝZA VYBRANÝCH UKAZATELŮ FÚ PRO OLOMOUCKÝ KRAJ POMOCÍ ČASOVÝCH ŘAD

KOMBINATORIKA, PRAVDĚPODOBNOST, STATISTIKA. Charakteristiky variability. Mgr. Jakub Němec. VY_32_INOVACE_M4r0120

Transkript:

Vysoká škola ekonomická v Praze Fakulta informatiky a statistiky Studijní program: Kvantitativní metody v ekonomice Studijní obor: Statistické metody v ekonomii Autor bakalářské práce: Vedoucí bakalářské práce: Evelyn Mayerlová Ing. Karel Helman, Ph.D. ANALÝZA ČASOVÝCH ŘAD POČTU PŘEPRAVOVANÝCH OSOB NA VYBRANÝCH EVROPSKÝCH LETIŠTÍCH školní rok 2013/2014 1

Prohlášení Prohlašuji, že jsem bakalářskou práci zpracovala samostatně a že jsem uvedla všechny použité prameny a literaturu, ze kterých jsem čerpala. V Praze dne. podpis 2

Poděkování Tímto bych chtěla poděkovat svému vedoucímu práce Ing. Karlu Helmanovi, Ph.D. za jeho cenné rady a informace, které mi podal během zpracování bakalářské práce, a za jeho podporu a čas, který mi věnoval. 3

Abstrakt Bakalářská práce se zabývá analýzou měsíčních časových řad počtu přepravovaných osob na třech vybraných evropských letištích (Letiště Václava Havla Praha Ruzyně, Letiště Franze Josefa Strauße Mnichov a Letiště Vídeň Swechat). Práce zkoumá měsíční počty přepravovaných osob v letech 2001-2013. Data byla čerpána z webových stránek Eurostatu, z databází a prostřednictvím přímé komunikace autorky s jednotlivými letišti. Hlavním cílem práce je prozkoumat vývoj těchto časových řad. Pro analýzu použijeme základní popisné charakteristiky časových řad a vybrané základní metody pro modelaci sezónní a trendové složky. Ambicí práce je zjistit, zda se mění počty přepravovaných cestujících v závislosti na měsíci v roce, zda a jakým způsobem se zvyšuje popularita letecké dopravy a porovnat časové řady jednotlivých letišť. Abstract This bachelor thesis is focused on analysis of monthly time series of passengers volume in three selected European airports (Airport Vaclav Havel Prague-Ruzyně, Airport Franz Josef Strauß Munich and Airport Schwechat Vienna). This thesis examines monthly volume data of passengers in 2001-2013 period. The data were collected from the Eurostat web pages, airport databases and by direct communication between the author and the individual airports. The major goal of this thesis is to explore the development of the time series. In the analysis we use basic characteristics of time series and selected basic methods for modelling the trend and seasonal components. The ambition of this thesis is to figure out, if the numbers of transported persons differ in different months of the year,if and how has a popularity of air transport increased and to compare time series of different aiports. 4

Obsah 1. Úvod... 7 1.1 Letecká doprava... 7 2. Přehled základních pojmů a vybraných metod analýzy časových řad... 8 2.1 Časová řada... 8 2.1.1 Klasifikace časových řad... 8 2.1.2 Elementární charakteristiky... 9 2.2 Dekompozice časové řady... 11 2.3 Analýza trendové složky... 12 2.3.1 Regresní přístup k modelování trendu... 13 2.3.2 Trendové funkce... 14 2.3.3 Kritéria pro výběr vhodné trendové funkce... 15 2.3.3.1 Grafická analýza... 15 2.3.3.2 Interpolační kritéria... 16 2.3.3.3 Extrapolační kritéria... 20 2.3.4 Klouzavé průměry... 20 2.4 Analýza sezónní složky... 21 2.4.1 F-test sezónnosti... 22 2.4.2 Sezónní faktory a sezóní očišťování... 22 2.4.2.1 Metoda sezónní dekompozice... 23 2.4.2.2 Regresní metoda modelování sezónnosti... 24 3. Analýza časových řad počtu přepravovaných osob... 25 3.1 Popisná statistika... 26 3.2 Analýza sezónní složky... 28 3.2.1 F-test sezónnosti... 28 3.2.2 Sezónní indexy... 28 3.2.3 Sezónní očišťování... 30 3.3 Analýza trendové složky... 31 3.3.1 Mnichov... 31 3.3.2 Praha... 32 3.3.3 Vídeň... 33 3.4 Regresní metoda modelování sezónnosti... 34 3.5 Předpověď... 37 3.6 Závěr I.... 39 5

4. Analýza časových řad počtu přepravovaných cestujících od roku 2009... 42 4.1 Popisná statistika od roku 2009... 42 4.2 Analýza sezónní složky od roku 2009... 42 4.2.1 F-test sezónnosti od roku 2009... 42 4.2.2 Sezónní indexy od roku 2009... 43 4.2.3 Sezónní očišťování od roku 2009... 44 4.3 Analýza trendové složky od roku 2009... 45 4.3.1 Mnichov... 45 4.3.2 Praha... 46 4.3.3 Vídeň... 47 4.4 Regresní metoda modelování sezónnosti od roku 2009... 48 4.5 Předpověď od roku 2009... 52 5. Závěr II.... 55 6. Literatura... 57 7. Přílohy... 58 7.1 F-test sezónnosti... 58 7.2 Výstupy Eviews... 59 6

1. Úvod Tato bakalářská práce se zabývá analýzou počtu přepravovaných osob na třech vybraných evropských letištích. Analyzovány budou následující letiště: Letiště Václava Havla v Praze, Letiště Franze Josefa Strauße Mnichov a Letiště Vídeň Schwechat. Tato konkrétní letiště patří mezi významná evropská letiště a byla vybrána na základě jejich geografické srovnatelnosti. Práce se bude věnovat analýze měsíčních časových řad. V práci použijeme veškerá existující data. Měsíční časové řady máme kompletní pro letiště v Praze a v Mnichově od začátku roku 2001 do konce roku 2013. Pro vídeňské letiště máme kompletní řadu od začátku roku 2002. Data byla získána z webových stránek Eurostatu, z veřejných databází a také prostřednictvím přímé komunikace s jednotlivými letišti. Obecné informace o vzrůstu letecké dopravy a o letecké dopravě obecně jsme čerpali z ročenek jednotlivých letišť z minulých let, případně z dalších prací a článků nalezených na internetu. Hlavním cílem této práce je zjistit, jaká je podoba obecně známého trendu nárůstu popularity letecké dopravy a zda se počty přepravovaných osob mění v závislosti na měsíci v roce. Chceme také zjistit, jestli byly nějaké měsíce či roky extrémní a proč. Dále se zaměříme na počty odbavených cestujících z jednotlivých letišť a vzájemné hodnoty porovnáme. Na závěr zkusíme určit předpověď počtu přepravených cestujících na první pololetí roku 2014. Pro analýzu vybraných časových řad použijeme základní popisné charakteristiky časových řad a vybrané základní metody pro modelování sezónní a trendové složky. Pro zpracování této analýzy využijeme software Eviews 7.0 a tabulkový procesor MS Excel 2007. Práce je rozdělena do dvou částí. První část je teoretická, obsahuje definice použitých základních popisných charakteristik časových řad a definice základních statistických metod pro modelování sezónní a trendové složky, které jsou v práci použité. V druhé části se budeme věnovat vlastní analýze dat a interpretaci získaných výsledků. V této části jsou taktéž dílčí výsledky ve formě grafů a tabulek. 1.1 Letecká doprava Jedná se o způsob přepravy, který je dostupný ve všech ekonomicky vyspělých zemích a slouží nejen k přepravě osob, ale i k přepravě zboží. Patří mezi nejbezpečnější a nejrychlejší způsoby přepravy. Největší rozmach zaznamenala letecká doprava v 90. letech 20. století. a stala se nenahraditelnou součástí rozvíjejícího se cestovního ruchu. [8] V naší práci se zaměříme pouze na přepravu osob na třech vybraných evropských letištích za období, pro které máme data k dispozici, tedy za období 2001-2013. 7

2. Přehled základních pojmů a vybraných metod analýzy časových řad 2.1 Časová řada Význam analýzy časových řad můžeme vyjádřit například následující větou. Vývoj sledovaného ukazatele v čase je nedílnou součástí řady analýz. Na základě poznání minulosti je možné pochopit zákonitosti v chování sledovaného ukazatele a na jejich základě usuzovat o vývoji ukazatele do budoucnosti [5]. Časová řada je definována jako posloupnost hodnot nějakého ukazatele, které jsou uspořádány v čase směrem z minulosti do budoucnosti. Klasické značení hodnot časovch řad je y t, kde t uvádí časový index nabývající hodnot t = 1,, T, T je tedy počet hodnot (délka) časové řady.[5] Analýzou časových řad nazýváme soubor metod, které slouží k popisu časových řad. Časové řady se mohou zabývat nejrůznějšími ukazateli (např. ekonomickými, fyzikálními či meteorologickými).*3] 2.1.1 Klasifikace časových řad Časové řady můžeme rozdělit podle různých hledisek. Základní druhy časových řad klasifikujeme dle následujících tří, uvedených v [5]: a) rozhodné časové hledisko - intervalové časové řady hodnoty ukazatele se vztahují k určitému časovému úseku, například k jednomu roku např. roční náklady,roční zisk - okamžikové časové řady hodnoty ukazatele se vztahují k určitému časovému okamžiku, například k poslednímu dni v roce např. stav zásob, počet zaměstnanců b) periodicita pozorování - krátkodobé časové řady zachycují sledovaný ukazatel pozorovaný v kratších periodách než je jeden rok např. měsíční, čtvrtletní, týdenní údaje - dlouhodobé časové řady zachycují hodnoty ukazatele v ročních a delších periodicitách c) druh ukazatelů - časové řady primárních ukazatelů - časové řady sekundárních(odvozených) ukazatelů například porovnávajících dvě časová období 8

V této práci budeme analyzovat intervalové časové řady krátkodobého charakteru, jelikož budeme pracovat s měsíčními časovými řadami. V analýze časových řad využijeme hodnot primárních ukazatelů. 2.1.2 Elementární charakteristiky Elementární charakteristiky slouží k prvotní rychlé a orientační představě o charakteru procesu, který konkrétní řada ukazuje. Mezi základní metody patří analýza průběhu časové řady zachyceného v grafu. Z grafu můžeme rozpoznat např. periodicky se opakující jevy, dlouhodobé nebo krátkodobé tendence časové řady apod. Vizuální analýza je ale značně subjektivní, poslouží nám pouze k vytvoření předběžné představy o charakteru časové řady. Na základě této analýzy nemůžeme poznat hlubší souvislosti a mechanismy studovaného procesu, a nemůžeme tudíž přehledně popsat jeho vlastnosti [5]. Další elementární charakteristiky, popsané níže, nám taktéž neposlouží k hlubšímu poznání mechanismu studovaného procesu, ale mají snadnou interpretaci a můžeme je taktéž použít k předběžné orientaci v charakteru časové řady. Elementární charakteristiky dělíme na míry polohy, míry variability a míry dynamiky. a) Míry polohy Mezi míry polohy řadíme prostý aritmetický průměr, který počítáme dle vzorce y = T t=1 y t T 5, (1) Kde T je počet pozorování v analyzovaném období. Prostý aritmetický průměr využijeme k základnímu popisu úrovně ukazatele za sledované období v případě intervalové časové řady. b) Míry variability Mezi míry variability řadíme rozptyl, směrodatnou odchylku a variační koeficient. Tyto míry variability vyjadřují absolutně či relativně kolísání hodnot dané proměnné okolo celkového průměru analyzované časové řady. Jestliže je variabilita nízká, značí to velkou podobnost hodnot v celém souboru. V takovém případě má prostý aritmetický průměr velkou vypovídací schopnost a naopak. 9

Rozptyl je definován jako průměrný čtverec vzdálenosti jednotlivých hodnot od jejich aritmetického průměru a můžeme ho zapsat ve tvaru s t 2 = T t=1 (y t y) 2 T 5 (2) Jelikož je rozptyl vyjádřen ve čtvercích měrných jednotek, jak vyplývá ze vzorce a z definice, nelze jej věcně interpretovat. Z tohoto důvodu uvedeme také směrodatnou odchylku, která je druhou kladnou odmocninou z rozptylu s t = s t 2 = T t=1 (y t y) 2 T 5. (3) Směrodatná odchylka je ve stejných jednotkách jako jednotlivé hodnoty a aritmetický průměr, proto je interpretovatelná lépe než rozptyl. Variační koeficient je mírou relativní variability. Slouží k lepšímu porovnání hodnot při rozdílné úrovni hodnot ve více souborech. Můžeme ho zapsat ve tvaru V t = s t y 5. (4) Jde v podstatě o poměr směrodatné odchylky a aritmetického průměru a obvykle se prezentuje v procentech. Udává pak, z kolika procent se v průměru odchylují jednotlivé hodnoty od aritmetického průměru. c) Míry dynamiky[2] Mezi jednoduché míry dynamiky patří první diference(absolutní přírůstky). Vyjadřují absolutní změnu hodnoty v čase t oproti hodnotě v čase t 1. Počítají se dle vzorce y t = y t y t 1, t = 2, 3,, T (5) Obecně můžeme diference(první, druhé, třetí atd.) použít k předběžnému odhadu trendové funkce při modelování trendu časových řad. Pro příklad uvedeme také vzorec pro výpočet druhých diferencí 2 y t = y t y t 1, t = 3, 4,, T. (6) Mezi další jednoduché míry variability patří průměrný absolutní přírůstek a průměrný koeficient růstu. Tyto míry umožňují charakterizovat základní rysy chování časových řad. Průměrný absolutní přírůstek zapíšeme ve tvaru 10

= y 2 y 1 y 3 y 2 + + y T y T 1 T 1 = T t=2 y t T 1 = y T y 1 T 1. (7) Průměrný koeficient růstu počítáme jako geometrický průměr jednotlivých koeficientů růstu T 1 k = k 2 k 3 k T T 1 = y 2 y 3 y 1 y 2 y T T 1 = y T y T 1 y 1. (8) Jednotlivé koeficienty růstu jsou velmi důležité. Po vynásobení stem nám udávají, na kolik procent hodnoty v čase t 1 vzrostla (případně klesla) hodnota v čase t. Zapíšeme je ve tvaru k t = y t y t 1, t = 2, 3,, T. (9) Koeficienty růstu se používají jednak pro charakterizování dynamiky časové řady, jednak je můžeme použít jako kritérium k nalezení vhodné trendové funkce. [2] 2.2 Dekompozice časové řady Klasická analýza ekonomických časových řad vychází z předpokladu, že časovou řadu y t pro t = 1, 2,, T je možné rozložit až na čtyři složky: trendovou (T t ), cyklickou (C t ), sezónní (S t ) a nesystematickou (a t ). [2] První tři složky se nazývají složkami systematickými, poslední složka nesystematickou. Jednotlivé složky definujeme jak je uvedeno ve [2] a [5] takto: a) trendová složka vyjadřuje dlouhodobou tendenci vývoje zkoumaného jevu. Je výsledkem faktorů, které dlouhodobě působí stejným směrem např. technologie výroby, demografické podmínky, podmínky na trhu apod. b) Cyklická složka vyjadřuje kolísání okolo trendu, ve kterém se střídají fáze růstu a poklesu. Jednotlivé cykly se vytvářejí za období delší než jeden rok a mají nepravidelný charakter, tj. různou délku a amplitudu. c) Sezónní složka vyjadřuje pravidelné kolísání okolo trendu např. v rámci kalendářního roku. Sezónní faktory se opakují každoročně ve stejných obdobích (délka periody je jeden rok či méně) a vznikají v důsledku střídání ročních období nebo vlivem různých institucionalizovaných zvyků, jako jsou např. svátky a dovolené. d) Nesystematická složka vyjadřuje nahodilé a jiné nesystematické výkyvy, ale také chyby měření apod. Nezávislé náhodné vlivy se navzájem zesilují a zeslabují, předpokládáme proto, že jejich celkový vliv je nulový. Nesystematická složka má vlastnosti tzv. procesu bílého šumu, jestliže splňuje předpoklady, že náhodné veličiny a t mají: - nulovou střední hodnotu E(a t ) = 0, - konstantní rozptyl D(a t ) = s a 2, 11

- jsou vzájemně lineárně nezávislé cov(a t a t-k ) = 0 ( neautokorelované) - mají normální rozdělení a t ~ N(0, s 2 a ). Trendová a cyklická složka mohou být přítomné v časových řadách všech typů (roční, čtvrtletní, měsíční, týdenní apod.), oproti tomu sezónní složka se vyskytuje pouze v krátkodobých časových řadách, obvykle v měsíčních a čtvrtletních. Nesystematická složka je přítomná v každé časové řadě. Dekompozice časových řad se v praxi často používá z těchto důvodů [2]: - Analýzou jednotlivých složek časové řady lze odhalit určité zákonitosti vývoje zkoumaného jevu - Můžeme časovou řadu očistit od sezónnosti nebo od trendu - Často umožňuje přesněji určit předpovědi nejen jednotlivých složek, ale také samotné časové řady Podle způsobu vyjádření hodnot časové řady pomocí jednotlivých složek rozlišujeme dvě základní dekompozice[5]: a) Aditivní (součtová) dekompozice y t = T t + C t + S t + a t, kde t = 1, 2,, T (10) Používá se v případě, že variabilita hodnot časové řady je přibližně konstantní v čase. Při aditivní dekompozici jsou jednotlivé složky časové řady ve stejných měrných jednotkách jako původní časová řada. b) Multiplikativní (součinová) dekompozice y t = T t C t S t a t, kde t = 1, 2,, T (11) Používá se v případě, že se variabilita časové řady v čase mění. 2.3 Analýza trendové složky Trendem rozumíme hlavní tendenci dlouhodobého vývoje hodnot analyzovaného ukazatele v čase. Trend může být rostoucí, klesající nebo konstantní, kdy hodnoty ukazatele dané časové řady v průběhu sledovaného období mohou kolísat okolo určité, v podstatě neměnné úrovně.[1] Existují různé přístupy k modelování trendu. Uvedeme dva z nich, jak je popsáno v *2] a [5]: 12

- regresní přístup pomocí toho přístupu můžeme modelovat trend, pokud vývoj časové řady odpovídá určité matematické funkci času např. lineární, kvadratický, hyperbolický. - Klouzavé průměry tuto metodu používáme za předpokladu, je-li vývoj časové řady v důsledku silného vlivu nesystematické složky nerovnoměrný, nebo má extrémní hodnoty. 2.3.1 Regresní přístup k modelování trendu Předpokládáme, že časová řada y t pro t=1, 2,...,T je řadou uspořádaných hodnot v čase t, které získáme měřením určitého ukazatele ve stejně dlouhých časových intervalech t a můžeme ji zapsat ve tvaru y t = T t + a t [2], (12) kde T t je systematická složka a představuje deterministický trend, který lze vyjádřit matematickou funkcí časové proměnné t a a t představuje nesystematickou složku s vlastnostmi procesu bílého šumu. [2] Myšlenka regresního přístupu v rámci modelování trendu spočívá v nalezení vhodné matematické funkce s vysvětlující časovou proměnnou t. Trend můžeme vyjádřit přímkou (lineární), parabolou (kvadratický), hyperbolou, případně dalšími jinými křivkami. Odhad parametrů trendových funkcí Nejčastější metodou pro odhad parametrů trendových funkcí je metoda nejmenších čtverců. Tato metoda je výhodná, jelikož minimalizuje rozptyl reziduální složky, je numericky snadná a navazuje na některá kritéria výběru vhodného modelu trendu, která jsou založena na součtu čtverců reziduí. [3] Touto metodou můžeme přímo získat odhady parametrů pro funkce, které jsou lineární z hlediska parametrů, tj. např. pro lineární a parabolickou trendovou funkci. Co se týče např. jednoduché exponenciální funkce, ta je z hlediska parametrů nelineární, proto můžeme použít metodu nejmenších čtverců až po provedení linearizující transformace, tzn. původní model trendu, který je s hlediska parametrů nelineární, převedeme vhodnou transformací na funkci lineární z hlediska parametrů. Nevýhodou této velmi rozšířené metody je, že nemá dobré statistické vlastnosti. Nedává ani nezkreslené ani konzistentní odhady parametrů, proto je dobré tyto odhady považovat jen za počáteční a postupným zlepšováním řešení získat se zadanou přesností konečný odhad. [3] 13

2.3.2 Trendové funkce Nyní uvedeme tři typy trendových funkcí, které v práci využijeme. Jednotlivé trendové funkce popíšeme tak, jak je uvedeno v [3]: a) Lineární trend Lineární trend je nejčastěji používanou trendovou funkcí. Můžeme jej použít vždy, když chceme alespoň orientačně určit základní směr vývoje časové řady a v určitém omezeném časovém intervalu může sloužit i jako vhodná aproximace jiných trendových funkcí. Lineární trend vyjádříme ve tvaru T t = β 0 + β 1 t, (13) kde β 0 a β 1 jsou neznámé parametry a t = 1, 2,, T Metodou nejmenších čtverců odhadneme neznámé parametry β 0 a β 1. Tato metoda je pro lineární funkci z hlediska parametrů nejlepší, dává totiž nejlepší lineární nevychýlené odhady. Odhady parametrů získané metodou nejmenších čtverců zapíšeme vzorci b 0 = y b 1 t (14) yt yt b 1 = t 2 t 2 (15) Odhad trendové přímky a zde zároveň i odhad hodnoty časové řady v čase t pak zapíšeme ve tvaru b) Parabolický trend Parabolický trend můžeme zapsat v podobě T t = y t = b 0 + b 1 t (16) T t = β 0 + β 1 t + β 2 t 2, (17) kde β 0, β 1 a β 2 jsou neznámé parametry a t = 1, 2,, T Tato trendová funkce je z hlediska parametrů lineární. Vzorce pro odhady parametrů pomocí metody nejmenších čtverců zde již uvádět nebudeme. Odhad parabolického trendu bude mít podobu 14

T t = y t = b 0 + b 1 t + b 2 t 2 (18) c) Polynomy vyšších stupňů V práci také využijeme polynomy vyšších stupňů. Konkrétně polynom třetího stupně (kubický) a čtvrtého stupně (kvartický). Uvedeme rovnice modelů pro jednotlivé polynomy. Kubický polynom Kvartický polynom T t = y t = b 0 + b 1 t + b 2 t 2 + b 3 t 3 (19) T t = y t = b 0 + b 1 t + b 2 t 2 + b 3 t 3 + b 4 t 4 (20) Oba tyto polynomy jsou z hlediska parametrů lineární, tudíž lze parametry β i (kde i = 1, 2,, d) odhadnout metodou nejmenších čtverců. 2.3.3 Kritéria pro výběr vhodné trendové funkce Po odhadnutí modelů trendových funkcí je potřeba vyhodnotit, která z uvažovaných trendových funkcí je pro danou časovou řadu lepší, lépe jí vystihující. Kritéria, podle kterých budeme trendové funkce vyhodnocovat jsou - Grafická analýza a výpočet diferencí - Interpolační kritéria - Extrapolační kritéria 2.3.3.1 Grafická analýza Grafické analýza nám pomůže s prvotní představou o typu vhodného modelu, pomocí kterého budeme trend dále analyzovat. Tato metoda je ale velice subjektivní, proto se nedoporučuje zvolit vhodný trend jen na základě grafické analýzy. Vhodným doplňkem vizuální analýzy průběhu časové řady je analýza prvních diferencí. První diference vyhodnotíme podle následujících kritérií [2]: - jestliže řada prvních diferencí kolísá okolo nuly, volíme konstantní trend. - Jestliže řada prvních diferencí kolísá okolo nenulové konstanty, volíme lineární trend. - Jestliže řada prvních diferencí má přibližně lineární trend a řada druhých diferencí má přibližně konstantní trend, volíme parabolický trend. 15

2.3.3.2 Interpolační kritéria Pomocí interpolačních kritérií hledáme nejvhodnější model trendové funkce na základě analýzy časové řady v minulosti. Zjišťujeme, jak přesně jednotlivé vypočtené modely trendových funkcí vystihují skutečný průběh časové řady tj. zkoumáme charakter rozdílů skutečných hodnot časové řady y t určitého ukazatele a vyrovnaných hodnot y t, resp. odhadnutých hodnot trendu T t. Rozdílům y t y t = y t T t = a t (21) říkáme rezidua a jsou odhadem nesystematické složky a t v čase t = 1, 2,, T. Přesnost vyrovnávání časové řady y t, pro t = 1, 2,, T měříme průměrnými reziduálními charakteristikami, které lze zobecnit pro libovolný model časové řady. [2] Uvedeme dále některé z nejpoužívanějších interpolačních kritérií pro vyhodnocení nejvhodnějšího modelu trendu. a) Index determinace R 2, modifikovaný(upravený) index determinace R 2 adj Index determinace vyjádříme vzorcem R 2 = 1 T t=1 (y t y t ) 2 T t=1 (y t y) 2 < 0,1 > (22) Intepretujeme ho jednoduchým způsobem. Čím je hodnota indexu blíže 1 (nebo 100 %), tím více variability hodnot časové řady je modelem vysvětleno, resp. tím lépe model vystihuje trend časové řady. Naopak čím blíže je 0 (nebo 0 %), tím méně vystihuje model trend časové řady.[2] Problémem indexu determinace je, že závisí na počtu parametrů modelu trendové funkce obecně tak, že čím je v modelu vyšší počet parametrů, tím vyšší je index determinace. Vzhledem k tomuto faktu musíme za účelem porovnání modelů s různým počtem parametrů použít modifikovaný index determinace, který (zohledňuje). Zapíšeme ho ve tvaru vliv počtu parametrů modelu eliminuje 2 R adj = R 2 1 R2 k 1 T k, (23) Kde k je počet parametrů modelu trendové funkce. 16

b) Celkový F-test [2] Pomocí celkového F-testu zjišťujeme, zda je užitečné daný model použít. Testujeme hypotézu o nulových parametrech β 1, β 2,, β i (kromě konstanty β 0 ). Hypotézy zapíšeme ve tvaru H 0 : β 0 = c, β 1 = 0,, β i = 0 H 1 : non H 0 Kde i = 0, 1,, d. Testové kritérium F-testu má pak podobu F = S T k 1, F~F(k 1, T k) (24) Se T k Kde k je počet parametrů a T počet pozorování. S T je tzv. součet teoretických čtverců a S e je tzv. součet reziduálních čtverců. Jednotlivé součty čtverců vypočítáme podle vzorců S T = T t=1 (y t y) 2 (25) T T S e = (y t y t ) 2 2 t=1 = t=1 a t (26) Vyhodnocení tohoto testu je takové, že zamítneme-li na zvolené hladině významnosti H 0 ve prospěch H 1, můžeme konkrétní model považovat jako celek za vhodný. c) MSE střední čtvercová chyba Dle [2] je střední čtvercová chyba nejpoužívanějším kritériem. Patří mezi průměrné charakteristiky reziduí a můžeme ji zapsat ve tvaru: MSE = 1 T T T (y t y t ) 2 = 1 t=1 T t=1. (27) a t 2 V naší práci využijeme charakteristiku RMSE, která je druhou odmocninou z MSE. Jako nejlepší vyhodnocujeme model s nejmenší MSE, resp. RMSE. d) Dílčí t-testy[2] Dílčí t-testy jsou prováděny za účelem zjištění, zda jednotlivé parametry β i (resp. příslušné vysvětlujícíc proměnné) do modelu patří. Chceme zjistit, zda jsou jednotlivé parametry různé od nuly, resp. zda vlivy jednotlivých proměnných v modelu jsou statisticky významné a v modelu je můžeme ponechat. 17

H 0 : β i = 0 H 1 : β i 0 kde i = 0, 1,, d. Testové kritérium dílčích t-testů má tvar t = β i S β i ~t T k, (28) kde β i je odhad parametru modelu trendové funkce, S βi je odhad směrodatné chyby odhadu testovaného parametru. Testové kritérium t je náhodná veličina, která má Studentovo t rozdělení s (T k) stupni volnosti. Kritický obor pro hypotézy dílčích t-testů má podobu t t 1 1 α T k. (29) Jestliže zamítneme nulovou hypotézu ve prospěch alternativní hypotézy, příslušnou vysvětlující proměnnou v modelu ponecháme. Abychom mohli dílčí t-testy a celkový F-test použít jako vyhodnocovací kritérium, musí být splněny požadavky kladené na nesystematickou složku a t uvedené v kapitole 2.2. Zda tomu tak je, se prozkoumá s pomocí reziduí a t, která jsou chápána jako odhad nesystematické složky. Jednou z předpokládaných vlastností nesystematické složky je, aby byla mezi veličinami v čase t a t k, kde k je zpoždění, vzájemná nezávislost požadavek, aby nesystematická složka byla tzv. neautokorelovaná. Tento předpoklad můžeme testovat několika způsoby(např. Durbinův-Watsonův test a reziduální autokorelační funkce). e) Durbinův-Watsonův test (DW) Jak je uvedeno ve [2], Durbinův-Watsonův test prověřuje nepřítomnost autokorelace nesystematické složky prvního řádu. Silnou stránkou tohoto testu je, že přímo zohledňuje, že máme k dispozici pouze hodnoty reziduí a nikoli samotnou nesystematickou složku. H 0 : ρ 1 = 0 autokorelace prvního řadu není, tj. cov a t, a t 1 = 0 H 1 : ρ 1 0 autokorelace kde ρ 1 je testovaný autokorelační koeficient prvního řádu. 18

Testové kritérium Durbinova-Watsonova testu má podobu DW = T t=2 a t a 2 t 1 T 2 t=1 a t 0,4 (30) Rozhodnutí o zamítnutí nebo nezamítnutí testované hypotézy na 5% hladině významnosti záleží na určení kritických hodnot d l a d u, které nalezneme například v literatuře věnující se analýze časových řad. Pokud máme k dispozici kritické hodnoty d l a d u, můžeme provést přesné vyhodnocení na základě tabulky 1. DW Výsledek 4-d l < DW < 4 H 0 se zamítá autokorelace 4-d u < DW < 4-d l Neumíme rozhodnout, je třeba zvýšit T 2 < DW < 4-d u Přijímá se H 0 autokorelace není d u < DW < 2 Přijímá se H 0 autokorelace není d l < DW < d u Neumíme rozhodnout, je třeba zvýšit T 0 < DW < d l H 0 se zamítá autokorelace Tabulka 1 výsledky DW testu[2] Pokud k dispozici kritické hodnoty nemáme, můžeme orientačně určit výsledek testu následovně - Je-li hodnota DW blízko hodnoty 2, nezamítáme H 0 (neprokázali jsme autokorelaci reziduí prvního řádu) - Je-li hodnota DW blízko hodnoty 0 nebo 4, zamítáme H 0 (prokázali jsme autokorelaci reziduí prvního řádu) f) Reziduální autokorelační funkce[2] Autokorelace v řadě y t ve zpoždění k se odhaduje pomocí výpočtu reziduální autokorelační funkce ve tvaru r k = ρ k = T t=k+1(y t y)(y t k y) T t=1 (y t y) 2 (31) kde y je aritmetický průměr. Jestliže je v modelu trendu konstanta, pak je průměr reziduí při odhadu parametrů metodou nejmenších čtverců nulový, tudíž v případě reziduální autokorelační funkce by se vzorec (31) odstraněním průměru zjednodušil. 19

Přístup vyhodnocení autokorelace reziduí s využitím tzv. korelogramu, tj. graf reziduální autokorelační funkce a zobrazuje koeficienty autokorelace reziduí, je plně korektní pouze pro dlouhé časové řady. Pro krátké časové řady se jedná pouze o orientační kritérium (je obtížné zamítnout testovanou hypotézu). V naší práci máme časové řady dostatečně dlouhé na to, abychom autokorelaci reziduí vyhodnotili na základě korelogramu. Na základě reziduální autokorelační funkce můžeme rozhodnout o neautokorelovanosti nesystematické složky, jestliže ani jeden autokorelační koeficient r k nepřekračuje meze 95% intervalu spolehlivosti 2 T, 2 T. 2.3.3.3 Extrapolační kritéria Ověření vhodnosti modelu na základě extrapolačních kritérií spočívá v tom, že časovou řadu y t, pro t = 1, 2,, T rozdělíme na dvě části T = T 1 + T 2. První část řady T 1 slouží k výběru modelu trendu, odhadu jeho parametrů a ověření vhodnosti modelu pomocí interpolačních kritérií. Druhá část, která má délku (T T 1 ) pozorování, pro t = T 1 + 1, T 1 + 2,, T 1 + T 2 = T slouží k určení předpovědi známé skutečnosti a k ověření její přesnosti. Tato kritéria tedy použijeme, pokud chceme ověřit, zda je vybraný model trendové funkce vhodný pro tvorbu předpovědi. Jako představitele extrapolačních kritérií vybereme Chowův předpovědní test, který pracuje na principu popsaném výše. Část T 1 tedy slouží k odhadu modelu trendu a část T 2 ke zjištění, zda je vektor parametrů konstantní: H 0 : vektor β je konstantní H 1 : non H 0 Nulovou hypotézu taktéž můžeme chápat jako neexistenci strukturální změny před a po začátku předpovědního období. Interpretovat můžeme tento test tak, že když zamítneme nulovou hypotézu na hladině významnosti 5%, znamená to, že model není vhodný pro tvorbu předpovědi. 2.3.4 Klouzavé průměry Metody klouzavých průměrů se liší od regresního přístupu tím, že nepředpokládají konstantní parametry trendové funkce v čase. Z tohoto důvodu se klouzavé průměry řadí mezi tzv. adaptivní metody. Tato metoda se zakládá na myšlence, že časovou řadu y t rozdělíme na kratší časové úseky o počtu hodnot 2n + 1, kde n je počet zvolených hodnot z časové řady, na kterých odhadujeme lokální polynomické trendy určitého stupně(např. konstantní nultý stupeň, lineární první stupeň). Postup je následující první část řady má 2n + 1 hodnot, 20

které označujeme y 1, y 2,, y 2n+1, z nich odhadneme parametry lokálního trendu vhodným polynomem a vypočítáme jeho odhad T n+1, stejný polynom odhadneme na druhé skupině hodnot řady y 2, y 3,, y 2n+2 a vypočítáme odhad lokálního trendu T n+2, tímto klouzavým způsobem postupujeme až do konce časové řady.[2] Pokud chceme použít metodu klouzavých průměrů k vyrovnání časové řady, musíme si nejprve zvolit počet hodnot, z nichž budeme klouzavé průměry počítat tzn. délku klouzavé části m hodnot. Platí, že čím větší m zvolíme, tím budeme mít časovou řadu více vyrovnanou. V naší práci se věnujeme zkoumání časových řad se sezónností. V takovém případě se volí délka klouzavé části podle počtu sezón. Při takto zvolené délce klouzavé části dojde také kromě vyhlazení k odfiltrování sezónní složky, po kterém je lépe viditelný odhadovaný trend. Klouzavé průměry dělíme na dva typy: a) Prosté klouzavé průměry Prosté klouzavé průměry požíváme, pokud volíme délku klouzavé části m = 2n + 1, tedy liché číslo. Prosté klouzavé průměry můžeme obecně zapsat ve tvaru: y t = y t n + +y t + +y t+n m (32) Jde v podstatě o výpočet úhrnu příslušné klouzavé části vydělený délkou klouzavé části.[2] b) Centrované klouzavé průměry Centrované klouzavé průměry používáme, pokud volíme délku klouzavé části m = 2n, tudíž sudé číslo. Centrované klouzavé průměry můžeme obecně zapsat ve tvaru: y t = y t n +2y t n +1 + +2y t + +2y t+n 1 +y t+n 2m (33) 2.4 Analýza sezónní složky Pří analýze časových řad s periodicitou kratší než jeden rok se setkáváme téměř vždy s existencí sezónních vlivů, reprezentovaných v modelu časové řady sezónní složkou. [3] Souborem přímých a nepřímých příčin, které se rok co rok pravidelně opakují v důsledku pravidelného koloběhu Země okolo Slunce jsou sezónní vlivy. Výsledkem působení těchto sezónních vlivů na analyzovanou časovou řadu jsou tzv. sezónní faktory, což jsou pravidelné výkyvy zkoumané řady vůči určitému nesezónnímu vývoji řady v průběhu let.[3] 21

Pro analýzu sezónní složky jsou vhodná měsíční neco čtvrtletní data, v naší práci budeme pracovat s daty měsíčními. Přítomnost sezónní složky v časové řadě je většinou viditelná z průběhu časových řad. Pokud si nejsme přítomností sezónní složky jistí, či jako podporu pro náš názor o přítomnosti sezónní složky, můžeme použít pro kontrolu F-test sezónnosti. 2.4.1 F-test sezónnosti Testujeme hypotézu o nepřítomnosti sezónní složky v časové řadě H 0 : časová řada sezónní složku neobsahuje H 1 : časovářada sezónní složku obsahuje Tento test je založen na principu jednofaktorové analýzy rozptylu, kdy třídícím faktorem je sezóna (resp. období, v našem případě kalendářní měsíc). Vyhodnocení F-testu sezónnosti je takové, že pokud zamítneme nulovou hypotézu ve prospěch hypotézy alternativní, znamená to, že v časové řadě je sezónní složka přítomná. 2.4.2 Sezónní faktory a sezóní očišťování Dalším krokem bude v analýze sezónní složky kvantifikace sezónních faktorů a následné očištění analyzované časové řady od sezónní složky. Při modelování sezónní složky při výpočtu sezónních faktorů musíme brát na vědomí, že sezónní faktory se uvádějí v různých jednotkách při předpokladu aditivní nebo multiplikativní dekompozice. a) Aditivní dekompozice Předpokládáme, že aditivní řada obsahuje trendovou a sezónní složku y t = T t + S t + a t a sezónní faktory(v případě aditivní dekompozice se často označují jako sezónní odchylky) se pravidelně opakují a v jednotlivých letech se jejich velikost nemění předpokládáme, že se tyto odchylky v rámci roku vykompenzují; pak platí kde S j je odhad sezónní odchylky v j-té sezónně. j s=1 S j = 0, (34) b) Multiplikativní dekompozice Při multiplikativní dekompozici předpokládáme, že časová řada má tvar y t = T t. S t. a t. Tento předpoklad je vhodný v případě, kdy se sezónní faktory(které se v případě multiplikativní 22

dekompozice často označují jako sezónní indexy) mění přímo úměrně dosažené úrovně trendové složky; pak platí j s=1 S j = s. (35) V naší práci budeme pracovat s měsíčními časovými řadami za předpokladu multiplikativní dekompozice. 2.4.2.1 Metoda sezónní dekompozice Nejstarší metoda pro výpočet odhadu sezónních faktorů se nazývá metoda sezónní dekompozice. Tato metoda pracuje na principu odhadu složek postupně, v jednotlivých krocích(pro každou složku zvlášť).[2] 1. Předpokládá se multiplikativní model časové řady y t = T t. S t. a t (36) 2. Odhadneme trend pomocí centrovaných klouzavých průměrů délky m T t = CKP t (37) 3. Dále odhadneme sezónní a nesystematickou složku SI t = y t T t (38) 4. Poté vypočteme průměrné sezónní indexy (=průměry ze všech odpovídajících si sezón) (Tento vzorec předpokládá roční úplnost měsíčních časových řad) sj = r 1 i=1 SI ij r 1 (39) Kde j = 1,..., s je počet sezón, i = 1,..., r je počet let 5. Vlastní sezónní indexy vypočítáme po úpravě průměrných sezónních indexů s sj = sj / s1s2 ss (40) Tzv. sezónně očištěnou časovou řadu tj. časovou řadu s odfiltrovanou sezónní složku získáme vydělením hodnot původní časové řady příslušnými sezónními indexy. 23

2.4.2.2 Regresní metoda modelování sezónnosti V práci také využijeme výpočet sezónních faktorů pomocí regresní metody modelování sezónnosti. Rozdíl oproti klasické metodě sezónní dekompozice je, že regresní metoda modelování sezónnosti odhaduje všechny parametry modelu současně(=trendovou i sezónní složku v jednom kroku) a předpokládá aditivní dekompozici časové řady y t = T t + S t + a t.[2] Touto metodou počítáme regresní model s umělými nula-jedničkovými proměnnými d jt, kde j = 1, 2,, s, (které přiřazují hodnotě časové řady jedničku, pokud se nachází v uvažované sezóně a nulu jinak), které v modelu představují sezónní složku. Trendovou složku modelujeme klasicky trendovými funkcemi. Např. pro lineární trend ve čtvrtletní časové řadě zvolíme regresní model y t = T t + S t + a t = β 0 + β 1 + δ 1 d 1t + δ 2 d 2t + δ 3 d 3t + a t (41) Je-li v modelu konstanta, pak je umělých proměnných vždy s 1(pokud bychom měli umělých proměnných s, byla by konstanta dokonalou lineární kombinací pomocných proměnných a pro odhad parametrů bychom pak nemohli použít metodu nejmenších čtverců). Nevýhodou této metody je, že nezískáme přímo hodnoty sezónních odchylek. Finální model s odhadnutými velikostmi sezónní složky pro všechny sezóny je třeba dopočítat v následujících krocích: 1. Spočítáme prostý aritmetický průměr(kde d s = 0) odhadnutých regresních parametrů pro pomocné proměnné d = d 1+d 2 + +d s 1 s 2. Velikost sezónních odchylek spočítáme odečtením průměru od jednotlivých hodnot umělých proměnných: s 1 = d 1 d s 2 = d 2 d... (43) s s 1 = d s 1 d s s = d 3. Přepočteme konstantu. Například u lineárního trendu by to vypadalo takto (42) T t = b 0 + d + b 1 t (44) 4. Vypočteme vyrovnané hodnoty a předpovědi. Například čtvrtletní časová řada s lineárním trendem y t = T t + S t = b 0 + d + b 1 t + s 1 d 1t + s 2d 2t + s 3d 3t + s 4 d 4t (45) 24

3. Analýza časových řad počtu přepravovaných osob Druhá část této bakalářské práce se bude zabývat vlastní analýzou časových řad počtu přepravovaných osob na třech vybraných evropských letištích za období, pro která jsou data k dispozici. Jak již bylo zmíněno v úvodu, jednotlivá letiště byla vybrána na základě jejich vzájemné srovnatelnosti z hlediska významu v dané zemi a z pohledu geografické blízkosti. Byla vybrána Letiště Václava Havla v Praze, Letiště Franze Josefa Strauße Mnichov a Letiště Vídeň Schwechat. Letiště Franze Josefa Strauße v Mnichově patří mezi rozlohou největší a nejvytíženější letiště v celé Evropě. Je důležitým spojovacím uzlem mezi dalšími letišti a dalšími destinacemi. Letiště Václava Havla Praha se nachází v hlavním městě České republiky a je také největším letištěm, které se na území České republiky nachází. Pro cestovní ruch v celé České republice a především v Praze je toto letiště nepostradatelnou součástí. Vídeňské letiště Schwechat je podobně jako letiště Václava Havla v Praze nepostradatelnou součástí hlavně pro cestovní ruch ve Vídni. Předpokládáme, že z vybraných letišť bude nejvytíženější letiště v Mnichově. Jelikož je mnichovské letiště největší z našich analyzovaných letišť, očekáváme největší počty přepravených cestujících, největší vyrovnanost v jednotlivých měsících během roku a předpokládáme také vzrůst počtu přepravených cestujících v roce 2014. Jako nejméně vytížené co do počtu přepravených cestujících očekáváme letiště v Praze. Abychom nemuseli vypisovat v každé tabulce a grafu celý název letiště, budeme uvádět zkrácené názvy. Pro Letiště Václava Havla v Praze použijeme Praha, pro Letiště Franze Josefa Strauße Mnichov Mnichov a pro Letiště Vídeň Schwechat Vídeň. V tabulkách budou letiště uspořádaná abecedně. 25

3.1 Popisná statistika V této kapitole se budeme zabývat základními popisnými charakteristikami časových řad. Průměr Rozptyl Směrodatná Variační koeficient odchylka Mnichov 2 616 213 314 162 321 080 560 502 21,4% Praha 857 307 71 988 463 667 268 307 31,3% Vídeň 1 489 338 132 087 865 324 363 439 24,4% Tabulka 1 - míry polohy a míry variability měsíčních časových řad V tabulce 1 vidíme, že za sledované období odbavilo v průměru měsíčně nejvíce cestujících letiště v Mnichově. Toto zjištění odpovídá skutečnosti, že letiště v Mnichově je co do rozlohy největší z analyzovaných letišť. Naopak Praha ve sledovaném období odbavila v průměru měsíčně nejméně cestujících, což jsme také předpokládali, mj. vzhledem k velikosti letiště a důležitosti jakožto spojovacího uzlu mezi dalšími letišti a destinacemi. Z tabulky 1 vidíme, že nejmenší hodnotu směrodatné odchylky má Praha. Směrodatná odchylka je charakteristikou absolutní variability, tudíž není vhodná pro porovnání časových řad s rozdílnou úrovní. Proto použijeme pro porovnání vybraných časových řad variační koeficient, který porovnává relativní variabilitu. Z tabulky 1 vidíme, že nejnižší relativní variabilitu, tj. kolísání měsíčních počtů přepravených osob, má letiště Mnichov, naopak největší relativní variabilitu má letiště Praha. Také časová řada pro Vídeň má z pohledu variačního koeficientu za analyzované období celkem nízkou variabilitu. 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 Mnichov -18 060 19 735 987 12 339 19 756 22 687 22 642-10 701 18 874 34 423 20 126 6 399 12 529 Praha 3 121 8 284 16 214 19 699 7 837 17 713 17 151 1 852 16 499 4 823 8 043 5 516 20 634 Vídeň - 14 379 17 582 16 642 17 202 14 830 28 626 2 660 18 378 21 347 27 322 17 208 20 953 Tabulka 2 Průměrné absolutní přírůstky měsíčních časových 2001-2013 V tabulce 2 jsou uvedeny průměrné absolutní měsíční přírůstky za všechna tři letiště. V tabulce 2 vidíme, že v roce 2001 byl v Mnichově za celý rok průměrný absolutní přírůstek roven hodnotě -18 060, což znamená, že v průměru se měsíčně v roce 2001 absolutně snížil počet odbavených cestujících o tuto hodnotu. I přesto, že jsme tento ukazatel definovali jako přírůstek, může nabývat záporných hodnot, pak je vhodnější hovořit o úbytku. Dále kupříkladu v roce 2010 ve Vídni byla hodnota průměrného měsíčního přírustku 21 347, což ukazuje průměrný měsíční vzrůst počtu cestujících. Takto můžeme interpretovat všechny hodnoty uvedené v tabulce. 26

Nízké hodnoty průměrných absolutních přírůstků v roce 2008 speciálně na pražském a vídeňském letišti jsou trochu zarážející. Jednou z možných interpretací je, že v průběhu roku byly hodnoty počtu přepravovaných cestujících velice podobné. Nenastávaly tak veliké nárůsty a následně poklesy mezi jednotlivými měsíci. Na mnichovském letišti šlo dokonce o průměrný mesíční pokles o 10 701 cestujících. 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 Mnichov 0,988 1,012 1,001 1,007 1,010 1,011 1,010 0,995 1,008 1,015 1,008 1,002 1,005 Praha 1,009 1,022 1,035 1,034 1,012 1,024 1,022 1,002 1,023 1,007 1,012 1,008 1,028 Vídeň - 1,018 1,019 1,017 1,016 1,013 1,022 1,002 1,015 1,016 1,019 1,012 1,014 Tabulka 3 Průměrné koeficienty růstu měsíčních časových řad Interpretace průměrných koeficientů růstu, vypočtených podle (8) je podobná interpretaci průměrných absolutních přírůstků, s tím rozdílem, že vzhledem k relativnímu vyjádření umožňují lepší porovnání různě velkých letišť. Dle dosažených výsledků můžeme například říci, že v Mnichově v roce 2001 byl průměrný meziměsíční koeficient růstu 0,988, což představuje meziměsíční pokles přepravených cestujících v roce 2001 v průměru o 1,2 %. Naopak v roce 2004 v Praze byl průměrný koeficient růstu 1,034 což nám říká, že v průměru meziměsíčně stoupl počet přepravených cestujících o 3,4 %. Pro lepší znázornění kolísání indexů zobrazíme graf průměrných koeficientů růstu. 1,04 1,03 1,02 1,01 1 Mnichov Praha Vídeň 0,99 0,98 Graf 1 průměrné meziměsíční koeficienty růstu v jednotlivých letech 27

3.2 Analýza sezónní složky Přestože přítomnost sezónní složky v měsíčních časových řadách je zřejmá již ze samotného průběhu časové řady, je možné přítomnost sezónních složky také formálně otestovat. K tomuto účelu poslouží výpočet F-testu sezónnosti v softwaru EViews 7.0 za pomoci funkce Census X12. V případě prokázání přítomnosti sezónní složky ji můžeme vyčíslit např. prostřednictvím výpočtu sezónních indexů, které je možné následně využít pro výpočet sezónně očištěné časové řady. 3.2.1 F-test sezónnosti Pro výpočet F-testu s předpokladem multiplikativní dekompozice použijeme časové řady původních zjištěných hodnot. Multiplikativní dekompozici volíme na základě mírně vzrůstající variability hodnot v čase(viz graf 3,4,5). Pro ilustraci si zobrazíme výstup F-testu pro letiště v Praze. Test for the presence of seasonality assuming stability. Sum of Dgrs.of Mean Squares Freedom Square F-Value Between months 76926.9333 11 6993.35757 809.974** Residual 1243.3039 144 8.63405 Total 78170.2372 155 **Seasonality present at the 0.1 per cent level. Tabulka 4 F-test sezónnosti letiště Praha Na základě výstupu můžeme na hladině významnosti 0,1 zamítnout nulovou hypotézu ve prospěch alternativní hypotézy, což znamená, že časová řada sezónní složku dle výsledků tohoto testu obsahuje. 3.2.2 Sezónní indexy Prostřednictvím sezónnních indexů můžeme zjistit zda-li jsou v jednotlivých měsících hodnoty nad nebo pod ročním průměrem hodnot časové řady. V tabulce uvedeme sezónní indexy pro všechna tři letiště. Leden Únor Březen Duben Květen Červen Červenec Srpen Září Říjen Listopad Prosinec Mnichov 0,8208 0,8345 0,9906 0,9919 1,0690 1,0878 1,1230 1,1192 1,1622 1,1025 0,9408 0,8433 Praha 0,7113 0,6963 0,8988 0,9745 1,0779 1,2182 1,3461 1,3685 1,2729 1,0779 0,8478 0,8194 Vídeň 0,7817 0,7669 0,9302 0,9889 1,0854 1,1297 1,2239 1,1937 1,1761 1,0822 0,9080 0,8759 Tabulka 5 - sezónní indexy měsíčních časových řad za období 2001-2013 Interpretovat můžeme jednotlivé indexy následujícím způsobem. Vezmeme-li například index měsíce března v Praze, který má hodnotu 0,8988, můžeme říci, že každý rok je průměrně 28

v měsíci březnu počet přepravených osob z pražského letiště pod ročním průměrem hodnot časové řady o 10,12 %. Naopak v měsíci červenci jsou hodnoty přepravovaných osob ve Vídni průměrně o 22,39 % nad ročním průměrem hodnot časové řady. Takto můžeme interpretovat všechny hodnoty, které byly zjištěny. Z tabulky můžeme vyčíst, že mezi měsíce, kdy jsou počty přepravovaných osob nižší než roční průměr, patří leden, únor, březen, duben, listopad a prosinec. Tuto skutečnost můžeme přičíst k počasí, resp. k dlouhodobým klimatickým podmínkám. Předpokládáme, že hlavním důvodem menšího počtu cestujících je, že do střední Evropy, kde naše tři vybraná letiště leží, lidé cestují především za kulturou. V důsledku chladnějšího počasí tedy klesá hlavně turismus, což způsobuje menší počet přepravených cestujících v těchto měsících. Lidé žijící v Evropě sice cestují do teplejších destinací právě v evropských chladných měsících, ale není to takové množství lidí jako cestujících, hlavně turistů, mířících do evropských kulturních měst v letních měsících. Sezónní ndexy těchto měsíců se pohybují pod hodnotou 1, což značí hodnoty pod ročním průměrem časové řady. Naopak mezi měsíce, kdy hodnoty přepravovaných osob překračují roční průměr časové řady, patří měsíce květen až září. Tato skutečnost platí pro všechna tři letiště. Pro nás zajímavé může být to, že z pražského letiště se nejvíce cestujících odbaví v měsíci srpnu, kdy jsou hodnoty přepravovaných osob o 36,8 % nad průměrem ročního průměru časové řady. Mnichov ani Vídeň takové nárůsty v měsících, kdy letiště odbavilo nejvíce cestujících, nevykazují. Počty cestujících se neliší v závislosti na měsíci v roce tolik jako je tomu v Praze. Pro přehledné znázornění výše popsaných skutečností je výhodné také grafické znázornění dosažených výsledků. 1,4 1,3 1,2 1,1 1 0,9 0,8 0,7 0,6 Mnichov Praha Vídeň Graf 2 sezónní indexy měsíčních časových řad za období 2001-2013 29

3.2.3 Sezónní očišťování Vypočtené sezónní indexy použijeme pro výpočet sezónně očištěných časových řad. Tyto očištěné časové řady dále použijeme pro analýzu trendové složky, které se budeme věnovat v další kapitole. Pro znázornění zobrazíme grafy hodnot původních časových řad a sezónně očištěných časových řad pro všechna letiště. Na ose x jsou uvedeny roky, za které jsou hodnoty naměřeny, osa y udává počet cestujících. 4,000,000 3,600,000 3,200,000 2,800,000 2,400,000 2,000,000 1,600,000 1,200,000 01 02 03 04 05 06 07 08 09 10 11 12 13 MNICHOV MNICHOVSA Graf 3 původní a sezónně očištěná časová řada-mnichov 1,600,000 1,400,000 1,200,000 1,000,000 800,000 600,000 400,000 200,000 01 02 03 04 05 06 07 08 09 10 11 12 13 PRAHA PRAHASA Graf 4 původní a sezónně očištěná časová řada-praha 30

2,400,000 2,200,000 2,000,000 1,800,000 1,600,000 1,400,000 1,200,000 1,000,000 800,000 600,000 01 02 03 04 05 06 07 08 09 10 11 12 13 VIDEN VIDENSA Graf 5 původní a sezónně očištěná časová řada-vídeň 3.3 Analýza trendové složky Tato část bakalářské práce se bude věnovat analýze trendové složky jednotlivých časových řad. Kapitolu rozdělíme do třech částí, každé letiště budeme zkoumat zvlášť. Na základě grafické analýzy odhadneme předběžnou trendovou funkci, která se nám bude zdát jako nejvhodnější. Následně pomocí softwaru Eviews 7.0 vypočítáme hodnoty interpolačních kritérií, podle kterých vyhodnotíme nejvhodnější modely trendu časových řad. Trendy budeme odhadovat s využitím sezónně očištěných časových řad. Nejvhodnější modely trendu časových řad vyhodnotíme pomocí interpolačních kritérií popsaných v teoretické části práce v kapitole 2.3.3.2. 3.3.1 Mnichov Z grafu 3 bychom mohli vyvodit, že řada obsahuje nejspíše lineární trend. Na základě ověřování vhodnosti modelu za pomocí výpočtu prvních diferencí nám také vychází jako nejvhodnější trend lineární. Pro lepší znároznění uvedeme graf prvních diferencí. 110000 90000 70000 50000 30000 10000-10000 -30000-50000 -70000 Graf 6 první diference měsíční časové řady Mnichov 31

Tento předpoklad dále ověříme pomocí interpolačních kritérií, jejichž přehled uvádíme v následující tabulce a uvedeme tabulku s výsledky pro výběr lepšího modelu trendu pro letiště Mnichov. Trend R 2 adj p-hodnota t-testy RMSE DW ACF F-testu Lineární 0,911146 0,000000 0,0000 135740,7 0,492742 autokorelace Parabolický 0,916400 0,000000 0,0000 131237,8 0,527387 autokorelace 0,0013 Tabulka 6 Interpolační kritéria Mnichov Z tabulky 6 můžeme vyhodnotit vhodnější model trendové funkce pro konkrétní časovou řadu. Upravený index determinace má vyšší hodnotu u parabolického trendu,podle p-hodnoty celkového F-testu bychom mohli zvolit oba modely, jelikož u obou na zvolené hladině významnosti 5% zamítáme testovanou hypotézu. Nulové hypotézy dílčích t-testů taktéž zamítáme na hladině významnosti 5%. Na základě kritéria minimálního RMSE bychom opět vybrali parabolický trend. Ke zjištění případné autokorelace reziudí se podíváme na korelogram, který ukazuje, zda autokorelační koeficienty překračují meze intervalu či nikoliv, jak jsme popsali v kapitole 2.3.3.2. Jak můžeme vidět v tabulce 6, prokázali jsme autokorelaci reziduí u obou trendů. Nemůžeme tudíž použít testy o parametrech ani celkový F-test jako vyhodnocovací kritérium tak, jak je naznačeno v předchozím odstavci. V této časové řadě by nepomohlo odstranit autokorelaci ani kdybychom použili pro výpočet trendové funkce vyšší polynom. Nicméně vyšší upravený index determinace a také minimální RMSE ukazují, že jako relativně nejvhodnější model trendové funkce zvolíme trend parabolický. Odhadnutý model pak můžeme zapsat ve tvaru T t = 1 757 209 + 12688,20t 19,11695t 2, kde t = 1,2,, T. 3.3.2 Praha Opět zobrazíme graf prvních diferencí a odhadneme nejvhodnější model pro časovou řadu letiště Praha. Podle grafu prvních diferencí bychom mohli říci, že v očištěné časové řadě se vyskytuje trend parabolický. Opět si náš předpoklad ověříme pomocí interpolačních kritérií. 32