BAKALÁŘSKÁ PRÁCE. Vývoj složení hrubého domácího produktu v České republice UNIVERZITA PALACKÉHO V OLOMOUCI



Podobné dokumenty
EKONOMICKÁ APLIKACE KOMPOZIČNÍHO REGRESNÍHO MODELU

Robust 2014, ledna 2014, Jetřichovice

Aplikace T -prostorů při modelování kompozičních časových řad

4. Aplikace matematiky v ekonomii

Necht tedy máme přirozená čísla n, k pod pojmem systém lineárních rovnic rozumíme rovnice ve tvaru

kompoziční data s aplikací v metabolomice

Teorie informace a kódování (KMI/TIK) Reed-Mullerovy kódy

Alternativní přístup k analýze vícefaktorových dat

Lineární algebra - I. část (vektory, matice a jejich využití)

0.1 Úvod do lineární algebry

Vektory a matice. Obsah. Aplikovaná matematika I. Carl Friedrich Gauss. Základní pojmy a operace

Maticí typu (m, n), kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru:

Matematika (CŽV Kadaň) aneb Úvod do lineární algebry Matice a soustavy rovnic

Management A. Přednášky LS 2018/2019, 2+0, zk. Přednášející: Doc. Ing. Daniel Macek, Ph.D. Ing. Václav Tatýrek, Ph.D.

Klasická a robustní ortogonální regrese mezi složkami kompozice

Popisná statistika kvantitativní veličiny

1 Řešení soustav lineárních rovnic

Úlohy nejmenších čtverců

Předzpracování kompozičních dat

ANALYTICKÁ GEOMETRIE V ROVINĚ

0.1 Úvod do lineární algebry

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

MATICE. a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij]

VI. Maticový počet. VI.1. Základní operace s maticemi. Definice. Tabulku

Eva Fišerová a Karel Hron. Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta Univerzity Palackého v Olomouci.

(Cramerovo pravidlo, determinanty, inverzní matice)

Učební texty k státní bakalářské zkoušce Matematika Skalární součin. študenti MFF 15. augusta 2008

Úvod do lineární algebry

Determinanty. Obsah. Aplikovaná matematika I. Pierre Simon de Laplace. Definice determinantu. Laplaceův rozvoj Vlastnosti determinantu.

Manažerská ekonomika KM IT

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

OE II - MAKROEKONOMIE

Základy maticového počtu Matice, determinant, definitnost

Statistika pro geografy

Obecné, centrální a normované momenty

Matice. Modifikace matic eliminační metodou. α A = α a 2,1, α a 2,2,..., α a 2,n α a m,1, α a m,2,..., α a m,n

Definice 13.1 Kvadratická forma v n proměnných s koeficienty z tělesa T je výraz tvaru. Kvadratická forma v n proměnných je tak polynom n proměnných s

Lineární algebra Operace s vektory a maticemi

6. Vektorový počet Studijní text. 6. Vektorový počet

9 Kolmost vektorových podprostorů

Určeno studentům středního vzdělávání s maturitní zkouškou, předmět Ekonomika, okruh Národní a mezinárodní ekonomika

6 Skalární součin. u v = (u 1 v 1 ) 2 +(u 2 v 2 ) 2 +(u 3 v 3 ) 2

Číselné vektory, matice, determinanty

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.

1 Vektorové prostory.

Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice

11 Analýza hlavních komponet

Lineární zobrazení. 1. A(x y) = A(x) A(y) (vlastnost aditivity) 2. A(α x) = α A(x) (vlastnost homogenity)

příkladů do cvičení. V textu se objeví i pár detailů, které jsem nestihl (na které jsem zapomněl) a(b u) = (ab) u, u + ( u) = 0 = ( u) + u.

B Výdaje za ICT vybavení a služby

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.

Hisab al-džebr val-muqabala ( Věda o redukci a vzájemném rušení ) Muhammada ibn Músá al-chvárizmího (790? - 850?, Chiva, Bagdád),

ANALYTICKÁ GEOMETRIE LINEÁRNÍCH ÚTVARŮ V ROVINĚ

Požadavky k písemné přijímací zkoušce z matematiky do navazujícího magisterského studia pro neučitelské obory

V předchozí kapitole jsme podstatným způsobem rozšířili naši představu o tom, co je to číslo. Nadále jsou pro nás důležité především vlastnosti

I. definice, dělení (hrubý x čistý, národní x domácí, reálný x nominální)

MENDELOVA UNIVERZITA V BRNĚ LDF MT MATEMATIKA VEKTORY, MATICE

MENDELOVA UNIVERZITA V BRNĚ LDF MT MATEMATIKA VEKTORY, MATICE

1 Báze a dimenze vektorového prostoru 1

Regresní analýza 1. Regresní analýza

Cílem této kapitoly je uvedení pojmu matice a jejich speciálních typů. Čtenář se seznámí se základními vlastnostmi matic a s operacemi s maticemi

ČESKÁ ZEMĚDĚLSKÁ UNIVERITA V PRAZE FAKULTA PROVOZNĚ EKONOMICKÁ

transformace je posunutí plus lineární transformace má svou matici vzhledem k homogenním souřadnicím [1]

19 Hilbertovy prostory

Soustavy lineárních rovnic a determinanty

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Lineární algebra : Násobení matic a inverzní matice

Parametrická rovnice přímky v rovině

Inovace bakalářského studijního oboru Aplikovaná chemie

MĚŘENÍ VÝKONU NÁRODNÍHO HOSPODÁŘSTVÍ

Analýza časových řad. John Watters: Jak se stát milionářem.

7 Ortogonální a ortonormální vektory

V: Pro nulový prvek o lineárního prostoru L platí vlastnosti:

a počtem sloupců druhé matice. Spočítejme součin A.B. Označme matici A.B = M, pro její prvky platí:

VYBRANÉ PARTIE Z NUMERICKÉ MATEMATIKY

EXPERIMENTÁLNÍ MECHANIKA 2 Přednáška 5 - Chyby a nejistoty měření. Jan Krystek

Lineární algebra : Metrická geometrie

1 Linearní prostory nad komplexními čísly

1 Determinanty a inverzní matice

12 DYNAMIKA SOUSTAVY HMOTNÝCH BODŮ

Makroekonomické výstupy

Eukleidovský prostor a KSS Eukleidovský prostor je bodový prostor, ve kterém je definována vzdálenost dvou bodů (metrika)

Afinní transformace Stručnější verze

1.4. VEKTOROVÝ SOUČIN

AVDAT Mnohorozměrné metody metody redukce dimenze

MATEMATICKÉ PRINCIPY VÍCEROZMĚRNÉ ANALÝZY DAT

Diferenciální rovnice

Modelování dopadů zemědělského sektoru na národní hospodářství ČR

1 Mnohočleny a algebraické rovnice

Křivky a plochy technické praxe

Matematika. Kamila Hasilová. Matematika 1/34

Soustavy linea rnı ch rovnic

Soustavy. Terminologie. Dva pohledy na soustavu lin. rovnic. Definice: Necht A = (a i,j ) R m,n je matice, b R m,1 je jednosloupcová.

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Matice. Předpokládejme, že A = (a ij ) je matice typu m n: diagonálou jsou rovny nule.

2D transformací. červen Odvození transformačního klíče vybraných 2D transformací Metody vyrovnání... 2

DEFINICE Z LINEÁRNÍ ALGEBRY

8.3). S ohledem na jednoduchost a názornost je výhodné seznámit se s touto Základní pojmy a vztahy. Definice

Vybrané hospodářské, měnové a sociální ukazatele

2 Hlavní charakteristiky v analýze přežití

Transkript:

UNIVERZITA PALACKÉHO V OLOMOUCI PŘÍRODOVĚDECKÁ FAKULTA KATEDRA MATEMATICKÉ ANALÝZY A APLIKACÍ MATEMATIKY BAKALÁŘSKÁ PRÁCE Vývoj složení hrubého domácího produktu v České republice Vedoucí bakalářské práce: RNDr. Karel Hron, Ph.D. Rok odevzdání: 2012 Vypracovala: Věra Balcárková ME, III. ročník

Prohlášení Prohlašuji, že jsem bakalářskou práci zpracovala samostatně pod vedením pana RNDr. Karla Hrona, Ph.D. s použitím uvedené literatury. V Olomouci, dne 30. března 2012

Poděkování Na tomto místě bych chtěla poděkovat především svému vedoucímu bakalářské práce panu RNDr. Karlu Hronovi, Ph.D., že měl se mnou dostatek trpělivosti, aby mi pomohl dovést tuto práci ke zdárnému konci. Také bych ráda poděkovala své rodině a přátelům, kteří mě po celou dobu studia podporovali.

Obsah Úvod 4 1 Hrubý domácí produkt 5 1.1 CoHDPvlastněpředstavuje?... 5 1.2 MetodyodhaduHDP... 6 1.3 ProblémyspojenésodhademHDP.... 7 1.4 PostupodhaduHDP... 8 1.5 PodceňováníanadhodnocováníHDP... 9 1.6 HlavnísložkyHDP.... 10 2 Kompoziční data 11 2.1 Základnípojmy.... 11 2.2 Podmínkyprokompozici... 12 2.3 Aitchisonovageometrie... 14 2.4 Zobrazeníaprácevsouřadnicích... 17 3 Stručný úvod do časových řad 19 4 Potřebné poznatky z lineární algebry 21 5 Mnohorozměrný lineární model 21 6 Použití lineárního modelu při zpracování kompoziční časové řady 25 7 Příklad s reálnými daty 26 7.1 Odhadyvšechzjištěnýchlet... 26 7.2 Odhadposledníhoroku.... 32 Závěr 33 Literatura 34

Úvod V této bakalářské práci bych chtěla čtenáře seznámit s problematikou hrubého domácího produktu a statistickou analýzou jeho vývoje. Hrubý domácí produkt představuje jeden z klíčových makroekonomických ukazatelů a jeho odpovídající ekonomickou a statistickou analýzu považujeme za velmi důležitou. Nejprve se seznámíme s pojmem hrubý domácí produkt(hdp). Ukážeme si, jaksepočítáajakémůžemítformy.zmínímeseioúskalích,kterájsoushrubým domácím produktem spjata. Budeme se zabývat jeho hlavními složkami, z kterých se skládá a se kterými se v běžném životě nejčastěji setkáváme. Tyto složky, respektive jejich hodnoty, použijeme k následné statistické analýze, kdy budeme kvalitu použitého modelu porovnávat s původními daty. V další kapitole si vysvětlíme pojem kompoziční data, která nejvíce využijeme v praktické části, kde pomocí ilr transformace zjistíme, jak se vývoj hrubého domácího produktu v určitých letech projevoval v České republice. Stručně a krátce pronikneme do časových řad. Zmíníme se i o potřebných poznatcích z lineární algebry, které využijeme v navazující kapitole o lineárních statistických modelech. Ty v kontextu časových řad aplikujeme při konstrukci předpovědi HDP s využitím ilr transformace kompozičních dat. Teoretické výsledky budeme nakonec demonstrovat na reálných datech z Českého statistického úřadu. 4

1. Hrubý domácí produkt Vtétokapitolejsemvyužilaliteraturu[4],[6],[7]a[10].Vdnešnídoběvývoj hrubého domácího produktu(hdp) nesledují jenom mezinárodní instituce, finanční trhy, odborná veřejnost, ale můžeme říci, že i laická veřejnost. Někteří vývoj HDP považují za měřítko úspěšnosti vlády, ale ve skutečnosti nám především ukazuje,jakseekonomikavdanézemivyvíjí.nelzetotižříci,žezaúspěchem vývoje ekonomiky stojí pouze vláda. Hrubý domácí produkt je jeden z nejdůležitějších makroekonomických ukazatelů na světě, a proto se každý člověk snadno můžepodívat,kolemjakéhodnotysehdppohybujeunás,aleivrůznýchzemích, protože v dnešní pokročilé době to lze jednoduše zjistit na internetu. 1.1. Co HDP vlastně představuje? - hrubý domácí produkt(hdp) je celkový tok peněžní hodnoty finální produkce vyrobené za určité období, což znamená většinou jeden rok - HDP je souhrnným makroekonomickým agregátem, který vyjadřuje hodnotu zboží a služeb vyrobených nebo poskytnutých na ekonomickém území a je vnímán jako nejsouhrnnějším agregátem výroby - HDP je ukazatel, pomocí kterého se hodnotí tři empirické jevy: vyspělost ekonomiky, intenzita jejího rozvoje a životní úroveň obyvatel Můžemeříci,ženadtímtoukazatelemjenutnosezamyslet,alenadruhou stranu není postačující. Uvedené tři empirické jevy se překrývají, proto je nehodnotíme stejným číslem, neboť nejsou ekvivalentní. U hrubého domácího produktu se nemohou spojovat litry, metry, kusy a další různé jednotky, proto pro tento ukazatel používáme jenom jejich peněžní hodnotu. V průběhu času je cena statků ovlivněna inflací, proto je potřeba rozlišit dva typy HDP,atoreálnýanominální. 5

1)Nominální hrubý domácí produkt je celková peněžní hodnota statků a služeb,vyjádřenávběžnýchcenách,tj.vcenáchobdobí,vněmžjsoudanéstatky a služby vyrobeny, nakupovány a prodávány. 2)Reálný hrubý domácí produkt udává celkovou peněžní hodnotu statků a služeb, vyjádřenou ve stálých(standardizovaných) cenách(v ČR obvykle rok 1993, výchozím rokem může být i předcházející nebo kterýkoliv jiný rok). Proto je možné srovnávat HDP napříč časem. Reálný HDP měří pouze změnu fyzického objemu finální produkce. Ve 30. letech 20. století se měření hrubého domácího produktu považovalo za prakticky neproveditelné. Zásadní průlom přišel se zvýšením vlivu státních financí na chod ekonomiky během 2. světové války. HDP znamená pro dodavatele i uživatele nejsložitější ukazatel, který současná statistika sleduje, protože ho nelze měřit, můžeme ho pouze odhadovat. Odhady mohou být roční, nebo čtvrtletní. Metodologie odhadu se pořád vyvíjí a mění podle institucionálních podmínek a struktury výroby. Měření odhadu hrubého domácího produktu je spojen s jedinou institucí, která podává výlučně bodový odhad, tzn. jediné číslo. U nás se tato instituce nazývá Český statistický úřad. 1.2. Metody odhadu HDP Hrubý domácí produkt odhadujeme pomocí třech způsobů: produkční, výdajová(spotřební) a důchodová metoda. V HDP nezapočítáváme služby, které lidé dělají mimo oficiální trh(např. práce na zahradě, vaření) a ilegální produkce (např. drogy, prostituce, atd.). 1) Produkční(výrobní) metoda U této metody sečteme hodnotu všech finálních statků, vytvořených za dané období na území daného státu. Je to vyrovnávací položka účtu výroby celkem za národní hospodářství, kde se na straně zdrojů zachycuje produkce a na straně užití mezispotřeba(= hodnota statků a služeb, která se v průběhu výrobního 6

procesu zcela nebo částečně spotřebuje). V tomto případě ale hrozí, že se ve výpočtu zahrne vícekrát, a proto se spíše počítá s přidanou hodnotou v jednotlivých fázích výroby. Hrubá přidaná hodnota je rozdíl mezi produkcí a mezispotřebou. 2) Výdajová metoda Touto metodou počítáme výdaje jednotlivých sektorů, které se podílejí na spotřebě statků. Seskupuje spotřební a investiční výdaje na finální nákupy. HDP= C+I+G+X C...spotřebadomácností I...hrubédomácíinvestice G...výdajestátunanákupstatků X...saldoobchodníbilance(export-import) 3) Důchodová metoda V této metodě počítáme s důchody domácností, které jsou vlastníky výrobních faktorů a součet jejich příjmu nám dá národní důchod. HDP dostaneme, když k národnímu důchodu přičteme amortizaci(výdaje na obnovení opotřebeného kapitálu). HDP= w+r+z+i+y+a+n w...hrubémzdy r...renty z...hrubéziskykorporací i...čistýúrok y...příjmyzesamozaměstnání a...amortizace n...nepřímédaně 1.3. Problémy spojené s odhadem HDP Úskalí spojené s odhadem HDP a jeho vývojem je požadavek úplnosti, to znamená, že musíme zachytit tzv. stínovou ekonomiku. Stínová ekonomika je 7

ekonomická aktivita, která není oficiálně podchycena, je to práce, kterou osoba provádí na černo. Vyskytuje se v oblastech, kde je činnost zakázaná, nedostatečně rozvinutá v oficiálních strukturách nebo z důvodu daňového úniku. Stínovou ekonomiku členíme na černou a šedou ekonomiku. - Černá ekonomika představuje kriminální činnost, která je nelegální. Např. pašování drog, obchod se zbraněmi atd. - Šedá ekonomika je legální činnost, ve které dochází k daňovým únikům. Např. práce na černo. S hrubým domácím produktem se také pojí problém zajištění dostatečné kvality jeho odhadu. Nepřesné vyjadřování ohledně různých hodnot národohospodářských agregátů(včetně HDP) žádného statistika nepřekvapí. Je to odraz toho, že veřejnost bere statistikou publikované výsledky státu jako určené i jako neměnné. Užsealenezamýšlínadtím,jaktytohodnotyvůbecvznikajíajakseurčují. 1.4. Postup odhadu HDP Každé čtvrtletí dostáváme z Českého statistického úřadu informace o vývoji národního hospodářství a to pomocí měření tempa růstu HDP. Na jedné straně je to podepřené vývojem spotřeby domácností, investic a čistého vývozu a na druhé straně vývojem přidané hodnoty v jednotlivých odvětvích. Státní statistika prezentuje hodnotu HDP, která není součtem zjištěných nebo naměřených čísel, jako výsledek různých postupů, expertních odhadů, dopočtů a v neposlední řadě i kompromisů. Odhadujeme-li dvěmi odlišnými cestami jedno a to stejné, ve statistice se nikdy nedobereme ke stejnému výsledku, a proto se dělá určitý kompromis. Východiskem pro odhad HDP na straně tvorby je produkce a mezispotřeba, resp. hrubá přidaná hodnota v jednotlivých odvětvích národního hospodářství, a na straně užití je spotřeba domácností, vládních a neziskových institucí, investice a čistý vývoz. Každá země má přesně stanovena pravidla bilancování, které jsou jakoby výrobním tajemstvím statistického úřadu a podle kterých dojde k pravé hodnotě 8

HDP. Tato pravidla musí statistický úřad ctít, respektovat a dodržovat. Odhadovaná hodnota HDP se postupem času zpřesňuje. Revize, neboli kontrola, HDP vychází ze základního problému: buď jednu sestavenou časovou řadu nechat doživotně, tak jak byla poprvé publikována, nebo dříve publikované odhady měnit a tím přepisovat historii. Světová i evropská praxe se v oblasti těchto odhadů HDP více přiklání ke změnám odhadu a tím k přepisování historie. Příčina revizí pochází z protichůdných požadavků: uživatelé požadují spolehlivé informace o vývoji národního hospodářství, ale chtějí je získat rychle. Revize je přirozená oběť ve prospěch včasnosti a kvality dat. Revize statistických údajů se provádí ve všech zemích a jsou nedílnou součástí práce na krátkodobých informacích. Kontrolám podléhají data za předchozí čtvrtletí, ale i data mnohem starší,okteréseužnikdomocnezajímá.pomocítěchtokontrolsemůžemevdaném okamžiku blížit k odhadované skutečnosti. I kvůli tomu je nutné a důležité se s revizemi sžít a nepřeceňovat význam těchto prvních odhadů vývoje HDP. 1.5. Podceňování a nadhodnocování HDP Výsledek odhadu hrubého domácího produktu je neurčitý, protože ho můžeme lehce podhodnotit, nebo zase naopak nadhodnotit. Podcenění, nebo naopak přecenění odhadu HDP způsobuje mylné vnímání reality rozvoje. Má to několik zásadních dopadů pro náš společenský vývoj: 1) Vytváření falešného obrazu země ve světě. 2) Údaje o reálném růstu jako základní veličina ke stanovení míry a směru použití skoro všech nástrojů hospodářské politiky. 3) Investoři do fyzického kapitálu musí brát v úvahu stávající historii růstu jako podklad pro návratnost svých výdajů. 4) Falešný signál o funkčnosti(nefunkčnosti) celého tržního systému a o úspěšnosti restrukturalizace. 9

K podceňování HDP dochází v produkci domácích prací. Dále také dochází k podceňování pomocí stínové ekonomiky, protože jde především o ilegální aktivity, jako např. celní úniky, neúplné vykazování informací o důchodech- s tím spjaté daňové úniky. I v důsledku kvalitativní změny produkce výrobků a služeb taktéž dochází k podceňování HDP, tzn., že zavádění nových výrobků na kvalitativně vyšší úroveň se v měření HDP neprojeví. Nadhodnocování HDP se projevuje u negativních(záporných) externalit, což jsou měřené náklady na odstranění negativních důsledků, které nejsou vyloučeny z výdajů na odstranění škod a vedou k plýtvání přírodními zdroji. Kvůli těmto skutečnostem je potřeba zavést nebo konstruovat ukazatele, jako např.: a) Ukazatel čistého ekonomického blahobytu(new)- zahrnuje HDP, domácí práce, stínovou ekonomiku, kvalitativní změny a hodnotu volného času. Je zde vyloučena negativní hodnota škod na životním prostředí. Tempo růstu tohoto ukazatele je nižší než tempo růstu HDP, protože dochází k rychlejšímu nárůstu škod na životním prostředí. b) Hrubý domácí produkt na jednoho obyvatele- je to vztah mezi dynamikou růstu HDP a dynamikou růstu počtu obyvatel. 1.6. Hlavní složky HDP Každý živý organismus nebo též všechny neživé věci mají své složení, to znamená, že je dělíme na různé(významově se nepřekrývající) složky neboli části. Pokud mluvíme o hrubém domácím produktu, jeho složky rozdělujeme do čtyř hlavních skupin, které si dále vyjmenujeme. 1) Osobní výdaje na spotřebu- sem patří statky krátkodobého užití, statky dlouhodobého užití a služby. 2) Hrubé soukromé domácí investice- sem řadíme fixní investice firem, fixní investice do bytové výstavby, změny stavu zásob. 10

3)Vládnívýdajenanákupstatkůaslužeb-např.veprospěchkultury,školství, zdravotnictví, atd. 4) Saldo obchodní bilance- představuje rozdíl mezi hodnotou vývozu a dovozu. Uvedené skupiny dále členíme na menší úseky, tzv. odvětví. Jedno takové dělení následně uvidíme v tabulce, uvedené v příkladu v poslední kapitole této práce. 2. Kompoziční data Kompoziční data(kompozice) představují kvantitativní popisy částí nějakého celku, nesoucí pouze relativní informaci- speciálně se pak jedná např. o procentuální podíly. Kompoziční data se nejčastěji vyskytují v přírodních a společenských vědách, ale můžeme se s nimi setkat i v mnoha dalších(např. technických) disciplínách. Kompozice můžeme reprezentovat tzv. Aitchisonovou geometrií na simplexu. Pokud chceme aplikovat na kompoziční data standardní statistické metody, musíme je nejdříve vyjádřit jako souřadnice, a to buď vzhledem k ortonormální bázi nebo generujícímu systému na simplexu. Nejprve se ovšem blíže zmíníme o základních pojmech, souvisejících s kompozicemi. Použitá literatura[1] a[11]. 2.1. Základní pojmy Ačkoli pojem kompoziční data se ve statistické literatuře vyskytuje již od konce 19. století, jeho v současnosti nejužívanější význam zavedl na počátku 80. let 20. století statistik John Aitchison. Definice1.Sloupcovývektorx=(x 1,x 2,...,x D ) nazývámed-složkovákompozice, pokud všechny jeho složky jsou kladná reálná čísla, která nesou pouze relativní informaci. Tato definice znamená, že kompoziční datové soubory charakterizují vícerozměrná pozorování s kvantitativně vyjádřenými relativními příspěvky částí na 11

celku (např. měsíční výdaje domácností,...). Většinou používáme procenta, abychom relativní data vyjádřili v interpretované podobě. Zdůrazněme přitom, že jediná relativní informace v datech je obsažena v podílech mezi složkami. Definice 2. Výběrový prostor kompozičních dat je simplex, který se definuje { D S D = x=(x 1,x 2,...,x D ),x i >0,i=1,2,...,D, i=1 x i = k }, kde k představuje součet složek kompozic. Většinou za k volíme 1 nebo 100. Geometricky vzato, pro trojsložkové kompozice simplex vyjadřuje rovnostranný trojúhelník,kterýmávrcholyvbodech A=(k,0,0),B=(0,k,0),C=(0,0,k). Tato skutečnost vede ke grafickému zobrazení kompozic pomocí tzv. ternárního diagramutak,žesložkykompozicep=[p a,p b,p c ]představujípostupněvzdálenost p a odstranyležícíprotivrcholu A,vzdálenost p b odstranyležícíproti vrcholu Bavzdálenost p c odstranyležícíprotivrcholu C. Zmíníme se ještě o pojmech subkompozice a uzávěru kompozice. Definice 3. Pro danou kompozici x, představuje subkompozice(podkompozice) x s sčástí,kterévyberemezpůvodníkompozicepomocípodvektoru(x i1,...,x is ). Subindexy i 1,...,i s námudávají,kterésložkyvpodkompozicijsouvybrány. Definice 4.Uzávěrkompozice x = [x 1,x 2,...,x D ] R D +,x i > 0prokaždé i=1,...,d,jedefinovánjako C(x)= ( k x 1 D i=1 x, i k x 2 D i=1 x,..., i k x D D i=1 x i). 2.2. Podmínky pro kompozici V následujícím textu zmíníme tři podmínky, které by měla vylučovat každá relevantní statistická analýza kompozic, a to invariantnost měřítka, invariantnost permutace a subkompoziční soudržnost. 12

1) Invariantnost měřítka Definice5.DvěD-složkovékompoziceskladnýmireálnýmisložkamix,y R+, D jsoukompozičněekvivalentní,jestližeexistujekladnéčíslo λ R + takové,že x=λ yaekvivalentně C(x)=C(y). Nezávisle na hodnotě λ bychom tak v případě odpovídající statistické analýzy měli dojít ke stejnému výsledku. Definice 6. Funkce f( ) je invariantní na změnu měřítka, jestliže pro každou kladnoureálnouhodnotu λ R + aprokaždoukompozicix S D splňujefunkce vztah f(λx)=f(x),toznamená,žefunkčníhodnotajestejnáprovšechnykompozičně ekvivalentní vektory. 2) Invariantnost permutace Funkce je permutačně invariantní, jestliže dosáhneme ekvivalentních výsledků, pokud změníme pořadí složek v kompozici. Častým postupem pro dosažení regularity varianční matice kompozičních dat s konstantním součtem, je odstranění jedné složky kompozice. Tento postup není ovšem invariantní na permutaci, protože výsledky, které dostaneme, nám do značné míry závisí na vybrané odstraněné složce. Permutace složek přitom informaci obsaženou v kompozici nemění. 3) Podkompoziční soudržnost Poslední důležitou vlastností je podkompoziční soudržnost kompozičních dat. Subkompozice by se měla chovat podobně jako ortogonální projekce v případě standardní reálné analýzy. Speciální informace, kterou získáme z kompozice o D- složkách nesmí být v rozporu s informací, získanou pomocí kompozice o d složkách (d D). Jedním konkrétním důsledkem podkompoziční soudržnosti je skutečnost, že vzdálenost, kterou měříme mezi dvěma kompozicemi, musí být větší než vzdálenost měřená mezi dvěma subkompozicemi; tomuto chování říkáme subkompoziční dominance. 13

2.3. Aitchisonova geometrie V reálném prostoru pracujeme s euklidovskou geometrií, ve které znázorňujeme a interpretujeme naše pozorování. U kompozičních dat je to ale jinak, protože v tomto případě ji nemůžeme použít. Rozdílmezidvěmakompozicemi(5,65,30) a(10,60,30) nenístejnýjakorozdílmezitěmitokompozicemi(50,20,30) a(55,15,30).sicejestejnáeuklidovská vzdálenost,rovna5 2,ameziprvníadruhousložkoujerozdíl5jednotek,aleje rozdílný relativní nárůst. U první kompozice je nárůst 100%, zatímco u druhé je to pouze 10%. Kvůli této skutečnosti nemůžeme pro práci s kompozičními daty použít euklidovskou geometrii a potřebujeme zavést citlivější geometrii, která bude respektovat relativní škálu kompozic. Abychom mohli zavést na simplexu vektorový soubor, musíme nejdříve definovat dvě operace. Jako první je pertubace, která je analogická sčítání v reálném prostoru. A druhou je potom mocninná transformace, která je obdobou násobení skalárem v reálném prostoru. Obě potřebují ve své definici operaci uzávěru, tj. projekci kompozičního vektoru s kladnými složkami na simplex. Následně můžeme zavést také skalární součin, normu a vzdálenost. Díky skalárnímu součinu můžeme ověřovat kolmost kompozic a určovat úhly mezi dvěma kompozičními vektory. Pomocí normy se zase může vypočítat délka kompozice, potažmo vzdálenost mezi kompozicemi. Vše dohromady umožňuje na simplexu pracovat stejným způsobem jako v reálném prostoru. Vznikla nám tak nová geometrie, kterou nazýváme Aitchisonova geometrie. V dalším se podívejme na jednotlivé pojmy podrobněji. Základní operace pro zavedení vektorového prostoru na simplexu jsou pertubace a mocninná transformace. Definice7.Pertubacekompozicex S D kompozicíy S D jekompozice x y=c[x 1 y 1,x 2 y 2,...,x D y D ]. 14

Definice8.Mocninnátransformacekompozicex S D skonstantou α Rje kompozice α x=c[x α 1,x α 2,...,x α D]. Simplex(S D,, )spertubacíamocninnoutransformacítedytvořívektorový prostor. Tento prostor má následující vlastnosti: 1)(S D, )jekomutativnígrupa,např.prox,y,z S D platí: Komutativnívlastnost:x y=y x, Asociativita:(x y) z=x (y z), Neutrálníprvek:n=C[1,1,...,1]=[ 1 D, 1 D,..., 1 D ], Inverzníprvek:x x 1 =n,kdex 1 = C[x 1 1,x 1 2,...,x 1 D ]. Analogicky jako u standardní situace v reálném prostoru budeme psát x y 1 =x y. 2)Mocninnátransformace-prox,y S D a α,β Rplatí: Asociativita: α (β x)=(α β) x, Distributivitazleva: α (x y)=(α x) (α y), Distributivitazprava:(α+β) x=(α x) (β x), Neutrálníprvek:1 x=x. Jako další zavedeme v Aitchisonově geometrii na simplexu skalární součin s přidruženou normou a vzdáleností. Definice9.Skalárnísoučinkompozicx,y S D definujemejako x,y a = 1 2D D i=1 D j=1 ln x i x j ln y i y j. Definice10.Normakompozicex S D sedefinuje 15

x a = 1 D 2D i=1 D j=1 ( ln x ) 2 i = x,x x a. j Definice11.Vzdálenostmezikompozicemixay S D jedefinovánajako d a (x,y)= x y a = 1 D 2D i=1 D j=1 ( ln x i ln y ) 2 i. x j y j Sodkazemnavlastnostisimplexu(S D,, )jakoeuklidovskéholineárního vektorového prostoru o dimenzi D 1, mluvíme celkově o Aitchisonově geometrii na simplexu a speciálně o Aitchisonově vzdálenosti, normě a skalárnímu součinu. Dále bychom si ještě měli představit centrum, matici rozptylů a celkový rozptyl, základní popisné charakteristiky kompozičního datového souboru. Definice 12. Uvažujeme kompoziční datovou matici X o n řádcích a D sloupcích asprvkyx ik.charakteristikapolohyjepotomuzavřenýgeometrickýprůměr(nebo centrum), který definujeme jako g=c(g 1,g 2,...,g D ), kde g i = ( n k=1 x ik )1 n. Definice 13. Disperze kompozice se popisuje pomocí matice rozptylů souřadnicjednotlivýchpodkompozic(x ik,x jk ),i,j=1,...,dak=1,...,n, t 11 t 22... t 1D T t 21 t 22... t 2D =......, t D1 t D2... t DD 16

kde t ijjerozptylsouboru x k ij=ln x ik x jk,k=1,...,n. Definice 14. Celkový rozptyl, neboli míra celkové variability, je dána vztahem totvar(x)= 1 D D D i=1 j=1 t ij. Pokudjehodnota t ij blízkánule,můžemeříci,žepodílmezii-touaj-tou složkoujevelmistabilní.zdefinice13vidíme,žematicet jezřejměsymetrická a má nuly na hlavní diagonále. Její prvky, ale i hodnota celkového rozptylu nezávisínakonstantě k(vizdefinice2) jsoutedyinvariantnínazměnuměřítka. Celkový rozptyl přitom shrnuje matici rozptylů v jednu jedinou hodnotu a matice rozptylů zase vysvětluje, jak se celkový rozptyl dělí mezi složky kompozice. 2.4. Zobrazení a práce v souřadnicích John Aitchison v[1] použil skutečnost, že absolutní hodnoty v případě kompozičních dat nejsou důležité, a proto zavedl transformace, které jsou založené na poměrech. Mezi tyto transformace zahrnujeme tzv. additive logratio(alr) transformaci a centred logratio(clr) transformaci. Alr transformace se dříve užívala pro statistické modelování a clr transformace spíše pro teoretické úvahy. Důvodem bylo, že alr transformace nezachovává Aitchisonovu vzdálenost, zatímco clr transformace ji zachovává, implikuje ovšem singulární varianční matici. Při statistické analýze jsme zvyklí pracovat v ortogonálním systému, který je známý jako kartézský souřadnicový systém. Ani alr transformace, ani clr transformace ovšem nelze asociovat s ortogonálním souřadnicovým systémem, proto se zavádí nová transformace, kterou nazýváme isometric logratio(ilr) transformace(izometrická logratio transformace). Tuto transformaci si nyní rozebereme podrobněji. 17

Ilr transformace Jakmile si zvolíme jednu ortonormální bázi na simplexu vzhledem k Aitchisonově geometrii, např. e i = [ exp ( )] 1 1 i,...,, i(i+1) i(i+1) i+1,0,...,0,i=1,...,d 1 kompozicix S D jemožnévyjádřitvsouřadnicíchx = ( x 1,...,x D 1),tedy D 1 x= x i e i,i=1,...,d 1, i=1 kde x i i= x,e i a = ln i i j=1 x j i+1 x i+1. Funkciilr,přiřazujícíkompozicixsouřadnicex definujemejakozobrazenízs D do R D 1 anazývámeilrtransformace. Ke každé konkrétní volbě ilr transformace můžeme přiřadit i inverzní transformacizr D 1 do S D apomocínízobrazitsouřadnicezpětjakokompozici nasimplexu.vnašempřípadětaktoprosouřadnicex dostanemekompozici x=ilr 1 (x )=(x 1,...,x D ),kde x j =exp Ilr transformace má různé vlastnosti, které vyplývají z izometrie tohoto zobrazení; ( j 1 l=1 x 1 =exp ( D 1 1 x l (D l+1)(d l) x D =exp D x 1 ) D j D j+1 x j, ) ( D 1 ) 1 x l. (D l+1)(d l) l=1,j=2,...,d 1, ilr(α x 1 β x 2 )=α ilr(x 1 )+β ilr(x 2 )=αx 1+βx 2; 18

x 1,x 2 a = ilr(x 1 ),ilr(x 2 ) = x 1,x 2 ; x 1 a = ilr(x 1 ) = x 1,d a (x 1,x 2 )=d(ilr(x 1 ),ilr(x 2 ))=d(x 1,x 2). Zejména si všimněme, že ilr transformace zobrazuje pertubaci a mocninou transformaci kompozic na sčítání vektorů a násobení vektoru číslem a Aitchisonův skalární součin na jeho euklidovský protějšek. Jakmile jsou kompozice zobrazeny v souřadnicích, můžeme s nimi pracovat jako s běžnými reálnými vektory, mimo jiné ji můžeme zpracovat pomocí standardních statistických metod. Práci v souřadnicích lze provádět také tzv. slepým způsobem. Tento způsobspočívávtom,ževyberemevýchozíbáziasouřadnice,apoobdrženívýsledku statistické analýzy v souřadnicích převedeme tento výsledek zpátky na simplex. Obvykle není možné tento přístup použít beze zbytku(např. díky odlišným charakteristikám variability kompozičních dat), v mnoha případech(včetně této práce) je ovšem jeho aplikace výhodná. 3. Stručný úvod do časových řad O časových řadách se v této kapitole zmíníme pouze okrajově, protože se dále budeme zabývat pouze jedním konkrétním případem časové řady. V této kapitole sitakalespoňvysvětlíme,cotočasovéřadyjsouaukážemesi,jakjerozdělujeme. Nejvíce jsem čerpala z literatury[8] a[12]. Pomocí časových řad zapisujeme statistická data, která popisují společenské a ekonomické jevy v čase. Tento zápis nám umožňuje nejenom provádět analýzu v dosavadním průběhu, ale může i vypovídat o vývoji do budoucna. Časová řada je řada hodnot určitého ukazatele, uspořádaná z hlediska přirozené časové posloupnosti. Je nutné, aby věcná náplň ukazatele i jeho prostorové vymezení byly shodné v celém sledovaném časovém úseku. 19

Časové řady dělíme na: I. a) ekvidistantní - pozorování mají stejně dlouhé intervaly b) neekvidistantní - pozorování mají různě dlouhé intervaly II. a) krátkodobé- denní, týdenní, měsíční, čtvrtletní b) dlouhodobé- pouze roční III. a) naturálních ukazatelů- hodnoty jsou v původních jednotkách b) peněžní- původní jednotky převádíme na peníze, aby se nám lépe porovnávalo IV. a) okamžikové - tato řada nám určuje kolik čeho existuje(např. počet zaměstnanců,měnovýkurz,teplota...) -utěchtořadsoučtynedávajísmysl,aleprůměrdává b) intervalové- tady hodnoty závisí na délce intervalu a určují nám kolik čeho vznikloazaniklo(např.produkce,tržby...) - na rozdíl od okamžikových časových řad, součty dávají smysl Časovou řadu rozkládáme i aditivně na jednotlivé její složky. Jedná se o tzv. dekompozici časových řad, a to na složku trendovou, sezónní, cyklickou a náhodnou[8]. My se blíže zmíníme pouze o trendové složce. Trendová složka, neboli trend, vyjadřuje obecnou tendenci dlouhodobého vývoje sledovaného ukazatele včase.tojedůsledkemsil,kterépůsobívestejnémsměru,např.změnyvpopulaci, změny ve výši příjmů obyvatelstva atd. Jestliže je ukazatel po celou dobu sledovaného období téměř na stejné úrovni, mluvíme o časové řadě bez trendu. V tomto kontextu představuje HDP nejčastěji ekvidistantní dlouhodobou peněžní intervalovou časovou řadu. V dalším textu práce se zaměříme na modelování trendové složky této časové řady pomocí lineárních regresních modelů. Ještě než začneme s popisem konkrétního lineárního modelu, zmíníme se o některých potřebných poznatcích z algebry, které využijeme při následném odvozování. 20

4. Potřebné poznatky z lineární algebry V této kapitole si vysvětlíme některé potřebné pojmy, které dále budeme využívat při práci s lineárním modelem. Nejdříve si vysvětlíme, co znamená zkratka vec, potom tenzorový součin a dvě lemmata, které patří do lineární algebry. K těmto poznatkům jsem použila literaturu[5]. Označenívec(A)znamená,žeprvkymaticeAomřádcíchansloupcích uspořádáme do tvaru m n složkového sloupcového vektoru. Obvykle postupujeme tak,žeuspořádámeprvní,druhýaž n-týsloupecmaticeazaseboudo mn složkového sloupcového vektoru. Zavedeme tenzorový součin dvou matic A a B. Definice15.NechťmaticeA={a ij }jetypu m namaticebjetypu r s, paktenzorovýsoučina Bjematiceotypu mr nsvetvaru a 11 B a 12 B... a 1n B a 21 B a 22 B... a 2m B A B:=....... a m1 Ba m2 B...a mm B Lemma1.ProlibovolnématiceAtypu m n,btypu p q,ctypu n uad typu q vplatí (A B)(C D)=(AC) (BD). Lemma 2. Pro libovolné matice A, B, X, jejichž součin AXB existuje, platí vec(axb)=(b A) vec(x). 5. Mnohorozměrný lineární model V této kapitole jsem vycházela z literatury[9]. Teď když už známe všechno potřebné, můžeme si říci něco o jednom konkrétním lineárním modelu, který 21

následně použijeme k modelování trendové složky časové řady HDP. Při využití standardního zápisu jej můžeme zavést jako vec(y) nm [(I m,m X n,k ) vec(b k,m ),Σ m,m I n,n ]. Kdyžuvedenouzávorkurozepíšeme,dostanemeproB=(b 1,...,b m )následující výsledky: X n,k 0... 0 b 1 Xb 1 0 X n,k... 0 b 2 (I m,m X n,k ) vec(b k,m )=....... = Xb 2., 0 0...X n,k b m Xb m kdeb i R k. σ 11 I σ 12 I... σ 1m I σ 21 I σ 22 I... σ 2m I Σ m,m I n,n =....... σ m1 I σ m2 I... σ mm I Jak můžeme vidět, I nám značí jednotkovou matici, vec(b) je sloupcový vektor neznámých parametrů a X, Σ jsou matice o různých typech dle příslušných indexů n,kam,m. Vuvedenémmodelupřitomvec(Y)hrajeroliobservačníhovektoruaI X je matice plánu. Dále předpokládáme, že matice X má plnou sloupcovou hodnost a matice Σ je pozitivně definitní. 22

Číselné charakteristiky Středníhodnota E(Y)=XB,kdeXjematiceonřádcíchaksloupcích abokřádcíchamsloupcích. Varianční matice sloupcového vektoru vec(y) je var[vec(y)] = Σ I. Variančnímaticei-téhořádkumaticeYjevar({Y} i. )=Σ,i=1,...,n, jednotlivé řádky jsou nekorelované. K důkazům následujících vět použijeme Lemma 1, Lemma 2, které jsme si již představili a Lemma 3, které je uvedeno dále. Lemma 3. Pro odhad varianční matice v uvedeném modelu platí kdem X =I X(X X) 1 X. ˆΣ= 1 n k Y M X Y, Věta 1. Pro nejlepší lineární nestranný odhad vektoru vec(b) platí vec( B)=vec[(X X) 1 X Y]. Důkaz: Aplikací vztahu pro odhad neznámých regresních parametrů v lineárním modelusvyužitím(σ I) 1 =Σ 1 Idostaneme vec( B)=[(I X )(Σ 1 I)(I X)] 1 (I X )(Σ 1 I)vec(Y). Všechny závorky roznásobíme dle Lemmatu 1 a obdržíme vec( B=[Σ 1 (X X)] 1 (Σ 1 X )vec(y)= =[Σ (X X) 1 ](Σ 1 X )vec(y). 23

Opětovným využitím Lemmatu 1. dostaneme vec( B= { I [(X X) 1 X ] } vec(y). A konečně aplikací Lemmatu 2 vec( B=vec((X X) 1 X Y). Jako důsledek předchozí věty, dostaneme odhad samotné matice parametrů B, který je určen vztahem B=(X X) 1 X Y. Věta2.Provariančnímaticiodhaduvec( B)platí var[vec( B)]=Σ (X X) 1. Důkaz: Uvedený vztah dokážeme s využitím vlastností varianční matice lineárně transformovaného náhodného vektoru a Lemmatu 1, var[vec( B)]=var( { I [(X X) 1 X ] } vec(y))= = { I [(X X) 1 X ] } (Σ I) { I [X(X X) 1 ] } = =Σ (X X) 1 X X(X X) 1 =Σ (X X) 1. 24

6. Použití lineárního modelu při zpracování kompoziční časové řady Výše zavedeného modelu nyní využijeme pro zpracování časové řady HDP vyjádřeného pomocí příspěvků jednotlivých odvětví, při znalosti údajů za n let a potřeby předpovědi pro(n + 1)-ní rok. V této kapitole jsem použila literaturu [3]. Pro tento účel nejprve upřesníme matici X. Uvažujme, že regresní závislost lze popsat pouze lineární funkcí, proto tato matice bude ve tvaru 1 t 1 1 t 2 X=.., 1 t n kde t 1,...,t n značíjednotlivéroky,vekterýchprobíháměření. Provyjádřeníodhaduvnásledujícímroce t n+1 musímenejdřívezjistitodhad Bapakdosadímedopředpisu p =(1,t n+1 ) B. Protože na HDP, vyjádřené v příspěvcích jednotlivých odvětví, lze pohlížet jako na kompoziční data(spíše než absolutní hodnoty jednotlivých příspěvků nás zajímá jejich relativní podíl na celkovém HDP, viz následující příklad) obdržíme jakovýsledeksledováníčasovéřadykompozičnídatovoumaticix n,d,kterouje nejprvepotřebapřevéstpomocíilrtransformacejejichřádkůnamaticiy n,d 1, abychom následně mohli využít uvedeného lineárního modelu. I když odhady parametrů a vyhodnocení kvality použitého modelu provedeme v souřadnicích, pro lepší interpretovatelnost predikce následujícího roku použijeme inverzní ilr transformaci,tedyp=ilr 1 (p ),analogickytéž,pokudbychompomocímodeluodhadovalisloženíhdpvjednotlivýchletech t 1,...,t n.poznamenejme,že zavedený lineární model lze vyjádřit přímo na simplexu pomocí operací pertu- 25

bace a mocninné transformace, v této práci se ale takovým případem zabývat nebudeme a případného zájemce odkazujeme na literaturu[3]. 7. Příklad s reálnými daty V této kapitole využijeme teoretické poznatky pro odhad složení hrubého domácího produktu pomocí lineárního regresního modelu. Přitom si ukážeme, jak vypadá příslušný odhad varianční matice a směrodatné odchylky odhadů parametrů. 7.1. Odhady všech zjištěných let Nejprve si představíme použitá data. Na internetových stránkách Českého statistického úřadu[2] jsou uvedeny hodnoty složení HDP od roku 1995 až do roku 2009. Tabulka je uvedená v procentech a znázorňuje, jak se různá odvětví podílí na hrubém domácím produktu v České republice. 1995 1996 1997 1998 1999 2000 2001 2002 1 5,0 4,8 4,2 4,2 3,8 3,9 3,9 3,3 2 2,2 2,0 1,9 1,6 1,5 1,5 1,4 1,3 3 24,3 26,3 27,3 25,7 26,6 26,8 26,4 25,4 4 5,3 5,3 3,9 3,9 3,8 3,3 3,7 3,8 5 6,6 8,3 7,5 8,1 7,0 6,5 6,3 6,2 6 11,1 10,0 11,5 11,8 12,0 13,8 13,1 13,6 7 2,8 2,6 2,7 2,5 2,2 2,2 2,0 2,0 8 10,4 10,1 10,5 10,6 10,4 9,8 10,5 11,3 9 3,2 3,2 2,9 3,8 3,5 2,8 3,2 3,1 10 13,6 11,7 11,8 12,5 12,9 13,4 13,3 13,0 11 5,4 5,5 5,3 5,3 5,6 5,4 5,5 5,6 12 4,1 4,2 4,0 3,7 4,0 4,0 4,0 4,1 13 3,5 3,5 3,5 3,5 3,5 3,5 3,7 4,1 14 2,5 2,6 2,9 3,0 3,3 3,1 2,9 3,2 26

2003 2004 2005 2006 2007 2008 2009 1 3,1 3,3 3,0 2,6 2,4 2,5 2,3 2 1,1 1,4 1,4 1,3 1,2 1,5 1,1 3 24,7 26,8 26,3 26,3 26,6 24,7 23,6 4 3,7 3,9 3,9 4,3 4,3 4,8 5,7 5 6,4 6,5 6,3 6,3 6,4 6,6 7,4 6 13,0 11,5 12,8 13,1 12,7 12,9 11,8 7 2,1 2,2 2,0 1,8 1,7 1,8 1,9 8 11,7 10,7 10,0 10,7 10,5 10,5 10,5 9 3,6 3,5 3,0 3,1 3,8 3,7 3,9 10 13,1 13,0 13,7 13,3 13,7 14,2 14,4 11 5,9 5,6 5,8 5,7 5,5 5,5 5,8 12 4,3 4,1 4,3 4,2 4,2 4,1 4,4 13 4,1 4,1 4,1 4,0 3,8 4,0 4,2 14 3,4 3,3 3,3 3,4 3,3 3,1 3,2 První sloupec v tabulce udává kódová čísla, která značí odvětví: 1 Zemědělství, rybolov 2 Dobývání nerostných surovin 3 Zpracovatelský průmysl 4Výrobaarozvodelektřiny,plynuavody 5 Stavebnictví 6 Obchod, opravy motorových vozidel a spotřeba zboží 7 Pohostinství a ubytování 8 Doprava a telekomunikace 9 Peněžnictví a pojišťovnictví 10 Nemovitosti, služby pro podniky, výzkum 11 Veřejná správa; obrana; sociální zabezpečení 12 Školství 13 Zdravotnictví, veterinární a sociální činnosti 14 Ostatní veřejné, sociální a osobní služby Výpočty odhadů provedeme pomocí softwaru R(www.r-project.org) a jeho knihovny robcompositions. Nejdříve si data v tabulce přepíšeme do poznámkového bloku, abychom je mohli v konzolovém okně R následně načíst jako objekt x. Potom použijeme ilr transformaci těchto dat, kterou zadáme do programu jako 27

> y=ilr(x) Dále si nadefinujeme matici X, která vypadá takto: [,1] [,2] [1,] 1 1 [2,] 1 2 [3,] 1 3 [4,] 1 4 [5,] 1 5 [6,] 1 6 [7,] 1 7 [8,] 1 8 [9,] 1 9 [10,] 1 10 [11,] 1 11 [12,] 1 12 [13,] 1 13 [14,] 1 14 [15,] 1 15 Pomocí toho, co jsme si nadefinovali, dokážeme vypočítat odhad B, zadaným vzorcem do konzolového okna >B=solve(t(X)*X)*t(X)*y Hodnoty pro B jsou následující: [,1] [,2] [,3] [,4] [,5] [,6] [,7] [1,] 0.0346 1.0607-1.5593 0.2576-0.3423-0.8467 0.5551 [2,] 0.0523 0.0378 0.0053-0.0014 0.0131-0.0057 0.0373 [,8] [,9] [,10] [,11] [,12] [,13] [1,] -0.7929 0.3966-1.0556-0.4153-0.2104-0.1521 [2,] 0.0073-0.0007 0.0001 0.0061 0.0077 0.0008 PokudvynásobímematiciXaodhadB >ypredict=x*b dostaneme odhady složení HDP v jednotlivých letech(v souřadnicích). Pro vyjádření odhadů jako kompozic provedeme jejich inverzní ilr transformaci >xpredict=invilr(ypredict)* 100 a dostaneme hodnoty, které můžeme porovnat s původním zadáním. 28

Naše odhadnutá data: [,1] [,2] [,3] [,4] [,5] [,6] [,7] [1,] 4.969934 1.892998 26.29331 4.063303 7.264541 11.46920 2.667949 [2,] 4.710682 1.826882 26.25754 4.085768 7.204220 11.59398 2.588667 [3,] 4.463881 1.762652 26.21552 4.107369 7.142684 11.71730 2.511137 [4,] 4.229027 1.700285 26.16748 4.128126 7.080028 11.83918 2.435363 [5,] 4.005631 1.639756 26.11368 4.148056 7.016348 11.95964 2.361346 [6,] 3.793213 1.581040 26.05434 4.167180 6.951733 12.07871 2.289082 [7,] 3.591308 1.524107 25.98968 4.185514 6.886270 12.19641 2.218565 [8,] 3.399461 1.468927 25.91995 4.203079 6.820044 12.31277 2.149785 [9,] 3.217234 1.415468 25.84534 4.219892 6.753134 12.42781 2.082730 [10,] 3.044199 1.363696 25.76608 4.235972 6.685617 12.54155 2.017385 [11,] 2.879945 1.313579 25.68237 4.251336 6.617565 12.65402 1.953734 [12,] 2.724073 1.265079 25.59441 4.266003 6.549050 12.76524 1.891757 [13,] 2.576196 1.218163 25.50240 4.279989 6.480138 12.87524 1.831433 [14,] 2.435945 1.172792 25.40653 4.293313 6.410892 12.98405 1.772740 [15,] 2.302962 1.128931 25.30697 4.305990 6.341373 13.09168 1.715654 [,8] [,9] [,10] [,11] [,12] [,13] [,14] [1,] 10.40242 3.102127 12.30251 5.388207 3.963679 3.441506 2.778315 [2,] 10.43375 3.138150 12.43501 5.418367 3.988922 3.494201 2.823855 [3,] 10.46266 3.173829 12.56592 5.447385 4.013361 3.546850 2.869452 [4,] 10.48922 3.209167 12.69526 5.475287 4.037012 3.599455 2.915109 [5,] 10.51348 3.244172 12.82305 5.502097 4.059892 3.652022 2.960827 [6,] 10.53551 3.278847 12.94933 5.527841 4.082016 3.704553 3.006610 [7,] 10.55538 3.313198 13.07410 5.552541 4.103401 3.757053 3.052462 [8,] 10.57315 3.347233 13.19741 5.576223 4.124064 3.809526 3.098386 [9,] 10.58887 3.380955 13.31927 5.598912 4.144020 3.861976 3.144386 [10,] 10.60262 3.414372 13.43972 5.620630 4.163285 3.914409 3.190466 [11,] 10.61444 3.447490 13.55879 5.641402 4.181877 3.966829 3.236630 [12,] 10.62440 3.480314 13.67649 5.661251 4.199809 4.019241 3.282882 [13,] 10.63255 3.512850 13.79286 5.680199 4.217099 4.071650 3.329227 [14,] 10.63896 3.545106 13.90792 5.698271 4.233760 4.124061 3.375668 [15,] 10.64366 3.577086 14.02170 5.715486 4.249809 4.176480 3.422211 Jednotlivé řádky představují roky a sloupce představují odvětví, ze kterých se HDP skládá. Již pouhým okem je vidět, že odhady poměrně přesně vystihují vývoj časové řady, a to přesto, že jsme se v použitém modelu dopustili mnoha zjednodušení (např. předpokladem nekorelovanosti měření mezi jednotlivými roky.) 29

Dále si ukážeme, jak vypadá odhad varianční matice řádků datové matice Y. Varianční matici dostaneme pomocí Lemmatu 3. Do softwaru R zadáváme příslušný vztah takto: >S=t(y)*(diag(rep(1,nrow(x)))-X*solve(t(X)*X)*t(X))*y/(nrow(X)-ncol(X)) Tato vypočítaná varianční matice nám poslouží k vyjádření směrodatných odchyleksložekvec( B). NejdřívesinadefinujemematiciX XjakomaticiXvynásobenouzlevatransponovanou maticí k X: >XX=solve(t(X)*X) Pakužjenspočítámeodhadydiagonálníchprvkůvar(vec( B)) > varvec=cbind(c(s[1,1]*xx[1,1],s[1,1]*xx[2,2]), + c(s[2,2]*xx[1,1],s[2,2]*xx[2,2]), + c(s[3,3]*xx[1,1],s[3,3]*xx[2,2]), + c(s[4,4]*xx[1,1],s[4,4]*xx[2,2]), + c(s[5,5]*xx[1,1],s[5,5]*xx[2,2]), + c(s[6,6]*xx[1,1],s[6,6]*xx[2,2]), + c(s[7,7]*xx[1,1],s[7,7]*xx[2,2]), + c(s[8,8]*xx[1,1],s[8,8]*xx[2,2]), + c(s[9,9]*xx[1,1],s[9,9]*xx[2,2]), + c(s[10,10]*xx[1,1],s[10,10]*xx[2,2]), + c(s[11,11]*xx[1,1],s[11,11]*xx[2,2]), + c(s[12,12]*xx[1,1],s[12,12]*xx[2,2]), + c(s[13,13]*xx[1,1],s[13,13]*xx[2,2])) Jejich odmocněním dostaneme hledané hodnoty směrodatných odchylek parametrů, >smodch=sqrt(varvec) 30

Výsledné směrodatné odchylky: [,1] [,2] [,3] [,4] [,5] [,6] [1,] 0.029181022 0.065591487 0.032270783 0.08466038 0.048550785 0.044998352 [2,] 0.003209484 0.007214102 0.003549313 0.00931140 0.005339874 0.004949159 [,7] [,8] [,9] [,10] [,11] [,12] [1,] 0.034120147 0.018148165 0.052394841 0.027233610 0.0087600332 0.024168459 [2,] 0.003752716 0.001996032 0.005762664 0.002995298 0.0009634752 0.002658176 [,13] [1,] 0.028882716 [2,] 0.003176675 Směrodatnéodchylkyodhadů B=( b ij )můžemepočítatirelativněvprocentech jako var( b ij ) b ij Výsledné relativní směrodatné odchylky: 100%. [,1] [,2] [,3] [,4] [,5] [,6] [1,] 84.441009 6.183534 2.069583 32.87084 14.18368 5.31428 [2,] 6.132678 19.100824 66.357657 689.25684 40.73997 87.34016 [,7] [,8] [,9] [,10] [,11] [,12] [1,] 6.146532 2.288736 13.21182 2.580016 2.109139 11.48745 [2,] 10.036031 27.176930 869.35014 2514.403412 15.849918 34.71315 [,13] [1,] 18.98702 [2,] 422.60779 Velikosti směrodatných odchylek a relativních směrodatných odchylek udávají, jak přesně jsou hodnoty parametrů odhadnuty. Jak můžeme vidět, vypočtené směrodatné odchylky vyšly vzhledem k počtu pozorování a jim odpovídajícímu počtu proměnných(15 versus 13) většinou malé, proto se můžeme domnívat, že naše odhadnuté hodnoty se od těch skutečných nebudou výrazně lišit. Velké hodnoty relativních směrodatných odchylek přitom zároveň poukazují na nevýznamnost daného regresního parametru. Celkově ovšem můžeme říci, že uvažovaný model dobře charakterizuje vývoj hrubého domácího produktu v jednotlivých letech. 31

7.2. Odhad posledního roku Nakonec zkusíme využít našeho modelu k odhadu složení HDP v roce 2009 ze znalosti jeho složení v předchozích 14 letech. Nejdříve tedy z původní tabulky vyloučíme poslední řádek odpovídající roku 2009. >x1=x[-15,] Tak jako předtím provedeme ilr transformaci, nyní ale pouze u x1. >y=ilr(x1) Dále si nadefinujeme matici X, analogicky jako u minulého příkladu. >X=cbind(rep(1,nrow(x1)),1:nrow(x1)) Vypočítáme odhad B. >B=solve(t(X)*X)*t(X)*y Nakonecspočítámepredikciroku2009,označenoudřívejakop. >ypredict09=t(c(1,15))*b Na tento odhad použijeme inverzní ilr transformaci a vynásobíme 100, abychom dostali v procentech predikci složení HDP pro rok 2009. >xpredict09=invilr(ypredict09)* 100 Odhadnuté hodnoty složení HDP pro rok 2009: [,1] [,2] [,3] [,4] [,5] [,6] [,7] [1,] 2.301223 1.136984 25.84634 3.933244 6.0299 13.51656 1.658816 [,8] [,9] [,10] [,11] [,12] [,13] [,14] [1,] 10.67741 3.475853 13.88705 5.682187 4.198135 4.164157 3.492146 Porovnáním s výchozí tabulkou lze říci, že i v tomto případě charakterizuje vypočtená predikce kvalitně skutečně dosažené hodnoty složení HDP v roce 2009. 32

Závěr Hlavním cílem této práce byla analýza složení HDP pomocí statistických metod, konkrétně teorie kompozičních dat a lineárních modelů. Nejlehčí přitom pro mne bylo psát ekonomickou část o hrubém domácím produktu, protože je to významný makroekonomický ukazatel úrovně našeho dalšího života, což by mělo mladou generaci zajímat. Na druhou stranu se mi nejobtížněji psalo o kompozičních datech, protože jsem sesnimivrámcibakalářskéhostudianesetkala.protojsemsimuselaktomuto tématu nastudovat další materiály, díky kterým jsem si rozšířila obzor a znalosti. V praktické části práce se ukázalo, že přes všechna zjednodušení použitý model velmi dobře charakterizoval zadané reálné hodnoty(bohužel se přes veškerou snahunepodařilozískatúdajeizauplynulédvaroky)alzejejsvelkoupřesností využít i k predikci vývoje složení hrubého domácího produktu, cíl práce se tak podařilo splnit. Doufám, že má bakalářská práce přispěje k dalšímu zkvalitnění modelování vývoje HDP v České republice. 33

Literatura [1] Aitchison, J., The Statistical Analysis of Compositional Data, Chapman and hall, London, 1986. [2] Český statistický úřad[online], dostupné z: http://czso.cz/csu/redakce.nsf/i/crodroku1989[citováno 30. 3. 2012]. [3] Egozcue, J.J., Daunis-i-Estadella, J., Pawlowsky-Glahn, V., Hron, K., Filzmoser, P., Simplicial regression. The normal model, Journal of Applied Probability and Statistics, v tisku, 87-108. [4] Fisher, J., Problémy měření HDP. In: Sborník textů, Centrum pro ekonomiku a politiku, Měříme správně HDP?, 11-20. [5] Harville, David A., Matrix Algebra From a Statistican s Perspective, Springer, New York, 1977. [6] Hindls, R., Hronová, S., Poznámky k měření HDP. In: Sborník textů, Centrum pro ekonomiku a politiku, Měříme správně HDP?, 69-72. [7] Janáčková, S., HDP je nedokonalý ukazatel. In: Sborník textů, Centrum pro ekonomiku a politiku, Měříme správně HDP?, 21-27. [8] Kropáč, J., Statistika B, VUT, Brno, 2007. [9] Kubáček, L., Multivariate Statistical Models Revisited, VUP, Olomouc, 2008. [10] Odbor ročních národních účtů, Zdroje, metody a výpočty hrubého domácího produktu 1998, Praha, Český statistický úřad, 2001. [11] Pawlowsky-Glahn, V., Egozcue, J.J., Tolosana-Delgado, R., Lecture Notes on Compositional Data Analysis [online], dostupné z: http://hdl.handle.net/10256/297,[citováno dne 30. 3. 2012] [12] Seger, J., Hindls, R., Statistické metody v tržním hospodářství, Victoria Publishing, Praha, 1995. 34