Česká zemědělská univerzita v Praze. Provozně ekonomická fakulta. Statistické softwarové systémy projekt

Podobné dokumenty
Vývoj obchodní letecké přepravy cestujících v ČR Časové řady Seminář výpočetní statistiky

Kriminalita. Kriminalita. 1 of :22. Kriminalita - zjištěné případy. Kriminalita - zjištěné případy - nejméně časté typy

Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1

Neuronové časové řady (ANN-TS)

Analýza časových řad pomoci SAS82 for Win

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Statistika pro geografy

Plánování experimentu

Semestrální práce. 2. semestr

4EK211 Základy ekonometrie

Stav Svobodný Rozvedený Vdovec. Svobodná Rozvedená Vdova 5 8 6

Tabulka 1. Výběr z datové tabulky

Daňové příjmy obcí v roce 2007 zaznamenaly nárůst

Uživatelská doumentace

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

8 ANALÝZA ČASOVÝCH ŘAD SEZÓNNÍ SLOŽKA

Simulace. Simulace dat. Parametry

Korelační a regresní analýza

4ST201 STATISTIKA CVIČENÍ Č. 10

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky

Analytické znaky laboratorní metody Interní kontrola kvality Externí kontrola kvality

Úloha 1: Lineární kalibrace

EXPERIMENTÁLNÍ MECHANIKA 2 Přednáška 5 - Chyby a nejistoty měření. Jan Krystek

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Inovace bakalářského studijního oboru Aplikovaná chemie

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

STRUKTURA ZAMĚSTNANÝCH OSOB V ČESKÉ REPUBLICE PODLE ODVĚTVÍ EKONOMICKÉ ČINNOSTI

VYUŽITÍ VYBRANÝCH NOVĚ POSTAVENÝCH CYKLISTICKÝCH KOMUNIKACÍ A UŽÍVÁNÍ CYKLISTICKÝCH PŘILEB

(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.

UNIVERZITA KARLOVA Přírodovědecká fakulta. Hydrometrie. Hodnocení variability odtokového režimu pomocí základních grafických a statistických metod

Informace o bezpečnostní situaci v teritoriu města Příbram ke dni

Informace o bezpečnostní situaci v teritoriu města Příbram ke dni

TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření

Lineární regrese. Komentované řešení pomocí MS Excel

Základy statistiky pro obor Kadeřník

ČVUT FEL X36PAA - Problémy a algoritmy. 4. úloha - Experimentální hodnocení algoritmů pro řešení problému batohu

Informace o bezpečnostní situaci v teritoriu města Příbram ke dni

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

Sociodemografická analýza SO ORP Mohelnice

Optimalizace provozních podmínek. Eva Jarošová

Tvorba grafů v programu ORIGIN

Procento objasněných případů

UNIVERZITA PARDUBICE

4EK211 Základy ekonometrie

Zadání Máme data hdp.wf1, která najdete zde: Bodová předpověď: Intervalová předpověď:

Jednofaktorová analýza rozptylu

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

SPC v případě autokorelovaných dat. Jiří Michálek, Jan Král OSSM,

Směrový průzkum ve městě Boskovice

Doba života LED a LED svítidel a její značení. Jakub Černoch

10. Předpovídání - aplikace regresní úlohy

PRAVDĚPODOBNOST A STATISTIKA

Vývoj cen nájmů bytů v České republice

Kapitola Hlavička. 3.2 Teoretický základ měření

4EK211 Základy ekonometrie

Zadání Vypracujte písemně s využitím paketu ADSTAT a vyřešte 3 příklady. Příklady postavte z dat vašeho pracoviště nebo nalezněte v literatuře. Každý

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných)

Statistika (KMI/PSTAT)

4EK211 Základy ekonometrie

Analýza reziduí gyroskopu

Kalibrace a limity její přesnosti

Tvorba nelineárních regresních modelů v analýze dat

3.5 Ověření frekvenční závislosti kapacitance a induktance

Charakteristika kriminologie, předmět, pojem a význam Stav, struktura a dynamika kriminality Vznik kriminologie, historické směry Uveďte jednotlivé

Společenství prvního stupně ověření norem

Zeměpisná olympiáda 2008

Ilustrační příklad odhadu LRM v SW Gretl

4EK211 Základy ekonometrie

KGG/STG Statistika pro geografy

Vývoj zemědělského půdního fondu ve světě

KALIBRACE A LIMITY JEJÍ PŘESNOSTI. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Popis softwaru VISI Flow

(Pozor, celkový součet je uveden v poloviční velikosti, skutečný počet je kolem ).

Semestrální práce. 3.3 Tvorba nelineárních regresních modelů v analýze dat

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

Dvouvýběrové a párové testy. Komentované řešení pomocí MS Excel

NEZAMĚSTNANOST V JEDNOTLIVÝCH KRAJÍCH ČR V LETECH

DEMOGRAFICKÁ STUDIE MLADÁ BOLESLAV

VYHODNOCENÍ SRÁŽKOVÝCH PŘEDPOVĚDÍ ALADIN A GFS PRO POVODÍ BĚLÉ

PRAVDĚPODOBNOST A STATISTIKA

Semestrální projekt. Vyhodnocení přesnosti sebelokalizace VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. Fakulta elektrotechniky a komunikačních technologií

UNIVERZITA PARDUBICE

Chyby měření 210DPSM

Dynamické metody pro predikci rizika

Makroekonomie I cvičení

B. Analýza podpory VaV z veřejných prostředků

Semestrální práce z předmětu Pravděpodobnost, statistika a teorie informace

Statistické zpracování naměřených experimentálních dat za rok 2012

Náhodná veličina X má Poissonovo rozdělení se střední hodnotou lambda. Poissonovo rozdělení je definováno jako. P(X=k) = 0,036

REE 11/12Z - Elektromechanická přeměna energie. Stud. skupina: 2E/95 Hodnocení: FSI, ÚMTMB - ÚSTAV MECHANIKY TĚLES, MECHATRONIKY A BIOMECHANIKY

(Pozor, celkový součet je uveden v poloviční velikosti, skutečný počet je kolem ).

S E M E S T R Á L N Í

VÝVOJ INDEXŮ SPOTŘEBITELSKÝCH CEN

Metoda Monte Carlo a její aplikace v problematice oceňování technologií. Manuál k programu

Česká republika. Obrázek 1: Přehled o vývoji počtů nově přijímaných žáků v ČR. ročníku SŠ. 1

KRUHOVÝ TEST 4/2018/NIR

MOŽNOSTI VYUŽITÍ STATISTICKÝCH PROGNOSTICKÝCH TECHNIK V KONJUNKTURNÍCH PRŮZKUMECH

Tvorba nelineárních regresních

Transkript:

Česká zemědělská univerzita v Praze Provozně ekonomická fakulta Statistické softwarové systémy projekt Analýza časové řady Analýza počtu nahlášených trestných činů na území ČR v letech 2000 2014 autor: Jindřich Načeradský

OBSAH: 1. Úvod 2. Cíl práce 3. Použitá data 4. Analýza časové řady 4.1. Model reziduí 4.2. Kvalita modelu 4.3. Autokorelace 4.4. Předpovídaný budoucí vývoj 5. Závěr 1

1. Úvod Trestné činy se dějí všude kolem nás, přestože si to nejsme vždy ochotni plně uvědomit. Každý rok je v České republice spácháno tisíce trestných činů a ne všechny tyto skutky jsou nahlášeny na policii. Jak se tato čísla vyvíjela v průběhu posledních let? Jaký bude jejich vývoj v letech budoucích? Odpovědi na tyto otázky by měl nalézt přesně tento projekt. 2. Cíl práce Cílem projektu je analyzovat počet nahlášených trestných činů na území ČR od roku 2000 do roku 2014 a zkoumat jeho vývoj v následujících letech. Pro tyto účely bude využito softwaru SAS, ve kterém bude analyzován zmíněný problém. 2

3. Použitá data Data byla získána z internetové databáze Českého statistického úřadu a doplněna z internetových stránek Policie ČR. Základní tabulka udává počet trestných činů od roku 2000 do roku 2014. Sloupec,,zjištěné trestné činy udává počet nahlášených trestných činů na území ČR ve zmíněných letech. Hodnot je celkem 14. Maximální hodnota byla naměřena v roce 2000 a minimální v roce 2014. zdroje: https://www.czso.cz/csu/czso/ceska republika v cislech od roku 1989 wau52m1y38#14 http://www.policie.cz/statistiky kriminalita.aspx 3

Graficky jsou pak data znázorněna v následujícím grafu. Graf i přes výkyvy postupně klesá. 4

4. Analýza časové řady V programu SAS je použit modul Time Series Forecasting System. Po zadání dat do programu je nutné zvolit optimální model. Díky automatickému výběru je k dispozici několik vhodných modelů, které mají v pravém sloupci uvedenou hodnotu Mean Absolute Percent Error (MAPE), díky které je možné je vzájemně porovnat. Jako nejlepší je zvolen model Lienar (Holt) Exponential Smoothing. Důvodem ke zvolení tohoto modelu je že má nejmenší chybovou hodnotu MAPE oproti ostatním modelům. Pro tvorbu modelu budou použita data z celé časové řady. 5

4.1. Model reziduí Největší rozdíly mezi skutečnou a vyrovnanou hodnotou jsou v letech 2007 a 2013. Největší výkyv činí 20 574 trestných činů, a to právě v roce 2007. V grafu není na první pohled vidět žádná pravidelnost a graf se zdá být nahodilý. Rozložení reziduí kolem nuly se zdá být rovnoměrné. 6

4.2. Kvalita modelu Na obrázku je přehled základních kritérií pro výběr modelu. Odchylka hodnot modelu od původního souboru činí jen 2.69%, což je udáno hodnotou MAPE. Hodnota je menší než 5%, model tudíž velmi kvalitně popisuje minulost. Otázkou však zůstává jestli model správně popíše i budoucnost. Model vystihuje situaci z 82.4%, jak je možné vypozorovat z hodnoty koeficientu determinace, který udává z kolika procent odpovídá matematická funkce modelu zadaným datům. Vysoká hodnota R Square značí kvalitní model. 7

4.3. Autokorelace Autokorelace je jev, který naznačuje kvalitu modelu. Znamená hodnotu závislosti reziduí vůči sobě, kdy každá hodnota koreluje právě s tou předchozí. Výpočty částečné a inverzní autokorelace splňují kritickou mez. V případě prvního výpočtu autokorelace je hodnota na hranici meze, ale je pořád splněna. V případě přesáhnutí kritické meze u jakéhokoliv prvku kromě prvního není model schopen správně definovat daný průběh vztahu a je žádoucí pokusit se autokorelaci zmírnit, například volbou jiného modelu. 8

4.4. Předpovídaný budoucí vývoj Graf předpovídaného budoucího vývoje udává další postupný pokles trestných činů pro další čtyři roky. Graf je omezen na čtyři roky kvůli nepřesnosti dalších předpovědí. Počet trestných činů na další 4 roky by měl zůstat v udávané mezi. Dá se očekávat pokračování celkové klesající tendence s možnými výkyvy. Do přesnosti předpovědi se může dále promítnout nedostatek údajů v časové řadě. 9

V poslední tabulce lze porovnat původní hodnoty s hodnotami předpovídanými a pozorovat o kolik se mezi sebou liší. Stějně tak lze pozorovat rozmezí ve kterém se budou pohybovat předpovídané hodnoty. 10

5. Závěr Počet trestných činů se snižuje. Toto snížení mohou ovlivňovat různé faktory, těch je ale v tomto případě velmi mnoho. Pro určení toho, které faktory mají na toto snížení zásadní vliv by bylo žádoucí výsledky porovnat s jinými statistickými šetřeními, které se přímo a nepřímo podílejí na počtu nahlášených trestných činů v ČR. Jako jedno z témat pro další analýzu by bylo zajímavé určit jakým způsobem se v grafu projevila nebo ještě projeví nedávná amnestie z roku 2013. Jelikož z grafu je možné vypozorovat, že v tom roce byl zaznamenán nárůst trestné činnosti. Další statistiky týkající se kriminality v ČR je možno mimo jiné naleznout na stránkách Českého statistického úřadu, stránkách policie ČR, a také například v projektu mapa kriminality, kde je kriminalita znázorněna na interaktivní mapě ČR. Projekt lze nalézt na stránkách www.mapakriminality.cz. 11