M praktikum : M0130pr03

Podobné dokumenty
M cvičení : GLM03a (The Working Activities of Bees)

RNDr. Marie Forbelská, Ph.D. 1

M cvičení : GLM04b (Vztah mezi Poissonovým a

M cvičení : M6120cv02 (Práce s daty v R)

Pracovní text a úkoly ke cvičením MF002

M praktikum : M0130pr07 (Modely lokálního postupného trendu)

M cvičení : GLM01a (Toxic Chemical Production Data)

velkou variabilitou: underdispersion, overdispersion)

Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze

Úkol 12. Přemysl Bejda. 22. března SAS slouží pro statistiky, jeho využití není příliš flexibilní, protože v něm nelze psát vlastní procedury.

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica

Testy nezávislosti kardinálních veličin

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

2011 (datový soubor life expectancy CR.txt). Budeme predikovat vývoj očekávané doby dožití pomocí

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

4EK211 Základy ekonometrie

Základní popisné statistiky a grafy

Lineární regrese. Komentované řešení pomocí MS Excel

Opravená data Úloha (A) + (E) Úloha (C) Úloha (B) Úloha (D) Lineární regrese

Základní popisné statistiky a grafy

Popisná statistika. Komentované řešení pomocí MS Excel

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Popisná statistika. Komentované řešení pomocí programu R. Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze

Diagnostika regrese pomocí grafu 7krát jinak

Národníinformačnístředisko pro podporu jakosti

Regresní analýza. Eva Jarošová

Analýza časových řad pomoci SAS82 for Win

(Poslední změna: 14. dubna 2018)

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Textové popisky. Typ dat

M cvičení : GLM01b (Porodní hmotnost novorozenců)

8. lekce Úvod do jazyka C 3. část Základní příkazy jazyka C Miroslav Jílek

Časové řady, typy trendových funkcí a odhady trendů

Statistická analýza jednorozměrných dat

Časové řady, typy trendových funkcí a odhady trendů

Testování předpokladů pro metodu chain-ladder. Seminář z aktuárských věd Petra Španihelová

otec syn

Návrh a vyhodnocení experimentu

Odhad parametrů N(µ, σ 2 )

Kreslení grafů v Matlabu

Cvičení ze statistiky - 3. Filip Děchtěrenko

O čem bych tu rád povídal...

Metoda Monte Carlo a její aplikace v problematice oceňování technologií. Manuál k programu

KORELACE. Komentované řešení pomocí programu Statistica

6. Lineární regresní modely

Návrh a vyhodnocení experimentu

Tutoriál programu ADINA

Analýza dat na PC I.

Cvičení z biostatistiky 06

Regresní analýza 1. Regresní analýza

Odhad - Problémy se sdruženým rozdělením pravděpodobnosti

4EK211 Základy ekonometrie

Stavový model a Kalmanův filtr

4EK211 Základy ekonometrie

Tematický celek Proměnné. Proměnné slouží k dočasnému uchovávání hodnot během provádění aplikace Deklarace proměnných

Cvičení z biostatistiky 03

Grafy relací s absolutními hodnotami

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

PRAVDĚPODOBNOST A STATISTIKA

SEMESTRÁLNÍ PRÁCE Z X37SAS Zadání č. 7

Návod pro práci s SPSS

Časové řady - Cvičení

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Pohlédněte si základní charakteristiky polohy jednotlivých veličin pomocí funkce summary.

1. lekce. do souboru main.c uložíme následující kód a pomocí F9 ho zkompilujeme a spustíme:

Příklady k druhému testu - Matlab

Národní informační středisko pro podporu kvality

Metodologie pro Informační studia a knihovnictví 2

1. Uživatelská úprava příkazů II.

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Stručný návod k programu Octave

UNIVERZITA PARDUBICE. Fakulta elektrotechniky a informatiky. Data mining a project R Martina Kršíková

StatSoft Jak vyzrát na datum

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Nadstavba pro statistické výpočty Statistics ToolBox obsahuje více než 200 m-souborů které podporují výpočty v následujících oblastech.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

PRAVDĚPODOBNOST A STATISTIKA

Protokol č. 1. Tloušťková struktura. Zadání:

Datový soubor X1 1, 5, 7, 8, 9, 10, 11, 12, 12.5, 13, 14, 15, 16, 17, 18, 20, 24

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA Sylabus pro předmět STATISTIKA Pomůcky... 7

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Bodové a intervalové odhady parametrů v regresním modelu

Metodologie pro Informační studia a knihovnictví 2

1. Téma 03 - Rozhodování

Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných)

RNDr. Marie Forbelská, Ph.D. 1

Vzorová prezentace do předmětu Statistika

1. lekce. do souboru main.c uložíme následující kód a pomocí F9 ho zkompilujeme a spustíme:

Hodnocení soutěžních úloh

4EK211 Základy ekonometrie

Měření závislosti statistických dat

Jednofaktorová analýza rozptylu

Stochastické signály (opáčko)

Velmi stručný návod jak dostat data z Terminálu Bloomberg do R

Cvičení 11. Klasifikace. Jan Přikryl. 14. března 2018 ČVUT FD

Zadání Máme data hdp.wf1, která najdete zde: Bodová předpověď: Intervalová předpověď:

Transkript:

RNDr. Marie Forbelská, Ph.D. 1 M0130 3. praktikum : M0130pr03 (Úvodní analýza časových řad) A. Roční data: Příklad 1 Máme k dispozici historická roční data, která se týkají minimálních (dolních) hladin řeky Nil, a to v letech 622 1284. > nile.low.levels <- c(1157, 1088, 1169, 1169, 984, 1322, 1178, 1103, 1211, 1292, 1124, 1171, 1133, 1227, 1142, 1216, 1259, 1299, 1232, 1117, 1155, 1232, 1083, 1020, 1394, 1196, 1148, 1083, 1189, 1133, 1034, 1157, 1034, 1097, 1299, 1157, 1130, 1155, 1349, 1232, 1103, 1103, 1083, 1027, 1166, 1148, 1250, 1155, 1047, 1054, 1018, 1189, 1126, 1250, 1297, 1178, 1043, 1103, 1250, 1272, 1169, 1004, 1083, 1164, 1124, 1027, 995, 1169, 1270, 1011, 1247, 1101, 1004, 1004, 1065, 1223, 1184, 1216, 1180, 1142, 1277, 1206, 1076, 1076, 1189, 1121, 1178, 1031, 1076, 1178, 1209, 1022, 1220, 1070, 1126, 1058, 1216, 1358, 1184, 1083, 1097, 1119, 1097, 1097, 1153, 1153, 1151, 1151, 1151, 1184, 1097, 1043, 1043, 1002, 1152, 1097, 1034, 1002, 989, 1092, 1115, 1115, 1047, 1040, 1038, 1085, 1126, 1058, 1067, 1115, 1263, 1124, 1110, 1097, 1097, 1157, 1000, 991, 995, 1013, 1007, 971, 971, 980, 993, 1043, 1097, 982, 971, 971, 1065, 1022, 1029, 989, 1029, 995, 982, 1090, 980, 971, 957, 989, 966, 989, 1022, 1074, 1110, 1110, 1061, 1151, 1128, 1074, 1043, 1034, 1074, 966, 1027, 1029, 1034, 1065, 989, 1034, 1002, 1128, 1178, 1097, 1142, 1466, 1097, 1137, 1097, 1259, 1313, 1173, 1169, 1173, 1088, 1191, 1146, 1160, 1142, 1128, 1169, 1162, 1115, 1164, 1088, 1079, 1083, 1043, 1110, 1092, 1110, 1047, 1076, 1110, 1043, 1103, 1034, 1074, 1052, 1011, 1097, 1092, 1110, 1115, 1097, 1196, 1115, 1162, 1151, 1142, 1126, 1108, 1187, 1191, 1153, 1254, 1187, 1196, 1331, 1412, 1349, 1290, 1211, 1232, 1166, 1124, 1146, 1079, 1108, 1097, 1106, 1072, 1065, 1128, 1340, 959, 959, 1137, 1133, 1137, 1151, 1117, 1157, 1157, 1133, 1110, 1155, 1189, 1260, 1189, 1151, 1097, 1209, 1130, 1295, 1308, 1250, 1205, 1310, 1250, 1155, 1101, 1100, 1103, 1121, 1121, 1097, 1106, 1259, 1261, 1124, 1196, 1205, 1205, 1119, 1088, 1250, 1094, 1198, 1121, 1164, 1211, 1153, 1146, 1126, 1288, 1175, 1171, 1081, 1133, 1164, 1155, 1155, 1155, 1160, 1094, 1054, 1067, 1044, 948, 1099, 1016, 1065, 1067, 1072, 1076, 1081, 1196, 1196, 1151, 1088, 1128, 1151, 1236, 1216, 1288, 1297, 1182, 1306, 1043, 1184, 1054, 1169, 1043, 980, 1072, 1189, 1151, 1142, 1193, 1151, 1097, 1144, 1097, 1094, 1153, 1108, 935, 1081, 1081, 1097, 1146, 1250, 1151, 1043, 1043, 1043, 1070, 1124, 1137, 1146, 1099, 1054, 1045, 1070, 1142, 1074, 1101, 1220, 1196, 1097, 1207, 1119, 1160, 1151, 1025, 1097, 1137, 1007, 1034, 1043, 1043, 980, 1079, 1169, 1250, 1324, 1209, 1142, 1061, 1000, 1088, 1128, 1142, 1259, 1142, 1148, 1088, 1142, 1119, 1130, 1088, 1250, 1137, 1108, 1110, 1173, 1173, 1196, 1189, 1200, 1351, 1274, 1227, 1310, 1148, 1151, 1151, 1182, 1182, 1151, 1133, 1130, 1151, 1166, 1070, 1200, 1074, 1110, 1292, 1178, 1128, 1097, 1304, 1103, 1259, 1119, 1119, 1119, 1081, 1196, 1085, 1101, 1103, 1146, 1211, 1169, 1144, 1191, 1189, 1182, 1243, 1243, 1227, 1189, 1191, 1155, 1209, 1218, 1211, 1209, 1164, 1135, 1121, 1137, 1254, 1457, 1299, 1277, 1277, 1178, 1270, 1313, 1333, 1270, 1245, 1245, 1211, 1265, 1346, 1346, 1290, 1295, 1286, 1259, 1254, 1421, 1268, 1263, 1335, 1313, 1265, 1319, 1351, 1277, 1317, 1268, 1263, 1112, 1207, 1292, 1205, 1223, 1205, 1153, 1182, 1245, 1205, 1151, 1079, 1151, 1081, 1128, 1209, 1157, 1277, 1259, 1209, 1220, 1184, 1220, 1193, 1247, 1252, 1259, 1299, 1173, 1182, 1180, 1180, 1331, 1207, 1236, 1151, 1182, 1142, 1191, 1259, 1166, 1196, 1241, 1252, 1241, 1252, 1157, 1126, 1164, 1088, 1173, 1252, 1288, 1301, 1286, 1223, 1232, 1184, 1207, 1250, 1256, 1211, 1216, 1209, 1209, 1207, 1151, 1097, 1097, 989, 966, 1047, 1056, 1110, 1290, 1151, 1166, 1196, 1196, 1110, 1110, 1119, 1119, 1074, 1106, 1128, 1218, 1098, 1044, 1056, 1058, 1098, 1043, 1038, 1142, 1142, 1193, 1103, 989, 936, 1142, 1142, 1151, 1151, 1180, 1259, 1196, 1142, 1169, 1196, 1142, 1128, 1043, 1097, 1142, 1205, 1205, 1164, 1160, 1196, 1112, 1169, 1110, 1178, 1133, 1153, 1139, 1155, 1187, 1196, 1220, 1166, 1128, 1101, 1157, 1175, 1142, 1187, 1254, 1198, 1263, 1283, 1252, 1160, 1234, 1234, 1232, 1306, 1205, 1054, 1151, 1108, 1097)

2 Praktikum z náhodných procesů (3. praktikum) Vytvoříme časovou řadu, kterou vykreslíme. > NileTS <- ts(nile.low.levels, start = 622, frequency = 1) > par(mar = c(2, 2, 0, 0) + 0.5) > plot(nilets, type = "o") 600 700 800 900 1000 1100 1200 1300 1000 1100 1200 1300 1400 Obrázek 1: Minimální roční hladiny řeky Nil v letech 622 1284 (Roda Island, Cairo) Vyzkoušíme, jak bude vypadat graf časové řady s volbou type="h" > par(mar = c(2, 2, 0, 0) + 0.5) > plot(nilets, type = "h") 600 700 800 900 1000 1100 1200 1300 1000 1100 1200 1300 1400 Obrázek 2: Minimální roční hladiny řeky Nil v letech 622 1284 - s volbou type="h"

RNDr. Marie Forbelská, Ph.D. 3 Nyní vytvoříme histogram, jádrový odhad hustoty vstupních dat a navíc ještě vykreslíme normální hustotu, kde střední hodnota a rozptyl jsou určeny výběrovými odhady. > x <- NileTS > par(mar = c(4, 2, 1, 0) + 0.75) > h <- hist(x, probability = TRUE, breaks = "FD", xlab = "Low-Water Levels of the Nile River", main = "Histogram, Kernel Density Estimate, Normal Curve") > xfit <- seq(min(x), max(x), length = 512) > yfit <- dnorm(xfit, mean = mean(x), sd = sd(x)) > lines(xfit, yfit, col = "dodgerblue", lwd = 2) > lines(density(x, n = 512), lwd = 2, col = "red", lty = 2) > rug(x, side = 1, ticksize = 0.02, col = "grey20") > legend("right", legend = c("histogram", "Kernel Density Estimate", "Normal Density"), col = c("black", "red", "dodgerblue"), lty = c(1, 2, 1), bty = "n", title = "Line Types") Histogram, Kernel Density Estimate, Normal Curve Density 0.000 0.002 0.004 0.006 Line Types Histogram Kernel Density Estimate Normal Density 900 1000 1100 1200 1300 1400 1500 Low Water Levels of the Nile River Obrázek 3: Histogram, jádrový odhad hustoty, normální hustota pro roční minima B. Měsíční data: Příklad 2 V tomto případě máme k dispozici měsíční data, která udávají počet nezaměstnaných mladých žen ve věku od 16 do 19 let v USA od ledna 1961 do srpna 2002. Nejprve načteme popis časové řady, který je v datovém souboru umístěn na prvních dvou řádcích. Můžeme to udělat několika způsoby.

4 Praktikum z náhodných procesů (3. praktikum) První možností je použít příkaz readlines. Protože je příkaz v závorkách, ihned se zobrazí obsah proměnné popis. > filedat <- paste(data.library, "MontlyUnemplWomen.dat", sep = "") > con <- file(filedat) > (popis <- readlines(con, n = 2)) [1] "Monthly unemployed young women between ages 16 and 19" [2] "in the U.S. from January 1961 to August 2002" > close(con) Další možností je použít příkaz scan. > (txt <- scan(filedat, what = "", nlines = 2)) [1] "Monthly" "unemployed" "young" "women" "between" [6] "ages" "16" "and" "19" "in" [11] "the" "U.S." "from" "January" "1961" [16] "to" "August" "2002" Vidíme, že každé slovo se načetlo zvlášt, chceme-li všechna slova spojit v jediný text, píšeme > (Txt <- paste(txt, collapse = " ")) [1] "Monthly unemployed young women between ages 16 and 19 in the U.S. from January 1961 to August 2002" Nyní načteme zbytek dat pomocí příkazu scan a volbou skip3 zajistíme přeskočení prvních dvou řádků s textem a jednoho volného řádku. > UnemplWomen <- scan(filedat, skip = 3) Z načtených dat vytvoříme časovou řadu a vykreslíme ji. > UnemplWomenTS <- ts(unemplwomen, start = 1961, frequency = 12) > par(mar = c(2, 2, 0, 0) + 0.5) > plot(unemplwoments)

RNDr. Marie Forbelská, Ph.D. 5 300 400 500 600 700 800 900 1960 1970 1980 1990 2000 Obrázek 4: Počet nezaměstnaných mladých žen ve věku od 16 do 19 let v USA od ledna 1961 do srpna 2002 Abychom mohli používat graf, ve kterém budou zřetelně odděleny roční bloky dat, nejprve vytvoříme funkci > plot.band <- function(x, lwd = 1.5, type = "o", pch = 20,...) { plot(x,...) a <- time(x) i1 <- floor(min(a)) i2 <- ceiling(max(a)) y1 <- par("usr")[3] y2 <- par("usr")[4] if (par("ylog")) { y1 <- 10^y1 y2 <- 10^y2 } for (i in seq(from = i1, to = i2-1, by = 2)) { polygon(c(i, i + 1, i + 1, i), c(y1, y1, y2, y2), col = "grey", border = NA) } par(new = T) plot(x, lwd = lwd, type = type, pch = pch,...) }

6 Praktikum z náhodných procesů (3. praktikum) Tuto funkci pak použijeme pro grafické oddělení jednotlivých let. > par(mar = c(2, 2, 2, 0) + 0.5) > plot.band(unemplwoments, type = "l", lwd = 1) > mtext(popis[1], line = 1, font = 3) > mtext(popis[2], line = 0.125, font = 3) Monthly unemployed young women between ages 16 and 19 in the U.S. from January 1961 to August 2002 300 400 500 600 700 800 900 1960 1970 1980 1990 2000 Obrázek 5: Počet nezaměstnaných mladých žen ve věku od 16 do 19 let v USA od ledna 1961 do srpna 2002 roční bloky Nyní vytvoříme histogram, jádrový odhad hustoty vstupních dat a navíc ještě vykreslíme normální hustotu, kde střední hodnota a rozptyl jsou určeny výběrovými odhady. > x <- UnemplWomenTS > par(mar = c(4, 2, 1, 0) + 0.75) > h <- hist(x, probability = TRUE, breaks = "FD", xlab = "Monthly unemployed young women", main = "Histogram, Kernel Density Estimate, Normal Curve") > xfit <- seq(min(x), max(x), length = 512) > yfit <- dnorm(xfit, mean = mean(x), sd = sd(x)) > lines(xfit, yfit, col = "dodgerblue", lwd = 2) > lines(density(x, n = 512), lwd = 2, col = "red", lty = 2) > rug(x, side = 1, ticksize = 0.02, col = "grey20") > legend("topright", legend = c("histogram", "Kernel Density Estimate", "Normal Density"), col = c("black", "red", "dodgerblue"), lty = c(1, 2, 1), bty = "n", title = "Line Types")

RNDr. Marie Forbelská, Ph.D. 7 Density 0.000 0.001 0.002 0.003 0.004 Histogram, Kernel Density Estimate, Normal Curve 400 600 800 1000 Monthly unemployed young women Line Types Histogram Kernel Density Estimate Normal Density Obrázek 6: Histogram, jádrový odhad hustoty, normální hustota pro počty mladých nezaměstnaných žen Jak je vidět z předchozího grafu, vstupní data jsou směsí tří rozdělení. C. Data s desetinnou čárkou: Příklad 3 Datový soubor ZiveNarozeni.dat obsahuje v prvním řádku popisku dat, druhý řádek je volný, od třetího řádku jsou k dispozici data, ve kterých je místo desetinné tečky desetinná čárka. Nejprve načteme popis datového souboru. > filedat <- paste(data.library, "ZiveNarozeni.dat", sep = "") > con <- file(filedat) > (popis <- readlines(con, n = 1)) [1] "ČR: Živě narození na 1000 obyvatel v letech 1785-2009" > close(con) Nyní načteme samotná data pomocí příkazu scan. Volba skip=2 zajistí přeskočení popisného a volného řádku a volba dec="," umožní načíst číslo s desetinnou čárkou. Pokud bychom to neudělali, příkaz scan by vstupní data bral jako typu character.

8 Praktikum z náhodných procesů (3. praktikum) > ZiveNarozeni <- scan(filedat, skip = 2, dec = ",") > str(zivenarozeni) num [1:225] 43.1 45.1 46 44.9 42 44.6 41.6 44.4 43.2 44.1... Z načtených dat vytvoříme časovou řadu a vykreslíme ji. > ZiveNarozeniTS <- ts(zivenarozeni, start = 1785, frequency = 1) > par(mar = c(2, 2, 1, 0) + 0.5) > plot(zivenarozenits, type = "o", pch = 20) > mtext(popis, line = 0.125, font = 3) CR: Žive narození na 1000 obyvatel v letech 1785 2009 10 20 30 40 1800 1850 1900 1950 2000 Obrázek 7: Počet živě narozených dětí na 1000 obyvatel v České republice v letech 1785-2009. Nyní vytvoříme histogram, jádrový odhad hustoty vstupních dat a navíc ještě vykreslíme normální hustotu, kde střední hodnota a rozptyl jsou určeny výběrovými odhady. > x <- ZiveNarozeniTS > par(mar = c(4, 2, 1, 0) + 0.75) > h <- hist(x, probability = TRUE, breaks = "FD", xlab = "Live births", main = "Histogram, Kernel Density Estimate, Normal Curve") > xfit <- seq(min(x), max(x), length = 512) > yfit <- dnorm(xfit, mean = mean(x), sd = sd(x))

RNDr. Marie Forbelská, Ph.D. 9 > lines(xfit, yfit, col = "dodgerblue", lwd = 2) > lines(density(x, n = 512), lwd = 2, col = "red", lty = 2) > rug(x, side = 1, ticksize = 0.02, col = "grey20") > legend("topleft", legend = c("histogram", "Kernel Density Estimate", "Normal Density"), col = c("black", "red", "dodgerblue"), lty = c(1, 2, 1), bty = "n", title = "Line Types") Density 0.00 0.01 0.02 0.03 0.04 0.05 Histogram, Kernel Density Estimate, Normal Curve Line Types Histogram Kernel Density Estimate Normal Density 10 20 30 40 50 Live births Obrázek 8: Histogram, jádrový odhad hustoty, normální hustota pro počty živě narozených dětí. K vykreslení dat můžeme použít i grafy z knihovny lattice, kdy máme možnost rozšířit volbu type=c("o","r") tak, aby se navíc daty proložila regresní přímka. > library(lattice) > print(xyplot(zivenarozenits, type = c("o", "r"), pch = 20, main = popis))

10 Praktikum z náhodných procesů (3. praktikum) CR: Žive narození na 1000 obyvatel v letech 1785 2009 10 20 30 40 1800 1850 1900 1950 2000 Time Obrázek 9: Počet živě narozených dětí na 1000 obyvatel v České republice v letech 1785-2009 spolu s regresní přímkou. Na závěr ještě vyšetříme, jak dopadnou odhady rozdělení, pokud z časové řady odstraníme lineární trend, tj. vykreslíme histogram, jádrový odhad hustoty a normální hustotu pro rezidua, která získáme z jednoduchého regresního modelu s lineárních trendem. > Time <- 1:length(ZiveNarozeni) > x <- residuals(lm(zivenarozeni ~ Time)) > par(mar = c(4, 2, 1, 0) + 0.75) > h <- hist(x, probability = TRUE, breaks = "FD", xlab = "residuals", main = "Histogram, Kernel Density Estimate, Normal Curve") > xfit <- seq(min(x), max(x), length = 512) > yfit <- dnorm(xfit, mean = mean(x), sd = sd(x)) > lines(xfit, yfit, col = "dodgerblue", lwd = 2) > lines(density(x, n = 512), lwd = 2, col = "red", lty = 2) > rug(x, side = 1, ticksize = 0.02, col = "grey20") > legend("left", legend = c("histogram", "Kernel Density Estimate", "Normal Density"), col = c("black", "red", "dodgerblue"), lty = c(1, 2, 1), bty = "n", title = "Line Types")

RNDr. Marie Forbelská, Ph.D. 11 Histogram, Kernel Density Estimate, Normal Curve Density 0.00 0.02 0.04 0.06 0.08 0.10 0.12 Line Types Histogram Kernel Density Estimate Normal Density 10 5 0 5 residuals Obrázek 10: Histogram, jádrový odhad hustoty, normální hustota pro residua. Srovnáme-li obrázky 8 a 10, vidíme, že pokud je u časových řad výrazný trend, nemá smysl odhadovat rozdělení dat, nebot v nich velkou váhu má deterministická složka. Tu je třeba nejprve odstranit a pak teprve zkoumat rozdělení zbývající stochastické složky. D. Úkol: Pro časové řady, které jste si našli v minulém praktiku, proved te úvodní analýzu.