Časové řady a jejich periodicita pokračování
|
|
- Miloš Matějka
- před 5 lety
- Počet zobrazení:
Transkript
1 Časové řady a jejich periodicita pokračování Jana Klicnarová Katedra aplikované matematiky a informatiky Jihočeská Univerzita v Českých Budějovicích, Ekonomická fakulta 2010
2 Dekompozice časových řad Jak jsme již zmínili dříve, cílem dekompozice časových řad je rozložení časové řady do čtyř základních složek složky trendu, sezónní složky, cyklické složky a reziduální složky. Při této dekompozici se často předpokládá, že reziduální složka je tzv. bílým šumem. Uveďme tedy definici bílého šumu. Bílý šum Náhodná složka ε t je často uvažována jako bílý šum. Náhodné veličiny (ε t ) t tvoří bílý šum, pokud jsou nekorelované, mají nulovou střední hodnotu a konečný kladný rozptyl σ 2.
3 Dva základní typy dekompozice časových řad Dekompozici časových řad do čtyř výše zmíněných složek lze provést několika způsoby, zde se omezme na dva základní způsoby, a to dekompozici aditivní dekompozici multiplikativní.
4 Dva základní typy dekompozice časových řad Aditivní dekompozice Pokud uvažujeme aditivní dekompozici, potom předpokládáme, že řadu lze rozložit jako součet několika složek: Y t = T t + S t + C t + ε t, kde Y t je náhodná veličina, realizující se v čase t, T t je trendová složka této veličiny, S t sezónní složka, C t cyklická složka a ε t je náhodnou složkou této veličiny v čase t.
5 Dva základní typy dekompozice časových řad Aditivní dekompozice jednotky Poněvadž lze sčítat pouze sčítance, které mají stejné jednotky, je zřejmé, že v případě aditivní dekompozice jsou všechny složky vyjádřeny ve stejných jednotkách v takových, ve kterých je udávána pozorovaná hodnota časové řady. Pokud tedy například analyzujeme počet návštěvníků nějaké památky, potom všechny složky mají za jednotky počet návštěvníků např. sezónní složka nám udává očekávaný nárůst či pokles návštěvníků v daném časovém období vůči průměru.
6 Dva základní typy dekompozice časových řad Multiplikativní dekompozice Uvažujeme-li multiplikativní model, potom náhodnou veličinu rozkládáme do stejných složek jako v případě aditivního modelu, ale operátor sčítání je nahrazen operátorem násobení. A tedy předpokládáme, že platí: Y t = T t S t C t ε t, kde, jak jsme již zmínili výše, Y t je náhodná veličina, kterou analyzujeme, T t je její trendová složka, S t sezónní složka, C t cyklická složka a ε t je její náhodnou složkou. V tomto modelu má stejné jednotky jako pozorování časové řady pouze složka trendu T, ostatní složky jsou bez rozměrné a udávají relativní změnu.
7 Dva základní typy dekompozice časových řad příklad Příklad Pro ilustraci rozdílu mezi multiplikativním a aditivním model si představme dvě vesničky Multiplikov a Aditov. V těchto dvou vesničkách chceme pomoci tamní energetické společnosti modelovat spotřebu elektřiny domácností v závislosti na ročním období. V Multiplikově všichni obyvatelé používají elektřinu pouze ke svícení. V Aditově všichni obyvatelé na elektřině vaří a všichni ji používají k vytápění.
8 Dva základní typy dekompozice časových řad příklad Multiplikov Za takových předpokladů, lze pro Multiplikov předpokládat model spotřeby elektřiny ve tvaru Y t = T t S t ε t, kde Y t je spotřeba elektřiny v časovém období t, T t je trendová složka spotřeby elektřiny, S t sezónní a ε t náhodná složka v čase t. Volba tohoto modelu vychází ze zjednodušené představy, že obyvatelé svítí nějakým daným počtem žárovek o dané spotřebě, rozdíl je v tom, že v letních měsících svítí kratší dobu než v zimních. A tedy parametr S t udává relativní dobu svícení v daném období.
9 Dva základní typy dekompozice časových řad příklad Aditov A pro Aditov lze sestavit model se stejnými parametry, avšak ve tvaru: Y t = T t + S t + ε t. V tomto případě je zjednodušená představa následující v trendu T t je zahrnuta spotřeba elektřiny na vaření, která se s měnícím se obdobím více méně nemění a v sezónnosti S t je zahrnuta spotřeba elektřiny na topení, která je v letních měsících nulová a v zimních měsících roste. (Všimněme si, že v tomto modelu není obsažený trend. Pokud tedy řada vykazuje nějaký trend, před použitím spektrální analýzy musíme zkoumanou řadu od trendu očistit.)
10 Obecná periodicita v časových řadách Dva základní přístupy k periodicitě První možnost je, že z povahy časové řady víme, jaká periodicita by se v ní měla vyskytovat (spotřeba plynu pro domácnosti na topení bude zřejmě mnohem vyšší v zimních měsících než v letních, kdy bude pravděpodobně nulová. Očekáváme zde tedy roční periodicitu). V takovémto případě, kdy z povahy dat víme, jakou periodicitu můžeme očekávat, je možné pro začátek udělat nějaký test na očekávanou periodicitu. V případě, že se tato periodicita potvrdí, potom již můžeme hledat parametry modelu s prokázanou periodicitou. Touto situací se zde zabývat nebudeme, podrobněji viz např. Cipra, T.: Analýza časových řad.
11 Obecná periodicita v časových řadách Dva základní přístupy k periodicitě Nadále se budeme soustředit na druhou možnost, a to takovou, kdy chceme zjistit, zda pozorovaná časová řada vykazuje nějakou periodicitu (přesněji cyklicitu), přičemž hledáme jakoukoliv periodu, pro kterou by byla nějaká cyklicita významná. Zjistit frekvenci takovýchto cyklů nemusí být vůbec snadné. Z grafu může být nemožné tyto cykly vyčíst, poněvadž se může stát, že řada obsahuje několik různých cyklů různých délek. V grafickém znázornění, potom není možné jednotlivé složky rozlišit. V takovém případě je asi nejvhodnější postupovat pomocí takzvané spektrální analýzy.
12 Základní myšlenka spektrální analýzy Časovou řadu chceme rozložit do tvaru Y t = µ + p (α j cos (ω j t) + β j sin (ω j t)) + ε j t = 1,..., n. (1) j=1 Tedy, jako součet nějaké úrovně (µ), směsi konečného počtu goniometrických funkcí s různými frekvencemi ω 1, ω 2,..., ω p a bílého šumu ε t. Všimněme si, že tento model nepředpokládá žádný trend. Tudíž, pokud naše zkoumaná řada vykazuje nějaký trend, musíme tuto řadu nejprve očistit od trendu, a teprve potom využít spektrální analýzy.
13 Základní myšlenka spektrální analýzy Hodnota p počet sčítanců je volena jako n 2 (celá část z n 2 ). (Máme-li řadu délky n, potom v této řadě můžeme pozorovat maximálně n 2 různých frekvencí, které se tam mohli projevit v celém průběhu.) Nejkratší pozorovatelný cyklus má polovinu své délky 1 ( jednou nahoře, po druhé dole ), poté následuje cyklus s polovinou délky 2,3,.... Nejdelší pozorovatelný cyklus má polovinu své délky n 2 delší cyklus už by se na n pozorování nemohl realizovat celý. Tato nejvyšší možná pozorovatelná frekvence se nazývá Nyquisova frekvence.
14 Základní myšlenka spektrální analýzy Naším cílem je nalézt ty hodnoty ω j, které jsou v námi analyzované řadě skutečně významné. K tomuto účelu zkonstruoval již v roce 1898 Schuster periodogram. Periodogram můžeme zapsat ( n 2 ( n ) 2 I (ω) = 1 y t cos (ωt)) + y t sin (ωt), (2) 2πn t=1 t=1 π ω π.
15 Periodogram Poznámka Definice periodogramu se u různých autorů liší multiplikativní konstantou, proto je možné, že hodnoty periodogramu vyjdou různě při výpočtu pomocí různého software. Nicméně na účelnosti to nic nemění.
16 Periodogram Ze vzorce pro periodogram je vidět, že ten je v každém bodě ω vlastně pozorováním nějaké náhodné veličiny (realizací náhodné veličiny). Podrobněji: Nahradíme-li ve vzorci periodogramu y t (tj. pozorované hodnoty) náhodnými veličinami Y t, potom je I (ω) skutečně náhodnou veličinou. V případě, že za náhodné veličiny dosadíme již pozorované hodnoty, získáváme pozorování této náhodné veličiny.
17 Periodogram náhodná veličina Pokud bychom uvažovali o periodogramu jako náhodné veličině (vypočítáno s Y t ), potom je tato náhodná veličina sestavena takovým způsobem, že její střední hodnota je ve významných bodech (tj. takových, kde je koeficient příslušný ω j nenulový) ω j (viz. (1)) řádu n a ostatních bodech se blíží nule. Její rozptyl je pro všechna n stejný. Hodnota periodogramu Máme-li hodnoty periodogramu naší časové řady, máme pro každé ω pozorování náhodné veličiny. A naším cílem je určit, kdy je to pozorování náhodné veličiny se střední hodnotou řádu n a kdy je to pozorování náhodné veličiny se střední hodnotou blíží se nule.
18 Periodogram testy Z výše uvedeného je zřejmé, že za významné frekvence budou uvažovány ty frekvence, v nichž vyjde hodnota periodogramu vysoká. Je tedy zapotřebí mít nějaký test, kterým určíme, kterou hodnotu ještě považovat za vysokou a kterou už nikoliv.
19 Test R.A. Fishera Hypotéza Y 1, Y 2,..., Y N, jsou nezávislé stejně rozdělené náhodné veličiny s rozdělením N(0, σ 2 ). Alternativa p Y t = µ + (α j cos (ω j t) + β j sin (ω j t)) + ε j t = 1,..., n. j=1
20 Test R.A. Fishera Testová statistika Spočtěme hodnoty I (ω j ) pro všechna j = 1,..., p. Seřaďme I (ω j ) sestupně a postupně je označme V 1, V 2,..., V p. (Tedy V 1 je největší hodnota, jaké pro naší časovou řadu nabyl periodogram.) Testovou statistikou je W = V 1 V 1 + V V p. Kritické hodnoty této statistiky jsou tabelovány. Hypotéza se zamítá ve prospěch alternativy, pokud W > g F, kde g F je kritická hodnota Fisherova testu na zvolené hladině významnosti pro dané p.
21 Test R.A. Fishera Negativa testu Jednou z nevýhod tohoto testu je v hypotéze podmínka nezávislosti náhodných veličin. Může se tedy stát, že zamítneme hypotézu H 0 nikoliv z důvodu periodocity, ale z důvodu nesplnění podmínky nezávislosti. Dalším problém je, co dělat, pokud zamítneme hypotézu H 0, a tedy připustíme, že jedna z period (ta, v níž je hodnota periodogramu maximální) je signifikantní. Jak určit, zda existuje ještě nějaká další významná perioda? Opakovat test? V tomto případě se někdy používá tav. Whittleova modifikace Fisherova testu. Také je možné využít Siegelův test.
22 Test R.A. Fishera Whittleova modifikace Test dalších významných složek Předpokládejme, že jsme použili Fisherův test a pro jednu periodu zamítli hypotézu H 0. Cílem je zjistit, zda existuje ještě nějaká další významná perioda. Whittle doporučil, aby se v případě významnosti největší hodnoty peirodogramu tato vynechala, zůstanou tak hodnoty V 2, V 3,..., V p a použila se testová statistika W 1 = V 2 V 2 + V V p. Tuto hodnotu opět porovnáváme s kritickou hodnotou g F, ovšem pozor, musíme již uvažovat p 1!
23 Fisherův test závěr Praktické zkušenosti ukázali, že v případě, že řada obsahuje jednu významnou frekvenci, je síla Fisherova testu svým způsobem optimální, ovšem v případě, že řady obsahují více významných frekvencí, má Fisherův test malou sílu. Proto byli navrženy modifikace Fisherova testu, které tento nedostatek odstraňují. Zde zmíníme Siegelovu modifikaci.
24 Siegelův test Siegel navrhl místo testové statistiky W použít testovou statistiku T λ = n (Z i λg F ) +, i=1 V kde Z i = i V 1 +V 2 + +V p, g F je kritická hodnota Fisherova testu, ( ) + značí kladnou část čísla a λ je nějakou konstanta. Kritické hodnoty této statistiky jsou tabelovány pro různá λ, obecně se však doporučuje používat λ = 0, 6.
25 Hledání periodických složek Jak z výše uvedeného vyplývá, je v podstatě subjektivní záležitostí (ovlivněno volbou testu, volbou konstanty), kolik prokážeme periodických složek v řadě (v případě, že jich existuje více). Proto se někdy používá zcela subjektivní přístup. Pokud se nám podaří zamítnout hypotézu H 0 pomocí Fisherova testu, potom si graficky znázorníme hodnotu periodogramu a sami určíme ty hodnoty, které ještě pokládáme za dostatečně velké. Čímž zcela subjektivně určíme významné periody.
26 Závěrečné poznámky Pokud jsme již stanovili významné periody, potom koeficienty v rovnici 1 určíme tradiční metodou nejmenších čtverců. Očištění řady Poznamenejme, že hypotézou všech uvedených testů bylo, že veličiny jsou nezávislé, s nulovou střední hodnotou, proto je nutné před začátkem testování periodicity řadu očistit od trendu!
Časové řady a jejich periodicita úvod
Časové řady a jejich periodicita úvod Jana Klicnarová Katedra aplikované matematiky a informatiky Jihočeská Univerzita v Českých Budějovicích, Ekonomická fakulta 2010 Časové řady Data, která získáváme
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
VíceJednofaktorová analýza rozptylu
I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých
Více12. cvičení z PST. 20. prosince 2017
1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace
VíceFunkce komplexní proměnné a integrální transformace
Funkce komplexní proměnné a integrální transformace Fourierovy řady I. Marek Lampart Text byl vytvořen v rámci realizace projektu Matematika pro inženýry 21. století (reg. č. CZ.1.07/2.2.00/07.0332), na
VíceTestování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOS A SAISIKA Regresní analýza - motivace Základní úlohou regresní analýzy je nalezení vhodného modelu studované závislosti. Je nutné věnovat velkou pozornost tomu aby byla modelována REÁLNÁ
VíceNormální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký
VícePříklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13
Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test
VíceZáklady biostatistiky II. Veřejné zdravotnictví 3.LF UK - II
Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické
VíceTestování hypotéz o parametrech regresního modelu
Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO
VíceTestování hypotéz o parametrech regresního modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie ZS 2015/16 Cvičení 1: Opakování ze statistiky LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Z čeho studovat 1) Z KNIHY Krkošková,
VíceProblematika analýzy rozptylu. Ing. Michael Rost, Ph.D.
Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít
VíceJednofaktorová analýza rozptylu
Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato
VíceKatedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci
Zpracování dat v edukačních vědách - Testování hypotéz Kamila Fačevicová Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Obsah seminářů 5.11. Úvod do matematické
VícePeriodicita v časové řadě, její popis a identifikace, exponenciální vyrovnáván
Periodicita v časové řadě, její popis a identifikace, exponenciální vyrovnávání Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Periodicita v časových
VíceČasové řady, typy trendových funkcí a odhady trendů
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Stochastický proces Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2 } se nazývá stochastický proces
VíceTesty dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)
Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich
VíceJana Vránová, 3. lékařská fakulta UK
Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace
Více1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti
Více12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)
cvičení z PSI 0-4 prosince 06 Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) Z realizací náhodných veličin X a Y s normálním rozdělením) jsme z výběrů daného rozsahu obdrželi
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceNormální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními
VíceČasové řady, typy trendových funkcí a odhady trendů
Časové řady, typy trendových funkcí a odhady trendů Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Jiří Neubauer (Katedra ekonometrie UO Brno) Časové
VíceCvičení ze statistiky - 8. Filip Děchtěrenko
Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly
VíceÚvod do analýzy rozptylu
Úvod do analýzy rozptylu Párovým t-testem se podařilo prokázat, že úprava režimu stravování a fyzické aktivity ve vybrané škole měla vliv na zlepšené hodnoty HDLcholesterolu u školáků. Pro otestování jsme
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
VíceÚvod do teorie odhadu. Ing. Michael Rost, Ph.D.
Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost
VíceTestování statistických hypotéz
Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné
Více10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.
0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti
Vícejevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.
Parametrické metody odhadů z neúplných výběrů 2 1 Metoda maximální věrohodnosti pro cenzorované výběry 11 Náhodné cenzorování Při sledování složitých reálných systémů často nemáme možnost uspořádat experiment
VíceTesty. Pavel Provinský. 19. listopadu 2013
Testy Pavel Provinský 19. listopadu 2013 Test a intervalový odhad Testy a intervalové odhady - jsou vlastně to samé. Jiný je jen úhel pohledu. Lze přecházet od jednoho k druhému. Například: Při odvozování
VíceStatistika, Biostatistika pro kombinované studium. Jan Kracík
Statistika, Biostatistika pro kombinované studium Letní semestr 2014/2015 Tutoriál č. 6: ANOVA Jan Kracík jan.kracik@vsb.cz Obsah: Testování hypotéz opakování ANOVA Testování hypotéz (opakování) Testování
Více11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.
11 cvičení z PSI 12-16 prosince 2016 111 (Test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota 0 1 2 3 4 5 6 pozorovaná četnost 29 15
VícePravděpodobnost, náhoda, kostky
Pravděpodobnost, náhoda, kostky Radek Pelánek IV122 Výhled pravděpodobnost náhodná čísla lineární regrese detekce shluků Dnes lehce nesourodá směs úloh souvisejících s pravděpodobností připomenutí, souvislosti
VíceMatematika (CŽV Kadaň) aneb Úvod do lineární algebry Matice a soustavy rovnic
Přednáška třetí (a pravděpodobně i čtvrtá) aneb Úvod do lineární algebry Matice a soustavy rovnic Lineární rovnice o 2 neznámých Lineární rovnice o 2 neznámých Lineární rovnice o dvou neznámých x, y je
VíceANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie ANOVA Semestrální práce Licenční studium Galileo Interaktivní statistická analýza dat Brno 2015 Ing. Petra Hlaváčková, Ph.D.
VíceMatematické modelování Náhled do ekonometrie. Lukáš Frýd
Matematické modelování Náhled do ekonometrie Lukáš Frýd Výnos akcie vs. Výnos celého trhu - CAPM model r it = r ft + β 1. (r mt r ft ) r it r ft = α 0 + β 1. (r mt r ft ) + ε it Ekonomický (finanční model)
VíceIntervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
VíceTECHNICKÁ UNIVERZITA V LIBERCI
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce z předmětu Statistický rozbor dat z dotazníkového šetření Jméno: Lucie Krechlerová, Karel Kozma, René Dubský, David Drobík Ročník: 2015/2016
VíceTECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření Analýza výsledků dotazníkového šetření - fakultní dotazník Vypracovaly: Klára Habrová,
VíceTestování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test
Testování hypotéz 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz proces, kterým rozhodujeme, zda přijmeme nebo zamítneme nulovou hypotézu
VíceDiferenciální rovnice 3
Diferenciální rovnice 3 Lineární diferenciální rovnice n-tého řádu Lineární diferenciální rovnice (dále jen LDR) n-tého řádu je rovnice tvaru + + + + = kde = je hledaná funkce, pravá strana a koeficienty
Vícecv3.tex. Vzorec pro úplnou pravděpodobnost
3 cvičení - pravděpodobnost 2102018 18cv3tex n i=1 Vzorec pro úplnou pravděpodobnost Systém náhodných jevů nazýváme úplným, jestliže pro něj platí: B i = 1 a pro i k je B i B k = 0 Jestliže je (Ω, A, P
VíceIntervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
VíceZápočtová práce STATISTIKA I
Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru
Více7. Analýza rozptylu.
7. Analýza rozptylu. Uvedeme obecnou ideu, která je založena na minimalizaci chyby metodou nejmenších čtverců. Nejdříve uvedeme několik základních tvrzení. Uvažujeme náhodný vektor Y = (Y, Y,..., Y n a
Více15. T e s t o v á n í h y p o t é z
15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
VíceAnalýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.
Analýza rozptylu Analýza rozptylu umožňuje ověřit významnost rozdílu mezi výběrovými průměry většího počtu náhodných výběrů, umožňuje posoudit vliv různých faktorů. Podle počtu analyzovaných faktorů rozlišujeme
VíceBodové a intervalové odhady parametrů v regresním modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model Mějme lineární regresní model (LRM) Y = Xβ + e, kde y 1 e 1 β y 2 Y =., e
VíceCharakteristika datového souboru
Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex
VíceMann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek
10. Neparametrické y Mann-Whitney U- Wilcoxonův Znaménkový Shrnutí statistických ů Typ srovnání Nulová hypotéza Parametrický Neparametrický 1 skupina dat vs. etalon Střední hodnota je rovna hodnotě etalonu.
VíceDobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze
Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,
VíceX = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní
..08 8cv7.tex 7. cvičení - transformace náhodné veličiny Definice pojmů a základní vzorce Je-li X náhodná veličina a h : R R je měřitelná funkce, pak náhodnou veličinu Y, která je definovaná vztahem X
VíceAproximace binomického rozdělení normálním
Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Příklad Sybilla a Kassandra tvrdí, že mají telepatické schopnosti, a chtějí to dokázat následujícím pokusem: V jedné
VíceKGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení
VíceJEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica
JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu
VíceRegresní analýza 1. Regresní analýza
Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému
Více0.1 Úvod do lineární algebry
Matematika KMI/PMATE 1 01 Úvod do lineární algebry 011 Lineární rovnice o 2 neznámých Definice 011 Lineární rovnice o dvou neznámých x, y je rovnice, která může být vyjádřena ve tvaru ax + by = c, kde
VíceIntervalová data a výpočet některých statistik
Intervalová data a výpočet některých statistik Milan Hladík 1 Michal Černý 2 1 Katedra aplikované matematiky Matematicko-fyzikální fakulta Univerzita Karlova 2 Katedra ekonometrie Fakulta informatiky a
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceSTATISTICKÉ ODHADY Odhady populačních charakteristik
STATISTICKÉ ODHADY Odhady populačních charakteristik Jak stanovit charakteristiky rozložení sledované veličiny v základní populaci? Populaci většinou nemáme celou k dispozici, musíme se spokojit jen s
VíceKORELACE. Komentované řešení pomocí programu Statistica
KORELACE Komentované řešení pomocí programu Statistica Vstupní data I Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná
Více676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368
Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540
VíceÚVOD DO TEORIE ODHADU. Martina Litschmannová
ÚVOD DO TEORIE ODHADU Martina Litschmannová Obsah lekce Výběrové charakteristiky parametry populace vs. výběrové charakteristiky limitní věty další rozdělení pravděpodobnosti (Chí-kvadrát (Pearsonovo),
VíceEpidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E
Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Epidemiologické ukazatele Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly
Víceletní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika
Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 Opakování t- vs. neparametrické Wilcoxonův jednovýběrový test Opakování
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Náhodný výběr Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
Víceanalýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele
Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. 1 Záznam epidemiologických dat Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly
VíceStručný úvod do testování statistických hypotéz
Stručný úvod do testování statistických hypotéz 1. Formulujeme hypotézu (předpokládáme, že pozorovaný jev je pouze náhodný). 2. Zvolíme hladinu významnosti testu a, tj. riziko, s nímž jsme ochotni se smířit.
VíceÚvod do analýzy časových řad
Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2... } se nazývá stochastický
VíceÚlohy nejmenších čtverců
Úlohy nejmenších čtverců Petr Tichý 7. listopadu 2012 1 Problémy nejmenších čtverců Ax b Řešení Ax = b nemusí existovat, a pokud existuje, nemusí být jednoznačné. Často má smysl hledat x tak, že Ax b.
VíceStatistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup
Statistika Testování hypotéz statistická indukce Úvod do problému Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 21. února 2012 Statistika by Birom
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceParametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =
Příklad 1 Metodou nejmenších čtverců nalezněte odhad lineární regresní funkce popisující závislost mezi výnosy pšenice a množstvím použitého hnojiva na základě hodnot výběrového souboru uvedeného v tabulce.
VíceTesty statistických hypotéz
Testy statistických hypotéz Statistická hypotéza je jakýkoliv předpoklad o rozdělení pravděpodobnosti jedné nebo několika náhodných veličin. Na základě náhodného výběru, který je reprezentativním vzorkem
VíceLINEÁRNÍ MODELY. Zdeňka Veselá
LINEÁRNÍ MODELY Zdeňka Veselá vesela.zdenka@vuzv.cz Genetika kvantitativních vlastností Jednotlivé geny nejsou zjistitelné ani měřitelné Efekty většího počtu genů poskytují variabilitu, kterou lze většinou
VíceKGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 8. Analýza rozptylu Mgr. David Fiedor 13. dubna 2015 Motivace dosud - maximálně dva výběry (jednovýběrové a dvouvýběrové testy) Příklad Na dané hladině významnosti α = 0,05
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y Xβ ε Předpoklady: Matice X X n,k je matice realizací. Předpoklad: n > k, h(x) k - tj. matice
VíceAnalýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel
Analýza rozptylu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 1 / 30 Analýza
Více(Cramerovo pravidlo, determinanty, inverzní matice)
KMA/MAT1 Přednáška a cvičení, Lineární algebra 2 Řešení soustav lineárních rovnic se čtvercovou maticí soustavy (Cramerovo pravidlo, determinanty, inverzní matice) 16 a 21 října 2014 V dnešní přednášce
VíceTestování statistických hypotéz
Testování statistických hypotéz Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 11. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 27 Obsah 1 Testování statistických hypotéz 2
Více13.1. Úvod Cílem regresní analýzy je popsat závislost hodnot znaku Y na hodnotách
13 Regrese 13.1. Úvod Cílem regresní analýzy je popsat závislost hodnot znaku Y na hodnotách znaku X. Přitom je třeba vyřešit jednak volbu funkcí k vystižení dané závislosti a dále stanovení konkrétních
VíceVícerozměrná rozdělení
Vícerozměrná rozdělení 7. září 0 Učivo: Práce s vícerozměrnými rozděleními. Sdružené, marginální, podmíněné rozdělení pravděpodobnosti. Vektorová střední hodnota. Kovariance, korelace, kovarianční matice.
VíceIng. Michael Rost, Ph.D.
Úvod do testování hypotéz, jednovýběrový t-test Ing. Michael Rost, Ph.D. Testovaná hypotéza Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru, např. o parametru Θ, pak takovéto tvrzení
VíceZpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.
Ing. Michal Dorda, Ph.D. 1 Př. 1: Cestující na vybraném spoji linky MHD byli dotazováni za účelem zjištění spokojenosti s kvalitou MHD. Legenda 1 Velmi spokojen Spokojen 3 Nespokojen 4 Velmi nespokojen
VícePravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.
Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení
VíceNávrh a vyhodnocení experimentu
Návrh a vyhodnocení experimentu Návrh a vyhodnocení experimentů v procesech vývoje a řízení kvality vozidel Ing. Bohumil Kovář, Ph.D. FD ČVUT Ústav aplikované matematiky kovar@utia.cas.cz Mladá Boleslav
VíceUniverzita Karlova v Praze procesy II. Zuzana. funkce
Náhodné 1 1 Katedra pravděpodobnosti a matematické statistiky Univerzita Karlova v Praze email: praskova@karlin.mff.cuni.cz 11.-12.3. 2010 1 Outline Lemma 1: 1. Nechť µ, ν jsou konečné míry na borelovských
VíceTESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceUniverzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA. Semestrální práce
Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA Semestrální práce Licenční studium GALILEO Interaktivní statistická analýza dat Brno, 2015 Doc. Mgr. Jan Muselík, Ph.D.
VíceKorelace. Komentované řešení pomocí MS Excel
Korelace Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A2:B84 (viz. obrázek) Prvotní představu o tvaru a síle závislosti docházky a počtu bodů nám poskytne
Více10. Soustavy lineárních rovnic, determinanty, Cramerovo pravidlo
0. Soustavy lineárních rovnic, determinanty, Cramerovo pravidlo (PEF PaA) Petr Gurka aktualizováno 9. prosince 202 Obsah Základní pojmy. Motivace.................................2 Aritmetický vektorový
VícePříklady - Bodový odhad
Příklady - odový odhad 5. října 03 Pražské metro Přijdu v pražském metru na nástupiště a tam zjistím, že metro v mém směru jelo před :30 a metro v opačném směru před 4:0. Udělejte bodový odhad, jak dlouho
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
Více