Lineární a adaptivní zpracování dat. 9. Modely časových řad II.

Podobné dokumenty
Lineární a adaptivní zpracování dat. 8. Modely časových řad I.

Investice do rozvoje vzdělávání

Lineární a adaptivní zpracování dat. 11. Adaptivní filtrace a predikce II.

Analýza a zpracování signálů. 4. Diskrétní systémy,výpočet impulsní odezvy, konvoluce, korelace

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

1. Základy měření neelektrických veličin

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

8. Analýza rozptylu.

EKONOMETRIE 9. přednáška Zobecněný lineární regresní model

Náhodný výběr 1. Náhodný výběr

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

Odhady parametrů 1. Odhady parametrů

základním prvkem teorie křivek v počítačové grafice křivky polynomiální n

Analýza a zpracování signálů. 3. Číselné řady, jejich vlastnosti a základní operace, náhodné signály

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

OPTIMÁLNÍ FILTRACE METALURGICKÝCH SIGNÁLŮ POMOCÍ INFORMAČNÍCH KRITÉRIÍ

Pravděpodobnostní modely

P2: Statistické zpracování dat

REGRESNÍ DIAGNOSTIKA. Regresní diagnostika

} kvantitativní znaky. korelace, regrese. Prof. RNDr. Jana Zvárov. Obecné principy

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

Základy statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

Lineární a adaptivní zpracovní dat. 5. Lineární filtrace: FIR, IIR

Úvod do analýzy časových řad

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

L A B O R A T O R N Í C V I Č E N Í Z F Y Z I K Y

Deskriptivní statistika 1

PRAVDĚPODOBNOST A STATISTIKA

Číslicové filtry. Použití : Analogové x číslicové filtry : Analogové. Číslicové: Separace signálů Restaurace signálů

Lineární a adaptivní zpracovní dat. 4. Lineární filtrace II: FIR, IIR

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

Pravděpodobnostní model doby setrvání ministra školství ve funkci

OVMT Přesnost měření a teorie chyb

NEPARAMETRICKÉ METODY

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

2 STEJNORODOST BETONU KONSTRUKCE

Iterační metody řešení soustav lineárních rovnic

Závislost slovních znaků

KONEČNĚ ROZDĚLENÁ ZPOŽDĚNÍ. POLYNOMICKY ROZDĚLENÉ ZPOŽDĚNÍ.

Sekvenční logické obvody(lso)

1. Základy počtu pravděpodobnosti:

12. N á h o d n ý v ý b ě r

Přednáška II. Lukáš Frýd

IAJCE Přednáška č. 12

UPLATNĚNÍ ZKOUŠEK PŘI PROHLÍDKÁCH MOSTŮ

Úloha III.S... limitní

1.3. POLYNOMY. V této kapitole se dozvíte:

K čemu slouží regrese?

Matematika 1. Katedra matematiky, Fakulta stavební ČVUT v Praze. středa 10-11:40 posluchárna D / 13. Posloupnosti

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

DERIVACE FUNKCÍ JEDNÉ REÁLNÉ PROM

Metody zkoumání závislosti numerických proměnných

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

1 Základy Z-transformace. pro aplikace v oblasti

2 IDENTIFIKACE H-MATICE POPISUJÍCÍ VEDENÍ Z NAMĚŘENÝCH HODNOT

vají statistické metody v biomedicíně Literatura Statistika v biomedicínsk nském výzkumu a ve zdravotnictví

8.2.1 Aritmetická posloupnost I

Intervalové odhady parametrů

8.2.1 Aritmetická posloupnost

1 ROVNOMĚRNOST BETONU KONSTRUKCE

Popisná statistika. Zdeněk Janák 9. prosince 2007

MOŽNOSTI STATISTICKÉHO POSOUZENÍ KVANTITATIVNÍCH VÝSLEDKŮ POŽÁRNÍCH ZKOUŠEK PRO POTŘEBY CERTIFIKACE A POSUZOVÁNÍ SHODY VÝROBKŮ

2. Náhodná veličina. je konečná nebo spočetná množina;

procesy II Zuzana 1 Katedra pravděpodobnosti a matematické statistiky Univerzita Karlova v Praze

8. Odhady parametrů rozdělení pravděpodobnosti

Zhodnocení přesnosti měření

MATICOVÉ HRY MATICOVÝCH HER

vají statistické metody v biomedicíně

6. Posloupnosti a jejich limity, řady

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

Integrace hodnot Value-at-Risk lineárních subportfolií na bázi vícerozměrného normálního rozdělení výnosů aktiv

, jsou naměřené a vypočtené hodnoty závisle

3. Sekvenční obvody. b) Minimalizujte budící funkce pomocí Karnaughovy mapy

9. Měření závislostí ve statistice Pevná a volná závislost

Testování statistických hypotéz

Optické vlastnosti atmosféry, rekonstrukce optického signálu degradovaného průchodem atmosférou

PRAVDĚPODOBNOST A STATISTIKA

Pravděpodobnost a aplikovaná statistika

Úloha II.S... odhadnutelná

Univerzita Karlova v Praze Matematiko-fyzikální fakulta BAKALÁŘSKÁ PRÁCE. Kateřina Boková. Predikce časových řad

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů

V. Normální rozdělení

Pravděpodobnost a aplikovaná statistika

Variabilita měření a statistická regulace procesu

Lekce 2 Jednoduchý lineární regresní model

3. Lineární diferenciální rovnice úvod do teorie

( + ) ( ) ( ) ( ) ( ) Derivace elementárních funkcí II. Předpoklady: Př. 1: Urči derivaci funkce y = x ; n N.

14. B o d o v é o d h a d y p a r a m e t r ů

Laboratorní práce č. 10 Úloha č. 9. Polarizace světla a Brownův pohyb:

1. JEV JISTÝ a. je jev, který nikdy nenastane b. je jev, jehož pravděpodobnost = ½ c. je jev, jehož pravděpodobnost = 0 d.

PRAVDĚPODOBNOST A STATISTIKA

Národní informační středisko pro podporu jakosti

Výukový modul III.2 Inovace a zkvalitnění výuky prostřednictvím ICT

je konvergentní, právě když existuje číslo a R tak, že pro všechna přirozená <. Číslu a říkáme limita posloupnosti ( ) n n 1 n n n

Periodicita v časové řadě, její popis a identifikace

Transkript:

Lieárí a adaptiví zpracováí dat 9. Modely časových řad II. Daiel Schwarz Ivestice do rozvoje vzděláváí

Opakováí K čemu je dobré vytvářet modely procesů geerující časové řady? Dekompozice časový řad: jaké přístupy záte? Vyjmeujte složky, do kterých časové řady rozkládáme. Které z ich tvoří užitečou iformaci o procesu? Je ějaký rozdíl mezi sezóí a cyklickou složkou? Jaký? Defiujte stacioárí stochastický proces. Jaké máme možosti pro očištěí časových řad od tredu? Jaké máme možosti pro očištěí časových řad od sezóích vlivů? Istitute of Biostatistics ad Aalyses

Modely časových řad Jakoukoli stacioárí časovou řadu či sigál s áhodou složkou geeruje stochastický proces, kterému lze přiřadit jede z těchto modelů: čistě rekursiví model erekursiví model s klouzavým průměrem kombiovaý model bílý šum AR autoregressive MA movigaverage ARMA Istitute of Biostatistics ad Aalyses

Modely časových řad Jakoukoli stacioárí časovou řadu či sigál s áhodou složkou geeruje stochastický proces, kterému lze přiřadit jede z těchto modelů: čistě rekursiví model erekursiví model s klouzavým průměrem kombiovaý model bílý šum AR autoregressive MA movigaverage ARMA V případě estacioarity procesu, který časovou řadu geeruje, modelujeme ejdříve časovou řadu oproštěou od tredových a sezóích (cyklických) vlivů a ve výsledém modelu pak tyto vlivy opět uplatíme. Hovoří se pak i o modelech ARIMA a SARIMA. Istitute of Biostatistics ad Aalyses

Bílý šum Náhodý proces ozačujeme za bílý šum, pokud jeho středí hodota a autokorelačí fukce (ACF) splňují tyto podmíky: Diracova distribuce μ = Ε = 0, R { } N 0 (, ) = Ε{ ( ) ( )} = δ ( ). Empirická ACF 0.6 0.4 000 800 w() 0. 0-0. -0.4-0.6 0 0 40 60 80 00 Rww(,) 600 400 00 0-00 -00-50 0 50 00 - Istitute of Biostatistics ad Aalyses

Autoregresí (AR) model = a a... a p p časová řada / sigál bílý šum p řád AR modelu a i parametry modelu z z z Odhad parametrů a a a p Istitute of Biostatistics ad Aalyses

Autoregresí (AR) model = a a... a p p AR model je lieárí regrese aktuálí hodoty řady proti jedé a více předcházejícím hodotám. Aktuálí hodota časové řady je dáa lieárí kombiací jejich předchozích hodot. AR modely mají přímou a jasou iterpretaci. Rekurziví systém buzeí IIR filtru bílým šumem. Staoveí parametrů modelu: metoda ejmeších čtverců eboli miimalizace rozptylu. z z z a a a p Istitute of Biostatistics ad Aalyses

(MA) model s klouzavým průměrem = c... c c q q časová řada / sigál bílý šum q řád MA modelu μ středí hodota áhodého procesu kocetrace CO 355 350 345 340 335 330 c i parametry modelu 35 974 976 978 980 98 984 986 988 čas Odhad parametrů z z z z c c c q c q Istitute of Biostatistics ad Aalyses

(MA) model s klouzavým průměrem = c... c c q q MA model je lieárí regrese aktuálí hodoty řady ovšem tetokrát proti vzorkům bílého šumu. Komplikace: v aměřeých datech obvykle tyto šumové hodoty ejsou k dispozici MA modely mají horší iterpretaci ež AR modely. Nerekurziví systém buzeí FIR filtru bílým šumem. Staoveí parametrů modelu: elieárí iteračí techiky. z z z z c c c q c q Istitute of Biostatistics ad Aalyses

ARMA model ARMA(p, q) kombiuje AR(p) a MA(q) modely. = a a... a p p c c... c q q Boova Jekisova metodologie zahruje: idetifikaci modelu, odhad modelu, validaci modelu. Určeí řádů p, q Výpočet parametrů a i, c i Kotrola rozložeí residuí Istitute of Biostatistics ad Aalyses

ARMA model: idetifikace. Je časová řada / sigál stacioárí?. Vykazuje časová řada / sigál sezóost? ANO NE zjištěí periody T, zahrutí čleu AR(T) ebo MA(T) do modelu, případě sezóí diferece ARIMA (autoregressive itegrated movig average model) Idetifikace, odhad, validace stacioárího ARMA modelu a diferecovaých datech a ásledá úprava modelu a estacioárí model ARIMA. Př. model AR(): y = -0.406y - -0.46y - -0.005 = - - - - =-0406( - - - )-0.64( - - -3 )-0.005 =0.594-0.4-0.64-3 -0.005 Istitute of Biostatistics ad Aalyses

ARMA model: idetifikace Určeí řádů p a q a) a základě zkušeosti a eperimetováí b) spektrum: každé výrazé maimum v rozsahu <0,f vz /> vyžaduje jede pár pólů, což zvyšuje řád o. c) kritéria a základě autokorelačí fukce (ACF) a parciálí autokorelačí fukce (PACF) Srováváí teoretických průběhů ACF, PACF procesů zámých řádů s ACF, PACF aměřeých časových řad Istitute of Biostatistics ad Aalyses

Parciálí autokorelačí fukce - PACF PACF představuje korelaci mezi rezidui regresí dvou proměých vůči třetí proměé. Pro zpožděí k vyjadřuje PACF vztah mezi dvěma zpožděými vzorky časové řady a k tak, že ezapočítává lieárí vliv vzorků ležících mezi imi. PACF(k): jedá se o autokorelačí koeficiet pro zpožděí k očištěý od vlivu,,, k Istitute of Biostatistics ad Aalyses

ARMA model: idetifikace Příklad: AR() proces a = = = a a a = ( a ) = ( a)... ( a) ( a ) = z a 0 Istitute of Biostatistics ad Aalyses

Istitute of Biostatistics ad Aalyses ARMA model: idetifikace Příklad: AR() proces a = ( ) ( ) ( ) ( ) 0... a a a a a a a = = = = = { } ( ) a a a E = =, μ μ μ { } { }, a E D = = σ μ a <: ( ) { } ( ). k k a E k R = =

ARMA model: idetifikace Příklad: AR() proces = ( ) { } k R k E = ( a). a = k Istitute of Biostatistics ad Aalyses

ARMA model: idetifikace Příklad: AR() proces = ( ) { } k R k E = ( a). a = k V literatuřelze alézt teoretické vlastosti základích stacioárích procesů AR(), AR(), MA(), MA() atd. Tyto teoretické vlastosti (apř. průběhy teoretické autokorelačí fukce) se pak srovávají s empirickými vlastostmi získaými z aměřeých časových řad a výsledky porováí slouží pro idetifikaci p, q. Istitute of Biostatistics ad Aalyses

ARMA model: idetifikace Tvar ACF Epoeciála klesající k ule. Změy kladých a záporých hodot, postupý pokles k ule. Jede ebo ěkolik vrcholů,zbytek zaedbatelý, ulový. Průběhklesající až po ěkolika zpožděích Vše zaedbatelé, ulové Vysoké hodoty ve stejých itervalech Neklesá k ule Model AR(p) model. Pro určeí p se vychází z PACF, která je pro AR(p) ulová od zpožděí p. MA model. Řád odpovídá hodotě zpožděí, od kterého je ACF ulová. Kombiovaý model ARMA. Data jsou áhodá, geeruje je bílý šum. Zahrout AR čle s řádem odpovídajícím periodě. Nejedá se o stacioárí řadu / sigál. Istitute of Biostatistics ad Aalyses

ARMA model: idetifikace očištěí od tredu Detekce sezóích kompoet Perioda vzorků Istitute of Biostatistics ad Aalyses

ARMA model: idetifikace Zbývá idetifikovat ještě esezóí kompoety sigálu / řady. Sezóí diferecováí: Istitute of Biostatistics ad Aalyses

ARMA model: idetifikace Zbývá idetifikovat ještě esezóí kompoety sigálu / řady. Istitute of Biostatistics ad Aalyses

ARMA model: idetifikace Zbývá idetifikovat ještě esezóí kompoety sigálu / řady. Hledáme tzv. bod usekutí, tj. zpožděí, od kterého je PACF ulová/zaedbatelá. Istitute of Biostatistics ad Aalyses

Istitute of Biostatistics ad Aalyses ARMA model ARMA(p, q) kombiuje AR(p) a MA(q) modely. Odhad parametrů modelu iteračí algoritmy: elieárí metoda ejmeších čtverců odhad a základě maimálí věrohodosti (MLE) Vhodější tvar rovice (pro SW ástroje): q q p p c c c a a a =...... q q p p c c c a a a =......

ARMA model ARMA(p, q) kombiuje AR(p) a MA(q) modely. = a a... a p p c c... c q q Odhad parametrů modelu iteračí algoritmy: elieárí metoda ejmeších čtverců odhad a základě maimálí věrohodosti (MLE) Výsledý AR() model (pro data očištěá od lieárího tredu a sezóích vlivů).745 0. 8745 = Istitute of Biostatistics ad Aalyses

ARMA modely Validace modelu.745 0. 8745 = Zpěté ověřeí předpokladů kladeých a áhodé chyby, tj. aalýza residuí RESIDUA = CHYBY PREDIKCE Residua by měla představovat bílý šum. Istitute of Biostatistics ad Aalyses

ARMA modely Validace modelu AR().745 0. 8745 = Validace modelu AR(4).943 3.765.494 3 0. 78 4 = Istitute of Biostatistics ad Aalyses

ARMA modely Validace modelu AR().745 0. 8745 = Validace modelu ARMA(4,4).345 = 3.789.58 5.397.645 3 3.45 0.563 3 4 0.868 = 4 Istitute of Biostatistics ad Aalyses

ARMA modely Validace modelu AR().745 0. 8745 = Ai postupým avyšováím složitosti (řádu) modelu se edospělo k uspokojivým výsledkům Validace modelu ARMA(4,4) (ACF residuí eodpovídá ACF bílého šumu)..345.58.645 3 0.563 4 = V takovém případě je ejlepší ávrat k co = 3.789 5.397 3.45 0.868 ejjedoduššímu 3 4 modelu: v ukázaém příkladu se jedá o AR(). Istitute of Biostatistics ad Aalyses

ARMA modely Posouzeí kvality předpovídáí aplikace modelu a řadu zkráceou o m pozorováí, předpověď hodot m, m,, porováí.745 0. 8745 = Model: AR() Horizot predikce: Shoda: 8. % Istitute of Biostatistics ad Aalyses

ARMA modely Posouzeí kvality předpovídáí aplikace modelu a řadu zkráceou o m pozorováí, předpověď hodot m, m,, porováí.745 0. 8745 = Model: AR() Horizot predikce: 5 Shoda: < % Istitute of Biostatistics ad Aalyses

ARMA modely Posouzeí kvality předpovídáí aplikace modelu a řadu zkráceou o m pozorováí, předpověď hodot m, m,, porováí.943 3.765.494 3 0. 78 4 = Model: AR(4) Horizot predikce: Shoda: 9.0 % Istitute of Biostatistics ad Aalyses

ARMA modely Posouzeí kvality předpovídáí aplikace modelu a řadu zkráceou o m pozorováí, předpověď hodot m, m,, porováí.943 3.765.494 3 0. 78 4 = Model: AR(4) Horizot predikce: 5 Shoda: 3.3 % Istitute of Biostatistics ad Aalyses

ARMA modely Posouzeí kvality předpovídáí aplikace modelu a řadu zkráceou o m pozorováí, předpověď hodot m, m,, porováí =.345 3.789.58 5.397.645 3.45 3 3 0.563 0.868 4 = 4 Model: ARMA(4,4) Horizot predikce: Shoda: 98.6 % Istitute of Biostatistics ad Aalyses

ARMA modely Posouzeí kvality předpovídáí aplikace modelu a řadu zkráceou o m pozorováí, předpověď hodot m, m,, porováí =.345 3.789.58 5.397.645 3.45 3 3 0.563 0.868 4 = 4 Model: ARMA(4,4) Horizot predikce: 5 Shoda: 3.9 % Istitute of Biostatistics ad Aalyses

LTI systém a jeho popis y =.745 y 0. 8745 y y z z.7 0.9 Istitute of Biostatistics ad Aalyses

LTI systém a jeho popis y =.745 y 0. 8745 y y z z.7 0.9 Nesystematickou složku předložeé časové řady (měřeí kocetrace CO v ovzduší) očištěé od tredu a sezóích vlivů modelujeme jako buzeí IIR filtru druhého řádu. Istitute of Biostatistics ad Aalyses

Shrutí Popis a idetifikace systémů a procesů z z z z c c c q c q Aalýza, Simulace, Predikce, Moitorig, Diagostika, Řízeí Istitute of Biostatistics ad Aalyses

9. cvičeí ) Z předložeých dat co.csv představujících moitorig kocetrace CO v ovzduší idetifikujte a odhaděte model procesu, který tato data vygeeroval. Využijte aditiví přístup k dekompozici časových řad a dále Bo Jekisovu metodiku pro idetifikaci struktury modelu. Pro odhad parametrů modelu využijte fukce z System Idetificatio Toolbo Matlabu. Nezapomeňte svůj model validovat pomocí aalýzy residuí a po té se pokuste předpovědět kocetraci ovzduší v ásledujících letech. Istitute of Biostatistics ad Aalyses

9. cvičeí c=.459*time-537. Istitute of Biostatistics ad Aalyses

9. cvičeí Istitute of Biostatistics ad Aalyses

9. cvičeí Istitute of Biostatistics ad Aalyses

9. cvičeí Istitute of Biostatistics ad Aalyses

9. cvičeí Istitute of Biostatistics ad Aalyses

9. cvičeí Istitute of Biostatistics ad Aalyses

Istitute of Biostatistics ad Aalyses 9. cvičeí ( ) ( ) ( ) ( ) ( ) d d d d d d d d d d d d d d d d d d d d d d d d d d d d dd dd d dd dd dd dd = = = = 8 7 6 5 4 3 6 5 4 3 8 7 6 5 4 3 6 5 4 3 8 6 7 5 6 4 5 3 4 3 6 5 4 3 0.530.44 5.49 7.47 6.7 3.74 0.530.44 5.49 7.47 6.7 3.74 537..459 0.530.44 5.49 7.47 6.7 3.74 0.530.44 5.49 7.47 6.7 3.74 0.530.44 5.49 7.47 6.7 ) 3.74( 0.530.44 5.49 7.47 6.7 3.74

9. cvičeí Istitute of Biostatistics ad Aalyses

9. cvičeí Istitute of Biostatistics ad Aalyses

9. cvičeí Istitute of Biostatistics ad Aalyses

9. cvičeí Istitute of Biostatistics ad Aalyses

ffgf Otázky? schwarz@iba.mui.cz 50 Istitute of Biostatistics ad Aalyses