Lieárí a adaptiví zpracováí dat 9. Modely časových řad II. Daiel Schwarz Ivestice do rozvoje vzděláváí
Opakováí K čemu je dobré vytvářet modely procesů geerující časové řady? Dekompozice časový řad: jaké přístupy záte? Vyjmeujte složky, do kterých časové řady rozkládáme. Které z ich tvoří užitečou iformaci o procesu? Je ějaký rozdíl mezi sezóí a cyklickou složkou? Jaký? Defiujte stacioárí stochastický proces. Jaké máme možosti pro očištěí časových řad od tredu? Jaké máme možosti pro očištěí časových řad od sezóích vlivů? Istitute of Biostatistics ad Aalyses
Modely časových řad Jakoukoli stacioárí časovou řadu či sigál s áhodou složkou geeruje stochastický proces, kterému lze přiřadit jede z těchto modelů: čistě rekursiví model erekursiví model s klouzavým průměrem kombiovaý model bílý šum AR autoregressive MA movigaverage ARMA Istitute of Biostatistics ad Aalyses
Modely časových řad Jakoukoli stacioárí časovou řadu či sigál s áhodou složkou geeruje stochastický proces, kterému lze přiřadit jede z těchto modelů: čistě rekursiví model erekursiví model s klouzavým průměrem kombiovaý model bílý šum AR autoregressive MA movigaverage ARMA V případě estacioarity procesu, který časovou řadu geeruje, modelujeme ejdříve časovou řadu oproštěou od tredových a sezóích (cyklických) vlivů a ve výsledém modelu pak tyto vlivy opět uplatíme. Hovoří se pak i o modelech ARIMA a SARIMA. Istitute of Biostatistics ad Aalyses
Bílý šum Náhodý proces ozačujeme za bílý šum, pokud jeho středí hodota a autokorelačí fukce (ACF) splňují tyto podmíky: Diracova distribuce μ = Ε = 0, R { } N 0 (, ) = Ε{ ( ) ( )} = δ ( ). Empirická ACF 0.6 0.4 000 800 w() 0. 0-0. -0.4-0.6 0 0 40 60 80 00 Rww(,) 600 400 00 0-00 -00-50 0 50 00 - Istitute of Biostatistics ad Aalyses
Autoregresí (AR) model = a a... a p p časová řada / sigál bílý šum p řád AR modelu a i parametry modelu z z z Odhad parametrů a a a p Istitute of Biostatistics ad Aalyses
Autoregresí (AR) model = a a... a p p AR model je lieárí regrese aktuálí hodoty řady proti jedé a více předcházejícím hodotám. Aktuálí hodota časové řady je dáa lieárí kombiací jejich předchozích hodot. AR modely mají přímou a jasou iterpretaci. Rekurziví systém buzeí IIR filtru bílým šumem. Staoveí parametrů modelu: metoda ejmeších čtverců eboli miimalizace rozptylu. z z z a a a p Istitute of Biostatistics ad Aalyses
(MA) model s klouzavým průměrem = c... c c q q časová řada / sigál bílý šum q řád MA modelu μ středí hodota áhodého procesu kocetrace CO 355 350 345 340 335 330 c i parametry modelu 35 974 976 978 980 98 984 986 988 čas Odhad parametrů z z z z c c c q c q Istitute of Biostatistics ad Aalyses
(MA) model s klouzavým průměrem = c... c c q q MA model je lieárí regrese aktuálí hodoty řady ovšem tetokrát proti vzorkům bílého šumu. Komplikace: v aměřeých datech obvykle tyto šumové hodoty ejsou k dispozici MA modely mají horší iterpretaci ež AR modely. Nerekurziví systém buzeí FIR filtru bílým šumem. Staoveí parametrů modelu: elieárí iteračí techiky. z z z z c c c q c q Istitute of Biostatistics ad Aalyses
ARMA model ARMA(p, q) kombiuje AR(p) a MA(q) modely. = a a... a p p c c... c q q Boova Jekisova metodologie zahruje: idetifikaci modelu, odhad modelu, validaci modelu. Určeí řádů p, q Výpočet parametrů a i, c i Kotrola rozložeí residuí Istitute of Biostatistics ad Aalyses
ARMA model: idetifikace. Je časová řada / sigál stacioárí?. Vykazuje časová řada / sigál sezóost? ANO NE zjištěí periody T, zahrutí čleu AR(T) ebo MA(T) do modelu, případě sezóí diferece ARIMA (autoregressive itegrated movig average model) Idetifikace, odhad, validace stacioárího ARMA modelu a diferecovaých datech a ásledá úprava modelu a estacioárí model ARIMA. Př. model AR(): y = -0.406y - -0.46y - -0.005 = - - - - =-0406( - - - )-0.64( - - -3 )-0.005 =0.594-0.4-0.64-3 -0.005 Istitute of Biostatistics ad Aalyses
ARMA model: idetifikace Určeí řádů p a q a) a základě zkušeosti a eperimetováí b) spektrum: každé výrazé maimum v rozsahu <0,f vz /> vyžaduje jede pár pólů, což zvyšuje řád o. c) kritéria a základě autokorelačí fukce (ACF) a parciálí autokorelačí fukce (PACF) Srováváí teoretických průběhů ACF, PACF procesů zámých řádů s ACF, PACF aměřeých časových řad Istitute of Biostatistics ad Aalyses
Parciálí autokorelačí fukce - PACF PACF představuje korelaci mezi rezidui regresí dvou proměých vůči třetí proměé. Pro zpožděí k vyjadřuje PACF vztah mezi dvěma zpožděými vzorky časové řady a k tak, že ezapočítává lieárí vliv vzorků ležících mezi imi. PACF(k): jedá se o autokorelačí koeficiet pro zpožděí k očištěý od vlivu,,, k Istitute of Biostatistics ad Aalyses
ARMA model: idetifikace Příklad: AR() proces a = = = a a a = ( a ) = ( a)... ( a) ( a ) = z a 0 Istitute of Biostatistics ad Aalyses
Istitute of Biostatistics ad Aalyses ARMA model: idetifikace Příklad: AR() proces a = ( ) ( ) ( ) ( ) 0... a a a a a a a = = = = = { } ( ) a a a E = =, μ μ μ { } { }, a E D = = σ μ a <: ( ) { } ( ). k k a E k R = =
ARMA model: idetifikace Příklad: AR() proces = ( ) { } k R k E = ( a). a = k Istitute of Biostatistics ad Aalyses
ARMA model: idetifikace Příklad: AR() proces = ( ) { } k R k E = ( a). a = k V literatuřelze alézt teoretické vlastosti základích stacioárích procesů AR(), AR(), MA(), MA() atd. Tyto teoretické vlastosti (apř. průběhy teoretické autokorelačí fukce) se pak srovávají s empirickými vlastostmi získaými z aměřeých časových řad a výsledky porováí slouží pro idetifikaci p, q. Istitute of Biostatistics ad Aalyses
ARMA model: idetifikace Tvar ACF Epoeciála klesající k ule. Změy kladých a záporých hodot, postupý pokles k ule. Jede ebo ěkolik vrcholů,zbytek zaedbatelý, ulový. Průběhklesající až po ěkolika zpožděích Vše zaedbatelé, ulové Vysoké hodoty ve stejých itervalech Neklesá k ule Model AR(p) model. Pro určeí p se vychází z PACF, která je pro AR(p) ulová od zpožděí p. MA model. Řád odpovídá hodotě zpožděí, od kterého je ACF ulová. Kombiovaý model ARMA. Data jsou áhodá, geeruje je bílý šum. Zahrout AR čle s řádem odpovídajícím periodě. Nejedá se o stacioárí řadu / sigál. Istitute of Biostatistics ad Aalyses
ARMA model: idetifikace očištěí od tredu Detekce sezóích kompoet Perioda vzorků Istitute of Biostatistics ad Aalyses
ARMA model: idetifikace Zbývá idetifikovat ještě esezóí kompoety sigálu / řady. Sezóí diferecováí: Istitute of Biostatistics ad Aalyses
ARMA model: idetifikace Zbývá idetifikovat ještě esezóí kompoety sigálu / řady. Istitute of Biostatistics ad Aalyses
ARMA model: idetifikace Zbývá idetifikovat ještě esezóí kompoety sigálu / řady. Hledáme tzv. bod usekutí, tj. zpožděí, od kterého je PACF ulová/zaedbatelá. Istitute of Biostatistics ad Aalyses
Istitute of Biostatistics ad Aalyses ARMA model ARMA(p, q) kombiuje AR(p) a MA(q) modely. Odhad parametrů modelu iteračí algoritmy: elieárí metoda ejmeších čtverců odhad a základě maimálí věrohodosti (MLE) Vhodější tvar rovice (pro SW ástroje): q q p p c c c a a a =...... q q p p c c c a a a =......
ARMA model ARMA(p, q) kombiuje AR(p) a MA(q) modely. = a a... a p p c c... c q q Odhad parametrů modelu iteračí algoritmy: elieárí metoda ejmeších čtverců odhad a základě maimálí věrohodosti (MLE) Výsledý AR() model (pro data očištěá od lieárího tredu a sezóích vlivů).745 0. 8745 = Istitute of Biostatistics ad Aalyses
ARMA modely Validace modelu.745 0. 8745 = Zpěté ověřeí předpokladů kladeých a áhodé chyby, tj. aalýza residuí RESIDUA = CHYBY PREDIKCE Residua by měla představovat bílý šum. Istitute of Biostatistics ad Aalyses
ARMA modely Validace modelu AR().745 0. 8745 = Validace modelu AR(4).943 3.765.494 3 0. 78 4 = Istitute of Biostatistics ad Aalyses
ARMA modely Validace modelu AR().745 0. 8745 = Validace modelu ARMA(4,4).345 = 3.789.58 5.397.645 3 3.45 0.563 3 4 0.868 = 4 Istitute of Biostatistics ad Aalyses
ARMA modely Validace modelu AR().745 0. 8745 = Ai postupým avyšováím složitosti (řádu) modelu se edospělo k uspokojivým výsledkům Validace modelu ARMA(4,4) (ACF residuí eodpovídá ACF bílého šumu)..345.58.645 3 0.563 4 = V takovém případě je ejlepší ávrat k co = 3.789 5.397 3.45 0.868 ejjedoduššímu 3 4 modelu: v ukázaém příkladu se jedá o AR(). Istitute of Biostatistics ad Aalyses
ARMA modely Posouzeí kvality předpovídáí aplikace modelu a řadu zkráceou o m pozorováí, předpověď hodot m, m,, porováí.745 0. 8745 = Model: AR() Horizot predikce: Shoda: 8. % Istitute of Biostatistics ad Aalyses
ARMA modely Posouzeí kvality předpovídáí aplikace modelu a řadu zkráceou o m pozorováí, předpověď hodot m, m,, porováí.745 0. 8745 = Model: AR() Horizot predikce: 5 Shoda: < % Istitute of Biostatistics ad Aalyses
ARMA modely Posouzeí kvality předpovídáí aplikace modelu a řadu zkráceou o m pozorováí, předpověď hodot m, m,, porováí.943 3.765.494 3 0. 78 4 = Model: AR(4) Horizot predikce: Shoda: 9.0 % Istitute of Biostatistics ad Aalyses
ARMA modely Posouzeí kvality předpovídáí aplikace modelu a řadu zkráceou o m pozorováí, předpověď hodot m, m,, porováí.943 3.765.494 3 0. 78 4 = Model: AR(4) Horizot predikce: 5 Shoda: 3.3 % Istitute of Biostatistics ad Aalyses
ARMA modely Posouzeí kvality předpovídáí aplikace modelu a řadu zkráceou o m pozorováí, předpověď hodot m, m,, porováí =.345 3.789.58 5.397.645 3.45 3 3 0.563 0.868 4 = 4 Model: ARMA(4,4) Horizot predikce: Shoda: 98.6 % Istitute of Biostatistics ad Aalyses
ARMA modely Posouzeí kvality předpovídáí aplikace modelu a řadu zkráceou o m pozorováí, předpověď hodot m, m,, porováí =.345 3.789.58 5.397.645 3.45 3 3 0.563 0.868 4 = 4 Model: ARMA(4,4) Horizot predikce: 5 Shoda: 3.9 % Istitute of Biostatistics ad Aalyses
LTI systém a jeho popis y =.745 y 0. 8745 y y z z.7 0.9 Istitute of Biostatistics ad Aalyses
LTI systém a jeho popis y =.745 y 0. 8745 y y z z.7 0.9 Nesystematickou složku předložeé časové řady (měřeí kocetrace CO v ovzduší) očištěé od tredu a sezóích vlivů modelujeme jako buzeí IIR filtru druhého řádu. Istitute of Biostatistics ad Aalyses
Shrutí Popis a idetifikace systémů a procesů z z z z c c c q c q Aalýza, Simulace, Predikce, Moitorig, Diagostika, Řízeí Istitute of Biostatistics ad Aalyses
9. cvičeí ) Z předložeých dat co.csv představujících moitorig kocetrace CO v ovzduší idetifikujte a odhaděte model procesu, který tato data vygeeroval. Využijte aditiví přístup k dekompozici časových řad a dále Bo Jekisovu metodiku pro idetifikaci struktury modelu. Pro odhad parametrů modelu využijte fukce z System Idetificatio Toolbo Matlabu. Nezapomeňte svůj model validovat pomocí aalýzy residuí a po té se pokuste předpovědět kocetraci ovzduší v ásledujících letech. Istitute of Biostatistics ad Aalyses
9. cvičeí c=.459*time-537. Istitute of Biostatistics ad Aalyses
9. cvičeí Istitute of Biostatistics ad Aalyses
9. cvičeí Istitute of Biostatistics ad Aalyses
9. cvičeí Istitute of Biostatistics ad Aalyses
9. cvičeí Istitute of Biostatistics ad Aalyses
9. cvičeí Istitute of Biostatistics ad Aalyses
Istitute of Biostatistics ad Aalyses 9. cvičeí ( ) ( ) ( ) ( ) ( ) d d d d d d d d d d d d d d d d d d d d d d d d d d d d dd dd d dd dd dd dd = = = = 8 7 6 5 4 3 6 5 4 3 8 7 6 5 4 3 6 5 4 3 8 6 7 5 6 4 5 3 4 3 6 5 4 3 0.530.44 5.49 7.47 6.7 3.74 0.530.44 5.49 7.47 6.7 3.74 537..459 0.530.44 5.49 7.47 6.7 3.74 0.530.44 5.49 7.47 6.7 3.74 0.530.44 5.49 7.47 6.7 ) 3.74( 0.530.44 5.49 7.47 6.7 3.74
9. cvičeí Istitute of Biostatistics ad Aalyses
9. cvičeí Istitute of Biostatistics ad Aalyses
9. cvičeí Istitute of Biostatistics ad Aalyses
9. cvičeí Istitute of Biostatistics ad Aalyses
ffgf Otázky? schwarz@iba.mui.cz 50 Istitute of Biostatistics ad Aalyses