Neuronové časové řady (ANN-TS)



Podobné dokumenty
Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Lineární regrese. Komentované řešení pomocí MS Excel

Neuronová síť. x 2 x 3. σ j. x 4. x 5. Menu: QCExpert Prediktivní metody

Plánování experimentu

Simulace. Simulace dat. Parametry

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

Partial Least Squares regrese (PLS-R)

Zobecněná analýza rozptylu, více faktorů a proměnných

PRAVDĚPODOBNOST A STATISTIKA

Tabulka 1 Příklad dat pro kalibraci

Porovnání dvou výběrů

Popisná statistika. Komentované řešení pomocí MS Excel

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

Plánování experimentu

Semestrální práce. 3.3 Tvorba nelineárních regresních modelů v analýze dat

S E M E S T R Á L N Í

Téma 9: Vícenásobná regrese

8 ANALÝZA ČASOVÝCH ŘAD SEZÓNNÍ SLOŽKA

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

Regresní analýza 1. Regresní analýza

Periodicita v časové řadě, její popis a identifikace, exponenciální vyrovnáván

Plánované experimenty - Návrh

INDUKTIVNÍ STATISTIKA

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

PowerOPTI Řízení účinnosti tepelného cyklu

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica

vzorek vzorek

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

11MAMY LS 2017/2018. Úvod do Matlabu. 21. února Skupina 01. reseni2.m a tak dále + M souborem zadané funkce z příkladu 3 + souborem skupina.

7. Rozdělení pravděpodobnosti ve statistice

PRAVDĚPODOBNOST A STATISTIKA

UNIVERZITA PARDUBICE

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Stupnice geomagnetické aktivity

Tvorba nelineárních regresních

Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1

Popisná statistika kvantitativní veličiny

Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice

Zápočtová práce STATISTIKA I

Obr. P1.1 Zadání úlohy v MS Excel

Algoritmy a struktury neuropočítačů ASN - P10. Aplikace UNS v biomedicíně

Kalibrace a limity její přesnosti

Souhrnné výsledky za školu

Vývoj obchodní letecké přepravy cestujících v ČR Časové řady Seminář výpočetní statistiky

Regresní a korelační analýza

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Rosenblattův perceptron

STATISTICA Téma 8. Regresní a korelační analýza, regrese prostá

Uživatelská doumentace

PRAVDĚPODOBNOST A STATISTIKA

Cvičení 9 dekompozice časových řad a ARMA procesy

Aplikovaná matematika I

0.1 Úvod do matematické analýzy

Statistická analýza jednorozměrných dat

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

II. Úlohy na vložené cykly a podprogramy

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Česká zemědělská univerzita v Praze. Provozně ekonomická fakulta. Statistické softwarové systémy projekt

KVADRATICKÁ FUNKCE URČENÍ KVADRATICKÉ FUNKCE Z PŘEDPISU FUNKCE

BALISTICKÝ MĚŘICÍ SYSTÉM

Řízení projektů. Konstrukce síťového grafu pro řízení projektů Metoda CPM Metoda PERT

Tvorba nelineárních regresních modelů v analýze dat

6. Lineární regresní modely

Časové řady, typy trendových funkcí a odhady trendů

fakulty MENDELU v Brně (LDF) s ohledem na disciplíny společného základu (reg. č. CZ.1.07/2.2.00/28.

Vyhodnocení 2D rychlostního pole metodou PIV programem Matlab (zpracoval Jan Kolínský, dle programu ing. Jana Novotného)

( + ) ( ) f x x f x. x bude zmenšovat nekonečně přesný. = derivace funkce f v bodě x. nazýváme ji derivací funkce f v bodě x. - náš základní zápis

Funkce - pro třídu 1EB

LDF MENDELU. Simona Fišnarová (MENDELU) Základy lineárního programování VMAT, IMT 1 / 25

Regrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly:

Úvod do analýzy časových řad

Bodové a intervalové odhady parametrů v regresním modelu

UNIVERZITA PARDUBICE

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Úloha 1. Napište matici pro případ lineárního regresního spline vyjádřeného přes useknuté

5. Umělé neuronové sítě. Neuronové sítě

10. Předpovídání - aplikace regresní úlohy

Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Kalibrace a limity její přesnosti

Přílohy. Příloha 1. Obr. P1.1 Zadání úlohy v MS Excel

Kapitola 2. o a paprsek sil lze ztotožnit s osou x (obr.2.1). sil a velikost rovnou algebraickému součtu sil podle vztahu R = F i, (2.

Časové řady, typy trendových funkcí a odhady trendů

a se nazývá aritmetická právě tehdy, když existuje takové číslo d R

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie

Chyby měření 210DPSM

Numerické metody zpracování výsledků

Chyby nepřímých měření

ANTAGONISTICKE HRY 172

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Protokol č. 1. Tloušťková struktura. Zadání:

4EK211 Základy ekonometrie

Měření modulů pružnosti G a E z periody kmitů pružiny

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ

Úvod do zpracování signálů

Transkript:

Neuronové časové řady (ANN-TS) Menu: QCExpert Prediktivní metody Neuronové časové řady Tento modul (Artificial Neural Network Time Series ANN-TS) využívá modelovacího potenciálu neuronové sítě k predikci a předpovědi budoucích hodnot jednorozměrné časové řady. Za jednorozměrnou časovou řadu zde považujeme posloupnost n naměřených hodnot y i, o nichž se předpokládá, že - jsou naměřeny v pravidelných časových okamžicích (takže informaci o čase měření lze nahradit pouhým pořadovým číslem měření bez ztráty informace), případně se jedná o posloupnost jednotlivých diskrétních entit (např. jednotlivé výrobky vyráběné po sobě ne nutně v pravidelných časových intervalech); - mohou nabývat libovolných reálných hodnot (to znamená, že nejsou omezeny jen na celá čísla, případně nečíselné hodnoty, tedy případná předpověď reálných čísel bude dávat smysl; - každá naměřená hodnota nějak závisí na hodnotách naměřených před ní, tedy y i = G(y i-1, y i-2, y i-r ) + i, zkráceně G(i, r) + i, kde r < n nazveme hloubkou modelu. Jako příklady takových časových řad lze uvést technologické veličiny, periodicky měřené výsledky výrobních procesů, nestabilita procesů, parametry přírodních systémů, vývoj finančních a ekonomických indexů, kurzů, cen a podobně. Nalezením vztahu G() lze pak predikovat z r-tice posloupnosti naměřených hodnot hodnotu následující. Rozlišujeme dva druhy predikce predikci hodnoty, která byla naměřena, tedy lze odhadnout chybu predikce y k G(k, r), a předpověď (prognózu) hodnot v yˆ G n 1, r. Pokud přidáme předpověděnou hodnotu budoucnosti, které ješte neznáme: n 1 k hodnotám již známým a budeme ji považovat za správně odhadnutou, můžeme rekurzivně předpovídat další neznámé hodnoty v budoucnosti. Je ovšem třeba si uvědomit, že každá další předpověď je zatížena rostoucí chybou, jejíž velikost není známa. To je částečně vyřešeno v následujícím modulu ANN-TS: Para-Bootstrap, kde je možné simulovat intervaly spolehlivosti předpovědi. Jako model G použijeme neronovou síť s r vstupními proměnnými a jednou výstupní proměnnou. Tento modul nabízí dva typy modelů: Autoregresní model vycházející přímo z naměřených hodnot (model AR) a model vycházející z prvních diferencí (model DIFF). Obecně se modely typu AR spíše hodí pro modelování stacionárních řad, kdy se budoucí hodnoty nedostanou mimo interval, v němž se nacházejí již naměřené hodnoty. Model typu DIFF je spíše vhodný tam, kde není vhodný model AR, tedy pro nestacionární řady, řady se systematickým lineárním trendem a řady, u nichž se očekávají v budoucnosti hodnoty mimo dosavadní minimum a maximum. Další podrobnosti a popis je shodný s kapitolou neuronové sítě. Data a parametry Data pro tento model tvoří jeden sloupec v datovém listu. Detaily výpočtu se nastavují v sérii 3 dialogových oken (viz Obrázek 1, Obrázek 2, Obrázek 3). V prvním okně se vybere sloupec s daty, typ modelu (AR nebo DIFF), hloubka modelu (počet hodnot z nichž se bude proedikovat následující hodnota), délka předpovědi, případně délka validace modelu.

Obrázek 1 Výběr proměnných Obrázek 2 Topologie sítě a parametry optimalizace Obrázek 3 Okno řízení optimalizace sítě Délka předpovědi definuje počet předpovědí budoucích, dosud neznámých hodnot. U většiny reálných řad lze předpovědět jen několik hodnot do budoucnosti. U řad s výraznou (i když složitou) periodickou složkou lze úspěšně předpovídat i desítky hodnot. Validace slouží k orientační představě o přesnosti a úspěšnosti předpovědi. Provede se předpověď posledních q naměřených hodnot z hodnot předcházejících. Počet q validovaných hodnot zadá uživatel v políčku Validace. Nelze současně validovat a předpovídat, proto je vhodné provést nejdříve výpočet s validací a po posouzení úspěšnosti teprve provést předpověď odpovídajícího počtu hodnot v budoucnosti.

Význam a popis dalších oken a funkcí je podobný jako v kapitole Neuronové sítě. Tlačítkem Uložit model se aktuálně vypočítaný model uloží do souboru pro pozdější použití v modulu Predikce, případně k automatickým predikcím v inteligentní databázi QCE-DataCenter. Protokol Název úlohy Data Typ modelu Hloubka modelu Délka předpovědi Validace Nezávisle proměnné Typ transformace Závisle proměnné Typ transformace Vrstva, Neuronů Strmost sigmoidy Moment Rychlost učení Ukončit při chybě Procent dat pro učení (%) Podmínky ukončení optimalizace Výpočet Počet iterací Maximální chyba pro učící data Střední chyba pro učící data Maximální chyba pro testovací data Střední chyba pro testovací data Váhy Vrstva / Neuron Relativní vliv Časová řada Zadaný název úlohy Zvolený typ modelu AR nebo DIFF Zvolený počet prediktorů pro předpověď Zvolená délka předpovědi Zvolený počet dat na konci řady použitých pro validaci modelu Seznam nezávisle proměnných jako číslovaný seznam zvoleného sloupce s časovým posunem Tedy pro sloupec X bude X3 znamenat X[i-3] Typ transformace nezávisle proměnných Název vybraného sloupce Typ transformace závisle proměnných Číslo vrstvy a počet neuronů ve vrstvě Zadaná strmost sigmoidy Zadaný moment Zadaná rychlost učení Kritérium chyby pro ukončení Procent dat pro učení (%), je-li vybráno Zadané terminační podmínky pro ukončení výpočtu Informace o průběhu výpočtu Skutečný počet iterací Dosažená maximální chyba pro učící data Dosažená střední chyba pro učící data Dosažená maximální chyba pro testovací data Dosažená střední chyba pro testovací data Vypočítané optimální váhy neuronové sítě Číslo vrstvy a číslo neuronu Relativní vliv X[i-j] na X[i] určený podle normy příslušných vah v neuronové síti. Tabulka naměřených hodnot a jejich predikcí a reziduí.

Grafy Graf časové řady s predikcí nebo validací (dle zadané volby). Zobrazuje naměřené hodnoty (modře) a vypočítané hodnoty (zeleně). Svislá přímka označuje začátek předpovědi, nebo validace. Od tohoto místa vpravo nemá model k dispozici data a zelené hodnoty předpovědi jsou vypočítané pouze na základě dat vlevo od této svislé hranice. Graf reziduí, tedy odchylek naměřených hodnot od predikce, nebo předpověděných hodnot od validačních dat. Grafické vyjádření architektury sítě. Byla-li při výpočtu vybrána možnost Grafické znázornění vah, pak tloušťka synapsí znázorňuje absolutní velikost odpovídající váhy a tím také množství informace, která teče mezi dvěma neurony. Podle tloušťky synapse se tak dá usuzovat na významnost nezávisle proměnné (vychází z ní tlusté synapse) a také na kvalitu predikce jednotlivých závisle proměnných (vchází do ní tlusté synapse). Barva synapsí určuje pouze znaménko váhy (červená = záporná váha, modrá = kladná váha). Byla-li vybrána možnost Popis neuronu z názvu, použije se název sloupce jako popis vstupních a výstupních neuronů.

Relativní vliv prediktorů na predikci vyjádřený jako součet absolutních vah jednotlivých prediktorových proměnných. Tato statistika je pouze mírou vlivu proměnných na odezvu, není testem významnosti. Tento graf má reálnou vypovídací schopnost pouze při vhodné volbě modelu. A Graf učicího procesu, pokles součtu čtverců rozdílů predikce a skutečných hodnot závisle proměnné v závislosti na počtu iterací. Na obrázku je typický úspěšný učicí proces, který postupně zlepšoval model pro zadaná data.