3. Metody analýzy časových řad v klimatologii

Podobné dokumenty
Úvod do vícerozměrných metod. Statistické metody a zpracování dat. Faktorová a komponentní analýza (Úvod do vícerozměrných metod)

Statistické metody a zpracování dat. IX Faktorová a komponentní analýza (Úvod do vícerozměrných metod) Petr Dobrovolný

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů

Úvod do zpracování signálů

1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

AVDAT Mnohorozměrné metody metody redukce dimenze

Statistická analýza jednorozměrných dat

Signál v čase a jeho spektrum

Analýza hlavních komponent

vzorek vzorek

Přednáška 13 Redukce dimenzionality

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

Regresní analýza 1. Regresní analýza

Testování hypotéz o parametrech regresního modelu

KGG/STG Statistika pro geografy. Mgr. David Fiedor 4. května 2015

Testování hypotéz o parametrech regresního modelu

Ekonometrie. Jiří Neubauer

Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Klasifikace a rozpoznávání. Extrakce příznaků

Statistika II. Jiří Neubauer

TERMINOLOGIE ... NAMĚŘENÁ DATA. Radek Mareček PŘEDZPRACOVÁNÍ DAT. funkční skeny

Osnova. Idea ASK/FSK/PSK ASK Amplitudové... Strana 1 z 16. Celá obrazovka. Konec Základy radiotechniky

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

doc. Dr. Ing. Elias TOMEH Elias Tomeh / Snímek 1

Vícerozměrné statistické metody

SIGNÁLY A SOUSTAVY, SIGNÁLY A SYSTÉMY

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Korelační a regresní analýza

Úvodem Dříve les než stromy 3 Operace s maticemi

POZNÁMKY K PŘEDMĚTU PROJEKT

Lineární a adaptivní zpracování dat. 1. ÚVOD: SIGNÁLY a SYSTÉMY

FOURIEROVA ANAL YZA 2D TER ENN ICH DAT Karel Segeth

Měření závislosti statistických dat

Charakterizace rozdělení

Počítačová analýza vícerozměrných dat v oborech přírodních, technických a společenských věd

KLIMATICKÝ DOWNSCALING. ZOO76 Meteorologie a klimatologie Petr Kolář PřF MU Brno

MKI Funkce f(z) má singularitu v bodě 0. a) Stanovte oblast, ve které konverguje hlavní část Laurentova rozvoje funkce f(z) v bodě 0.

Funkce komplexní proměnné a integrální transformace

Faktorová analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Univerzita Pardubice 8. licenční studium chemometrie

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

4.1 Metoda horizontální a vertikální finanční analýzy

n = 2 Sdružená distribuční funkce (joint d.f.) n. vektoru F (x, y) = P (X x, Y y)

Požadavky k písemné přijímací zkoušce z matematiky do navazujícího magisterského studia pro neučitelské obory

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Zpracování digitalizovaného obrazu (ZDO) - Popisy III

Matematika pro geometrickou morfometrii

Úvod do analýzy časových řad

Vícerozměrná rozdělení

Tomáš Karel LS 2012/2013

Analýza teplotních. řad. Petr Štěpánek. Czech Hydrometeorological Institute, regional office Brno

INDUKTIVNÍ STATISTIKA

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy

SIGNÁLY A LINEÁRNÍ SYSTÉMY

SPC v případě autokorelovaných dat. Jiří Michálek, Jan Král OSSM,

4EK211 Základy ekonometrie

Základy a aplikace digitálních. Katedra radioelektroniky (13137), blok B2, místnost 722

5 Časové řady. Definice 16 Posloupnost náhodných veličin {X t, t T } nazveme slabě stacionární, pokud

Pravděpodobnost a statistika (BI-PST) Cvičení č. 7

Digitalizace převod AS DS (analogový diskrétní signál )

Semestrální projekt. Vyhodnocení přesnosti sebelokalizace VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. Fakulta elektrotechniky a komunikačních technologií

Úvod do problematiky měření

Motivace příklad použití lokace radarového echa Význam korelace Popis náhodných signálů číselné charakteristiky

KGG/STG Statistika pro geografy

Šum a jeho potlačení. Michal Švanda. Astronomický ústav MFF UK Astronomický ústav AV ČR. Spektroskopie (nejen) ve sluneční fyzice LS 2011/2012

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

ZX510 Pokročilé statistické metody geografického výzkumu

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Plánování experimentu

P7: Základy zpracování signálu

ZPRACOVÁNÍ SIGNÁLŮ Z MECHANICKÝCH. Jiří Tůma

MATEMATICKÉ PRINCIPY VÍCEROZMĚRNÉ ANALÝZY DAT

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

(n, m) (n, p) (p, m) (n, m)

Pravděpodobnost a aplikovaná statistika

Základní metody číslicového zpracování signálu a obrazu část II.

8 ANALÝZA ČASOVÝCH ŘAD SEZÓNNÍ SLOŽKA

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

AVDAT Náhodný vektor, mnohorozměrné rozdělení

SIGNÁLY A LINEÁRNÍ SYSTÉMY

Lineární a adaptivní zpracování dat. 1. ÚVOD: SIGNÁLY, ČASOVÉ ŘADY a SYSTÉMY

Periodicita v časové řadě, její popis a identifikace, exponenciální vyrovnáván

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Statistická analýza jednorozměrných dat

Ilustrační příklad odhadu LRM v SW Gretl

Číslicové zpracování signálů a Fourierova analýza.

Výstupy z výukové jednotky. 2. Princip faktorové analýzy

4EK211 Základy ekonometrie

Inovace bakalářského studijního oboru Aplikovaná chemie

Lineární a adaptivní zpracování dat. 1. ÚVOD: SIGNÁLY, ČASOVÉ ŘADY a SYSTÉMY

Univerzita Karlova v Praze procesy II. Zuzana. funkce

Neuronové časové řady (ANN-TS)

PRAVDĚPODOBNOST A STATISTIKA

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Lineární a adaptivní zpracování dat. 3. SYSTÉMY a jejich popis ve frekvenční oblasti

Statistika II. Jiří Neubauer

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.

Transkript:

3. Metody analýzy časových řad v klimatologii 3.1 Periodicita a cykličnost Klima je vyjádřeno různými prvky (např. teplota vzduchu, srážky, indexy), kolísajícími v prostoru a čase: {a, b, c, } = f (x, y, z, t), a, b, c, jsou prvky klimatu, x, y, z jsou prostorové souřadnice a t je čas. Při studiu časových změn platí pro dané místo {a, b, c, } = f (t). Informace o časových změnách je získávána v podobě časové řady {ai, bi, ci, } = f (ti) s ti+1 ti = t = konst., i = 1, 2,, n t je časový interval (např. den, měsíc, rok) a n je délka řady. Typy kolísání v časových řadách Periodická: s periodou T Cyklická (kvaziperiodická, rytmická): s periodou T Transientní: lineární nebo nelineární trend Náhodná (stochastická)

Perioda T Cyklus T Náhodnost Cyklus s periodou Tp: t << Tp << n t Vnitřní cykly: Tp < t Vnější cykly: Tp > n t Podmínky aplikovatelnosti statistických metod nezávislost hodnot časové řady stacionarita řady, tj. statistické charakteristiky řady Sj (j = 1,2,, J) jsou časově nezávislé, tedy Sj / t = konst. ergodicita, tj. průměr dané řady (výběrový soubor) s jejím prodlužováním v časovém intervalu L se blíží střední hodnotě celé řady (základního souboru) Nesplnění podmínek: výsledky analýzy mají platnost pouze pro danou realizaci časové řady (tj. daný výběr), je třeba testovat výsledky se zřetelem na vlastnosti základního souboru. Nestacionarita přirozená vlastnost klimatických řad (změny a kolísání klimatu).

3.2 Korelační analýza Korelační koeficient Podmínka použití: hodnoty obou řad jsou nezávislé a mají přibližně normální rozdělení. Autokorelační koeficient Autokovariance Autokorelace

Křížově-korelační koeficient 3.3 Harmonická analýza

Řada spojitá, nekonečná a periodická superpozice konečného počtu sinových a kosinových funkcí Fourierova analýza Fourierova řada: Pro klimatologické řady, nesplňující uvedené podmínky, lze nahradit Fourierovy koeficienty Besselovou formulí, aplikovatelnou pro přibližně periodickou řadu: Počet harmonik hi = P/i je N/2, hmin = 2 t, hmax = P.

Falešný efekt (aliasing effect) skutečná kolísání s periodou T1 (5/4 T) mohou být se zřetelem na interval měření t chybně interpretována periodou T2 (5 T), kde T2 > T1 3.4 Spektrální analýza

Interpretace spektra a) Periodická funkce s periodou T1 b) Periodická funkce s periodami T1 a T2 c) Cyklická kolísání se střední periodou T d) Náhodná čísla (tzv. bílý šum nebo bílé spektrum) e) Náhodná čísla s trendem (tzv. rudý šum nebo rudé spektrum)

Schéma spektrální analýzy maximální entropie (Maximum Entropy Spectral Analysis MESA)

3.5 Křížově-spektrální a koherenční analýza Cxy(h) vyjadřuje podíl oscilací různých frekvencí na celkové kovarianci při nulovém posunu. Qxy(h) vyjadřuje podíl různých harmonik na celkové kovarianci (harmoniky řady x jsou posunuty o ¼ periody zpět a řada y je beze změny).

3.6. Filtrace Schéma filtrace časové řady Filtrační funkce a časová řada a) Bez filtrace výchozí údaje b) Nízkofrekvenční filtrace c) Vysokofrekvenční filtrace d) Pásmová filtrace

Pásmový filtr

3.7 Metody klouzavé analýzy - podmínka stacionarity časové řady může být snadněji splněna v jejich kratších realizacích aplikace metod klouzavé analýzy Schéma výpočtu dynamické (klouzavé) MESA

Time series analysis

3.8 Wavelet analýza - časově-frekvenční analýza signálu v nestacionárních řadách

Tab. 1. Mateřské wavelety DOC, Paul, Haar, Kotlet Obr. 1. Reálná (plně) a imaginární (přerušovaně) části mateřských waveletů

Obr. 2. Generace waveletů posun a kontrakce mateřského waveletu pro různé σ a λ

Výběr mateřského waveletu Morlet dobré časové a frekvenční rozlišení Paul malý cone of influence (nekorektní výsledky) Zobrazení výsledků wavelet power spektrum kvadrát absolutní hodnoty wavelet transformace globální wavelet spektrum integrál wavelet power spektra podél časové osy

Rekonstrukce testovacího signálu původní signál x(t) Pmax určuje hranice největší (vpravo), resp. nejmenší (vlevo) detekované periody. rozdíl původního a rekonstruovaného signálu rekonstrukce signálu (inverzní wavelet transformace)

3.9 Analýza hlavních komponent (Principal Component Analysis) Cílem metody je eliminování duplicit a zhuštění informace obsažené v původních proměnných do menšího počtu vzájemně nekorelovaných proměnných. Tyto nové proměnné (hlavní komponenty) popisují soubor syntetičtěji a úsporněji. Redukce dimenzionality příliš mnoho proměnných Příklady: jedna meteorologická proměnná měřená v n případech na p místech p meteorologických proměnných měřených na n stanicích v jednom případě p meteorologických proměnných měřených na jedné stanici v n případech. Je-li p proměnných vysoce korelováno, lze vybrat m proměnných (m << p), které poskytují veškerou originální informaci o p proměnných. Strategie výběru m proměnných: podsoubor z originálních p proměnných vytvoření nových proměnných z p původních, které jsou od nich typově odlišné (při téže ztrátě informace lze získat větší redukci dimenzionality) Analýza hlavních komponent p proměnných x1, x2,, xp lineární funkce p proměnných: z = a1x1 + a2x2 + + apxp, kde a1, a2,..., ap jsou konstanty změní-li se konstanty, dostaneme odlišnou lineární funkci a lze spočítat její rozptyl první hlavní komponenta (PC1) je lineární funkcí, která má maximální možný rozptyl, druhá hlavní komponenta (PC2) je lineární funkcí s maximálně možným rozptylem nekorelovatelná s PC2, třetí hlavní komponenta PC3 je lineární funkcí s maximálně možným rozptylem nekorelovatelná s PC1 a PC2, atd. PCA nabízí m-dimenzionální prezentaci údajů pro m = 1, 2,, p 1, tedy pro každé m = 1, 2,, p 1 dostáváme m lineárních funkcí proměnných x1, x2,, xp ukazující maximálně možný podíl originálních variací

Příklad (dvourozměrný): 50 měření teploty půdy (x1) a teploty vzduchu (x2) lineární funkce x1 a x2 objasňuje více kolísání než každá proměnná samostatně lineární funkce, která maximalizuje rozptyl, je první PC z1, tj. všechna kolísání mohou být nyní vyjádřena s ohledem na z1 obrázky se shodují s tím, že došlo k rotaci os druhá PC (z2) jde pak kolmo na z1 PC minimalizuje sumu čtverců podle vzdáleností kolmých k z1 (předchozí podle vertikálních vzdáleností) Vlastní hodnoty a vlastní vektory (eigenvalues and eigenvectors) k-tá hlavní komponenta je dána vztahem z1 = ak1x1 + ak2x2 + + akpxp pro k = 1, 2,, p vlastní vektory: první vlastní vektor koeficienty a11, a12,, a1p; další vlastní vektory jsou tvořeny koeficienty u proměnných x1, x2,, xp vlastní hodnota rozptyl první hlavní komponenty (míra významnosti objasněných kolísání) Vstupní matice výpočtu a standardizace hodnot standardizací se přisuzuje proměnným stejná váha (např. proměnné v různých jednotkách) t i x = i µ σ

Příklad typický výstup PCA (I) pořadové číslo nové proměnné (PC - hlavní komponenty) vlastní hodnota část z celkového rozptylu původních dat vysvětlená každou z nových komponent procentuální vyjádření množství rozptylu vysvětleného komponentou kumulativní hodnota procentuálního podílu vysvětleného příslušnými komponentani (např. první 4 komponenty vysvětlují 85,68 % celkové variability původních dat) tzv. sutinový graf sloužící k určení počtu významných komponent Příklad typický výstup PCA (II) Tzv. zátěže (loadings) - představují míru korelace mezi původními a novými proměnnými. Doporučená literatura: Brázdil, R. (1991): Kolísání vybraných meteorologických prvků ve střední Evropě v období přístrojových pozorování. Národní klimatický program ČSFR, sv. 2, Praha, 56 s. Pišoft, P., Kalvová, J. (2005): Wavelet analýza v meteorologii: teorie a přehled dosavadních výsledků. Meteorologické zprávy, 58, č. 1, s. 1-6. Pišoft, P., Kalvová, J., Brázdil, R. (2004): Cycles and trends in the Czech temperature series using wavelet transforms. International Journal of Climatology, 24, 1661-1670. Schönwiese, C.-D. (1985): Praktische Statistik für Meteorologen und Geowissenschaftler. Gebrüder Borntraeger, Berlin, Stuttgart, 231 s. Storch, H. von, Zwiers, F. W. (1999): Statistical Analysis in Climate Research. Cambridge University Press, Cambridge, 484 s.