L 12 Statistická adaptace. Oddělení numerické předpovědi počasí ČHMÚ 2007



Podobné dokumenty
Základy. analýzy hlavních komponent a multivariačních regresních metod pro spektrální analýzu

Tvorba trendové funkce a extrapolace pro roční časové řady

1.3.1 Kruhový pohyb. Předpoklady: 1105

Vzdělávací oblast: Matematika a její aplikace. Obor vzdělávací oblasti: Seminář z matematiky. Ročník: 7. Poznámky

6 HYDROLOGICKÉ SIMULACE S PŘEDSTIHEM 10 DNÍ

SPOLEHLIVOST KONSTRUKCÍ & TEORIE SPOLEHLIVOSTI část 2: Statistika a pravděpodobnost

STATISTICKÁ PŘEDPOVĚĎ ZNEČIŠTĚNÍ OVZDUŠÍ, NÁVRH A TESTY METODY. Josef Keder. ČHMÚ ÚOČO, Observatoř Tušimice keder@chmi.cz

{ } Kombinace II. Předpoklady: =. Vypiš všechny dvoučlenné kombinace sestavené z těchto pěti prvků. Urči počet kombinací pomocí vzorce.

Předpovědní povodňová služba v červnu Radek Čekal cekal@chmi.cz

C v celé výkonnostní třídě.

Testování výškové přesnosti navigační GPS pro účely (cyklo)turistiky

Hodnocení způsobilosti procesu. Řízení jakosti

Klima Vsetína. RNDr. Bořek NAVRÁTIL Vedoucí práce: doc. RNDr. Miroslav VYSOUDIL, CSc.

1. Cizinci v České republice

( ) Kreslení grafů funkcí metodou dělení definičního oboru I. Předpoklady: 2401, 2208

3.2.4 Podobnost trojúhelníků II

2.7.2 Mocninné funkce se záporným celým mocnitelem

Nerovnice s absolutní hodnotou

3. Ve zbylé množině hledat prvky, které ve srovnání nikdy nejsou napravo (nevedou do nich šipky). Dát do třetí

Úvod. Analýza závislostí. Přednáška STATISTIKA II - EKONOMETRIE. Jiří Neubauer

4.6.6 Složený sériový RLC obvod střídavého proudu

E-ZAK. metody hodnocení nabídek. verze dokumentu: QCM, s.r.o.

Téma 10: Podnikový zisk a dividendová politika

Internetová agentura. Předimplementační analýza webu

Analýza časových řad formální komunikace obcí

PŘEDSTAVENÍ PROJEKTU ZPOPLATŇOVÁNÍ ÚSEKŮ POZEMNÍCH KOMUNIKACÍ. Ing. Veronika Dvořáková, Ph.D. 11. prosince 2015, Brno

A. Struktura grafického kódu na dokladech o získání základního vzdělání

DUM 11 téma: Nástroje pro transformaci obrázku

Uplatnění nových informačních technologií ve výuce a na zdravotnickém pracovišti. Marie Marková

2.8.9 Parametrické rovnice a nerovnice s absolutní hodnotou

Kvadratické rovnice pro učební obory

Praktikum II Elektřina a magnetismus

JAK PŘIDAT UŽIVATELE PRO ADMINISTRÁTORY

Dopravní úloha. Jiří Neubauer. Katedra ekonometrie FEM UO Brno

4.2.7 Voltampérová charakteristika rezistoru a žárovky

2.7.1 Mocninné funkce s přirozeným mocnitelem

Metodické principy NIL

Preference politických subjektů - únor celkový přehled 10,5% 10,0% 7,9% 5,9% 5,2% 5,0% 4,7% 1,6% 1,6% 1,6% 1,4% 1,4% 0%

LABORATORNÍ CVIČENÍ Elektrotechnika a elektronika

Katedra matematiky Matematika a byznys Příklady odhadů a předpovědí časových posloupností

PRAVDĚPODOBNOST A STATISTIKA OPAKOVÁNÍ, pro rozpoznávání

M-10. AU = astronomická jednotka = vzdálenost Země-Slunce = přibližně 150 mil. km. V následující tabulce je závislost doby

PC, POWER POINT, dataprojektor

1 Typografie. 1.1 Rozpal verzálek. Typografie je organizace písma v ploše.

Vlak dětství a naděje opět nalezl své diváky

Úpravy skříní a čelních ploch pro úchopovou lištou

PŘÍLOHA č. 2B PŘÍRUČKA IS KP14+ PRO OPTP - ŽÁDOST O ZMĚNU

1.1.1 Kvadratické rovnice (dosazení do vzorce) I

(a) = (a) = 0. x (a) > 0 a 2 ( pak funkce má v bodě a ostré lokální maximum, resp. ostré lokální minimum. Pokud je. x 2 (a) 2 y (a) f.

9.2.5 Sčítání pravděpodobností I

INŽENÝRSKÁ MATEMATIKA LOKÁLNÍ EXTRÉMY

Optika. VIII - Seminář

Téma 8. Řešené příklady

PŘÍRUČKA K POUŽÍVÁNÍ APLIKACE HELPDESK

Kvantové počítače algoritmy (RSA a faktorizace čísla)

Architektura AMD K10. Kozelský Martin, koz230. Datum:

Hydrologie a pedologie

Zvyšování kvality výuky technických oborů

MS WORD 2007 Styly a automatické vytvoření obsahu

Google Apps. pošta 2. verze 2012

V. Pozice České republiky v mezinárodním srovnání

Oddělení teplárenství sekce regulace VYHODNOCENÍ CEN TEPELNÉ ENERGIE

Převodníky analogových a číslicových signálů

Euro a stabilizační role měnové politiky. 95. Žofínské fórum Euro s otazníky? V Česku v představách, na Slovensku realita Praha, 13.

Lokální a globální extrémy funkcí jedné reálné proměnné

Název a registrační číslo projektu: Číslo a název oblasti podpory: Realizace projektu: Autor: Období vytváření výukového materiálu: Ročník:

Popis připojení elektroměru k modulům SDS Micro, Macro a TTC.

Železniční přejezdy. Základní statistické ukazatele ve formě komentovaných grafů

Všechny možné dvojice ze čtyř možností, nezáleží na uspořádání m (všechny výsledky jsou rovnocenné), 6 prvků. m - 5 prvků

Novinky v programu Účtárna 2.09

Možné dopady měnícího se klimatu na zemědělství v ČR

DS SolidWorks PDM Workgroup

Semestrální práce NÁVRH ÚZKOPÁSMOVÉHO ZESILOVAČE. Daniel Tureček zadání číslo 18 cvičení: sudý týden 14:30

Výsledky testování školy. Druhá celoplošná generální zkouška ověřování výsledků žáků na úrovni 5. a 9. ročníků základní školy. Školní rok 2012/2013

Ministerstvo pro místní rozvoj. podprogram

Název: VY_32_INOVACE_PG3309 Booleovské objekty ve 3DS Max - sčítání a odčítání objektů

B Kvantitativní test. Semestrální práce TUR. Novotný Michal

PŘEDSTAVUJEME ŘADU UVOLNĚTE POTENCIÁL SVÉ NÁDRŽE. p. 1. str. 1

1 Rozbor vývoje smrtelných následků dopravních nehod v ČR

PRAKTIKUM II Elektřina a magnetismus

SUPPORT VECTOR MACHINES

Matematika a její aplikace. Matematika a její aplikace

Sada 2 - MS Office, Excel

4.5.2 Magnetické pole vodiče s proudem

Post-Processingové zpracování V módu post-processingu je možné s tímto přístrojem docílit až centimetrovou přesnost z běžné 0,5m.

Metodika pro učitele

IMPORT A EXPORT MODULŮ V PROSTŘEDÍ MOODLE

INMED Klasifikační systém DRG 2014

Kvadratické rovnice pro studijní obory

Tepelná výměna. výměna tepla může probíhat vedením (kondukce), sáláním (radiace) nebo prouděním (konvekce).

Plastové rozvaděče pro FVE a nejen pro ně...

CERTIFIKOVANÉ TESTOVÁNÍ (CT) Výběrové šetření výsledků žáků 2014

MODERNIZACE ELEKTRÁRNY OPATOVICE

Zvyšování IT gramotnosti zaměstnanců vybraných fakult MU MS POWERPOINT 2010

M - Rovnice - lineární a s absolutní hodnotou

Parkovací automat. Identifikace systému. Popis objektu

Dualita v úlohách LP Ekonomická interpretace duální úlohy. Jiří Neubauer. Katedra ekonometrie FEM UO Brno

Střední škola obchodu, řemesel a služeb Žamberk. Výukový materiál zpracovaný v rámci projektu EU Peníze SŠ

Informace k novému vydání učebnice 2015 Manažerské účetnictví nástroje a metody (2. aktualizované a přepracované vydání) OBSAH 2015

Transkript:

L 12 Statistická adaptace Oddělení numerické předpovědi počasí ČHMÚ 2007

Plán přednášky Úvod Přehled rozpracovaných metod (teorie) Aplikace metod v ČHMÚ Verifikace (ukázka pro hydrologické povodí)

Statistická adaptace patří k ní všechny metody, pomocí kterých se numerická předpověď modelu dostává v automatické formě k uživateli: filtrační metody inter-extrapolační metody regresní metody pravděpodobnostní metody jejich kombinace

Směřování přechod k multivariačním metodám umožňují pracovat s kratšími vstupními soubory, umí si lépe poradit se závislými prediktory zkracování vstupních souborů: filtrační metody přechod od dlouhé serie (5.2002 u nás) ke kratší přes snížení počtu prediktorů, přes využití multivariačních metod využití informace v prostoru: prediktorem je jenom předpovídaný prvek prediktory jsou předpovědi modelu ve více bodech nad měřením snaha o využití informace nejen o velikosti předpovídaného prvku, ale i o jeho proměnlivosti

Rozpracované metody (teorie) Kalmanův filtr - Maximální a Minimální teplota BMA (Bayesian Model Averaging) -srážky MOS (regrese) - rychlost větru PLSR (Partial Least Squares Regression) - rychlost větru

Kalmanův filtr vypočte odchylku předpověď měření a její rozptyl za 8 dní předpovídá další odchylku, větší váhu dává na poslední dny, zohledňuje její rozptyl (v případě většího rozptylu zmenšuje předpovídanou odchylku) řeší případy, kdy je počasí několik dní stejné a chyba modelu se opakuje řeší případy, kdy dochází k lokální chybě modelu, něco v modelu není zachyceno přesně (lokální půdní model, lokální orografie, lokální efekty počasí) pro dva případy z obrázku pro odchylku dobře pracuje v modrém případě, v červeném případě nedělá skoro nic

BMA průměrovací metoda (nehledá nejlepší prediktory jako regrese, ale nejlepší kombinaci prediktorů) v principu dělá vážený průměr z prediktorů, optimální váhy pro jednotlivé prediktory hledá pomocí Maximum Likelihood Metody (metoda maximální věrohodnosti) v prvním kroku dělá pravděpodobnostní předpověď pro zvolený práh, v druhém kroku podmíněnou deterministickou předpověď pro vybranou pravděpodobnostní třídu výhody: zohledňuje náhodnost v předpovědi dobře pracuje se závislými prediktory dobře pracuje s nekalibrovanými prediktory dobře pracuje s prediktory s různým rozdělením tradičně se využívá na zpracování ansámblových předpovědí

MOS lineární regresní model vytvořený pomocí metody postupné krokové regrese z jednotlivých prediktorů vytváří se na delším souboru modelových výstupů a pozorování (u nás serie předpovědí od května 2002 v současném modelovém rozlišení) postupná kroková regrese vybere prediktory, které nejlépe upravují předpověď modelu a vypočte jejich koeficienty regresní modely jsou aplikovány na aktuální modelové výstupy tradiční metoda, u nás v provozu 06/2000-03/2003 pro termínové teploty, maximální a minimální teploty, rychlost větru, oblačnost

PLSR postupuje podobně jako analýza hlavních složek (PCA), vytváří nové prediktory z původních proměnných, které jsou na sobě nezávislé z nových proměnných vytváří regresní model pomocí krokové vícerozměrné regrese v každém kroku postup opakuje, po odečtení prvního nového prediktoru hledá nový soubor navzájem nezávislých prediktorů, které by nejlépe vysvětlovaly kovarianci mezi prediktorem a prediktandem nezaručuje úplnou nezávislost prediktorů kombinuje výhody PCA a krokových regresí pracuje dobře se závislými prediktory pracuje dobře na kratších souborech předpovědí a měření

Aplikace metod v ČHMÚ Předpověď maximální a minimální teploty pro synoptické stanice Předpověď srážkových úhrnů pro hydrologická povodí Předpověď rychlosti větru pro letiště? (podle dalších požadavků uživatelů)

Předpověď maximální a minimální teploty pro synoptické stanice metoda: Kalmanův filtr, pro 31 synoptických stanic zkušební poloprovoz na: http://voodoo.chmi.cz/~mma105/prohlizec.html z testovaných období dal Kalmanův filtr nejlepší výsledky u stabilní situace 11.-21.4. pro většinu stanic (systematická chyba se objevila na více stanicích) pro stanici na Lysé Hoře upravuje předpověď často (pravděpodobná systematická lokální chyba orografie nebo půdního modelu)

Předpověď srážkových úhrnů pro hydrologická povodí (1) prvním řešeným problémem bylo vybrat vhodnou kombinaci bodů z modelu ALADIN nad zadaným hydrologickým povodím ukázalo se, že průměr z bodů nad povodím není nejvhodnější, testovaly se nad daným povodím různé výběry bodů pokusili jsme se využít metody statistické adaptace, aby si samy vybíraly body nad povodím (výhodou tohoto postupu bylo, že metody mohly vedle srážkového úhrnu využívat i informaci o proměnlivosti pole nad danou oblastí) pro pravděpodobnostní předpověď srážkových úhrnů jsme srovnali metody: Multivariační diskriminační analýza, Logistické regrese, BMA pro podmíněnou kvantitativní předpověď srážkových úhrnů jsme srovnali metody: Barisotropické regrese, PLSR, BMA

Předpověď srážkových úhrnů pro hydrologická povodí (2) nejlepší výsledky dala metoda BMA ve svém nestandardním využití (standardně se využívá na zpracování ansámblových předpovědí) v našem případě: pseudo-ansámbl z jednotlivých bodů modelu ALADIN nad daným hydrologickým povodím z jednoho běhu modelu ALADIN dává oba druhy předpovědi: pravděpodobnostní předpověď a podmíněnou kvantitativní předpověď srážkových úhrnů větších než zvolený práh jako jediná byla schopná pracovat s vyššími prahy srážkových úhrnů kolem 1, 2, 5,... mm / 6hodin v současnosti probíhá srovnání málo se lišících modifikací BMA a výběr vhodných prahů pro vybraná hydrologická povodí

Předpověď rychlosti větru pro letiště pravděpodobný postup: MOS od května 2002 pro nejbližší bod k letišti ze všech prediktorů PLSR od května 2002 jen pro rychlost větru v okolí 4 x 4 = 16 bodů kolem letiště (závislé prediktory) = pokus vzít informaci jen z pole větru a jeho proměnlivosti kolem stanice srovnání MOS a PLSR (pokud bude PLSR úspěšné, pokus zkrátit délku vstupního souboru na minimum)

Verifikace (ukázka pro hydrologické povodí LASEŇ, pravděpodobnostní předpověď a podmíněná kvantitativní předpověď srážkových úhrnů větších než zvolený práh = 0.01mm/6hodin, délka učebního souboru od 02/2003-06/2005, délka testovací vzorky 07/2005-09/2006 ) subjektivní hodnocení uživatele objektivní metody: scatter plots kvadratická chyba Brier score a jejich dekompozice ROC diagrams Reliability diagrams

scatter plots osa x meření, osa y předpověď horní obrázek: průměr 6x6 bodů, kvadratická chyba 3.08, spodní obrázek: BMA ze 6x6 bodů, kvadratická chyba 2.66 čím víc bodů leží u diagonály, tím je předpověď lepší

kombinace Logistických regresí s Barisotropickými regresemi a PLSR, podmíněná kvantitativní předpověď na ose x je počet bodů od středu oblasti, které jsme brali v úvahu (1 = pole 2x2 = 4 body modelu, 7 = pole 14x14 = 196 bodů modelu) na ose y je kvadratická chyba pro průměr z bodů, Barisotropické regrese, PLSR, jeden bod uprostřed oblasti kvadratická chyba

Brier score a jejich dekompozice BRIER = REL RES + UNC Reliability - spolehlivost, zachycuje rozdíl mezi předpovědí a průměrem měření přes celý interval pro vybranou pravděpodobnostní třídu předpovídaných hodnot Resolution - rozlišení, zachycuje rozdíl mezi průměrem měření a průměrem měření pro vybranou pravděpodobnostní třídu předpovídaných hodnot Uncertainty - náhodnost, odpovídá rozptylu měření, zachycuje, jak obtížné je předpovídat analog ke kvadratické chybě pro pravděpodobnostní předpověď, zachycují těsnost předpovědi, čím nižší, tím lépe čím je RES vyšší než REL, tím líp LOG BMA BRIER 0.1641 0.1272 REL 0.0227 0.0061 RES 0.0572 0.0776 UNC 0.1987 0.1987

pseudo-roc diagrams transformace předpovědi s různou pravděpodobností do indexů osa x: FAR = b / (b+d) osay:dr=d/(c+d) čím blíže k levému hornímu rohu, tím lépe horní obrázek: Logistické regrese, spodní obrázek BMA prediction observation no yes no a b yes c d

Reliability diagrams osax pravděpodobnost předpovědi v procentech osa y pozorované četnosti čím více bodů leží u diagonály, tím lépe horní obrázek: Logistické regrese, dolní obrázek: BMA