L8 Asmlace dat II Oddělení numercké předpověd počasí ČHMÚ 007
Plán přednášky Úvod do analýzy Optmální odhad v meteorolog D případ: demonstrace metod; mult-dmensonální případ; Zavedení předběžného pole; Strukturní funkce; 4D analýza; Hstorcký vývoj analýzy
Úvod do analýzy Problém počáteční podmínky v meteorolog: Znát co nejpřesněj současný stav atmosféry. Analýza: pravdelná prostorová reprezentace prognostckých proměnných v daném čase. Slouží jako dagnostka; Je startem pro novou předpověď; Hodí se pro pozdější valdac. Analýza potřebuje: Systém pozorování; dagnostckou funkc, kde musí být zahrnuty vntřní vztahy mez závslým proměnným; Prognostckou komponentu pro vytvoření prvního odhadu.
Analýza: optmální odhad v meteorolog Použjeme teor odhadu s následujícím klíčovým hypotézam: Pozorování nejsou perfektní; Odhad (analýza) také nebude perfektní; Odhad by měl být optmální kombnací pozorování, mnulých a současných; Model může poskytnout první odhad; Model není nkdy perfektní; Odhad by měl souhlast s pozorováním v ntervalu jejch chyby.
Zjednodušení problému odhadu Odhadněme proměnnou x ze dvou měření: y, y y t t x + ε ; y x + ε x t - pravda, jež chceme odhadnout; ε chyba pozorování. Máme následující hypotézy: Přístroje jsou bez basu: Jejch přesnost je známa: Jejch chyby nejsou korelovány: E E ( ε ) E( ε ) 0 E ( ) ( ) ε E ε ; ( ε ε ) 0 Odhad (analýza) může být nalezena 3 přístupy: -Mnmalzací varance chyby odhadu; -Metodou vážených nejmenších čtverců; -Maxmální pravděpodobností.
Mnmalzace varance chyby odhadu: jednoduchý případ () Hledáme odhad x a jako lneární kombnac pozorování: x a k y + k y Váhy k jsou neznámé. Chceme aby odhad E x a x t Tak máme: neměl systematckou chybu: ( ) 0 ( t ) ( t ) ( t ) ( t E k ) y + k y x ke x + ε + ke x + ε E x ( ) ( t k ) + k E x 0 Součet vah je jednčka. ( ) ) a t E x x Chceme aby odhadnutá chyba byla mnmální: a s použtím: ( k ) y ; E( ε ) 0 k ε y + a máme: a k + x a ( ) k
Mnmalzace varance chyby odhadu: jednoduchý případ () Mnmalzace chyby poskytne vztah pro váhy: + + k and k přesnost odhadu je dána obrácenou hodnotou varance chyby: + p a a ; Čím více pozorování, tím větší přesnost.
Nejmenší čtverce s vaham: jednoduchý případ Odhad může být hledán mnmalzací jeho vzdálenost od pozorování, když vezmeme v úvahu jejch přesnost / : ( ) ( ) ( ) y x y x x J a a + Budeme počítat mnmum J(x): ( ) 0 + y x y x x x J a a a a y y x a + + + A dostaneme ten samý výraz jako u předešlé metody.
Multdmenzonální případ () Budeme mít stavový vektor x, s dmenzí n. Jeho složky jsou například hodnoty v uzlovém bodě výpočetní mřížky (3D), jsou to hodnoty různých prvků (teplota, vítr, tlak, ). Zavedeme také vektor of pozorování y sdmenzíp. Můžeme jej zapsat takto: y H ( t x ) +ε H + ε O H je vztah mez analyzovaným proměnným a pozorováním. Je nazýván jako observaton operator. Když je lneární, je to matce n x p. ε H je chyba reprezentatvty. H může být roven jednotkové matc (nejjednodušší případ) nebo zahrnovat prostorové nterpolace (z modelové mřížky do bodu pozorování), relac mez proměnným modelu a měřenou velčnou (sateltní radance), nebo dokonce ntegrac modelu (4DVAR). Často jsou tyto poslední dva vztahy lnearzovány
Multdmenzonální případ () Jako v předchozím případě, hledáme odhad prostý systematcké chyby. Použjeme metodu nejmenších čtverců s vaham. Zavedeme matc varancí-covarancí chyb pozorování: 4 3 3....... ) (.... E R Obecně mohou být korelovány Budeme hledat mnmum následující kvadratcké formy: ( ) ( ) ( ) y Hx R y Hx x T J
Multdmenzonální případ (3) Dervace kvadratcké formy je: J T ( x) H R ( Hx y) Je to vektor gradentu; jeho složky jsou gradenty J podle složek stavového vektoru x. Analýza je Best Lnear Unbased Estmate ( BLUE ): x a ( T H R H) T H R y ten samý výsledek bychom získal pomocí metody mmmalzace varance chyby nebo metodou maxmální věrohodnost (za předpokladu Gaussovské PDF pro chyby pozorování).
Potřeba přeurčení systému: zavedení předběžného pole () Pravda- červeně Obs kolečka Analýza-zeleně Případ přeurčení: n, p40.
Potřeba přeurčení systému: zavedení předběžného pole () Pravda- červeně Obs kolečka Analýza-zeleně Nemáme přeurčení: n, p. Přtom by bylo žádoucí.
Potřeba přeurčení systému: zavedení předběžného pole (3) Abychom systém přeurčl, použjeme předběžné pole ( guess, background ): Je to první odhad stavového vektoru, označený jako x b. Má tu samou dmenz Jako analýza x a a používáme jej jako druhý zdroj nformace. Můžeme pak psát (Talagrand): b t x x + Všmněme s stejného formalsmu jako pro pozorování; ε b je chyba předběžného pole a operátor H je zde redukován na jednotkovou matc I. Použjeme hypotézu, že chyba předběžného pole nemá bas (není systematcká). Zavedeme matc B covarancí chyb předběžného pole analogcky k matc R pro pozorování. Předpokládáme, že B a R nejsou korelovány. První odhad (guess) je typcky poskytnut předešlou krátkou modelovou předpovědí. ε b
Potřeba přeurčení systému: zavedení předběžného pole (4) Metoda nejmenších čtverců vyžaduje najít mnmum kvadratcké formy: J T ( ) ( b ) T ( b ) x x x B x x + ( Hx y) R ( Hx y) Tento skalární funkconál měří vzdálenost k dostupné nformac. Jeho gradent je: b T J ( x) B ( x x ) + H R ( Hx y) Řešením je BLUE odhad Alternatvně: x a x a x b ( T ) B H R H ( b T + B x + H R y) BH T ( T ) ( b HBH + R y Hx ) Matce zsku gan Inovační vektor
Role matce B - strukturní funkce () Matce B popsuje varance a kovarance chyb předběžného pole. V multdmenzonálním systému má B varance chyb na své dagonále a kovarance chyb jsou členy mmo dagonálu. Kovarance chyb se mohou zapsat pomocí korelací: ρ ( ε, ε ) j ( ε ), ε j ( ε ).var( ε ) cov ; ex.: ρ var j r ( ) j r j exp L Délkové měřítko Korelace chyb předběžného pole určují prostorové šíření a hlazení nformace: zavádíme pojem strukturních funkcí. Dobrá demonstrace je případ jedného pozorování.
Role matce B - strukturní funkce () Příklad případu jedného pozorování: přírůstky analýzy v pol teploty; ALADIN 3DVAR Pro modelování B statstk se používají slné hypotézy: -sotrope, -homogenta. Typcky jsou statstky chyb předběžného pole odhadnuty z řad modelových předpovědí: metoda NMC, ansámblová metoda.
Role matce B - strukturní funkce (3) V multvarantním případě matce B obsahuje kovarance chyb mez meteorologckým parametry (vítr a geopotencál, vítr a teplota, a tak dále). Tyto kovarance odrážejí základní rovnováhy v atmosféře: hydrostatckou a geostrofckou. Tyto rovnováhy mohou být také explctně popsány v B anebo jsou schovány ve statstckých vztazích (lneární regrese). Příklad statstcky spočtených vertkálních kovarancí chyb (q,t) v modelu ALADIN pro 37 hladn.
Strukturní funkce závslé na proudění: 4D analýza () Klascky, matce B je počítána jako statstcký soubor krátkých modelových předpovědí. Je to vlastně klmatologe chyb modelu. Typcky je potřeba období 3 měsíců pro získání dat. NMC metoda: rozdíly dvou předpovědí platných ve stejném čase: Nově: rozdíly ansámblových přepovědí ε b P48 P4 Skutečné aktuální strukturní funkce závsí na proudění. Jejch modelování by se dalo dělat metodou Kalmanova fltru (velm, ale opravdu velm drahé): zavedeme chybu modelu čstým způsobem do systému optmálního odhadu evolucí stavového vektoru během jednoho časového kroku modelu: t + M + x x + ε (, ) t M chyba modelu
Strukturní funkce závslé na proudění: 4D analýza () Přjmeme klasckou hypotézu: model nemá systematckou chybu. Známe matc kovarancí chyb modelu Q, chyby analýzy a modelu nejsou korelovány. Kroky Kalmanova fltru v každém kroku t jsou následující:. Vypočte se novační vektor;. Vypočte se matce gan ; 3. Určí se analýza; 4. Provede se update kovarancí chyb; 5. Provede se krok modelu; 6. Spočte se vývoj kovarancí chyb. d K ( f y ) Hx f T ( f T P H H P H + R ) a f x K d x + P a P f K H T P f f a x + M(, + ) x f a T P + MP M + Q Ve 4DVAR, klascká matce B je použta na začátku algortmu mnmalzace. Ale strukturní funkce jsou neseny v čase modelem v průběhu tzv okna asmlace.
Analýza: hstorcký vývoj () První subjektvní analýza první polovna 9. století Ldé chtěl odvodt zákontost atmosféry z map; Věřlo se, že dagnostcké mapy pomohou pro předpověď. Vynález synoptcké mapy (Le Verrer, pozděj Ftzroy); díky bouř v roce 854. Grafcké technky (Bjerknes 9) byly vyvnuty pro odhad komplkovaných z map; to pokračovalo do 950 (Fjortoft, Saucer). Předpověď: hlavně extrapolační metody; pouze malé zlepšení v kvaltě předpovědí bylo dosaženo v letech 860-950.
Analýza: hstorcký vývoj () První objektvní analýza Rchardson, 9: potřeboval určt vítr a tlak na pravdelné sít bodů z nepravdelně rozmístěných pozorování. Další: Charney, Fjortoft, von Neumann, 950. Nutnost objektvní procedury, dostatečně robustní, bez zásahu ldské ruky. Panofsky (949): metoda polynomů pro dosažení souhlasu s pozorováním přes malé oblast jenom s několka uzlovým body. Cressman (954): Lokální aplkace polynomů.
Analýza: hstorcký vývoj (3) Cressman: zavedení automatcké kontroly kvalty dat, první použtí předběžného pole. Bergthorsson a Doos (955): metoda postupných korekcí zavedl pojmy jako přírůstky analýzy a pozorování, zavedl předchůdce optmálních vah a statstcké nterpolační metody. V roce 960 je objektvní analýza operatvní skutečností v reálném čase v hlavních předpovědních centrech.
Optmální nterpolace: 963 dnes () Optmální Interpolace (OI) byla zavedena Gandnem, 963. Její vylepšené varanty jsou stále používány. Formulace je velce blízká BLUE odhadu, ale datový operátor (a také chyba reprezentatvty) není zaveden. BLUE je redukována na: x x + B ( yy ) ( b o B + R y x ) a b xy, B xy : kovarance mez uzlovým body a body pozorování; B yy : kovarance mez body pozorování; x b,o : stavový vektor nterpolovaný do bodu pozorování.
Optmální nterpolace: 963 dnes () Hlavní problém nverze matce: která má obrovskou dmenz.. 0 5 ; ( yy B + R) Selekce pozorování je nutným krokem: -Buďto metodou boxu kdy celková oblast je rozdělena na menší kousky staré schéma ECMWF; - Nebo po uzlových bodech: každý bod je postupně analyzován s okolních pozorování (staré schéma CANARI v ARPEGE/ALADIN). Omezující hypotézy: - Nemáme kontnuální reprezentac atmosféry; -Předpokládá se exstence kontnuálního korelačního modelu pro výpočet kovarancí B.
Varační analýza: polovna 980 dnes () Varační počet byl zaveden do problému analýzy v polovně 80. let Funkconál J je defnován pro řešení BLUE odhadu nalezením jeho mnma. Metoda adjungovaného operátoru je použta pro výpočet gradentu J (Le Dmet & Talagrand, 986). Další nutné prvky: - Rychlý algortmus mnmalzace (konjugovaný gradent); - Dostatečná vntřní paměť počítače: problém hledání mnma je řešen globálně pro celý stavový vektor x. Výhody: -Umožňuje použít velké množství pozorování různých typů; - Poradí s s velkou dmenzí úlohy, což by jnak nebylo možné; - Je adtvní: můžeme zavést další členy funkconálu J, jako kontrolu šumu, etc. - 4D analýza se stává uskutečntelnou: 4DVAR
Varační analýza: polovna 980 dnes () Funkconál (3DVAR) je: J T ( ) ( b ) T ( b ) x x x B x x + ( Hx y) R ( Hx y) Ve zkráceném značení: J J b + J o Můžeme přdat člen kontroly rovnováhy polí J c, jako vzdálenost k vyváženému stavu: ve 4DVAR se používá v J c dgtální fltr. J ( ) ( b ) T x B x x + H R ( Hx y) Př výpočtu gradentu máme H T : adjungovaný datový operátor: gradent je nejdříve počítán v prostoru pozorování a pak je transformován zpět H T do prostoru stavového vektoru; nebo kontrolní proměnné. Matce H, H T zajšťují zobrazení mez dvěma prostory.
Varační analýza: polovna 980 dnes (3) Zobecnění na 4DVAR: J b je stejné, ale J o je počítáno podle modelové trajektore vymezené oknem asmlace (například 6 hodn). Podél časové osy jsou pozorování sloučena do časových ntervalů, typcky po jedné hodně. J o N 0 T ( H( M ( x) ) y ) R ( H( M ( x) ) y ) Zde M je TANGENT LINEAR model (lnearzovaný model podél trajektore předpočítané plným modelem v asmlačním okně). a M T je jeho ADJOINT (adjungovaný operátor). Tyto operátory nesou kontrolní proměnnou a gradent funkconálu podél trajektore: TL vpřed, AD vzad. Výraz pro gradent je: J N ( ) ( b ) T x B x x + H R H M ( x) 0 ( ( ) y )
Varační analýza: polovna 980 dnes (4) V prax používáme metodu přírůstků: funkconál a jeho gradent jsou vyjádřeny pomocí přírůstků analýzy: δx x a x b
Závěr Lekce L8 V asmlac dat řešíme jenom jednu rovnc: BLUE odhad. Dáse tak dělat mnohým konkrétním postupy, vz lekce L9 a L0