Jak bude zítra? Skoro jako dneska. Dan Lessner

Podobné dokumenty
Rozpoznávání captcha obrázků

K možnostem krátkodobé předpovědi úrovně znečištění ovzduší statistickými metodami. Josef Keder

Klasifikace hudebních stylů

Neuronové časové řady (ANN-TS)

ANALÝZA DAT V R 2. POPISNÉ STATISTIKY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

BAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni

Atmosférická chemie a její interakce s procesy v atmosféře

SketchUp je zase o něco snadnější a výkonnější!

Na čem na konci života záleží? Lenka Slepičková, Ph.D.

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Zadání Máme data hdp.wf1, která najdete zde: Bodová předpověď: Intervalová předpověď:

Využití strojového učení k identifikaci protein-ligand aktivních míst

Meteorologické minimum

Rovnoměrně zrychlený = zrychlení je stále stejné = velikost rychlosti se každou sekundu zvýší (případně sníží) o stejný díl

Meteorologie opakování pojmů a veličin

vzorek vzorek

PRAVDĚPODOBNOST A STATISTIKA

1 0 0 u 22 u 23 l 31. l u11

KIS a jejich bezpečnost I Šíření rádiových vln

METODIKA PRO PŘEDPOVĚĎ EXTRÉMNÍCH TEPLOT NA LETECKÝCH METEOROLOGICKÝCH STANICÍCH AČR

Zákony hromadění chyb.

Metodika poradenství. Vypracovali: Jiří Šupa Edita Kremláčková

Algoritmy a struktury neuropočítačů ASN - P11

SEZNAM PŘÍLOH. Příloha č. 1: Seznam respondentů (tabulka) Příloha č. 2: Ukázka rozhovorů a pozorování (přepis)

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

KLIMATICKÝ DOWNSCALING. ZOO76 Meteorologie a klimatologie Petr Kolář PřF MU Brno

SVRS A PŘESHRANIČNÍ MIGRACE ZNEČIŠTĚNÍ,

Uběhly desítky minut a vy stále neumíte nic. Probudíte se ze svého snění a hnusí se vám představa učit se.

Vliv Mosteckého jezera na teplotu a vlhkost vzduchu a rychlost větru. Lukáš Pop Ústav fyziky atmosféry v. v. i. AV ČR

Základy popisné statistiky

Statistika. Jindřich Soukup. University of South Bohemia in České Budějovice Faculty of Fisheries and Protection of Waters, School of complex systems

Sucho a klimatický vývoj v ČR

Je větrná růžice potřeba pro zpracování rozptylové studie?

Rozpoznávání písmen. Jiří Šejnoha Rudolf Kadlec (c) 2005

Fiala P., Karhan P., Ptáček J. Oddělení lékařské fyziky a radiační ochrany Fakultní nemocnice Olomouc

3. Třídy P a NP. Model výpočtu: Turingův stroj Rozhodovací problémy: třídy P a NP Optimalizační problémy: třídy PO a NPO MI-PAA

PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady

Vliv emisí z měst ve střední Evropě na atmosférickou chemii a klima

Základy navrhování průmyslových experimentů DOE

You created this PDF from an application that is not licensed to print to novapdf printer (

O soutěži MaSo. Co je to MaSo? 22. MaSo. V Praze a v Mikulově. maso.mff.cuni.cz. o dvakrát za rok o nejen počítání o soutěž družstev

EM algoritmus. Proč zahrnovat do modelu neznámé veličiny

Úvod do mobilní robotiky AIL028

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

ÚSTAV MATEMATIKY A DESKRIPTIVNÍ GEOMETRIE. Matematika 0A4. Cvičení, letní semestr DOMÁCÍ ÚLOHY. Jan Šafařík

POKUS O STATISTICKOU PŘEDPOVĚD ZNEČIŠTĚNÍ OVZDUŠÍ. Josef Keder. ČHMÚ, ÚOČO, Observatoř Tušimice,

Diagnostika regrese pomocí grafu 7krát jinak

KGG/STG Statistika pro geografy

EXPERIMENTÁLNÍ MECHANIKA 2 Přednáška 5 - Chyby a nejistoty měření. Jan Krystek

Sucho se za uplynulý týden výrazně prohloubilo a dosáhlo nejhoršího rozsahu v tomto roce

Algoritmy a struktury neuropočítačů ASN P4. Vícevrstvé sítě dopředné a Elmanovy MLNN s učením zpětného šíření chyby

ROZVOJ PŘEDPOVĚDNÍ POVODŇOVÉ SLUŽBY V ČESKÉ REPUBLICE PO POVODNI RNDr. Radek Čekal, Ph.D. RNDr. Jan Daňhelka, Ph.D.

4EK211 Základy ekonometrie

Zařazování dětí mladších tří let do mateřské školy. Vyhodnocení dotazníkového šetření. Příloha č. 1

Cvičení ze statistiky - 3. Filip Děchtěrenko

Bodové a intervalové odhady parametrů v regresním modelu

Intervalová data a výpočet některých statistik

Optimalizace osazování odběrných míst inteligentními plynoměry

Renáta Bednárová, Petr Sládek. Pedagogická fakulta MU Brno, Univerzita obrany Brno

Příloha A - Dotazník průběhu procesu vyhledávání informací

UŽ ZNÁTE SVÉ ŠŤASTNÉ ČÍSLO?

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Analýza reziduí gyroskopu

VÍŠ, CO JE TO BANKA?

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

4.1 Metoda horizontální a vertikální finanční analýzy

Statistická teorie učení

1 Analytické metody durace a konvexita aktiva (dluhopisu) $)*

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

ÚLOHY S POLYGONEM. Polygon řetězec úseček, poslední bod je totožný s prvním. 6 bodů: X1, Y1 až X6,Y6 Y1=X6, Y1=Y6 STANOVENÍ PLOCHY JEDNOHO POLYGONU

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Konstruktivistické principy v online vzdělávání

1 Úvod 1.1 Vlastnosti programového vybavení (SW)

Organizační pokyny k přednášce. Matematická statistika. Přehled témat. Co je statistika?

Pravděpodobnost, náhoda, kostky

Co je za obchodním úspěchem

(ne)závislost. α 1 x 1 + α 2 x α n x n. x + ( 1) x Vektoru y = ( 1) y říkáme opačný vektor k vektoru y. x x = 1. x = x = 0.

2.7.6 Rovnice vyšších řádů (separace kořenů)

Bodové a intervalové odhady parametrů v regresním modelu

JAK ŘEŠIT A PREZENTOVAT ÚLOHY TMF

Algoritmy a struktury neuropočítačů ASN - P10. Aplikace UNS v biomedicíně

Propozice k fotografování. Pro rok 2016 / 2017

PRAVDĚPODOBNOST A STATISTIKA

2.4.6 Hookův zákon. Předpoklady: Podíváme se ještě jednou na začátek deformační křivky. 0,0015 0,003 Pro hodnoty normálového napětí menší než σ

Pravděpodobnost, náhoda, kostky

PRŮBĚŽNÉ HODNOCENÍ AKTUÁLNÍ PŘENOSOVÉ KAPACITY VEDENÍ

Rosenblattův perceptron

Hydrologická bilance povodí

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA DOPRAVNÍ Ústav aplikované matematiky

Proč vyhrál bitvu o cloud opensource a proč mě to má zajímat


Cena celkem včetně DPH. E Kč H Kč 52902P ,2 714 Kč Cena bez DPH Cena celkem včetně DPH.

Podnebí a počasí všichni tyto pojmy známe

Struktura a architektura počítačů (BI-SAP) 5

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

sbor Českobratrské církve evangelické ve Velké Lhotě u Dačic Velká Lhota a Valtínov

MINIROL SCREEN. Efektivní omezení proudění teplého a studeného vzduchu na Vaše okna! Specialisté na rolovací systémy

Opravná zkouška 2SD (druhé pololetí)

PREDIKCE DÉLKY KOLONY V KŘIŽOVATCE PREDICTION OF THE LENGTH OF THE COLUMN IN THE INTERSECTION

Úloha - rozpoznávání číslic

Transkript:

Jak bude zítra? Skoro jako dneska. Dan Lessner

Osnova O čem budu mluvit Motivace, popis problému Vhodná data Použitá architektura sítě Zajímavá zjištění Kde je zakopaný pes? Tady Co teď s tím Další zajímavá zjištění Jak dál Závěr

Motivace, popis problému Zápočet 1. Chci vědět, co zítra na sebe 2. Nemám ve sklepě superpočítač 3. Vím jak bylo dnes 4. Moji přátelé v Evropě to vědí taky 5. Nechci s tím mít příliš práce Pokus o predikci vývoje časové řady na základě několika posledních členů. Nesimuluju, používám empirické metody.

Vhodná data Aby to fungovalo Hodí se o problému (počasí) něco vědět: dnes je skoro jako včera je zejména teplo vlhko těžko prach, sluníčko, emise, bio... počasí k nám chodí ve frontách počasí se různí podle ročního období Proto vezmu data: nedávná o průměrné denní teplotě to je dost zjednodušující (pro mě, ne pro síť) z různých míst odborník: 800 900 km od Klementina o roční době

Vhodná data Konkrétněji V Tróji sídlí Katedra meteorologie a ochrany prostředí a na ní dvoučlenná Skupina deterministického chasu. Tímto děkuji Mgr. Jiřímu Mikšovskému za pomoc se sháněním vhodných dat. Na http://eca.knmi.nl je k dispozici volně přístupná databáze ECA (European Climate Assessment) s daty ze stovek stanic v Evropě. různá období uvádění teplot v desetinách C ušetří tečku

Vhodná data Příprava Výběr vhodných stanic k měření (odhadem), stažení časových řad Nalezení společného průniku (1966 1997) Poslední tři roky jako testovací Normalizace teplot: lineárně jako z [-40;40] na [-1;1] (přenosová funkce bude tansig) Zavedení informace o ročním období separace sezón čtyři nové vstupy sinus a cosinus dne v roce Příklad vstupu: 0.831; 0.556; 0,185; -0,008; 0,105; 0,015; 0,128; 0,0003; 0,025; 0,188; 0,0005; 0,14

Použitá architektura sítě Jak na to Požadovaná přesnost předpovědi: 1 C Není to moc, ale menší rozdíl stejně nepoznám Navíc se teplota během dne stejně dost mění Průměrný rozptyl denní teploty v Klementinu (1905 2005) činí víc než 7 C Taky je tu otázka přesnosti samotných dat Zkoušel jsem různé varianty různé učící algoritmy a jejich parametry jedna nebo dvě skryté vrstvy s až čtyřnásobkem počtu vektorů ze vstupní vrstvy 10 17 9 1, 10 13 4 1, 10 10 10 1, 10 20 1, 10 10 1, 10 5 1, 10 3 1, 10 1!!!

Zajímavá zjištění Něco tu smrdí Záleží na inicializaci Nejlépe se síť učila s LM Za 17 epoch bylo hotovo Celkem dobře vycházelo i trainrp Přesnost by šla hnát výš, ovšem s řádovým nárůstem počtu epoch Třeba na 400 To není nic špatného, jiné problémy se tak učí běžně. Na konkrétní architektuře příliš nezáleželo Opravdu až příliš... co je tedy obtížného na předpovědi počasí?

Kde je zakopaný pes? 10 532 000 km 2

Tady Zítra bude SKORO jako dneska. Kdyby v Klementinu dnešek znamenal zítřek: Obléct se na denní průměr o deset stupňů jinde může někoho stát zdraví. A to bohatě stačí třeba dvakrát za rok. Ale síť tyhle případy mezi stovkami ostatních ignoruje. A podobně vypadá i rozložení chyb sítě. (je jen o něco strmější)

Co teď s tím? Zvýším šance sítě přidáním informací ze včerejška (ale zato uberu polovinu míst) nová data (ne)zapomenu normalizovat Snížím práh citlivosti na dlouhé učení Nebudu měřit střední kvadratickou odchylku, ale absolutní hodnotu chyby (funkce mae)

Další zajímavá zjištění Odkud vítr vane Délka učení poskočila z desítek na stovky epoch Takže na velikosti sítě už dost záleží Co se týče zvratů, moc jsem si nepomohl Dokážu naučit síť velmi dobře na malých množinách, ale pro neznámá data je nepoužitelná (chyba vzroste třeba na stonásobek) To velmi je mnohem lepší než v předchozích pokusech (maximální chyba 2 C, výskyt v desetinách procenta) Ale nedokážu říct, jestli by šlo stejný výsledek získat pro větší vstupy Začíná být zřejmé, co je složitého na předpovědi počasí Opravdu se může stát, že síť leze po plošině a najednou narazí na údolí chybové funkce

Jak dál Musím taky spát Kudy by šlo pokračovat Podívat se na váhy která místa mají na zítřejší teplotu nejmenší vliv (pak je ubrat a urychlit učení) Přidat kvalitativně nová data na vstup (tlak, vlhkost) Začít znovu, lépe od začátku se zaměřit na vyhledávání zvratů v počasí (že zítra bude jako dnes, odhadne často každý trouba) Průběžně síť přizpůsobovat podle každodenního pozorování počasí a jeho změny se vyvíjí i dlouhodobě funkce adapt

Závěr Problém vyřešen Jak bude zítra? Skoro jako dneska, ale ráno se radši podívám z okna.