Strojové učení a dolování dat. Vybrané partie dolování dat 2016/17 Jan Šimbera

Podobné dokumenty
Analýza dat v GIS. Dotazy na databáze. Překrytí Overlay Mapová algebra Vzdálenostní funkce. Funkce souvislosti Interpolační funkce Topografické funkce

Využití obrazové korelace leteckých měřických snímků pro potřeby aktualizace budov v ZABAGED

Dálkový průzkum Země DPZ. Zdeněk Janoš JAN789

Využití digitální stereofotogrammetrie jako podpůrných dat pro automatizovanou tvorbu lesnických tematických map

Detekce a monitoring invazních druhů pomocí dálkového průzkumu

TRENDY ROZVOJE DPZ A JEJICH MOŽNOSTI VYUŽITÍ PRO INVENTARIZACI KONTAMINOVANÝCH MÍST

ELEKTROMAGNETICKÉ SPEKTRUM PRO POTŘEBY DPZ

Data a technické nástroje pro studium krajiny (GIS, DPZ)

ZEMĚMĚŘICKÝ ÚŘAD. Letecké laserové skenování Nový výškopis ČR. Petr Dvořáček

Možnosti podpory plošné inventarizace kontaminovaných míst interpretací multi- a hyperspektrálního snímkování Jana Petruchová Lenka Jirásková

DPZ Dálkový průzkum Země. Lukáš Kamp, KAM077

Geografické informační systémy GIS

Digitální model reliéfu (terénu) a analýzy modelů terénu

Data Science projekty v telekomunikační společnosti

Z E M Ě M Ě Ř I C K Ý Ú Ř A D NOVÉ ZDROJE GEOPROSTOROVÝCH DAT POKRÝVAJÍCÍCH ÚZEMÍ STÁTU

GIS ANALÝZA VLIVU DÁLNIČNÍ SÍTĚ NA OKOLNÍ KRAJINU. Veronika Berková 1

ZEMĚMĚŘICKÝ ÚŘAD. Letecké laserové skenování Nový výškopis ČR. Petr Dvořáček

MAPY NAŽIVO PRO VÁŠ GIS PALIVO

Hodnocení stavu regenerace. lesních porostů na Šumavě......s využitím ecognition

DPZ Dálkový Průzkum Země. Luděk Augusta Aug007, Vojtěch Lysoněk Lys034

METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1

NOVÉ METODICKÉ PŘÍSTUPY SLEDOVÁNÍ PROSTOROVÉ MOBILITY

Rastrová reprezentace geoprvků model polí Porovnání rastrové a vektorové reprezentace geoprvků Digitální model terénu GIS 1 153GS01 / 153GIS1

RYBNÍKY POHLEDEM Z VÝŠKY

VÝUKA SYSTÉMU IDRISI NA KATEDŘE GEOINFORMATIKY PŘÍRODOVĚDECKÉ FAKULTY UNIVERZITY PALACKÉHO V OLOMOUCI

I řešení bez nálepky smart mohou být chytrá

Dolování dat z multimediálních databází. Ing. Igor Szöke Speech group ÚPGM, FIT, VUT

Okruhy otázek pro státní závěrečné zkoušky NMgr. Geoinformatika

ZEMĚMĚŘICKÝ ÚŘAD. Nový výškopis ČR již existuje. Ing. Karel Brázdil, CSc., Ing. Petr Dvořáček

ZEMĚMĚŘICKÝ ÚŘAD. Geografická data pro podporu rozhodování veřejné správy

Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář,

Vyjádření povodňových rizik vyplývajících z nebezpečí přívalových srážek v ČR

Kolik lidí kudy chodí?

Moderní systémy pro získávání znalostí z informací a dat

Kartografické modelování. VIII Modelování vzdálenosti

GRR. získávání znalostí v geografických datech Autoři. Knowledge Discovery Group Faculty of Informatics Masaryk Univerzity Brno, Czech Republic

PROJEKT TVORBY NOVÉHO VÝŠKOPISU ČESKÉ REPUBLIKY

Opensource ve vědě satelitní dálkový průzkum Země

Současné možnosti dálkového průzkumu pro hodnocení heterogenity půd a porostů na orné půdě

1. české uživatelské fórum GMES Praha Zbyněk Stein. Představení aktivit CENIA v projektu EnviSec

1 Obsah přípravné fáze projektu Poohří

VYUŽITÍ FUZZY MODELŮ PŘI HODNOCENÍ OBTÍŽNOSTI CYKLOTRAS

Červené bahno. kolontár, maďarsko. PŘípadová studie

Objektově orientovaná fuzzy klasifikace krajinného pokryvu (land cover) se zaměřením na zemědělskou krajinu

(zejména na tocích a v příbřežních zónách)

Mezinárodní konference Mikroklima a mezoklima krajinných struktur a antropogenních prostředí Skalní mlýn, Moravský kras,

Zdroje dat GIS. Digitální formy tištěných map. Vstup dat do GISu:

5. GRAFICKÉ VÝSTUPY. Zásady územního rozvoje Olomouckého kraje. Koncepce ochrany přírody Olomouckého kraje

Videometrie,, LIDAR, Radarová data

K možnostem krátkodobé předpovědi úrovně znečištění ovzduší statistickými metodami. Josef Keder

Využití DPZ v Národní inventarizaci lesů (NIL2) - potenciál dat GMES/Copernicus

POSKYTOVÁNÍ A UŽITÍ DAT Z LETECKÉHO LASEROVÉHO SKENOVÁNÍ (LLS)

Automatizace tvorby výškopisu pro mapy velkého měřítka v prostředí ArcGIS

Digitální fotogrammetrie

Metody hodnocení sucha v lesních porostech. Kateřina N. Hellebrandová, Vít Šrámek, Martin Hais

GIS a pozemkové úpravy. Data pro využití území (DPZ)

Aplikace obrazové fúze pro hledání vad


Vývoj sběru intenzit dopravy. Ing. Petr Neuwirth Centrum dopravního výzkumu, v. v. i.

Tvorba povrchového modelu (ndsm) v časové řadě a jeho využití k detekci lesní těžby

SPRING Lenka Egrmajerová

PLOŠNÁ GRAFICKÁ ANALÝZA NEROVNOSTÍ VOZOVEK. Jiří Sláma

Porovnání výsledků viditelnosti získaných z topografických map a z digitálních modelů reliéfu

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Průzkumy dopravního chování: základní zdroj dat o dopravní poptávce. Petr Šenk Centrum dopravního výzkumu, v.v.i.

Možnosti modelování lesní vegetační stupňovitosti pomocí geoinformačních analýz

Využití dálkového průzkumu pro lokálně cílenou agrotechniku polních plodin. Vojtěch Lukas a kol.

Úvodem Dříve les než stromy 3 Operace s maticemi

Dálkový průzkum Země. Klasifikace obrazu

Geoinformatika. IX GIS modelování

Uživatelská podpora v prostředí WWW

MONITORING EROZNÍHO POŠKOZENÍ PŮD POMOCÍ METOD DPZ USING REMOTE SENSING FOR MONITORING OF SOIL DEGRADATION BY EROSION

Obsah. Co je to Field-Map? Field-Map software Popis technologie Field-Map Zdroje

Úvod do GIS. Prostorová data II. část. Pouze podkladová prezentace k přednáškám, nejedná se o studijní materiál pro samostatné studium.

INFORMAČNÍ SYSTÉMY PRO KRIZOVÉ ŘÍZENÍ GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY A JEJICH VYUŽITÍ V KRIZOVÉM ŘÍZENÍ ING. JIŘÍ BARTA, RNDR. ING.

Dálkový průzkum země v mikrovlnné části spektra

Protierozní ochrana 5. cvičení Téma: GIS řešení USLE stanovení faktorů LS a K. Výpočet ztráty půdy a určení erozní ohroženosti

Urban Planner. Urban Planner. Analytický nástroj pro hodnocení potenciálu území. Vývoj Urban Planneru. Přednastavené typy využití ploch

Vývoj Urban Planneru Urban Planner Analytický nástroj pro hodnocení potenciálu území. Urban Planner. Přednastavené typy využití ploch

DPZ10 Radar, lidar. Doc. Dr. Ing. Jiří Horák Institut geoinformatiky VŠB-TU Ostrava

Návod na použití aplikace Limity využití půdy

Zdroj:

Dálkový průzkum Země. Ústav geoinformačních technologií Lesnická a dřevařská fakulta MENDELU

Dálkový průzkum Země (úvod, základní pojmy, historický přehled)

fytopatogenů a modelování

Geomorfologické mapování

Zaměření vybraných typů nerovností vozovek metodou laserového skenování

ROZHODUJTE EFEKTIVNĚJI NAD DATY Z GEODISU

Hodnocení zdravotního stavu lesa pomocí nových metod dálkového průzkumu Země

GEOINFORMATIKA. -základní pojmy a principy -ukázky aplikací GIS v praxi. Lukáš MAREK a Vít PÁSZTO

Pokročilé operace s obrazem

Geografické informační systémy

Bezpilotní letecké prostředky Nové možnosti DPZ z UAV v oblasti životního prostředí. Jakub KARAS

ČESKÝ ÚŘAD ZEMĚMĚŘICKÝ A KATASTRÁLNÍ

Česká geologická služba

3D laserové skenování Silniční stavitelství. Aplikace

krajiny povodí Autoři:

8. přednáška z předmětu GIS1 Rastrový datový model a mapová algebra

Pozemní laserové skenování. Doc. Ing. Vlastimil Hanzl, CSc.

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Transkript:

Strojové učení a dolování dat vgeografii Vybrané partie dolování dat 2016/17 Jan Šimbera simberaj@natur.cuni.cz

Kde v geografii? Získávání prostorově podrobných dat Prostorová dezagregace Analýza dat dálkového průzkumu Big data processing(geotweets) Geomodelování Přírodní rizika a procesy Šíření druhů Mobilita populace

GEOMODELOVÁNÍ

Pravděpodobnost sesuvů Marjanović(2014) Per-pixelová segmentace a klasifikace Topografické a geologické příznaky Druh hornin, hloubka podzemní vody Výška nad závěrovým profilem (= rychlost odtoku) Sklon svahu, křivost, orientace, land cover SVM vyšlo jako nejlepší

PROSTOROVÁ DEZAGREGACE

Prostorová dezagregace Odhad prostorově podrobných dat vstup: méně podrobná data (vyšší adm. úroveň) + pomocná data (covariates) příznaky výhoda: je to model, bez problémů s OOÚ

Dezagregace princip rozpočítání na hodnoty podjednotek váhy w i nutno spočítat/namodelovat

Používané příznaky Landcover/ landuse podíl zelených ploch, tvar, počet a plocha budov hustota barů, bank, ordinací, lékáren Doprava hustota a zatížení sítí, dostupnost Terén sklon a orientace svahu, nadmořská výška Night light imagery, ChÚ, klima, tweety Problém volby okolí Mnoho potenciálních příznaků Dvoufázové trénování

DP Dezagragace hustoty zalidnění Geostat1 km grid-> urbanblocklevel General Regression(Specht 1991) trénováno na Praze (data za adresní body) testováno na Lublani ANN jsem nezvládl Nekompatibilita balíčků, backprop nefungovala WorldPop: random forests

DATA DÁLKOVÉHO PRŮZKUMU

Data DPZ satelitní a letecké snímky VIS, IR, termální pásmo, radarová data hyperspektrálnídata: šířka pásma λ pár nm, desítky pásem -> curse of dimensionality letecké laserové skenování (ALS)

Data DPZ užití Klasifikace land coveru changedetection Ekologické modelování přítomnost druhů / pravděpodobnost Detekce pohybů zemské kůry (mm přesnost) ALS -> digitální model terénu na rozdíl od klasické image analysischceme na výstupu také 2D informaci

Landcoverklasifikace příznaky Hodnoty z pásem Spektrální indexy (NDVI) NDVI NIR NIR Object-based Image Analysis = + R R segmentace obrazu kritéria: homogenita barev + tvarová kritéria objektové příznaky texturální míry, heterogenita, tvar, sousedství

ML metody pro klasifikaci klasická: Maximum Likelihood out-of-the-box cokoliv, co se najde v software (ENVI, ArcGIS, ecognition) ANN (konvenční) SVM Randomforests Filtrace ALS: nic Pravděpodobně výpočetní náročnost

MOBILNÍ SIGNALIZAČNÍ DATA

Mobilní signalizační data (CDR) Záznamy o aktivitě mobilních telefonů Hovor, zpráva, datový paket Změna buňky Ověření připojení jednou za čas (30 min 2 h) Na hranici bigdat 80 GB / 14 dní v ČR (1 operátor) Velké problémy s anonymizací Výzkum: bez vazby na demografii Zašumění a posuny času

Statická agregace rytmy lokalit

Dolování trajektorií Moving object databases Rekonstrukce trajektorií Časoprostorové dotazování (TB-strom) Agregace do buněk Shlukování Spektrální shlukování nad prům. vzdálenostmi Sémantické konverze dle kategorií lokací Jen pro podrobnější data Partition-and-group Frequent itemsets(se směrovou úpravou)

Partition-and-groupshlukování trajektorií Partition segmentace trajektorie Rozdělení dle reprezentativních bodů Výrazné ohyby ~ generalizace linie Group hierarchicky Vzdálenostní funkce: 3 faktory Kolmá vzdálenost Vzdálenost ve směru Rozdíl směrů Hlavní trajektorie

Regionalizace Shlukování zón dle OD matice do regionů Problémy Nesymetrická vzdálenostní matice Definice cílové funkce (při jiných přístupech) Subjektivní ad-hoc přístupy Velmi kvalitní (expertní vhled) Replikace prostor pro ML? Dedikované agregační metody Genetické algoritmy

NA ZÁVĚR Převládají jednoduché metody převodu 2+D informace na 1D a aplikace běžných ML metod Prostor zejména u velkých dat Trajektorie,