GRR. získávání znalostí v geografických datech Autoři. Knowledge Discovery Group Faculty of Informatics Masaryk Univerzity Brno, Czech Republic

Podobné dokumenty
Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence

FOSS4G úspěšné projekty

DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Pokročilé metody geostatistiky v R-projektu

VY_32_INOVACE_INF.19. Inkscape, GIMP, Blender

Matematika v programovacích

Moderní systémy pro získávání znalostí z informací a dat

Získávání dat z databází 1 DMINA 2010

Dobývání znalostí z databází

7. Geografické informační systémy.

12. přednáška ze stavební geodézie SG01. Ing. Tomáš Křemen, Ph.D.

Dolování z textu. Martin Vítek

SRSW4IT Inventarizační SW. Prezentace aplikace. Vedoucí DP: ing. Lukáš Macura Autor: Bc. Petr Mrůzek

Software Operaèní systém autorské dílo licenci multilicenci Aplikaèní software Komerèní programy upgrade OEM software Demoverze a zku ební verze

Software Operaèní systém autorské dílo licenci multilicenci Aplikaèní software Komerèní programy upgrade OEM software Demoverze a zku ební verze

Software Operaèní systém autorské dílo licenci multilicenci Aplikaèní software Komerèní programy upgrade OEM software Demoverze a zku ební verze

Platforma ArcGIS. Platforma ArcGIS se skládá ze čtyř komponent: dat, zdrojů, portálu a aplikací.

Využití metod strojového učení v bioinformatice David Hoksza

Hledání prostorových asociačních pravidel v prostorových databázích. Discovery of Spatial Association Rules in Geographic Information Databases

v návaznosti na Strategii resortu MZe ČR s výhledem do roku 2030 o podpořit zachování nejkvalitnější zemědělské půdy pro zemědělskou produkci,

Vývojové nástroje pro multiagentové systémy

SPRING Lenka Egrmajerová

METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1

Počítačové řešení elektrických obvodů

PostGIS. Luboš Hejduk, Petr Sedlář 2007

úvod Historie operačních systémů

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group

Algoritmy a struktury neuropočítačů ASN - P10. Aplikace UNS v biomedicíně

Analýza dat v GIS. Dotazy na databáze. Překrytí Overlay Mapová algebra Vzdálenostní funkce. Funkce souvislosti Interpolační funkce Topografické funkce

Hospodářská informatika

Úvodem Dříve les než stromy 3 Operace s maticemi

Rastrová reprezentace geoprvků model polí Porovnání rastrové a vektorové reprezentace geoprvků Digitální model terénu GIS 1 153GS01 / 153GIS1

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9

Datová věda (Data Science) akademický navazující magisterský program

Vyvinuté programové vybavení (projekt čís. TA )

Geografické informační systémy

Geografické informační systémy GIS

RadioBase 3 Databázový subsystém pro správu dat vysílačů plošného pokrytí

Dolování dat z dotazníků. Ondřej Takács

Lekce 10 Analýzy prostorových dat

GEOINFORMATIKA. -základní pojmy a principy -ukázky aplikací GIS v praxi. Lukáš MAREK a Vít PÁSZTO

Svět svobodného softwaru

Seznámení s prostředím dot.net Framework

Profilová část maturitní zkoušky 2013/2014

V t í á t V á V s ČVU V T v v P r P a r ze

Myšlenkové mapy v Linuxu

Rozvoj tepla v betonových konstrukcích

1 Obsah přípravné fáze projektu Poohří

Institut teoretické informatiky (ITI) na FI MU

Diplomová práce Prostředí pro programování pohybu manipulátorů

Architektury Informačních systémů. Jaroslav Žáček

GIS S SYSTÉMY KRIZOVÉHO ŘÍZENÍ. Bc. Vladimír Bátrla,BAT027

Znalostní systém nad ontologií ve formátu Topic Maps

Vizualizace v Information Retrieval

Strojové učení a dolování dat. Vybrané partie dolování dat 2016/17 Jan Šimbera

Shluková analýza vícerozměrných dat v programu R

DATAMINING SEWEBAR CMS

LINUX - INSTALACE & KONFIGURACE

Vytěžování znalostí z dat

Wichterlovo gymnázium, Ostrava-Poruba, příspěvková organizace. Maturitní otázky z předmětu INFORMATIKA A VÝPOČETNÍ TECHNIKA

Geoinformační technologie

Architektury Informačních systémů. Jaroslav Žáček

ANALÝZA A KLASIFIKACE DAT

Analýza a prezentace dat

Možnosti modelování lesní vegetační stupňovitosti pomocí geoinformačních analýz

INFORMAČNÍ SYSTÉMY PRO KRIZOVÉ ŘÍZENÍ GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY A JEJICH VYUŽITÍ V KRIZOVÉM ŘÍZENÍ ING. JIŘÍ BARTA, RNDR. ING.

Aplikace. prostorového navázání zastávek veřejné autobusové dopravy na přilehlou pozemní komunikaci s využitím prostorových a popisných dat

Systémy pro tvorbu digitálních knihoven

Shlukování prostorových dat KDE+

Uživatelská podpora v prostředí WWW

Hardware Různé počítačové platformy (personální počítače, pracovní stanice, víceuživatelské systémy) Požadavek na konkrétní vstupní a výstupní zařízen

GIS ANALÝZA VLIVU DÁLNIČNÍ SÍTĚ NA OKOLNÍ KRAJINU. Veronika Berková 1

Kritérium Orange Weka KEEL KNIME TANAGRA AlphaMiner RA, RS, RP, S, AP, DS, NS, BM, MNS, GA, + TXT, XLS, CSV, C45, ARF, + CSV, XLS, ARF, + BMP, PNG, +

Aplikace. prostorového navázání nehod v silničním provozu na přilehlou pozemní komunikaci s využitím prostorových a popisných dat

Přípravný kurz ECDL. Popis jednotlivých lekcí (modulů) je uveden v samostatných tabulkách níže. Rozsah kurzu

Vzdělávací obsah vyučovacího předmětu

Domino 10 nové komponenty a související témata (node.js, ES )

Metody ukládání časoprostorových dat pro multirelační dolování

Projekt implementace OS Linux do výuky informačních technologií

Strojové učení se zaměřením na vliv vstupních dat

Geoinformatika. I Geoinformatika a historie GIS

GIS v regionální analýze a jejich využití na příkladu Moravskoslezského kraje a města Ostravy

Aplikace. prostorového navázání železničních přejezdů na přilehlou pozemní komunikaci s využitím prostorových a popisných dat

MBI - technologická realizace modelu

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Lekce 4 - Vektorové a rastrové systémy

Měření teploty, tlaku a vlhkosti vzduchu s přenosem dat přes internet a zobrazování na WEB stránce

Obsah. Seznam obrázků. Seznam tabulek. Petr Berka, 2011

PLÁN ICT ŠKOLNÍ ROK 2015/2016

Dobývání a vizualizace znalostí

Zdroj:

5.15 INFORMATIKA A VÝPOČETNÍ TECHNIKA

Testování neuronových sítí pro prostorovou interpolaci v softwaru GRASS GIS

Dobývání a vizualizace znalostí

Simluátor Trilobota. (projekt do předmětu ROB)

Systémy pro podporu. rozhodování. 2. Úvod do problematiky systémů pro podporu. rozhodování

IS pro podporu BOZP na FIT ČVUT

Transkript:

GRR získávání znalostí v geografických datech Autoři Knowledge Discovery Group Faculty of Informatics Masaryk Univerzity Brno, Czech Republic

GRR cílet 2 GRR - Popis systému - cíle systém pro dolování v geografických datech snadno dostupný pro běžné uživatele snadno rozšiřitelný co nejméně závislý na použitém geografickém informačním systému

GRR - Popis systému GRR - Systém pro dolování v geografickém informačním systému GRASS Struktura systému GRR grafické uživatelské rozhraní rozhraní pro komunikaci se systémem R rozhraní pro komunikaci s vlastním geografickým informačním systémem vizualizér - výsledné znalosti jsou vyjádřeny v jazyku PMML. Systém umožňuje jejich vizualizaci. GRR popis systému 3

GRR - Popis systému Struktura systému GRR GRR popis systému 4

GRR - Popis systému Grafické rozhraní GRR popis systému 5

GRR - implementace implementován v jazyku Perl (verze 5.6.1) pro tvorbu grafického uživatelského rozhraní bylo využito Tk (verze 8.0) vytvořen a testován v operačním systému Linux RedHat 7.2. testován se systémem R verze 1.6.1. pro komunikaci mezi systémem GRASS a R byl použit v systému R přídavný modul GRASS (verze 0.1-11) Rogera Bivanda Jako vizualizátor byl použit PMML vizualizer [Wetts02] implementovaný v jazyce java GRR implementace 6

GRR - GRASS GRR je vystavěn nad geografickém informačním systému GRASS je v podstatě nádstavbou GRR pracuje nad daty, které máme otevřeny v systému GRASS dále využívá možností zobrazení vrstev v GRASSu GRR je odladěn nad verzí systému GRASS 5.0.0. GRR grass 7

GRASS - Geographical Resources Analysis Support systém geografický informační systém (GIS) vyvíjený od roku 1982 "open-source" - free software (v ramci projektu GNU) pracuje pod operačními systémy UNIX (na různých platformách) s grafickým uživatelským rozhraním X-Windows existuje i verze pro Windows NT/2000/XP (s použitím systému cygwin) http://grass.itc.it GRR grass 8

GRASS - Geographical Resources Analysis Support systém Grafické rozhraní GRR grass 9

GRR - data Geografická data, která máme k dispozici pro demonstrování práce systému GRR, pokrývají severozápadní část Leicestershire v Anglii Jde o rastrová data pokrývající výřez velikosti 12km x 12km Část této oblasti je spíše nížinatá (sever a východ) a část pokrývá vysočina. GRR data 10

GRR - data V oblasti jsou: dvě větší města Loughborough Shepshe hustá síť silnic různých kategorií Železnice řeka (Soar) GRR data 11

GRR data jednotlivé vrstvy crash vrstva, ve které je označeno místo nehody na dálnici contours zde jsou zaznamenány vrstevnice procházející touto oblastí image jde o černobílý satelitní snímek dané oblasti landcov v této vrstvě jsou barevně odlišeny oblasti podle pokryvu resp. využití plant zde je vyznačena čistírna odpadních vod GRR data 12

GRR data jednotlivé vrstvy popln rail v této vrstvě jsou vyznačeny oblasti, které jsou zalidněny vrstva, kde jsou vyznačeny železnice roads v této vrstvě je zaznačena síť silnic, které jsou klasifikované podle typu: dálnice, plánované, silnice tř. A, silnice tř. B, silnice tř. C segment zde je zaznamenán úsek řeky, který je znečištěn source v této vrstvě je vyznačen zdroj znečištění GRR data 13

GRR data jednotlivé vrstvy spillage zde je vyznačena míra rizika chemického znečištění topo zde je pro každou buňku určena nadmořská výška (jde o digitální model) urban v této vrstvě jsou vyznačena důležitá městská území water zde jsou vyznačeny řeky a vodní nádrže GRR data 14

GRR data jednotlivé vrstvy Import vrstev do systemu GRR Zobrazení vrstev image a landcov v systemu Grass GRR data 15

GRR data vrstva landcov barevně odlišeny oblasti podle pokryvu resp. využití: průmysl. obytná oblast lom/důl zalesněná oblast orná půda pastvina křovinatá oblast vodní plocha GRR data 16

GRR - R http://www.r-project.org systém pro analýzu dat a grafickou prezentaci výsledku volně šířitelný software v rámci projektu GNU pro operační systémy: UNIX Windows 9x/NT/2000 Mac OS GRR R Součástí systému je programovací jazyk s překladačem a systém knihoven 17

R poskytuje širokou škálu metod předzpracování dat statistických technik algoritmů strojového učení např: Klasifikace Shlukováni lineární a nelineární modelováni asociační pravidla Umožňuje též výsledky vizualizovat. GRR R 18

GRR - Metody předzpracování Vzorkování výběr náhodného vzorku zadané velikosti Metody pro výběr atributů LVF Konstrukce nových atributů analýza hlavních komponent hledání častých vzorů GRR předzpracování 19

LVF metoda pro výběr relevantních atributů pro klasifikaci implementovaná v jazyce C Filipem Procházkou uživatel může na základě výsledků zůžit výběr vstupních dat pro další práci GRR předzpracování 20

GRR -Metody dolování klasifikace dat pomocí rozhodovacích stromů metody pro hledání shluků aglomerativní i hierarchická metoda asociační pravidla ILP klasifikační pravidla, časté vzory a asociační pravidla weka GRR metody dolování 21

Aleph V rámci GRR byl využit na dolování klasifikačních pravidel Základní postup výpočtu systému: GRR metody dolování 22

INDEED Odvozuje klasifikační pravidla v podobě Hornových klauzulí Napsán v jazyce Prolog Vyvinut na FI MU GRR aktuální část 23

Rozhodovací strom cílem je pro vstupní atributy a výstupní atribut (diskrétní) nalézt, model pomocí kterého můžeme klasifikovat data Implementováno pomocí externí knihovny rpart systému R GRR metody dolování 24

Regresní strom narozdíl od rozhodovacího stromu má výstupní atribut spojitý také využívá knihovnu rpart systému R GRR metody dolování 25

RAP Nástroj na hledání častých vzorů v datech Napsán v jazyce Prolog Vyvinut na FI MU Algoritmus výpočtu: GRR metody dolování 26

Clara principem algoritmu je nalézt shluky podobných záznamů implementována v externí knihovně cluster systému R GRR metody dolování 27

Autoclass automatický klasifikační systém, založený na metodách učení bez učitele k určování tříd používá Bayesovský přístup GRR metody dolování 28

weka Systém vyvinutý na University of Waikato na Novém Zélandu souhrn knihoven v Javě implementované nástroje umožňují: předzpracování dat klasifikaci regresi shlukování hledání asociačních pravidel GRR metody dolování 29

GRR - Vizualizace PMML PMML - Predictive Modeling Markup Language standard pro reprezentaci výsledků data mining http://www.dmg.org/pmml-v1-1.htm podporován jak nekomerčními systémy pro vyhledávání znalostí v databázích (Knowledge Discovery Support Engines, KDDSE) tak komerčními firmami jako je IBM. Oracle, SAS a SPSS výsledky dolování lze vizualizovat pomocí PMML- Vizualizéru http://soleunet.ijs.si/website/other/pmml.html GRR vizualizace 30

GRR - Vizualizace PMML Vizualizace rohodovacího stromu GRR vizualizace 31

GRR Více na: http://www.fi.muni.cz/kd/projects/grr/ GRR 32