UNIVERZITA TOMÁŠE BATI VE ZLÍNĚ FAKULTA APLIKOVANÉ INFORMATIKY GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY 4 Lubomír Vašek Zlín 2013 Tento studijní materiál vznikl za finanční podpory Evropského sociálního fondu (ESF) a rozpočtu České republiky v rámci řešení projektu: MODERNIZACE VÝUKOVÝCH MATERIÁLŮ A DIDAKTICKÝCH METOD
2 Obsah... 3 1. Základní pojmy... 3 2. Data v GIS... 3 2.1 Typy geografických dat... 4 2.2... 4 2.2.1 Duální/hybridní model:... 4 2.2.2 Integrovaný model... 4 2.2.4 Objektově-relační přístup s podporou prostorových dat... 5 2.3 Srovnání hybridního/duálního a objektového modelu... 6 Použitá literatura... 7
3 STRUČNÝ OBSAH PŘEDNÁŠKY: Typy geografických dat pohled na vazbu mezi prostorovými a atributovými daty Porovnání jednotlivých datových modelů MOTIVACE: V této přednášce se studenti seznámí s typy dat používaných v GIS z hlediska jejich informačního obsahu. Dále získají přehled o užívaných datových modelech rozdělených podle konceptů svázaných s používanými databázemi a způsobu vytváření vazby mezi prostorovými a atributovými daty. CÍL: Získání znalostí o typech dat používaných v GIS z hlediska jejich informačního obsahu. Dále pak získání přehledu o základních vlastnostech jednotlivých používaných datových modelů. 1. Základní pojmy Typy geografických dat: data rodělená podle informačního obsahu na data prostorová, atributová a časová Datový model: podíl tepla procházejícího danou plochou a doby, po kterou teplo prochází. Datová struktura: způsob vlastního uložení dat v PC Objektový model: datový model, který využívá objektový přístup známý z objektového programováni 2. Data v GIS Pokud hovoříme o datech, rozlišujeme pojem datový model a datová struktura. Datovým modelem rozumíme to, jak jsou data logicky uspořádána, datovou strukturou rozumíme popis toho, jak jsou data uložena v PC. V dalším se budeme zabývat především popisem datových modelů, neboť ty jsou do značné míry obecně platné. Pokud jde o datovou strukturu, ta je do značné míry závislá na konkrétní implementaci daného GIS. K tomu jsou na některých místech tohoto textu uvedeny jen některé poznámky, týkající se GIS GeoMedia.
4 2.1 Typy geografických dat Geografická data obsahují dva až tři základní typy informací: prostorová informace - pozice, tvar a jejich vztah k ostatním objektům. popisná informace (atributová data) - další vlastnosti daného objektu např. teplota, typ asfaltu, tloušťka drátu, rok pořízení, typ plynového potrubí časová informace - je-li použita, přidává do systému dynamické vlastnosti, např. datum poslední opravy potrubí. V dalším budou popisována většinou jen prostorová data, protože atributová data se vyskytují běžně i v jiných IS a práce s nimi se studuje v jiných předmětech (databáze, informační systémy). Znalosti z těchto předmětů se zde předpokládají. 2.2 Konkrétními datovými modely pro jednotlivé typy reprezentace prostorových dat se budeme zabývat v následujících přednáškách. Zde se budeme věnovat jedné, pro GIS specifické záležitosti a to vztahu mezi atributovými a prostorovými daty. U GIS je velice podstatné provázáni grafických (prostorových) a negrafických (popisných) údajů. Způsoby svázání těchto údajů je možné rozdělit na několik různých typů, podle toho, jak se vyvíjely GIS i DBMS. 2.2.1 Duální/hybridní model: Je to velice rozšířený způsob, kde grafika je zpracovávána jednom systému, atributy v DBMS někde jinde (příklad ARC/1NFO. kde už z názvu je vidět, že jeden systém (ARC) zpracovává grafiku a druhý (INFO) se stará popisné atributy). Díky dualitě má však tento model problémy s integritou dat a to především mezi prostorovou a popisnou složkou (nelze zaručit, že někdo pomoci DBMS neobejde GIS SW a nemodifikuje data přímo v DB). Neřeší problematiku dlouhých transakcí. Má problémy s bezešvými daty (vše je rozdělené na mapové listy, což je špatné hlavně z hlediska udržení topologie v modelu). Příkladem systému jsou ARC/INFO, MGE, a další významné GIS systémy. 2.2.2 Integrovaný model Tento model se rozšiřuje hlavně v poslední době. Vše je uloženo v jedné databázi (jak prostorová, tak popisná složka), ale využíván je pouze standardní relační model. management dat se stará middleware, což je produkt tvořící komunikační vrstvu mezi databázi a GIS SW, a ne databáze samotná. Díky uložení prostorové části v databázi je možné používat bezešvá prostorová data a odpadá dělení prostorou na mapové listy. Model je však relativně pomalý (hlavně kvůli tomu, že standardní relační databáze neumí
5 efektivně ukládat prostorová data). Není definován standard přístupu k prostorovým datům v databázi (prostorová data jsou uložena jako binární posloupnosti (Binary Large Objects - BLOBs), což znemožňuje data zpracovávat již v DBMS či pomocí jiného SW). Model neodstraňuje problémy s dlouhými transakcemi a integritou dat. Příkladem mohou být ARCjTNFO s modulem ArcStorm, SDE, GeoMedia. V systému GeoMedia jsou prostorová data uložena v DB, v každé tabulce pro jednotlivou třídu objektů ve speciálním poli (sloupci), označeném Geometry. Toto pole je typu BLOB. Vektorové objekty mají v tomto poli uložena v předepsané formě charakteristická data v závislosti na typu objektu (např. pro liniový objekt je za hlavičkou uložena posloupnost souřadnic jednotlivých vertexů linie). U rastrových objektů je pak ve stejném poli ve formě textového řetězce uložen úplný název (včetně cesty) souboru, v němž jsou obsažena vlastní rastrová data v některém z grafických formátů (např. tiff). Speciálním případem integrovaného modelu jsou pak prostorové databáze, které umožňují ukládat prostorová data ve standardizované podobě spolu s atributy. Díky tomu, že míddleware se v podstatě přesunul do DBMS (je součástí DBMS), jsou odstraněny problémy s integritou dat a částečně i s výkonnosti. Příkladem je Oracle Spatial Cartrídge 2.2.3 Objektový model V objektové databázi jsou uloženy přímo objekty reprezentující reálný objekt, tzn., že prostorové i atributové složky jsou uloženy spolu s metodami objektu. V tomto modelu se celý GIS pak stává vlastně OODB. V databázi jsou obvykle definovány základní třídy geografických objektů (bod, linie, polygon, rastr) a od nich jsou pak pomocí dědičnosti odvozeny další, složitější a specializovanější třídy. Například z primitivnější třídy linie je odvozena třída komunikace (dopravní), která má již specifické chováni a atributy nutné pro komunikaci, jako je povrch, počet pruhů a z třídy komunikace pak třída dálnice (jedná se o speciální případ komunikace se speciálními atributy a metodami). Díky objektově orientovanému řešení je obvykle řešena i problematika různé grafické' reprezentace téhož objektu (například elektrické vedení bude vizualizováno jinak ve schematické síti a na mapě), která je od GIS v poslední době často požadována. Model nemá žádné problémy s integritou (je řešena již na úrovni objektu). Díky principu práce OODB není většinou problém s dlouhými transakcemi, vše je řešeno na úrovni uchovávání několika verzí objektu. Existují však problémy s výkonností systému a částečně i s napojením na standardní relační databázi. Příklad systému je Smallworld (velice využívaný správci inženýrských sítí). 2.2.4 Objektově-relační přístup s podporou prostorových dat Je to kompromis relačního modelu a OO modelu - bere to nejlepší z obou dvou modelů. Je možné vytvářet objekty, ale podporuje i klasická data.
6 Využívá speciálních indexačních mechanismů, které podporují prostorová data. Umožňuje snadno integrovat stávající relační DB do nového prostředí. Díky tomu, že se o prostorová data stará přímo DBMS, je integrita dat bezproblémová. Příkladem je Oracle Spatial Cartridge, ArcGIS 8.x. 2.3 Srovnání hybridního/duálního a objektového modelu Jelikož hybridní model je nejpoužívanější a objektový zase nejlepší, co se týká užitných vlastností, je vhodné tyto dva modely porovnat. Hybridní přístup Výhody: jednoduchá možnost modifikovat, snadná integrace atributových dat s dalšími relačními systémy a aplikacemi, jednoduché použití, propracované teoretické základy pro relační databáze, standardizace v RDBMS (SQL ) a využití těchto standardů. Nevýhody: nedostatečné možnosti při zpracování časových dat, není nijak zabráněno v porušení integrity dat z DBMS, pomalé dotazování, zvláště u složitých objektů, nedostatečná podpora dlouhých transakcí", relativně špatná přizpůsobitelnost požadavkům konkrétní aplikace. Objektový přístup Výhody: OOP je vhodnější pro modelování komplexních objektů, neexistují rozdíly mezi atributovými a prostorovými údaji - je to celý objekt, rastrová a vektorová data mohou být jednoduše integrována v jedné databázi, pro uložení dat je potřeba méně diskového prostoru než hybridní přístup (RDBMS pracují s mnoha indexovými tabulkami), snadné upravováni vlastností stávajících i nových objektů - lepší přizpůsobitelnost konkrétní aplikaci, jeden geografický objekt může být reprezentován více reprezentacemi (např. silníce - polygon i linie), podpora i pro další typy dat (multimedia... ). Nevýhody: zatím neexistuje standard v OO databázích, tudíž různé OODBMS jsou navzájem
7 nekompatibilní (z toho plyne nepřenositelnost aplikací). identifikace objektu je často složitá, zvláště ve spojitých datech (rastrech), menší teoretické i praktické zkušeností než s hybridními systémy, složitější návrh databáze - je třeba definovat i metody, OODBMS jsou náročné na hardware. Přednáškový text se vztahuje k těmto otázkám: Typy geografických dat. Výhody a nevýhody jednotlivých typů datových modelů Použitá literatura [1] Břehovský M., Jedlička K.: Úvod do geografických informačních systémů, ZČU Plzeň, Přednáškové texty [2] Kolár, J.: Geografické informační systémy 10, Praha, ČVUT, 2001. ISBN 80-01-02687-6. [3] Tuček, J.: Geografické informační systémy - principy a praxe, Praha, Computer Press, 1998. ISBN 80-7226-091-X. [4] Burrough, Peter A. McDonnell, Rachael A. : Principles of geographical information systems /. 1st ed. repr.. Oxford : 1998. 0-19-823365-5.