UNIVERZITA TOMÁŠE BATI VE ZLÍNĚ FAKULTA APLIKOVANÉ INFORMATIKY GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY 6 Lubomír Vašek Zlín 2013
Obsah... 3 1. Základní pojmy... 3 2. Princip rastrové reprezentace... 3 2.1 Užívané typy tvaru buněk.... 4 3. Základní typy rastrových datových modelů, popisy jejich struktur... 7 3.1 Pravidelné reprezentace - pravidelné čtvercové mřížky... 7 3.2 Nepravidelné reprezentace... 9 Použitá literatura... 12
STRUČNÝ OBSAH PŘEDNÁŠKY: Princip rastrové reprezentace prostorových dat. Typy buněk užívaných v rastrové reprezentaci, jejich výhody a nevýhody. Komprese rastrových dat. TIN síť, její reprezentace, výhody a nevýhody. Porovnání vektorové a rastrové reprezentace prostorových dat. MOTIVACE: V této přednášce se studenti seznámí s rastrovou reprezentací prostorových dat, s jejími principy, typy a praktickými aplikacemi. Jsou zde rozebrány jak pravidelné mozaiky, tak i nepravidelné sítě a to po stránce jejich výhod a nevýhod i příkladů praktického použití. Jsou porovnány vektorová a rastrová reprezentace prostorových dat. CÍL: Seznámení se s principy a praktickým použitím rastrové reprezentace prostorových dat, s jejími jednotlivými typy, výhodami a nevýhodami. Z porovnání vektorové a rastrové reprezentace prostorových dat se získají poznatky pro praktickou volbu odpovídající reprezentace prostorových dat. 1. Základní pojmy Rastrová reprezentace: jeden ze dvou užívaných způsobů zachycení prostorových dat, kdy jednotlivé geografické objekty jsou popsány v kontextu celé oblasti, v níž se nacházejí. Buňka: základní prostorový prvek pro rastrovou reprezentaci. skalární intenzivní veličina, která je vhodná k popisu stavu ustálených Mozaika: síť buněk může být pravidelná nebo nepravidelná, podle typu použitých buněk. Komprese rastrových dat: zmenšení objemu rastrových dat bez snížení jejich informačního obsahu. 2. Princip rastrové reprezentace Na rozdíl od vektorové reprezentace se rastrová reprezentace zaměřuje na danou lokalitu jako celek. Většinou je používána pro reprezentaci spojitě se měnících jevů, jako je např. digitální model reliéfu (DMR) či rozložení dešťových srážek viz obr. 1. Základním stavebním prvkem je u rastrové struktury tzv. buňka (cell). Buňky jsou organizovány do tzv. mozaiky. Jednotlivé buňky obsahují hodnoty (values) zkoumané veličiny v odpovídajícím místě dané lokality.
Mozaiky rastrové reprezentace můžeme rozlišit podle způsobu dělení prostoru na: pravidelné (regular) - všechny buňky mají stejnou velikost a tvar nepravidelné (irregular) - velikost i tvar jednotlivých buněk se liší. Obr. 1 Rastrový obraz přehledu ročních srážek v Evropě 2.1 Užívané typy tvaru buněk. čtvercová buňka (pravidelná mozaika) trojúhelníková buňka (nepravidelná mozaika) hexagonální buňka (pravidelná mozaika) Nejčastěji se používá čtvercová mozaika má tyto výhody: je kompatibilní s datovými strukturami programovacích jazyku používaných pro tvorbu GIS software, je kompatibilní s mnoha zařízeními pro vstup a výstup dat (monitory, scannery, plottery), je kompatibilní s kartézským souřadnicovým systémem. Nevýhody použití čtvercové mozaiky: detail - celý obraz je reprezentován stejným způsobem, tudíž uloženi velké oblasti, skládající se z pixelů stejného typu, není nijak optimalizováno, abstrakce - k získání méně detailního obrazu je nutné použít všechna data náročnost na úložný prostor - zbytečné plýtvání místem, plýtvání pamětí - celý datový soubor musí být v paměti, což může být obtížné u velkých obrazů.
Trojúhelníková mozaika má tu unikátní vlastnost, že jednotlivé buňky nemají stejnou orientaci. To je výhoda při reprezentování digitálního modelu reliéfu (terénu), kde je každému vrcholu o souřadnicích (x, y) přiřazena funkční hodnota z = f (x,y), např. výška. Jednotlivé trojúhelníky pak implicitně obsahují údaje o svém sklonu a směru tohoto sklonu. Daní za tuto vlastnost je mnohem větší složitost všech algoritmů pracujících s tímto modelem. Hexagonální (šestiúhelníková) mozaika má tu výhodu, že středy všech sousedních buněk jsou ekvidistantní (stejně od sebe vzdálené), což je výhodné pro některé analytické funkce (např.: paprskové vyhledáváni). Ve čtvercové mřížce je toto nemožné a tato vlastnost se musí kompenzovat nebo prostě zanedbat. Hexagonální tvar buňky se však používá jen velmi zřídka. Topologie je v rastrovém modelu definována implicitně (je jasné kdo je čí soused), tudíž není nutné jí explicitně ukládat jako pro vektorový model. Zaměříme se nyní na pravidelné čtvercové mřížky (rastry), protože ty jsou, jak bylo uvedeno, nejčastěji využívané. Stejně jako u vektorových modelů, rastrová datová struktura může nést informace o bodech, liniích a plochách. Bod odpovídá jedné buňce, linie odpovídá řadě spojených buněk se stejnou hodnotou a plocha odpovídá skupině navzájem sousedících buněk se stejnou hodnotou, viz obr. 2. Obr. 2 Základní geografické objekty ve vektorové a v rastrové reprezentaci Pří využívání rastru pro reprezentaci povrchu je třetí rozměr reprezentován jako hodnota tohoto rastru. Ta je pak funkcí dvourozměrných souřadnic z = f (x, y).
Poznámky: Při reprezentaci prostorových objektů mozaikou je třeba dbát na zvolení vhodného rozlišení resp. velikosti pixelu (zkratka od picture element obrazový bod). Při nevhodné volbě rozlišení muže dojít buď k zbytečnému ukládáni mnoha dat na disk, nebo naopak ke ztrátě prostorových informaci, například o tvaru jednotlivých objektů. Některé informace se mohou ztratit úplně. Obr. 3 Vliv velikosti rozlišení na kvalitu zobrazení Problematika reprezentace "žádné hodnoty" (NoVa1ue/NoData) se v počítači řeší zavedením speciální hodnoty NODATA. která nabývá předem zvolené hodnoty. Například v ARC/INFO GRlD (modul na zpracování rastrového datového modelu v software ARC/INFO) je tato hodnota určena jako -9999. Mozaiky mohou reprezentovat hodnotu bud' pouze pro střed buňky (tzv. lattices) nebo pro celou oblast buňky (tzv. grids) Z hlediska obsahu lze rastrová data dělit na data reprezentující jeden jev (tzv. klasické rastry) a na data obrazová. Obrazová data: Snímek DPZ - vícepásmové obrazy (př.: snímky z družice) používané pro vyhodnocení polohy jednotlivých geografických prvku v krajině (vodstvo, lesy, silnice,... ). Takto vyhodnocené vrstvy jsou pak uloženy do rastru. Ortofoto - ve většině případu používáno jako jednopásmový obraz (sice RGB, CMYK ale uložené např. jako tiff) používané pro vyhodnocení polohy jednotlivých geografických prvku v krajině. Spíše zde již převládá využití jako podkladových dat pod tematické vrstvy. Tento studijní materiál vznikl za finanční podpory Evropského sociálního fondu (ESF) a rozpočtu České republiky v rámci řešení projektu: CZ.1.07/2.2.00/15.0463, MODERNIZACE VÝUKOVÝCH MATERIÁLŮ A DIDAKTICKÝCH METOD
7 Skenované plány - podkladová data pod tematické vrstvy, musí ale být georeferencovány. Dokumentace - nereferencovaná obrazová data, sloužící pouze jako archivní dokumentace projektu. "Klasické rastry: Pouze jednopásmová data znázorňující rozložení jednoho geografického jevu (nadmořská výška, vodstvo, lesy, atd.). Tato data mohou být získána např. právě vyhodnocením obrazových dat. 3. Základní typy rastrových datových modelů, popisy jejich struktur 3.1 Pravidelné reprezentace - pravidelné čtvercové mřížky Definice pro dvourozměrný prostor (2D): Čtvercová mozaika (mřížka) je v souřadnicovém systému jednoznačně definována souřadnicemi počátečního bodu, velikosti buňky a počtem buněk ve směru X a Y. V geometrii nastává problém tzv. metriky: Metrika je způsob definice vzdálenosti dvou buněk. V GIS jsou používány nejčastěji následující typy metrik: Bloková metrika - vzdálenost středů dvou buněk je definována jako minimální počet překonaných hran (diagonální vzdálenost, tedy vzdálenost buněk sousedících rohem je 2). Šachovnicová metrika - vzdálenost středů dvou buněk je definována jako minimální počet překonaných hran i středů (diagonální vzdálenost je 1). Euklidovská metrika vzdálenost D středů dvou buněk A (x A, y A ) a B (x B, y B ) je definována jako D = sqrt((x A x B ) 2 + (y A y B ) 2 ) kde x A, y A a x B, y B jsou souřadnice středů buněk A a B. Diagonální vzdálenost sousedních buněk je potom rovna velikosti hrany buňky násobené 2 1/2. Kompresní techniky používané pro ukládání pravidelných rastrů Uložení rastrových dat je velice náročné na prostor a má vysoké režijní náklady. Velikost dat záleží na rozloze představované oblasti a na rozlišení bodu, ale vůbec nezávisí na obsahu. Pro zmenšení náročnosti je nutné zavést více účinné způsoby uložení, hlavně pro reprezentaci řídce rozptýlených bodů. Se zavedením kompresních technik se však pro operace využívající okolí zpracovávaného bodu musí data nejdříve dekódovat a až pak je možné data zpracovat. Nejenom z tohoto důvodu se kompresní techniky většinou užívají jen pro ukládání dat na disk a pro vlastní zpracování v paměti je k reprezentaci užívána dvourozměrná matice. MODERNIZACE VÝUKOVÝCH MATERIÁLŮ A DIDAKTICKÝCH METOD CZ.1.07/2.2.00/15.0463,
8 Metoda délkových kódů (Run Lenght Encoding - RLE) RLE je jedna z technik odstraňující neefektivnost uložení rastrových dat pomocí matic. Využívá vlastností, že mnoho dat obsahuje rozsáhlé homogenní objekty, reprezentované velkým množstvím pixelů. Místo uchovávání hodnot každého bodu, RLE pixelů o stejné hodnotě do skupiny a tu potom ukládá ve formě (počet hodnota). Uvažujme následující rastrová data. 1 1 1 1 5 5 9 9 9 9 9 9 9 2 9 9 9 Při použití techniky RLE dostaneme datovou strukturu, kde jsou původní data nahrazena páry skládající se z počtu opakujících se pixelů stejné hodnoty za sebou a vlastní hodnoty pixelu. Podle našeho příkladu se tedy první čtyři pixely o hodnotě 1 z tvaru (l 1 1 1) zakódují do (4 1). Celý zakódovaný řádek vypadá následovně. (4 1) (2 5) (7 9) (1 2) (3 9) Jak je vidět, pixel o hodnotě 2 je zakódován jako (1 2). To znamená, že místo komprese nastala expanze jednoho elementu do dvou. Díky této vlastností není RLE technika vhodná pro data s častými změnami v průběhu. V nejhorším případě, když neexistují žádné úseky se stejnými hodnotami, se po zakódování dat zvětší velikost dvakrát. Z tohoto důvodu se používají současně s RLE i jiné techniky komprese. Čtyřstrom (QuadTree) QuadTree je zástupcem hierarchických rastrových struktur. Využívá model rozděl a panuj" tak, že dělí prostor do kvadrantů. Ty jsou opět rozděleny do dalších čtyř kvadrantů, až do doby, kdy kvadrantu odpovídá homogenní oblast. Tato struktura vytváří strom s uzly reprezentujícími heterogenní oblastí a listy oblastí se stejnou hodnotou. Na obrázku je uveden rastrový obraz a jemu odpovídající strom. Viz obr. 4. Obr. 4 Princip komprese QuadTree Nevýhodou QuadTree struktury je, že není invariantní s operacemi translace, rotace a změna měřítka. Tento problém se ale týká všech hierarchických modelů reprezentace rastrových dat využívajících dělení prostoru. MODERNIZACE VÝUKOVÝCH MATERIÁLŮ A DIDAKTICKÝCH METOD CZ.1.07/2.2.00/15.0463,
9 Obr. 5 Příklad komprese QuadTree Adaptivní komprese Adaptivní komprese rastrových dat využívá vlastnosti, že data jdou rozdělit do bloku a ty lze zakódovat pomocí metody s nejvyšší účinnosti. Takový způsob má výhodu v tom, že nedochází ke zbytečnému nárůstu režijních nákladů pro jakákoli data, jak tomu je v případě RLE a částečně i QuadTree. 3.2 Nepravidelné reprezentace Prakticky se nepoužívají, protože všechny algoritmy (pro vytvoření, uložení i analýzy) jsou mnohonásobně složitější, než u pravidelných rastrů. Jedinou výjimkou je nepravidelná trojúhelníková síť (Triangulated Irregular Network - TIN), která je velice často používána pro reprezentaci povrchů, například DMR (Digitální Model Reliéfu), viz obr. 6. MODERNIZACE VÝUKOVÝCH MATERIÁLŮ A DIDAKTICKÝCH METOD CZ.1.07/2.2.00/15.0463,
10 Obr. 6 Použití TIN pro reprezentaci DMR (Digitálního Modelu Reliéfu) Nepravidelná trojúhelníková síť (Triangulated Irregular Network - TIN), TIN reprezentuje povrch jako soubor trojúhelníků (odtud trojúhelníková), které jsou definovány třemi body umístěnými kdekoliv v prostoru (odtud nepravidelná) a pro tyto trojúhelníky uchovává topologické vztahy (odtud síť). Vlastní proces vytvoření sítě se nazývá triangulace. Ten je poměrné náročný na výpočetní výkon. V počítači je TIN uložena ve třech seznamech: v seznamu trojúhelníků, v seznamu hran těchto trojúhelníků a v seznamu souřadnic vrcholů těchto trojúhelníku (viz obr. 7). Obr. 7 Reprezentace nepravidelné trojúhelníkové sítě (TIN) Výhody oproti pravidelným rastrovým reprezentacím: zmenšeni objemu uložených údajů při reprezentaci nehomogenních povrchů, větší přesnost a věrnost pro nehomogenní povrchy (více kopců a rovin najednou, například Říp a okolí), hodnota zobrazované veličiny se přiřazuje jednotlivým vrcholům trojúhelníku a struktura tedy automaticky obsahuje informace o sklonu a směru tohoto sklonu. kompatibilita s moderními grafickými kartami (které podporují 3D zobrazeni v reálném čase). MODERNIZACE VÝUKOVÝCH MATERIÁLŮ A DIDAKTICKÝCH METOD CZ.1.07/2.2.00/15.0463,
11 Nevýhody: složitost struktury a algoritmů s ní pracujících. Porovnání výhod a nevýhod pro výběr vhodné reprezentace Vektorový model Výhody vysoká polohová přesnost objektů grafický výstup je blízký klasickým mapám vhodné pro reprezentaci a modelování jednotlivých objektů relativně malý objem uložených dat vhodný pro kartografické výstupy Nevýhody komplikovanost datové struktury složitost výpočtů při analytických operacích časově náročné vytváření topologie špatně reprezentují spojité povrchy nevhodnost pro prostorové modelování a simulace Rastrový model Výhody jednoduchost datové struktury jednoduchá kombinace s údaji DPZ i fotogrammetrickými jednoduché vykonáváni analytických operací vhodnost pro modelování a simulace Nevýhody velký objem uložených údajů přesnost závislá na velikosti buňky menší vizuální kvalita kartografických výstupů nevhodnost pro analýzy sítí pro transformace je třeba speciálních algoritmů a výkonný hardware Přednáškový text se vztahuje k těmto otázkám: Princip rastrové reprezentace prostorových dat. Typy buněk užívaných v rastrové reprezentaci, jejich výhody a nevýhody. Komprese rastrových dat. TIN síť, její reprezentace, výhody a nevýhody. Výhody a nevýhody vektorové a rastrové reprezentace prostorových dat. MODERNIZACE VÝUKOVÝCH MATERIÁLŮ A DIDAKTICKÝCH METOD CZ.1.07/2.2.00/15.0463,
12 Použitá literatura [1] Břehovský M., Jedlička K.: Úvod do geografických informačních systémů, ZČU Plzeň, Přednáškové texty [2] Kolár, J.: Geografické informační systémy 10, Praha, ČVUT, 2001. ISBN 80-01-02687-6. [3] Tuček, J.: Geografické informační systémy - principy a praxe, Praha, Computer Press, 1998. ISBN 80-7226-091-X. [4] Burrough, Peter A. McDonnell, Rachael A. : Principles of geographical information systems /. 1st ed. repr.. Oxford : 1998. 0-19-823365-5. MODERNIZACE VÝUKOVÝCH MATERIÁLŮ A DIDAKTICKÝCH METOD CZ.1.07/2.2.00/15.0463,