GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY CN 02 1. přednáška
Seznam přednášek: 1. Co je GIS, definice, základní datové struktury GIS, seznámení se s vybranými programy na GIS, k čemu slouží GIS 2. Databázové struktury, tvorba GIS, editační schopnosti GIS 3. Základní aplikace GIS, analytické možnosti GIS, metody dotazování v GIS 4. GIS a 3-D analýzy, geokódování 5. GIS a prostorové analýzy založené na rastrových datech, mapová algebra 6. GIS a analýzy na síťovém grafu, metoda obchodního cestujícího, rozvoz zboží, nejkratší cesty 7. GIS a passport liniových staveb
Geo pracuje s údaji a informacemi vztahujícími se k Zemi, pro které je dána jejich lokalizace v prostoru, případně v čase grafický využívá prostředků grafické prezentace dat, výsledků a analýz a grafické komunikace s uživatelem Informační provádí sběr, ukládání, analýzu a syntézu dat s cílem získat nové informace, potřebné pro rozhodování, řízení, plánováním či modelování Systém integrace technických a programových prostředků, dat, pracovních postupů, personálu, uživatelů apod. do jednoho funkčního celku
Co to je GIS? Geografický informační systém je organizovaný souhrn počítačové techniky, programového vybavení, geografických dat a zaměstnanců navržený tak, aby mohl efektivně získávat, ukládat, aktualizovat, analyzovat, přenášet a zobrazovat všechny druhy geograficky vztažených informací.
Geografický informační systém je informační systém pracující s prostorovými daty. Další definice
Vztah GIS a ostatních oborů
Co GIS není! GIS není počítačový systém na vytváření map GIS není CAD
Oblasti využití GIS Maloobchod výběr nejvhodnějších míst pro supermarkety optimalizaci rozmístění skladovacích kapacit optimalizaci zásobovací sítě supermarketů. Inženýrské sítě správa dat o sítích modelování reakcí sítí na změnu poptávky, na poruchy Životní prostředí jedná se o historicky první oblast užití geografických informačních systémů inventarizace přírodních zdrojů modelování přírodních procesů (eroze půdy, modelování šíření povodňové vlny) Archeologie
Oblasti využití GIS Státní správa územní plánování evidence nemovitostí vyměřování daní správu majetku Doprava plánování a údržba dopravní infrastruktury optimalizace městské hromadné dopravy, dálkové přepravy navigace vozidel pomocí systémů umístěných ve vozidlech Záchranné služby dispečeři záchranných služeb navádění vozidel do místa neštěstí Armáda a bezpečnostní služby
Příklady projektů realizovaných v ČR Využití digitálního modelu terénu pro rozbor erozních a odtokových poměrů Mapa erozní ohroženosti zemědělské půdy a transportu splavenin využití digitálních podkladů v měřítku ČR Ekologická stabilizace v záplavovém území Kategorizace zemědělských odvodňovacích soustav zpracování melioračního detailu pro hydraulické výpočty Analýza zdrojů a modelování znečišťování ovzduší v rozsáhlém území Využití GIS při modelování interakcí základních složek životního prostředí Monitorování změn krajinného pokryvu s využitím GIS a DPZ Obnova funkce krajiny narušené povrchovou těžbou Analýza ekologických nároků tetřívka obecného ve východní části Krušných hor Vytipování vhodných lokalit pro reintrodukci tetřeva Využití GPS při typologickém mapování Silniční a železniční pasport
Státní správa a samospráva, životní prostředí Cenové mapy pro odhadce, projektanty, daňové zatížení pozemků Odkud budou vidět projektované výškové stavby (větrné elektrárny, vysílače mobilních operátorů.) určení oblasti narušení krajinného rázu Monitoring hloubky hladiny podzemní vody v sondách a modelování interpolací Analýzy ekologických nároků druhu
Státní správa a samospráva, životní prostředí, lesnictví Modelování dopadů projekčních plánů na povodí Trasy odtoku z povodí a zdroje znečištění Modelování šíření: Lesního požáru na základě údajů o terénu, vodních zdrojích, kvalitě lesa Kůrovcové kalamity na základě expozice, druhového složení, zdravotního stavu porostu Druhu na základě výskytu vhodných biotopů a překážek
Státní správa a samospráva, životní prostředí, lesnictví Optimalizace tras Kudy vést lesní cesty Pohyb mezi výzkumnými lokalitami v terénu Tvorba porostních map, vyhledávání porostů splňujících zadané podmínky
Inženýrské sítě Optimalizace umístění nových transformátorů Kde jsou nejbližší uzavírací kohouty od místa, kde praskl vodovod? Které segmenty potrubí jsou nejvíce ohroženy vzhledem ke geologickým a hydrogeologickým podmínkám
Optimální rozmístění sil vzhledem k míře kriminality Obchod Analýza vhodnosti umístění obchodních míst na základě koncentrace zákazníků v okolí a umístění konkurence
Povodně vyhodnocení, prevence
Ochrana přírody - management
Strukturální členění GIS Hardware - počítače, poč. sítě, vstupní a výstupní zařízení Software - často bývá modulárně postaven = jádro systému (zakl. příkazy pro práci s geodaty) + nadstavby (spec. práce) Data nejdůležitější část GIS (90% nákladů) Lidé programátoři, specialisté GIS, uživatelé Metody využití GIS, zapojení do stávajícího IS
Funkční členění GIS Vstup dat Zpracování a uchování GIS Vykonání analýz a syntéz s využitím prostorových vztahů Prezentace výsledků (mapy, zprávy, tabulky) Interakce s uživatelem (desktop/web GIS)
Životnost komponent GIS Hardware: 2-3 roky Základní software: 4-7 let Aplikační software: 10-15 let Lidé: dny-desetiletí
Historie GIS 1963 - R. F. Tomlinsen zavedl pojem GIS jako novou technologii pracující s daty a podávající informaci o terénu pomocí výpočetní techniky 60. léta aplikace zaměřené na digitální kartografii (CGIS Canadian GIS 10 000 diditálních map) 70. léta aplikace s důrazem na zpracování a uchování dat (LIS) 80. léta. - komercionalizace, nové systémy založené na CAD určené na zpracování geografických dat (ESRI, Intergraph..) 90. léta počátek standardizace, desktop GIS, Internet Současnost vývoj objektově orientovaných systémů, propojení s databázemi, vzdálený přístup přes Internet.
Různé aspekty GIS Kartografický: důraz je kladen především na informačně- komunikační funkci mapy Databázový: dominuje potřeba inventarizace, shromažďování, třídění, selektování a prezentování údajů Analytický: vyzdvihuje schopnosti prostorové analýzy, syntéz poznatků a modelování.
Databáze Databáze je sdílená kolekce logicky uspořádaných dat (a popisu těchto dat - metadat), která je navržena tak, aby splňovala potřeby uživatele. Původní název databanka: určitý soubor uspořádaných informací (dat) Podnikový archiv Systém kartotéčních lístků v knihovně Informace o zákaznících podniku Informace o studentech a studijních oborech fakulty Kvalitně zpracovaný tahák Účel: co nejefektivnější zjišťování informací o vložených jevech kdo napsal knihu Rumcajs a v které polici ji najdu? Počítačové databáze pouze umožňují zpracovávat data efektivněji Interaktivní řazení a třídění dat, vyhledávání určitého textu, vyhledávání údajů splňujících složitou soustavu podmínek
Datová základna: soubor všech uživatelských dat uložených v databázi Databázový systém = data + nástroje pro práci s daty. Access. FoxPro, dbase. Paradox. Oracle. MySQL. SQL Server.. atd.. A v různé míře různé sw GIS
Základní dovednosti databázového systému Založení evidence Naplnění daty Měnit zapsaná data Doplnit další sledované údaje Mazat data Zapisovat nová data Vypočítávat další údaje Řazení dat Výběr údajů Formuláře Tiskové sestavy Export / import Makra, moduly
Relační databázový model Vytváří vztah mezi sloupci a řádky Umožňuje vytvořit vztahy mezi jakýmikoliv dvěma soubory prostřednictvím nějakého společného pole Pro svou flexibilitu je hojně využíván Dříve se používaly další databázové modely hierarchický a síťový
Relační datový model reprezentuje množina dvourozměrných tabulek: Na každou tabulku se odkazujeme jejím jménem Každý řádek reprezentuje datovou větu (record) a každý sloupec pak datovou proměnnou Množina datových proměnných (položek, fields) pak definuje datovou strukturu tabulky (structure).
Data a jejich uložení relační model Databáze kolekce databázových tabulek Př. Tabulka Hospody Id NAZEV CENA PROSTREDI ZAHRADKA 1 U tlustý báby 11 4,5 Ano 2 U suchý dásně 16 3 Ne 3 Pod kaštany 15 2 Ano 4 V Šakalově 15 1,5 Ne 5 U zloděje 25 2,5 Ano 6 Na mýtince 14 2 Ano Základní prvky: Sloupec (pole, field, atribut) Řádek (záznam, record) Hodnota (uživatelská data)
Datové typy Musí být definován název a datový typ každého sloupce Id NAZEV CENA PROSTREDI ZAHRADKA 1 U tlustý báby 11 4,5 Ano 2 U suchý dásně 16 3 Ne 3 Pod kaštany 15 2 Ano 4 V Šakalově 15 1,5 Ne 5 U zloděje 25 2,5 Ano 6 Na mýtince 14 2 Ano Text (znak, char, řetězec, string) libovolné znaky Číslo (numeric) pouze čísla určitého rozsahu, ve většině systémů podtypy Short Integer, Long integer, Float, Double Ano/Ne (Boolean, Logic) logické hodnoty true false Datum. Definice (návrh, založení tabulky)
Nejběžnější datové typy 1. Text - textové položky mohou obsahovat všechny znaky, které lze zadávat z klávesnice. To znamená číslice, písmena, interpunkční znaménka a grafické symboly. Délka textové položky může být až 255 znaků, ale zabírá pouze prostor nutný pro uchování vložených údajů. 2. Memo - tato položka může obsahovat všechny znaky, které lze zadávat z klávesnice. Délka této položky může být až 32 000, ale zabírá pouze prostor nutný pro uchování vložených údajů. 3. Number - položka tohoto typu může obsahovat pouze číslice, desetinnou tečku nebo znaménko minus. Položek typu number může být více druhů: byte - obsahuje pouze kladné hodnoty typu integer (celá čísla) od 0-255 integer - celá čísla od -32 768 do 32 767 long integer - celá čísla od -2 147 483 678 do 2 147 483 647 single - číselné hodnoty v jednoduché přesnosti od -3.4*1038 do 3.4*10^38 double - číselné hodnoty v dvojité přesnosti od -1.797*10^308 do 1.797*10^308
4. Counter - položka tohoto typu uchovává hodnoty long integer, které jsou automaticky o jedna zvyšovány přidáním nového záznamu. 5. Date/Time - tato položka reprezentuje dny v kalendáři nebo hodiny. 6. Ano/Ne - položky tohoto typu obsahují logické hodnoty, které mohou být vyjádřeny jako 0/1, ano/ne, nebo true/false. 7. OLE object - tato položka uchovává data, která nejsou reprezentována znaky. Mohou to být například grafické objekty, zvukové záznamy, fotografie, video sekvence a pod.
Pojmenování objektů v databázi V databázi jsou objekty různého druhu (tabulka, sloupec, index.) Všechny musí být pojmenovány dle zásad: Název obsahuje jen písmena (bez diakritiky) a číslice a znaky _ Název musí začínat písmenem Název má omezenou délku (dle systému) Názvy objektů musí být v jedné databázi jedinečné (výjimky: indexy, sloupce v různých tabulkách) Název nesmí být shodný s rezervovaným slovem Název by měl být výstižný Př. Sloupec pro datum narození: datum_nar, dat_nar, dnarozeni
Klíče Primární klíč Pole (nebo kombinace polí), které jednoznačně identifikuje záznam V každém řádku má unikátní hodnotu, nemohou existovat dva řádky se stejným primárním klíčem Nesmí obsahovat hodnotu Null Má ho mít každá tabulka Vybere se z tzv. kandidátních klíčů Cizí klíč Pole sloužící k propojení tabulky s jinou tabulkou Primární klíč z cizí tabulky Jednoduchý x složený klíč
Vztahy mezi tabulkami Databázi zpravidla tvoří více tabulek, mezi nimiž jsou vztahy Mezi dvěmi tabulkami může být: 1 : 1 1 : N N : M Vztah mezi tabulkami nebo tabulka sama může být nazývána relací
1 : 1 Relace 1:1 Muzi.dbf ID Prijmeni Jmeno Narozeni 1 Novák František 23.9.1958 2 Podpěra Jan 15.11.1935 Zeny.dbf Monogamie ID Partner Prijmeni Jmeno Narozeni Sukne 153 1 Nováková Lada 14.7.1963 60 289 2 Podpěrová Alena 10.10.1980 30
1 : N Muzi.dbf Relace 1:N ID Prijmeni Jmeno Narozeni 1 Muhamad Ali-Baba 23.9.1958 2 Mustafa Abdul-Ali 15.11.1935 Zeny.dbf Polygamie ID Partner Prijmeni Jmeno Narozeni 152 1 Muhamad Seherezada 29.2.1951 153 1 Muhamad Alifa 14.7.1963 161 1 Muhamad Hala-Bala 10.10.1980 283 2.. 284 2..
Muzi.dbf ID_m Prezdivka 1 Divoch 2 Šmoula 3 Kikin 4 Moula 5 Džejár 6 Ufoun 7 Bijec 8 Dugi 9 Mistr 10 Bredpit N : M Zeny.dbf ID_z Prezdivka 1 Micka 2 Kotě 3 Manka 4 Víla 5 Miselí 6 Dolly 7 Bobina 8 Mařena 9 Pamela 10 Těžká Barbora
1. Analýza 2. Návrh Model vztahů entit Život databáze Entita - je jednoznačně rozlišitelný, identifikovatelný a samostatné existence schopný objekt z reálného světa Atribut entity popisný údaj k entitě rozpoznat, co je v navrhované databázi entitou a jaké má mít atributy jaké mezi našimi entitami existují vztahy Jaké atributy patří k entitě, co bude tvořit primární a cizí klíče, jakého datového typu atribut je Popř. jakých hodnot může atribut nabývat 3. Implementace 4. Testování, provozování a údržba
Dotazovací jazyk SQL u relačních databází 1. práce s daty je uskutečňována pouze relačními prostředky 2. databáze na logické úrovni je dána pouze relacemi 3. musí existovat přístupový mechanismus k uloženým datům (název tabulky,název sloupce, hodnota přístupového klíče) 4. jsou definovány prázdné hodnoty 5. veškerý popis databázových objektů je uchován v relačních tabulkách, manipulace s daty je založena na relační algebře 6. existuje jazyk pro definici dat včetně vytváření pohledů a podpory vstupů a výstupů 7. existují příkazy pro manipulaci s daty (příkazy - insert, delete, update) 8. je možné definovat přístupová práva 9. logické relace jsou nezávislé na jejich fyzické reprezentaci (fyzická datová nezávislost) 10. funguje logická datová nezávislost
Příkazy SQL jazyka (Structured query language) Tabulku lze vytvořit tímto SQL příkazem Velká a malá písmena SQL jazyk nerozlišuje CREATE TABLE <jmeno tabulky> (<polozka> <typ> }<delka>), (<polozka> <typ> }<delka>)]...); Data do tabulky pak ukládáme po řádkách příkazem: INSERT INTO <jmeno tabulky> VALUES (<seznam konstant>);
CREATE TABLE vcelari ( jmeno adresa narozen kraj poc_vcelstev litru_medu TEXT(20), TEXT(25), DATE, TEXT(15), INTEGER, SINGLE); INSERT INTO vcelari VALUE ( Jaroslav Smutný, Veveří 95, 27.01.1970, Jihomoravský,5,20); INSERT INTO vcelari VALUE ( Jan Poláček, Grohova 78, 25.11.1950, Jihočeský,24,125);
K čemu slouží indexy Představují pomocnou složku databáze, která uchovává informace jedné nebo několika položek v tabulce. Indexy slouží k urychlení operací jako je setřídění a hledání záznamů podle klíčových položek. Takže, indexové klíče jsou vhodné pro následující účely: k urychlení procesu zobrazení záznamu v jiném pořadí, než v jakém byly zadány k urychlení vyhledávání jednotlivých záznamů podle jednoznačných hodnot v klíčových položkách k urychlení dotazů, které vybírají záznamy podle obsahu klíčových položek k zamezení zadávání záznamů se stejnými indexovými klíči podporu vazeb mezi tabulkami k určení implicitního pořadí zobrazování záznamů Většina tabulek by měla mít minimálně jeden zvláštní klíč, který se nazývá primární klíč. Tento určuje implicitní pořadí zobrazení při prohlížení záznamů a navíc slouží jako jednoznačný identifikátor.
Příjmení Jméno Číslo věty Příjmení Smutný Adam Kadaňka Zvěřina Bílek Jaroslav Jan Pavel Pavel Miroslav 2 Adam 5 Bílek 3 Kadaňka 1 Smutný 4 Zvěřina databáze indexový klíč V jazyce SQL vypadá příkaz na indexování následovně: ORDER BY <seznam klíčů> SELECT * FROM vcelari ORDER BY litru_medu DESC; DESC - znamená sestupně
Jazyk SQL a relace mezi tabulkami V jazyce SQL vypadá příkaz na sestavení relace a dotazu následovně: SELECT <seznam sloupců> FROM <seznam tabulek> WHERE <podmínka spojení> Operace spojení je provedena příkazem SELECT tak, že v klauzuli FROM uvedeme seznam jmen spojovaných tabulek a v klauzuli WHERE uvedeme podmínku spojení.
Pozor - někteří zákazníci si mohou půjčit auto vícekrát, nebo, že půjčovna může mít více stanovišť, kde jsou auta zaparkována 1. po logické analýze problému prvotní struktura dat z_kód příjmení adresa a_kód model s_kód stanoviště cena půjčeno vráceno 2. po normalizaci zákazník z_kód příjmení adresa pronájem z_kód a_kód půjčeno vráceno pronájem a_kód model cena s_kód stanoviště s_kód stanoviště
Atributy v GIS vztah 1 : 1 Primární klíč Př. Plochy bezlesí navázané na atributovou tabulku porostní mapy Cizí klíč
Atributy v GIS 1 : N Př. Porostní mapa a hospodářská kniha Funkce RELATE!!! Nelze použít při klasifikaci; pro ni musíme nějak získat vztah 1 :1
Prostorová (geografická) data Prostorová data (spatial data) jsou data, která se vztahují k určitým místům v prostoru, a pro která jsou na potřebné úrovni rozlišení známé lokalizace těchto míst. Jednotlivá data jsou organizována v tématických vrstvách (layer, theme, coverage). Reprezentace komplexního světa pomocí jednoduchých tématických vrstev umožňuje zorganizovat a pochopit vztahy mezi vrstvami.
Geografický prvek (feature) Geoprvek je základní prostorová entita, která je dále nedělitelná na jednotky stejného typu a která je popisovaná prostorovými daty. Na každý geoprvek se odkazujeme jedinečným identifikátorem, unikátním kódem. Geoprvky mohou reprezentovat jak objekty reálného světa (studna, silnice, řeka, jezero), tak i abstraktní jednotky (volební obvody).
Složky popisu geoprvku Má-li být geoprvek v GISu správně reprezentováv a zpracován musí být popsán z mnoha hledisek: geomertické zaznamenává lokalizaci geoprvku v prostoru, popisuje přímo jeho geometrické vlastnosti a nepřímo prostorové vztahy s okolními objekty (topologii) popisné (tématické) zaznamenává negeometrické vlastnosti geoprvku, tzv. atributy geoprvku časové zaznamenává pozici geoprvku na časové ose, tedy jeho existenci při daném stavu geometrie a atributů vztahové popisuje vztahy, do nichž geoprvek vstupuje s jinými georvky funkční popisuje operace, které lze s daným geoprvkem provádět
Popis geoprvku Časová složka popisu
Datové modely v GIS Datový model označení logické struktury dat z pohledu zobrazení reálného světa v GIS, představuje zjednodušený pohled na část reálného světa Datová struktura označení logické a fyzické struktury dat v databázi Datové modelování je proces abstrakce, při kterém jsou podstatné elementy reálného světa zdůrazněny a nepodstatné eliminovány s ohledem na cíl, který má toto modelování splnit Datové modely a datové struktury jsou na sobě závislé, pokrok používaný v datových modelech je limitovám pokrokem v používaných datových strukturách Datová model popisuje nejstabilnější a nejnákladnější součást GISu data (požadovaná životnost dat 50.let)
Proces modelování (příklad) Vnitřní model Pozorování reálného světa Promítnutí vnitřního modelu pozorovatele do mapy Papírová mapa Digitizér Převod papírové mapy do GIS pomocí digitizéru
Rozdělení datových modelů Klasické (mapa GIS), reálný svět je rozdělen na 0-2D geometrické prvky (body, linie, plochy) Rastrový zaměřuje se na danou lokalitu jako celek, používá se na prezentaci spojitě se měnících jevů (teplota, srážky, bonita půdy, oblast znečistění) Vektorový zaměřuje se na popis jednotlivých geografických objektů Hybridní využívá duálních dat, uložení dat v rastrovém i vektorovém modelu, velká redundance dat Objektové (vnitřní model GIS), založené na principech OOP, ve stádiu vývoje
Vektorový datový model Nejrozšířenější datový model používaný v GISech Pro popis geometrických vlastností se používají lineární geometrické prvky, tzv. vektory Vektor je orientovaná úsečka, definovaná souřadnicemi počátečního a koncového bodu
Základní geometrické prvky Bod jako vektor nulové délky Linie otevřená posloupnost vektorů, uzel je počáteční a koncový bod, vrcholem se označuje mezilehlý bod Plocha reprezentována uzavřenou hraniční linií, uzavřenou posloupností vektorů
Základní geometrické prvky
Typy vektorových datových modelů Vektorové datové struktury jsou založeny na jednotlivých bodech u kterých je známa jejich poloha. Ty se používají k popisu složitějších objektů pomocí bodů a linií. Špagetový model Topogický model Hierarchický model
Špagetový model Nejjednodušší model Každý prvek je kódován odděleně ve vektorové formě, bez vytváření vztahů s okolními prvky Uplatnění v digitální kartografii
Topologický model Každá linie začíná a končí v uzlu Dvě linie se mohou protínat jen v uzlu Uzly jsou uloženy jako soubor souřadnic x,y Struktura také obsahuje identifikátor polygonu Neuspořádanost záznamů, při vyhledávání určitého liniového segmentu se musí projít celý soubor
Hierarchický model Základní stavebním kamenem jsou body Linie se skládají z úseček, které jsou definovány jako seřazená množina vrcholů o souřadnicích x,y Uzly jsou počáteční nebo koncové body linií (průsečíky) Polygony jsou definovány jako plochy ohraničené pomocí řetězců linií
Shapefiles Nejrozšířenější formát Široce podporován v různém software Nepodporuje topologii (narozdíl od Coverage nebo Geodatabase) Nepodporuje křivky (např. Bézierovy používané v kartografii) Atributy ukládá ve formátu dbase - jistá omezení V každém Shapele může být obsažen pouze jeden typ geometrie Je složen z minimálně 3 souborů, může jich být i víc
SHP - povinný, soubor s geometrií DBF - povinný, atributová tabulka ve formátu dbase SHX - povinný, soubor s indexem propojujícím geometrii a atributy PRJ - definice použitého souřadnicového systému v ESRI SBN - prostorový index SBX - prostorový index ATX - atributový index SHP.XML - metadata ve formátu XML QIX - quad-tree prostorový index
Nejjednodušší forma geografických dat Neukládají se topologické vztahy mezi různými prvky, případně třídami prvků Soubory typu shapefile zahrnují následující typy bodových prvků: 1. Body 2. Vícenásobné body 3. Jednoduché linie 4. Vícedílné linie 5. Jednoduché plochy 6. Vícedílné plochy
atributový index - vytvoří index nad vybraným atributem, slouží k rychlejší práci s atributovou tabulkou ArcToolbox - Data Management Tools Indexes Add Attribute Index, přidá atributový index, je třeba vybrat příslušné atributy, které mají být indexovány, název indexu, zda jsou hodnoty indexu jedinečné a zda mají být hodnoty indexovány ve vzestupném pořadí. U Shapele není možné volit název a parametry, index se pak vytvoří jako soubor shape.atribut.atx prostorový index - vytvoří index nad geometrií ArcToolbox - Data Management Tools Indexes Add Spatial Index, přidá prostorový index, je třeba zvolit úrovně prostorového indexu (Spatial Grid 1 až 3). Využito je totiž indexování do gridu (pravidelné čtvercové sítě). U Shapele není možné volit úrovně gridu, index se pak vytvoří jako soubory shape.sbx a shape.sbn.