ZÁPADOČESKÁ UNIVERZITA Fakulta aplikovaných věd v Plzni Obor: Katedra: Předmět: Geomatika Katedra matematiky Aplikace geografických informačních systémů Téma projektu: Datový model pro data z ČSÚ Vedoucí seminární práce: Ing. Karel Janečka Autor: Jaroslav Zámiš 2007
Obsah: 1. Úvod, zadání 2. Logický model 3. Atributová statistika 4. Fyzický model 5. Možnost načtení hodnot z tabulek se souřadnicemi do ESRI formátu 6. Závěr 7. Seznam zdrojů 2
1. Úvod Cílem projektu je vytvoření logického a fyzického modelu předpokládané databáze, jež bude vybudována z dat UIR ZSJ (Územně identifikační registr základních sídelních jednotek). Tato data jsou volně přístupná na WWW stránkách Českého statistického úřadu. Dalším cílem projektu je ověřit možnost konverze dat s souřadnicovými atributy do vektorového formátu firmy ESRI shapefile. Systém UIR ZSJ je vybudován a udržován jako zdrojový registr soustavy ZSJ, jakožto zdroj pro přidělování kódu částí obcí a katastrálních území, dále slouží pro zveřejňování změn v územně správním členění ČR a v neposlední řadě je používán jako informační zdroj pro navazující systémy (sčítání lidu, identifikace v GIS atd.) 2. Logický model Data jsou dostupná ve formě balíku tabulek ve formátu DBF a lze je rozdělit do několika skupin: a) číselníky územních a evidenčních jednotek: - OBLASTI.dbf - jednotky NUTS 2 (regiony soudržnosti), - KRAJE.dbf - 14 krajů (VÚSC), - OKRESY.dbf - okresy, - OBCE.dbf - obce a vojenské újezdy, - MCAST.dbf - městské části a městské obvody v Praze a ve statutárních městech, - COBE.dbf - části obce evidenční (v číselnících ČSÚ: části obce) sloužík číslování domů, - COB.dbf - části obce statistické (v číselnících ČSÚ: části obce-díly) slouží ke skladebnosti územních jednotek do lexikálního třídění, tj. obsahují části obce včetně jejich dílů v různých městských částech a městských obvodech, - KU.dbf - katastrální území, - UTJ.dbf - územně technické jednotky, - ZSJ.dbf - základní sídelní jednotky včetně jejich dílů, b) číselníky správních obvodů: - ORP.dbf - obce s rozšířenou působností, - POU.dbf - obce s pověřeným obecním úřadem, - STUR.dbf - stavební úřady, - MATUR.dbf - matriční úřady, - FINUR.dbf - finanční úřady, c) číselníky bývalých jednotek územního plánování a regionální politiky (udržují se pro kontinuitu historických dat promítnutých do aktuálního územně správního členění): - SOMV.dbf - střediska osídlení místního a obvodního významu (platné do roku 1993), - SRAMR.dbf - sídelní regionální aglomerace a městské regiony (platné do roku 1993), - OCR.dbf - oblasti cestovního ruchu (bývalé), d) další doplňkové číselníky: - SM.dbf - hlavní město Praha a statutární města, - UR.dbf - typ úřadu v obci nebo městském obvodu/městské části (magistrát, městský, obecní, atd.), nově rozdělen na dva číselníky: - UROBCE.dbf typ úřadu v obci, - URMCAST.dbf typ úřadu v městském obvodu/městské části, - NEST.dbf - číselník nestandardních jednotek, 3
e) pomocný pracovní soubor, který obsahuje stručný popis významu všech položek ve všech souborech ÚIR-ZSJ: - POLOZKY.dbf - seznam všech položek ve všech souborech s jejich významem, který slouží jako stručný popis struktur souborů ÚIR-ZSJ. Vlastní logický model je reprezentován nákresem tabulek a vyznačením přepokládaných vazeb. 4
3. Atributová statistika Tato statistika je dostupná např. v aplikaci SQL Developer, který umožňuje práci s daty uloženými v DB Oracle (Expres Edition), kam byla data převedena (pomocí konverze tabulek DBF přes formát CSV do struktury dat Oracle). Z údajů atributové statistiky lze vytipovat primární klíče pro jednotlivé tabulky (jedna statistika stanovuje počet neduplicitních položek ve sloupci, pokud je rovna počtu záznamů, lze ji prohlásit za kandidáta na primární klíč). Pokud je vytipováno více atributů pro primární klíč, je vybrán nejvhodnější dle návaznosti do jiných tabulek: název tabulky atribut použitelný jako primární klíč ======================================= COB KODCOB COBE KODCOBE FINUR KODFI KRAJE KN KU KODKU MATUR KODMA MCAST KODMC NEST Nelze použít stávající OBCE KODOB OBLASTI KODNUTS OCR KODOCR OKRESY KODOK ORP KODORP POLOZKY Pomocná tabulka POU KODPO SM SM SOMV KODSOMV SRAMR KODSRA STUR PORCSU UTJ KODUTJ ZSJ Nelze použít stávající V případě tabulky NEST by bylo možno vytvořit primární klíč např. pomocí kombinace atributů KODNEST a KODOK (složený klíč). V případě tabulky ZSJ nebylo možno najít žádnou použitelnou kombinaci a pro použití stávajících atributů by bylo nutno doplnit hodnoty (protože sloupce jež tvoří jednoznačnou kombinaci obsahují hodnoty NULL), nebo použít nový atribut (po vyřešení problému s nenaplněnými hodnotami by bylo možno použít atributy KODZSJ, KODZSL, DILSL, KODZ01, KZ01 a DIL01 pro vytvoření primárního klíče). 5
4. Fyzický model Testování dat bylo provedeno v SW MS Access. Mezi tabulkami MCAST a KU existuje pravděpodobně vazba M:N a proto bude nutno tuto vazbu realizovat rozkladovou tabulkou MCAST-KU. Vlastní fyzický model je reprezentován nákresem tabulek a vyznačením vazeb. 5. Možnost načtení hodnot z tabulek se souřadnicemi do ESRI formátu Následující tabulky obsahují prostorové atributy (souřadnice YX): COB, COBE, KU, MCAST, OBCE, UTJ, ZSJ. Tyto informace jsou vedeny pro jejich využití v dalších informačních systémech s prostorovou složkou (GIS). Jednoduchou možností vizualizace prostorové složky těchto dat je použití funkce Vytvořit prvkovou třídu v programu ArcCatalog a provést export do shapefile, jež lze zobrazit v např. v programu ArcMap. Data byla exportována z prostředí MS Access. Zde byla před exportem provedena manipulace (update) s atributy vyjadřujícími souřadnice v S-JTSK (v případě tabulky OBCE jsou to SYOB a SXOB) záměna znaménka u souřadnic. Takto upravenou tabulku lze zobrazit a exportovat do bodové prvkové třídy (je vytvořen shapefile). 6
Při této operaci je nutno zadat, který atribut je souřadnice X a Y a zde je nutno pro správné zobrazení prohodit souřadnice. 7
Vytvořený shapefile lze zobrazit v např. ArcMap a připojit k němu jako popis atributová data z tabulky (např. název obce). 8
6. Závěr V rámci tohoto projektu jsem se seznámil se systémem UIR-ZSJ, jehož data jsou volně poskytována Českým statistickým úřadem. Při testování dat jsem narazil na různé problémy, spojené zejména s konverzemi dat z formátu DBF do jiných formátů (např import DBF-CSV-Oracle) z důvodů nenaplněnosti či duplicity určitých položek. Přesto si myslím, že po určitých úpravách (např. doplnění nevyplněných položek či doplnění nových atributů) jsou data použitelná i v nových projektech a jsou použitelná pro vizualizaci v GIS. 7. Seznam zdrojů http://www.czso.cz/ http://www.czso.cz/csu/rso.nsf/i/prohlizec_uir_zsj http://gis.zcu.cz/studium/ugi/cviceni/ 9