OTEVÍRÁNÍ GEODAT - PŘÍPAD IPR PRAHA JÁCHYM ČEPICKÝ

Podobné dokumenty
Otevřená geodata a mapové služby. Jiří Čtyroký Institut plánování a rozvoje hl. m. Prahy

Praha na cestě k Open datům. Jiří Čtyroký Institut plánování a rozvoje hl. m. Prahy

Otevřená data. Shrnutí. Když stavím nový IS nebo upravuji existující, co musím udělat, abych byl Open Data Ready? Prosinec 2018

Open Source projekty a INSPIRE

Otevřená geografická data IPR Praha. Jiří Čtyroký Institut plánování a rozvoje hl. m. Prahy

GIS a nemapové služby

Webové služby pro prostorová data

GeoHosting. Martin Vlk. (vypusťte svoje data do světa) Help forest s.r.o. člen skupiny WirelessInfo 2008

Sociodemografická data v GIS

Geoportál a georeporty hl. m. Prahy. Jiří Čtyroký Útvar rozvoje hl. m. Prahy

OGC GeoPackage nový formát pro výměnu prostorových dat. Jáchym Čepický OpenGeoLabs s.r.o. GIVS 2018

INSPIRE konference Inspirujme se otevřeností. GIS Jihomoravského kraje blíž uživateli

ArcGIS Server na platformě Web sdílení dat a služeb

Správa VF XML DTM DMVS Datový model a ontologický popis

Linked Data v oblasti geoinformačních technologií

Převod prostorových dat katastru nemovitostí do formátu shapefile

Sémantický web 10 let poté

FOSS4G úspěšné projekty

ROZŠIŘOVÁNÍ MOŽNOSTÍ PUBLIKACE DAT ZEMĚMĚŘICKÉHO ÚŘADU

Otevřená data veřejné správy

Hardware Různé počítačové platformy (personální počítače, pracovní stanice, víceuživatelské systémy) Požadavek na konkrétní vstupní a výstupní zařízen

ArcGIS Server 10.1/10.2

internetu v rámci výuky

Geoprostorová řešení pro státní správu a samosprávu. Vladimír Špaček, Intergraph ČR

DTM DMVS Plzeňského kraje

Free and Open Source Software for Geoinformatics FOSS4G

Publikování map na webu - WMS

Logický datový model VF XML DTM DMVS

SA Služby IS DMVS LK

GIS Libereckého kraje

Národní technické specifikace. služeb nad prostorovými daty a metadaty

ZEMĚMĚŘICKÝ ÚŘAD. Poskytování dat a služeb Geoportál ČÚZK. Petr Dvořáček

Mapové servery. Novák Petr Katedra informatiky a geoinformatiky Fakulta životního prostředí Univerzita J. E. Purkyně v Ústí nad Labem.

Poskytování prostorových dat resort ČÚZK a INSPIRE

Otevřený katastr (OK)

CZ.1.07/1.5.00/

Význam a způsoby sdílení geodat. Ing. Petr Seidl, CSc. ARCDATA PRAHA, s.r.o.

ROZVOJ SLUŽEB GEOPORTÁLU ČÚZK

Architektura GIS KMA/AGI. Karel Jedlička

Moderní přístupy a nástroje GIS v ochraně přírody a krajiny ČR

Použitá metodika. Jan Pytel. NOP.

INSPIRE Transformation services

ArcGIS inspirativní technologie Radek Kuttelwascher

G E O G R A F I C K É I N F O R M A Č N Í S Y S T É M Y. Bc. Michalis Katapodis kat015

Výzvy využívání otevřených dat v ČR

plan4business Jan Ježek za ZČU & HS-RS Západočeská univerzita v Plzni

DTM DMVS Plzeňského kraje

MÜLLEROVY MAPY ČECH A MORAVY NA INTERNETU

Možnosti využití dat RÚIAN poskytovaných VDP pomocí webových služeb

Pravidla pro poskytování dat a výstupů z datového skladu Geografického informačního systému hl. m. Prahy. Všeobecná ustanovení

Nový grafický klient v Nahlížení do katastru nemovitostí. Petr SOUČEK 1, Jiří BARTOŠ 2

ZEMĚMĚŘICKÝ ÚŘAD. Poskytování dat a služeb Geoportál ČÚZK

Standard výměnného formátu XML Digitální technické mapy

Otevřená data: zdroj příležitostí, nápadů a inovací pro Českou republiku ve 21. století

SD - Provozní řád ÚAP DMVS LK

Georeferencované mapové podklady z WMS služeb

MAPOVÉ SLUŽBY ONLINE GIS MOBILNÍ MAPOVÁNÍ SBĚR DAT

ArcGIS Online Subscription

Standardy publikace a katalogizace otevřených dat

VYUŽITÍ MAPOVÉ TVORBY V METEOROLOGII A KLIMATOLOGII

Jádrem systému je modul GSFrameWork, který je poskytovatelem zejména těchto služeb:

VÝSLEDKY DOTAZNÍKOVÉHO ŠETŘENÍ

Otevřená data veřejné správy

ArcGIS Server 10. Řešení pro sdílení geodat

MAGISTRÁT HLAVNÍHO MĚSTA PRAHY ODBOR INFORMATIKY ÚTVAR ROZVOJE HL. M. M. PRAHY. Geografický informační systém hl. m. Prahy (GIS)

Alena Malovaná, MAL305

I. oddíl poskytovatel údaje (identifikační údaje) II. oddíl údaj o území

Optimalizace pro vyhledavače a přístupnost webu

ArcGIS for Server. V oblasti správy, vizualizace a zpracování prostorových dat nabízí ArcGIS for Server tyto možnosti:

DOTAZNÍK V. v rámci projektu LIFE10 ENV/CZ RESTEP

DOTAZNÍK O FINANČNÍCH MODELECH DATOVÉHO FONDU KLÍČOVÝCH PROSTOROVÝCH INFORMACÍ

GVSIG& OPENWEBGLOBE: OPEN SOURCE ŘEŠENÍ na Katedře geoinformatiky Univerzity Palackého v Olomouci

Zdroje mapových podkladů

EMBARCADERO TECHNOLOGIES. Jak na BYOD chytře? Možnosti zapojování různých mobilních zařízení do podnikových informačních systémů.

Seminář ČSSI: Otevřená a propojitelná data

Přidružené publikace v České republice

VEŘEJNĚ DOSTUPNÁ DATA A LICENČNÍ POLITIKA. Karel Charvát

POKROČILÁ KARTOGRAFICKÁ TVORBA v prostředí ArcMap

Zpřístupnění Müllerových map Čech a Moravy na internetu

ArcGIS Online a jeho využití (nejen) při výuce

Analýza bydlení pro osoby se zdravotním postižením pro projekt Komunitní plánování sociálních služeb ORP Tábor

Výměnný formát XML DTM DMVS PK

PŘEHLED A MOŽNOSTI VYUŽITÍ WEBOVÝCH MAPOVÝCH SLUŽEB

Prostorová data pro INSPIRE, pro veřejnou správu i pro veškerou veřejnost

Geografické informační systémy

METADATOVÝ PORTÁL A KATALOGOVÉ SLUŽBY. Štěpán Kafka

GIS v počítačových sítích KMA/AGI. Karel Jedlička

GIS v regionální analýze a jejich využití na příkladu Moravskoslezského kraje a města Ostravy

ČÚZK CESTA K OTEVŘENOSTI. Jiří Poláček

Instalace produktu Ontopia. ver (open-source verze)

Linked Heritage. Koordinace standardů a technologií za účelem obohacení Europeany. Alena Součková

Svět mapových služeb. Vladimír Špaček, Sr. consultant Intergraph ČR

ESRI v národním kroji

Standardy publikace a katalogizace otevřených dat. Dušan Chlapek David Hemala

DATA A SLUŽBY ZEMĚMĚŘICKÉHO ÚŘADU

Ing. Michal KOVÁŘ, Ph.D. Design for landscape s.r.o.

Otevřená data nejen ve vzdělávání

3D model města pro internetové aplikace. Jakub Dolejší. Ing. Tomáš Dolanský, Ph.D.

Co jsou otevřená data?

Informace o aktuálním dění v oblasti otevřených dat v České republice

Transkript:

OTEVÍRÁNÍ GEODAT - PŘÍPAD IPR PRAHA JÁCHYM ČEPICKÝ 1 Otevřená GeoInfrastruktura, Česká republika jachym.cepicky@opengeolabs.cz Abstrakt Na základě nově schválených Pravidel pro poskytování dat a výstupů z datových souborů z datového skladu Geografického informačního systému hl. m. Prahy zajišťovaným IPR Praha, která nabudou účinnosti od 1. 5. 2015, bude možné poskytování geodat formou otevřených dat a otevřených služeb. IPR Praha ve spolupráci se sdružením Otevřená GeoInfrastruktura a Fondem Otakara Motejla sestavili dotazník pro potenciální uživatele těchto dat, abychom jim při otevírání dat vyšli co nejvíce vstříc a podpořili tak jejich další široké využití. Dotazník se obecně ptá na pozadí respondentů, zda-li přicházejí z oboru GIS či jiného, s jakými typy programů nejčastěji pracují (desktop vs. server nebo databáze či web), na jakých platformách se pohybují (např. otevřený software, proprietární), v jaké formě data nejraději požadují (surová či předzpracovaná) a jakou formu distribuce požadují (webové služby OGC či předgenerované soubory). Výsledkem bude, jak věříme, jací uživatelé pro data přicházejí a jaké je jejich technické zázemí a odborné pozadí. Také na základě dat z dotazníku vzniká analýza otevírání (geo)dat nejen pro IPR Praha, která popisuje možné způsoby otevírání geodat, jejich vhodné formáty pro různé případy použití a "best practices" při otevírání geodat obecně. Abstract Based on new rules for distribution of data files from data warehouse of Geographical information system of the city of Prague, it will be possible to distribute geodata as open data, using open services. Institute of Planing and Development of Prague, together with Open GeoInfrastructure Association and Otakar Motejl's fund put together a questionnaire for potential users of those data, in order to be able to be able to fulfill their needs and support of data usage as much as possible. Questionnaire is asking on the background of the users, on their technological background, whether they come from GIS field or from other area, whether they work rather with destkop, database or server programs. It also tries to find out, which form of the data is prefered (raw versus postprocessed,...), which types of services are required and so on. Also based on the results of the questionnaire, new analysis of opening of (geo)data is to be prepared, which should be usable not only for the city of Prague, but also for other bigger public (geo)data providers. Klíčová slova: otevřená data; dotazník; evaluace; otevřené formáty; IPR Praha Keywords: open data, questionnaire; evaluation; open formats; Prague Institute of Planning and Development ÚVOD Je všeobecně uznávaným faktem, že sebelepší řešení není udržitelné, pokud není naplněno kvalitními a aktuálními daty. V poslední době dochází v této souvislosti v čím dál větší míře ke sdílení a šíření dat prostřednictvím sítě Internet. Pojmy jako linked data nebo sémantický web nejsou dávno jen teoretickým konceptem, ale aktuální skutečností. Bez nadsázky lze říci, že data jsou jedna z komodit, které podporují jak technický pokrok, tak rozvoj občanské společnosti. Tento fakt začíná být po vzoru našich nejbližších sousedů, především Německa, ale i Rakouska či Velké Británie reflektován i veřejnou správou v České republice v podobě postupného otevírání dat.

OTEVŘENÁ DATA Aby data mohla být označena za otevřená, musí splňovat několik legislativních a technických podmínek (viz níže). Tyto podmínky nejsou v čase konstantní, vyvíjí se spolu s technickými prostředky, standardy ale i legislativou či postoji společnosti. V současnosti těmito podmínkami myslíme zejména: Data jsou dostupná na síti Internet a dohledatelná běžnými nástroji. Data jsou čitelná, tedy v textovém či binárním formátu. Data musí být úplná, tj. jsou zveřejněná v takovém rozsahu, aby nechyběly některé fragmenty umožňující jejich využití. Data by zároveň měla být zveřejněna v maximálním možném rozsahu. Legislativní a technické překážky pro využití dat jsou minimální. Otevírání dat přináší kromě nákladů na vlastní otevření a provoz také nemalé přínosy jak pro poskytovatele, tak pro uživatele. Tim Berners-Lee [1] sestavil tzv. pětihvězdičkový systém hodnocení otevřenosti dat, jehož smyslem je umožnit jednoduchou orientaci ve stupni otevřenosti datových sad. Čím výše se datová sada dostane, tím větší je možnost jejího využití veřejností. Obr. 1: Pětihvězdičkový systém otevřených dat podle Tim Berners-Lee [1] 5ti hvězdičkový systém Dostupná data Data jsou zveřejněna na Internetu, nezáleží na formátu. Data, která jsou zveřejněna na síti Internet v jakémkoli formátu, ale pod otevřenou licencí pro jejich využití. Existují tedy určitá technická omezení pro jejich využití, nicméně legislativní omezení jsou odstraněna. Příkladem může být mapové dílo ve formátu PDF. Strukturovaná data Data jsou zveřejněna ve strojově čitelném formátu. Data jsou zveřejněna ve strojově zpracovatelném formátu, který není otevřený. Příkladem mohou být data ve formátu Microsoft Excel nebo data uložená v Esri GeoDatabase.

Data v otevřeném formátu Data jsou zveřejněna v otevřeném formátu. Strojový formát, ve kterém jsou data zveřejněna, je otevřený, tj. veřejně publikovaný s licencí umožňující jeho využití. Příkladem jsou například formáty Geospatial Markup Language (GML), OGC GeoPackage nebo Esri Shapefile Data s identifikátorem Data jsou dohledatelná, mají unikátní identifikátor. Data jsou opatřena identifikátorem Uniform Resource Identifier (URI), unikátním v rámci celé sítě Internet. Jednotlivé prvky datové sady by měly být identifikované pomocí URI ve tvaru použitelném pro protokol HTTP tzn. v podobě adresy URL. Tím se zajistí, že uživatelé mohou daný prvek kdykoli najít. Provázaná data Data jsou navzájem prolinkovaná, lze mezi nimi navigovat, "surfovat" [ref71]. Data jsou nejen identifikovatelná pomocí URI, ale obsahují odkazy na další datové sady. Stejně jako datové sady jsou pomocí odkazů provázány i jednotlivé prvky z datových sad. Data jsou dále opatřena popisnými informacemi (metadaty) tak, aby v nich bylo možno jednoduše vyhledávat. OTEVÍRÁNÍ DAT Proces otevírání dat v sobě zahrnuje zejména následující kroky [2]: Zvolení souborového formátu (GeoTIFF, Esri Shapefile, GeoDatabáze, atd.) Zvolení způsobu distribuce (např. Server FTP, webové služby, CD k vyzvednutí osobně na vrátnici úřadu a podobně) Zvolení licence databáze Způsob aktualizace A další Jeden z rozhodujících faktorů je cílová skupina uživatelů otevřených dat. Jedná se o odborné pracovníky v daném oboru? Pracovníky GIS? Datové analytiky bez specifického zaměření? Programátory bez hlubší znalosti problematiky? Jaký používají software, ze kterého budou k datům přistupovat? Tyto a další otázky si je potřeba položit nalézt odpověď nemusí být zcela jednoznačné. SPECIFIKA GEODAT Na rozdíl od běžných datových sad, jsou geodata svým způsobem specifická oblast a to zejména z těchto důvodů: Existuje nezávislá uznávaná standardizační organizace, jejích normy jsou akceptovány jak výrobci, tak uživateli software (Open Geospatial Consortium OGC). Existují všeobecně uznávané otevřené formáty datových sad Existují standardizované a využívané způsoby distribuce geodat pomocí webových služeb (opět standardy OGC) Díky INSPIRE jsou tyto normy dále využívány PRŮZKUM IPR Jedním ze způsobů, jak zjistit preference potenciálních uživatelů otevřených dat je dotazníkové šetření. Ve spolupráci s IPR Praha, Fondem Otakara Motejla a spolkem Otevřená GeoInfrastruktura jsme se pokusili takový dotazník sestavit. Jeho dílčí výsledky bychom rádi představili v tomto příspěvku. Dotazník je možné spustit z adresy http://www.geoportalpraha.cz/cs/clanek/260/pomozte-otevrit-prazska-geograficka-data k

prosinci 2014 dotazník vyplnilo 120 respondentů. Níže uvedeme a částečně okomentujeme výsledky některých odpovědí [3]. Uživatelé Obr. 2: Odpovědi na otázku, "Pracujete jako...?" Převažující skupinou respondentů jsou Pracovníci GIS (27%), následovaná Pracovníky v soukromém sektoru (25%) a Studenty (20%). Ostatní skupiny byly spíše minoritní. Práce s GeoDaty Obr. 3: Jakým způsobem pracujete s geodaty, jaký je váš vztah ke GIS? Na otázku Jakým způsobem pracujete s geodaty? odpověděla skoro polovina respondentů (48%), že při své práci GIS aktivně využívají (jako zdroj dat, používají analýzy, tvoří výstupy a podobně). Pouhých 6% respondentů odpovědělo, že GIS ve své praxi prakticky nevyužívá. GIS na desktopu Obr. 4: Desktopová platforma

70% dotázaných odpovědělo, že ve své práci využívá desktopové programy pro tvorbu GIS. Nepřekvapí, že významného zastoupení na desktopech našich uživatelů dosáhla platforma firmy ESRI (47%). Významnějšího podílu však dosáhla skupina open source programů (QGIS, GRASS GIS, Jump a podobně) s 51%. Web GIS 66% dotázaných využívá některou z webových platforem pro tvorbu mapových aplikací. Nejčastěší platforma je vlastní, postavené na některé z open source knihoven (OpenLayers, Leaflet) (37%), a Google Maps API (34%). Prostorové databáze Obr. 5: Webová platforma 66% účastníků průzkumu uvedlo, že prostorové databáze nějakým způsobem využívá. Obr. 6: Prostorové databáze Nejpoužívanější prostorovou databází je s odstupem PostGIS (35%). NoSQL databáze zatím nejsou v našich končinách příliš využívány.

Mapové servery 41% respondentů uvedlo, že využívá mapové servery. Nejpoužívanější software jsou GeoServer a MapServer (oba shodně 18%), následovaný ArcGIS Serverem (15%). Datové zdroje Obr. 7: Mapové servery Obr. 8: Způsob distribuce otevřený geodat Na otázku, jakým způsobem uživatelé preferují dostávat otevřená geodata, většina odpověděla (56%), že prostřednictvím souborů. Druhým nejčastějším přáním způsobu distribuce jsou webové služby OGC (OGC OWS) 20%.

Souborové výměnné formáty Nejvíce preferovaným výměnným souborovým formátem je ESRI Shapefile (47%). Mezi dalšími formáty převažují ty oteřené (GML, KML, JSON, ). V seznamu chybí formát OGC GeoPackage, ale vzhledem k jeho malému povědomí v naší odborné veřejnosti, by pravděpodobně nebyl příliš preferován. Webové služby OGC Obr. 9: Preferovaný souborový formát pro otevřená geodata Obr. 10: Požadované služby OGC Podíváme-li se na preferované služby OGC, s překvapením zjistíme, že vedle INSPIRE prohlížečích služeb (WMS, WMTS), je silně zastoupena i stahovací služba vektorových dat WFS (19%).

Zpracování dat Podíváme-li se na požadavek na před-zpracování dat veřejnou správou, zjistíme, že převažuje požadavek na zdrojová data (přes 60%), nad požadavkem na předpřipravené analýzy. Provázaná (linked) data Obr. 11: Forma zpracování geodat V dotazníku jsme se také ptali na pohled našich respondentů na tzv. provázaná data (linked data). Provázaná data jsou z hlediska výše zmíněného 5ti hvězdičkového klasifikačního systému na nejvyšším vývojovém stupni otevřených dat. Z pohledu uživatele dat mají data nejvyšší hodnotu, protože z jednoho datového prvku se lze díky jejich vzájemnému provázání dostat na jakýkoliv další. Z pohledu poskytovatele dat se ale jedná o nejvíce náročnou úpravu dat. Jednotlivé datové prvky je potřeba opatřit identifikátory a datové sady se na sebe následně musí navzájem navázat. Jak se data mění, musí poskytovatel dat na tuto skutečnost reagovat a své datové sady udržovat stále aktuální a to tak, aby provázání nepřestalo platit jak v rámci vlastních datových sad, tak v případě prolinkování vlastní dat s datovými sadami třetích stran. 20% respondentů by preferovali publikování stavajících datových sad ve formě otevřených provázaných dat. 37% se domnívá, že se jedná o přirozený ale budoucí vývoj v oblasti publikace dat. Ale plných 42% dotázaných se o provázaná data vůbec nezajímá. INSPIRE Obr. 12: Provázaná data Obr. 13: Jak vnímají INSPIRE V odpovědi na obecnou otázku Co si myslíte o INSPIRE se ukázalo, že INSPIRE je vnímán v naší odborné veřejnosti spíše pozitivně. Většina respondentů si myslí, že je buď Preferovaný způsob výměny dat (9%)

nebo alespoň vnímají INSPIRE jako Příležitost udělat pořádek v poskytování geodat (53%). Jako nutné zlo jej vnímají pouze 2% respondentů. ZÁVĚR A DISKUSE V tomto článku jsme prezentovali některé odpovědi na otázky položené v dotazníku sestaveném ve spolupráci s IPR Praha, který směřoval na potenciální uživatele otevřených geodat. Cílem bylo prozkoumat, z jakého prostředí tito uživatelé pochází, jaké mají odborné a technické zázemí, v jakém formátu data preferují a jakým způsobem by preferovali jejich distribuci. Dotazník zatím nebyl zcela uzavřen a zpracován, nicméně již nyní můžeme vidět, že open source je vnímán jako validní alternativa a to jako v desktopovém, tak na serverovém prostředí. Nejpřesvědčivěji je to vidět na poli prostorových databází, uživatelé kladou důraz na otevřené formáty, otevřené standardy a preferují je před proprietárními uživatelé preferují původní, nikým nezpracovaná data, před nějakým způsobem zpracovanými datovými sadami. Po uzavření dotazníku budou jeho výsledky zveřejněny a věříme, že nejen IPR Praha přihlédne k jeho výsledkům při své iniciativě otevírání geodat. Otevírání dat je proces, kdy (mimo jiné) instituce ztrácí kontrolu nad svými daty a zároveň tak přichází o důležitou zpětnou vazbu. Chce-li instituce zjistit, co se dále s jejich daty děje, musí tuto informaci poměrně náročně získávat zpět. Tato činnost je vždy aktivní instituce musí pro získání této zpětné vazby něco udělat. Obvyklou formou je pořádání přednášek či (lépe) aktivních workshopů a tzv. hackathonů. Další možností je právě dotazníkové šetření, které bude bez pochyby po nějaké čase zopakovat. Výsledky dotazníkového šetření jsou spíše než závazným dogmatem určitým návodem, který dává instituci cennou zpětnou vazbu a poskytuje určitý náhled na problematiku. Cenné jsou samozřejmě i volné komentáře, jejichž zpracování je ovšem již náročnější, nicméně bude součástí vyhodnocení dotazníku. LITERATURA [1] Tim Berners-Lee: Linked Data, http://www.w3.org/designissues/linkeddata.html [cit. 2014-09-06] [2] Augustýn, R., Čepický, J., Landa, M. a kol: Otevírání geografických dat - Případová studie, http://opengeolabs.cz/otevrena-geodata/, [cit. 2014-12-19] [3] Kolektiv autorů: Dotazník Pražská Open Geodata, https://docs.google.com/forms/d/1opimmgfcml4r3yqoyavw6jz1gewsvjgjaobu7eehrlw/viewform, [cit. 2014-12-19]