Metodika publikace otevřených a propojitelných dat

Rozměr: px
Začít zobrazení ze stránky:

Download "Metodika publikace otevřených a propojitelných dat"

Transkript

1 Metodika publikace otevřených a propojitelných dat Září 2015 Autoři Autor Organizace Dušan Chlapek Jakub Klímek Jan Kučera Martin Nečaský Fakulta informatiky a statistiky Vysoká škola ekonomická v Praze Matematicko-fyzikální fakulta Univerzita Karlova v Praze Fakulta informatiky a statistiky Vysoká škola ekonomická v Praze Matematicko-fyzikální fakulta Univerzita Karlova v Praze Popis výstupu Metodika publikace otevřených a propojitelných dat popisuje doporučení pro publikaci číselných ukazatelů v podobě otevřených propojitelných dat s využitím slovníku The RDF Data Cube Vocabulary. Metodika vznikla jako jeden z výstupů projektu Otevřená propojitelná data v oblasti veřejných rozpočtů (TD020277) realizovaného v rámci Programu na podporu aplikovaného společenskovědního výzkumu a experimentálního vývoje OMEGA vypisovaného Technologickou agenturou České republiky. Poděkování Projekt Otevřená propojitelná data v oblasti veřejných rozpočtů (TD020277) je spolufinancován Technologickou agenturou České republiky a Fondem Otakara Motejla.

2 Obsah MANAŽERSKÉ SHRNUTÍ ÚVOD STRUKTURA METODIKY KOMU JE METODIKA URČENA NOVOST POSTUPŮ OTEVŘENÁ A PROPOJENÁ DATA OTEVŘENÁ DATA STUPNĚ OTEVŘENOSTI DAT PROPOJENÁ DATA THE RDF DATA CUBE VOCABULARY DATOVÉ SADY A DATOVÉ KOSTKY ROLE PODÍLEJÍCÍ SE NA PUBLIKACI OTEVŘENÝCH DAT POSTUP PUBLIKACE DAT ANALÝZA ZDROJOVÝCH DAT A VYMEZENÍ DATOVÝCH SAD Cíl činnosti Obsah činnosti Související praktiky NÁVRH DATOVÝCH KOSTEK A TVORBA ONTOLOGIÍ/SLOVNÍKŮ Cíl činnosti Obsah činnosti Související praktiky VOLBA ZPŮSOBU PŘÍSTUPU K DATŮM Cíl činnosti Obsah činnosti Související praktiky TRANSFORMACE DAT Cíl činnosti Obsah činnosti Související praktiky PŘÍPRAVA METADAT A KATALOGIZAČNÍCH ZÁZNAMŮ Cíl činnosti Obsah činnosti Související praktiky VALIDACE DATOVÝCH KOSTEK Cíl činnosti Obsah činnosti Související praktiky KONTROLA PŘIPRAVENÝCH DATOVÝCH SAD Cíl činnosti Obsah činnosti Publikace číselných ukazatelů s využitím slovníku The RDF Data Cube Vocabulary 2 (z 84)

3 6.7.3 Související praktiky ZVEŘEJNĚNÍ DATOVÝCH SAD Cíl činnosti Obsah činnosti Související praktiky ZVEŘEJNĚNÍ KATALOGIZAČNÍCH ZÁZNAMŮ Cíl činnosti Obsah činnosti Související praktiky PRAKTIKY URČENÍ FAKTŮ A DIMENZÍ Problém Doporučené řešení VYMEZENÍ DATOVÝCH SAD A DATOVÝCH KOSTEK VE FORMÁTU RDF PŘI VYUŽITÍ SLOVNÍKU DATA CUBE Problém Doporučené řešení NÁVRH STRUKTURY DATOVÉ KOSTKY S VYUŽITÍM SLOVNÍKU DATA CUBE Problém Doporučené řešení TVORBA IDENTIFIKÁTORŮ (URI) Problém Doporučené řešení VOLBA ONTOLOGIÍ PRO REPREZENTACI FAKTŮ A DIMENZÍ Problém Doporučené řešení REPREZENTACE ČÍSELNÍKŮ POMOCÍ SKOS Problém Doporučené řešení REPREZENTACE DIMENZE ČASU Problém Doporučené řešení REPREZENTACE DIMENZE MÍSTA/ÚZEMÍ Problém Doporučené řešení REPREZENTACE DIMENZE POHLAVÍ Problém Doporučené řešení REPREZENTACE DIMENZE SUBJEKTU Problém Doporučené řešení PROPOJOVÁNÍ PRVKŮ POZOROVÁNÍ NA EXISTUJÍCÍ KONCEPTY Problém Doporučené řešení AUTOMATIZACE TRANSFORMACE DAT Problém Publikace číselných ukazatelů s využitím slovníku The RDF Data Cube Vocabulary 3 (z 84)

4 Doporučené řešení PŘÍPRAVA METADAT O DATOVÉ KOSTCE Problém Doporučené řešení VALIDACE DATOVÝCH KOSTEK V RDF Problém Doporučené řešení SOUVISEJÍCÍ PRÁCE METODIKA PUBLIKACE OTEVŘENÝCH DAT VEŘEJNÉ SPRÁVY ČR STANDARDY PUBLIKACE A KATALOGIZACE OTEVŘENÝCH DAT THE OPENCUBE LIFECYCLE ZDROJE ZKRATKY A POUŽITÁ TERMINOLOGIE ZKRATKY SLOVNÍK POJMŮ PŘÍLOHA A: PŘÍKLAD VYUŽITÍ METODIKY PUBLIKACE OTEVŘENÝCH A PROPOJITELNÝCH DAT ROZPOČTOVÁ A ÚČETNÍ DATA VYBRANÝCH ORGÁNŮ VEŘEJNÉ SPRÁVY STRUKTURA ROZPOČTOVÝCH A ÚČETNÍCH DAT VE FORMÁTU RDF PODMÍNKY UŽITÍ ROZPOČTOVÝCH A ÚČETNÍCH DAT VE FORMÁTU RDF POSTUP PUBLIKACE ROZPOČTOVÝCH A ÚČETNÍCH DAT VE FORMÁTU RDF Analýza zdrojových dat a vymezení datových sad Návrh datových kostek Volba způsobu přístupu k datům Transformace dat Příprava metadat a katalogizačních záznamů Validace datových kostek Kontrola připravených datových sad Zveřejnění datových sad Zveřejnění katalogizačních záznamů POPIS VSTUPNÍCH DATOVÝCH SAD, JEJICH SOUBORŮ A ATRIBUTŮ Kmenová data Atributy kmenových dat Soubory finančních a účetních výkazů Atributy rozpočtových a účetních dat Publikace číselných ukazatelů s využitím slovníku The RDF Data Cube Vocabulary 4 (z 84)

5 Manažerské shrnutí Otevřená data představují data publikovaná na internetu, která mohou jejich uživatelé volně využívat, upravovat a šířit, přičemž může být vyžadováno, aby při užití dat byl uveden jejich autor/původce a aby i ostatní uživatelé měli zajištěna stejná oprávnění s daty nakládat. Otevřená data lze publikovat v různých strojově čitelných formátech, nicméně v současné době je za nejpokročilejší formu publikace otevřených dat považována jejich publikace s využitím principů tzv. propojených dat (angl. Linked Data). Otevřená propojená data jsou nejen strojově čitelná, ale lze je snadno propojovat obdobně, jako jsou propojeny webové stránky. Propojování dat umožňuje data zasadit do kontextu a zároveň snižuje potřebu opakovat údaje, které jsou uvedeny v jiných datových zdrojích. To může být výhodné např. v případě referenčních údajů namísto opakování údajů z referenčního zdroje v určité datové sadě a s tím spojených rizik vzniku chyb při zpracování dat a zastarávání údajů v datové sadě oproti údajům v referenčním datovém zdroji, lze v datové sadě uvést pouze odkazy na objekty z referenčního datového zdroje. Při využití principů propojených dat pak lze zajistit, že při práci s datovou sadou budou díky uvedeným odkazům vždy získávána aktuální data z referenčního datového zdroje. Metodika popsaná v tomto dokumentu obsahuje doporučení pro publikaci číselných ukazatelů v podobě otevřených propojených dat s využitím slovníku The RDF Data Cube Vocabulary, který je standardem pro publikaci tohoto typu dat ve formátu RDF vydaným mezinárodní organizací The World Wide Web Consortium (W3C). Číselné ukazatele mohou představovat např. údaje o výši schváleného rozpočtu, o výši rozpočtu po změnách a o výsledku od počátku roku sledované v členění dle účetních jednotek, fiskálního období, tabulky výkazu, rozpočtového paragrafu odvětvového členění rozpočtu a rozpočtové položky. Pro zajištění publikace číselných ukazatelů v podobě otevřených propojených dat jsou v metodice vymezeny role a jejich odpovědnosti, postup publikace dat a praktiky zaměřené na zvládnutí často řešených problémů. Metodika je obecně určena orgánům veřejné správy, které se rozhodnou publikovat data představující číselné ukazatele v podobě otevřených propojených dat. Použití metodiky je pak ilustrováno na příkladu publikace rozpočtových a účetních dat zveřejněných na portálu Monitor Ministerstva financí České republiky, která byla do podoby otevřených propojených dat převedena v rámci projektu Technologické agentury České republiky Otevřená propojitelná data v oblasti veřejných rozpočtů (TD020277). Novost postupů uvedených v této metodice spočívá v popisu uceleného postupu publikace číselných ukazatelů v podobě otevřených propojených dat, který je doplněn praktikami, jež by měly uživatelům usnadnit aplikaci metodiky v praxi. Metodika aplikuje a odkazuje na relevantní osvědčené praktiky pro publikaci otevřených a propojených dat, ty jsou ale zasazeny do uceleného rámce a zároveň jsou doplněny o praktiky, které specificky zohledňují podmínky v České republice. Publikace číselných ukazatelů s využitím slovníku The RDF Data Cube Vocabulary 5 (z 84)

6 1 Úvod Otevřená data představují data publikovaná na internetu, která mohou jejich uživatelé volně využívat, upravovat a šířit, přičemž může být vyžadováno, aby při užití dat byl uveden jejich autor/původce a aby i ostatní uživatelé měli zajištěna stejná oprávnění s daty nakládat (Open Knowledge, 2015b). Metodika popsaná v tomto dokumentu obsahuje doporučení pro publikaci číselných ukazatelů v podobě otevřených propojených dat (viz dále) s využitím slovníku The RDF Data Cube Vocabulary (Cyganiak a Reynolds, 2014), tj. na nejvyšším stupni otevřenosti dle tzv. pětihvězdičkového schématu, které navrhl Berners-Lee (2006). Metodika by tak měla orgánům veřejné správy v ČR pomoci publikovat data, která mají povahu číselných ukazatelů, tak, aby byla otevřená, a aby je bylo zároveň možné snadno propojovat na jiná související data, což otevírá cestu pro jejich inovativní využití. Dle Charty otevřených dat skupiny G8 podporuje publikace otevřených dat mimo jiné inovace, otevřené vládnutí a transparentnost veřejné správy a publikace dat o rozpočtech orgánů veřejné správy patří mezi data, která by měla být publikována v podobě otevřených dat (G8, 2013). Metodika popsaná v tomto dokumentu byla vytvořena v rámci projektu Otevřená propojitelná data v oblasti veřejných rozpočtů (TD020277), který se zaměřuje právě na publikaci rozpočtových a účetních dat zveřejněných na portálu Monitor 1 Ministerstva financí České republiky v podobě otevřených a propojených dat. Použití metodiky je tak ilustrováno na příkladu publikace rozpočtových a účetních dat, který metodiku doplňuje o popis způsobu, jakým byly jednotlivé kroky postupu publikace dat dle této metodiky uplatněny v praxi. Příklad je uveden v příloze metodiky, slouží pouze k jejímu lepšímu pochopení a má tak pouze informativní charakter. 1.1 Struktura metodiky Metodika je členěna následujícím způsobem. Za úvodem následuje vymezení otevřených dat a principů propojených dat (Linked Data). V navazující části je představen slovník The RDF Data Cube Vocabulary (Cyganiak a Reynolds, 2014), který je základním slovníkem používaným pro reprezentaci číselných ukazatelů v podobě otevřených a propojených dat dle této metodiky, a v návaznosti na to je diskutován vztah mezi pojmy datová sada a datová kostka. Následující kapitoly jsou věnovány vymezení toho, jak by měly být číselné ukazatele v podobě otevřených a propojených dat publikovány, a kdo by se na jejich publikaci měl podílet. Jsou tak vymezeny role zúčastněné na publikaci dat a v dalších částech je pak popsán postup publikace dat a praktiky pro realizaci navrženého postupu. V další části jsou ve stručnosti diskutovány související práce. Následující části obsahují seznam použitých zdrojů, seznam zkratek a terminologický slovník, za kterými je zařazen příklad využití metodiky. Struktura metodiky je znázorněna na obrázku Publikace číselných ukazatelů s využitím slovníku The RDF Data Cube Vocabulary 6 (z 84)

7 Obrázek 1: Struktura metodiky publikace otevřených a propojitelných dat, zdroj: autoři Metodika popsaná v tomto dokumentu se zaměřuje pouze na publikaci otevřených propojených dat s využitím slovníku The RDF Data Cube Vocabulary. Formát RDF je zde stručně představen, nicméně obecná doporučení pro publikaci dat v tomto formátu nejsou součástí této metodiky. Je doporučeno seznámit se s některým ze zdrojů uvedených v kapitole 2.3, jelikož alespoň základní seznámení s formátem RDF a publikací propojených dat je předpokladem pro uplatnění této metodiky. Pro zápis dat v RDF je v rámci tohoto dokumentu použita notace Turtle Komu je metodika určena Metodika je obecně určena orgánům veřejné správy, které se rozhodnou publikovat data představující číselné ukazatele v podobě otevřených propojených dat. Pracovníkům poskytovatele dat, kteří nejsou obeznámeni s tím, co jsou otevřená data, a na jaký principech je založena publikace propojených dat, doporučujeme seznámit se s obsahem kapitoly 2, kde jsou základní pojmy vysvětleny a kde jsou také uvedeny odkazy na další zdroje, které se otevřeným a propojeným datům věnují. 2 Publikace číselných ukazatelů s využitím slovníku The RDF Data Cube Vocabulary 7 (z 84)

8 V kapitole 6 jsou vymezeny odpovědnosti jednotlivých rolí ve vztahu k činnostem, prostřednictvím kterých je publikace číselných ukazatelů v podobě otevřených propojených dat zajišťována. Pracovníkům působícím v jednotlivých rolích doporučujeme seznámit se alespoň s obsahem činností, za které zodpovídají a se souvisejícími praktikami. Kromě tohoto obecného doporučení lze uvést, že pracovníkům pověřeným řízením a koordinací publikace otevřených dat jsou určeny zejména kapitoly 5 a 6, tj. s vymezením jednotlivých rolí a s navrženým postupem publikace číselných ukazatelů v podobě otevřených propojených dat. Navržený postup publikace dat číselných ukazatelů je rozdělen do jednotlivých kroků, jejichž popis se zaměřuje na vymezení toho, co by mělo být v rámci realizace daného kroku dosaženo. IT specialistům pak doporučujeme seznámit se s celou metodikou. Zejména těmto pracovníkům je určena kapitola 3, ve které je stručně představen slovník The RDF Data Cube Vocabulary a kapitola 7, která obsahuje popis praktik, které lze uplatnit při řešení častých problémů, na které lze při publikaci číselných ukazatelů v podobě otevřených propojených dat narazit. 1.3 Novost postupů Novost postupů uvedených v této metodice spočívá v popisu uceleného postupu publikace číselných ukazatelů v podobě otevřených propojených dat, který je doplněn praktikami, jež by měly uživatelům usnadnit aplikaci metodiky v praxi. Metodika aplikuje a odkazuje na relevantní osvědčené praktiky pro publikaci otevřených a propojených dat, ty jsou ale zasazeny do uceleného rámce a zároveň jsou doplněny o praktiky, které specificky zohledňují podmínky v České republice. Příkladem takovéto praktiky je praktika Reprezentace dimenze místa/území, která obsahuje doporučení, aby v případě, že entitami v dimenzi místa/území jsou územní celky v ČR, bylo využito propojení na reprezentaci dat z Registru územní identifikace, adres a nemovitostí (RÚIAN) 3 v podobě otevřených propojených dat Publikace číselných ukazatelů s využitím slovníku The RDF Data Cube Vocabulary 8 (z 84)

9 2 Otevřená a propojená data V této části jsou blíže charakterizována otevřená data a jejich vlastnosti a je zde vysvětlen koncept propojených dat. Dále je v rámci této části vysvětlen model stupňů otevřenosti navržený v (Berners-Lee, 2006). Pokud jste s principy otevřených a otevřených propojených dat obeznámeni, můžete kapitolu přeskočit. 2.1 Otevřená data Otevřená data byla již stručně charakterizována v úvodu, nicméně vlastnosti otevřených dat lze vymezit i podrobněji. Dle (Chlapek a kol., 2012a) jsou otevřená data veřejné správy data, která jsou: 1. úplná data jsou zveřejněna v maximálním možném rozsahu. Rozsah může být definován právním předpisem, usnesením vlády, příp. poskytovatelem dat. Například seznam všech nemovitostí s číslem popisným nebo evidenčním v obci XY, nebo seznam všech památkově chráněných objektů v obci XY. 2. primární (původní) data, která jsou zveřejněna původcem dat v podobě, v jaké byla původcem jako primární (původní) vytvořena. Za primární data se považují i a. referenční údaje ze základních registrů, b. data z registrů a rejstříků VS, c. agregovaná data (např. výsledky voleb) pokud není možné zveřejnit data, z nichž byla provedena agregace, d. agregovaná data (např. statistiky nad jinými otevřenými daty) pokud je uveden způsob agregace a odkaz na zveřejněná primární data, z nichž byla agregace provedena. 3. zveřejněná bez zbytečného odkladu zveřejnění dat není zdrženo činnostmi, které nesouvisí s jejich přípravou; činnosti nezbytné pro publikaci dat jsou provedeny v čase, který umožní jejich zveřejnění bez nepřiměřeně dlouhé prodlevy od okamžiku vzniku dat, 4. snadno dostupná data jsou dostupná a dohledatelná běžnými ICT nástroji a prostředky, 5. strojově čitelná data ve formátu, který je strukturovaný takovým způsobem, že pomocí programové aplikace lze z dat získat žádané (vybrané) údaje 6. neomezující přístup data dostupná způsobem, který nediskriminuje jednotlivce nebo skupinu osob, 7. používající standardy s volně dostupnou specifikací (otevřené standardy) data musí být ve formátu, který je volně (bezplatně) dostupný pro libovolné použití nebo do takovéhoto formátu převoditelný volně (bezplatně) dostupnou aplikací, 8. zpřístupněna za jasně definovaných podmínek užití dat (licence) s minimem omezení podmínky musí být jasně a zřetelně definovány a zveřejněny, 9. stále dostupná data jsou dostupná on-line po dobu uvedenou jejich poskytovatelem, 10. dostupná uživatelům při vynaložení minima možných nákladů na jejich získání poskytovatelé jsou v souvislosti s poskytováním dat oprávněni žádat úhradu maximálně ve výši, která nesmí přesáhnout náklady spojené s jejich zpřístupněním uživateli; poskytovatel dat může jednorázově vyžádat i úhradu za mimořádně náročné pořízení dat, pokud si uživatel zpřístupnění těchto dat vyžádá. Publikace číselných ukazatelů s využitím slovníku The RDF Data Cube Vocabulary 9 (z 84)

10 Chlapek a kol. (2012a) rozdělují výše uvedené vlastnosti otevřených dat na povinné a nepovinné. Aby bylo možné data považovat za otevřená, musí data dle (Chlapek a kol., 2012a) splňovat alespoň podmínky č. 1, 4, 5, 7, 8 a 10. V souladu s (Chlapek a kol., 2012a) jsou tak v této metodice za otevřená data veřejné správy považována data, která jsou úplná, snadno dostupná, strojově čitelná, používající otevřené standardy, zpřístupněná za jasně definovaných podmínek užití s minimem omezení a dostupná uživatelům při vynaložení minima možných nákladů na jejich získání. Dle Open Knowledge (2015a) je třeba u otevřených dat zajistit jejich právní a technickou otevřenost. Právní otevřenost je zajištěna tak, že data jsou zpřístupněna k využití za podmínek či pod licencí umožňující jejich volné využití. Podmínky užití či licence by měly být v souladu s tzv. Definicí otevřenosti viz (Open Knowledge, 2014). Technická otevřenost je pak zajištěna publikací dat v otevřených a strojově čitelných formátech (Open Knowledge, 2015a). 5 K datovým formátům viz dále. Otevřená data by měla být úplná a primární, tj. měla by být publikována v maximálním možném rozsahu a v takové podrobnosti, v jaké jsou pořizována. Nicméně pokud není možné data publikovat v rozsahu a podrobnosti v jaké jsou pořizována zdrojová data, připouští výše uvedené vymezení otevřených dat, aby jako otevřená data byla publikována data, která jsou anonymizovaná nebo agregovaná. Důvodem může být např. potřeba zajistit ochranu osobních údajů, která jsou součástí zdrojových dat, nebo potřeba vyhovět požadavkům vyplývajícím ze zák. č. 89/1995 Sb., o státní statistické ( 16 až 18, ochrana důvěrných statistických údajů a poskytování statistických informací a anonymních údajů). Protože data mohou v průběhu času zastarávat, měla by být otevřená data pravidelně aktualizována a měla by být zveřejněna bez zbytečného odkladu. Organizace The Open Data Institute definovala tzv. certifikáty pro otevřená data (Open Data Certificate) viz (Open Data Institute, 201?a). Čím kratší je prodleva mezi aktualizací zdrojových dat a zveřejněním příslušné otevřené datové sady, resp. její aktualizace, tím vyšší úroveň certifikátu je možné získat (Open Data Institute, 201?b). Využívat otevřená data by mělo být umožněno každému a pro libovolné účely, tj. využití by např. nemělo být omezeno pouze na nekomerční způsoby využití (Open Knowledge, 2015b). Dle (Open Knowledge, 2015a) je doporučeno poskytovat otevřená data zdarma ke stažení prostřednictvím internetu. S ohledem na zák. č. 106/1999 Sb. nevylučuje vymezení otevřených dle (Chlapek a kol., 2012a) vybírání poplatků v omezené výši. Dle Evropské komise (2014) by orgány veřejné správy při poskytování dat v režimu směrnice 2013/37/EU měly pravidelně posuzovat potenciální náklady a přínosy politiky nulových poplatků a politiky mezních nákladů, přičemž je třeba mít na paměti, že i výběr poplatků něco stojí (fakturace, sledování a kontrola plateb atd.). Evropská komise (2014) doporučuje při poskytování dat v digitální podobě formou stažení z internetu volit metodu nulových poplatků. V souladu s výše uvedenými doporučeními lze doporučit, aby otevřená data byla poskytována zdarma ke stažení. 5 K problematice otevřených formátů viz např. (Free Software Foundation Europe, 2013). Publikace číselných ukazatelů s využitím slovníku The RDF Data Cube Vocabulary 10 (z 84)

11 2.2 Stupně otevřenosti dat Otevřená data musí být strojově čitelná (viz vlastnosti otevřených dat veřejné správy dle (Chlapek a kol., 2012)). Na základě toho, v jakém formátu jsou data poskytována, navrhl sir Tim Berners-Lee (2006) schéma pro klasifikaci otevřenosti dat. Toto schéma včetně příkladů formátů dat využívaných na jednotlivých stupních otevřenosti je dále rozpracováno v (Hausenblas, 2012). Graficky je toto schéma znázorněno na obrázku 2. Obrázek 2: Stupně otevřenosti dat, zdroj: (Hausenblas, 2012) Na všech stupních otevřenosti musí být zaručena právní otevřenost dat, tj. podmínky užití či příslušná licence musí umožnit, aby bylo možné data volně využívat (viz výše). Vlastnosti dat a příklady formátů na jednotlivých stupních otevřenosti uvádí tabulka 1. Publikace číselných ukazatelů s využitím slovníku The RDF Data Cube Vocabulary 11 (z 84)

12 Tabulka 1: Vlastnosti dat dle stupňů otevřenosti, zdroj: zpracováno dle (Hausenblas, 2012) Stupeň otevřenosti Vlastnosti dat Možný formát * Data poskytována pod licencí či podmínkami užití, které zajišťují jejich právní otevřenost. Data poskytována v libovolném formátu. ** Data poskytována pod licencí či podmínkami užití, které zajišťují jejich právní otevřenost. Data poskytována ve strojově čitelném formátu, nemusí být otevřený. *** Data poskytována pod licencí či podmínkami užití, které zajišťují jejich právní otevřenost. Formát dat je otevřený Specifikace formátu je volně dostupná. Lze využívat zdarma, další využití formátu není omezeno. Formát nezávislý na platformě, resp. lze vytvořit nezávislé implementace pro různé platformy. **** Data poskytována pod licencí či podmínkami užití, které zajišťují jejich právní otevřenost. Data poskytována ve strojově čitelném formátu. Formát dat je otevřený. Jako identifikátory objektů jsou použity URI (viz dále). ***** Data poskytována pod licencí či podmínkami užití, které zajišťují jejich právní otevřenost. Data poskytována ve strojově čitelném formátu. Formát dat je otevřený. Jako identifikátory objektů jsou použity URI. Data jsou pomocí odkazů propojena na jiná související data. PDF XLS(X) CSV RDF (viz dále), Atom RDF Aby bylo možné publikovaná data považovat za otevřená dle definice v (Chlapek a kol., 2012a), měla by být publikována alespoň na stupni otevřenosti 3 hvězdičky. Data na stupni otevřenosti 5 hvězdiček jsou označována jako otevřená propojená data a pojednává o nich následující část. Výhody a nevýhody dat na jednotlivých stupních otevřenosti shrnuje tabulka 2. Publikace číselných ukazatelů s využitím slovníku The RDF Data Cube Vocabulary 12 (z 84)

13 Tabulka 2:Hodnocení stupňů otevřenosti, zdroj: (Chlapek a kol., 2014 dle Hausenblas, 2012) Stupeň otevřenosti Výhody Nevýhody * Jednoduchost a relativně nízká pracnost Data není třeba transformovat na straně poskytovatele dat. Zaměření pouze na právní otevřenost. Uživatelé vědí, že mohou data dále zpracovávat. ** Relativně jednoduché, pokud jsou podkladová data již dostupná ve formátu typu MS Excel, nebo pokud je lze takovéhoto formátu jednoduše uložit. Data jsou ve formátu, který je snáze strojově zpracovatelný. *** Uživatelé nejsou nuceni používat aplikace určitého výrobce, aby s daty mohli pracovat. **** Objekty jsou jednoznačně identifikovány způsobem, který umožňuje se na ně odkazovat obdobně jako na HTML stránky. Lze kombinovat s jinými datovými sadami na stupních 4 a 5 hvězdiček. ***** Data jsou propojena na další související zdroje Datům lze přiřadit bohatý kontext Místo opisování referenčních údajů se lze přímo odkázat na referenční datové zdroje. Propojení umožňují uživateli získat další data, která by jinak poskytovatel musel zahrnout do datové sady. Jednotlivé orgány VS zodpovídají a udržují své datové sady, je možné se mezi nimi odkazovat, není nutné je duplicitně publikovat na více místech. Data může být obtížné využít např. potřeba vytěžování tabulkových dat z PDF dokumentů Příklad: tabulky s údaji v ročenkách a výročních zprávách. Pokud neexistují volně dostupné nástroje pro práci se zvolenými formáty, je uživatel nucen pořizovat odpovídající SW nástroje. Může být nutné data do otevřeného strojově čitelného formátu transformovat. Příprava dat vyžaduje více času a úsilí definice schémat pro tvorbu URI a přiřazení URI identifikátorů objektům. Ne všichni v současné době disponují znalostmi pro publikaci a zpracování dat v této podobě. Příprava dat vyžaduje více času a úsilí definice schémat pro tvorbu URI a přiřazení URI identifikátorů objektům. Ne všichni v současné době disponují znalostmi pro publikaci a zpracování dat v této podobě. Související datové zdroje musí být také k dispozici minimálně na stupni 4 hvězdičky. Publikace číselných ukazatelů s využitím slovníku The RDF Data Cube Vocabulary 13 (z 84)

14 2.3 Propojená data Propojená data 6 je označení pro následující čtyři principy pro publikaci dat v prostředí webu (Berners- Lee, 2006): 1. pojmenování objektů na webu pomocí URI, 2. použití HTTP URI, které umožňují je vyhledat v prostředí dnešního webu, 3. při vyhledání URI jsou uživateli poskytnuta data o objektu, data jsou poskytnuta s využitím standardů RDF a SPARQL, 4. objekty jsou provázány odkazy mezi HTTP URI, což umožňuje objevovat související objekty. Dle (Bizer a kol., 2009) jsou propojená data strojově čitelná a jejich význam je explicitně definován. Hlavním cílem propojených dat je umožnit propojení různých datových zdrojů obdobným způsobem, jakým jsou v prostředí webu propojeny jednotlivé webové stránky (Bizer a kol., 2009). Na rozdíl od propojení webových stránek odkazy mezi jednotlivými datovými entitami vyjadřují jejich vzájemný vztah. Vzájemně propojené datové entity tak vytváření tzv. web dat. Propojená data využívají několika základních standardů protokol HTTP (Fielding a Reschke, 2014), identifikátory v podobě URI 7 (Berners-Lee a kol., 2005), datový model (formát) RDF 8 (Cyganiak a kol., 2014) a dotazovací jazyk SPARQL (W3C SPARQL Working Group, 2013). RDF představuje zcela obecný model pro reprezentaci dat na webu. Datová sada ve formátu RDF představuje sadu grafů reprezentovaných trojicemi subjekt-predikát-objekt. Subjekt, predikát a objekt pak mohou být reprezentovány pomocí URI, literálu nebo prázdného uzlu (blank node). Predikát RDF trojice určuje, v jakém vzájemném vztahu jsou subjekt a objekt a musí být vždy reprezentován jako URI. Literál je využit v případě, kdy objektem RDF trojice je hodnota, která nepředstavuje URI (prostá hodnota, ale i složená hodnota, jako např. množina bodů vymezujících určitý polygon představující území dle specifikace Open Geospatial Consortium, 2012). Objekt a subjekt mohou být reprezentovány prázdnými uzly, na které se ale lze odkazovat pouze v rámci jednoho RDF dokumentu. Díky tomuto omezení není možné odkazovat na prázdné uzly z jiných datových zdrojů a potenciál propojení datové sady (RDF dokumentu) s prázdnými uzly je tak nižší, než kdyby byly využity identifikátory v podobě URI (Heath a Bizer, 2011). Využívání prázdných uzlů tak není doporučováno. Protože RDF představuje zcela obecný datový model, neobsahuje definice žádných konceptů pro reprezentaci dat z určité domény. Pro reprezentaci objektů určité domény a vztahů mezi nimi jsou využívány ontologie nebo jednodušší slovníky (k ontologiím a slovníkům viz např. Heath a Bizer, 2011). Ontologie vznikají pro řadu oblastí. Doporučenou praktikou je využívání existujících ontologií (Hyland a kol., 2014). Tj. pokud pro reprezentaci určitého objektu existuje koncept v existující ontologii, měl by být využit. K tvorbě vlastních ontologií či k rozšiřování existujících ontologií je vhodné přistoupit až v okamžiku, kdy stávající ontologie neumožňují vhodným způsobem reprezentovat příslušné objekty a 6 Anglicky Linked Data, zkráceně LD. 7 Uniform Resource Identifier. 8 Resource Description Framework. Publikace číselných ukazatelů s využitím slovníku The RDF Data Cube Vocabulary 14 (z 84)

15 vztahy mezi nimi. Existující ontologie lze vyhledávat např. v katalogu Linked Open Vocabularies, 9 doporučené ontologie uvádí také např. (Nečaský a kol., 2014). Pokud jsou data veřejné správy publikována nejen jako otevřená data, ale pokud využívají i principů propojených dat, jsou takováto data označovaná jako otevřená propojená data. Dle (Archer a kol., 2013) by publikace dat v podobě otevřených propojených dat mohla v oblasti veřejné správy přinést následující přínosy: Flexibilní datová integrace publikace dat ve formátu otevřených propojených dat umožňuje a podporuje propojování doposud nepropojených datových sad v držení orgánů veřejné správy. Zvýšení kvality dat vyšší intenzita využívání dat vede k potřebě zajistit jejich potřebnou kvalitu. Uživatelé mohou na existující nedostatky v datech upozorňovat. Zjištěné nedostatky mohou být průběžně odstraňovány. Vznik nových služeb publikovaná otevřená propojená data mohou jak soukromé, tak i veřejné subjekty využít pro vytváření nových služeb a produktů. Snížení nákladů využívání publikovaných otevřených propojených dat v rámci aplikací zajišťujících služby egovernmentu může vést ke snížení nákladů. Bizer (2009) pak upozorňuje na skutečnost, že využívání principů propojených dat v oblasti veřejné správy může umožnit, aby data v držení různých orgánů veřejné správy byla integrována bez nutnosti změny kompetencí jednotlivých orgánů veřejné správy. Tato metodika se zaměřuje konkrétně na publikaci dat s využitím slovníku The RDF Data Cube Vocabulary. Obecná doporučení pro publikaci dat ve formátu RDF nejsou tedy součástí této metodiky. Lze je ale nalézt v řadě existujících zdrojů, jako je např. (Heath a Bizer, 2011; Hyland a kol., 2014) nebo (Nečaský a kol., 2014). Doporučujeme tak seznámit se s některým z těchto zdrojů. 9 Publikace číselných ukazatelů s využitím slovníku The RDF Data Cube Vocabulary 15 (z 84)

16 3 The RDF Data Cube Vocabulary The RDF Data Cube Vocabulary (dále jen Data Cube, prefix qb) je doporučení W3C, které vychází z mezinárodního standardu SDMX (Cyganiak & Reynolds, 2014). Data reprezentovaná pomocí Data Cube představují tzv. datové kostky (qb:dataset). Datové kostky jsou tvořeny pozorováními (qb:observation). Pozorování pak dále obsahují fakt, jemu přiřazené dimenze a mohou také obsahovat atribut faktu, např. jednotku, ve které je hodnota faktu vyjádřena. Schéma slovníku Data Cube je uvedeno na obrázku 3. Obrázek 3: Schéma slovníku Data Cube, zdroj: (Cyganiak a Reynolds, 2014) Slovník Data Cube nedefinuje strukturu datových kostek pro reprezentaci dat z určité domény, ale poskytuje koncepty, pomocí kterých lze strukturu konkrétních datových kostek definovat tak, aby odpovídala potřebám konkrétních dat. Pro každou datovou kostku tak existuje definice její struktury (qb:datastructuredefinition). V rámci definice této struktury je pak určeno, jakými fakty (qb:measureproperty), dimenzemi (qb:dimensionproperty) a příp. jejich atributy (qb:attributeproperty) je datová kostka tvořena. Data Cube umožňuje definovat i tzv. řezy (qb:slice). Řez představuje předdefinovaný pohled na data, který vznikne tak, že u jedné či více dimenzí je určena hodnota a součástí řezu jsou pak pouze ty fakty, u kterých hodnota příslušné dimenze odpovídá zvolené hodnotě. Publikace číselných ukazatelů s využitím slovníku The RDF Data Cube Vocabulary 16 (z 84)

17 4 Datové sady a datové kostky Výše bylo uvedeno, že v případě reprezentace dat pomocí slovníku Data Cube jsou data organizována do podoby datových kostek. V oblasti otevřených dat se lze běžně setkat s pojmem datová sada (angl. dataset). Datová sada je dle (Maali a Erickson, 2014) definována jako kolekce dat publikovaná a spravovaná jedním subjektem zpřístupněná ke stažení či jiným způsobem v jednom či více formátech. Při reprezentaci dat ve formátu RDF jsou trojice subjekt-predikát-objekt organizovány do grafů (Cyganiak a kol., 2014). RDF graf je tak považován za datovou sadu ve smyslu výše uvedené definice. Protože by datová kostka měla obsahovat související naměřené či pozorované údaje organizované dle odpovídajících dimenzí, doporučujeme, aby jeden RDF graf obsahoval data jedné datové kostky. 10 Z hlediska toho, jaká data jsou součástí datové sady, resp. datové kostky, vymezení datové sady a datové kostky si odpovídají. Protože ale podle výše uvedené definice může datová sada obsahovat data v různých formátech, bylo by možné uvažovat např. situaci, kdy je jedna datová kostka vedle formátu RDF reprezentována např. ve formátu XML. 11 Nicméně v této metodice jsou uvažovány pouze datové kostky ve formátu RDF. Datovou kostku dle slovníku Data Cube tak nelze zcela ztotožnit s datovou sadou dle (Maali a Erickson, 2014). Datová kostka ve formátu RDF je tak v této metodice chápána jako jedna z reprezentací obsahově shodně vymezené datové sady. K výše uvedenému je třeba doplnit, že v rámci specifikace konceptů a syntaxe formátu RDF (Cyganiak, Wood a Lanthaler, 2014) je vymezen pojem datová sada v RDF. Tento pojem je širší, než pojem datová sada, tak jak je popsána v předcházejícím odstavci, protože datová sada v RDF představuje kolekci RDF grafů (výchozí graf, který může být prázdný a žádný nebo více pojmenovaných grafů). Pojem datová sada v této metodice tak je používán ve smyslu definice dle (Maali a Erickson, 2014) a nikoli ve smyslu definice pojmu datová sada v RDF dle (Cyganiak, Wood a Lanthaler, 2014). Výše je také doporučeno, aby RDF trojice byly organizovány do RDF grafů tak, aby RDF trojice reprezentující jednu datovou kostku byly součástí samostatného RDF grafu. Pro úplnost uveďme, že toto je jen jeden z možných způsobů, které lze obecně použít pro organizaci RDF trojic do RDF grafů. Další z možných přístupů jsou popsány např. v (Doods a Davis, 2012). 10 Blíže viz praktika Vymezení datových sad a datových kostek ve formátu RDF při využití slovníku Data Cube. 11 Prostředky pro reprezentaci datových kostek pomocí XML nabízí standard SDMX, viz (SDMX, 2011a). Publikace číselných ukazatelů s využitím slovníku The RDF Data Cube Vocabulary 17 (z 84)

18 5 Role podílející se na publikaci otevřených dat Na publikaci číselných ukazatelů v podobě otevřených propojených dat se může podílet řada osob v různých rolích. V této metodice jsou využity role zúčastněné na publikaci otevřených dat veřejné správy, které byly vymezeny v rámci přípravy Standardů publikace a katalogizace otevřených dat veřejné správy, jenž probíhá v rámci projektu Ministerstva vnitra České republiky (Ministerstvo vnitra ČR, 2015b). Těmito rolemi jsou: Vedení poskytovatele dat vedení subjektu, který publikuje určitá data v podobě otevřených dat. Publikace otevřených dat je zahájena z rozhodnutí vedení. Vedení dále obsazuje jednotlivé role určenými pracovníky a schvaluje publikační plán. 12 Koordinátor otevřených dat v rámci organizace je zodpovědný za proces otevírání dat a za jeho řízení. Kurátor dat v rámci organizace zodpovídá za jednu nebo více určených datových sad. Správce katalogu otevřených dat zodpovídá za přípravu katalogu otevřených dat organizace a za správu jednotlivých katalogizačních záznamů. IT specialista odborník se znalostmi v oblasti informačních technologií, který spolupracuje s kurátory dat a správcem katalogu otevřených dat při přípravě datových sad k publikaci a při provozu datového katalogu. Obecné odpovědnosti jednotlivých rolí vymezuje vzorová směrnice pro publikaci a katalogizaci otevřených dat dostupná webových stránek věnovaných Standardům publikace a katalogizace otevřených dat veřejné správy, viz (Ministerstvo vnitra ČR., 2015f). Specifické odpovědnosti těchto rolí při publikaci číselných údajů v podobě otevřených propojených dat dle této metodiky jsou vymezeny v kapitole Dle (Ministerstvo vnitra ČR, 2015f) publikační plán vymezuje datové sady plánované k publikaci v podobě otevřených dat. Publikace číselných ukazatelů s využitím slovníku The RDF Data Cube Vocabulary 18 (z 84)

19 6 Postup publikace dat Postup publikace číselných údajů v podobě otevřených propojených dat s využitím slovníku Data Cube vychází z Metodiky publikace otevřených dat veřejné správy ČR (Chlapek a kol., 2012b) a z postupu publikace otevřených dat vymezeného ve standardech vytvářených Ministerstvem vnitra ČR (Ministerstvo vnitra ČR, 2015c). Tyto zdroje vymezují obecný postup publikace otevřených dat a nezaměřují se tak na specifika publikace otevřených propojených dat a využití slovníku Data Cube. Postup navržený v této metodice je tak oproti těmto obecným postupům rozšířen, aby bylo možné tato specifika zohlednit. Zvolený přístup tak zohledňuje jak specifika publikace otevřených propojených dat s využitím slovníku Data Cube, tak i vznikající standardy pro publikaci otevřených dat ČR a mezinárodní praxi. Doporučený postup publikace číselných údajů ve formátu RDF s využitím slovníku Data Cube se sestává z kroků uvedených v tabulce 3 společně s rolí, která za provádění kroku zodpovídá. Postup byl vymezen tak, aby pokryl životní cyklus datové sady od analýzy zdrojových dat, která budou následně transformována do podoby datové kostky či datových kostek, až po zpřístupnění datové sady k jejímu využití. Periodická publikace datové sady a její údržba není reprezentována samostatným krokem, ale předpokládá se opakování relevantních kroků navrženého postupu. Do postupu publikace nebyly zařazeny činnosti spojené s přípravou a přijetím interních předpisů upravujících publikaci otevřených dat, ani činnosti související s přípravou plánu publikace otevřených dat, které vymezují standardy publikace otevřených dat veřejné správy v ČR (Ministerstvo vnitra ČR, 2015b). Tyto činnosti v organizaci sice vytvářejí předpoklady, aby data v podobě otevřených dat s využitím slovníku Data Cube byla publikována, ale návrh, příprava a zveřejnění datových kostek v rámci nich přímo neprobíhá. Dále se předpokládá, že podmínky užití, resp. licence, zajišťující právní otevřenost dat byly zvoleny v rámci přípravy publikačního plánu. Podmínky užití je vhodné volit dle návodu popsaného v (Ministerstvo vnitra ČR, 2015a). Tabulka 3: Kroky postupu publikace číselných údajů ve formátu RDF s využitím slovníku Data Cube, zdroj: autoři Činnost Analýza zdrojových dat a vymezení datových sad Návrh datových kostek a tvorba ontologií/slovníků Volba způsobu přístupu k datům Transformace dat Příprava metadat a katalogizačních záznamů Validace datových kostek Kontrola připravených datových sad Zveřejnění datových sad Zveřejnění katalogizačních záznamů Zodpovídá Kurátor dat IT specialista Koordinátor otevírání dat IT specialista Kurátor dat Kurátor dat Koordinátor otevírání dat IT specialista Správce katalogu otevřených dat Postup publikace číselných údajů ve formátu RDF s využitím slovníku Data Cube je graficky znázorněn na obrázku 4. Kroky vyznačené na obrázku 4 přerušovanou čarou označují kroky obecného postupu publikace otevřených dat, které je třeba realizovat, aby i otevřená propojená data využívající slovník Publikace číselných ukazatelů s využitím slovníku The RDF Data Cube Vocabulary 19 (z 84)

20 Data Cube byla zpřístupněna k využití. Protože ale specifika zvoleného formátu dat neovlivňují jejich provádění, nejsou v této metodice pro tyto kroky vymezeny praktiky. Podrobnosti k provádění těchto kroků lze najít v (Chlapek a kol., 2012b; Ministerstvo vnitra ČR, 2015b). Obrázek 4: Schéma postupu publikace číselných údajů ve formátu RDF s využitím slovníku Data Cube, zdroj: autoři 6.1 Analýza zdrojových dat a vymezení datových sad Cíl činnosti Cílem této činnosti je provést analýzu zdrojových dat, identifikovat fakty a dimenze, vyhodnotit, zda je nutné zdrojová dat před publikací anonymizovat či agregovat do podoby statistik a navrhnout způsob, jakým bude provedena validace vytvořených datových kostek vzhledem ke zdrojovým datům Obsah činnosti V rámci činnosti je třeba: identifikovat fakty a dimenze ve zdrojových datech; navrhnout způsob agregace či anonymizace zdrojových dat, je-li to třeba; navrhnout způsob validace datových kostek Související praktiky Určení faktů a dimenzí Vymezení datových sad a datových kostek ve formátu RDF při využití slovníku Data Cube Validace datových kostek v RDF Publikace číselných ukazatelů s využitím slovníku The RDF Data Cube Vocabulary 20 (z 84)

21 6.2 Návrh datových kostek a tvorba ontologií/slovníků Cíl činnosti Cílem činnosti je na základě výsledků analýzy zdrojových dat, zejména na základě určení faktů a dimenzí, navrhnout strukturu příslušných datových kostek ve formátu RDF s využitím slovníku Data Cube a dalších relevantních ontologií. Pokud není možné reprezentovat fakty a dimenze pomocí existujících ontologií, je v rámci činnosti proveden návrh vlastních ontologií Obsah činnosti V rámci činnosti je třeba: identifikovat vhodné existující ontologie pro reprezentaci faktů a dimenzí; navrhnout vlastní ontologie pro reprezentaci faktů a dimenzí, pokud je není možné reprezentovat pomocí existujících ontologií; navrhnout vzory tvorby URI nebo využít vhodné existující vzory; navrhnout strukturu datových kostek ve formátu RDF; navrhnout propojení na jiné datové zdroje Související praktiky Návrh struktury datové kostky s využitím slovníku Data Cube Tvorba identifikátorů (URI) Volba ontologií pro reprezentaci faktů a dimenzí Reprezentace číselníků pomocí SKOS Reprezentace dimenze času Reprezentace dimenze místa/území Reprezentace dimenze pohlaví Reprezentace dimenze subjektu Propojování prvků pozorování na existující koncepty 6.3 Volba způsobu přístupu k datům Cíl činnosti Cílem činnosti je zvolit způsob, jakým budou datové sady obsahující příslušné datové kostky zpřístupněny k využití Obsah činnosti V rámci činnosti je třeba: určit způsob, kterým budou data zveřejněna. Datové sady musí být zpřístupněny ve formě datových souborů ke stažení. Ke stažení musí být k dispozici úplná datová sada, tj. všechna data datové kostky. To usnadňuje využití dat těm, kdo potřebují pracovat Publikace číselných ukazatelů s využitím slovníku The RDF Data Cube Vocabulary 21 (z 84)

22 s úplnými daty. Obsah lze ale rozdělit do více souborů, např. tak, aby soubor obsahoval data za vymezené časové období, nebo podle povahy měření zaznamenaného v datech. Pokud je to možné, měly by být datové sady obsahující datové kostky ve formátu RDF zpřístupněny prostřednictvím SPARQL endpointu. Pokud je to možné, měla by být zajištěna dereferencovatelnost URI jednotlivých objektů, tj. mělo by být zajištěno, že po přistoupení na URI pomocí protokolu HTTP budou poskytnuta data o příslušném objektu v RDF Související praktiky Volba přístupu k datům (Chlapek a kol., 2012b) Tvorba URL (Archer a kol., 2012) 6.4 Transformace dat Cíl činnosti Cílem činnosti je navrhnout způsob transformace datové sady z jejího stávajícího formátu do formátu RDF dle navržené struktury datových kostek a realizovat navrženou transformaci Obsah činnosti V rámci činnosti je třeba: navrhnout způsob transformace zdrojových dat do formátu RDF dle navržené struktury datových kostek; pokud navržený způsob zahrnuje automatizovanou transformaci pomocí ETL procedur, implementovat tyto ETL procedury; provést transformaci zdrojových dat dle navrženého způsobu Související praktiky Automatizace transformace dat 6.5 Příprava metadat a katalogizačních záznamů Cíl činnosti Cílem činnosti je připravit katalogizační záznamy o datových sadách a metadata popisující datové kostky Obsah činnosti V rámci činnosti je třeba: vytvořit metadata o datové sadě a o jednotlivých datových kostkách dle navržené struktury Související praktiky Příprava metadat o datové sadě viz (Ministerstvo vnitra ČR, 2015e) Příprava metadat o datové kostce Publikace číselných ukazatelů s využitím slovníku The RDF Data Cube Vocabulary 22 (z 84)

23 6.6 Validace datových kostek Cíl činnosti Cílem této činnosti je provést kontrolu, že vytvořené datové kostky ve formátu RDF a jejich metadata neobsahují chyby, že jsou dodrženy stanovené požadavky na kvalitu dat a metadat Obsah činnosti V rámci činnosti je třeba: validovat, že datové kostky odpovídají definicím jejich struktury; validovat, že data neobsahují chyby; validovat, že metadata neobsahují chyby a že věrně popisují datovou sadu a datové kostky Související praktiky Validace datových kostek v RDF 6.7 Kontrola připravených datových sad Cíl činnosti Cílem činnosti je provést kontrolu, že datové sady a k nim příslušné katalogizační záznamy vyhovují požadavkům určeným poskytovatelem dat a že mohou být zveřejněny Obsah činnosti V rámci činnosti je třeba: provést finální kontrolu souladu datových sad s určenými podmínkami, které musí před zveřejněním splňovat; provést finální kontrolu souladu katalogizačních záznamů s určenými podmínkami, které musí před zveřejněním splňovat Související praktiky Viz (Ministerstvo vnitra, 2015b). 6.8 Zveřejnění datových sad Cíl činnosti Cílem této činnosti je realizovat zveřejnění datových sad obsahujících datové kostky ve formátu RDF v souladu se způsobem určeným v rámci činnosti Volba způsobu přístupu k datům Obsah činnosti V rámci činnosti je třeba: zveřejnit datové sady v souladu se způsobem určeným v rámci činnosti Volba způsobu přístupu k datům. Publikace číselných ukazatelů s využitím slovníku The RDF Data Cube Vocabulary 23 (z 84)

24 6.8.3 Související praktiky Viz (Ministerstvo vnitra, 2015b). 6.9 Zveřejnění katalogizačních záznamů Cíl činnosti Cílem činnosti je zajistit, že metadata o datových sadách obsahujících datové kostky, jsou zpřístupněna v souladu se zvoleným způsobem katalogizace. Volba způsobu katalogizace je mimo rámec této metodiky, k této problematice viz (Ministerstvo vnitra ČR, 2015d) Obsah činnosti V rámci činnosti je třeba: zpřístupnit metadata o datové sadě a o datových kostkách v souladu se zvoleným způsobem katalogizace Související praktiky Viz (Ministerstvo vnitra, 2015b). Publikace číselných ukazatelů s využitím slovníku The RDF Data Cube Vocabulary 24 (z 84)

25 7 Praktiky Tabulka 4 uvádí přehled praktik a problémů, na jejichž řešení se jednotlivé praktiky zaměřují. Tabulka 4: Praktiky a související problémy, zdroj: autoři Praktika Problém Určení faktů a dimenzí Vymezení datových sad a datových kostek ve formátu RDF při využití slovníku Data Cube Návrh struktury datové kostky s využitím slovníku Data Cube Tvorba identifikátorů (URI) Volba ontologií pro reprezentaci faktů a dimenzí Reprezentace číselníků pomocí SKOS Reprezentace dimenze času Reprezentace dimenze místa/území Reprezentace dimenze pohlaví Reprezentace dimenze subjektu Propojování prvků pozorování na existující koncepty Automatizace transformace dat Příprava metadat o datové kostce Validace datových kostek v RDF Jak určit, zda mají být existující data publikována jako jedna nebo více datových sad? Jak určit, zda mají být existující data publikována jako jedna nebo více datových sad? Jak navrhnout strukturu datové kostky s využitím slovníku Data Cube? Jaká je vhodná struktura URI, které budou sloužit jako identifikátory objektů ve formátu RDF? Kdy volit existující ontologie pro reprezentaci faktů a dimenzí a kdy vytvářet ontologie vlastní? Jak nalézt vhodné existující ontologie pro reprezentaci dat ve formátu RDF? Jak reprezentovat číselníky pomocí slovníku SKOS? Jakým způsobem by měla být v datové kostce reprezentována dimenze času? Jakým způsobem by měla být v datové kostce reprezentována dimenze místa/území? Jakým způsobem by měla být v datové kostce reprezentována dimenze pohlaví? Jakým způsobem by měly být v datové kostce reprezentovány subjekty, např. právnické osoby, jako dimenze? Jak propojit měření (fakty), dimenze a příp. atributy pozorování na existující koncepty? Jak snížit pracnost přípravy datových sad? Jaká metadata by měla popisovat datovou kostku a jak tato metadata reprezentovat? Jak ověřit, že datová kostka obsahuje správné a úplné údaje? 7.1 Určení faktů a dimenzí Problém Co jsou fakty a dimenze a jak je rozpoznat v existujících datech? Publikace číselných ukazatelů s využitím slovníku The RDF Data Cube Vocabulary 25 (z 84)

26 7.1.2 Doporučené řešení Při určování faktů a dimenzí je vhodné se řídit následujícími doporučeními: Fakty představují sledované jevy, resp. naměřené hodnoty vypovídající o těchto jevech, např. celková výše příjmů, nebo výdajů. Dimenze představují hlediska, pomocí kterých jsou fakty klasifikovány, např. období, za které je výše příjmů/výdajů udávána, nebo typ výdaje/příjmu. Jak již bylo uvedeno výše, data reprezentovaná pomocí slovníku Data Cube jsou organizována do multidimenzionální datové struktury označované jako datová kostka. Datová kostka je tvořena pozorováními, která představují určité naměřené hodnoty či hodnoty o nějakém pozorovaném jevu, která jsou klasifikována na základě zvolených hledisek. V datové kostce je sledovaná hodnota (fakt) označována jako měření a klasifikační hlediska jsou pak označována jako dimenze (Cyganiak a Reynolds, 2014). Pozorování pak mohou mít přiřazeny další atributy, jako je např. jednotka měření či stav měření, např. odhadovaná hodnota (Cyganiak a Reynolds, 2014). Identifikaci měření, dimenzí a atributů lze ilustrovat na následujícím příkladu celkové výše výdajů hlavního města Prahy na služby pro obyvatelstvo, která v roce 2014 činila tis. Kč. 13 Celková výše výdajů představuje pozorovaný jev měření. Hodnotou měření v tomto konkrétním pozorování je hodnota Atributem pozorování je jednotka v tomto případě jsou výdaje udávány v tisících Kč (tis. Kč). Výše výdajů je pak klasifikována dle následujících hledisek, které představují dimenze: subjekt, který výdaje realizoval v uvedeném příkladu hl. m. Praha; druh výdaje v uvedeném příkladu služby pro obyvatelstvo; období, za které je výše výdajů udávána v uvedeném příkladu rok Vymezení í datových sad a datových kostek ve formátu RDF při využití slovníku Data Cube Problém Jak určit, zda mají být existující data publikována jako jedna nebo více datových sad? Doporučené řešení Pro určení, zda určitá zdrojová kolekce dat 14 představuje jednu či více datových sad, je vhodné se řídit následujícími doporučeními: Určete fakty a dimenze ve zdrojových datech. Určete, které dimenze se vztahují k jakým faktům Obecně data, která chceme transformovat do podoby datových kostek ve formátu RDF. Může se jednat o datový soubor, např. ve formátu CSV, ale i rozsáhlou databázi. Publikace číselných ukazatelů s využitím slovníku The RDF Data Cube Vocabulary 26 (z 84)

Otevřená data veřejné správy

Otevřená data veřejné správy Seminář Digitální výzvy 2012 8.11.2012 Otevřená data veřejné správy Dušan Chlapek 1, Jan Kučera 1, Martin Nečaský 2 1 Fakulta informatiky a statistiky, Vysoká škola ekonomická v Praze 2 Matematicko-fyzikální

Více

Otevřená data veřejné správy

Otevřená data veřejné správy Hradec Králové, 7. - 8. 4. 2014 Otevřená data veřejné správy Dušan Chlapek Fakulta informatiky a statistiky, Vysoká škola ekonomická v Praze Obsah 1. Co jsou otevřená data 2. Aktivity v oblasti otevřených

Více

Standardy publikace a katalogizace otevřených dat

Standardy publikace a katalogizace otevřených dat Standardy publikace a katalogizace otevřených dat Autor: Dušan Chlapek V prezentaci jsou použity výstupy z projektů, na kterých se podíleli: Tomáš Bruckner, David Hemala, Drahomír Chocholatý, Jakub Klímek,

Více

Informace o aktuálním dění v oblasti otevřených dat v České republice

Informace o aktuálním dění v oblasti otevřených dat v České republice Informace o aktuálním dění v oblasti otevřených dat v České republice Ministerstvo vnitra - odbor Hlavního architekta egovernmentu Rady vlády pro informační společnost (RVIS), 10.6. 2016 Osnova 1. Definice

Více

S M Ě R N I C E č. 6/2014 ministra financí ------------------------------------------------------------------------

S M Ě R N I C E č. 6/2014 ministra financí ------------------------------------------------------------------------ MINISTERSTVO FINANCÍ Praha 1, Letenská 15 V Praze dne 12. prosince 2014 Č.j.: MF 69 949/2014/4703-2 S M Ě R N I C E č. 6/2014 ministra financí ------------------------------------------------------------------------

Více

MINISTERSTVO PRO MÍSTNÍ ROZVOJ Č.j. 7022/ R O Z H O D N U T Í č. 19/2016. ministryně pro místní rozvoj. ze dne

MINISTERSTVO PRO MÍSTNÍ ROZVOJ Č.j. 7022/ R O Z H O D N U T Í č. 19/2016. ministryně pro místní rozvoj. ze dne MINISTERSTVO PRO MÍSTNÍ ROZVOJ Č.j. 7022/2016-56 R O Z H O D N U T Í č. 19/2016 ministryně pro místní rozvoj ze dne 18. 2. 2016 o Pravidlech správy otevřených dat Ministerstva pro místní rozvoj S účinností

Více

Standardy publikace a katalogizace otevřených dat. Dušan Chlapek David Hemala

Standardy publikace a katalogizace otevřených dat. Dušan Chlapek David Hemala Standardy publikace a katalogizace otevřených dat Dušan Chlapek David Hemala Obsah prezentace 1. Vymezení otevřených dat 2. Standardy publikace otevřených dat 3. Role a procesy 4. Vzorové publikační plány

Více

Otevřená data nejen ve vzdělávání

Otevřená data nejen ve vzdělávání Otevřená data nejen ve vzdělávání Michal Kubáň Národní koordinátor otevřených dat Odbor hlavního architekta egovernmentu (MV ČR) Seminář: Otevřené licence a otevřená data pro resort MŠMT Praha, 18.10.2017

Více

Informace o aktuálním dění v oblasti otevřených dat v ČR

Informace o aktuálním dění v oblasti otevřených dat v ČR Informace o aktuálním dění v oblasti otevřených dat v ČR Ministerstvo vnitra - odbor Hlavního architekta egovernmentu Rady vlády pro informační společnost (RVIS), 10.6. 2016 Osnova 1. Definice otevřených

Více

Co jsou otevřená data?

Co jsou otevřená data? Co jsou otevřená data? Data zveřejněná na Internetu, která jsou úplná, snadno dostupná, strojově čitelná, používající standardy s volně dostupnou specifikací, zpřístupněna za jasně definovaných podmínek

Více

Výzvy využívání otevřených dat v ČR

Výzvy využívání otevřených dat v ČR a cesty k jejich řešení Praha, 8. 11. 2013 Výzvy využívání otevřených dat v ČR Dušan Chlapek 1, Jan Kučera 1, Martin Nečaský 2, 1 Fakulta informatiky a statistiky, Vysoká škola ekonomická v Praze 2 Matematicko-fyzikální

Více

Seminář ČSSI: Otevřená a propojitelná data

Seminář ČSSI: Otevřená a propojitelná data Otevřená a propojitelná data veřejné správy aktivity, postupy, návody, Seminář ČSSI: Otevřená a propojitelná data pojmy, témata, aktivity Dušan Chlapek Fakulta informatiky a statistiky, Vysoká škola ekonomická

Více

Otevřená a propojitelná data ve veřejné správě Národní katalog otevřených dat

Otevřená a propojitelná data ve veřejné správě Národní katalog otevřených dat Otevřená a propojitelná data ve veřejné správě Národní katalog otevřených dat Dušan Chlapek, Fakulta informatiky a statistiky Vysoká škola ekonomická v Praze, Tomáš Kroupa, Ministerstvo vnitra - Odbor

Více

Publikace dat důchodové statistiky v podobě otevřených propojených dat

Publikace dat důchodové statistiky v podobě otevřených propojených dat Publikace dat důchodové statistiky v podobě otevřených propojených dat Jan Kučera Katedra informačních technologií Fakulta informatiky a statistiky Vysoká škola ekonomická v Praze Obsah přednášky Aktivity

Více

Principy a praktické využití otevřených dat

Principy a praktické využití otevřených dat Principy a praktické využití otevřených dat 1 Dušan Chlapek, 1 Jan Kučera, 2 Martin Nečaský 1 Fakulta informatiky a statistiky, Vysoká škola ekonomická v Praze 2 Matematicko-fyzikální fakulta, Univerzita

Více

Obsah. 1. Co jsou otevřená data 2. Aktivity v oblasti otevřených dat v ČR 3. Přínosy a výzvy využívání otevřených dat v ČR

Obsah. 1. Co jsou otevřená data 2. Aktivity v oblasti otevřených dat v ČR 3. Přínosy a výzvy využívání otevřených dat v ČR Open Data v ČR Martin Nečaský 1, Dušan Chlapek 2, Jan Kučera 2 1 Matematicko-fyzikální fakulta, Univerzita Karlova v Praze 2 Fakulta informatiky a statistiky, Vysoká škola ekonomická v Praze Obsah 1. Co

Více

Metody tvorby ontologií a sémantický web. Martin Malčík, Rostislav Miarka

Metody tvorby ontologií a sémantický web. Martin Malčík, Rostislav Miarka Metody tvorby ontologií a sémantický web Martin Malčík, Rostislav Miarka Obsah Reprezentace znalostí Ontologie a sémantický web Tvorba ontologií Hierarchie znalostí (D.R.Tobin) Data jakékoliv znakové řetězce

Více

Aktuální výzvy a novinky v oblasti otevřených dat v České republice

Aktuální výzvy a novinky v oblasti otevřených dat v České republice Aktuální výzvy a novinky v oblasti otevřených dat v České republice Michal Kubáň Národní koordinátor otevřených dat Odbor hlavního architekta egovernmentu (MV ČR) Open Data Expo, 7. 3. 2017 Zakotvení otevřených

Více

Otevřená data ve veřejné správě ČR Tomáš Kroupa, Ministerstvo vnitra - Odbor Hlavního architekta egovernmentu

Otevřená data ve veřejné správě ČR Tomáš Kroupa, Ministerstvo vnitra - Odbor Hlavního architekta egovernmentu Otevřená data ve veřejné správě ČR 13.11.2015 Tomáš Kroupa, Ministerstvo vnitra - Odbor Hlavního architekta egovernmentu Zhodnocení vývoje v oblasti otevřených dat v ČR Rok 2015 je zatím nejvýznačnějším

Více

Návrh metodiky popisu a prezentace dat důchodové statistiky ve formátu otevřených propojitelných dat a návrh typové architektury IT řešení

Návrh metodiky popisu a prezentace dat důchodové statistiky ve formátu otevřených propojitelných dat a návrh typové architektury IT řešení Návrh metodiky popisu a prezentace dat důchodové statistiky ve formátu otevřených propojitelných dat a návrh typové architektury IT řešení Autoři Březen 2014 Autor Organizace Dušan Chlapek Tomáš Knap Jan

Více

Otevřená data. Shrnutí. Když stavím nový IS nebo upravuji existující, co musím udělat, abych byl Open Data Ready? Prosinec 2018

Otevřená data. Shrnutí. Když stavím nový IS nebo upravuji existující, co musím udělat, abych byl Open Data Ready? Prosinec 2018 Otevřená data Když stavím nový IS nebo upravuji existující, co musím udělat, abych byl Open Data Ready? Prosinec 2018 Schválil: Ing. Petr Kuchař, ředitel odboru Hlavního architekta egovernmentu, MVČR Shrnutí

Více

Otevřená data ve veřejné správě 8.9.2015, Mikulov. Tomáš Kroupa, Ministerstvo vnitra - Odbor hlavního architekta egovernmentu

Otevřená data ve veřejné správě 8.9.2015, Mikulov. Tomáš Kroupa, Ministerstvo vnitra - Odbor hlavního architekta egovernmentu Otevřená data ve veřejné správě 8.9.2015, Mikulov Tomáš Kroupa, Ministerstvo vnitra - Odbor hlavního architekta egovernmentu Zhodnocení vývoje v oblasti otevřených dat v ČR Rok 2015 je zatím nejvýznačnějším

Více

Setkání po roce aneb Kam jsme pokročili v otevřených datech

Setkání po roce aneb Kam jsme pokročili v otevřených datech Setkání po roce aneb Kam jsme pokročili v otevřených datech Michal Kubáň, Národní koordinátor otevřených dat Ministerstvo vnitra - odbor Hlavního architekta egovernmentu 5.11. konference Open Alt 2016,

Více

Správa VF XML DTM DMVS Datový model a ontologický popis

Správa VF XML DTM DMVS Datový model a ontologický popis Správa VF XML DTM DMVS Datový model a ontologický popis Verze 1.0 Standard VF XML DTM DMVS Objednatel Plzeňský kraj Institut plánování a rozvoje hlavního města Prahy Zlínský kraj Kraj Vysočina Liberecký

Více

OpenData.cz. Jan Kučera. Otevřená data v České republice. Otevřené repositáře 2014 30.4.2014

OpenData.cz. Jan Kučera. Otevřená data v České republice. Otevřené repositáře 2014 30.4.2014 Otevřené repositáře 2014 OpenData.cz Otevřená data v České republice Jan Kučera Fakulta informatiky a statistiky, Vysoká škola ekonomická v Praze Obsah 1. Otevřená data 2. Propojitelná data 3. Aktivity

Více

Aktuální dění v oblasti otevřených dat v ČR

Aktuální dění v oblasti otevřených dat v ČR Aktuální dění v oblasti otevřených dat v ČR Autoři: Dušan Chlapek 1 a Michal Kubáň 2 1 Fakulta informatiky a statistiky Vysoká škola ekonomická v Praze 2 Národní koordinátor otevřených dat Odbor Hlavního

Více

Otevřená data veřejné správy z pohledu České republiky

Otevřená data veřejné správy z pohledu České republiky Otevřená data veřejné správy z pohledu České republiky Mgr. Tomáš Kroupa Ministerstvo vnitra - Samostatné oddělení hlavního architekta egovernmentu Agenda Proč to všechno děláme Co máme za sebou Co nás

Více

Praktické zkušenosti s řízením projektů otevřených dat Dobrá / špatná praxe

Praktické zkušenosti s řízením projektů otevřených dat Dobrá / špatná praxe Praktické zkušenosti s řízením projektů otevřených dat Dobrá / špatná praxe Tomáš Pecha, Benedikt Kotmel 4. dubna 2017 ISSS 2017 Registrační číslo: Název projektu: CZ.03.4.74/0.0/0.0/15_025/0004172 Implementace

Více

Specializovaná mapa s interpretací regionálních rozdílů v oblasti sociálního výzkumu

Specializovaná mapa s interpretací regionálních rozdílů v oblasti sociálního výzkumu v oblasti sociálního výzkumu Autoři Březen 2015 Autor Organizace Dušan Chlapek Vladimír Jakubal Tomáš Knap Jan Vrána Jan Kučera Jiří Makalouš Luboš Marek Petr Mazouch Martin Nečaský Tomáš Vahalík KOMIX

Více

Otevřená data ČSSZ: Přehledné informace dostupné všem, snadno a zdarma. Ing. Jiří Šunka Ing. Michaela Hendrychová. ISSS Hradec Králové, 5. 4.

Otevřená data ČSSZ: Přehledné informace dostupné všem, snadno a zdarma. Ing. Jiří Šunka Ing. Michaela Hendrychová. ISSS Hradec Králové, 5. 4. Otevřená data ČSSZ: Přehledné informace dostupné všem, snadno a zdarma ISSS Hradec Králové, 5. 4. 2016 Ing. Jiří Šunka Ing. Michaela Hendrychová Obsah 1. Představení ČSSZ 2. Proces publikace otevřených

Více

Metodika publikace otevřených dat veřejné správy ČR. verze 1.0

Metodika publikace otevřených dat veřejné správy ČR. verze 1.0 Metodika publikace otevřených dat veřejné správy ČR verze 1.0 Praha, listopad 2012 Zpracovali: Dušan Chlapek Jan Kučera Martin Nečaský Fakulta informatiky a statistiky, Vysoká škola ekonomická v Praze

Více

Open Data v ČR. Martin Nečaský 1, Dušan Chlapek 2, Jan Kučera 2. Business Intelligence Forum Praha, 14. 11. 2013

Open Data v ČR. Martin Nečaský 1, Dušan Chlapek 2, Jan Kučera 2. Business Intelligence Forum Praha, 14. 11. 2013 Martin Nečaský 1, Dušan Chlapek 2, Jan Kučera 2 1 Matematicko-fyzikální fakulta, Univerzita Karlova v Praze 2 Fakulta informatiky a statistiky, Vysoká škola ekonomická v Praze Obsah 1. Co jsou otevřená

Více

Jak budeme řešit otevřená data ve veřejné správě? Michal Rada Ministerstvo vnitra ČR

Jak budeme řešit otevřená data ve veřejné správě? Michal Rada Ministerstvo vnitra ČR Jak budeme řešit otevřená data ve veřejné správě? Michal Rada Ministerstvo vnitra ČR OPEN Není to jen o samotných datech Hodně se hovoří o opendatech jako otevřených datech Příkladem jsou otevřená data

Více

OTEVŘENÁ DATA v České republice a v zahraničí Michal Kubáň Národní koordinátor otevřených dat Odbor hlavního architekta egovernmentu (MV ČR)

OTEVŘENÁ DATA v České republice a v zahraničí Michal Kubáň Národní koordinátor otevřených dat Odbor hlavního architekta egovernmentu (MV ČR) OTEVŘENÁ DATA v České republice a v zahraničí Michal Kubáň Národní koordinátor otevřených dat Odbor hlavního architekta egovernmentu (MV ČR) Seminář CACIO, 20. 9. 2016 Co jsou otevřená data Data zveřejněná

Více

Školení otevřených dat VS ČR. Ministerstvo vnitra - Odbor hlavního architekta egovernmentu

Školení otevřených dat VS ČR. Ministerstvo vnitra - Odbor hlavního architekta egovernmentu Školení otevřených dat VS ČR Ministerstvo vnitra - Odbor hlavního architekta egovernmentu Cíle prezentace a vystoupení Blok 1. Teorie a kontext otevřených dat ( Co jsou otevřená data ) Význam a role otevřených

Více

UŽIVATELSKÁ PŘÍRUČKA K INTERNETOVÉ VERZI REGISTRU SČÍTACÍCH OBVODŮ A BUDOV (irso 4.x) VERZE 1.0

UŽIVATELSKÁ PŘÍRUČKA K INTERNETOVÉ VERZI REGISTRU SČÍTACÍCH OBVODŮ A BUDOV (irso 4.x) VERZE 1.0 UŽIVATELSKÁ PŘÍRUČKA K INTERNETOVÉ VERZI REGISTRU SČÍTACÍCH OBVODŮ A BUDOV (irso 4.x) VERZE 1.0 OBSAH 1 ÚVOD... 3 1.1 HOME STRÁNKA... 3 1.2 INFORMACE O GENEROVANÉ STRÁNCE... 4 2 VYHLEDÁVÁNÍ V ÚZEMÍ...

Více

Výměnný formát XML DTM DMVS PK

Výměnný formát XML DTM DMVS PK Výměnný formát XML DTM DMVS PK Představení partnerským krajům Praha 8. 2. 2016 Krajský úřad Plzeňského kraje Odbor informatiky Koncept etapizace tvorby výměnného formátu XML aktualizačních zakázek Digitální

Více

Koncepce katalogizace otevřených dat

Koncepce katalogizace otevřených dat Koncepce katalogizace otevřených dat 1 Dušan Chlapek, 1 Jan Kučera, 2 Martin Nečaský 1 Fakulta informatiky a statistiky, Vysoká škola ekonomická v Praze 2 Matematicko-fyzikální fakulta, Univerzita Karlova

Více

Automatizovatelná aktualizace Wikidata z veřejných databází. Jakub Klímek

Automatizovatelná aktualizace Wikidata z veřejných databází. Jakub Klímek Automatizovatelná aktualizace Wikidata z veřejných databází Jakub Klímek Veřejné databáze, Otevřená data https://data.gov.cz 2 Veřejné databáze, Otevřená data - zajímavé zdroje Český úřad zeměměřický a

Více

Jak na opendata ve veřejné správě. Michal Rada Ministerstvo vnitra

Jak na opendata ve veřejné správě. Michal Rada Ministerstvo vnitra Jak na opendata ve veřejné správě Michal Rada Ministerstvo vnitra OPEN Není to jen o samotných datech Hodně se hovoří o opendatech jako otevřených datech Příkladem jsou otevřená data RÚIAN Existují ale

Více

Jaká data veřejné správy ČR jsou otevřená?

Jaká data veřejné správy ČR jsou otevřená? Jaká data veřejné správy ČR jsou otevřená? Dušan Chlapek Fakulta informatiky a statistiky, Vysoká škola ekonomická v Praze Cíle projektu a případové studie ověřit možnosti přípravy aplikace sémantických

Více

1 Popis předmětu plnění projektu implementace MIS

1 Popis předmětu plnění projektu implementace MIS 1 Popis předmětu plnění projektu implementace MIS Vytvořit Manažerský rozpočet Tzn. vytvoření metodiky pro zajištění Manažerského účetnictví, přičemž metodikou se rozumí soubor postupů a pravidel popisujících

Více

D. Chlapek, J. Kučera, M. Nečaský: Principy a technologie otevřených dat a jejich využití v managementu

D. Chlapek, J. Kučera, M. Nečaský: Principy a technologie otevřených dat a jejich využití v managementu 22.1. 23.1.2015, Praha Principy a technologie otevřených dat a jejich využití v managementu Dušan Chlapek 1 Jan Kučera 1 Martin Nečaský 2 1 Fakulta informatiky a statistiky, Vysoká škola ekonomická v Praze

Více

OTEVŘENÁ DATA V ČESKÉ REPUBLICE Aktuální stav, překážky a příležitosti

OTEVŘENÁ DATA V ČESKÉ REPUBLICE Aktuální stav, překážky a příležitosti OTEVŘENÁ DATA V ČESKÉ REPUBLICE Aktuální stav, překážky a příležitosti Michal Kubáň Národní koordinátor otevřených dat Odbor hlavního architekta egovernmentu (MV ČR) Open Goverment Week, Bratislava, 20.

Více

Konsolidace rezortních registrů. 4. dubna 2011

Konsolidace rezortních registrů. 4. dubna 2011 Konsolidace rezortních registrů 4. dubna 2011 Úprava rezortních registrů a konsolidace rezortních dat v návaznosti na základní registry VS Cílem projektu je vytvoření JTP pro rezortní registry, která zajistí

Více

Otevřená data v ČR aktuální stav a výzvy

Otevřená data v ČR aktuální stav a výzvy Otevřená data v ČR aktuální stav a výzvy Projekt: Reg. číslo: Doc. Mgr. Martin Nečaský, Ph.D. Ministerstvo vnitra ČR Co jsou otevřená data? Projekt: Reg. číslo: Otevřená data 3 Stav otevřených dat v České

Více

4 Poskytování informací. (1) Povinné subjekty poskytují informace žadateli na základě žádosti nebo zveřejněním.

4 Poskytování informací. (1) Povinné subjekty poskytují informace žadateli na základě žádosti nebo zveřejněním. V Praze dne 28. května 2008 Vážení členové Konzultační skupiny, dovoluji si vám předložit k následné diskuzi návrhy zpracovatelů informací veřejného sektoru, tak jak byly prodiskutovány na platformě Iniciativy

Více

Specifikace předmětu plnění Datová tržiště

Specifikace předmětu plnění Datová tržiště Příloha 1 Specifikace předmětu plnění Datová tržiště Etapa 1 Analýza statistické domény produkčních statistik 1 Obsah ETAPA 1 ANALÝZA STATISTICKÉ DOMÉNY PRODUKČNÍCH STATISTIK... 3 1.1. Koncepční shrnutí...

Více

Ontologie. Otakar Trunda

Ontologie. Otakar Trunda Ontologie Otakar Trunda Definice Mnoho různých definic: Formální specifikace sdílené konceptualizace Hierarchicky strukturovaná množina termínů popisujících určitou věcnou oblast Strukturovaná slovní zásoba

Více

Národní technické specifikace. služeb nad prostorovými daty a metadaty

Národní technické specifikace. služeb nad prostorovými daty a metadaty Národní technické specifikace služeb nad prostorovými daty a metadaty Jiří Kvapil, CENIA, Nemoforum - seminář, ČÚZK, 26.4.2017 Výstupy 1. Metodika zpracování specifikace datového produktu pro datové zdroje

Více

Školení otevřených dat VS ČR. Ministerstvo vnitra - Odbor hlavního architekta egovernmentu

Školení otevřených dat VS ČR. Ministerstvo vnitra - Odbor hlavního architekta egovernmentu Školení otevřených dat VS ČR Ministerstvo vnitra - Odbor hlavního architekta egovernmentu Cíle prezentace a vystoupení Blok 1. Teorie a kontext otevřených dat ( Co jsou otevřená data ) Význam a role otevřených

Více

EXTRAKT z mezinárodní normy

EXTRAKT z mezinárodní normy EXTRAKT z mezinárodní normy Extrakt nenahrazuje samotnou technickou normu, je pouze informativním ICS 03.220.01; 35.240.60 materiálem o normě. Inteligentní dopravní systémy Požadavky na ITS centrální datové

Více

Rezortní registry. 8. dubna 2013

Rezortní registry. 8. dubna 2013 Rezortní registry 8. dubna 2013 Úprava rezortních registrů a konsolidace rezortních dat v návaznosti na základní registry VS Cílem projektu je vytvoření JTP pro rezortní registry, která zajistí konzistenci

Více

OTEVŘENÁ DATA ČSSZ INFORMAČNÍ TECHNOLOGIE HISTORIE OTEVŘENÝCH DAT CO JSOU OTEVŘENÁ DATA. Ing. JIŘÍ ŠUNKA

OTEVŘENÁ DATA ČSSZ INFORMAČNÍ TECHNOLOGIE HISTORIE OTEVŘENÝCH DAT CO JSOU OTEVŘENÁ DATA. Ing. JIŘÍ ŠUNKA OTEVŘENÁ DATA ČSSZ Ing. JIŘÍ ŠUNKA Publikace otevřených dat se stává významnou aktivitou stále většího počtu států a jejich vlád. Celosvětově roste počet oblastí nabízejících sady otevřených dat. Data

Více

Linked Data a jazyk RDF

Linked Data a jazyk RDF Linked Data a jazyk RDF Doc. Ing. Vojtěch Svátek, Dr. Zimní semestr 2016 http://nb.vse.cz/~svatek/rzzw.html Osnova přednášky Strukturovaná data na webu - přehled Principy Linked Data Jazyk RDF Hlavní syntaxe

Více

GIS Libereckého kraje

GIS Libereckého kraje Funkční rámec Zpracoval: Odbor informatiky květen 2004 Obsah 1. ÚVOD...3 1.1. Vztah GIS a IS... 3 2. ANALÝZA SOUČASNÉHO STAVU...3 2.1. Technické zázemí... 3 2.2. Personální zázemí... 3 2.3. Datová základna...

Více

Standard výměnného formátu XML Digitální technické mapy

Standard výměnného formátu XML Digitální technické mapy Standard výměnného formátu XML Digitální technické mapy Michal Souček, Plzeňský kraj Karel Vondráček, GEOREAL spol. s r.o. Důvody realizace Neexistence celorepublikového standardu Široká společenská poptávka

Více

Otevřená a propojitelná data

Otevřená a propojitelná data Setkání absolventů Fakulty informatiky a statistiky, 1.4.2014 Otevřená a propojitelná data výzkum, výsledky, praxe Dušan Chlapek 1 Jakub Klímek 2 Jan Kučera 1 Luboš Marek 1 Petr Mazouch 1 Martin Nečaský

Více

Jak otevřené je Zastupitelstvo hlavního města Prahy?

Jak otevřené je Zastupitelstvo hlavního města Prahy? Jak otevřené je Zastupitelstvo hlavního města Prahy? Nezbytnou podmínkou pro kvalitní fungování demokracie je dostupnost informací o činnosti zastupitelských sborů, jimiž jsou krajská zastupitelstva. Ta

Více

1. Datová architektura a správa dat 2. Otevřená propojená data 3. Řízení kvality dat 4. Role ve správě dat

1. Datová architektura a správa dat 2. Otevřená propojená data 3. Řízení kvality dat 4. Role ve správě dat Konference DATA A ZNALOSTI 2015 1. 2. 10. 2015 Řízení kvality dat s přihlédnutím k otevřeným propojeným datům Dušan Chlapek Jan Kučera Fakulta informatiky a statistiky Vysoká škola ekonomická v Praze Obsah

Více

Jak otevřené je zastupitelstvo Středočeského kraje?

Jak otevřené je zastupitelstvo Středočeského kraje? Jak otevřené je zastupitelstvo Středočeského kraje? zbytnou podmínkou pro kvalitní fungování demokracie je dostupnost informací o činnosti zastupitelských sborů, jimiž jsou krajská zastupitelstva. Ta se

Více

Co nového ve spisové službě? Národní standard pro elektronické systémy spisové služby a jeho optimalizace

Co nového ve spisové službě? Národní standard pro elektronické systémy spisové služby a jeho optimalizace Co nového ve spisové službě? Národní standard pro elektronické systémy spisové služby a jeho optimalizace Tomáš Dvořák, Archiv hl. města Prahy Radek Pokorný, Státní okresní archiv Hradec Králové DRMS Forum

Více

Jak otevřené je zastupitelstvo Plzeňského kraje?

Jak otevřené je zastupitelstvo Plzeňského kraje? Jak otevřené je zastupitelstvo Plzeňského kraje? Nezbytnou podmínkou pro kvalitní fungování demokracie je dostupnost informací o činnosti zastupitelských sborů, jimiž jsou krajská zastupitelstva. Ta se

Více

Sémantický web 10 let poté

Sémantický web 10 let poté Sémantický web 10 let poté Vilém Sklenák sklenak@vse.cz Vysoká škola ekonomická, fakulta informatiky a statistiky, katedra informačního a znalostního inženýrství Inforum2011, 26. 5. 2011 Vilém Sklenák

Více

Národní sada prostorových objektů z pohledu krajů. Mgr. Jiří Čtyroký IPR Praha

Národní sada prostorových objektů z pohledu krajů. Mgr. Jiří Čtyroký IPR Praha Národní sada prostorových objektů z pohledu krajů Mgr. Jiří Čtyroký IPR Praha Výchozí stav Fixní (omezené) zdroje primárních geodat Heterogenní pojetí agend VS při využívání zdrojů geodat Neefektivní procesy

Více

Co jsou otevřená propojená data?

Co jsou otevřená propojená data? Co jsou otevřená propojená data? Martin Nečaský Matematicko-fyzikální fakulta Univerzita Karlova v Praze 1 Co jsou otevřená propojená data? Zdroj : http://5stardata.info 2 Co jsou otevřená propojená data?

Více

Otev ená data Českého statistického ú adu

Otev ená data Českého statistického ú adu Otev ená data Českého statistického ú adu Konference ISSS, 4. 4. 2017 ČESKÝ STATISTICKÝ Ú AD Na padesátém Ř1, 100 Ř2 Praha 10 czso.cz 1 OBSAH Působnost ČSÚ Statistický informační systém ČSÚ Nástroje pro

Více

Publikační databáze. Září 2014. Vysoká škola ekonomická v Praze

Publikační databáze. Září 2014. Vysoká škola ekonomická v Praze Publikační databáze Září 2014 Autoři Autor Organizace Dušan Chlapek Tomáš Knap Jan Kučera Luboš Marek Petr Mazouch Martin Nečaský Jiří Makalouš Tomáš Vahalík Jan Vrána Vysoká škola ekonomická v Praze Vysoká

Více

Výčet strategií a cílů, na jejichž plnění se projektový okruh podílí: Strategický rámec rozvoje veřejné správy České republiky pro období

Výčet strategií a cílů, na jejichž plnění se projektový okruh podílí: Strategický rámec rozvoje veřejné správy České republiky pro období Karta projektového okruhu Číslo a název projektového okruhu: Garant karty projektového okruhu: Spolupracující subjekty: 6.3 Sdílitelné služby technologické infrastruktury Ministerstvo vnitra, Ministerstvo

Více

Tvorba DSD a kódovníků pro fiskální data z projektu OpenBudgets.eu

Tvorba DSD a kódovníků pro fiskální data z projektu OpenBudgets.eu Tvorba DSD a kódovníků pro fiskální data z projektu OpenBudgets.eu Doc. Ing. Vojtěch Svátek, Dr. Zimní semestr 2017 http://nb.vse.cz/~svatek/rzzw.html Základní info Předpoklad: vstupní data jsou v CSV

Více

Průzkumník IS DP. Návod k obsluze informačního systému o datových prvcích (IS DP) vypracovala společnost ASD Software, s. r. o.

Průzkumník IS DP. Návod k obsluze informačního systému o datových prvcích (IS DP) vypracovala společnost ASD Software, s. r. o. Průzkumník IS DP Návod k obsluze informačního systému o datových prvcích (IS DP) vypracovala společnost ASD Software, s. r. o. dokument ze dne 13. 09. 2018, verze 1.00 Průzkumník IS DP Návod k obsluze

Více

Příloha: Dodatečné informace, včetně přesného znění žádosti dodavatele o dodatečné informace

Příloha: Dodatečné informace, včetně přesného znění žádosti dodavatele o dodatečné informace Příloha: Dodatečné informace, včetně přesného znění žádosti dodavatele o dodatečné informace Pořadové číslo dodatečných informací: 14. ČÁST 1: Přesné znění žádosti dodavatele o dodatečné informace Otázka

Více

Jak otevřené je zastupitelstvo Jihočeského kraje?

Jak otevřené je zastupitelstvo Jihočeského kraje? Jak otevřené je zastupitelstvo Jihočeského kraje? Nezbytnou podmínkou pro kvalitní fungování demokracie je dostupnost informací o činnosti zastupitelských sborů, jimiž jsou krajská zastupitelstva. Ta se

Více

Jak otevřené je zastupitelstvo Karlovarského kraje?

Jak otevřené je zastupitelstvo Karlovarského kraje? Jak otevřené je zastupitelstvo Karlovarského kraje? zbytnou podmínkou pro kvalitní fungování demokracie je dostupnost informací o činnosti zastupitelských sborů, jimiž jsou krajská zastupitelstva. Ta se

Více

S t a n o vi s k o. odboru dozoru a kontroly veřejné správy Ministerstva vnitra č. 1/2012

S t a n o vi s k o. odboru dozoru a kontroly veřejné správy Ministerstva vnitra č. 1/2012 S t a n o vi s k o odboru dozoru a kontroly veřejné správy Ministerstva vnitra č. 1/2012 Označení stanoviska: Zveřejňování poskytnuté informace podle zákona o svobodném přístupu k informacím Právní předpis:

Více

Jak otevřené je zastupitelstvo Olomouckého kraje?

Jak otevřené je zastupitelstvo Olomouckého kraje? Jak otevřené je zastupitelstvo Olomouckého kraje? Nezbytnou podmínkou pro kvalitní fungování demokracie je dostupnost informací o činnosti zastupitelských sborů, jimiž jsou krajská zastupitelstva. Ta se

Více

Technická dokumentace

Technická dokumentace Příloha č. 1 výzvy k podání nabídky na veřejnou zakázku malého rozsahu s názvem On-line vyjádření k existenci sítí" Technická dokumentace 1/5 Úvod Tento dokument je nedílnou součástí zadávacích podmínek

Více

Tvorba DSD a kódovníků pro fiskální data z projektu OpenBudgets.eu Doplněná verze vyznačeno červeně

Tvorba DSD a kódovníků pro fiskální data z projektu OpenBudgets.eu Doplněná verze vyznačeno červeně Tvorba DSD a kódovníků pro fiskální data z projektu OpenBudgets.eu Doplněná verze vyznačeno červeně Prof. Ing. Vojtěch Svátek, Dr. Zimní semestr 2018 http://nb.vse.cz/~svatek/rzzw.html Základní info Předpoklad:

Více

Rozdílová tabulka návrhu právního předpisu České republiky s předpisy Evropské unie

Rozdílová tabulka návrhu právního předpisu České republiky s předpisy Evropské unie Rozdílová tabulka návrhu právního předpisu České republiky s předpisy Evropské unie VII. Navrhovaný právní předpis Odpovídající předpis EU Zákon, kterým se mění zákon č. Sb., o svobodném přístupu k informacím,

Více

MBI - technologická realizace modelu

MBI - technologická realizace modelu MBI - technologická realizace modelu 22.1.2015 MBI, Management byznys informatiky Snímek 1 Agenda Technická realizace portálu MBI. Cíle a principy technického řešení. 1.Obsah portálu - objekty v hierarchiích,

Více

PRŮZKUMNÍK ISDP NÁVOD K OBSLUZE INFORMAČNÍHO SYSTÉMU O DATOVÝCH PRVCÍCH (ISDP)

PRŮZKUMNÍK ISDP NÁVOD K OBSLUZE INFORMAČNÍHO SYSTÉMU O DATOVÝCH PRVCÍCH (ISDP) PRŮZKUMNÍK ISDP NÁVOD K OBSLUZE INFORMAČNÍHO SYSTÉMU O DATOVÝCH PRVCÍCH (ISDP) Obsah Úvod...2 Co je ISDP...2 Jaké jsou funkce ISDP...2 Slovník pojmů...2 Dílčí DP...2 DS...2 ISDP...2 JeDP...2 OS...2 SlDP...2

Více

Jak otevřené je zastupitelstvo Ústeckého kraje?

Jak otevřené je zastupitelstvo Ústeckého kraje? Jak otevřené je zastupitelstvo Ústeckého kraje? Nezbytnou podmínkou pro kvalitní fungování demokracie je dostupnost informací o činnosti zastupitelských sborů, jimiž jsou krajská zastupitelstva. Ta se

Více

SPECIFICKÁ PRAVIDLA PRO ŽADATELE A PŘÍJEMCE

SPECIFICKÁ PRAVIDLA PRO ŽADATELE A PŘÍJEMCE INTEGROVANÝ REGIONÁLNÍ OPERAČNÍ PROGRAM SPECIFICKÁ PRAVIDLA PRO ŽADATELE A PŘÍJEMCE SPECIFICKÝ CÍL 3.2 PRŮBĚŽNÁ VÝZVA Č. 10 PŘÍLOHA Č. 4 PRAVIDLA PRO VYDÁNÍ STANOVISKA ODBORU HLAVNÍHO ARCHITEKTA EGOVERNMENTU

Více

Metodický pokyn k uvedení registru do produkčního provozu

Metodický pokyn k uvedení registru do produkčního provozu Metodický pokyn k uvedení registru do produkčního provozu dokumentace Národního registru hrazených zdravotních služeb (NRHZS) autoři: Černek J., Blaha M. verze: 1.0 datum: 15. 1. 2018 Dokument je vytvořen

Více

Koncepce katalogizace otevřených dat VS ČR. (zkrácená verze)

Koncepce katalogizace otevřených dat VS ČR. (zkrácená verze) Koncepce katalogizace otevřených dat VS ČR (zkrácená verze) Praha, květen září 2012 Zpracovali: Dušan Chlapek Jan Kučera Martin Nečaský Fakulta informatiky a statistiky, Vysoká škola ekonomická v Praze

Více

Jak otevřené je zastupitelstvo Jihomoravského kraje?

Jak otevřené je zastupitelstvo Jihomoravského kraje? Jak otevřené je zastupitelstvo Jihomoravského kraje? Nezbytnou podmínkou pro kvalitní fungování demokracie je dostupnost informací o činnosti zastupitelských sborů, jimiž jsou krajská zastupitelstva. Ta

Více

Služby katastru nemovitostí. JiříPoláček

Služby katastru nemovitostí. JiříPoláček Služby katastru nemovitostí JiříPoláček Obsah prezentace 1. Současné formy poskytování údajů KN 2. RÚIAN a jeho datové zdroje 3. Další kroky při implementaci směrnice INSPIRE 4. Novela vyhlášky 162/2001

Více

RDF serializace Turtle

RDF serializace Turtle 4IZ440 Propojená data na webu RDF serializace Turtle Vyučující: Doc. Ing. Vojtěch Svátek, Dr. Zimní semestr 2016 http://nb.vse.cz/~svatek/rzzw.html Shrnutí obsahu a související zdroje Prezentace vychází

Více

Znalostní báze pro obor organizace informací a znalostí

Znalostní báze pro obor organizace informací a znalostí Znalostní báze pro obor organizace informací a znalostí Představení projektu Programu aplikovaného výzkumu a vývoje národní a kulturní identity (NAKI) DF13P01OVV013 2013 2015 Helena Kučerová ÚISK FF UK

Více

Otevřená data: zdroj příležitostí, nápadů a inovací pro Českou republiku ve 21. století

Otevřená data: zdroj příležitostí, nápadů a inovací pro Českou republiku ve 21. století #opendatacz Otevřená data: zdroj příležitostí, nápadů a inovací pro Českou republiku ve 21. století Aneb Jak v Česku otevíráme data Michal Kubáň 7.11. 2015, Brno Konference Open Alt 2015 Fond Otakara Motejla

Více

Jak otevřené je zastupitelstvo Zlínského kraje?

Jak otevřené je zastupitelstvo Zlínského kraje? Jak otevřené je zastupitelstvo Zlínského kraje? Nezbytnou podmínkou pro kvalitní fungování demokracie je dostupnost informací o činnosti zastupitelských sborů, jimiž jsou krajská zastupitelstva. Ta se

Více

GEOINFOSTRATEGIE AKTUÁLNÍ STAV

GEOINFOSTRATEGIE AKTUÁLNÍ STAV GEOINFOSTRATEGIE AKTUÁLNÍ STAV Radek Horáček MV ČR Odbor egovernmentu GEOINFOSTRATEGIE V POLOČASE CO SE UDĚLALO CO DĚLÁME DNES CO BUDE V ROCE 2020 GEOINFOSTRATEGIE Současný stav (východiska, informační

Více

Garant karty projektového okruhu:

Garant karty projektového okruhu: Karta projektového okruhu Číslo a název projektového okruhu: Garant karty projektového okruhu: Spolupracující subjekty: 3.5 Elektronizace odvětví: eeducation Ministerstvo školství, mládeže a tělovýchovy

Více

INFORMACE ČLENŮM VLÁDY

INFORMACE ČLENŮM VLÁDY II. INFORMACE ČLENŮM VLÁDY V roce 2011 přistoupila Česká republika k mezinárodní iniciativě Partnerství pro otevřené vládnutí (Open Government Partnership, OGP) usnesením vlády ze dne 14. září 2011 č.

Více

Informace o aktuálním dění v oblasti otevřených dat v ČR

Informace o aktuálním dění v oblasti otevřených dat v ČR Informace o aktuálním dění v oblasti otevřených dat v ČR Martin Tajtl Ministerstvo vnitra Odbor Hlavního architekta egovernmentu Obsah 1. Co se doposud povedlo 2. Připravovaná legislativa 3. Plány MV ČR

Více

Jak otevřené je zastupitelstvo Kraje Vysočina?

Jak otevřené je zastupitelstvo Kraje Vysočina? Jak otevřené je zastupitelstvo Kraje Vysočina? Nezbytnou podmínkou pro kvalitní fungování demokracie je dostupnost informací o činnosti zastupitelských sborů, jimiž jsou krajská zastupitelstva. Ta se výrazně

Více

Provozní dokumentace. Seznam datových schránek. Datové soubory. Vytvořeno dne: 29. 4. 2013 Aktualizováno: 2.5.2013 Verze: 1.

Provozní dokumentace. Seznam datových schránek. Datové soubory. Vytvořeno dne: 29. 4. 2013 Aktualizováno: 2.5.2013 Verze: 1. Provozní dokumentace Seznam datových schránek Datové soubory Vytvořeno dne: 29. 4. 2013 Aktualizováno: 2.5.2013 Verze: 1.1 2013 MVČR Obsah Datové soubory s údaji držitelů datových schránek 1 Úvod...3 1.1

Více

Praha na cestě k Open datům. Jiří Čtyroký Institut plánování a rozvoje hl. m. Prahy

Praha na cestě k Open datům. Jiří Čtyroký Institut plánování a rozvoje hl. m. Prahy Praha na cestě k Open datům Jiří Čtyroký Institut plánování a rozvoje hl. m. Prahy Otevřená data? 1. Transparentnost veřejné správy kvalitní informace kontrola rozhodování důvěra 2. Podpora přípravy investic

Více