Publikace otevřených propojených dat v prostředí ČSSZ

Podobné dokumenty
Otevřená data ČSSZ: Přehledné informace dostupné všem, snadno a zdarma. Ing. Jiří Šunka Ing. Michaela Hendrychová. ISSS Hradec Králové, 5. 4.

Rok a půl otevřených dat ČSSZ

Publikace dat důchodové statistiky v podobě otevřených propojených dat

Tvorba DSD a kódovníků pro fiskální data z projektu OpenBudgets.eu

Tvorba DSD a kódovníků pro fiskální data z projektu OpenBudgets.eu Doplněná verze vyznačeno červeně

Standardy publikace a katalogizace otevřených dat

Návrh metodiky popisu a prezentace dat důchodové statistiky ve formátu otevřených propojitelných dat a návrh typové architektury IT řešení

Publikační databáze. Září Vysoká škola ekonomická v Praze

OTEVŘENÁ DATA ČSSZ INFORMAČNÍ TECHNOLOGIE HISTORIE OTEVŘENÝCH DAT CO JSOU OTEVŘENÁ DATA. Ing. JIŘÍ ŠUNKA

Specializovaná mapa s interpretací regionálních rozdílů v oblasti sociálního výzkumu

Standardy publikace a katalogizace otevřených dat. Dušan Chlapek David Hemala

Praktické zkušenosti s naplňováním registrů ČSSZ

PŘEDSTAVENÍ ČSSZ. prof. JUDr. Vilém Kahoun, Ph.D. ústřední ředitel ČSSZ. Lednice na Moravě ČESKÁ SPRÁVA SOCIÁLNÍHO ZABEZPEČENÍ

Otevřená data. Shrnutí. Když stavím nový IS nebo upravuji existující, co musím udělat, abych byl Open Data Ready? Prosinec 2018

Otev ená data Českého statistického ú adu

Metodika publikace otevřených a propojitelných dat

Automatizovatelná aktualizace Wikidata z veřejných databází. Jakub Klímek

TÉMA 1. Historie otevřených dat Charakteristika Otevřená data v ČSSZ

Webová prezentační aplikace

Otevřená data veřejné správy

Otevřená data ve veřejné správě ČR Tomáš Kroupa, Ministerstvo vnitra - Odbor Hlavního architekta egovernmentu

MBI - technologická realizace modelu

ČINNOST ČSSZ V ROCE 2011

Výzvy využívání otevřených dat v ČR

RDF a RDF Query. Jakub Nerad 1. prosince Nerad () RDF a RDF Query 1. prosince / 16

Otevřená data ve veřejné správě , Mikulov. Tomáš Kroupa, Ministerstvo vnitra - Odbor hlavního architekta egovernmentu

Elektronizace agendy a ČSSZ, eportál pomocník klientů ČSSZ. Ing. Karel Chod Náměstek ústředního ředitele ČSSZ

Otevřená a propojitelná data ve veřejné správě Národní katalog otevřených dat

Jaká data veřejné správy ČR jsou otevřená?

Informace o aktuálním dění v oblasti otevřených dat v České republice

Výměnný formát XML DTM DMVS PK

Integrovaný informační portál MPSV a ČSSZ. Rostislav Čevela, Libuše Čeledová

Otevřená data nejen ve vzdělávání

SPARQL.

Aktuální dění v oblasti otevřených dat v ČR

Veřejná databáze ČSÚ (VDB) a vizualizace demografických údajů

Aktuální výzvy a novinky v oblasti otevřených dat v České republice

Marketingová komunikace. 3. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK3PH (vm3bph)

Jak používat statistiky položkové v systému WinShop Std.

Informace o aktuálním dění v oblasti otevřených dat v ČR

Setkání po roce aneb Kam jsme pokročili v otevřených datech

D. Chlapek, J. Kučera, M. Nečaský: Principy a technologie otevřených dat a jejich využití v managementu

Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph)

STÁTNÍ POKLADNA. Integrovaný informační systém Státní pokladny (IISSP)

Otevřená data veřejné správy

OTEVŘENÁ DATA v České republice a v zahraničí Michal Kubáň Národní koordinátor otevřených dat Odbor hlavního architekta egovernmentu (MV ČR)

KOMPONENTY APLIKACE TreeINFO. Petr Štos ECM Business Consultant

Elektronické dokumenty v ČSSZ Document Management

Datový slovník. Datum vyhlášení :00:00. Platnost od data. Platnost do data. Název oblasti datových prvků. Verze 102

OBSAH ZÁKON O ORGANIZACI A PROVÁDĚNÍ SOCIÁLNÍHO ZABEZPEČENÍ

Co jsou otevřená data?

Seminář ČSSI: Otevřená a propojitelná data

Jak vytvořit správné Zadání IS

Národní technické specifikace. služeb nad prostorovými daty a metadaty

Sémantický web 10 let poté

Standardy publikace a katalogizace otevřených dat

RDF DSPS ROZVOJ PORTÁLU

Marketingová komunikace. 2. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK1aPH/N9KMK1bPH (um1a1ph/um1b1ph)

Business Intelligence nástroje a plánování

Obsah. 1. Co jsou otevřená data 2. Aktivity v oblasti otevřených dat v ČR 3. Přínosy a výzvy využívání otevřených dat v ČR

ÚZEMNĚ ANALYTICKÉ PODKLADY. Ing. Jitka Olševičová Ing. Tomáš Prokop

Analýza podkladů pro návrh datového VF XML DTM DMVS

Praktické zkušenosti s řízením projektů otevřených dat Dobrá / špatná praxe

Hodnocení výsledků výzkumu, vývoje a inovací, jejich evidence a správa v. Jiří Stöhr

Sekce sociálně pojistných systémů

Jak budeme řešit otevřená data ve veřejné správě? Michal Rada Ministerstvo vnitra ČR

Výroční zpráva za rok 2010 o činnosti Ministerstva práce a sociálních věcí. v oblasti poskytování informací

Vize propojení zdravotního pojištění a sociálního systému. RNDr. Jiří Schlanger 1. lékařská fakulta, Univerzita Karlova v Praze

4IZ440 Propojená data na webu Organizační úvod

Stručný obsah. K2118.indd :15:27

Novinky e - Podání v ČSSZ

ZPRÁVA O ČINNOSTI ČSSZ V OBLASTI POSKYTOVÁNÍ INFORMACÍ ZA ROK podle zákona č. 106/1999 Sb., o svobodném přístupu k informacím, v platném znění

Elektronická podatelna a výpravna České správy sociálního zabezpečení v návaznosti na systém datových schránek

Analýza staročeské morfologie v Excelu

Základní instituce sociálního zabezpečení v ČR a jejich struktura

PŘÍLOHA C Požadavky na Dokumentaci

Formy komunikace s knihovnami

Geografické podklady Zeměměřického úřadu pro státní správu a samosprávu

Ontologie v e-commerce

Co jsou otevřená propojená data?

Metadata a Geoportál ČÚZK. Ing. Petr Dvořáček Ing. Bohumil Vlček Zeměměměřický úřad

Kancelář zdravotního pojištění I Health Insurance Bureau

Přehled činnosti f.foresta SG Databázové aplikace pro lesnictví

1 Webový server, instalace PHP a MySQL 13

PRŮZKUMNÍK ISDP NÁVOD K OBSLUZE INFORMAČNÍHO SYSTÉMU O DATOVÝCH PRVCÍCH (ISDP)

Veřejné databáze ČSÚ

Linked Data a jazyk RDF

Rubrika Zajímavostí ze zahraničního obchodu končí, ostatní zdroje získávání dat zůstávají

Metadata. MI-DSP 2013/14 RNDr. Ondřej Zýka,

UŽIVATELSKÁ PŘÍRUČKA K INTERNETOVÉ VERZI REGISTRU SČÍTACÍCH OBVODŮ A BUDOV (irso 4.x) VERZE 1.0

OpenData.cz. Jan Kučera. Otevřená data v České republice. Otevřené repositáře

Expresní analýza PLM. jako efektivní start implementace PLM.

Personalisté, personální manažeři, mzdové účetní, vedoucí a ředitelé jednotlivých úseků firem.

Výtisk č.: Počet listů 9. Přílohy: 0 ÚZIS ČR

eslužby ČSSZ URČENÉ ZAMĚSTNAVATELŮM

ZPRÁVA O ČINNOSTI ČSSZ V OBLASTI POSKYTOVÁNÍ INFORMACÍ ZA ROK podle zákona č. 106/1999 Sb., o svobodném přístupu k informacím, v platném znění

Jádrem systému je modul GSFrameWork, který je poskytovatelem zejména těchto služeb:

Databázové systémy. Doc.Ing.Miloš Koch,CSc.

Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová. 5. Statistica

INTERAKTIVNÍ PUBLIKACE pro smartphony a tablety

Transkript:

Publikace otevřených propojených dat v prostředí ČSSZ Otevřená propojená data veřejné správy ČR - příklady dobré praxe NKÚ, Praha 7, 19. 2. 2016 Ing. Jiří Šunka Ing. Martina Jandová Ing. Marek Novák

Obsah 1. Představení ČSSZ 2. Jak jsme začínali s otevřenými daty 3. Ukázka řešení katalogu otevřených dat ČSSZ a jejich vizualizace 4. Příprava dat k publikaci ve formátu propojených dat 5. Shrnutí 2

Představení ČSSZ - Profil ČSSZ působnost v oblasti sociálního zabezpečení (důchodového a nemocenského pojištění) a lékařské posudkové služby organizační složka státu v rezortu Ministerstva práce a sociálních věcí ČR celkový objem příjmů a výdajů v částce 804 miliard Kč za rok 2015 8,6 milionu klientů (počet obyvatel ČR - 10,5 milionu) 2,9 milionu důchodců 8 690 zaměstnanců 3

Představení ČSSZ - Hlavní činnosti provádění důchodového pojištění (DP) rozhodování o nároku na důchod a jeho výši realizace výplat důchodů rozhodování o námitkách provádění nemocenského pojištění (NP) výplata dávek NP kontrola dodržování léčebného režimu výběr pojistného na sociální zabezpečení objem vybraného pojistného => 1/3 státního rozpočtu ČR lékařská posudková služba styčné místo vůči zahraničním institucím 4

Představení ČSSZ - Sociální zabezpečení prováděné ČSSZ 5

Jak jsme začínali Hlavní kroky: Spolupráce ČSSZ s VŠE na Projektu TD020121 Publikace dat statistických ročenek ve standardu otevřených dat 01.2014 06.2015 Smluvní zajištění expertní podpory 04.2015 Návrh a příprava technického prostředí 05.2015 09.2015 Příprava a vydání organizační směrnice 05.2015 10.2015 Výběr dat k publikaci 05.2015 07.2015 Vyhodnocení bezpečnostních hledisek 08.2015 Publikace dat 2.11.2015 Interaktivní vizualizace 22.12.2015 6

Jak jsme začínali - expertní podpora Smluvní zajištění expertní podpory pro oblast: Metodiky Technického řešení Organizace přípravy a procesu publikace otevřených dat Bezpečnosti Publikace dat Interaktivních vizualizací 7

Jak jsme začínali technické prostředí Technické prostředí: Výchozí návrh vycházel z nástrojů UnifiedViews, CKAN, Openlink Virtuoso Modifikace podle standardů IIS ČSSZ Publikovaný formát primárně propojená data v RDF, doplňkově v CSV Finální řešení Dvě hlavní prostředí testovací a produkční Příprava dat UnifiedViews, CKAN, Openlink Virtuoso Publikace LifeRay, databáze Apache Jena Fuseki, vlastní řešení katalogu dat, Google Charts pro vizualizaci Umožněno automatické předávání na NKOD Další rozvoj Automatizované přenosy mezi přípravou a portálem Schvalovací workflow Optimalizace procesů 8

Jak jsme začínali organizační zajištění Organizační zajištění: Příprava organizační směrnice Nutnost organizačního ukotvení procesů v rámci činnosti organizace Definice rolí Stanovení rolí, jejich kompetencí a odpovědností v procesu publikace otevřených dat Zapojení věcných útvarů Aktivní spolupráce s odbornými útvary vlastníky dat Připomínky oddělení komunikace Spolupráce na tvorbě vzhledu katalogu a vizualizace dat 9

Jak jsme začínali výběr dat Výběr dat k publikaci: Bezpečná data již publikována na stránkách ČSSZ : 154 datových sad Po vyloučení nevhodných sad k publikaci : 84 datových sad Po posouzení přínosů a rizik a odložení k řešení : 62 datových sad Do plánu publikace zařazeno : 62 datových sad 62 Datové sady 70 Vyloučeno Odloženo K publikaci 22 10

Jak jsme začínali - Vyhodnocení přínosů a rizik Přínosy (P1) Posílení transparentnosti veřejné správy (P2) Podpora opětovného použití dat (P3) Zlepšení vnímání veřejné správy veřejností (P4) Zlepšení procesů a dat veřejné správy, zlepšení komunikace a spolupráce veřejné správy (P5) Snížení počtu dotazů dle zákona č. 106/1999 Sb. Rizika (R1) Zveřejnění dat v rozporu se zákonem (R2) Ohrožení bezpečnosti státu / majetku / osob (R3) Riziko porušení ochrany osobních údajů a dobrého jména (R4) Zveřejnění nevhodných dat či informací (R5) Překrývání dat 11

Jak jsme začínali publikace dat Publikační plán: 2. 11. 2015 18 datových sad statistické ročenky statistika informací poskytovaných podle zákona č. 106/1999 Sb. 03/2016 14 datových sad oblast LPS oblast OSVČ oblast správního řízení 12/2016 30 datových sad různé okruhy dat 70 60 50 40 30 20 10 0 4. Q 2015 1. Q 2016 2. Q 2016 3. Q 2016 4. Q 2016 12

Jak jsme začínali interaktivní vizualizace Interaktivní vizualizace: Základní typy grafů spojnicový, sloupcový, koláčový, mapy (kraj, okres) Business Process Vizualizace Vstupní data z databáze RDF Výběrové filtry na data Business Process Vizualizace Návrh vizualizace Zobrazení grafu nebo tabulky dat RDF nastavení filtrů databáze Export dat grafu do CSV Příprava SPARQL Export grafu do PNG Upřesňující komentáře Vizualizace Grafický návrh Komponenta Google Charts Ladění vizualizace Tabulka (CSV) Graf (PNG) Zveřejnění vizualizace 13

Otevřená data ČSSZ https://data.cssz.cz/ 14

Otevřená data ČSSZ https://data.cssz.cz/ 15

Otevřená data ČSSZ https://data.cssz.cz/ 16

Otevřená data ČSSZ https://data.cssz.cz/ 17

Otevřená data ČSSZ https://data.cssz.cz/ 18

Interaktivní vizualizace nad RDF databází Typy interaktivních grafů Další 19

Počet důchodců v krajích ČR 20

Počet nově přiznaných invalidních důchodů v České republice 21

Počet důchodců v okresech ČR 22

Průměrná délka pobírání starobního důchodu 23

Postup publikace Pohovor s vlastníkem dat Analýza zdrojových souborů Analýza datové sady Příprava vstupních dat pro transformaci Tvorba HTML dokumentace Sestavení transformačního procesu Vygenerování výstupních souborů Publikace dat 24

Pojmy UnifiedViews software pro transformaci dat a přípravu jejich publikace ve formátu otevřených dat Pipeline automatizovaný proces k přípravě dat DPU (Data processing unit) krabička na zpracování dat RDF (Resource Description Framework) grafový formát otevřených dat CSV (Comma-separated values) tabulkový formát, kde jsou hodnoty oddělené čárkami SPARQL dotazovací jazyk nad daty ve formátu RDF CKAN katalog pro otevřená data nadace Open Knowledge Foundation Datová kostka obecný statistický pojem pro vícedimenzionální data a pro publikaci standardu W3C v RDF podobě slovníku Dimenze data, pomocí kterých jsou jednotlivá pozorování klasifikována; např. druh důchodu, pohlaví, území, čas Měření data o sledovaných jevech; např. počet důchodců, průměrná výše důchodu, průměrný věk apod. 25

Prostředí UnifiedViews 26

Datová sada Počet podaných ELDP Definice struktury datové kostky Transformace Číselník roků Vstupní XLS Metadata Číselník způsobu podání ELDP RDF slovník a CSV schéma Katalogizace (CKAN) RDF CSV Další 27

#108_Pocet-podanych-ELDP.xlsx Další 28

Definice struktury datové kostky @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>. @prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#>. @prefix xsd: <http://www.w3.org/2001/xmlschema#>. @prefix interval: <http://reference.data.gov.uk/def/intervals/>. @prefix dcterms: <http://purl.org/dc/terms/>. @prefix qb: <http://purl.org/linked-data/cube#>. @prefix cssz: <https://data.cssz.cz/ontology/>. @prefix cssz-dimension: <https://data.cssz.cz/ontology/dimension/>. @prefix cssz-measure: <https://data.cssz.cz/ontology/measure/>. @prefix cssz-dsd: <https://data.cssz.cz/resource/data-structure-definition/>. @prefix cssz-dataset: <https://data.cssz.cz/resource/dataset/>. cssz-dataset:pocet-podanych-eldp a qb:dataset ; dcterms:title "Počet podaných ELDP"@cs ; rdfs:label "Počet podaných ELDP"@cs ; dcterms:description "Statistika počtu podaných evidenčních listů důchodového pojištění za jednotlivé roky v rozlišení na papírové podání a e-podání"@cs ; rdfs:comment "Statistika počtu podaných evidenčních listů důchodového pojištění za jednotlivé roky v rozlišení na papírové podání a e-podání"@cs ; dcterms:publisher <http://www.cssz.cz> ; qb:structure cssz-dsd:pocet-podanych-eldp. cssz-dsd:pocet-podanych-eldp a qb:datastructuredefinition ; rdfs:label "Definice struktury datové kostky Počet podaných ELDP"@cs ; qb:component [ qb:dimension cssz-dimension:rok ; qb:order 1 ; rdfs:label "Rok"@cs ] ; qb:component [ qb:dimension cssz-dimension:zpusob-podani-eldp ; qb:order 2 ; rdfs:label "Způsob podání ELDP"@cs ] ; qb:component [ qb:measure cssz-measure:pocet-podanych-eldp ; rdfs:label "Počet podaných ELDP"@cs ]. 29

Vstupní XLS 30

Transformace 31

Vytvořit základní RDF reprezentaci (1/2) 32

Vytvořit základní RDF reprezentaci (2/2) 33

#108_Pocet-podanych-ELDP.xlsx 34

Debug - Output 35

Převést na datovou kostku PREFIX qb: PREFIX xsd: PREFIX cssz-dimension: PREFIX cssz-measure: PREFIX tabular: PREFIX temp: PREFIX ds: <http://purl.org/linked-data/cube#> <http://www.w3.org/2001/xmlschema#> <https://data.cssz.cz/ontology/dimension/> <https://data.cssz.cz/ontology/measure/> <http://unifiedviews.eu/ontology/t-tabular/> <https://data.cssz.cz/resource/temp/> <https://data.cssz.cz/resource/dataset/pocet-podanych-eldp> CONSTRUCT {?oepodani a qb:observation ; qb:dataset ds: ; cssz-dimension:rok?rokuri ; cssz-dimension:zpusob-podani-eldp <https://data.cssz.cz/resource/ciselniky/zpusob-podanieldp/epodani> ; cssz-measure:pocet-podanych-eldp?epodani.?otiskopisy a qb:observation ; qb:dataset ds: ; cssz-dimension:rok?rokuri ; cssz-dimension:zpusob-podani-eldp <https://data.cssz.cz/resource/ciselniky/zpusob-podanieldp/tiskopisy> ; cssz-measure:pocet-podanych-eldp?tiskopisy. } WHERE {?row a tabular:row ; temp:epodani?epodani1 ; temp:tiskopisy?tiskopisy1 ; temp:rok?rok1. BIND(STRBEFORE(?rok1, ".0") as?rok) BIND(STRDT(STRBEFORE(?epodani1, ".0"), xsd:integer) as?epodani) BIND(STRDT(STRBEFORE(?tiskopisy1, ".0"), xsd:integer) as?tiskopisy) BIND (IRI(CONCAT("https://data.cssz.cz/resource/reference.data.gov.uk/id/gregorian-year/", STRBEFORE(?rok1, ".0"))) as?rokuri) BIND (IRI(CONCAT("https://data.cssz.cz/resource/observation/zpusob-podani-eldp/", STRBEFORE(?rok1, ".0"), "/epodani")) as?oepodani) BIND (IRI(CONCAT("https://data.cssz.cz/resource/observation/zpusob-podani-eldp/", STRBEFORE(?rok1, ".0"), "/tiskopisy")) as?otiskopisy) } 36

Debug - Output 37

Číselník roků 38

Vygenerovat číselník roků PREFIX skos: PREFIX y-onto: PREFIX sdmx: PREFIX owl: <http://www.w3.org/2004/02/skos/core#> <https://data.cssz.cz/ontology/years/> <http://purl.org/linked-data/sdmx#> <http://www.w3.org/2002/07/owl#> CONSTRUCT { y-onto:yearsscheme a skos:conceptscheme, sdmx:codelist ; skos:preflabel "Codelist of used years"@en, "Číselník použitých let"@cs.?o a skos:concept ; skos:preflabel?rok ; skos:notation?rok ; owl:sameas?sameas ; skos:inscheme y-onto:yearsscheme. } WHERE {?s <https://data.cssz.cz/ontology/dimension/rok>?o BIND (REPLACE(str(?o),"[^0-9]*([0-9]{4})$", "$1") as?rok) BIND (IRI(CONCAT("http://reference.data.gov.uk/id/gregorian-year/", STRAFTER(STR(?o),"https://data.cssz.cz/resource/reference.data.gov.uk/id/ gregorian-year/"))) as?sameas) } 39

uv-t-rdftofiles 40

Uložit soubory s číselníky 41

Nahrát do Virtuoso číselník pro roky 42

Číselník způsobu podání ELDP @prefix skos: <http://www.w3.org/2004/02/skos/core#>. <https://data.cssz.cz/resource/ciselniky/zpusob-podanieldp/conceptscheme> a skos:conceptscheme ; skos:preflabel "Číselník způsobů podání ELDP"@cs. <https://data.cssz.cz/resource/ciselniky/zpusob-podani-eldp/epodani> a skos:concept ; skos:preflabel "epodání"@cs ; skos:notation "epodani" ; skos:inscheme <https://data.cssz.cz/resource/ciselniky/zpusob-podanieldp/conceptscheme>. <https://data.cssz.cz/resource/ciselniky/zpusob-podani-eldp/tiskopisy> a skos:concept ; skos:preflabel "Tiskopisy"@cs ; skos:notation "tiskopisy" ; skos:inscheme <https://data.cssz.cz/resource/ciselniky/zpusob-podanieldp/conceptscheme>. 43

RDF slovník a CSV schéma 44

Vocabulary @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>. @prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#>. @prefix qb: <http://purl.org/linked-data/cube#>. @prefix cssz-measure: <https://data.cssz.cz/ontology/measure/>. @prefix cssz-dimension: <https://data.cssz.cz/ontology/dimension/>. @prefix y-onto: <https://data.cssz.cz/ontology/years/>. <https://data.cssz.cz/resource/dataset/pocet-podanych-eldp/vocabulary> { cssz-dimension:rok a rdf:property, qb:dimensionproperty, qb:codedproperty ; rdfs:label "Rok"@cs ; rdfs:comment "Rok"@cs ; rdfs:subpropertyof cssz-dimension:refperiod ; qb:codelist y-onto:yearsscheme. cssz-dimension:zpusob-podani-eldp a rdf:property, qb:dimensionproperty, qb:codedproperty ; rdfs:label "Způsob podání ELDP"@cs ; rdfs:comment "Způsob podání evidenčních listů důchodového pojištění"@cs ; qb:codelist <https://data.cssz.cz/resource/ciselniky/zpusob-podanieldp/conceptscheme>. cssz-measure:pocet-podanych-eldp a rdf:property, qb:measureproperty ; rdfs:label "Počet podaných ELDP"@cs ; rdfs:comment "Počet podaných evidenčních listů důchodového pojištění"@cs. } 45

Schema pro CSV { "fields": [ { "name": "rok", "title": "Rok", "type": "integer", "description": "Toto pole obsahuje rok" }, { "name": "zpusob_podani_eldp_kod", "title": "Kód způsobu podání ELDP", "type": "default", "description": "Kód způsobu podání ELDP" }, { "name": "zpusob_podani_eldp", "title": "Způsob podání ELDP", "type": "default", "description": "Způsob podání ELDP" }, { "name": "pocet_podanych_eldp", "title": "Počet podaných ELDP", "type": "integer", "description": "Počet podaných ELDP" } ], "primarykey": [ "rok", "zpusob_podani_eldp_kod" ] } 46

Uložit soubor se slovníkem 47

Nahrát slovník do Virtuoso 48

RDF 49

Data do RDF souboru 50

Uložit soubor s daty 51

Nahrát data do Virtuoso 52

CSV 53

Vytvořit CSV PREFIX qb: PREFIX dcterms: PREFIX skos: PREFIX cssz-dimension: PREFIX cssz-measure: <http://purl.org/linked-data/cube#> <http://purl.org/dc/terms/> <http://www.w3.org/2004/02/skos/core#> <https://data.cssz.cz/ontology/dimension/> <https://data.cssz.cz/ontology/measure/> PREFIX ds: <https://data.cssz.cz/resource/dataset/pocet-podanych-eldp> SELECT?rok?zpusob_podani_eldp_kod?zpusob_podani_eldp?pocet_podanych_eldp WHERE {?observation a qb:observation ; qb:dataset ds: ; cssz-dimension:rok/skos:preflabel?rok; cssz-dimension:zpusob-podani-eldp/skos:preflabel?zpusob_podani_eldp; cssz-dimension:zpusob-podani-eldp/skos:notation?zpusob_podani_eldp_kod ; cssz-measure:pocet-podanych-eldp?pocet_podanych_eldp. } 54

Uložit CSV 55

Metadata 56

Metadata datové sady (1/4) 57

Metadata datové sady (2/4) 58

Metadata datové sady (3/4) 59

Metadata datové sady (4/4) 60

Klasifikace dle EuroVoc 61

Metadata RDF distribuce (1/2) 62

Metadata RDF distribuce (2/2) 63

Metadata CSV distribuce (1/2) 64

Metadata CSV distribuce (2/2) 65

Metadata do RDF souboru 66

Uložit soubor s metadaty 67

Nahrát metadata do Virtuoso 68

Katalogizace (CKAN) 69

Nahrát do CKAN 70

Prostředí CKAN 71

Stáhnout JSON záznam ze CKAN 72

Datová sada Počet podaných ELDP 73

Výstupní soubory pocet-podanych-eldp.trig pocet-podanych-eldp-vocabulary.trig pocet-podanych-eldp.csv pocet-podanych-eldp-schema.json pocet-podanych-eldp-metadata.trig pocet-podanych-eldp-package_show.json 74

Počet podaných ELDP vs. Ročenka 2014 (příprava) 34 DPU 92 DPU 75

Shrnutí výhody automatizace Výhody automatizace Snadný převod do formátu RDF i obtížných zdrojů (formátované XLS) Udržení pořádku při přípravě dat Možnost publikace dat ve více formátech RDF, CSV Opakovatelnost spouštění při průběžných aktualizacích datových sad Dokumentování transformace dat Tvorba vzorů pro převody Jedno místo pořizování metadat 76

Shrnutí kritické faktory úspěšnosti Kritické faktory úspěšnosti: Podpora vedení Expertní podpora Úzká spolupráce s věcnými útvary Podpora útvaru informatiky Lidské zdroje 77

Děkujeme za pozornost Ing. Jiří Šunka jiri.sunka@cssz.cz Ing. Martina Jandová martina.jandova@cssz.cz Ing. Marek Novák marek.novak@cssz.cz