Co jsou otevřená propojená data? Martin Nečaský Matematicko-fyzikální fakulta Univerzita Karlova v Praze 1
Co jsou otevřená propojená data? Zdroj : http://5stardata.info 2
Co jsou otevřená propojená data? Kontrolní akce CISLO PREDMET ZAHAJENI 2012/33 Peněžní prostředky určené 2012/11 2012/34 Účetní závěrka a finanční... 2012/11 Kontrolované osoby OSOBA IC OKRES KA? Ministerstvo obrany 60162694 Praha 2012/33 ČSSZ 6963 Praha 2012/34 3
Principy propojených dat 1. princip: Pojmenovávejte věci pomocí URI. Kontrolní akce CISLO PREDMET ZAHAJENI http://data.nku.cz/akce/2012/33 2012/33 Peněžní prostředky určené 2012/11 2012/34 Účetní závěrka a finanční... 2012/11 http://data.nku.cz/akce/2012/34 Kontrolované osoby OSOBA IC OKRES KA Ministerstvo obrany 60162694 Praha 2012/33 ČSSZ 6963 Praha 2012/34 http://data.nku.cz/osoba/60162694 http://data.nku.cz/osoba/6963 http://data.nku.cz/okres/praha 4
Principy propojených dat 2. princip: Používejte HTTP URI a umožněte tak věci vyhledávat v prostředí WWW. HTTP GET "http://data.nku.cz/akce/2012/33 WWW http://data.nku.cz/akce/2012/33 5
Principy propojených dat 3. princip: Pokud někdo vyhledá URI, poskytněte mu údaje o příslušné věci ve formátu RDF. Kontrolní akce CISLO PREDMET ZAHAJENI 2012/33 Peněžní prostředky určené 2012/11 "2012/33" cislo "2012/11" zahajeni Vyjádření v RDF formátu (notace Turtle) http://data.nku.cz/akce/2012/33 predmet "Peněžní prostředky určené " <http://data.nku.cz/akce/2012/33> cislo "2012/33". <http://data.nku.cz/akce/2012/33> predmet "Peněžní prostředky určené ". <http://data.nku.cz/akce/2012/33> zahajeni "2012/11". 6
Principy propojených dat 3. princip: Pokud někdo vyhledá URI, poskytněte mu údaje o příslušné věci ve formátu RDF. Volitelně nabídněte SPARQL API. HTTP GET SPARQL dotaz SPARQL API (SPARQL endpoint) NKÚ RDF databáze HTTP GET "http://data.nku.cz/... Přístup k HTTP URI 7
Principy propojených dat 4. princip: Mezi údaji poskytněte i odkazy na URI souvisejících věcí. <http://data.nku.cz/akce/2012/33> cislo "2012/33" ; predmet "Peněžní prostředky určené " ; zahajeni "2012/11" ; osoba <http://data.nku.cz/osoba/60162694>. <http://data.nku.cz/osoba/60162694> nazev "Ministerstvo obrany" ; okres <http://data.nku.cz/okres/praha>. "2012/33" "2012/11" http://data.nku.cz/akce/2012/33 "Peněžní prostředky určené " cislo zahajeni predmet osoba http://data.nku.cz/osoba/60162694 "Ministerstvo obrany" okres <http://data.nku.cz/okres/praha> nazev "Praha". "Praha" http://data.nku.cz/okres/praha 8
Principy propojených dat 4. princip: Mezi údaji poskytněte i odkazy na URI souvisejících věcí (včetně URI jiných poskytovatelů). http://data.nku.cz/akce/2012/33 osoba odpovídá http://data.mfcr.cz/ares/osoba/60162694 http://data.nku.cz/osoba/60162694 okres http://data.nku.cz/okres/praha okres http://data.cuzk.cz/ruian/okres/3100 9
Principy propojených dat 4. princip: Mezi údaji poskytněte i odkazy na URI souvisejících věcí (včetně URI jiných poskytovatelů). Vláda ČR IS Vědy a výzkumu MFČR ARES ČOI Kontroly a kontrolované osoby NKÚ Kontrolní akce a kontrolované osoby ČÚZK RÚIAN ČSSZ Důchodové statistiky ČSÚ Demografie 10
Slovníky a ontologie <http://data.nku.cz/akce/2012/33> cislo "2012/33" ; predmet "Peněžní prostředky určené " ; zahajeni "2012/11" ; osoba <http://data.nku.cz/osoba/60162694>. <http://data.nku.cz/akce/2012/33> a schema:checkaction, nku:kontrolniakce ; adms:identifier "2012/33" ; schema:object "Peněžní prostředky určené " ; schema:startdate "2012/11" ; nku:osoba <http://data.nku.cz/osoba/60162694>. Vlastnosti nejsou určeny řetězcem, ale pomocí HTTP URI, stejně jako ostatní věci. Věci jsou přiřazovány do tříd (= kategorií věcí), které jsou také určeny pomocí HTTP URI. Třídy a vlastnosti jsou definovány pomocí tzv. slovníků (někdy zvaných ontologie) Dublin Core Vocabulary Schema.org Data Cube Vocabulary schema:object = <http://schema.org/object> nku:kontrolniakce = <http://data.nku.cz/slovnik/kontrolniakce> 11
Slovníky a ontologie Měli bychom co nejvíce používat třídy a vlastnosti definované existujícími slovníky. Někdy je ale vhodné nebo nutné zavést vlastní třídy či vlastnosti, tj. definovat vlastní slovník. Při definici vlastního slovníku je zásadní vysvětlit sémantiku (význam) nových tříd a vlastností pomocí existujících slovníků tam, kde je to možné. nku:kontrolniakce a owl:class ; rdfs:label "Kontrolní akce NKÚ"@cs, "Check action of Supreme Audit Office of Czech Republic"@en ; rdfs:subclassof schema:checkaction. 12
4 vs 5 URI pro pojmenování věcí Data poskytována ve formátu RDF Propojená data 13
Děkuji za pozornost 14