Modelování a odvozování v RDFS

Podobné dokumenty
Ontologie. Otakar Trunda

Ontologie a OWL. Prof. Ing. Vojtěch Svátek, Dr. Zimní semestr

Metody tvorby ontologií a sémantický web. Martin Malčík, Rostislav Miarka

Aplikace s odvozováním nad ontologiemi

Modely datové. Další úrovní je logická úroveň Databázové modely Relační, Síťový, Hierarchický. Na fyzické úrovni se jedná o množinu souborů.

Logika pro sémantický web

Sémantický Web RDF(S)

Petr Křemen. Katedra kybernetiky, FEL ČVUT. Petr Křemen (Katedra kybernetiky, FEL ČVUT) Sémantické sítě a rámce 1 / 112

Deskripční logika. Petr Křemen FEL ČVUT. Petr Křemen (FEL ČVUT) Deskripční logika 37 / 157

Relační databázový model. Vladimíra Zádová, KIN, EF, TUL- DBS

Tvorba DSD a kódovníků pro fiskální data z projektu OpenBudgets.eu Doplněná verze vyznačeno červeně

Informační systémy 2008/2009. Radim Farana. Obsah. Obsah předmětu. Požadavky kreditového systému. Relační datový model, Architektury databází

postaveny výhradně na syntaktické bázi: jazyk logiky neinterpretujeme, provádíme s ním pouze syntaktické manipulace důkazy

Od relačních databází k technologiím sémantickému webu

DBS Konceptuální modelování

Relační datový model. Integritní omezení. Normální formy Návrh IS. funkční závislosti multizávislosti inkluzní závislosti

10. Techniky formální verifikace a validace

Linked Data a jazyk RDF

Bakalářská práce Převodník Excel - OWL

Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

6 Objektově-orientovaný vývoj programového vybavení

Reprezentace znalostí. Katedra kybernetiky, ČVUT v Praze.

RDF serializace Turtle

Úvod do databázových systémů 10. cvičení

Ontologie, OWL a deskripční logika

Tvorba DSD a kódovníků pro fiskální data z projektu OpenBudgets.eu

Reprezentace znalostí - úvod

RDF a RDF Query. Jakub Nerad 1. prosince Nerad () RDF a RDF Query 1. prosince / 16

Databázové systémy. Vztahy a relace. 3.přednáška

Inference v deskripčních logikách

Sémantický web a extrakce

EXTRAKT z mezinárodní normy

InternetovéTechnologie

Expertní systémy. 1. Úvod k expertním systémům. Cíl kapitoly:

Správa VF XML DTM DMVS Datový model a ontologický popis

Petr Křemen FEL ČVUT. Petr Křemen (FEL ČVUT) Od sémantických sítí k logickým formalismům 1 / 161

Kapitola 2: Entitně-vztahový model (Entity-Relationship model) Množiny entit (entitní množiny) Atributy

Databázové systémy. * relační kalkuly. Tomáš Skopal. - relační model

Nepravidlové a hybridní znalostní systémy

Úvod do logiky (presentace 2) Naivní teorie množin, relace a funkce

Množiny, relace, zobrazení

MBI - technologická realizace modelu

Co jsou otevřená propojená data?

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

(#%ist #%LargeCorpInternalsMt #%ForAll x (#%HumanResourcesDepartment #%allinstances (#%actsincapacity x #%mediatorinprocesses #%EmployeeHiring

MODELOVÁNÍ DAT V INFORMAČNÍCH SYSTÉMECH. Jindřich Kaluža Ludmila Kalužová

Databázové patterny. MI-DSP 2013/14 RNDr. Ondřej Zýka,

Databázové systémy. Datová integrita + základy relační algebry. 4.přednáška

Výroková a predikátová logika - III

4IZ440 Propojená data na webu Organizační úvod

Fuzzy logika. Informační a znalostní systémy

Znalostní modelování

Výroková logika syntaxe a sémantika

Konceptualizace, komunikace a reprezentace znalostí

Databázové patterny. RNDr. Ondřej Zýka

Logický datový model VF XML DTM DMVS

8.2 Používání a tvorba databází

Databáze. Logický model DB. David Hoksza

Databáze I. Přednáška 2

Výroková a predikátová logika - III

RELACE, OPERACE. Relace

Ontologie. Přednáška z předmětu Socioekonomická geografie pro geomatiku (KMA/SGG) Otakar Čerba Západočeská univerzita

Otevřená data. Shrnutí. Když stavím nový IS nebo upravuji existující, co musím udělat, abych byl Open Data Ready? Prosinec 2018

Predikátová logika. Teoretická informatika Tomáš Foltýnek

Databázové systémy. Ing. Radek Holý

Databáze I. 4. přednáška. Helena Palovská

Modely Herbrandovské interpretace

Primární klíč (Primary Key - PK) Je právě jedna množina atributů patřící jednomu z kandidátů primárního klíče.

Databázové systémy BIK-DBS

Obsah přednášky. Databázové systémy RDBMS. Fáze návrhu RDBMS. Coddových 12 pravidel. Coddových 12 pravidel

2. Modelovací jazyk UML 2.1 Struktura UML Diagram tříd Asociace OCL. 3. Smalltalk 3.1 Jazyk Pojmenování

Etapy tvorby lidského díla

Matematická analýza 1

Usuzování za neurčitosti

Pro každé formule α, β, γ, δ platí: Pro každé formule α, β, γ platí: Poznámka: Platí právě tehdy, když je tautologie.

Formální jazyky a gramatiky Teorie programovacích jazyků

J. Zendulka: Databázové systémy 4 Relační model dat 1

Získávání a reprezentace znalostí

Analýza a modelování dat 2. přednáška. Helena Palovská

Přepoužívání ontologických modelů na sémantickém webu

Databázové systémy. Přednáška 1

1. Znalostní systémy a znalostní inženýrství - úvod. Znalostní systémy. úvodní úvahy a předpoklady. 26. září 2017

Linked Data v oblasti geoinformačních technologií

Logický důsledek. Petr Kuchyňka

REPREZENTACE ZNALOSTÍ

OOT Objektově orientované technologie

Linked Data a jazyk RDF

Automatizované řešení úloh s omezeními

Inovace tohoto kurzu byla spolufinancována z Evropského sociálního fondu a státního rozpočtu České republiky.

Vybrané přístupy řešení neurčitosti

KMA/PDB. Karel Janečka. Tvorba materiálů byla podpořena z prostředků projektu FRVŠ č. F0584/2011/F1d

4IZ440 Propojená data na webu Organizační a kontextový úvod

UDBS Cvičení 10 Funkční závislosti

Výroková a predikátová logika - VII

Inteligentní systémy (TIL) Marie Duží

Databázové systémy. Cvičení 2

Matematická logika. Miroslav Kolařík

Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph)

Kritéria hodnocení praktické maturitní zkoušky z databázových systémů

Výroková a predikátová logika - IX

Transkript:

Modelování a odvozování v RDFS Doc. Ing. Vojtěch Svátek, Dr. Zimní semestr 2012 http://nb.vse.cz/~svatek/rzzw.html

Modelování v RDFS Základní konstrukce slovníku jsou Třídy Individua (jen význačná doménová jde o slovník, ne o data!) Vlastnosti (v praxi lze rozlišit na objektové, datové, event. anotační) V praxi se vždy nemusí shodovat s intuitivním chápáním tříd objektů, jednotlivých objektů a vztahů

Populární slovníky Z různých oblastí Některé znovupoužívané na úrovni jednotlivých entit nebo jejich shluků Zmapované na portálu Linked Open Vocabularies http://lov.okfn.org/

Odvozování Odvozování (inference) není jen záležitostí umělé inteligence expertních systémů apod. I v systémech spravujících běžná data může odvozování na straně zdrojových dat být náhradou za sofistikovanou tvorbu dotazů Typicky jednoduché, deterministické, monotónní odvozování bez neurčitosti V sémantickém webu přichází odvozování v menší míře s RDFS v rozsáhlé míře s OWL, případně pravidlovými jazyky nad ním (SWRL, RIF)

RDFS jako schématový jazyk Každé schéma RDFS je samo zároveň množinou trojic RDF Primárně určen k odvozování, nikoliv k ověřování formální validity dokumentů Pozn.: existují i implementace odvozovacích nástrojů, které fakticky provádějí kontrolu datové integrity podle schémat v RDFS a OWL, mají ale jen podpůrnou úlohu, viz http://clarkparsia.com/pellet/icv Odvozování lze popsat pomocí inferenčních pravidel typu IF THEN nad zobecněnými grafy RDF(S)

Odvozovací konstrukty RDFS Všechny jsou současně predikáty RDF rdfs:subclassof rdfs:subpropertyof rdfs:domain rdfs:range Proto je možné trojice s těmito predikáty přidat k ostatním, a odvozovat nad elementárními fakty RDFS a tvrzeními RDF jako jedním celkem

Propagace typu IF?A rdfs:subclassof?b. AND?x rdf:type?a. THEN?x rdf:type?b. IF ex:professor rdfs:subclassof ex:teacher. AND ex:petr rdf:type ex:professor. THEN ex:petr rdf:type ex:teacher. Odvozování příslušnosti zdroje ke třídě směrem nahoru vs. dědění atributů a metod tříd v OOP dolů neexistuje přepisování (overriding) na nižší úrovni vícenásobná dědičnost (více rodičovských tříd pro danou třídu) je definována jednoznačně Lze chápat i jako inkluzi množin zdrojů

Lze řešit na úrovni SPARQL? Jen pro předem daný počet hierarchických úrovní, přepsáním dotazu na složitější WHERE {?x rdf:type?b } WHERE { {?x rdf:type?b } UNION {?A rdfs:subclassof?b.?x rdf:type?a. } }

Propagace relace IF?P rdfs:subpropertyof?q. AND?x P?y. THEN?x Q?y. Funguje stejně, jako propagace tříd ale na úrovni uspořádaných dvojic zdrojů vlastnost je binární relace, tj. množina uspořádaných dvojic tj. množinová inkluze platí stejně jako u tříd Nemá analogii v OOP IF ex:isheadof rdfs:subpropertyof ex:isemployedby. AND ex:vilem ex:isheadof ex:kizi. THEN ex:vilem ex:isemployedby ex:kizi.

Odvozování vs. modelování Z hlediska odvozování je korektní vztah ex:returned rdfs:subpropertyof ex:borrowed. Z hlediska modelování reality ale neplatí, že by vrácení věci bylo specializovaným případem jejího půjčení!

Odvození dle definičního oboru IF?P rdfs:domain?a. AND?x P?y. THEN?x rdf:type?a. IF ex:isemployedby rdfs:domain ex:person. AND ex:vilem ex:isemployedby ex:kizi. THEN ex:vilem rdf:type ex:person. Díky OWA definiční obor (domain) nefunguje jako integritní omezení IF ex:isemployedby rdfs:domain ex:person. AND ex:lisp-miner rdf:type ex:software. AND ex:lisp-miner ex:isemployedby ex:kizi. THEN???

Odvození dle definičního oboru IF?P rdfs:domain?a. AND?x P?y. THEN?x rdf:type?a. IF ex:isemployedby rdfs:domain ex:person. AND ex:vilem ex:isemployedby ex:kizi. THEN ex:vilem rdf:type ex:person. Díky OWA definiční obor (domain) nefunguje jako integritní omezení IF ex:isemployedby rdfs:domain ex:person. AND ex:lisp-miner rdf:type ex:software. AND ex:lisp-miner ex:isemployedby ex:kizi. THEN ex:lisp-miner rdf:type ex:person ale jako odvozovací pravidlo! Pozn.: odlišné třídy nejsou explicitně disjunktní

Odvození dle oboru hodnot IF?P rdfs:range?a. AND?x P?y. THEN?y rdf:type?a. IF ex:isemployedby rdfs:range ex:organization. AND ex:vilem ex:isemployedby ex:kizi. THEN ex:kizi rdf:type ex:organization. Odvození dle oboru hodnot (range) funguje analogicky jako pro definiční obor

Subclass vs. domain/range Víceméně stejnou realitu a odvozování nad ní lze modelovat oběma způsoby ex:isemployedby rdfs:range ex:organization. IF ex:vojtech ex:isemployedby ex:kizi. THEN ex:kizi rdf:type ex:organization. ex:employer rdfs:subclassof ex:organization. IF ex:kizi rdf:type ex:employer. THEN ex:kizi rdf:type ex:organization.

RDFS jednoduchý jazyk? RDFS klame tělem! Syntakticky je velmi jednoduchý Odvozování se implementuje také vcelku jednoduše ale pro uživatele není snadné si na ně zvyknout! Největší díl nejasností připadá na domain/range Ale při kvalifikovaném využívání může přinést užitečný efekt Pro srovnání RDF je jednoduché na pohled i podstatou OWL je komplikovanější na pohled i podstatou

Směr tvrzení domain/range Mějme tvrzení P rdfs:domain?a Intuitivně bychom asi chápali jako: Pro třídu A je definována vlastnost P, tj. od A směrem k P Správná interpretace ale je: Pro levou stranu vlastnosti P je určena třída A, tj. od P směrem k A!!! Analogicky pro range Na levé i pravé straně jakékoli vlastnosti se vždy může vyskytnout jakýkoli zdroj z univerza tvrzení typu domain a range pouze umožňují tomuto zdroji odvozením přiřadit příslušnost k (další) třídě

Propagace domain/range IF?P rdfs:domain?a. AND?A rdfs:subclassof?b. THEN?P rdfs:domain?b. IF ex:isemployedby rdfs:domain ex:person. AND ex:person rdfs:subclassof ex:biologicalentity. THEN ex:isemployedby rdfs:domain ex:biologicalentity. Podobně jako příslušnost instance se v hierarchii tříd dědí nahoru i definiční obor a opět analogicky i obor hodnot

Vícenásobná domain/range ex:teaches rdfs:domain ex:person. ex:teaches rdfs:domain ex:organization. Intuitivně: učit mohou lidé i celé organizace je tato intuice správná? Ne! Jde o dva nezávislé axiomy! Pokud se nějaký zdroj vyskytne na levé straně tvrzení s ex:teaches, bude přiřazen jako instance k oběma třídám, tj. do jejich průniku V RDFS je třeba pečlivě zvažovat, zda dva způsoby použití vlastnosti nevyžadují dvě odlišné vlastnosti; nebo je nutno původní vlastnost nechat bez domain/range V OWL lze řešit tzv. lokálními restrikcemi

Vlastnost jako propojení tříd? Úroveň instancí: dva zdroje propojené vlastností Petr employedby KIZI Úroveň tříd: dvě třídy propojené vlastností, která je má v domain resp. range? Person employedby Organizati on Grafická notace a la RDF se často takto používá i pro úroveň tříd, to ale svádí k omylu Nejde o jednu trojici RDF, ale o dvě; a u obou je employedby subjektem, nikoliv predikátem! Protože hodnotou domain/range nejsou jen explicitně zadané třídy, ale i jejich nadtřídy (viz předchozí slide), nelze ani v obecném smyslu chápat jako vztah mezi dvěma třídami!

Modelování ekvivalence Přímo lze jen v OWL V RDFS lze nahradit dvěma jednosměrnými vztahy?a rdfs:subclassof?b.?b rdfs:subclassof?a. To ovšem vede k nižší srozumitelnosti

Výsledek odvození v RDFS Nové trojice se přidají do databáze (pokud v ní ještě nejsou) Nemůže dojít k nekonzistenci na rozdíl od odvození v OWL

Odvozování při integraci dat Náhrada termínu při zachování vazby na stará data Propojení více terminologií Napojení proprietární vlastnosti na standardizovanou Umožní např. zobrazovat hodnoty vlastnosti z proprietárního namespace v generické aplikaci isis:name rdfs:subpropertyof rdfs:label. atd. pcvse:autor rdfs:subclassof isis:person.

RDFS nad rámec odvozování a modelování reality rdfs:label Lidsky srozumitelný název entity rdfs:seealso URI odkaz na libovolný související zdroj rdfs:isdefinedby Jde o podvlastnost k seealso Odkaz na definující zdroj rdfs:comment Textový komentář