Ontologie a OWL. Prof. Ing. Vojtěch Svátek, Dr. Zimní semestr

Podobné dokumenty
Ontologie, OWL a deskripční logika

Aplikace s odvozováním nad ontologiemi

Ontologie. Otakar Trunda

Modelování a odvozování v RDFS

Metody tvorby ontologií a sémantický web. Martin Malčík, Rostislav Miarka

Logika pro sémantický web

Linked Data a jazyk RDF

Propojená data na webu (motivační úvod)

4IZ440 Propojená data na webu Organizační a kontextový úvod

4IZ440 Propojená data na webu Organizační a kontextový úvod

4IZ440 Propojená data na webu Organizační a kontextový úvod

Výměnný formát XML DTM DMVS PK

Deskripční logika. Petr Křemen FEL ČVUT. Petr Křemen (FEL ČVUT) Deskripční logika 37 / 157

Ontologie v e-commerce

Přepoužívání ontologických modelů na sémantickém webu

Sémantický web 10 let poté

Přepoužívání ontologických modelů na sémantickém webu

Reaktivní ontologické inženýrství (na sémantickém webu)

Linked Data a jazyk RDF

Petr Křemen. Katedra kybernetiky, FEL ČVUT. Petr Křemen (Katedra kybernetiky, FEL ČVUT) Sémantické sítě a rámce 1 / 112

Tvorba DSD a kódovníků pro fiskální data z projektu OpenBudgets.eu Doplněná verze vyznačeno červeně

Logický datový model VF XML DTM DMVS

4IZ440 Propojená data na webu Organizační úvod

EXTRAKT z mezinárodní normy

RDF serializace Turtle

Workshop k terminologickým otázkám organizace znalostí Motivace a hypotézy projektu. Cíl projektu NAKI DF13P01OVV013

Dokumentační služba projektu MediGrid

Sémantický web principy, prostředky, aplikace. Ondřej Černoš UISK

Tvorba DSD a kódovníků pro fiskální data z projektu OpenBudgets.eu

postaveny výhradně na syntaktické bázi: jazyk logiky neinterpretujeme, provádíme s ním pouze syntaktické manipulace důkazy

Použ ití konžolové č á sti áplikáčé XRéásonér

PLIN021 Sémantická analýza v praxi

Znalostní báze pro obor organizace informací a znalostí

Logika a logické programování

Sémantický web a extrakce

Modely datové. Další úrovní je logická úroveň Databázové modely Relační, Síťový, Hierarchický. Na fyzické úrovni se jedná o množinu souborů.

Teorie systémů TES 5. Znalostní systémy KMS

4IZ440 Reprezentace a zpracování znalostí na WWW

Výroková a predikátová logika - III

Od relačních databází k technologiím sémantickému webu

MBI - technologická realizace modelu

GISON: ontologická integrace urbanistických datových sad IPR

REPREZENTACE ZNALOSTÍ

Metadata, sémantika a sémantický web. Ing. Vilém Sklenák, CSc.

Obsah. Zpracoval:

6 Objektově-orientovaný vývoj programového vybavení

Nepravidlové a hybridní znalostní systémy

(#%ist #%LargeCorpInternalsMt #%ForAll x (#%HumanResourcesDepartment #%allinstances (#%actsincapacity x #%mediatorinprocesses #%EmployeeHiring

Klasické a moderní ontologie při popisu lékařských algoritmů. Lesný P., Vejvalka J.

Znalostní báze pro obor organizace informací a znalostí

Ontologie. Přednáška z předmětu Socioekonomická geografie pro geomatiku (KMA/SGG) Otakar Čerba Západočeská univerzita

Výměnný formát XML DTM DMVS PK

Web 2.0 vs. sémantický web

Analýza podkladů pro návrh datového VF XML DTM DMVS

InternetovéTechnologie

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

Správa VF XML DTM DMVS Datový model a ontologický popis

RDF a RDF Query. Jakub Nerad 1. prosince Nerad () RDF a RDF Query 1. prosince / 16

Informační systémy 2008/2009. Radim Farana. Obsah. Obsah předmětu. Požadavky kreditového systému. Relační datový model, Architektury databází

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Znalostní systém nad ontologií ve formátu Topic Maps

Negativní informace. Petr Štěpánek. S použitím materiálu M.Gelfonda a V. Lifschitze. Logické programování 15 1

Národní technické specifikace. služeb nad prostorovými daty a metadaty

4.2 Syntaxe predikátové logiky

Informační systémy 2008/2009. Radim Farana. Obsah. Nástroje business modelování. Business modelling, základní nástroje a metody business modelování.

Nastavení provozního prostředí webového prohlížeče pro aplikaci

10. Techniky formální verifikace a validace

Analýza podkladů a návrh DM

Petr Křemen FEL ČVUT. Petr Křemen (FEL ČVUT) Od sémantických sítí k logickým formalismům 1 / 161

UML. Unified Modeling Language. Součásti UML

Bakalářská práce Převodník Excel - OWL

Znalostní modelování

DIPLOMOVÁ PRÁCE. Jan Dědek Sémantická anotace dat z webovských zdrojů

10 Metody a metodologie strukturované analýzy

Výroková a predikátová logika - III

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

POPIS STANDARDU CEN TC278/WG9. Oblast: VYHRAZENÁ KOMUNIKACE KRÁTKÉHO DOSAHU ( DSRC) Zkrácený název: DSRC - APLIKAČNÍ VRSTVA. Norma číslo: 12834

Výroková a predikátová logika - II

Architektura informačních systémů. - dílčí architektury - strategické řízení taktické řízení. operativní řízení a provozu. Globální architektura

Dolování v objektových datech. Ivana Rudolfová

Konceptualizace, komunikace a reprezentace znalostí

Umělá inteligence I. Roman Barták, KTIML.

Prolog PROgramming in LOGic část predikátové logiky prvního řádu rozvoj začíná po roce 1970 Robert Kowalski teoretické základy Alain Colmerauer, David

Programovací jazyk Pascal

12. konference Archivy, knihovny, muzea v digitálním světě

Stav projektu Digitální mapa veřejné správy na krajích ke dni

Univerzita Karlova v Praze. Sémantický web ontologický Internet budoucnosti

Linked Data v oblasti geoinformačních technologií

Výroková a predikátová logika - VII

Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky. Diplomová práce. Objektové vazby pro prostorová Linked Data

platné nejsou Sokrates je smrtelný. (r) 1/??

Logika a jazyk. filosofický slovník, Praha:Svoboda 1966)

Dokumentační služba projektu Medigrid : dokumentování sémantiky lékařských dat

Analýza podkladů pro návrh datového VF XML DTM DMVS

Výroková a predikátová logika - V

dbpedia Václav Zeman December 2015 KIZI - VŠE

Výroková a predikátová logika - VI

Text Mining: SAS Enterprise Miner versus Teragram. Petr Berka, Tomáš Kliegr VŠE Praha

Transkript:

Ontologie a OWL Prof. Ing. Vojtěch Svátek, Dr. Zimní semestr 2018 http://nb.vse.cz/~svatek/rzzw.html

Témata Ontologie v informatice Jazyk OWL Vybrané aktuální problémy ontologického inženýrství a projekty KIZI (informativně)

Témata Ontologie v informatice Jazyk OWL Vybrané aktuální problémy ontologického inženýrství a projekty KIZI (informativně)

Pojem ontologie Ve filosofii: nauka o bytí univerzální soustava znalostí o světě (tak, jak je, nezávisle na usuzování o něm ) Kategorie jsoucen (viz např. Aristoteles) V informatice: soustava znalostí o světě bez nároku na ucelenost (mnoho dílčích ontologií pro různé domény) často účelově vzniklý artefakt zohledňující způsob použití v informačním systému / aplikaci

Definice ontologie (v inf.) (T. Gruber, 1993) explicitní specifikace konceptualizace (W. Borst, 1997) formální specifikace sdílené konceptualizace (B. Swartout, 1997) hierachicky strukturovaná množina termínů popisujících určitou věcnou oblast a mnoho dalších

Typická struktura ontologie Termíny, resp. pojmy, které se používají k popisu nějaké reality jim odpovídají reálné objekty Rozlišují se obecné pojmy třídy, a jejich instance Hierarchické uspořádání pojmů z hlediska obecnosti (nadtřída - podtřída) I nehierarchické vazby pojmenované vztahy, ve kterých se mohou objekty reálného světa vystupovat

Dva pohledy na ontologii Aristoteles: Definitio per genus proximum et differentia specifica Porfyriův strom: myslící vs. materiální živé vs. neživé racionální vs. neracionální Doktorand je student který úspěšně ukončil magisterskou úroveň studia a věnuje se určitému výzkumnému tématu pod vedením kvalifikovaného školitele

Dva pohledy na ontologii Aristoteles: Definitio per genus proximum et differentia specifica Modulární systém propojených definic Porfyriův strom: myslící vs. materiální živé vs. neživé racionální vs. neracionální Systematická taxonomie Doktorand je student který úspěšně ukončil magisterskou úroveň studia a věnuje se určitému výzkumnému tématu pod vedením kvalifikovaného školitele

Dva pohledy na ontologii Aristoteles: Definitio per genus proximum et differentia specifica Modulární systém propojených definic Jedno z využití deskripční logiky Porfyriův strom: myslící vs. materiální živé vs. neživé racionální vs. neracionální Systematická taxonomie Doktorand je student který úspěšně ukončil magisterskou úroveň studia a věnuje se určitému výzkumnému tématu pod vedením kvalifikovaného školitele

Jazyky pro reprezentaci ontologií Historicky mnoho, vzájemně si konkurujících V současnosti dominuje OWL, případně RDFS jako jeho (cca) podmnožina Syntakticky společný základ (rodina W3C standardů), ale významně odlišné kontexty a způsoby použití

Využívání ontologií v OWL (1) Rozsáhlé doménové ontologie nadále vznikají zejména v biomedicíně (viz http://bioportal.bioontology.org/), např. ICD (Mezinárodní klasifikace nemocí) unifikovaná struktura generovaná automaticky pomocí šablon důraz na využití pro strojové odvozování v deskripční logice (DL) viz 5FI430 (Ing. Vacura) příklad ze SNOMED-OWL (v Manch. syntaxi) Appendicectomy equivalentto Surgical_Procedure and method some Excision) and procedure-site some Appendix_structure)

SNOMED-OWL SNOMED, Systematic NOmenclature of MEDicine, je kategorizační systém vytvářený asociací amerických patologů První verze převodu do OWL v r. 2007 obsahovala cca 400 tisíc konceptů Systém není uzavřený - je možno libovolně vytvářet nové koncepty, aniž by musely obdržet vyčleněné jméno a ID (post-koordinace) Excision and (procedure-site some (kidney and (laterality some left))) To vede k nutnosti využití odvozovacích systémů

Scénář využití SNOMED-OWL (Dle J. Daviese, British Telecom + projekt RIDE) Lékař vloží klinická data do zdravotnické aplikace a přiřadí je konceptu, který pro tento účel nově vytvoří, např. alergie způsobená mandlemi Aplikace informuje o novém konceptu terminologickou službu Terminologická služba kontaktuje odvozovací nástroj (nad DL), a ten automaticky zařadí nový koncept do taxonomie existujících Terminologická služba informuje zdravotnickou aplikaci o změně taxonomie, ve které je nyní nový koncept podřazený konceptu alergie na ořechy

Využívání ontologií v OWL (2) 2. Ontologie pro lepší přístup ke konkrétnímu datovému zdroji - tzv. OBDA kompaktní, využívané aplikací jako celek, využívání přinejmenším zčásti na základě tzv. předpokladu uzavřeného světa (CWA) spíš nadstavba relačního datového schématu než skutečná ontologie sémantického webu

Využívání ontologií v OWL (3) 3. Využití ontologií pomocí pravidlových systémů Např. některé systémy business rules, deklarativně definující politiky v informačních systémech

Využívání ontologií v OWL (4) 4. Datové slovníky pro linked data zajišťují minimální vyjádření významu dat v infrastruktuře bez vymezeného cílového určení provázané mezi sebou, kombinují se, přepoužívají se pro mnoho různých datasetů zpravidla využívají jen malou část vyjadřovací síly OWL bývá to RDFS a něco málo navíc

Témata Ontologie v informatice Jazyk OWL Vybrané aktuální problémy ontologického inženýrství a projekty KIZI (informativně)

Jazyk OWL První verze doporučení W3C z r. 2004 Aktuálně platná verze OWL 2 z r. 2009 Pro úvodní seznámení vhodný OWL 2 Primer http://www.w3.org/tr/owl2-primer/ Několik syntaxí funkční syntaxe normativní zápis v podobě trojic RDF (v XML, Turtle npod.) málo přehledné, ale umožňuje zpracovávat nástroji pro RDF Manchesterská syntaxe nepokrývá celý jazyk, ale je lidsky nejčitelnější syntaxe OWL přímo v XML

Množinové predikáty v RDFS (rekapitulace) rdfs:subclassof, rdfs:subpropertyof, rdfs:domain, rdfs:range IF ex:professor rdfs:subclassof ex:teacher. AND ex:petr rdf:type ex:professor. THEN ex:petr rdf:type ex:teacher. IF ex:isheadof rdfs:subpropertyof ex:isemployedby. AND ex:vilem ex:isheadof ex:kizi. THEN ex:vilem ex:isemployedby ex:kizi. IF ex:isemployedby rdfs:domain ex:person. AND ex:vilem ex:isemployedby ex:kizi. THEN ex:vilem rdf:type ex:person. IF ex:isemployedby rdfs:range ex:organization. AND ex:vilem ex:isemployedby ex:kizi. THEN ex:kizi rdf:type ex:organization. (třída třída) (vlastnost vlastnost) (vlastnost třída) (vlastnost třída)

OWL jako nadstavba RDFS Nejvýznamnějším rozšířením je možnost používat nejen pojmenované třídy, ale i anonymní třídy definované logickým výrazem Konjunkce/disjunkce tříd, třídy definované restrikcí nad vlastností (viz příklady ze SNOMED-OWL), výčtové třídy Lze do sebe vnořovat skládat z jednodušších pojmů složitější Vlastnosti se explicitně rozlišují jako objektové (hodnotou je instance nějaké třídy) a datové (hodnotou je literál) Vlastnostem lze přiřadit charakteristiky, jako je funkčnost, symetrie, vzájemná inverznost (pro dvě vlastnosti) apod. Možnost formulovat negativní tvrzení

Profily OWL https://www.w3.org/tr/owl2-profiles/ specifikuje 3 profily ( podjazyky ) OWL pro specifické použití OWL 2 EL: vhodný pro ontologie s mnoha třídami, které je třeba automaticky podřazovat (zvl. biomedicína) OWL 2 QL: vhodný pro využití ontologie při obohaceném dotazování do RDBMS (OBDA) OWL 2 RL: vhodný pro implementaci odvození pomocí pravidlových systémů (např. business rules) Další rozšíření jsou dosud nestandardizovaná, zejména OWL LD

OWL LD Profil OWL vycházející z potřeb návrhářů slovníků linked data Empirické šetření provedené v r. 2011, viz https://arxiv.org/abs/1202.0984 Podmnožina OWL RL, obsahující výhradně konstrukce vyjádřitelné pomocí jediné RDF trojice (tj. bez temných trojic ) http://semanticweb.org/owlld/

Konstrukty OWL LD (nad rámec RDFS) Ne/identita individuí owl:sameas, owl:differentfrom Individuální charakteristiky vlastností owl:functionalproperty, owl:inversefunctionalproperty, owl:irreflexiveproperty, owl:symmetricproperty, owl:asymmetricproperty, owl:transitiveproperty Vzájemné vztahy tříd / vlastností owl:equivalentclass, owl:disjointwith, owl:equivalentproperty, owl:propertydisjointwith, owl:inverseof

Využití některých konstruktů owl:sameas explicitně udává identitu objektů owl:inversefunctionalproperty vlastnost klíče, identitu objektů z ní lze nepřímo odvodit owl:transitiveproperty odvození v řetězci výskytů vztahu owl:equivalentclass / owl:equivalentproperty / zjednodušený zápis dvou subsumpcí (rdfs:subclassof / rdfs:subpropertyof); typicky se používá pro zajištění kompatibility se starými verzemi tříd/vlastností owl:disjointwith / owl:propertydisjointwith kontrola neslučitelných tříd/vlastností

Témata Ontologie v informatice Jazyk OWL Vybrané aktuální problémy ontologického inženýrství a projekty KIZI (informativně)

Vybrané aktuální problémy KIZI se systematicky zabývá tvorbou a využíváním ontologií cca od r. 2000 Podrobně viz např. https://kizi.vse.cz/english/research-groups/semanticweb-and-ontological-engineering/research-focus/ Aktuálně řešené problémy: zejména Fokusovaná kategorizační síla ontologií Rozklad webové znalostní báze na ontologické schéma, znalostní graf a kódovníky Modely ontologického pozadí (viz 5FI430, Ing. Vacura)

Fokusovaná kategorizační síla Je dána výchozí třída fokusová třída o které již víme, že je objekt její instancí Výstupem kategorizace je jiná třída, která je sémantickou specializací fokusové třídy Teze: Ontologií vhodnou pro přepoužití je taková, která nabízí mnoho možností kategorizace pro fokusové třídy objektů ve vytvářeném datasetu, tj. má pro něj vysokou fokusovanou kategorizační sílu

Ilustrační příklad Majitel autobazaru chce na webu sdílet data o prodávaných vozech Pro popis dat chce přepoužít jednu nebo malý počet ontologií

Ilustrační příklad Majitel autobazaru chce na webu sdílet data o prodávaných vozech Pro popis dat chce přepoužít jednu nebo malý počet ontologií Kterou z dostupných ontologií, obsahujících požadovanou fokusovou třídu (nazvanou Vozidlo), pro přepoužití vybrat?

Ontologie A Ontologie B Vozidlo Vozidlo Automobil Motocykl Auto Nákladní

Ontologie A Ontologie B Vozidlo Vozidlo Automobil Motocykl Auto Nákladní Kategorie vozidel dle A: Automobil Motocykl Nákladní

Ontologie A Ontologie B Vozidlo Vozidlo Automobil Motocykl Auto Nákladní Kategorie vozidel dle A: Automobil Motocykl Nákladní Kategorie vozidel dle B: Auto

Ontologie A Ontologie B Vozidlo Vozidlo pohon Automobil Motocykl Auto diesel LPG CNG Nákladní benzin Kategorie vozidel dle A: Automobil Motocykl Nákladní Kategorie vozidel dle B: Auto

Ontologie A Ontologie B Vozidlo Vozidlo po nehodě pohon Nehoda v roce Automobil Motocykl Auto diesel LPG CNG Nákladní benzin Kategorie vozidel dle A: Automobil Motocykl Nákladní Kategorie vozidel dle B: Auto

Ontologie A Ontologie B Vozidlo Osoba prodejce Vozidlo po nehodě pohon Nehoda v roce Automobil Motocykl Fyzická osoba Právnická osoba Auto diesel LPG CNG Nákladní Dospělý Nezletilý benzin Kategorie vozidel dle A: Automobil Motocykl Nákladní Kategorie vozidel dle B: Auto

Ontologie A Ontologie B Vozidlo Osoba prodejce Vozidlo po nehodě pohon Nehoda v roce Automobil Motocykl Fyzická osoba Právnická osoba Auto diesel LPG CNG Nákladní Dospělý Nezletilý benzin Kategorie vozidel dle A: Automobil Motocykl Nákladní Kategorie vozidel dle B: Auto po nehodě * pohon = diesel prodejce je fyzická osoba prodejce je právnická osoba

Ontologie A Ontologie B Vozidlo Osoba prodejce Vozidlo po nehodě pohon Nehoda v roce Automobil Motocykl Fyzická osoba Právnická osoba Auto diesel LPG CNG Nákladní Dospělý Nezletilý benzin Kategorie vozidel dle A: Automobil Motocykl Nákladní Kategorie vozidel dle B: Auto po nehodě * pohon = diesel prodejce je fyzická osoba prodejce je právnická osoba Kategorie mohou být i odvozené

Ontologie A Ontologie B Vozidlo Osoba prodejce Vozidlo po nehodě pohon Nehoda v roce Automobil Motocykl Fyzická osoba Právnická osoba Auto diesel LPG CNG Nákladní Dospělý Nezletilý benzin Kategorie vozidel dle A: Automobil Motocykl Nákladní Kategorie vozidel dle B: Auto po nehodě * pohon = diesel prodejce je fyzická osoba prodejce je právnická osoba Kategorie mohou být i odvozené pohon * prodejce * prodejce je nezletilý

Ontologie A Ontologie B Vozidlo Osoba prodejce Vozidlo po nehodě pohon Nehoda v roce Automobil Motocykl Fyzická osoba Právnická osoba Auto diesel LPG CNG Nákladní Dospělý Nezletilý benzin Kategorie vozidel dle A: Automobil Motocykl Nákladní Kategorie vozidel dle B: Auto po nehodě * pohon = diesel prodejce je fyzická osoba prodejce je právnická osoba Kategorie mohou být i odvozené Ale ne všechny jsou stejně užitečné! pohon * prodejce * prodejce je nezletilý

Projekt FCatPoWO Focused Categorization Power of Web Ontologies Projekt Grantové agentury ČR (2018-2020) Velmi prestižní: jde o první standardní projekt GAČR získaný informatickou větví FIS od r. 2012 Rozpočet cca 2,7 mil. Kč Objem práce cca 46 člověkoměsíců Stálý tým: Svátek, Zamazal, Dudáš, Vacura, Ivánek Zapojení doktorandů (Nguyen, Vataščinová), ale potenciálně i studentů magisterského stupně studia (lze projevit zájem kdykoliv)

Návrh projektu IGA (2019-2020) Problém nalezení optimálního rozkladu ( partitioning ) souboru znalostí pro publikování na webu na schéma (ontologii) třídy (pojmy) uspořádané do hierarchie, případně opatřené logickými definicemi kódovníky ploché, ev. hierarchické; kódy mohou odpovídat jak jednotlivým objektům, tak i pojmům; typicky SKOS znalostní grafy sítě vztahů mezi instancemi (reprezentujícími jak jednotlivé objekty, tak i pojmy) příkladem jsou DBpedia, WikiData, Google KG, Tým: Nguyen, Vataščinová, Svátek, Zamazal, Vacura, (prozatím) 2 magisterští studenti poslední možnost vyjádřit zájem o zapojení: do 5.12. do večera

Relevantní seminář KEG 6. 12. 2018 16:00-17:30 473 NB Václav Jirkovský, Ondřej Šebek, ČVUT Praha: Utilization of Semantic Web technologies within Industrial Automation Domain The talk will provide an overview of outcomes which were achieved during the long-term collaboration with Rockwell Automation and Ford Motor Company. The interest of these companies in Semantic Web technologies emphasizes their importance for the future industrial systems. The following outcomes will be covered: Semantic Big Data Historian, Plug&Play concept for cyber-physical systems, diagnostics, and ontology learning for facilitating data model integration.