Metody tvorby ontologií a sémantický web. Martin Malčík, Rostislav Miarka



Podobné dokumenty
Ontologie. Otakar Trunda

Logika pro sémantický web

Sémantický web 10 let poté

Logický datový model VF XML DTM DMVS

EXTRAKT z mezinárodní normy

Výměnný formát XML DTM DMVS PK

Ontologie. Přednáška z předmětu Socioekonomická geografie pro geomatiku (KMA/SGG) Otakar Čerba Západočeská univerzita

Modely datové. Další úrovní je logická úroveň Databázové modely Relační, Síťový, Hierarchický. Na fyzické úrovni se jedná o množinu souborů.

Deskripční logika. Petr Křemen FEL ČVUT. Petr Křemen (FEL ČVUT) Deskripční logika 37 / 157

Aplikace s odvozováním nad ontologiemi

Znalostní báze pro obor organizace informací a znalostí

Internetové publikování

RDF a RDF Query. Jakub Nerad 1. prosince Nerad () RDF a RDF Query 1. prosince / 16

Výměnný formát XML DTM DMVS PK

Analýza podkladů pro návrh datového VF XML DTM DMVS

Ontologie v e-commerce

Znalostní báze pro obor organizace informací a znalostí

Informační a znalostní systémy jako podpora rozhodování

Národní technické specifikace. služeb nad prostorovými daty a metadaty

Linked Data a jazyk RDF

Teorie systémů TES 5. Znalostní systémy KMS

Inovace výuky prostřednictvím šablon pro SŠ

Dokumentační služba projektu MediGrid

Dolování v objektových datech. Ivana Rudolfová

Sémantický web a extrakce

(#%ist #%LargeCorpInternalsMt #%ForAll x (#%HumanResourcesDepartment #%allinstances (#%actsincapacity x #%mediatorinprocesses #%EmployeeHiring

Workshop k terminologickým otázkám organizace znalostí Motivace a hypotézy projektu. Cíl projektu NAKI DF13P01OVV013

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

1. Úvod Vztah k OAI-PMH Terminologie

Od relačních databází k technologiím sémantickému webu

GISON: ontologická integrace urbanistických datových sad IPR

ČESKÁ TECHNICKÁ NORMA

Správa VF XML DTM DMVS Datový model a ontologický popis

Kritéria hodnocení praktické maturitní zkoušky z databázových systémů

Konceptualizace, komunikace a reprezentace znalostí

Principy fungování WWW serverů a browserů. Internetové publikování

Modely a sémantika. Petr Šaloun VŠB-Technická univerzita Ostrava FEI, katedra informatiky

POSTUP PRO VYTVOŘENÍ STRUKTUR PRO UKLÁDÁNÍ RDF DAT V ORACLE

Sémantický web principy, prostředky, aplikace. Ondřej Černoš UISK

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Analýza podkladů pro návrh datového VF XML DTM DMVS

Propojená data na webu (motivační úvod)

Linked data (nejen) v knihovnách

Znalostní modelování

MBI - technologická realizace modelu

Kritéria hodnocení praktické maturitní zkoušky z databázových systémů

InternetovéTechnologie

Vývoj Internetových Aplikací

Nastavení provozního prostředí webového prohlížeče pro aplikaci

Doktorandské dny 07. Ústav informatiky. v.v.i. vydavatelství Matematicko-fyzikální fakulty University Karlovy v Praze

NÁSTROJE SÉMANTICKÉHO WEBU A VĚCNÉ AUTORITY APLIKACE V PROJEKTU INTERPI

REPREZENTACE ZNALOSTÍ

Univerzita Karlova v Praze. Sémantický web ontologický Internet budoucnosti

Modelování a odvozování v RDFS

Web 2.0 vs. sémantický web

Úvod do informatiky 5)

Metadata, sémantika a sémantický web. Ing. Vilém Sklenák, CSc.

Věcné zpracování a zpřístupnění informačních zdrojů Marie Balíková Národní knihovna ČR

4IZ440 Propojená data na webu Organizační a kontextový úvod

Přehled znalostních systémů

2. Modelovací jazyk UML 2.1 Struktura UML Diagram tříd Asociace OCL. 3. Smalltalk 3.1 Jazyk Pojmenování

Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Ontologie jako součást sémantického webu

Spojení OntoUML a GLIKREM ve znalostním rozhodování

Informační systémy 2008/2009. Radim Farana. Obsah. Obsah předmětu. Požadavky kreditového systému. Relační datový model, Architektury databází

JAZYK XSLT A SÉMANTICKÝ WEB XSLT Language and Semantic Web

NSWI108 Sémantizace Webu

Informační systémy 2008/2009. Radim Farana. Obsah. Nástroje business modelování. Business modelling, základní nástroje a metody business modelování.

10. Techniky formální verifikace a validace

4IZ440 Reprezentace a zpracování znalostí na WWW

Úvod do tvorby internetových aplikací

Standard výměnného formátu XML Digitální technické mapy

XML terminologie a charakteristiky. Roman Malo

UML. Unified Modeling Language. Součásti UML

Úvod do aplikací internetu a přehled možností při tvorbě webu

GIS Geografické informační systémy

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Webové služby a ontologie

Petr Křemen. Katedra kybernetiky, FEL ČVUT. Petr Křemen (Katedra kybernetiky, FEL ČVUT) Sémantické sítě a rámce 1 / 112

Dnešní téma. Oblasti standardizace v ICT. Oblasti standardizace v ICT. Oblasti standardizace v ICT

Základní zadání IS o ISVS. Sluţba poskytování dat IS o ISVS

Open Bibliography Data. ( Matouš Jobánek

4IZ440 Propojená data na webu Organizační a kontextový úvod

GIS Geografické informační systémy

Znalostní systém nad ontologií ve formátu Topic Maps

4.2 Syntaxe predikátové logiky

SPARQL.

Programování v C++ 3, 3. cvičení

Obsah přednášky. Databázové systémy RDBMS. Fáze návrhu RDBMS. Coddových 12 pravidel. Coddových 12 pravidel

CZ.1.07/1.5.00/

Software602 Form Designer

dbpedia Václav Zeman December 2015 KIZI - VŠE

Příloha: Dodatečné informace, včetně přesného znění žádosti dodavatele o dodatečné informace

Systém elektronického rádce v životních situacích portálu

PHP framework Nette. Kapitola Úvod. 1.2 Architektura Nette

Objektově orientované technologie. Daniela Szturcová

Principy a praktické využití otevřených dat

Objektové modely a znalostní ontologie podobnosti a rozdíly

Transkript:

Metody tvorby ontologií a sémantický web Martin Malčík, Rostislav Miarka

Obsah Reprezentace znalostí Ontologie a sémantický web Tvorba ontologií

Hierarchie znalostí (D.R.Tobin) Data jakékoliv znakové řetězce + relevance, zpracování, interpretace > Informace data obohacená o jejich význam + aplikace, transformace, rozšíření > Znalosti informace, které můžeme odvodit z jiných informací

Původní web V počátcích pouze akademická záležitost ; 1962 počítačová síť Arpa 1974 vynález TCP/IP 1983 spojení sítě a přensového protokolu 1991 Tim Berners Lee použil princip hypertextu Teda Nelsona (1976 Xanadu) a publikoval HTML world wide web syntaktický web 1998 XML 2001 Tim Berners Lee - sémantický web

Sémantický web Ideu Sémantického webu představil Tim Berners-Lee v roce 2001; Počet webových stránek na webu stále narůstá; Je stále složitější nalézt relevantní informace; Přechod od stávajícího webu k Sémantickému webu.

Cíl Sémantického webu Cílem sémantického webu je zpřístupnění webových zdrojů automatickým procesům, a to prostřednictvím: rozšíření stávajících značkovacích jazyků o možnost zachycení sémantiky v metadatech popisujících obsah/funkce webových zdrojů; použití ontologií jako formálně specifikovaných slovníků tak, aby se formální specifikace staly automaticky přístupnými. Sémantický web je založen na: RDF URI

Syntaktický web > sémantický web Přechod od strukturálně propojených datových zdrojů na bázi klíčových slov k jejich propojení na bázi významových asociací; Potřeba sémanticky strukturovat data na webu obrací pozornost ke konceptuální úrovni návrhů webových znalostních bází a aplikací Sémantická struktura dat je reprezentována konceptuálním datovým modelem RDF.

Expresivita a sémantika webu

RDF Resource Description Framework; Obecný rámec pro popis zdrojů na Internetu; Jde o obecný rámec pro popis, výměnu a znovupoužití metadat; RDF trojice subjekt predikát objekt Subjekt má vlastnost určenou objektem; Grafová podoba orientovaný graf Textová podoba založena na jazyce XML

URI Uniform Resource Identifier URI identifikátory jsou použity k identifikaci zdrojů v RDF Jednoznačná identifikace zdrojů Podmnožinou URI jsou URL adresy webových stránek nebo souborů na webu

Digitální podpis Šifrování Struktura sémantického webu Věrohodnost Důkaz Logika Pravidla/Dotazy Ontologie RDF Model & Syntaxe XML dotazy XML URI/IRI XML Schéma Jmenné prostory Unicode Obr. 1 Schéma vrstev sémantického webu (Zdroj: W3C. Přeložil MM)

Ontologie Filosofické pojetí bytí Ontologie lze charakterizovat jako formalizované reprezentace znalostí určené k jejich sdílení a znovupoužití. Domluvená sdílená terminologie pro určitou aplikační doménu Formální ontologie je explicitní formální reprezentace konceptualizace v určité doméně, založená na všeobecně sdílené významové struktuře a terminologickém slovníku domény pro danou oblast.

Ontologie Ontologie může co do expresivity představovat: taxonomie (znalosti strukturované hierarchicky nebo genericky stylem předek potomek); tezaury (slova a synonyma),; konceptuální modely (se složitějším zachycením struktury znalostí) ; logické teorie (s velmi bohatými, složitými, konzistentními a smysluplnými znalostmi).

Možnosti tvorby ontologií Automatické a poloautomatické ontologie tvorba a extrakce s použitím různých druhů zdrojů a různých technologií. ze souborů např. na webu z databází např. Wikipedie dbpedie http://dbpedia.org Expertní tvorba ontologií, kde je výzkum zaměřen na problémy buďto spojené s procesem návrhu ontologie nebo problémy specifické pro vzdělávací technologii.

Určen í domény a rozsahu ontologie Determine the domain and scope of the ontology Vazba na existující ontologie Integrating existing ontologies Formalizace terminologie First order logic: Terminology Definování tříd a jejich hierarchie Define the classes and the class hierarchy Definování objektových a datových vlastností tříd Define the data and object properties of clasies Repeat until condition is valid Definování znalostních vzorů Define the knowledge patterns Tvorba instancí Create instances Odvozování nových znalostí Deduction new knowledge

Expertní tvorba ontologií I. Určení domény a rozsahu ontologie: Definování domény, oblastí použití a uživatelů ontologie. Vazba na existující ontologie. Formalizace terminologie: Termíny navržené k zařazení do ontologie musí být specifikovány s použitím predikátové logiky prvního řádu, případně v jazyce KIF (Knowledge Interchange Format). V rámci vymezeného univerza diskursu se definují objekty, které jsou reprezentovány prostřednictvím konstant a proměnných. Pro objekty se definují atributy jakožto unární predikáty a vztahy mezi nimi se definují pomocí n-árních (např. binárních) predikátů. Definování tříd a jejich hierarchie: V rámci námi zpracovávaných domén jsme postupovali postupem top-down. Ze seznamu termínů jsme vybrali termíny označující objekty se samostatnou existencí a tyto označili jako třídy. Mezi třídami jsme definovali generické hierarchické vztahy s uplatněním dědičnosti Definování vlastností tříd: Z termínů, které nebyly označeny jako třídy, se vyberou ty, jež představují vlastnosti některé z definovaných tříd. Rozlišují se typy vlastností: objektové popisující zejména vztahy mezi třídami a datové, popisující datový typ.

Expertní tvorba ontologií II. Definování znalostních vzorů: Znalostní vzory slouží ke znovupoužití znalostí. Ve vytvořené ontologii je možné nalézt koncepty a vztahy, které mají shodnou strukturu, ale liší se pouze ve svých názvech Tvorba instancí: Vytvoření individuálních instancí tříd a naplnění jejich vlastností hodnotami. Odvozování z ontologie: Ve výsledné ontologii je možné provádět dotazování a odvozování. Je možné vytvářet dotazy na třídy a na individua.

Děkuji za pozornost

Ukázka ontologie v Protégé