Ontologie. Otakar Trunda

Podobné dokumenty
Metody tvorby ontologií a sémantický web. Martin Malčík, Rostislav Miarka

Logika pro sémantický web

Aplikace s odvozováním nad ontologiemi

Petr Křemen. Katedra kybernetiky, FEL ČVUT. Petr Křemen (Katedra kybernetiky, FEL ČVUT) Sémantické sítě a rámce 1 / 112

Modely datové. Další úrovní je logická úroveň Databázové modely Relační, Síťový, Hierarchický. Na fyzické úrovni se jedná o množinu souborů.

Metadata, sémantika a sémantický web. Ing. Vilém Sklenák, CSc.

Výměnný formát XML DTM DMVS PK

Deskripční logika. Petr Křemen FEL ČVUT. Petr Křemen (FEL ČVUT) Deskripční logika 37 / 157

Logický datový model VF XML DTM DMVS

Sémantický web a extrakce

GISON: ontologická integrace urbanistických datových sad IPR

Standard výměnného formátu XML Digitální technické mapy

(#%ist #%LargeCorpInternalsMt #%ForAll x (#%HumanResourcesDepartment #%allinstances (#%actsincapacity x #%mediatorinprocesses #%EmployeeHiring

MBI - technologická realizace modelu

Znalostní báze pro obor organizace informací a znalostí

Modely a sémantika. Petr Šaloun VŠB-Technická univerzita Ostrava FEI, katedra informatiky

Modelování a odvozování v RDFS

Ontologie. Přednáška z předmětu Socioekonomická geografie pro geomatiku (KMA/SGG) Otakar Čerba Západočeská univerzita

EXTRAKT z mezinárodní normy

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

MATURITNÍ OTÁZKY ELEKTROTECHNIKA - POČÍTAČOVÉ SYSTÉMY 2003/2004 PROGRAMOVÉ VYBAVENÍ POČÍTAČŮ

Konceptualizace, komunikace a reprezentace znalostí

Nepravidlové a hybridní znalostní systémy

PRODUKTY. Tovek Tools

Ontologie v e-commerce

Znalostní báze pro obor organizace informací a znalostí

Správa VF XML DTM DMVS Datový model a ontologický popis

Od relačních databází k technologiím sémantickému webu

InternetovéTechnologie

Informační systémy 2008/2009. Radim Farana. Obsah. Nástroje business modelování. Business modelling, základní nástroje a metody business modelování.

Dokumentační služba projektu MediGrid

Znalostní modelování

Logický důsledek. Petr Kuchyňka

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Workshop k terminologickým otázkám organizace znalostí Motivace a hypotézy projektu. Cíl projektu NAKI DF13P01OVV013

Informační systémy 2008/2009. Radim Farana. Obsah. Obsah předmětu. Požadavky kreditového systému. Relační datový model, Architektury databází

Teorie systémů TES 5. Znalostní systémy KMS

Sémantický web 10 let poté

8.2 Používání a tvorba databází

DBS Konceptuální modelování

Business Intelligence

4IZ440 Reprezentace a zpracování znalostí na WWW

Význam datových standardů pro automatizované sdílení dat

2. Modelovací jazyk UML 2.1 Struktura UML Diagram tříd Asociace OCL. 3. Smalltalk 3.1 Jazyk Pojmenování

Znalostní systém nad ontologií ve formátu Topic Maps

REPREZENTACE ZNALOSTÍ

PŘÍLOHA C Požadavky na Dokumentaci

Profilová část maturitní zkoušky 2017/2018

Národní technické specifikace. služeb nad prostorovými daty a metadaty

MODELOVÁNÍ DAT V INFORMAČNÍCH SYSTÉMECH. Jindřich Kaluža Ludmila Kalužová

PRODUKTY Tovek Server 6

Propojená data na webu (motivační úvod)

Informační a znalostní systémy jako podpora rozhodování

PLIN021 Sémantická analýza v praxi

4IZ440 Propojená data na webu Organizační a kontextový úvod

Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Ontologie jako součást sémantického webu

Okruhy z odborných předmětů

postaveny výhradně na syntaktické bázi: jazyk logiky neinterpretujeme, provádíme s ním pouze syntaktické manipulace důkazy

Obsah. Zpracoval:

12. konference Archivy, knihovny, muzea v digitálním světě

Ontologie, OWL a deskripční logika

Reprezentace znalostí - úvod

PRODUKTY. Tovek Tools

Věcné zpracování a zpřístupnění informačních zdrojů Marie Balíková Národní knihovna ČR

Ontologie a OWL. Prof. Ing. Vojtěch Svátek, Dr. Zimní semestr

Příloha: Dodatečné informace, včetně přesného znění žádosti dodavatele o dodatečné informace

RDF a RDF Query. Jakub Nerad 1. prosince Nerad () RDF a RDF Query 1. prosince / 16

Výměnný formát XML DTM DMVS PK

ZÁKLADY PROGRAMOVÁNÍ. Mgr. Vladislav BEDNÁŘ /14

Dolování v objektových datech. Ivana Rudolfová

Wichterlovo gymnázium, Ostrava-Poruba, příspěvková organizace. Maturitní otázky z předmětu INFORMATIKA A VÝPOČETNÍ TECHNIKA

Design systému. Komponentová versus procesní architektura

Uživatelská podpora v prostředí WWW

Databáze 2013/2014. Konceptuální model DB. RNDr. David Hoksza, Ph.D.

TEORIE ZPRACOVÁNÍ DAT

Reprezentace znalostí. Katedra kybernetiky, ČVUT v Praze.

Petr Křemen FEL ČVUT. Petr Křemen (FEL ČVUT) Od sémantických sítí k logickým formalismům 1 / 161

Relační datový model. Integritní omezení. Normální formy Návrh IS. funkční závislosti multizávislosti inkluzní závislosti

Výměnný formát XML DTM DMVS

4IZ440 Propojená data na webu Organizační a kontextový úvod

Web 2.0 vs. sémantický web

Analýza podkladů pro návrh datového VF XML DTM DMVS

Archivace relačních databází

6 Objektově-orientovaný vývoj programového vybavení

Logika a logické programování

Text Mining: SAS Enterprise Miner versus Teragram. Petr Berka, Tomáš Kliegr VŠE Praha

Představuje. Technický Informační Systém nové generace

Inovace CRM systémů využitím internetových zdrojů dat pro malé a střední podniky. Ing. Jan Ministr, Ph.D.

10. Techniky formální verifikace a validace

Oborové číslo Hodnocení - část A Hodnocení - část B Hodnocení - část A+B

UŽIVATELSKÁ PŘÍRUČKA K INTERNETOVÉ VERZI REGISTRU SČÍTACÍCH OBVODŮ A BUDOV (irso 4.x) VERZE 1.0

Objektově orientované databáze. Miroslav Beneš

ZKUŠENOSTI S AUTOMATIZACÍ CITAČNÍ ANALÝZY NA ZAKONECHPROLIDI.CZ. Pavel Gardavský/AION CS, s.r.o

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

INTLIB. Osnova. Projekt (TA /Inteligentní knihovna) je řešen s finanční podporou TA ČR. ! Legislativní doména

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group

Database engine (databázový stroj, databázový motor, databázové jádro) Systém řízení báze dat SŘBD. Typy SŘBD podle způsobu práce s daty

Inteligentní systémy (TIL) Marie Duží

Transkript:

Ontologie Otakar Trunda

Definice Mnoho různých definic: Formální specifikace sdílené konceptualizace Hierarchicky strukturovaná množina termínů popisujících určitou věcnou oblast Strukturovaná slovní zásoba Logická teorie v jazyce podporujícím definování konceptů Grafová struktura nad pojmy

Dělení ontologií

Dělení podle oborových oblastí Terminologické ontologie Tezaury Strukturace termínů přirozeného jazyka Informační ontologie Nadstavba nad datovými zdroji Odpovídají DB schématům Znalostní ontologie Reprezentace znalostí, logické odvozování

Dělení podle předmětu formalizace Generické ontologie Obecná problematika napříč věcnými oblastmi Doménové ontologie Znalosti o určité doméně Úlohové ontologie Způsob řešení určité úlohy Diagnostika, plánování,

Struktura ontologie Třídy Individua Sloty relace, funkce a atributy Facety omezení na sloty Primitivní hodnoty a datové typy Axiomy a odvozovací pravidla

Struktura ontologie - příklad

Facety omezení slotů Typická omezení slotů: Definiční obor, obor hodnot Požadované vlastnosti relací. Např.: Tranzitivita, symetrie, funkčnost Vzájemně inverzní sloty JeRodičem inverzní k JeDítětem Dědičnost na slotech JeRodičem IS-A JePředkem

Axiomy a pravidla Zejména u ontologií založených na deskripční logice Třídy a sloty definované implicitně Axiomy: (např.) Ekvivalence/Subsumpce tříd a relací Disjunktnost tříd Rozklad na podtřídy atd. Pravidla Dopředné a/nebo zpětné řetězení Umožňují provádět odvozování

Základní odvozovací úlohy Kontrola konzistence znalostní báze zjišťuje, zda definice každého konceptu připouští náležení alespoň jednoho individua. Kontrola individuí zjišťuje, zda dané individuum spadá pod daný koncept. Realizace nalezne nespecifičtější koncept, pod který individuum spadá. Vyhledání nalezne všechna individua spadající pod zadaný koncept. Kontrola subsumpce zjišťuje, zdali je jeden zadaný koncept podkonceptem druhého.

Rozdíly oproti OOP Třídy pouze jako unární relace Individua x instance Sloty nezávislé na třídách Dědičnost OOP: znovupoužití kódu Ontologie: zachycení reality Příslušnost k třídám a slotům může být zadána implicitně Relace na slotech

Požadované vlastnosti ontologie Odpovídající realitě Konsensuální, obecně přijímaná Srozumitelná člověku, dále sdílitelná Znovupoužitelná, a to i nepředjímaným způsobem Bohatě strukturovaná Formálně popsaná, strojově zpracovatelná Logicky konzistentní

Využití ontologií Společné porozumění struktuře informací mezi lidmi nebo softwarovými agenty Nejčastější využití. Sémantický web Znovupoužití doménové znalosti Např. reprezentace času Explicitní popis předpokladů o doméně Oddělení znalosti o doméně od manipulace se znalostmi Analýza domény

Odbočka - filozofická ontologie Ontologie - věda o jsoucnu, o tom co je Ogden-Richardsův trojúhelník

Odbočka - filozofická ontologie Ontologie v informatice někdy považované za aplikovanou filozofii Témata tradiční (filozofické) ontologie: Esenciální / neesenciální vlastnosti Problém změny (kdy je změna entity taková, že je nutno ji reklasifikovat) Problém identity (kdy různé identifikátory odkazují k téže entitě) Leibnizův zákon identity Problém obecnin

Odbočka - filozofická ontologie Vlastnosti objektů: Esenciální - to, co dělá danou věc, tím čím je. (Například člověka člověkem, strom stromem atd.) Jednotliví lidé se navzájem liší neesenciálními vlastnostmi (věk, pohlaví, výška, váha, barva atd.) Leibnizův zákon identity: Zákon stejnosti identických x y [( x = y) ( P( P( x) P( y))) ] Zákon identity stejných [( P( P( x) P( y))) ( x y) ] x y =

Sémantický web

Struktura současného webu Obrovské množství informací a služeb Stávající způsob vyhledávání je nedostatečný Informace dostupné pouze pro člověka, strojové zpracování obtížné (lingvistické aspekty apod.) Webové služby také určené primárně pro člověka, jejich využití agenty je problematické (standardizovaný formát)

Textové vyhledávání na webu

Sémantický web Idea: informace srozumitelné jak pro člověka, tak pro stroje Aplikace by měly rozumět informacím na webu, umět je vyhledávat, zpracovávat a použít Je třeba formálně definovat sémantiku informací pro strojové zpracování Zde se dají využít (doménové) ontologie

Sémantický web - realizace Potřebné nástroje: Jazyk pro popis ontologií Jazyk pro popis sémantiky webových dat (na základě příslušné ontologie) Integrace tohoto jazyka se stávajícími protokoly (html) Databáze standardních ontologií

Sémantický web - realizace Popis ontologií: jazyk OWL Popis sémantiky dat: jazyk RDF Integrace RDF do HTML: pomocí metadat a formátu XML

Tvorba ontologií Editor Protégé Tvorba ontologie je obecně iterativní proces, neexistuje jeden správný postup Různé metodiky, návody, seznam častých chyb, apod. Typická posloupnost kroků: Ujasnění účelu a rozsahu ontologie Specifikace terminologické části Odlišení ontologických typů Specifikace taxonomie Vytvoření netaxonomických relací, atributů a instancí Specifikace pokročilých axiomů Nasazení a údržba ontologie

Ujasnění účelu a rozsahu Formulace obecných scénářů a případů užití Konkrétní vzorové kompetenční otázky Co by mělo být možné s pomocí ontologie zodpovědět? Vyvarovat se bezbřehosti (tzv. hugeness problem ) Současně ale zachovat otevřenost pro prozatím neřešené aplikace (znovupoužití)

Specifikace terminologické části Východiskem pro vývoj ontologie bývá seznam relevantních termínů Například seznam všech podstatných jmen a sloves v textu popisujícím danou doménu Možnost již v této fázi využít podporu automatickým nástrojem text-mining

Odlišení ontologických typů Třídy, instance, relace, atributy Zpravidla existuje více možností! Typicky podstatná jména odpovídají třídám a atributům, slovesa pak relacím (neplatí vždy) Postupuje se od návrhu tříd a jejich hierarchie Je možné využít některé již definované ontologie

Učení ontologií Zejména pro extrakci relevantních termínů Učení probíhá na základě textu, popisujícího cílovou doménu Používané techniky: 1. Syntaktická analýza - zejména odlišení podstatných a přídavných jmen a sloves 2. Vytvoření distribučního modelu pro slova a víceslovné výrazy 3. Použití statistických metod strojového učení a dobývání znalostí (text-mining), zejména shlukové analýzy

Extrahované znalosti Termíny definující třídy Hierarchie tříd Buď pomocí slovníku subsumpcí nebo použitím tzv. Harrisovy distribuční hypotézy Atributy tříd a jejich obory hodnot Obecné relace mezi třídami Využití pokročilé lingvistické analýzy Takto získaný model slouží jako základ pro další zpracování člověkem!

Děkuji za pozornost