Inference v deskripčních logikách

Podobné dokumenty
Deskripční logika. Petr Křemen FEL ČVUT. Petr Křemen (FEL ČVUT) Deskripční logika 37 / 157

Výroková a predikátová logika - V

Predik atov a logika - pˇredn aˇska () Predik atov a logika - pˇredn aˇska / 16

Základy logiky a teorie množin

Výroková a predikátová logika - III

Konstrukce relace. Postupně konstruujeme na množině všech stavů Q relace i,

Výroková a predikátová logika - II

Výroková a predikátová logika - IV

Výroková a predikátová logika - IX

Výroková a predikátová logika - II

Výroková a predikátová logika - X

Výroková a predikátová logika - IX

Výroková a predikátová logika - VIII

Modely Herbrandovské interpretace

Výroková a predikátová logika - VII

Výroková logika - opakování

Logika. 6. Axiomatický systém výrokové logiky

Výroková a predikátová logika - III

postaveny výhradně na syntaktické bázi: jazyk logiky neinterpretujeme, provádíme s ním pouze syntaktické manipulace důkazy

Výroková a predikátová logika - VIII

Matematická logika. Miroslav Kolařík

Každé formuli výrokového počtu přiřadíme hodnotu 0, půjde-li o formuli nepravdivou, a hodnotu 1, půjde-li. α neplatí. β je nutná podmínka pro α

Formální systém výrokové logiky

1 Pravdivost formulí v interpretaci a daném ohodnocení

Systém přirozené dedukce výrokové logiky

10 Přednáška ze

PQ-stromy a rozpoznávání intervalových grafů v lineárním čase

Petr Křemen. Katedra kybernetiky, FEL ČVUT. Petr Křemen (Katedra kybernetiky, FEL ČVUT) Sémantické sítě a rámce 1 / 112

Výroková a predikátová logika - IX

Výroková a predikátová logika - II

Hilbertovský axiomatický systém

teorie logických spojek chápaných jako pravdivostní funkce

TOPOLOGIE A TEORIE KATEGORIÍ (2017/2018) 4. PREDNÁŠKA - SOUČIN PROSTORŮ A TICHONOVOVA VĚTA.

Úvod do informatiky. Miroslav Kolařík

Matematická logika. Miroslav Kolařík

Principy indukce a rekurentní rovnice

Logické programy Deklarativní interpretace

1 Lineární prostory a podprostory

Výroková a predikátová logika - XII

Výroková a predikátová logika - VII

popel, glum & nepil 16/28

Matematická logika. Rostislav Horčík. horcik

Výroková logika. Teoretická informatika Tomáš Foltýnek

Sémantika predikátové logiky

ROZHODOVACÍ PROCEDURY A VERIFIKACE PAVEL SURYNEK, KTIML

Výroková a predikátová logika - X

Umělá inteligence I. Roman Barták, KTIML.

vhodná pro strojové dokazování (Prolog) metoda založená na vyvracení: dokazuje se nesplnitelnost formulí

Základy teorie množin

1 REZOLUČNÍ FORMÁLNÍ DŮKAZY

Regulární výrazy. Definice Množina regulárních výrazů nad abecedou Σ, označovaná RE(Σ), je definována induktivně takto:

5 Orientované grafy, Toky v sítích

Predikátová logika. Z minula: 1. jazyk logiky 1. řádu. 2. term a formule. 3. interpretace jazyka (relační struktura) 4. Tarského definice pravdy

Principy indukce a rekursivní algoritmy

Logika a logické programování

4. NP-úplné (NPC) a NP-těžké (NPH) problémy

Vztah teorie vyčíslitelnosti a teorie složitosti. IB102 Automaty, gramatiky a složitost, /31

Další NP-úplné problémy

Problém obchodního cestujícího(tsp) Vstup: Množina n měst a vzdálenosti mezi nimi. Výstup: Nejkratší okružní cesta procházející všemi městy.

Problémy třídy Pa N P, převody problémů

Predikátová logika. prvního řádu

Reprezentace znalostí. Katedra kybernetiky, ČVUT v Praze.

Usuzování za neurčitosti

Vrcholová barevnost grafu

Rezoluční kalkulus pro výrokovou logiku

Stromové rozklady. Definice 1. Stromový rozklad grafu G je dvojice (T, β) taková, že T je strom,

Negativní informace. Petr Štěpánek. S použitím materiálu M.Gelfonda a V. Lifschitze. Logické programování 15 1

Grafy. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 13.

NP-ÚPLNÉ PROBLÉMY. Doc. RNDr. Josef Kolář, CSc. Katedra teoretické informatiky, FIT České vysoké učení technické v Praze

Obsah Předmluva Rekapitulace základních pojmů logiky a výrokové logiky Uvedení do predikátové logiky...17

= je prostý orientovaný graf., formálně c ( u, v) 0. dva speciální uzly: zdrojový uzel s a cílový uzel t. Dále budeme bez

Algoritmus pro hledání nejkratší cesty orientovaným grafem

Základní pojmy matematické logiky

Místo pojmu výroková formule budeme používat zkráceně jen formule. Při jejich zápisu

V předchozí kapitole jsme podstatným způsobem rozšířili naši představu o tom, co je to číslo. Nadále jsou pro nás důležité především vlastnosti

Úvod do TI - logika Výroková logika - pokračování (3.přednáška) Marie Duží

Naproti tomu gramatika je vlastně soupis pravidel, jak

0. ÚVOD - matematické symboly, značení,

15. Moduly. a platí (p + q)(x) = p(x) + q(x), 1(X) = id. Vzniká tak struktura P [x]-modulu na V.

Tableaux metody. Jiří Vyskočil 2011

Predikátová logika: Axiomatizace, sémantické stromy, identita. (FLÚ AV ČR) Logika: CZ.1.07/2.2.00/ / 13

Složitost 1.1 Opera ní a pam ová složitost 1.2 Opera ní složitost v pr rném, nejhorším a nejlepším p ípad 1.3 Asymptotická složitost

Rekurentní rovnice, strukturální indukce

Lineární programování

Generující kořeny cyklických kódů. Generující kořeny. Alena Gollová, TIK Generující kořeny 1/30

6 Lineární geometrie. 6.1 Lineární variety

Lineární algebra Kapitola 1 - Základní matematické pojmy

FIT ČVUT MI-LOM Lineární optimalizace a metody. Dualita. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Množiny, relace, zobrazení

1 Výroková logika 1. 2 Predikátová logika 3. 3 Důkazy matematických vět 4. 4 Doporučená literatura 7

Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Booleovy algebry. Irina Perfilieva. logo

Rezoluce ve výrokové logice

8 Přednáška z

Logika. 5. Rezoluční princip. RNDr. Luděk Cienciala, Ph. D.

NP-úplnost problému SAT

TOPOLOGIE A TEORIE KATEGORIÍ (2017/2018) 3. PREDNÁŠKA - KOMPAKTNÍ PROSTORY.

Definice. Vektorový prostor V nad tělesem T je množina s operacemi + : V V V, tj. u, v V : u + v V : T V V, tj. ( u V )( a T ) : a u V které splňují

Databázové systémy. * relační kalkuly. Tomáš Skopal. - relační model

Minimalizace KA - Úvod

Transkript:

Inference v deskripčních logikách Petr Křemen FEL ČVUT Petr Křemen (FEL ČVUT) Inference v deskripčních logikách 53 / 157

Co nás čeká 1 Základy deskripční logiky 2 Jazyk ALC Syntax a sémantika 3 Cyklické a acyklické TBOXy Petr Křemen (FEL ČVUT) Inference v deskripčních logikách 54 / 157

Inference v deskripčních logikách Inference v deskripčních logikách Petr Křemen (FEL ČVUT) Inference v deskripčních logikách 55 / 157

Inference v deskripčních logikách Inferenční problémy pro TBOX Představili jsme si syntax a sémantiku jazyka ALC. Nyní se podívejme na automatické odvozování. Máme ontologii K = (T, A). Pro TBOX T a koncepty C a D nás zajímá, zda (ne)splnitelnost koncept C je nesplnitelný, tedy T = C? subsumpce koncept C je obecnější než D, tedy T = D C? ekvivalence dva koncepty C a D jsou ekvivalentní, tedy T = C D? disjunktnost dva koncepty C a D jsou disjunktní, tedy T = C D? Všechny tyto úlohy lze redukovat na kontrolu splnitelnosti jednoho konceptu. Petr Křemen (FEL ČVUT) Inference v deskripčních logikách 56 / 157

Inference v deskripčních logikách Redukce na nesplnitelnost příklad Příklad Tyto redukce jsou jednoduché, ukažme si, jakým způsobem převést např. subsumpci na nesplnitelnost: (T = C D) iff ( I)(I = T implikuje I = C D) iff ( I)(I = T implikuje C I D I ) iff ( I)(I = T implikuje C I ( I \ D I ) iff ( I)(I = T implikuje I = C D iff (T = C D ) Redukce ostatních inferenčních úloh na nesplnitelnost je analogická vyzkoušejte si. Petr Křemen (FEL ČVUT) Inference v deskripčních logikách 57 / 157

Inference v deskripčních logikách Inferenční problémy pro ABOX... pro ABOX A, axiom α, koncept C, roli R a individuály a,a 0 nás zajímá consistency checking zda je ABOX A konzistentní vzhledem k T, tedy pokud K je konzistentní. instance checking zda platí T A = C(a)? role checking zda platí T A = R(a, a 0 )? instance retrieval nalezení množiny všech individuálů a 1, pro které T A = C(a 1 ). realization nalezení nejspecifičtějšího konceptu C z předem dané množiny konceptů takového, že T A = C(a). Všechny tyto inferenční problémy, stejně tak jako ověření nesplnitelnosti konceptu lze redukovat na ověření konzistence A vzhledem k T. Za jakých podmínek a jak? Petr Křemen (FEL ČVUT) Inference v deskripčních logikách 58 / 157

Petr Křemen (FEL ČVUT) Inference v deskripčních logikách 59 / 157

Algoritmy strukturálního porovnávání jsou polynomiální, ale úplné pouze pro některé jednoduché DL bez úplné negace, např. ALN, viz.[bcm + 03]. Tablové algoritmy jsou SoA algoritmy pro komplexní DL korektní, úplné, pracující v konečném čase, viz. [HS03], [HS01], [BCM + 03]. jiné... např. algoritmy založené na rezoluci [Hab06], převodu na konečné automaty [BCM + 03], apod. My si dále podrobněji představíme právě tablové algoritmy. Petr Křemen (FEL ČVUT) Inference v deskripčních logikách 60 / 157

Tablové algoritmy Tablové algoritmy (TA) slouží k ověřování konzistence ABOXu vzhledem k TBOXu. Nejedná se o žádnou novinku v deskripčních logikách TA byly známy již pro FOL. Hlavní myšlenka je jednoduchá: Máme-li ověřit konzistenci daného ABOXu A vzhledem k TBOXu T, pokusme se sestrojit model T A. Pokud se nám to podaří, víme, že A je konzistentní vzhledem k T Na každý tablový algoritmus lze vlastně nahĺıžet jako na produkční systém : Stav TA ( báze dat) je tvořen množinou grafů zúplnění, inferenční pravidla ( produkční pravidla) implementují sémantiku jednotlivých konstruktů daného jazyka, např.,, apod., a slouží k populaci grafů zúplnění podle zvolené strategie pro aplikaci pravidel Kontrolní otázka: Co je to RETE algoritmus? Petr Křemen (FEL ČVUT) Inference v deskripčních logikách 61 / 157

Graf zúplnění je ohodnocený orientovaný graf G = (V G, E G, L G )), kde každý uzel x V G je ohodnocen množinou L G (x) konceptů a každá hrana x, y E G je ohodnocena množinou hran L G ( x, y ) 5 Přímý spor se vyskytuje v grafu zúplnění G = (V G, E G, L G )), pokud {A, A} L G (x), nebo L G (x), pro nějaký atomický koncept A a uzel x V G Úplný graf zúplnění je takový graf zúplnění G = (V G, E G, L G )), na který nelze aplikovat žádné pravidlo z množiny pravidel daného tablového algoritmu. Definujme též I = G iff I = A G, kde A G je ABOX vytvořený z G, který obsahuje C(a) pro každý vrchol a V G a každý C L G (a) a R(a, b) pro každou hranu a, b E G a každou R L G (a, b) a Pozor na záměnu. Co je to úplný graf v teorii grafů? 5Petr Křemen (FEL ČVUT) Inference v deskripčních logikách 62 / 157 Grafy zúplnění (completion graphs)

bez TBOXu máme K = (T, A). Uvažujme zatím pro jednoduchost, že T =. 0 (Předzpracování) Transformuj všechny koncepty, které se vyskytují v K do tzv. negační normální formy (NNF). Jedná se o aplikaci ekvivalentních úprav známých z výrokové a predikátové logiky, po jejichž aplikace se negace vyskytuje pouze před atomickými koncepty. Např. (A B) se vyjádří pomocí de Morganových pravidel jako A B). 1 (Inicializace) Počáteční stav algoritmu je S 0 = {G 0 }, kde G 0 = (V G0, E G0, L G0 ) je obrazem A: pro každý C(a) je a V G0 a C L G0 (a) pro každý R(a, b) je a, b E G0 a R L G0 (a, b) množiny V G0, E G0, L G0 jsou nejmenší s těmito vlastnostmi. Petr Křemen (FEL ČVUT) Inference v deskripčních logikách 63 / 157

bez TBOXu (2)... 2 (Test konzistence) Aktuální stav tablového algoritmu označme S. Pokud každý G S obsahuje přímý spor, potom algoritmus končí s výsledkem NEKONZISTENTNÍ 3 (Test modelu) Vybereme jeden G S, který neobsahuje přímý spor. Je-li G úplný vzhledem k pravidlům uvedeným dále, potom algoritmus končí s výsledkem KONZISTENTNÍ 4 (Aplikace pravidla) Nalezneme pravidlo, které ja na G aplikovatelné - aplikací tohoto pravidla získáme ze stavu S nový stav S a algoritmus pokračuje bodem 2. Petr Křemen (FEL ČVUT) Inference v deskripčních logikách 64 / 157

TA pro ALC bez TBOXu odvozovací pravidla pravidlo if (C 1 C 2 ) L G (a) a {C 1, C 2 } L G (a) pro nějaké a V G. then S = S {G } \ {G}, kde G = (V G, E G, L G ), a L G (a) = L G (a) {C 1, C 2 } a jinak se shoduje s L G. pravidlo if (C 1 C 2 ) L G (a) a {C 1, C 2 } L G (a) = pro nějaké a V G. then S = S {G 1, G 2 } \ {G}, kde G (1 2) = (V G, E G, L G(1 2) ), a L G(1 2) (a) = L G (a) {C (1 2) } a jinak se shoduje s L G. pravidlo if ( R C) L G (a) a neexistuje b V G takové, že R L G (a, b) a současně C L G (b). then S = S {G } \ {G}, kde G = (V G {b}, E G { a, b }, L G ), a L G (b) = {C}, L G (a, b) = {R} a jinak se shoduje s L G. pravidlo if ( R C) L G (a) a existuje b V G takové, že R L G (a, b) a současně C / L G (b). then S = S {G } \ {G}, kde G = (V G, E G, L G ), a L G (b) = L G (b) {D} a jinak se shoduje s L G. Petr Křemen (FEL ČVUT) Inference v deskripčních logikách 65 / 157

Je představený TA konečný? Konečnost je snadným důsledkem následujících faktů : K je konečná stav tablového algoritmu můžeme v každém kroku obohatit o nejvýše jeden graf zúplnění a to pouze po aplikaci pravidla. Počet disjunkcí v K je konečný, tedy i toto pravidlo může být aplikovánou pouze konečněkrát. pro každý graf zúplnění G = (V G, E G, L G ) platí, že počet vrcholů v V G je nejvýše rovna počtu individuálů v A plus počet existenciálních kvantifikátorů v A. po aplikaci libovolného z pravidel,, se bud v G vytvoří nová hrana, nový vrchol, nebo se přidá ohodnocení k existujícímu vrcholu či hraně. Všechny tyto operace jsou konečné. Petr Křemen (FEL ČVUT) Inference v deskripčních logikách 66 / 157

Je představený TA korektní? Korektnost ověříme rovněž snadno. Vezmeme-li libovolnou I = A Gi, potom musí I = A Gi+1. Musíme ukázat, že aplikací každého z pravidel zachováme splnitelnost. Jako příklad vezměme pravidlo: Před aplikací pravidla platilo pro a V Gi, že ( R C) L Gi (a). Tedy a I ( R C) I. Tedy v I musí existovat nějaký i, pro který a I, i R I a současně i C I. Aplikací pravidla jsme vytvořili v G i+1 nový vrchol b a upravili ohodnocení hrany a, b a vrcholu b. Stačí tedy, položíme-li i = b I a vidíme, že po aplikaci pravidla jsme pouze zhmotnili doménový element, který jinak v interpretaci musí být vždy přítomen na základě sémantiky konstruktu. Pravidlo je tedy korektní. Pro ostatní pravidla bychom korektnost ukázali stejným způsobem. Petr Křemen (FEL ČVUT) Inference v deskripčních logikách 67 / 157

Je představený TA úplný? Pro dokázání úplnosti musíme zkonstruovat model pro káždý úplný graf zúplnění G, který neobsahuje přímý spor. Kanonický model I můžeme zkonstruovat takto: Doménu I budou tvořit všechny vrcholy grafu G. Pro každý atomický koncept A definujeme A I = {a A L G (a)} Pro každou atomickou roli R definujeme R I = { a, b R L G (a, b)} Je zřejmé, že I je modelem A G. Indukcí dozadu podle aplikovaných pravidel lze ukázat, že musí být též modelem každého předchozího kroku a ve výsledku tedy i A. Petr Křemen (FEL ČVUT) Inference v deskripčních logikách 68 / 157

Několik poznámek k TA Proč jsme vlastně používali pojem graf zúplnění? Nestačí nám držet si stav tablového algoritmu v ABOXu? Pro námi představený algoritmus bychom si ABOXy opravdu vystačili! My jsme zavedli grafy zúplnění jednak proto, že grafová reprezentace je názornější, především však proto, že v případě TA pro ALC a složitější logiky nám již ABOX pro reprezentaci stavu reasoneru bohužel nestačí. Jak je to s komplexitou představeného algoritmu? Spokojíme se s konstatováním (bez důkazu), že se jedná o problém ve třídě P-SPACE. Petr Křemen (FEL ČVUT) Inference v deskripčních logikách 69 / 157

Příklad běhu TA Example Ověřme konzistenci ontologie K 2 = (, A 2 ), kde A 2 = {( madite Muz madite Prarodic madite (Muz Prarodic))(JAN)}). Převedeme zmíněný koncept do NNF: madite Muz madite Prarodic madite ( Muz Prarodic) Počáteční stav G 0 tablového algoritmu je tedy Petr Křemen (FEL ČVUT) Inference v deskripčních logikách 70 / 157

Příklad běhu TA (2) Example... Nyní se vykonají 4 sekvence kroků 2,3,4 tablového algoritmu, které můžeme znázornit vývojem stavu během kroku 4: {G 0 } -pravidlo {G 1 } -pravidlo {G 2 } -pravidlo {G 3 } -pravidlo {G 4 }, kde G 4 je Petr Křemen (FEL ČVUT) Inference v deskripčních logikách 71 / 157

Příklad běhu TA (3) Example... Dosud jsme prováděli pouze deterministická pravidla (máme stále jediný graf zúplnění). Nyní není žádné deterministické pravidlo již aplikovatelné. Nyní můžeme použít -pravidlo, a to na koncept Muz Rodic bud v ohodnocení vrcholu 0, nebo v ohodnocení vrcholu 1. Jeho aplikací např. na 1 získáme stav {G 5, G 6 } (G 5 vlevo, G 6 vpravo) Petr Křemen (FEL ČVUT) Inference v deskripčních logikách 72 / 157

Příklad běhu TA (4) Example... Vidíme, že G 5 obsahuje přímý spor ve vrcholu 1. Zbývá tedy vyšetřit graf G 6. Aplikací -pravidla získáme stav {G 5, G 7, G 8 }, kde G 7 (vlevo), G 8 (vpravo) vznikly z G 6 : G 7 je již úplný a bez přímého sporu. Petr Křemen (FEL ČVUT) Inference v deskripčních logikách 73 / 157

Příklad běhu TA (5) Example... Z G 7 můžeme vytvořit kanonický model I 2. Jedná se o jediný model K 2? I 2 = {Jan, i 1, i 2 }, madite I 2 = { Jan, i 1, Jan, i 2 }, Prarodic I 2 = {i 1 }, Muz I 2 = {i 2 }, JAN I 2 = Jan, 0 I 2 = i 2, 1 I 2 = i 1, Petr Křemen (FEL ČVUT) Inference v deskripčních logikách 74 / 157

Obecné inkluze Ukázali jsme si tablový algoritmus pro konzistenci K = (, A). My však již umíme použít stejný algoritmus i pro některé neprázdné TBOXy. Jaké? Jak se však změní situace pro obecnou K = (T, A)? Máme T obsahující axiomy ve tvaru C i D i pro 1 i n. Takový TBOX lze transformovat do jediného axiomu C kde C označuje koncept ( C 1 D 1 )... ( C n D n ) Pro každý model I ontologie K musí každý element I patřit do interpretace konceptu na pravé straně. Jak toho docílit? Petr Křemen (FEL ČVUT) Inference v deskripčních logikách 75 / 157

Obecné inkluze (2) Co třeba takto? pravidlo if C / L G (a) pro nějaké a V G. then S = S {G } \ {G}, kde G = (V G, E G, L G ), a L G (a) = L G (a) { C } a jinak se shoduje s L G. Příklad Uvažujme K 3 = ({Muz marodice Muz}, A 2 ). Potom C je Muz marodice Muz. Použijme nyní dříve představený tablový algoritmus a obohacený o pravidlo. Několikerou aplikací sekvence pravidel,, na G 7 (který již není úplný vzhledem k pravidlu) z předchozího příkladu dostáváme... Petr Křemen (FEL ČVUT) Inference v deskripčních logikách 76 / 157

... tento algoritmus nemusí skončit. Petr Křemen (FEL ČVUT) Inference v deskripčních logikách 77 / 157 Obecné inkluze (3) Příklad

Blokování v TA TA se snaží nalézt nekonečný model. Je tedy jej třeba přinutit, aby tento nekonečný model reprezentoval konečným grafem zúplnění. Mechanismu, který vynutí reprezentaci nekonečného modelu konečným grafem zúplnění, se říká blokování. Blokování zajišt uje, že odvozovací pravidla bude možné aplikovat jen dokud se nezačnou jimi prováděné změny dostatečně pravidelně opakovat. Pro ALC lze ukázat, že dostačuje tzv. podmnožinové blokování: V grafu zúplnění G je vrchol x (nevyskytující se v ABOXu A) blokován vrcholem y, vede-li orientovaná cesta od y k x a L G (x) L G (y). Všechna inferenční pravidla je možné aplikovat pouze, není-li vrchol a v jejich definici blokován jiným vrcholem. Petr Křemen (FEL ČVUT) Inference v deskripčních logikách 78 / 157

Blokování v TA (2) V předchozím příkladu tedy blokování zabezpečí, že vrchol 2 je blokován vrcholem 0 a k další expanzi již nedojde. Jakému modelu takovýto graf zúplnění odpovídá? Představený TA s podmnožinovým blokováním je již korektní, úplnou a konečnou rozhodovací procedurou pro jazyk ALC. Petr Křemen (FEL ČVUT) Inference v deskripčních logikách 79 / 157

Pohrajme si... http://krizik.felk.cvut.cz/km/dl/index.html Petr Křemen (FEL ČVUT) Inference v deskripčních logikách 80 / 157