PLIN021 Sémantická analýza v praxi

Podobné dokumenty
Ontologie. Otakar Trunda

Metody tvorby ontologií a sémantický web. Martin Malčík, Rostislav Miarka

Petr Křemen. Katedra kybernetiky, FEL ČVUT. Petr Křemen (Katedra kybernetiky, FEL ČVUT) Sémantické sítě a rámce 1 / 112

Nepravidlové a hybridní znalostní systémy

(#%ist #%LargeCorpInternalsMt #%ForAll x (#%HumanResourcesDepartment #%allinstances (#%actsincapacity x #%mediatorinprocesses #%EmployeeHiring

Znalostní modelování

Dokumentační služba projektu MediGrid

6 Objektově-orientovaný vývoj programového vybavení

Reprezentace znalostí. Katedra kybernetiky, ČVUT v Praze.

Korpusová lingvistika a počítačové zpracování přirozeného jazyka

Workshop k terminologickým otázkám organizace znalostí Motivace a hypotézy projektu. Cíl projektu NAKI DF13P01OVV013

Logika pro sémantický web

1. Znalostní systémy a znalostní inženýrství - úvod. Znalostní systémy. úvodní úvahy a předpoklady. 26. září 2017

Témata této a příští přednášky. Důležité pojmy. Modelování a organizace znalostí aneb

Výroková logika syntaxe a sémantika

Klasické a moderní ontologie při popisu lékařských algoritmů. Lesný P., Vejvalka J.

Ontologie a OWL. Prof. Ing. Vojtěch Svátek, Dr. Zimní semestr

Logický důsledek. Petr Kuchyňka

2. Konceptuální model dat, E-R konceptuální model

Deskripční logika. Petr Křemen FEL ČVUT. Petr Křemen (FEL ČVUT) Deskripční logika 37 / 157

Aplikace s odvozováním nad ontologiemi

Matematická logika. Lekce 1: Motivace a seznámení s klasickou výrokovou logikou. Petr Cintula. Ústav informatiky Akademie věd České republiky

Formální konceptuální analýza

Šeptáková, Šarmanová

Ontologie, OWL a deskripční logika

Soustředí se na reprezentaci konceptů a vztahů (relací) mezi nimi. Používají grafickou reprezentaci, koncepty jsou uzly grafu, relace

Sémantický web 10 let poté

Znalostní systém nad ontologií ve formátu Topic Maps

Formálnílogickésystémy pro aplikaci v informatice Martin Žáček

Objektově orientovaný přístup

04 Sémantika I (reprezentace lexikálního významu) Karel Pala, Zuzana Nevěřilová. Centrum ZPJ, FI MU, Brno

Reprezentace a vyvozování znalostí

04 Sémantika I (reprezentace lexikálního významu) Karel Pala, Zuzana Nevěřilová. Centrum ZPJ, FI MU, Brno

Dokumentační služba projektu Medigrid : dokumentování sémantiky lékařských dat

Historie a vývoj umělé inteligence

Metadata, sémantika a sémantický web. Ing. Vilém Sklenák, CSc.

Použ ití konžolové č á sti áplikáčé XRéásonér

PŘEDMĚT: ORGANIZACE ZNALOSTÍ PŘEDNÁŠEJÍCÍ: SILVIE KOŘÍNKOVÁ PRESOVÁ

Předzpracovnání dokumentů a tvorba doménového modelu z nich. Petr Šaloun VŠB-Technická univerzita Ostrava FEI, katedra informatiky

Získávání a reprezentace znalostí

Sémantický web a extrakce

Web 2.0 vs. sémantický web

Matematická logika. Miroslav Kolařík

Logika a jazyk. filosofický slovník, Praha:Svoboda 1966)

DBS Konceptuální modelování

GISON: ontologická integrace urbanistických datových sad IPR

Petr Křemen FEL ČVUT. Petr Křemen (FEL ČVUT) Od sémantických sítí k logickým formalismům 1 / 161

Znalostní báze pro obor organizace informací a znalostí

vyvozování znalostí (reasoning) zpracovává znalosti uložené v bázi znalostí (knowledge base, KB) a odpovědi na dotazy

Modifikace: atributivní použití adjektiv, druhy adjektiv,

B i n á r n í r e l a c e. Patrik Kavecký, Radomír Hamřík

Konceptualizace, komunikace a reprezentace znalostí

Usuzování za neurčitosti

Znalostní báze pro obor organizace informací a znalostí

MATEMATICKÁ TEORIE ROZHODOVÁNÍ

UML. Unified Modeling Language. Součásti UML

Modely datové. Další úrovní je logická úroveň Databázové modely Relační, Síťový, Hierarchický. Na fyzické úrovni se jedná o množinu souborů.

Modely Herbrandovské interpretace

Negativní informace. Petr Štěpánek. S použitím materiálu M.Gelfonda a V. Lifschitze. Logické programování 15 1

1. Dědičnost a polymorfismus

VÝUKOVÝ MATERIÁL. Bratislavská 2166, Varnsdorf, IČO: tel Číslo projektu

5 Orientované grafy, Toky v sítích

Ontologie v e-commerce

Ostravská univerzita, Přírodovědecká fakulta, 30. dubna 22, Ostrava,

Informační systémy 2008/2009. Radim Farana. Obsah. Nástroje business modelování. Business modelling, základní nástroje a metody business modelování.

Návrh ROLAP databáze v zemědělském podniku: Transformace ekonometrického modelu do konceptuálního modelu dat

Grafy. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 13.

Ontologie jako součást sémantického webu

Úvod do expertních systémů

Analýza podkladů pro návrh datového VF XML DTM DMVS

Tvorba informačních systémů

Matematická logika. Miroslav Kolařík

pseudopravděpodobnostní Prospector, Fel-Expert

Modely a sémantika. Petr Šaloun VŠB-Technická univerzita Ostrava FEI, katedra informatiky

Analýza a modelování dat. Helena Palovská

POLOPROVOZ ZNALOSTNÍ DATABÁZE INTERPI DOKUMENTACE

VÝUKOVÝ MATERIÁL. Bratislavská 2166, Varnsdorf, IČO: tel Číslo projektu

Úvod do logiky a logického programování.

4IZ440 Propojená data na webu Organizační a kontextový úvod

Architektura počítačů

Reprezentace znalostí - úvod

postaveny výhradně na syntaktické bázi: jazyk logiky neinterpretujeme, provádíme s ním pouze syntaktické manipulace důkazy

Obsah Předmluva Rekapitulace základních pojmů logiky a výrokové logiky Uvedení do predikátové logiky...17

Ontologie. Přednáška z předmětu Socioekonomická geografie pro geomatiku (KMA/SGG) Otakar Čerba Západočeská univerzita

Stanovení relevantních kritérií při volbě reprezentace znalostí

Výroková a predikátová logika - VI

Věcné zpracování a zpřístupnění informačních zdrojů Marie Balíková Národní knihovna ČR

Výměnný formát XML DTM DMVS PK

MATEMATICKÁ TEORIE ROZHODOVÁNÍ

odpilotovaných materiálů v šabloně Datum pilotáže Třída v pilotáži KAD1, KOS1, IK1,AZ1,AZ2,IK3,KPO2,PO3,K3A,KČ3A,KČ3B,A3

Kapitola 1: Úvod. Systém pro správu databáze (Database Management Systém DBMS) Účel databázových systémů

Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/ Vzdělávání v informačních a komunikačních technologií

Logický datový model VF XML DTM DMVS

Prolog PROgramming in LOGic část predikátové logiky prvního řádu rozvoj začíná po roce 1970 Robert Kowalski teoretické základy Alain Colmerauer, David

Databázové patterny. MI-DSP 2013/14 RNDr. Ondřej Zýka,

Databázové systémy trocha teorie


REPREZENTACE ZNALOSTÍ

InternetovéTechnologie

Střední průmyslová škola Zlín

Transkript:

PLIN021 Sémantická analýza v praxi OP VK Mezi bohemistikou a informatikou www.projekt-inova.cz Zuzana Nevěřilová xpopelk@fi.muni.cz Centrum zpracování přirozeného jazyka, B203 Fakulta informatiky, Masarykova univerzita 22. dubna 2013

Taxonomie Sémantické sítě Odvozování Existující sémantické sítě Sémantické rámce

Ontologie O. je značně nadužívaný pojem, v informatice znamená formální a explicitní specifikaci sdílené konceptualizace [Gruber, 2009] formální explicitní sdílené pojmy

Ontologie 2013-04-22 PLIN021 Sémantická analýza v praxi Ontologie O. je značně nadužívaný pojem, v informatice znamená formální a explicitní specifikaci sdílené konceptualizace [Gruber, 2009] formální explicitní sdílené pojmy Ontologie se skládá z uvedených součástí a má uvedené vlastnosti, jinak ale může mít libovolný tvar. O. můžeme chápat jako nadpojem pro taxonomie, sémantické sítě atd. Bohužel kvůli nadužívání termínu v mnoha oblastech se setkáme s odmítáním zařadit určité projekty pod pojem ontologie. Vždy, když se hovoří o o., je potřeba ujasnit si, co tím myslíme. Nám v tomto kurzu bude stačit tento jednoduchý pohled a budeme se soustředit hlavně na různé tvary a využití o.

Ontologie slovník (glosář, inventář pojmů... ) taxonomie (tezaurus, inventář relací... )

Taxonomie (stromy) Aristoteles kategorie (všech) entit, které mohou lidé vnímat Porfyrios uspořádal kategorie Carl Linné klasifikace (všech) organismů důležité rysy: uzly jsou třídy (organismů, entit... ), třídy jsou strukturované do stromu (podtřída, nadtřída), uzly na stejné úrovni se vzájemně vylučují (implicitní předpoklad)

Porfyriův strom (John. F. Sowa)

Taxonomie (stromy) relace is a relace member of třída instance Pes je masožravec, nepohrdne však ani ovocem. Alík má rád švestky. Americký prezident je zároveň předsedou vlády. Americký prezident má babičku v Africe.

Taxonomie (stromy) a slovníkové definice klasická definice = genus proximum + differentia specifica Počítač je v informatice elektronické zařízení, které zpracovává data pomocí předem vytvořeného programu. Elektronické zařízení je zařízení, jehož funkce závisí na elektrickém proudu nebo na elektromagnetickém poli.

Sémantické sítě I sémantická síť = reprezentace lexikálních znalostí [Collins and Quillian, 1969]

Sémantické sítě II uzly = entity (třídy nebo instance), jednomu konceptu odpovídá jeden uzel hrany = vztahy mezi uzly (binární relace)

Sémantické sítě nadtyp podtyp, is a, is-a, isa (hypo/hyperonymie) instance třídy, member of část celek, has a (holo/meronymie) upřesnění akce (troponymie) příčina následek...

Sémantické sítě 2013-04-22 PLIN021 Sémantická analýza v praxi Sémantické sítě Sémantické sítě nadtyp podtyp, is a, is-a, isa (hypo/hyperonymie) instance třídy, member of část celek, has a (holo/meronymie) upřesnění akce (troponymie) příčina následek... Jednotlivé podsítě, kde uzly spojují relace jednoho druhu, jsou stromy (tj. taxonomie). Je to docela logické v každém druhu relace máme nějaké uspořádání od nejmenšího po největší. Např. nadtyp podtyp je klasická taxonomie. Část celek taky, protože objekt x se skládá z částí a a b, část a se skládá z částí m a n (které jsou patrně menší než a i menší než x).

Sémantické sítě 2013-04-22 PLIN021 Sémantická analýza v praxi Sémantické sítě Sémantické sítě nadtyp podtyp, is a, is-a, isa (hypo/hyperonymie) instance třídy, member of část celek, has a (holo/meronymie) upřesnění akce (troponymie) příčina následek... Důležitou vlastností taxonomií (tj. i těch částí sém. sítě, které tvoří taxonomii) je tranzitivita. Využíváme ji v odvozování (viz dál).

Odbočka k odvozování Fakt F = tvrzení s pravdivostní hodnotou (např. ptáci létají) Báze znalostí (knowledge base) KB = (pokud možno konzistentní) soubor faktů (např. ptáci létají, vlaštovka je pták) Pokud z KB plyne F a přidáme další fakt takový, že KB je stále konzistentní, je KB monotónní reprezentace.[allen, 1995] ptáci létají vlaštovka je pták vlaštovka létá

Odbočka k odvozování ptáci létají tučňák je pták tučňák létá kromě tučňáka ptáci létají tučňák je pták NOT(tučňák létá) kromě tučňáka ptáci létají pštros je pták pštros létá kromě tučňáka, pštrosa, mláďat, mrtvých ptáků, ptáků se zraněnými křídly... ptáci létají

Odbočka k odvozování Používáme implicitní pravidlo (default rule), tj. ptáci létají, dokud neřekneme jinak. Uvedeme-li implicitní pravidlo, má přednost před obecným faktem. Ptáci létají, ale tučňák ne.

Sémantické sítě dědičnost odvozování je monotónní

Sémantické sítě dědičnost 2013-04-22 PLIN021 Sémantická analýza v praxi Odvozování Sémantické sítě dědičnost odvozování je monotónní Praktická ukázka dědičnosti a odvozování: 1. silniční vozidlo má (has part) volant 2. dodávka je (isa) silniční vozidlo 3. dodávka má (has part) volant 4. Mercedes Sprinter je (member of) dodávka 5. Mercedes Sprinter má (has part) volant

Sémantické sítě WordNet a EuroWordNet český WordNet Sítě z Wikipedie, dbpedia

Rámce použití Rámce můžeme použít pro desambiguaci slov i celých vět [Laparra and Rigau, 2009].

Rámce použití Rámce můžeme použít pro doplnění implicitní (nezmiňované) znalosti. Koupila jsem ojetou felicii. Byly to vyhozené peníze. koupit: má_činitele člověk/instituce/skupina má_benefaktora člověk/instituce/skupina má_předmět výrobek/nemovitost/zvíře/rostlina/přírodnina má_část činitel dá peníze má_část benefaktor dá předmět

Rámce použití 2013-04-22 PLIN021 Sémantická analýza v praxi Sémantické rámce Rámce použití Rámce můžeme použít pro doplnění implicitní (nezmiňované) znalosti. Koupila jsem ojetou felicii. Byly to vyhozené peníze. koupit: má_činitele člověk/instituce/skupina má_benefaktora člověk/instituce/skupina má_předmět výrobek/nemovitost/zvíře/rostlina/přírodnina má_část činitel dá peníze má_část benefaktor dá předmět Rámce se používají hodně. FrameNet nebo VerbaLex jsou zajímavé i svým velkým rozsahem, nejsou to jen nějaké experimenty s uměle vybranými jevy.

Skripty, scénáře (Abelson) skript: v restauraci, prvky skriptu mohou být rámce host (člověk, není v zaměstnání, má u sebe peníze, sedí na židli, jí jídlo) číšník (člověk, je v zaměstnání) kuchař (člověk, je v zaměstnání) místnost (obsahuje židle, stoly, příjemnou teplotu) jídlo (uvařil kuchař, donesl číšník hostovi) peníze (zaplatil host číšníkovi za jídlo) Pepovi u večeře zazvonil telefon. Chvíli poslouchal, pak položil telefon a opustil restauraci.

Skripty, scénáře (Abelson) Pepovi u večeře zazvonil telefon. Chvíli poslouchal, pak položil telefon a opustil restauraci. Předpokládáme, že mezi položil telefon a opustil restauraci se stalo: Číšník donesl účet. Pepa zaplatil. Pepa se oblékl.

Skripty, scénáře (Abelson) skript: v restauraci host (člověk, není v zaměstnání, má u sebe peníze, sedí na židli, jí jídlo) číšník (člověk, je v zaměstnání) kuchař (člověk, je v zaměstnání) místnost (obsahuje židle, stoly, příjemnou teplotu) jídlo (uvařil kuchař, donesl číšník hostovi) peníze (zaplatil host číšníkovi za jídlo) Usuzování v rámcích může být implicitní (podobné jako v sém. sítích) i speciální pro daný rámec. Usuzování v rámcích může být nemonotónní. Příklad: host zaplatil číšník má u sebe peníze Příklad: každý host musí zaplatit svoji útratu.

Skripty, scénáře (Abelson) skript: v restauraci Skripty popisují typické situace. Stereotypická je i informace o zaplněnosti slotů, např. restaurace musí mít číšníka. Pořadí ve scénáři je chronologické: host přijde do restaurace, objedná si jídlo, kuchař jídlo uvaří, host sní jídlo, host zaplatí číšníkovi... Můžeme nějak měřit vybočení ze stereotypu?

Allen, J. (1995). Natural Language Understanding (2nd ed.). Benjamin-Cummings Publishing Co., Inc., Redwood City, CA, USA. Collins, A. M. and Quillian, M. R. (1969). Retrieval time from semantic memory. Journal of Verbal Learning and Verbal Behavior, 8(2):240 247. Gruber, T. (2009). Ontology. In Liu, L. and Özsu, M. T., editors, Encyclopedia of Database Systems, page 1963 1965. Springer Verlag. Laparra, E. and Rigau, G. (2009). Integrating wordnet and framenet using a knowledge-based word sense disambiguation algorithm. In RANLP, Borovets, Bulgaria.