(#%ist #%LargeCorpInternalsMt #%ForAll x (#%HumanResourcesDepartment #%allinstances (#%actsincapacity x #%mediatorinprocesses #%EmployeeHiring



Podobné dokumenty
Znalostní modelování

Ontologie. Otakar Trunda

Metody tvorby ontologií a sémantický web. Martin Malčík, Rostislav Miarka

Architektura informačních systémů. - dílčí architektury - strategické řízení taktické řízení. operativní řízení a provozu. Globální architektura

Dokumentační služba projektu MediGrid

Smysl metodiky IS/IT. Koncentrovaná zkušenost Checklist na nic nezapomeneme

Dokumentační služba projektu Medigrid : dokumentování sémantiky lékařských dat

1. Znalostní systémy a znalostní inženýrství - úvod. Znalostní systémy. úvodní úvahy a předpoklady. 26. září 2017

Klasické a moderní ontologie při popisu lékařských algoritmů. Lesný P., Vejvalka J.

6 Objektově-orientovaný vývoj programového vybavení

Informační systémy 2008/2009. Radim Farana. Obsah. Nástroje business modelování. Business modelling, základní nástroje a metody business modelování.

Znalostní báze pro obor organizace informací a znalostí

TÉMATICKÝ OKRUH Softwarové inženýrství

Metadata, sémantika a sémantický web. Ing. Vilém Sklenák, CSc.

Vývoj informačních systémů. Obecně o IS

MATURITNÍ OTÁZKY ELEKTROTECHNIKA - POČÍTAČOVÉ SYSTÉMY 2003/2004 PROGRAMOVÉ VYBAVENÍ POČÍTAČŮ

Modely datové. Další úrovní je logická úroveň Databázové modely Relační, Síťový, Hierarchický. Na fyzické úrovni se jedná o množinu souborů.

Znalostní báze pro obor organizace informací a znalostí

Modelování procesů s využitím MS Visio.

MATEMATICKÁ TEORIE ROZHODOVÁNÍ

Architektury Informačních systémů. Jaroslav Žáček

MATEMATICKÁ TEORIE ROZHODOVÁNÍ

Klasické metodiky softwarového inženýrství I N G M A R T I N M O L H A N E C, C S C. Y 1 3 A N W

Architektury Informačních systémů. Jaroslav Žáček

Konceptualizace, komunikace a reprezentace znalostí

2. Modelovací jazyk UML 2.1 Struktura UML Diagram tříd Asociace OCL. 3. Smalltalk 3.1 Jazyk Pojmenování

Obsah. Zpracoval:

Informační systémy 2008/2009. Radim Farana. Obsah. Obsah předmětu. Požadavky kreditového systému. Relační datový model, Architektury databází

10 Metody a metodologie strukturované analýzy

Znalostní systém nad ontologií ve formátu Topic Maps

Kapitola 1: Úvod. Systém pro správu databáze (Database Management Systém DBMS) Účel databázových systémů

Úvod do expertních systémů

Nepravidlové a hybridní znalostní systémy

TÉMATICKÝ OKRUH Softwarové inženýrství

Programování II. Modularita 2017/18

Logický datový model VF XML DTM DMVS

Návrh IS - UML. Jaroslav Žáček

EXTRAKT z mezinárodní normy

Vývoj informačních systémů. Přehled témat a úkolů

Design systému. Komponentová versus procesní architektura

Systémy pro podporu. rozhodování. 2. Úvod do problematiky systémů pro podporu. rozhodování

Systémy pro podporu rozhodování. Hlubší pohled 2

Aplikace s odvozováním nad ontologiemi

Vývoj informačních systémů. Přehled témat a úkolů

Teorie systémů TES 5. Znalostní systémy KMS

Návrh IS - UML. Jaroslav Žáček

Výměnný formát XML DTM DMVS PK

Informační a znalostní systémy jako podpora rozhodování

Architektury informačních systémů

2. Systémová analýza SA návrhová část projektu = příručka projektu - systémový přístup k analýze problémů, nejdůležitější etapa projektu - podrobné st

UML a jeho použití v procesu vývoje. Jaroslav Žáček jaroslav.zacek@osu.cz

Logika pro sémantický web

DBS Konceptuální modelování

Odontologie a sémantická interoperabilita ve stomatologii

4 ARCHITEKTURA PODNIKOVÝCH PROCESŮ S ARISEM

Spojení OntoUML a GLIKREM ve znalostním rozhodování

Metody popisu systému, základy UML

Reprezentace znalostí - úvod

Správa VF XML DTM DMVS Datový model a ontologický popis

1. Integrační koncept

Databázové modelování. Analýza Návrh konceptuálního schématu

POČÍTAČE A PROGRAMOVÁNÍ

7 Jazyk UML (Unified Modeling Language)

7 Jazyk UML (Unified Modeling Language)

Architektury informačních systémů

Pravidlové znalostní systémy

MVC (Model-View-Controller)

Úvod. Programovací paradigmata

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

11 Návrh programového vybavení

UML. Unified Modeling Language. Součásti UML

Vývoj IS - strukturované paradigma II

ČESKÁ TECHNICKÁ NORMA

EO_01. Podnikové ontologie

Analýza a modelování dat. Helena Palovská

Modelování a odvozování v RDFS

TÉMATICKÝ OKRUH Teorie zpracování dat, Databázové a informační systémy a Teorie informačních systémů

01 Teoretické disciplíny systémové vědy

MOŢNOSTI VYUŢITÍ ROLÍ, AKTORŮ A AGENTŮ PŘI DESIGNU BYZNYS PROCESŮ

Databáze 2013/2014. Konceptuální model DB. RNDr. David Hoksza, Ph.D.

Budování architektury pomocí IAA

MODELOVÁNÍ DAT V INFORMAČNÍCH SYSTÉMECH. Jindřich Kaluža Ludmila Kalužová

Informační systémy. Jaroslav Žáček

Reprezentace znalostí. Katedra kybernetiky, ČVUT v Praze.

Modelování a optimalizace diagnostických procesů

TÉMATICKÝ OKRUH Softwarové inženýrství

PV167 Projekt z obj. návrhu IS. 26. března 2008

ZEMĚMĚŘICKÝ ÚŘAD. Výzkum a vývoj programového aparátu pro generalizaci státního mapového díla. Ing. Přemysl JINDRÁK

Ontologie v e-commerce

Získávání a reprezentace znalostí

Tvorba informačních systémů

Okruhy z odborných předmětů

Unifikovaný modelovací jazyk UML

Program a životní cyklus programu

Servisně orientovaná architektura Základ budování NGII

Problémové domény a jejich charakteristiky

EXTRAKT z české technické normy

Transkript:

Znalostní modelování Podobor znalostního inženýrství, který se zabývá tvorbou znalostních modelů spíše než finální implementací znalostních systémů Model: účelová abstrakce, která umožňuje snížit složitost zkoumaného předmětu tím, že se soustředí pouze na některé jeho aspekty. (Karbach, 1990) U znalostního modelu spočívá abstrakce v odhlédnutí od implementačních detailů: znalosti zachyceny relativně nezávisle na odvozovacích algoritmech a symbolické reprezentaci nositelem znalostí může být existující znalostní systém, plánovaný znalostní systém i lidský expert Historie znalostního modelování 60.-70. léta: expertní systémy založené na symbolických znalostech přímo převzatých od experta (transfer znalostí). Důraz na znuvupoužitelnost implementačních nástrojů (prázdné ES) 1982: A. Newell knowledge-level hypothesis - znalosti lze abstrahovat od způsobu jejich reprezentace 1985: W. Clancey heuristická klasifikace jako abstraktní model řady diagnostických ES konec 80. let: první verze metodiky KADS (Wielinga, Schreiber, Breuker) začátek 90. let: posun paradigmatu v získávání znalostí přechod od transferu k modelování. Vznik knihoven modelů úloh a metod řešení, doménové ontologie konec 90. let: snaha o adaptaci technik znalostního modelování pro potřeby znalostního managementu v organizacích P. Berka, 2007 1/23 P. Berka, 2007 2/23 Metodika KADS Počátkem 90. let jako výzkumný projekt na universitě v Amsterodamu. Nyní de facto evropský standard pro tvorbu znalostních systémů. Důraz na srozumitelnost a opakovanou využitelnost P. Berka, 2007 3/23 1. podpora fáze analýzy: Model procesů, zachycující dekompozici procesů dané úlohy, tok informací mezi nimi, a přiřazení procesů a prvků datové základny (včetně znalostí) jednotlivým agentům (softwarovým i lidským). Model kooperace, který se zaměřuje především na komunikaci mezi uživatelem a systémem, případně i mezi jednotlivými moduly systému navzájem. Model expertizy (tj. expertních znalostí), jehož tvorba je úzce spojena s procesem získávání znalostí. 2. podpora fáze projektování: Model globální architektury, specifikující subsystémy, rozhraní mezi nimi a globální funkce. Funkční model, realizující dekompozici funkcí jednotlivých subsystémů. Behaviorální model, přiřazující funkcím projekční prvky. Fyzický model, kombinující projekční prvky do detailního návrhu systému. P. Berka, 2007 4/23

KADS Model expertízy Doménová vrstva (domain layer) zachycuje pojmy, fakta, vztahy atp. relevantní k dané problémové oblasti (doméně). Znalosti jsou zde zachyceny bez ohledu na způsob použití k usuzování - proto se někdy mluví o úrovni statických znalostí. Strategická vrstva (strategy layer) zachycuje strategické rozhodování experta, např. výběr z možných hierarchií úloh, jejich dynamické rozvrhování atd. Vyskytuje se zpravidla jen u velmi složitých a rozsáhlých projektů. Inferenční vrstva (inference layer) zachycuje abstraktní inference, které je MOŽNÉ na doménové znalosti aplikovat, a vazby mezi nimi (deklarativní stránka odvozování). Prostřednictvím tzv. doménových rolí je propojena s doménovou vrstvou. Úlohová vrstva (task layer) specifikuje, které inference se pro danou úlohu SKUTEČNĚ POUŽIJÍ (procedurální stránka odvozování). Každá inference z inferenční vrstvy je chápána jako primitivní úloha; ty jsou pak seskupovány do hierarchií úloh, a spojovány procedurálními operacemi, jako je např. sekvence, selekce nebo iterace. P. Berka, 2007 5/23 Novější podoba této metodiky, CommonKADS, pracuje pouze se třemi vrstvami: doménovou, inferenční a úlohovou. (Schreiber a kol., 1999) P. Berka, 2007 6/23 Doménové znalosti Inferenční znalosti 1. Doménové schéma obsahuje obecné třídy objektů: objekty, relace, atributy a tzv, typy pravidel 1. Inference vyjadřují elementární odvozovací procesy 2. Báze znalostí obsahuje konkrétní znalosti, tj. instance objektů, jejichž třídy jsou definovány doménovým schématem 2. Znalostní role vyjadřují abstraktní vstupy a výstupy inferencí; mapují se na prvky doménového schématu Báze znalostí nemusí obsahovat zdaleka všechny znalosti potřebné pro fungování budoucího implementovaného systému, ale jen takové, které byly zjištěny již ve fázi analýzy. Inferenčná struktura je obdobou diagramu datových toků (DFD), místo doménově závislých datových prvků jsou použity doménově nezávislé, abstraktní role Znalostní role jsou rozděleny na dynamické, které odpovídají znalostem/datům o řešeném případu (transformují se v průběhu odvozování), a statické, které odpovídají trvalým znalostem. P. Berka, 2007 7/23 P. Berka, 2007 8/23

Úlohové znalosti 1. Úloha popsána pouze na úrovni vstupu a výstupu (co se má řešit, nikoliv jak) 2. Metoda řešení úlohy jako procedurální popis řešení úlohy (hierarchický rozklad na podúlohy a procedurální řídící struktura) KADS - GTM Generic Task Model (GTM) je jakýmsi polotovarem modelu expertizy, zahrnujícím inferenční a úlohovou vrstvu, které jsou doménově nezávislé. Knihovna GTM má hierarchickou strukturu, která koresponduje s typy úloh pro expertní systémy Jedné úloze může odpovídat několik metod řešení. Elementárními prvky metody řešení úlohy jsou inference z inferenční vrstvy. P. Berka, 2007 9/23 P. Berka, 2007 10/23 KADS - Heuristická klasifikace Přínosy znalostních modelů Urychlení a usnadnění vývoje znalostní aplikace (využití existujících znovupoužitelných modelů) Dokumentace vývoje znalostní aplikace vedoucí k její lepší udržovatelnosti /* Dopředné usuzování */ Heuristická klasifikace (+ Pozorovatelné, - Řešení) :- získání dat a jejich vložení do Pozorovatelných abstrahuje (+ Pozorovatelné, - Proměnné) přiřazuje (+ Proměnné, - Abstraktní řešení) specializuje (+ Abstraktní řešení, - Řešení) Usnadnění komunikace mezi tvůrci (i navzájem) a uživateli aplikace Zabezpečení interoperability mezi softwarovými komponentami aplikace /* Zpětné usuzování */ Heuristická klasifikace (+ Pozorovatelné, - Řešení) :- specializuje (- Abstraktní řešení, - Řešení) přiřazuje (- Proměnné, - Abstraktní řešení) abstrahuje (- Pozorovatelné, - Proměnné) získání dat a jejich vložení do Pozorovatelných P. Berka, 2007 11/23 P. Berka, 2007 12/23

Znalostní ontologie Ontologie je explicitní dohoda o sdílené konceptualizaci. (T. Gruber, 1993) Explicitní: zaznamenána pomocí přirozeného nebo formálního jazyka Konceptualizace: úroveň pojmů (tříd) spíše než objektů (instancí) Sdílená: není určena jen pro vlastní potřebu Výhody ontologií: usnadnění komunikace mezi lidmi a organizacemi díky jasnému vymezení používaných pojmů, usnadnění spolupráce počítačových systémů ontologie zde hraje roli výměnného formátu znalostí, usnadnění vývoje znalostní aplikace ontologie zde plní roli základní, koceptuální vrstvy báze znalostí. P. Berka, 2007 13/23 Typy ontologií Podle předmětu konceptualizace Doménové: pro znalosti z nějaké věcné domény (např. UMLS, Enterprise Ontology) Úlohové: modely řešení úloh (např. KADS) Generické: široký, obecný záběr (např. upperlevel models v rámci CyC nebo ON9) Aplikační: pro konkrétní aplikaci (nejsou přímo reusabilní), obsahují i doménovou a úlohovou složku Reprezentační: pro reprezentaci znalosti i samotných ontologií (meta-ontologie) Podle reprezentace Terminologické: lexikony, tezaury Informační: databázová konceptuální schémata Znalostní Podle míry formalizace: neformální (volný text), semiformální (strukturovaný text), formální P. Berka, 2007 14/23 Wordnet Lexikální databáze obsahující synonymické řady - synsety - tvořené slovy, která mají v určitém kontextu totožný význam sémantické vazby jako např. o hypero-/hyponymické vztahy (is_a) o vztahy meronymie mezi částí a celkem (part_of) Enterprise Ontology Doménová neformální ontologie popisující organizační strukturu a činnosti podniku jako celku j i jeho částí LEGAL OWNERSHIP: a Relationship between a LEGAL ENTITY and an Entity whereby the LEGAL ENTITY has certain rights with respekt to the Entity. Note: The Entity in such a Relationship will be said to be LEGALLY OWNED. VENDOR: the Role of the LEGAL ENTITY who Offers a PRODUCT, FOR SALE for an ASKING PRICE; or Agrees to exchange a PRODUCT for SALE PRICE in a SALE. Note: From the VENDOR s perspective, the exchange is reffered to as selling. P. Berka, 2007 15/23 P. Berka, 2007 16/23

CyC Project CyC (Encyclopedia) zahájený již v roce 1984 usiluje o shromáždění všeobecných (common sense) znalostí, které by ve znalostních systémech fungovaly komplementárně ke specializovaným znalostem experta. Open CyC Open verze projektu CyC dostupná na http://www.opencyc.org Generická, formální ontologie. Použitý jazyk CyCL je založen na predikátovém počtu prvního řádu (#%ist #%LargeCorpInternalsMt #%ForAll x (#%HumanResourcesDepartment #%allinstances (#%actsincapacity x #%mediatorinprocesses #%EmployeeHiring #%MainFunction))) P. Berka, 2007 17/23 P. Berka, 2007 18/23 Knihovna ON9 Ontologie Biological functions doménová formální ontologie využívající jazyk Ontolingua Foundational Model of Anatomy (FMA) je ontologie vyvinutá na Universitě ve Washingtonu v rámci projektu Digital Anatomist. Ontologie obsahuje symbolicky reprezentované (s využitím rámců) deklarativní znalosti o lidské anatonomii. P. Berka, 2007 19/23 P. Berka, 2007 20/23

Gene ontology (GO) je tvořena slovníkem termínů z oblasti molekulární biologie. Ontologie se týká tří základních témat: molekulárních funkcí (7459 termínů), biologických procesů (12122 termínů) a buněčných součástí (1818 termínů). Termíny v ontologii jsou spolu svázány dvěma typy relací: is_a (např. nuclear chromosome is_a chromosome) a part_of (např nucleus part_of cell). Unified Medical Language System (UMLS) je ontologie zachycující obecné koncepty a znalosti týkající se oblasti medicíny vyvíjená v National Library of Medicine, National Institutes of Health (NLM NIH) ve Spojených státech. 1. Metatezaurus je víceúčelová, vícejazyčná slovníková databáze, která obsahuje informace o biomedicínských a zdravotnických konceptech, jejich různých názvech a relacích mezi nimi. 2. Sémantická síť je tvořena (1) sémantickými typy, které umožňují konzistentní kategorizaci konceptů reprerzentovaných v metatezauru, a (2) množinou relací, které existují mezi sémantickými typy. Hlavní skupiny sémantických typů zahrnují organismus, anatomickou strukturu, biologickou funkci, chemikálie, události, fyzické objekty, koncepty a ideje. 3. SPECIALIST Lexicon byl vytvořen jako obecný anglický lexikon zahrnující mnoho biomedicínských pojmů i běžných anglických slov P. Berka, 2007 21/23 P. Berka, 2007 22/23 Sémantická síť UMLS P. Berka, 2007 23/23