Získávání a reprezentace znalostí

Získávání a reprezentace znalostí 11.11.2014 6-1

Reprezentace znalostí Produkční pravidla Sémantické sítě Získávání znalostí 6-2

a) Česká 6. Reprezentace znalostí v ZS Literatura Berka P.: Tvorba znalostních systémů. VŠE, Praha, 1994. Dvořák J.: Expertní systémy. Skriptum VUT Brno, 2004. Lukasová A.: Formální logika v umělé inteligenci. Computer Press, Brno, 2003. b) Anglická Geisler E.: Knowledge and Knowledge Systems. IGI Global Publ., 2007. Brachman R.J., Levesque H. J.: Knowledge Representation. New York: Elsevier, 2004. 6-3

Znalost Znalost nejvyšší forma organizace strukturovaných dat Metaznalost znalost o znalostech Definována: Prvky dat Vlastnostmi prvků Relacemi mezi prvky Operacemi nad prvky 6-4

Deklarativní 6. Reprezentace znalostí v ZS Způsoby reprezentace znalostí Zanesený čistič vzduchu způsobí zvýšení spotřeby pohonných hmot. Procedurální Má-li automobil zvýšenou spotřebu pohonných hmot, ověř, zda nemá zanesený čistič vzduchu. 6-5

Požadavky na systém reprezentace znalostí Vyjádřitelnost poznatků Použitelnost reprezentace 6. Reprezentace znalostí v ZS Logická adekvátnost reprezentačního systému Heuristická síla, expresivita a přesnost reprezentace Začlenitelnost do kontextu již reprezentovaných poznatků Jednoduchost vyjádření 6-6

Způsoby reprezentace znalostí 1. Formální (matematické) logika 2. Pravidlové (produkční) znalostní systémy 3. Nepravidlové znalostní systémy Sémantické sítě Rámce Objekty Petriho sítě Rozhodovací stromy Procedurální systémy a speciální programovací jazyky 6-7

Základem jsou: Termy 6. Reprezentace znalostí v ZS Formální logika 1. Proměnné 2. Funkce 3. Výrazy vytvořené konečně mnoha kombinacemi 1 a 2 pravidla Formule 1. Predikátové symboly 2. Symbol rovnosti a negace 3. Binární spojky 4. Kvantifikátory 5. Výrazy získané konečně mnoha kombinacemi 1 až 4 pravidla Př.: (,, ) 6-8

Pravidlové znalostní systémy 1/2 Pravidla mají tvar: 6. Reprezentace znalostí v ZS if E then H : E H (E evidence, H hypothesis) IF předpoklad THEN závěr IF situace THEN akce IF podmínka THEN závěr AND akce IF podmínka THEN důsledek_1 ELSE důsledek_2 V předpokladové části (antecedentu) se mohou vyskytnout spojky AND a OR, v důsledkové části (konsekventu) se může vyskytnout spojka AND. Součástí pravidla může být také kontext, ve kterém je pravidlo uvažováno. 6-9

Pravidlové znalostní systémy 2/2 Většina znalostních systémů je založena na pravidlech. Pravidlové systémy se od klasických logických systémů odlišují nemonotónním uvažováním a možností zpracování neurčitosti. Neurčitost se může vyskytnout jednak v předpokladech pravidla, jednak se může týkat pravidla jako celku. 6-10

Struktury v pravidlových systémech Inferenční síť Závěry jsou fakta, korespondují s předpoklady jiných pravidel. Systém porovnání se vzory Závěry obecnější, lze chápat jako kolekce faktů. 6-11

Inferenční síť Inferenční síť je zpravidla reprezentována jako graf, jehož uzly jsou fakta a orientované hrany odpovídají pravidlům. Užitečné pro domény, kde je počet možných řešení limitován, např. klasifikační nebo diagnostické problémy. 6-12

Systém porovnání se vzory Vztahy mezi fakty a pravidly se ustavují za běhu podle porovnání faktů se vzory. Vysoká flexibilita a schopnost řešit problémy. Aplikovatelné v doménách s vysokým počtem možných řešení navrhování, plánování, syntéza. Horší podpora rozhodování za neurčitosti. 6-13

Výhody a nevýhody pravidlových systémů Výhody Modularita Uniformita Přirozenost Možné nevýhody 6. Reprezentace znalostí v ZS Nebezpečí nekonečného řetězení Přidání nové rozporné znalosti Modifikace existujících pravidel Neefektivnost Neprůhlednost Pokrytí domény (některé vyžadují příliš mnoho pravidel) 6-14

Sémantické (asociativní) sítě Sémantická (asociativní) síť je ohodnocený orientovaný graf sestávající se z uzlů, ohodnocených termy, a hran, ohodnocených binárními predikátovými symboly, přičemž hrany spojují některé dvojice uzlů. Sémantická síť poskytuje vyšší úroveň porozumění akcím, příčinám a událostem, které se vyskytují v odpovídající doméně. To umožňuje úplnější usuzování znalostního systému z této domény. 6-15

Vztahy v sémantické síti Sémantická síť umožňuje reprezentaci fyzikálních, kauzálních a taxonomických vztahů a podporuje dědičnost a tranzitivitu. Příklady vztahů v sémantické síti: is-a, has-a, part-of, number-of, connected-to, causes,. POZOR na interpretaci vztahu is-a, může mít více významů: je instancí, je prvkem, je podmnožinou, je podtřídou, je ekvivalentní s,. 6-16

Výhody a nevýhody sémantických sítí Výhody Explicitní a jasné vyjádření Redukce doby hledání (dotazy typu dědičnosti nebo rozpoznávání) Nevýhody Neexistence interpretačních standardů Nebezpečí chybné inference Nebezpečí kombinatorické exploze 6-17

Příklad sémantické sítě 1/2 Prodavač podává zákazníkovi zmrzlinu. 6-18

Příklad sémantické sítě 2/2 6-19

Rámce Rámce (frames) jsou struktury pro reprezentaci stereotypních situací a odpovídajících stereotypních činností (scénářů). Tento prostředek reprezentace vychází z poznatku, že lidé používají pro analyzování a řešení nových situací rámcové struktury znalostí získaných na základě předchozích zkušeností. Rámce mají reprezentovat obecné znalosti o třídách objektů, znalosti pravdivé pro většinu případů. Mohou existovat objekty, které porušují některé vlastnosti popsané v obecném rámci. Rámce jsou preferovaným schématem reprezentace v modelovém a případovém usuzování (model-based reasoning, case-based reasoning). Příklady jazyků: KRYPTON, FRL, KSL 6-20

Struktura rámce Rámec je tvořen jménem a množinou atributů. Atribut může dále obsahovat položky, např. aktuální hodnota, implicitní hodnota, rozsah možných hodnot. Dalšími položkami atributu mohou být speciální procedury, jako např. if-needed, if-changed, if-added, if-deleted,. Tyto procedury jsou automaticky aktivovány jestliže nastanou příslušné situace. Př.: událostmi řízené procedury v systému FLEX: launches - aktivují se při vytváření instance rámce watchdogs - aktivují se při přístupu k aktuální hodnotě atributu 6-21

Vztahy mezi rámci Mezi rámci mohou existovat vztahy dědičnosti, které umožňují distribuovat informace bez nutnosti jejich zdvojování. Rámec může být specializací jiného obecnějšího rámce (specialization-of) a současně může být zobecněním jiných rámců (generalization-of). Vztahy v systému FLEX: Rodič potomek (is-a, is-an, is-a-kind-of) Rámec instance rámce (is-an-instance-of) Vlastnictví rámce atributem rámce může být jiný rámec 6-22

Výhody a nevýhody rámcových systémů Výhody 6. Reprezentace znalostí v ZS Snazší usuzování řízené očekáváním Organizace znalostí (strukturovanější než sémantické sítě) Samořízení (schopnost rámců určit svou vlastní aplikovatelnost v dané situaci) Uchovávání dynamických hodnot (v atributech) Nevýhody Potíže s odlišností objektů od prototypu Obtížné přizpůsobení novým situacím Obtížný popis detailních heuristických znalostí 6-23

Příklad rámců 6-24

Objekty Objekt je programová struktura, obsahující jak data, tak metody, které s daty pracují. Data jsou dostupná pouze prostřednictvím metod objektu (zapouzdření). Objekt je instance třídy. Třída je skupina objektů se stejnými vlastnostmi a stejným chováním. Objekty podobně jako rámce sdružují deklarativní a procedurální znalosti. 6-25

Dědičnost 6. Reprezentace znalostí v ZS Vztahy mezi třídami Od jedné třídy lze odvodit třídu jinou. Dceřiná třída dědí všechny složky své rodičovské třídy a k nim může přidat své vlastní. Zděděné metody lze předefinovat. Předek může být v programu zastoupen potomkem. Vlastnictví Složkou třídy může být jiná třída. 6-26

Třídy, objekty a dědičnost 6-27

Skládání tříd a objektů 6-28

Komunikace mezi objekty Objekty si při komunikaci posílají zprávy Odesílatel volá metodu příjemce. Časná vazba Příjemce zprávy určen v okamžiku kompilace. Pozdní vazba Příjemce zprávy určen za běhu (polymorfismus). 6-29

Výhody 6. Reprezentace znalostí v ZS Výhody a nevýhody objektů Abstrakce Zapouzdření Dědičnost Polymorfismus Znovupoužitelnost kódu Nevýhody Problém při odchylce od normy Problém při zohlednění dosud neuvažované situace 6-30

Petriho sítě 1/2 Orientovaný bipartitní graf s ohodnocením. Skládá se z míst, přechodů a hran. Místa obsahují libovolný počet tokenů. Rozložení tokenů se nazývá značení (marking). Hrany spojují místa s přechody. Místo, z něhož vede hrana do přechodu vstupní místo Místo, do něhož vede hrana z přechodů výstupní místo Přechody odpalují tokeny ze vstupních míst do výstupních Odpálení je uschopněno pokud je v každém ze vstupních míst alespoň jeden token 6-31

Petriho sítě 2/2 Výpočet je nedeterministický Více přechodů může být uschopněno současně a libovolný může pálit. Žádný přechod není nutné odpálit Odpalování dle libosti v čase od 0 do nekonečna 6-32

Příklad Petriho sítě 1. Odpálení je uschopněno. 2. Stav po odpálení. 6-33

Tvořeny uzly a hranami. 6. Reprezentace znalostí v ZS Rozhodovací stromy Uzly představují fáze rozhodovacího procesu: Rozhodovací uzly deterministické, závislé na uživateli Situační uzly Náhodné alternativy s pravděpodobnostmi Optimální strategie určena vyhodnocením jednotlivých uzlů od konce. 6-34

Příklad rozhodovacího stromu 6-35

Jazyky 1. generace 6. Reprezentace znalostí v ZS Hybridní systémy Použit pouze jeden způsob reprezentace znalostí. Jazyky 2. generace Obvykle používají hybridní reprezentace znalostí. Hybridní reprezentace Kombinují pravidlově, rámcově a objektově orientované techniky. Umožňují modelový přístup k tvorbě systému. 6-36

Knowledge Acquisition 6. Reprezentace znalostí v ZS Získávání znalostí Klíčová operace implementace ZS. Jeden z hlavních problémů při tvorbě ZS. Nejdelší a nejpracnější část vývoje ZS. 6-37

Proces získávání znalostí od expertů Obvykle tři fáze: 1. Seznámení se s problémem, získávání základních znalostí 2. Získávání obecných znalostí 3. Získávání specifických znalostí Práce s jedním expertem Obvykle formou interview Nebezpečí chybné expertízy Práce se skupinou expertů Brainstorming Nižší riziko chybných expertíz Náročnější, na přípravu a průběh Nebezpečí konfliktu expertů 6-38

Technika získávání znalostí od experta Nestrukturované interview Běžný rozhovor, počáteční fáze. Strukturované interview Cílené dotazy, detailní pohled. Myšlení nahlas Expert popisuje své myšlenkové pochody. Pokus o řešení problému pod dohledem experta Repertoárová tabulka Sloupce odpovídají objektům z dané oblasti. Řádky odpovídají konstruktorům Konstrukt tvořen dvěma mezními (nejlépe protikladnými) vlastnostmi. Buňky tabulky obsahují číselná ohodnocení příslušnosti k jednomu či druhému pólu. 6-39

Problémy práce s experty Paradox znalostního inženýrství: Čím více se experti stávají kompetentními, tím méně jsou schopni popsat znalost, kterou používají při řešení problémů. Problémoví experti: Expert obávající se ztráty postavení po zavedení ES. Cynický expert. Velekněz oboru. Paternalistický expert. Nekomunikativní expert. Lhostejný expert. Pseudovzdělanec v oboru umělé inteligence. 6-40