MYCIN, Prospector. Pseudodefinice [Expertní systémy, Feigenbaum a kol. 1988] oblasti kvality rozhodování na úrovni experta.



Podobné dokumenty
pseudopravděpodobnostní Prospector, Fel-Expert

Zpracování neurčitosti

Usuzování za neurčitosti

Expertní systémy. Typy úloh: Klasifikační Diagnostické Plánovací Hybridní Prázdné. Feingenbaum a kol., 1988

POČÍTAČOVÁ FORMALIZACE MENTÁLNÍCH MODELŮ METODAMI PRAVDĚPODOBNOSTNÍHO JAZYKOVÉHO MODELOVÁNÍ

Vybrané přístupy řešení neurčitosti

1. Znalostní systémy a znalostní inženýrství - úvod. Znalostní systémy. úvodní úvahy a předpoklady. 26. září 2017

Úvod do expertních systémů

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Matematika B101MA1, B101MA2

Expertní systémy T3: principy expertních systémů P. Berka, /19

Dnešní program odvozování v Bayesovských sítích exaktní metody (enumerace, eliminace proměnných) aproximační metody y( (vzorkovací techniky)

MATEMATICKÁ TEORIE ROZHODOVÁNÍ

1 Báze a dimenze vektorového prostoru 1

MATEMATICKÁ TEORIE ROZHODOVÁNÍ

Spojení OntoUML a GLIKREM ve znalostním rozhodování

Pravděpodobně skoro správné. PAC učení 1

NAIVNÍ TEORIE MNOŽIN, okruh č. 5

Ústav teorie informace a automatizace. J. Vomlel (ÚTIA AV ČR) Úvod do bayesovských sítí 30/10/ / 28

Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice

Téma 48 (dříve 47) Martin Staviař, 16. srpna 2006

teorie logických spojek chápaných jako pravdivostní funkce

Výroková a predikátová logika - II

Fuzzy logika. Informační a znalostní systémy

MATICE. a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij]

1 Řešení soustav lineárních rovnic

Cíle lokalizace. Zjištění: 1. polohy a postavení robota (robot pose) 2. vzhledem k mapě 3. v daném prostředí

Obr. 1: Vizualizace dat pacientů, kontrolních subjektů a testovacího subjektu.

8.3). S ohledem na jednoduchost a názornost je výhodné seznámit se s touto Základní pojmy a vztahy. Definice

Bayesovská klasifikace

Kapitola Základní množinové pojmy Princip rovnosti. Dvě množiny S a T jsou si rovny (píšeme S = T ) prvek T je také prvkem S.

ZÁKLADY PROGRAMOVÁNÍ. Mgr. Vladislav BEDNÁŘ /14

Ing. Alena Šafrová Drášilová, Ph.D.

Rozhodování. Ing. Alena Šafrová Drášilová, Ph.D.

Jednofaktorová analýza rozptylu

RELACE, OPERACE. Relace

V předchozí kapitole jsme podstatným způsobem rozšířili naši představu o tom, co je to číslo. Nadále jsou pro nás důležité především vlastnosti

Výroková a predikátová logika - II

= je prostý orientovaný graf., formálně c ( u, v) 0. dva speciální uzly: zdrojový uzel s a cílový uzel t. Dále budeme bez

VI. Maticový počet. VI.1. Základní operace s maticemi. Definice. Tabulku

Matematická logika. Miroslav Kolařík

Statistická teorie učení

Necht tedy máme přirozená čísla n, k pod pojmem systém lineárních rovnic rozumíme rovnice ve tvaru

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

15. Moduly. a platí (p + q)(x) = p(x) + q(x), 1(X) = id. Vzniká tak struktura P [x]-modulu na V.

Výroková a predikátová logika - II

Matematická analýza 1

Algebraické struktury s jednou binární operací

Motivace. Náhodný pokus, náhodný n jev. Pravděpodobnostn. podobnostní charakteristiky diagnostických testů, Bayesův vzorec

OVLÁDÁNÍ RIZIKA ANALÝZA A MANAGEMENT

Reprezentace znalostí - úvod


Základy teorie pravděpodobnosti

TEORIE PRAVDĚPODOBNOSTI. 2. cvičení

ZÁKLADNÍ METODOLOGICKÁ PRAVIDLA PŘI ZPRACOVÁNÍ ODBORNÉHO TEXTU. Martina Cirbusová (z prezentace doc. Škopa)

Vysoká škola ekonomická Praha. Tato prezentace je k dispozici na:

grupa těleso podgrupa konečné těleso polynomy komutativní generovaná prvkem, cyklická, řád prvku charakteristika tělesa

0. ÚVOD - matematické symboly, značení,

1 Expertní systémy. 1.1 Základní informace. 1.2 Výstupy z učení. 1.3 Expertní systém (ES) 1.4 Komponenty expertních systémů

Matematika I 2a Konečná pravděpodobnost

Formální systém výrokové logiky

Strukturální regresní modely. určitý nadhled nad rozličnými typy modelů

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od podzimu 2014

ALGEBRA. Téma 4: Grupy, okruhy a pole

Binární logika Osnova kurzu

TECHNICKÁ UNIVERZITA V LIBERCI

Poznámka. Je-li f zobrazení, ve kterém potřebujeme zdůraznit proměnnou, píšeme f(x) (resp. f(y), resp. f(t)) je zobrazení místo f je zobrazení.

Náhodné jevy. Teorie pravděpodobnosti. Náhodné jevy. Operace s náhodnými jevy

5 Orientované grafy, Toky v sítích

Modely Herbrandovské interpretace

Teorie grup 1 Příklad axiomatické teorie

Expertní systémy. 1. Úvod k expertním systémům. Cíl kapitoly:

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti.

Výroková a predikátová logika - VI

Modely vyhledávání informací 4 podle technologie. 1) Booleovský model. George Boole Aplikace booleovské logiky

Základy fuzzy řízení a regulace

Teorie rozhodování (decision theory)

Intuitivní pojem pravděpodobnosti

x 2 = a 2 + tv 2 tedy (a 1, a 2 ) T + [(v 1, v 2 )] T A + V Příklad. U = R n neprázdná množina řešení soustavy Ax = b.

10. Předpovídání - aplikace regresní úlohy

Booleovská algebra. Booleovské binární a unární funkce. Základní zákony.

Pravidlové znalostní systémy

Informační a znalostní systémy jako podpora rozhodování

Odpřednesenou látku naleznete v kapitolách skript Abstraktní a konkrétní lineární algebra.

Poznámka: Násobení je možné vyložit jako zkrácený zápis pro součet více sčítanců. Například:

Zabýváme se konstrukcí racionálních agentů.

Afinní transformace Stručnější verze

Úvod do logiky (presentace 2) Naivní teorie množin, relace a funkce

10. Vektorové podprostory

Diskrétní matematika. DiM /01, zimní semestr 2017/2018

Matematika II. dvouletý volitelný předmět

Teorie užitku. Marta Vomlelová 14. prosince / 23

Jak pracovat s absolutními hodnotami

Agent pracující v částečně pozorovatelném prostředí udržuje na základě senzorického modelu odhaduje, jak se svět může vyvíjet.

10. N á h o d n ý v e k t o r

Bakalářská matematika I

CVIČNÝ TEST 15. OBSAH I. Cvičný test 2. Mgr. Tomáš Kotler. II. Autorské řešení 6 III. Klíč 15 IV. Záznamový list 17

Petr Křemen. Katedra kybernetiky, FEL ČVUT. Petr Křemen (Katedra kybernetiky, FEL ČVUT) Sémantické sítě a rámce 1 / 112

Databázové systémy. * relační kalkuly. Tomáš Skopal. - relační model

Transkript:

Expertní systémy MYCIN, Prospector Pseudodefinice [Expertní systémy, Feigenbaum a kol. 1988] Expertní systémy jsou počítačové programy, simulující rozhodovací činnosti experta při řešení složitých úloh a využívající vhodně zakódovaných, explicitně vyjádřených speciálních znalostí, převzatých od experta, s cílem dosáhnout ve zvolené problémové oblasti kvality rozhodování na úrovni experta.

Hlavní rysy expertních systémů Explicitně reprezentované znalosti, striktně oddělené od řídícího mechanizmu nakládání s nimi. Znalosti obsahují celou škálu od nejobecnějších až k úzce speciálním, od exaktních až po osobní heuristiky experta. Znalosti nemají statický charakter, nýbrž se vyvíjejí a rozrůstají. Báze znalosti reprezentuje soubor pravidel, obecnou znalost. Řešit konkrétní příklad znamená dosadit data o daném případu do obecně formulovaných znalostí z báze znalostí. Musí umět pracovat s nejistými znalostmi (od experta) i nejistotě o bázi dat (konkrétním případu). Měly by být schopny vysvětlit a zdůvodnit své doporučení (i otázky). Reprezentace znalostí: modularita (logiky, pravidel) se hodí pro snadnou údržbu, ale těžko se v ní vyhledávají všechny informace relevantní k jednomu pojmu. Z tohoto pohledu jsou lepší

Sémantika pravidel Definition (pravidlo E H s vahou W ) Znalost je reprezentována pomocí pravidel E H s vahou W, kde E a H reprezentují elementární tvrzení. Každé pravidlo má přiřazenou svou váhu W - míru, nakolik (jistá, tj. 100%-ní) znalost E podporuje či popírá platnost tvrzení H. Potřebujeme zodpovědět následující tři otázky. 1 Jak vyjádřit neurčitost elementárního tvrzení? 2 Jak se využívá pravidla, pokud není splnění předpokladu jisté? 3 Jak se určuje míra důvery závěru H v případě, že existuje více pravidel se stejným závěrem? Různé typy reprezentace nejistoty se v odpovědi na tyto otázky liší.

MYCIN, EMYCIN Přírůstek důvěry (measure of belief) je definován jako MB(H, E) = P(H E) P(H) 1 P(H) přírůstek nedůvěry (measure of disbelief) je definován jako MD(H, E) = P(H) P(H E) P(H) Pokud znalost E podporuje hypotézu H, tak se pravděpodobnost P(H) musí touto znalostí zvýšit, tj. P(H E) > P(H), tedy MB(H, E) > 0, pokud E snižuje důvěru v H, je P(H E) < P(H), a tedy MD(H, E) > 0. Pro každé pravidlo vyžadujeme, aby nebyly obě míry různé od nuly zároveň, tj. jednotlivé pravidlo buď podporuje důvěru v hypotézu či nedůvěru v ní, ale ne obojí zároveň.

Činitel jistoty (CF) Na základě MB a MD je definován činitel jistoty (certainty factor) CF (H, E) = MB(H, E) MD(H, E) který nabývá hodnotu od -1 do +1, je-li větší než 0 je roven MB, jinak je v absolutní hodnotě roven MD. V EMYCIN je činitel jistoty definován trochu jinak: CF = což umožní snažší skládání pravidel. MB MD 1 min(mb, MD)

Nejistý předpoklad pravidla Ani předpoklad pravidla E 1 nemusíme znát s jistotou. Zavádíme míru jistoty evidence E 1 po pozorování E : CF (E 1, E ). Pravidlo E 1 H pak kombinujeme s touto mírou jistoty následovně: MB(H, E ) = MB(H, E 1 ) max{0, CF (E 1, E )} MD(H, E ) = MD(H, E 1 ) max{0, CF (E 1, E )}

Skládání pravidel Skládání pravidel se stejnou hypotézou E 1 H, E 2 H je v MYCIN definováno následovně: MB(H, E 1 &E 2 ) = MB(H, E 1 ) + MB(H, E 2 ) MB(H, E 1 ) MB(H, E 2 ) MD(H, E 1 &E 2 ) = MD(H, E 1 ) + MD(H, E 2 ) MD(H, E 1 ) MD(H, E 2 ) a dopočítat CF V EMYCIN přímo: CF (H, E 1 &E 2 ) = f (CF ((H, E 1 ), CF (H, E 2 )) { x + y xy pro xy 0 kde f (x, y) = jinak x+y 1 min{abs(x),abs(y)}

Skládání hypotéz Pro konjunkci či disjunkci hypotéz H 1 &H 2 MB(H 1 &H 2, E) = min{mb(h 1, E), MB(H 2, E)} MD(H 1 &H 2, E) = max{md(h 1, E), MD(H 2, E)} MB(H 1 H 2, E) = max{mb(h 1, E), MB(H 2, E)} MD(H 1 H 2, E) = min{md(h 1, E), MD(H 2, E)} Příklad.

PROSPECTOR Pseudobayesovský model P(H E) = P(E H) P(H) P(E) P( H E) = P(E H) P( H) P(E) Odtud P(H E) P(E H) = P( H E) P(E H) P(H) P( H) O(H E) = L O(H) O() odds - naděje, pravděpodobnostní šance, O(H) apriorní, O(H E) aposteriorní L míra postačitelnosti

obdobně míra nutnosti L = P(E H) P(E H) L = P( E H) P( E H) Míra nutnosti nelze dopočítat z míry postačitelnosti. Expert zadává buď L a L, nebo pravděpodobnosti P(H E), P(H E). Skládání pravidel pak je triviální: O(H E 1, E 2, E 3, E 4 ) = L 1 L 2 L 3 L 4 O(H) Nejisté pozorování není tak triviální, protože dojde k přeurčení a je třeba aproximovat (my se tím zabývat nebudeme).

Hájek 1985 - Abelovské grupy Pokud jsou k řešení úlohy k dispozici identické znalosti, pak je bez ohledu na použitý inferenční mechanismus a na použitou kombinační funkci, která je operací na uspořádané Abelově grupě výsledné uspořádání cílových hypotéz identické. Uspořádaná Abelovská grupa Komutativnost Asociativnost Existence neutrálního prvku Existence inverzního prvku Uspořádání Minimální a max. prvek + vlastnosti, jejich kombinace není def.

Success story: Pathfinder Pathfinder je medicínský diagnostický systém (lymph-node diseases). Měl čtyři verze: 1 pravidlový systém založený na logice, bez nejistoty. 2 zjednodušená Bayesovská síť ( naive bayes ) pro klasifikaci: jeden uzel pro klasifikovanou veličinu, z ní vede hrana do každé pozorovatelné veličiny, tj. předpokládáme, že pozorování jsou nezávislá. Častou příčinou nesprávné klasifikace bylo, že expert přiřadil pravděpodobnost nula nepravděpodobnému, ale možnému výsledku. 3 zas naive bayes, ale dali si pozor na jevy s nízkou pravděpodobností (úspěšnost 7.9 z 10) 4 modelovali i závislosti mezi pozorováními. (úspěšnost 8.9 z 10) - srovnatelná s dobrým expertem.

Pravděpodobnostní modely budou příští semestr nyní (na tabuli) naive bayes klasifikátor

Dempster Shapfer Dempster-Shafer teorie Mám-li čtyři možné hodnoty veličiny, pak mi pravděpodobnost neumožňuje reprezentovat znalost: na 50% to udělal A nebo B, ale nevím který z nich, na 50% to udělal C. Pokud bychom to reprezentovali pravděpodobností a dostali informaci, že to A neudělal, tak se zvýší pravděpodobnost viny C. V Dempster-Shapfer teorii vyloučíme A, tedy celých 50% přejde na B, a 50% zůstane na C. Definition (základní přiřazení) Mějme množinu možných hodnot X. Definujeme základní přiřazení m: P(X ) [0, 1], kde m( ) = 0 a A X m(a) = 1. Všiměte si, že m definujeme na potenci X, nikoli na X samotné.

Tímto základním přiřazením je jednoznačně určena míra domění (belief) a plauzibilita (připustitelnost), definované: Bel(A) = m(b) B A Pl(A) = m(b) B A = tj. součet přes všechny B mající s A neprázdný průnik. Bel sumarizuje, nakolik evidence ukazuje na A. Pl říká, jak bychom věřili A, kdyby vše neznámé ukazovalo na A. pravdivá hodnota je někde mezi.

Příklad Uvažujme univerzum U = {H, C, P} a základní přiřazení m({h}) = 0.3 m({h,c}) = 0.2 m({h,c,p}) = 0.5 Pak Bel({H}) = 0.3 Pl({H}) = 1.0 Bel({H,C}) = 0.5 Pl({H,C}) = 1.0 Bel({P}) = 0 Pl({P}) = 0.5 Bel({C}) = 0 Pl({C}) = 0.7

Dempstrovo kombinační pravidlo Pro dvě daná základní přiřazení m 1 a m 2 definujeme jejich kombinaci m 1 + m 2 (která je také základní přiřazení) následovně: (m 1 + m 2 )(A) = X,Y ;X Y =A m 1 (X ) m 2 (Y ) 1 X,Y ;X Y = m 1 (X ) m 2 (Y )

Příklad Pro univerzum U = {D, D } a m 1 ({D}) = 0.8; m 1 ({D }) = 0; m 1 ({D,D }) = 0.2; m 2 ({D}) = 0.9; m 2 ({D }) = 0; m 2 ({D,D }) = 0.1; vytvoříme tabulku: m 2 m 1 0.9 {D} 0 {D } 0.1 {D,D } 0.8 {D} 0.72 {D} 0 {} 0.08 {D} 0 {D } 0 {} 0 {} 0 {D } 0.2 {D,D } 0.18 {D} 0 {} 0.02 {D,D } m 1 + m 2 ({D}) = 0.72 + 0.08 + 0.18 = 0.98 m 1 + m 2 ({D }) = 0 m 1 + m 2 ({D, D }) = 0.02

Problém s normalizací Counter Intuitive Behavior of Dempster Rule V následujícím příkladu vede Dempstrovo pravidlo k neočekávanému výsledku. Řekněme, že dva doktoři vyšetřili stejného pacienta, který má buď meningitidu (M), concussion (C) nebo nádor na mozku (tumor) (T). Tedy U = {M,C,T}. Doktoři se liší v diagnoze: m 1 ({M}) = 0.99; m 1 ({T }) = 0.01; m 2 ({C }) = 0.99; m 2 ({T }) = 0.01; Shodnou se na malé pravděpodobnosti nádoru T, ale neshodnou se v pravděpodobné příčině. Kombinací nám vyjde, že... Jedna možnost, jak potlačit takovéto výsledky, je přiřadit i prázdné množině nenulovou míru, která bude určovat míru neshody mezi