pseudopravděpodobnostní Prospector, Fel-Expert

Práce s neurčitostí trojhodnotová logika Nexpert Object, KappaPC pseudopravděpodobnostní Prospector, Fel-Expert (pravděpodobnostní) bayesovské sítě míry důvěry Mycin algebraická teorie Equant fuzzy logika Sak, Nest nemonotonní logika Prolog 1

Trojhodnotová logika K hodnotám 1 (true) a 0 (false) přidáme hodnotu X (unknown) A A A B 0 X 1 0 1 0 0 0 0 X X X 0 X X 1 0 1 0 X 1 negace konjunkce A B 0 X 1 A B 0 X 1 0 0 X 1 0 1 1 1 X X X 1 X X X 1 1 1 1 1 1 0 X 1 disjunkce implikace 2

Odvozování v systému Nexpert Object Pravidla jsou tvořena třemi částmi: podmínky na levé straně pravidla (LHS), hypotéza, akce na pravé straně pravidla (RHS). Hodnota pravidla závisí na vyhodnocení podmínek LHS: pokud nebyla LHS vyhodnocována, pravidlo je UNKNOWN, jsou-li všechny podmínky LHS TRUE je i pravidlo TRUE, je-li jedna z podmínek LHS FALSE je pravidlo FALSE, nepodařilo-li se vyhodnotit nějakou podmínku LHS, pravidlo je NOTKNOWN. Kombinování více pravidel které mají stejnou hypotézu: hypotéza je FALSE, jsou-li všechna pravidla FALSE, hypotéza je TRUE, je-li alespoň jedno pravidlo TRUE, hypotéza je NOTKNOWN, je-li nějaké pravidlo NOTKNOWN a žádné TRUE. 3

Pseudopravděpodobnostní přístup Založen na Bayesově větě o podmíněných pravděpodobnostech: P (H E) = P (E H) P (H) P (E) P (H E) = P (E H) P (H) P (E) kde P (H E) je aposteriorní pravděpodobnost hypotézy H, víme-li, že E jistě platí, zatímco P (H) je apriorní pravděpodobnost hypotézy H. Obdobně P (H E) je aposteriorní pravděpodobnost negace hypotézy H. Vydělíme-li tyto dvě rovnice, dostaneme P (H E) P (H E) = P (E H) P (E H) P (H) P (H). což lze zapsat jako O(H E) = L O(H) aposteriorní šance míra apriorní šance postačitelnosti obdobně O(H E) = L O(H), kde míra nezbytnosti L = P (E H) P (E H) Tímto způsobem lze vyjádřit vztah mezi jednou evidencí a jednou hypotézou, tedy zapsat bázi znalostí tvořenou jediným pravidlem E H(L, L) 4

Problémy pseudopravděpodobnostního přístupu více předpokladů za předpokladu podmíněné (stochastické) nezávislosti evidencí E 1,..., E n za podmínky H i H: O(H E 1,..., E n ) = L 1 L n O(H) O(H E 1,..., E n ) = L 1 L n O(H) evidence jsou nejisté místo evidence E pozorujeme evidenci E, ze které usuzujeme na pravděpodobnost evidence E P (H E ) P (H E) P (H) P (H E) 0 P (E) 1 Aproximace P (H E ) P (E ) 5

Faktory jistoty Ad hoc pojmy míra důvěry (meassure of belief, MB) v platnost hypotézy H resp. míra nedůvěry (meassure of disbelief, MD) v platnost této hypotézy za předpokladu potvrzení evidence E: MB(H, E) = MD(H, E) = P (H/E) P (H) 1 P (H) P (H) P (H/E) P (H) když MB > 0 pak MD = 0 když MD > 0 pak MB = 0 evidence potvrzuje hypotézu evidence vyvrací hypotézu míry MB a MD nabývají hodnot z intervalu [0, 1]. faktor jistoty (certainty factor, CF): CF = MB MD 1 min(mb, MD) faktor jistoty nabývá hodnot z intervalu [ 1, 1]. Pravidla tedy mají tvar E H(CF ) 6

Problémy MYCINovského přístupu více předpokladů v EMYCINovském pojetí lze počítat výsledný faktor jistoty CF (H, E 1 &E 2 ) přímo z dílčích faktorů jistoty w 1 = CF (H, E 1 ) a w 2 = CF (H, E 2 ): CF (H, E 1 &E 2 ) = w 1 + w 2 w 1 w 2 když w 1, w 2 > 0 w 1 +w 2 1 min( w 1, w 2 ) když w 1.w 2 < 0 w 1 + w 2 + w 1 w 2 když w 1, w 2 < 0 evidence jsou nejisté Důvěru ve splnění evidence E na základě nějakého relevantního pozorování E můžeme popsat také faktorem jistoty CF (E, E ). Výsledné míry důvěry a nedůvěry pak dostáváme pomocí vztahů MB(H, E ) = MB(H, E) max(0, CF (E, E )), MD(H, E ) = MD(H, E) max(0, CF (E, E )). Pro faktor jistoty pak přirozeně platí CF (H, E ) = CF (H, E) max(0, CF (E, E )). 7

Algebraický přístup zobecnění práce s nejistotou vyjádřenou vahami (P. Hájek) A D (w1) D E (w2) A F (w3) B C F (w4) Tedy obecně pravidla tvar A B(w), kde w je váha pravidla. 4 kombinační funkce na intervalu [ 1, 1]: NEG(w) - negace váhy výroku CONJ(w1,w2) - váha konjunkce výroků v předpokladu pravidla CTR(a,w) - příspěvek váhy předpokladu k váze závěru pravidla GLOB(w1,w2) - kombinování vah pravidel se stejným závěrem 8

Vyhodnocení předpokladu pravidla NEG(w) : 1. NEG(1) = -1, 2. NEG(-1) = 1, 3. NEG(0) = 0, 4. NEG(NEG(x)) = x, 5. x = 0 právě když NEG(x) = 0. CONJ(w1,w2): 1. CONJ(w1,w2) w1, 2. CONJ(w1,w2) w2. 9

Vyhodnocení příspěvku pravidla CTR(a,w): 1. je-li a 0, pak CT R(a, w) = 0, 2. CT R(1, w) = w, 3. pro 0 < a 1 je CT R neklesající v a. w 0 1 a CTR(a,w) 10

Skládání příspěvků pravidel GLOB(w 1, w 2,..., w n ) = w 1 w 2... w n : 1. w 1 = 1 w = 1, pro libovolné w ( 1, 1], 2. w 1 = 1 w = 1, pro libovolné w [ 1, 1), 3. výrazy 1 1 a 1 1 nejsou definovány, 4. w 0 = 0 w = w, pro libovolné w [ 1, 1], 5. je asociativní a komutativní pro libovolné w ( 1, 1), 6. w w = 0 pro libovolné w ( 1, 1), 7. pro libovolné w 1, w 2, w 3 ( 1, 1), jestliže w 1 < w 2, pak w 1 w 3 < w 2 w 3. 11

Neurčitost v systému NEST Práce s neurčitostí založena na algebraické teorii: použit interval [ 1, 1], doplnění kombinačních funkcí o výpočet váhy disjunkce: 1. DISJ(w1,w2) w1, 2. DISJ(w1,w2) w2. možnost volit mezi více sémantikami inferenčního mechanismu (více sadami kombinačních funkcí CTR a GLOB): standardní logický neuronový hybridní (kombinace standardního (CTR) a logického (GLOB)) přechod od bodových vah k intervalům. 12

Vyhodnocení předpokladu pravidla Stejné ve všech inferenčních mechanismech: váha negace NEG(w) = w váha konjunkce CONJ(w 1, w 2 ) = min(w 1, w 2 ) váha disjunkce DISJ(w 1, w 2 ) = max(w 1, w 2 ) 13

Standardní inferenční mechanismus příspěvek pravidla: MYCIN pro a [0, 1] CT R(a, w) = a w w 0 CTR(a,w) 1 a skládání příspěvků pravidel: PROSPECTOR GLOB(w 1, w 2) = w 1 + w 2 1 + w 1 w 2 GLOB1(x,y) (x+y)/(1+x*y) 1.5 1 0.5 0-0.5-1 1 0.5-1 -0.5 x 0 0.5 1-1 -0.5 0 y 14

Logický inferenční mechanismus příspěvek pravidla: fuzzy modus ponens pro a [0, 1] CT R(a, w) = sign(w) max(0, a + w 1) w 0 1 w 1 a CTR(a,w) skládání příspěvků pravidel: fuzzy disjunkce GLOB(w 1, w 2) = sign(w 1 + w 2) min(1, w 1 + w 2 ) GLOB(w 1, w 2,..., w n) = min(1, w i) min(1, w i ) w i >0 w i <0 GLOB2,3(x,y) sgn(x+y)*min(1,abs(x+y)) 1 0.5 0-0.5-1 1 0.5-1 -0.5 x 0 0.5 1-1 -0.5 0 y 15

Neuronový inferenční mechanismus Schéma linárního neuronu x1 --> y ( w1) non(x1) --> y (-w1)... xn --> y ( wn) non(xn) --> y (-wn) True --> y ( w0) příspěvek pravidla: vážený vstup do neuronu pro a [0, 1] CT R(a, w) = a w skládání příspěvků pravidel: nelineární transformace součtu vážených vstupů GLOB(w 1, w 2,..., w n) = max( 1, min(1, w i w i)) 16

Přechod od bodových vah k intervalům Váhovy interval znamená, že se berou do úvahy všechny možné hodnoty z tohoto intervalu (paralelní uvažování více variant). Díky monotonii kombinačních funkcí lze pracovat pouze s mezemi intervalů: NEG[w 1, w 2 ] = [NEG(w 2 ), NEG(w 1 )] CONJ([w 1, w 2 ], [v 1, v 2 ]) = [CONJ(w 1, v 1 ), CONJ(w 2, v 2 )] DISJ([w 1, w 2 ], [v 1, v 2 ]) = [DISJ(w 1, v 1 ), DISJ(w 2, v 2 )] CT R([a 1, a 2 ], w) = [CT R(a 1, w), CT R(a 2, w)] GLOB([w 1, w 2 ], [v 1, v 2 ]) = [GLOB(w 1, v 1 ), GLOB(w 2, v 2 )] 17

Nemonotonní logika Označíme-li Cn(X) množinu všech důsledků množiny formulí X (tzv. logický uzávěr množiny X), pak pro monotonní usuzování platí: 1. X Cn(X) 2. X Y = Cn(X) Cn(Y ) 3. Cn(Cn(X)) = Cn(X) 4. Cn(X) = Cn(Y ), kde Y jsou konečné podmnožiny množiny X Pro nemonotonní usuzování neplatí X Y Cn(X) Cn(Y ) pravidlo s vyjímkami všichni ptáci létají (IF X = pták THEN X létá) tučňák nelétá Prologovská syntaxe: letá(tučňák) :-!,fail. létá(x) :- pták(x). 18