Usuzování za neurčitosti

Usuzování za neurčitosti 25.11.2014 8-1

Usuzování za neurčitosti Hypotetické usuzování a zpětná indukce Míry postačitelnosti a nezbytnosti Kombinace důkazů Šíření pravděpodobnosti v inferenčních sítích 8-2

a) Česká Literatura Jiroušek R.: Metody reprezentace a zpracování znalostí v umělé inteligenci. VŠE, Praha, 1995. Jiroušek R.: Úvod do teorie bayesovských sítí. VŠE, Praha, 1994. Müller L.: Znalostní systémy. Skriptum, ZČU, 2002. b) Anglická Geisler E.: Knowledge and Knowledge Systems. IGI Global Publ., 2007. Harmon P., Sawyer B.: Creating Expert Systems for Business and Industry. John Wiley&sons, New York, 1990. 8-3

Neurčitost Charakteristický rys složitých systémů. Poznatky z reality jsou neurčité. Příčiny neurčitosti: Problémy s daty Chybějící nebo nedostupná data. Nespolehlivá data (chyba měření). Nepřesná nebo nekonzistentní reprezentace dat. Nejisté znalosti Znalost nemusí být platná ve všech případech. Znalost může obsahovat vágní pojmy. 8-4

Vyjádření neurčitosti Obvykle vyjadřována numerickými parametry. Označení váhy, míry, stupně důvěry, faktory jistoty. Hodnoty přiřazeny tvrzením či pravidlům. Nejčastěji v rozsahu 0,1 nebo -1,1. Většinou označena jedním číslem, v novějších systémech dvojicí (interval). Některé systémy pracují s kvalitativně vyjádřenými neurčitostmi. 8-5

Zpracování neurčitosti Bayesův přístup a jeho modifikace (PROSPECTOR). Teorie určitosti (Certainty Theory). Fuzzy logika. Dempster-Shaferova teorie. 8-6

Bayesovský přístup 1/2 Nejstarší a nejlépe definovaná technika. Znalost ve tvaru pravidla Předpoklad (evidence) podporuje závěr (hypothesis). ( ) apriorní pravděpodobnost jevu. ( ) apriorní pravděpodobnost jevu. aposteriorní pravděpodobnost závěru (hypotézy). ( ) podmíněna pravděpodobnost jevu za podmínky, že nastal jev. 8-7

Bayesovský přístup 2/2 Bayesovy vzorce: = = + ( ) = + 8-8

Pacient s bolestmi na hrudi má: 1. (nemocné srdce): +/ (má/nemá) 2. : +/ (pozitivní/negativní) Za předpokladu, že je pozitivní + se ptáme, zda pacient má skutečně, tzn. jaká je pravděpodobnost + + =? + apriorní pravděpodobnost jevu, že pacient má nemocné srdce = 0,1. + + podmíněná pravděpodobnost jevu, že je pozitivní u pacienta s = 0,9. = 0,95. Příklad 1/2 8-9

Řešení: + + = Příklad 2/2 + + (+ ) (+ ) = = = = + + (+ ) + + + + + ( ) = + + (+ ) + + + + 1 [1 + ] = 0,9 0,1 0,9 0,1 + 1 0,95 [1 0,1] 0,67 2 3 2/3 lidí s bolestmi na hrudi a s pozitivním EKG mají nemocné srdce. 8-10

Apriorní pravděpodobnostní šance: = = 1 Aposteriorní pravděpodobnostní šance: = Pravděpodobnostní šance = 1 Pravděpodobnost lze ze šance vypočítat dle vztahu: ( ) = ( ) 1 + ( ) 8-11

Důkaz Věta: ( ) = ( ) 1 + ( ) Důkaz: = = 1 = 1 1 1 1 = 1 1 1 1 + 1/ = 1 + 8-12

Míra postačitelnosti Z Bayesových vzorců pro a vyplývá: =, kde: = ( ) ( ) = (někdy též ) se nazývá mírou postačitelnosti. Když s velkou pravděpodobností, pak se blíží nekonečnu, tzn. velká hodnota 1 říká, že předpoklad je postačitelný k dokázání hypotézy. 8-13

Důkaz míry postačitelnosti Věta: = Důkaz: L = O(H E) O(H) = ( ) ( ) ( ) ( ) = ( ) ( ) = = = = 8-14

Míra nezbytnosti Obdobně platí: = ^, kde: ^ = ( ) ( ) = ^ (někdy též ) se nazývá mírou nezbytnosti. Když s malou pravděpodobností, pak ^ se blíží 0, tzn. malá hodnota 0 < ^ 1 znamená, že je nezbytné pro dokázání. 8-15

Důkaz míry nezbytnosti Věta: ^ = Důkaz: ^ = O(H E) O(H) = ( ) ( ) ( ) ( ) = ( ) ( ) = = = = 8-16

Tabulka ^ 0 je nezbytné pro je postačitelné pro 1 ani nemá žádný vliv na 1 ani nemá žádný vliv na je postačitelné pro 0 je nezbytné pro 8-17

Platí: > 1 ^ < 1 = 1 ^ = 1 < 1 ^ > 1 Neboť platí: ^ = ( ) ( ) Vztah a ^!Toto platí pouze teoreticky! Prakticky expert zadává i ^, které vztah splňovat nemusí. 8-18

Zadávání míry postačitelnosti a nezbytnosti Míry postačitelnosti a nezbytnosti zadávány pro každé pravidlo expertem subjektivně. Pravidlo lze chápat jako: if then with váha else with váha ^ tzn. a ^ 8-19

Kombinace více pravidel Mějme pravidla:,,, Pak se aposteriorní šance za předpokladu nezávislosti vypočte jako:... =... Pokud není k dispozici přesná evidence dispozici pouze pozorování, pak platí:... =... kde = a je k 8-20

Přebráno z fuzzy logiky. Kombinace předpokladů 1. Disjunkce předpokladů: =, 2. Konjunkce předpokladů: =, 3. Negace předpokladů: = 1 8-21

Výhody a nevýhody Bayesova přístupu Výhody Dobré teoretické základy Dobře definovaná sémantika rozhodování Nevýhody Potřeba velkého množství pravděpodobnostních dat Nebezpečí neúplnosti a nekonzistence dat Předpoklad nezávislosti evidencí E nebývá splněn Možnost ztráty informace při popisu neurčitosti jedním číslem Obtížnost vysvětlování 8-22

Bayesův teorém v PROSPECTORu 1/3 V inferenční síti jsou ke každému přechodu z uzlu do uzlu (tj. každému pravidlu) přiřazeny vztahy pro výpočet pravděpodobnosti faktu odpovídajícího uzlu, do kterého se přejde. Použije se pravděpodobnost faktu odpovídajícího výchozího uzlu.?,,, 8-23

Bayesův teorém v PROSPECTORu 2/3,, V inferenční síti dochází k postupné propagaci. 8-24

Bayesův teorém v PROSPECTORu 3/3 Pro experta obtížné určit hodnoty ( ) a ( ). Expert tedy zadává, ^, ( ). Věta: = ( ) 1 + ( ) 8-25

Bayesian Network Bayesovská síť Orientovaný acyklický graf Uzel náhodná veličina Hrana (vztah) kauzální závislost mezi proměnnými Hrana znamená, že kauzálně ovlivňuje Pozorování poskytuje kauzální podporu Pozorování poskytuje diagnostickou podporu Umožňuje provádět prediktivní i diagnostické inference 8-26

Příklad Bayesovské sítě Každému uzlu přiřazena pravděpodobnostní tabulka Pokud uzel nemá předchůdce nepodmíněná pravděpodobnost 8-27

Pojmy pro definici Bayesovské sítě Nechť =, je orientovaný acyklický graf a nechť. Definujme množiny: = { (, ) } = { } = { } Množina je množinou bezprostředních předchůdců uzlu, je množinou všech následníků uzlu. Prvky nazývány příčinami. 8-28

Definice Bayesovské sítě 1/2 Nechť (Ω, ) je pravděpodobnostní prostor, kde Ω = Ω... Ω. Nechť ( = 1,..., ) je projekce Ω na Ω (tj. : Ω Ω je náhodná proměnná). Nechť (, ) je orientovaný acyklický graf, kde = {,, }. Řekneme, že (,, ) je Bayesovská síť, jestliže pro všechna a všechna ( ) a podmíněně nezávislé při daném ( ). 8-29

Definice Bayesovské sítě 2/2 Když =,,, =,,, (...... ) 0, pak:...... = (... Pokud známe příčiny, pak pouze nebo jeho následníci nám mohou dát další informace o. Namísto pojmu Bayesovská síť se používají i pojmy kauzální síť nebo influenční diagram. 8-30

Vlastnosti Bayesovské sítě Nechť (,, ) je Bayesovská síť, pak platí: = ( ) ( ) Nechť (, ) je orientovaný acyklický graf, kde = {,..., }, přičemž jsou proměnné s obory hodnot ( ). Nechť ( ) je nezáporná reálná funkce taková, že ( ) = 1 pro všechny kombinace hodnot proměnných z ( ). Pak: Ω = ( )... ( ) a = ( ) definují pravděpodobnostní prostor, pro nějž,, je Bayesovská síť. Přitom je buď 0 nebo ( ( ). 8-31

Konstrukce Bayesovské sítě 1. Specifikace veličin,..., a jejich obory hodnot ( ). 2. Konstrukce orientovaného acyklického grafu (, ), kde = {,, }, vyjadřujícího kauzální závislosti mezi veličinami. 3. Odhad pravděpodobnosti P tak, že odhadneme ( ) pro všechna X, všechny hodnoty X a všechny kombinace hodnot proměnných z ( ). Nezbytné je splnění pouze těchto podmínek: 0 ( ) 1 = 1 ( ) 8-32

Problém pro Bayesovskou síť Problém řešený Bayesovskou sítí lze formulovat takto: Nechť je dána Bayesovská síť (,, ) a množiny,, =. Jsou-li zadány hodnoty proměnných z množiny U, je třeba zjistit ( ). Po zadání hodnot některých proměnných se zavádí inference, což znamená přepočet podmíněných pravděpodobností pro ostatní proměnné. Inference je založena na Bayesovských vzorcích. Tento problém je NP-složitý Neexistuje algoritmus s polynomiální časovou složitostí. Použití aproximačních technik transformace na jednodušší tvar. 8-33

Jednoduše souvislá Bayesovská síť Bayesovská síť je jednoduše souvislá, jestliže mezi každými dvěma uzly existuje právě jedna neorientovaná cesta. Další názvy polystrom, les Zvláštním případem polystromu je strom. Strom každý uzel má nejvýše jednoho rodiče Pro tuto síť existují algoritmy s polynomiální časovou složitostí. 8-34