MYCIN, Prospector. Pseudodefinice [Expertní systémy, Feigenbaum a kol. 1988] oblasti kvality rozhodování na úrovni experta.

Rozměr: px
Začít zobrazení ze stránky:

Download "MYCIN, Prospector. Pseudodefinice [Expertní systémy, Feigenbaum a kol. 1988] oblasti kvality rozhodování na úrovni experta."

Transkript

1 Expertní systémy MYCIN, Prospector Pseudodefinice [Expertní systémy, Feigenbaum a kol. 1988] Expertní systémy jsou počítačové programy, simulující rozhodovací činnosti experta při řešení složitých úloh a využívající vhodně zakódovaných, explicitně vyjádřených speciálních znalostí, převzatých od experta, s cílem dosáhnout ve zvolené problémové oblasti kvality rozhodování na úrovni experta.

2 Hlavní rysy expertních systémů Explicitně reprezentované znalosti, striktně oddělené od řídícího mechanizmu nakládání s nimi. Znalosti obsahují celou škálu od nejobecnějších až k úzce speciálním, od exaktních až po osobní heuristiky experta. Znalosti nemají statický charakter, nýbrž se vyvíjejí a rozrůstají. Báze znalosti reprezentuje soubor pravidel, obecnou znalost. Řešit konkrétní příklad znamená dosadit data o daném případu do obecně formulovaných znalostí z báze znalostí. Musí umět pracovat s nejistými znalostmi (od experta) i nejistotě o bázi dat (konkrétním případu). Měly by být schopny vysvětlit a zdůvodnit své doporučení (i otázky). Reprezentace znalostí: modularita (logiky, pravidel) se hodí pro snadnou údržbu, ale těžko se v ní vyhledávají všechny informace relevantní k jednomu pojmu. Z tohoto pohledu jsou lepší

3 Sémantika pravidel Definition (pravidlo E H s vahou W ) Znalost je reprezentována pomocí pravidel E H s vahou W, kde E a H reprezentují elementární tvrzení. Každé pravidlo má přiřazenou svou váhu W - míru, nakolik (jistá, tj. 100%-ní) znalost E podporuje či popírá platnost tvrzení H. Potřebujeme zodpovědět následující tři otázky. 1 Jak vyjádřit neurčitost elementárního tvrzení? 2 Jak se využívá pravidla, pokud není splnění předpokladu jisté? 3 Jak se určuje míra důvery závěru H v případě, že existuje více pravidel se stejným závěrem? Různé typy reprezentace nejistoty se v odpovědi na tyto otázky liší.

4 MYCIN, EMYCIN Přírůstek důvěry (measure of belief) je definován jako MB(H, E) = P(H E) P(H) 1 P(H) přírůstek nedůvěry (measure of disbelief) je definován jako MD(H, E) = P(H) P(H E) P(H) Pokud znalost E podporuje hypotézu H, tak se pravděpodobnost P(H) musí touto znalostí zvýšit, tj. P(H E) > P(H), tedy MB(H, E) > 0, pokud E snižuje důvěru v H, je P(H E) < P(H), a tedy MD(H, E) > 0. Pro každé pravidlo vyžadujeme, aby nebyly obě míry různé od nuly zároveň, tj. jednotlivé pravidlo buď podporuje důvěru v hypotézu či nedůvěru v ní, ale ne obojí zároveň.

5 Činitel jistoty (CF) Na základě MB a MD je definován činitel jistoty (certainty factor) CF (H, E) = MB(H, E) MD(H, E) který nabývá hodnotu od -1 do +1, je-li větší než 0 je roven MB, jinak je v absolutní hodnotě roven MD. V EMYCIN je činitel jistoty definován trochu jinak: CF = což umožní snažší skládání pravidel. MB MD 1 min(mb, MD)

6 Nejistý předpoklad pravidla Ani předpoklad pravidla E 1 nemusíme znát s jistotou. Zavádíme míru jistoty evidence E 1 po pozorování E : CF (E 1, E ). Pravidlo E 1 H pak kombinujeme s touto mírou jistoty následovně: MB(H, E ) = MB(H, E 1 ) max{0, CF (E 1, E )} MD(H, E ) = MD(H, E 1 ) max{0, CF (E 1, E )}

7 Skládání pravidel Skládání pravidel se stejnou hypotézou E 1 H, E 2 H je v MYCIN definováno následovně: MB(H, E 1 &E 2 ) = MB(H, E 1 ) + MB(H, E 2 ) MB(H, E 1 ) MB(H, E 2 ) MD(H, E 1 &E 2 ) = MD(H, E 1 ) + MD(H, E 2 ) MD(H, E 1 ) MD(H, E 2 ) a dopočítat CF V EMYCIN přímo: CF (H, E 1 &E 2 ) = f (CF ((H, E 1 ), CF (H, E 2 )) { x + y xy pro xy 0 kde f (x, y) = jinak x+y 1 min{abs(x),abs(y)}

8 Skládání hypotéz Pro konjunkci či disjunkci hypotéz H 1 &H 2 MB(H 1 &H 2, E) = min{mb(h 1, E), MB(H 2, E)} MD(H 1 &H 2, E) = max{md(h 1, E), MD(H 2, E)} MB(H 1 H 2, E) = max{mb(h 1, E), MB(H 2, E)} MD(H 1 H 2, E) = min{md(h 1, E), MD(H 2, E)} Příklad.

9 PROSPECTOR Pseudobayesovský model P(H E) = P(E H) P(H) P(E) P( H E) = P(E H) P( H) P(E) Odtud P(H E) P(E H) = P( H E) P(E H) P(H) P( H) O(H E) = L O(H) O() odds - naděje, pravděpodobnostní šance, O(H) apriorní, O(H E) aposteriorní L míra postačitelnosti

10 obdobně míra nutnosti L = P(E H) P(E H) L = P( E H) P( E H) Míra nutnosti nelze dopočítat z míry postačitelnosti. Expert zadává buď L a L, nebo pravděpodobnosti P(H E), P(H E). Skládání pravidel pak je triviální: O(H E 1, E 2, E 3, E 4 ) = L 1 L 2 L 3 L 4 O(H) Nejisté pozorování není tak triviální, protože dojde k přeurčení a je třeba aproximovat (my se tím zabývat nebudeme).

11 Hájek Abelovské grupy Pokud jsou k řešení úlohy k dispozici identické znalosti, pak je bez ohledu na použitý inferenční mechanismus a na použitou kombinační funkci, která je operací na uspořádané Abelově grupě výsledné uspořádání cílových hypotéz identické. Uspořádaná Abelovská grupa Komutativnost Asociativnost Existence neutrálního prvku Existence inverzního prvku Uspořádání Minimální a max. prvek + vlastnosti, jejich kombinace není def.

12 Success story: Pathfinder Pathfinder je medicínský diagnostický systém (lymph-node diseases). Měl čtyři verze: 1 pravidlový systém založený na logice, bez nejistoty. 2 zjednodušená Bayesovská síť ( naive bayes ) pro klasifikaci: jeden uzel pro klasifikovanou veličinu, z ní vede hrana do každé pozorovatelné veličiny, tj. předpokládáme, že pozorování jsou nezávislá. Častou příčinou nesprávné klasifikace bylo, že expert přiřadil pravděpodobnost nula nepravděpodobnému, ale možnému výsledku. 3 zas naive bayes, ale dali si pozor na jevy s nízkou pravděpodobností (úspěšnost 7.9 z 10) 4 modelovali i závislosti mezi pozorováními. (úspěšnost 8.9 z 10) - srovnatelná s dobrým expertem.

13 Pravděpodobnostní modely budou příští semestr nyní (na tabuli) naive bayes klasifikátor

14 Dempster Shapfer Dempster-Shafer teorie Mám-li čtyři možné hodnoty veličiny, pak mi pravděpodobnost neumožňuje reprezentovat znalost: na 50% to udělal A nebo B, ale nevím který z nich, na 50% to udělal C. Pokud bychom to reprezentovali pravděpodobností a dostali informaci, že to A neudělal, tak se zvýší pravděpodobnost viny C. V Dempster-Shapfer teorii vyloučíme A, tedy celých 50% přejde na B, a 50% zůstane na C. Definition (základní přiřazení) Mějme množinu možných hodnot X. Definujeme základní přiřazení m: P(X ) [0, 1], kde m( ) = 0 a A X m(a) = 1. Všiměte si, že m definujeme na potenci X, nikoli na X samotné.

15 Tímto základním přiřazením je jednoznačně určena míra domění (belief) a plauzibilita (připustitelnost), definované: Bel(A) = m(b) B A Pl(A) = m(b) B A = tj. součet přes všechny B mající s A neprázdný průnik. Bel sumarizuje, nakolik evidence ukazuje na A. Pl říká, jak bychom věřili A, kdyby vše neznámé ukazovalo na A. pravdivá hodnota je někde mezi.

16 Příklad Uvažujme univerzum U = {H, C, P} a základní přiřazení m({h}) = 0.3 m({h,c}) = 0.2 m({h,c,p}) = 0.5 Pak Bel({H}) = 0.3 Pl({H}) = 1.0 Bel({H,C}) = 0.5 Pl({H,C}) = 1.0 Bel({P}) = 0 Pl({P}) = 0.5 Bel({C}) = 0 Pl({C}) = 0.7

17 Dempstrovo kombinační pravidlo Pro dvě daná základní přiřazení m 1 a m 2 definujeme jejich kombinaci m 1 + m 2 (která je také základní přiřazení) následovně: (m 1 + m 2 )(A) = X,Y ;X Y =A m 1 (X ) m 2 (Y ) 1 X,Y ;X Y = m 1 (X ) m 2 (Y )

18 Příklad Pro univerzum U = {D, D } a m 1 ({D}) = 0.8; m 1 ({D }) = 0; m 1 ({D,D }) = 0.2; m 2 ({D}) = 0.9; m 2 ({D }) = 0; m 2 ({D,D }) = 0.1; vytvoříme tabulku: m 2 m {D} 0 {D } 0.1 {D,D } 0.8 {D} 0.72 {D} 0 {} 0.08 {D} 0 {D } 0 {} 0 {} 0 {D } 0.2 {D,D } 0.18 {D} 0 {} 0.02 {D,D } m 1 + m 2 ({D}) = = 0.98 m 1 + m 2 ({D }) = 0 m 1 + m 2 ({D, D }) = 0.02

19 Problém s normalizací Counter Intuitive Behavior of Dempster Rule V následujícím příkladu vede Dempstrovo pravidlo k neočekávanému výsledku. Řekněme, že dva doktoři vyšetřili stejného pacienta, který má buď meningitidu (M), concussion (C) nebo nádor na mozku (tumor) (T). Tedy U = {M,C,T}. Doktoři se liší v diagnoze: m 1 ({M}) = 0.99; m 1 ({T }) = 0.01; m 2 ({C }) = 0.99; m 2 ({T }) = 0.01; Shodnou se na malé pravděpodobnosti nádoru T, ale neshodnou se v pravděpodobné příčině. Kombinací nám vyjde, že... Jedna možnost, jak potlačit takovéto výsledky, je přiřadit i prázdné množině nenulovou míru, která bude určovat míru neshody mezi

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav automatizace a informatiky. Expertní systémy. Jiří Dvořák

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav automatizace a informatiky. Expertní systémy. Jiří Dvořák VYSOKÉ UČNÍ TCNICKÉ V BRNĚ FAKULTA STROJNÍO INŽNÝRSTVÍ Ústav automatizace a informatiky Jiří Dvořák 2004 Obsah ředmluva...... 5 1. Úvod do expertních systémů...... 6 1.1 Charakteristika expertních systémů......

Více

Pravděpodobnost a matematická statistika

Pravděpodobnost a matematická statistika Pravděpodobnost a matematická statistika Mirko Navara Centrum strojového vnímání katedra kybernetiky FEL ČVUT Karlovo náměstí, budova G, místnost 104a http://cmp.felk.cvut.cz/ navara/mvt http://cmp.felk.cvut.cz/

Více

Biostatistika a matematické metody epidemiologie - stručné studijní texty

Biostatistika a matematické metody epidemiologie - stručné studijní texty Biostatistika a matematické metody epidemiologie - stručné studijní texty Bohumír Procházka, SZÚ Praha 1 Co můžeme sledovat Pro charakteristiku nebo vlastnost, kterou chceme sledovat zvolíme termín jev.

Více

NÁSTIN péče o kvalitu v analytické a klinické laboratoři

NÁSTIN péče o kvalitu v analytické a klinické laboratoři NÁSTIN péče o kvalitu v analytické a klinické laboratoři Zbyněk Plzák Obsah NÁSTIN péče o kvalitu v analytické a klinické laboratoři... 1 Správnost měření... 3 Přesnost měření... 3 Nejistoty analytických

Více

KOMPRESE DAT ARNOŠT VEČERKA KATEDRA INFORMATIKY PŘÍRODOVĚDECKÁ FAKULTA UNIVERZITA PALACKÉHO

KOMPRESE DAT ARNOŠT VEČERKA KATEDRA INFORMATIKY PŘÍRODOVĚDECKÁ FAKULTA UNIVERZITA PALACKÉHO KATEDRA INFORMATIKY PŘÍRODOVĚDECKÁ FAKULTA UNIVERZITA PALACKÉHO KOMPRESE DAT ARNOŠT VEČERKA VÝVOJ TOHOTO UČEBNÍHO TEXTU JE SPOLUFINANCOVÁN EVROPSKÝM SOCIÁLNÍM FONDEM A STÁTNÍM ROZPOČTEM ČESKÉ REPUBLIKY

Více

SPECIMEN. Základy zpracování dat. Michal Otyepka, Pavel Banáš, Eva Otyepková verze 16.2.2007. tento text byl vysázen systémem L A TEX2 ε

SPECIMEN. Základy zpracování dat. Michal Otyepka, Pavel Banáš, Eva Otyepková verze 16.2.2007. tento text byl vysázen systémem L A TEX2 ε Základy zpracování dat Michal Otyepka, Pavel Banáš, Eva Otyepková verze 16.2.2007 tento text byl vysázen systémem L A TEX2 ε ii Skripta vznikla pro potřeby kurzu Základy zpracování dat určeného studentům

Více

Metody řešení problematiky neúplných dat

Metody řešení problematiky neúplných dat Metody řešení problematiky neúplných dat Ing. David Pejčoch, DiS. Katedra informačního a znalostního inženýrství Fakulta informatiky a statistiky Vysoká škola ekonomická Nám. W. Churchilla 4 130 00 Praha

Více

ajejichaplikace Andrea Peterková Opava 2013 Hrazeno z prostředků projektu OPVK CZ.1.07/2.2.00/15.0174

ajejichaplikace Andrea Peterková Opava 2013 Hrazeno z prostředků projektu OPVK CZ.1.07/2.2.00/15.0174 Řešení krizových situací metody ajejichaplikace Katarína Jelšovská Andrea Peterková Opava 2013 Hrazeno z prostředků projektu OPVK CZ.1.07/2.2.00/15.0174 Inovace bakalářských studijních oborů se zaměřením

Více

ZÁKLADY TEORETICKÉ INFORMATIKY

ZÁKLADY TEORETICKÉ INFORMATIKY KATEDRA INFORMATIKY PŘÍRODOVĚDECKÁ FAKULTA UNIVERZITA PALACKÉHO ZÁKLADY TEORETICKÉ INFORMATIKY PAVEL MARTINEK VÝVOJ TOHOTO UČEBNÍHO TEXTU JE SPOLUFINANCOVÁN EVROPSKÝM SOCIÁLNÍM FONDEM A STÁTNÍM ROZPOČTEM

Více

Úvod do počítačové lingvistiky příprava na zkoušku

Úvod do počítačové lingvistiky příprava na zkoušku Tento text vznikl jako pomocný text k přípravě na zkoušku z předmětu Úvod do počítačové lingvistiky v roce 2011. Může obsahovat mnoho chyb, dohadů a nepřesností. Tedy jeho autoři se vzdávají zodpovědnosti

Více

Při statistickém zkoumání se snažíme udělat nějaký závěr ohledně vlastností celého statistického souboru

Při statistickém zkoumání se snažíme udělat nějaký závěr ohledně vlastností celého statistického souboru 0.1 Základy statistického zpracování dat 1 0.1 Základy statistického zpracování dat Statistika se zabývá shromažďováním, tříděním a popisem velkých souborů dat. Někdy se pod pojmem statistika myslí přímo

Více

1. ZPRACOVÁNÍ DAT. Čas ke studiu kapitoly: 2 hodiny. 1.1. Úlohy zpracování dat. Cíl Po prostudování tohoto odstavce budete umět.

1. ZPRACOVÁNÍ DAT. Čas ke studiu kapitoly: 2 hodiny. 1.1. Úlohy zpracování dat. Cíl Po prostudování tohoto odstavce budete umět. 1.1. Úlohy zpracování dat 1. ZPRACOVÁNÍ DAT Čas ke studiu kapitoly: 2 hodiny 1.1. Úlohy zpracování dat Cíl Po prostudování tohoto odstavce budete umět popsat problém evidence a zpracování velkého množství

Více

Obr. 1 Biologický neuron

Obr. 1 Biologický neuron 5.4 Neuronové sítě Lidský mozek je složen asi z 10 10 nervových buněk (neuronů) které jsou mezi sebou navzájem propojeny ještě řádově vyšším počtem vazeb [Novák a kol.,1992]. Začněme tedy nejdříve jedním

Více

OSTRAVSKÁ UNIVERZITA V OSTRAVĚ

OSTRAVSKÁ UNIVERZITA V OSTRAVĚ OSTRAVSKÁ UNIVERZITA V OSTRAVĚ REGULÁRNÍ A BEZKONTEXTOVÉ JAZYKY I HASHIM HABIBALLA OSTRAVA 2005 Tento projekt byl spolufinancován Evropskou unií a českým státním rozpočtem Recenzent: Doc. Ing. Miroslav

Více

KÓDOVÁNÍ A KOMPRESE DAT

KÓDOVÁNÍ A KOMPRESE DAT KÓDOVÁNÍ A KOMPRESE DAT URČENO PRO VZDĚLÁVÁNÍ V AKREDITOVANÝCH STUDIJNÍCH PROGRAMECH RADIM FARANA ČÍSLO OPERAČNÍHO PROGRAMU: CZ..7 NÁZEV OPERAČNÍHO PROGRAMU: VZDĚLÁVÁNÍ PRO KONKURENCESCHOPNOST OPATŘENÍ:

Více

POHLED STATISTIKA NA HODNOCENÍ STUDIÍ. Marek Malý Státní zdravotní ústav

POHLED STATISTIKA NA HODNOCENÍ STUDIÍ. Marek Malý Státní zdravotní ústav POHLED STATISTIKA NA HODNOCENÍ STUDIÍ Marek Malý Státní zdravotní ústav ZÁKLADNÍ INDIKÁTORY ZDRAVÍ POPULACE Sociodemografické indikátory věk, pohlaví, vzdělání, příjem Hlavní determinanty a rizikové faktory

Více

Hrubých chyb se musíme vyvarovat. Systematické chyby můžeme rozpoznat a opravit. U cvičeného pozorovatele je reakční doba pro

Hrubých chyb se musíme vyvarovat. Systematické chyby můžeme rozpoznat a opravit. U cvičeného pozorovatele je reakční doba pro III. Chyby měření a zpracování naměřených výsledků 1. Obecné úvahy Při měření nějaké fyzikální veličiny můžeme zásadně rozlišit dva případy: 1.) několikrát po sobě měříme veličinu, která je konstantní

Více

StatSoft Úvod do neuronových sítí

StatSoft Úvod do neuronových sítí StatSoft Úvod do neuronových sítí Vzhledem k vzrůstající popularitě neuronových sítí jsme se rozhodli Vám je v tomto článku představit a říci si něco o jejich využití. Co si tedy představit pod pojmem

Více

Průzkumová analýza jednorozměrných dat (Teorie)

Průzkumová analýza jednorozměrných dat (Teorie) Míra nezaměstnanosti *%+ 211 Průzkumová analýza jednorozměrných dat (Teorie) Míra nezaměstnanosti *%+ (okres Opava, červen 21) Rozsah 77 Průměr 11,5 Minimum 5,5 Dolní kvartil 8,4 5 1 15 2 Medián 9,9 Horní

Více

Systém M-CAST (Multilingual Content Aggregation System Vícejazyčný systém agregace informací)

Systém M-CAST (Multilingual Content Aggregation System Vícejazyčný systém agregace informací) Systém M-CAST (Multilingual Content Aggregation System Vícejazyčný systém agregace informací) Marie BALÍKOVÁ Národní knihovna České republiky, Praha Marie.Balikova@nkp.cz Petr STROSSA Vysoká škola ekonomická,

Více

( ) ( ) F t je = a (02) a ta se nazývá hustotou poruch. Příklad takové funkce f ( t ), která odpovídá funkci ( ) F t na

( ) ( ) F t je = a (02) a ta se nazývá hustotou poruch. Příklad takové funkce f ( t ), která odpovídá funkci ( ) F t na Doba do poruchy Uvažujme nějaký objekt, jenž je v čase t = 0 uveden do provozu. Tento objekt pracuje za určitých podmínek, o nichž budeme předpokládat, že se nemění s časem. V určitém čase t = x se ale

Více

Nástroje pro analýzu dat

Nástroje pro analýzu dat 7 Nástroje pro analýzu dat V té to ka pi to le: Ověřování vstupních dat Hledání řešení Řešitel Scénáře Citlivostní analýza Rychlá analýza Kapitola 7 Nástroje pro analýzu dat Součástí Excelu jsou nástroje

Více

Řízení projektů zavádění IS do organizací TUTORIAL

Řízení projektů zavádění IS do organizací TUTORIAL Řízení projektů zavádění IS do organizací TUTORIAL Zdenko STANÍČEK 1, Josef HAJKR 2 1 etrium Corporation, a.s. U Vodárny 2,616 00 Brno zdenko.stanicek@etriumgroup.com a Katedra programových a komunikačních

Více

Sémantika otázky v problémové situaci

Sémantika otázky v problémové situaci KYBERNETIKA ČÍSLO 4, ROČNÍK 4/1968 Sémantika otázky v problémové situaci LADISLAV TONDL Práce podává logicko-sémantický rozbor tří základních druhů tzv. uzavřených otázek v problémové situaci: (1) otázek

Více

2. Teorie databázových systémů

2. Teorie databázových systémů - 1-1. Úvod Zpracování dat můžeme definovat jako obsažné a účelné sestavení dat provedené strojem ze zadaných údajů. Cílem je nejen ušetřit lidskou práci a čas, ale zejména zabránit možným chybám. Výsledkem

Více

Vybrané kapitoly z pravděpodobnosti (interaktivní učební text) - Řešené příklady. Martina Litschmannová

Vybrané kapitoly z pravděpodobnosti (interaktivní učební text) - Řešené příklady. Martina Litschmannová Vysoká škola báňská Technická univerzita Ostrava Západočeská univerzita v Plzni Vybrané kapitoly z pravděpodobnosti (interaktivní učební text) - Řešené příklady Martina Litschmannová 1. strana ze 102 1

Více

Institute of Computer Science. Tvorba ontologie huminových látek

Institute of Computer Science. Tvorba ontologie huminových látek Institute of Computer Science Academy of Sciences of the Czech Republic Tvorba ontologie huminových látek Pavel Tyl, Martin Řimnáč, Roman Špánek, Július Štuller, Zdeňka Linková, Josef Kozler, Barbora Antošová,

Více

Masarykova univerzita Ekonomicko správní fakulta. Statistika II

Masarykova univerzita Ekonomicko správní fakulta. Statistika II Masarykova univerzita Ekonomicko správní fakulta Statistika II distanční studijní opora Marie Budíková Brno 2006 Tento projekt byl realizován za finanční podpory Evropské unie v rámci programu SOCRATES

Více

Zjišťování potřeb uživatelů sociálních služeb včetně uživatelských výzkumů

Zjišťování potřeb uživatelů sociálních služeb včetně uživatelských výzkumů Zjišťování potřeb uživatelů sociálních služeb včetně uživatelských výzkumů Základní informace o využití metodiky Cíl metodiky Řešené otázky Seznámit se s nástroji vedoucími ke kvalitnímu shromažďování

Více