Volba aplikační oblasti 1. dvoukriteriální schéma založené na odhadu vágnosti a komplexnosti Důvody aplikace: Faktory úspěchu expert odchází a je třeba zaškolit nástupce snaha pro standardizaci způsobu rozhodování 2. Tansley a Hayball (1993): v definici úlohy jsou použity termíny typu: pravidla, vztahy, předpoklady, úloha se zdá být neřešitelná numerickým výpočtem, zpracovávaná fakta se vyznačují určitou nejistotou, úloha nevyžaduje manuální zručnost, pro úlohu existují kvalifikovaní experti. Zkušenosti z úspěšných projektů: ve znalostech je síla, získejte experta pro spolupráci, zaměřte se na koncového uživatele, použijte inkrementální vývoj metodou rychlého prototypování (rapid prototyping). 3. pravidlo telefonního hovoru : každý problém, který expert běžně vyřeší po telefonu za 10 až 30 minut lze řešit i expertním systémem. P. Berka, 2007 1/28 P. Berka, 2007 2/28 Tvorba aplikace Dedikované expertní systémy Typ systému malý velký velmi velký Počet pravidel 50-350 500-3000 10000 Počet člověkoroků 0.3-0.5 1-2 3-5 Cena projektu (v tis.$) 40-60 500-1000 2000-5000 (Harmon, King, 1985) Vytvoření expertního systému pro středně složitý problém vyžaduje asi dva roky práce čtyřčlenného týmu ve složení: vedoucí znalostní inženýr (na 1/4 úvazku), znalostní inženýr (na plný úvazek), programátor (na plný úvazek), expert (na 3/4 úvazek). (Waterman 1986) Problémově zaměřená aplikace šitá na míru konkrétní úloze. Příklady z KIZI: 1. Systém TEAM: doporučení ke zlepšení práce řešitelského kolektivu. Báze znalostí zahrnuje šest oblastí úrovně týmové práce: myšlení, práce s informacemi, odborná připravenost, skupinová práce, motivace, struktura týmu Systém nabízí dva způsoby hodnocení: hodnocení pozorovatelem a samohodnocení týmu Prázdný systém doplněn o: vstupní dotazník syntézu dílčích odpovědí z jednotlivých dotazníků P. Berka, 2007 3/28 P. Berka, 2007 4/28
Schéma systému Team 2. Systém AREX: vyhodnocení dat o spolehlivosti automobilů. Vyhodnocení odchylek mezi skutečným a předpokládaným průběhem poruch Odhadnutí možných příčin těchto odchylek na základě konzultace s expertním systémem Prázdný systém doplněn o: Určení míry odchylky mezi skutečným a předpokládaným počtem poruch Vysvětlování prováděné během interaktivní konzultace (výpis aktivovaných pravidel) Možnost automaticky aktualizovat bázi znalostí na základě požadovaných výsledků konzultace P. Berka, 2007 5/28 P. Berka, 2007 6/28 Báze znalostí má tříúrovňovou hierarchickou strukturu vytvořenou s použitím kontextů AREX Znalosti o příčinách odchylek v průběhu jsou pravidla tvaru JESTLIŽE Poruchy druhu p j Vykazují v období záruky odchylku S > P resp. S < P POTOM Potenciální příčinou poruch je závada Z s vahou w P. Berka, 2007 7/28 P. Berka, 2007 8/28
Životní cyklus expertního systému Softwarový projekt, kde klíčovou roli hraje využití znalostí 1. Analýza posouzení, zda lze ve zvolené aplikaci použít techniky znalostního inženýrství 2. Specifikace definování činnost znalostního systému 3. Vývoj iterativní proces vytváření (zpřesňování a rozšiřování) znalostního systému 4. Využívání průběžná aktualizace a údržba znalostního systému P. Berka, 2007 9/28 P. Berka, 2007 10/28 Vodopádový model Spirálový model (Boehm 1988, převzato ze Sochor 2003) P. Berka, 2007 11/28 P. Berka, 2007 12/28
V model Získávání znalostí (Boose, 1988) základ pro metodiku KADS P. Berka, 2007 13/28 P. Berka, 2007 14/28 Verbální techniky elicitace znalostí Techniky založené na rozhovoru úvodní výklad experta k dané problematice nestrukturovaný rozhovor (běžná odborná konverzace) strukturovaný rozhovor (pevná agenda s cílenými dotazy) introspekce (myšlení nahlas) V počáteční fázi procesu získávání znalostí se někdy jako specifická forma skupinové diskuse používá brainstorming. Observační techniky komentovaný případ (expert řeší skutečný případ a komentuje svůj postup) prosté pozorování (znalostí inženýr bezprostředně interpretuje postup experta) simulace dialogu systému s uživatelem (expert a uživatel komunikují přes počítačové rozhraní, a všechny jejich akce jsou automaticky zaznamenávány) Neverbální techniky elicitace znalostí Třídění karet. Expertovi jsou předložena sada karet, z nichž každá odpovídá jednomu objektu (např. řešenému případu). Expert má za úkol nacházet vytvářet skupiny karet, které mají něco společného, a snažit se definovat, o jakou společnou vlastnost jde. Metoda repertoárové tabulky založená na tzv. konstruktivní psychologické teorii G.Kellyho. Repertoárová tabulka je dvourozměrná tabulka, v níž jeden rozměr odpovídá objektům a druhý konstruktům (vlastnostem objektů); uvnitř tabulky jsou hodnoty konstruktů pro jednotlivé objekty. Maticová analýza. Založena na dvourozměrné tabulce, kde jeden rozměr tvoří objekty a druhý vlastnosti; na rozdíl od repertoárové tabulky neuvažuje bipolární vlastnosti objektů, nýbrž jen přítomnost/nepřítomnost dané vlastnosti (např. symptomu) u daného objektu (např. diagnózy). P. Berka, 2007 15/28 P. Berka, 2007 16/28
Vícerozměrné škálování. spočívá ve vytvoření tabulky vzájemných podobností všech objektů, a v její následné statistické analýze vedoucí k uspořádání objektů do shluků. Žebříková analýza (laddering) slouží pro generování struktury doménových konceptů pomocí střídání vzestupných a sestupných kroků v generalizační hierarchii. Poloautomatizované získávání znalostí Systémy vycházející z použití repertoárové tabulky: systém ETS (Boose 1985), tuzemský systém SAZE (Mikulecký, Heroutová), nebo novější systém RepGrid (repgrid.com) Postup tvorby báze znalostí: 1. Expert zadá seznam možných řešení (objektů) TBC, chřipka, nachlazení 2. Expert zadá tzv. tabulku ohodnocení (rating grid), ve které je každé řešení (objekt) popsáno pomocí znaků (konstruktů) bledost dýchavičnost kašel rýma horečka TBC 100 100 50-100 -100 Chřipka -100-100 100-100 100 Nachlazení -100-50 100 100-100 P. Berka, 2007 17/28 P. Berka, 2007 18/28 3. Systém vytvoří implikace mezi jednotlivými póly různých konstruktů dýchavičnost nedýchavičnost bledost 1 0 nebledost 0 2 bledost dýchavičnost... 4. Systém pokračuje tvorbou pravidel (od každého pólu každého konstruktu ke všem objektům): Když bledost, pak TBC s váhou 47 chřipka s váhou -47 nachlazeni s váhou -47 Analýza vytvořené báze: vyhodnocení podobnosti objektů a konstruktů doporučení přidat objekty které chybí Průběh konzultace: 1. Uživatel volí důležitost konstruktu (další typ neurčitosti) 2. Uživatel odpovídá na otázky volbou neurčitosti ve škále mezi oběma póly daného konstruktu 3. Systém kombinuje pravidla s využitím MYCINovského způsobu práce s neurčitostí; výsledkem je seznam objektů uspořádaný podle vhodnosti jako řešení dané konzultace Když nebledost, pak... TBC s váhou -47 chřipka s váhou 47 nachlazeni s váhou 47 Kde váha pravidla w ij je dána hodnotou t ij z tabulky, důležitostí konstruktu d j a koeficientem f(m) w ij = f(m) * d j * t ij P. Berka, 2007 19/28 P. Berka, 2007 20/28
Automatizované získávání znalostí Používané metody: např. údaje o osobách - klientech banky, kterým banka půjčuje na základě informací o jejich příjmech a výši konta z oblasti statistiky - shluková analýza, diskriminační analýza, regresní analýza z oblasti strojového učení rozhodovací stromy, rozhodovací pravidla, neuronové sítě, bayesovské sítě, genetické algoritmy, učení založené na instancích Znalosti se získávají metodou generalizace z dat (induktivní inference) Učení na základě podobnosti: objekty, patřící do téže třídy mají podobné charakteristiky z konečného počtu příkladů odvozujeme obecné znalosti P. Berka, 2007 21/28 P. Berka, 2007 22/28 Rozhodovací stromy: Rozhodovací pravidla: P. Berka, 2007 23/28 P. Berka, 2007 24/28
Neuronové sítě: Učení založené na instancích P. Berka, 2007 25/28 P. Berka, 2007 26/28 Přínosy expertních systémů zvýšená dostupnost expertízy (expertní systémy lze provozovat na libovolných počítačích), snížené náklady na provedení expertízy (cena práce počítače je nižší než cena práce experta), trvalost expertízy (znalosti uložené v expertním systému jsou použitelné trvale, expert může odejít), násobná expertíza (znalosti v expertním systému mohou pocházet od více expertů), vzrůst spolehlivosti expertízy (ve stejných situacích systém rozhoduje stejně, expertízu je možno dokumentovat...), schopnost vysvětlování, rychlá odezva, úplnost expertízy (expertní systém nepodléhá emocím, únavě, stresu) Perspektivy expertních systémů Expertní systémy zatím nedosáhly takového rozšíření a obliby jako např. databázové systémy nebo tabulkové kalkulátory. chybějí efektivnější techniky získávání znalostí, které by urychlily vývoj konkrétní aplikace, nedostatečné integrování do používaných technologií, která snižuje přijatelnost expertních systémů pro uživatele (uživatel používá zavedenou informační technologii, do které investoval), znalostní inženýři kladou malý důraz na aplikační oblast (úkolem by mělo být vyřešit konkrétní problém, nikoliv přizpůsobit jej používanému nástroji), chybějí přesné testovací procedury, které by zaručily, že výsledný systém správně funguje. P. Berka, 2007 27/28 P. Berka, 2007 28/28