APLIKOVANÁ UMĚLÁ INTELIGENCE

Podobné dokumenty

Regresní a korelační analýza

Jazyk matematiky Matematická logika Množinové operace Zobrazení Rozšířená číslená osa

GRAFY A GRAFOVÉ ALGORITMY

MINISTERSTVO ŠKOLSTVÍ, MLÁDEŽE A TĚLOVÝCHOVY. Učební osnova předmětu MATEMATIKA. pro studijní obory SOŠ a SOU (13 15 hodin týdně celkem)

Matematická statistika

TEORIE ZPRACOVÁNÍ DAT

Seminář z matematiky. jednoletý volitelný předmět

Dodatek č. 3 ke školnímu vzdělávacímu programu. Strojírenství. (platné znění k )

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více

Některé zákony rozdělení pravděpodobnosti. 1. Binomické rozdělení

+ ω y = 0 pohybová rovnice tlumených kmitů. r dr dt. B m. k m. Tlumené kmity

7. Rozdělení pravděpodobnosti ve statistice

2. RBF neuronové sítě

3. Matice a determinanty

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

Matematická logika. Miroslav Kolařík

9. Úvod do teorie PDR

Matematika pro studenty ekonomie

KYBERNETIKA. Prof. Ing. Vilém Srovnal, CSc. Vysoká škola báňská Technická univerzita Ostrava

Učební osnova předmětu stavba a provoz strojů

(Auto)korelační funkce Statistické vyhodnocování exp. dat M. Čada ~ cada

Základy teorie pravděpodobnosti

Distribuční funkce je funkcí neklesající, tj. pro všechna

Skalární součin je nástroj, jak měřit velikost vektorů a úhly mezi vektory v reálných a komplexních vektorových prostorech.

Skalár- veličina určená jedním číselným údajem čas, hmotnost (porovnej životní úroveň, hospodaření firmy, naše poloha podle GPS )

Petr Chvosta. vlevo, bude pravděpodobnost toho, že se tyč na počátku intervalu τ B nachází nad vpravo

PROFIL BUDOUCÍHO ABSOLVENTA OBORU INFORMATIKA

1 VZNIK, VÝVOJ A DEFINICE MECHATRONIKY

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od podzimu 2015

Úvod. Integrování je inverzní proces k derivování Máme zderivovanou funkci a integrací získáme původní funkci kterou jsme derivovali

ZNALOSTNÍ SYSTÉMY ŘÍZENÍ

Vysoká škola báňská Technická univerzita Ostrava TEORIE ÚDRŽBY. učební text. Jan Famfulík. Jana Míková. Radek Krzyžanek

Aplikovaná numerická matematika

BAKALÁŘSKÁ PRÁCE. Numerické metody jednorozměrné minimalizace

Několik poznámek na téma lineární algebry pro studenty fyzikální chemie

A0M15EZS Elektrické zdroje a soustavy ZS 2011/2012 cvičení 1. Jednotková matice na hlavní diagonále jsou jedničky, všude jinde nuly

Přijímací zkouška - matematika

Matematické symboly a značky

Jak je důležité být fuzzy

Biostatistika a matematické metody epidemiologie- stručné studijní texty

Náhodné chyby přímých měření

Teoretická rozdělení

Moderní technologie ve studiu aplikované fyziky CZ.1.07/2.2.00/ Množiny, funkce

MATEMATIKA Charakteristika vyučovacího předmětu 2. stupeň

Součin matice A a čísla α definujeme jako matici αa = (d ij ) typu m n, kde d ij = αa ij pro libovolné indexy i, j.

SYSTÉMY S UMĚLOU INTELIGENCÍ

Matematika a ekonomické předměty

U Úvod do modelování a simulace systémů

Absolventi středních škol a trh práce PEDAGOGIKA, UČITELSTVÍ A SOCIÁLNÍ PÉČE. Odvětví:

Euklidovský prostor Stručnější verze

KATEDRA INFORMATIKY UNIVERZITA PALACKÉHO LINEÁRNÍ ALGEBRA 1 OLGA KRUPKOVÁ VÝVOJ TOHOTO UČEBNÍHO TEXTU JE SPOLUFINANCOVÁN

Ten objekt (veličina), který se může svobodně měnit se nazývá nezávislý.

Náhodné (statistické) chyby přímých měření

PROPUSTNOST ŽELEZNIČNÍ DOPRAVY

Téma je podrobně zpracováno ve skriptech [1], kapitola

JIHOČESKÁ UNIVERZITA V ČESKÝCH BUDĚJOVICÍCH Ekonomická fakulta DIPLOMOVÁ PRÁCE Bc. Lucie Hlináková

Kombinatorický předpis

MATEMATIKA A Metodický list č. 1

Západočeská univerzita v Plzni. Fakulta aplikovaných věd Katedra matematiky. Geometrie pro FST 1. Pomocný učební text

Matematika I. dvouletý volitelný předmět

(Cramerovo pravidlo, determinanty, inverzní matice)

Mgr. Ladislav Zemánek Maturitní okruhy Matematika Obor reálných čísel

Učební texty k státní bakalářské zkoušce Matematika Matice. študenti MFF 15. augusta 2008

Drsná matematika IV 7. přednáška Jak na statistiku?

Matematika - Prima. množiny zavedení pojmů množina, prvek, sjednocení, průnik, podmnožina

Prognóza poruchovosti vodovodních řadů pomocí aplikace Poissonova rozdělení náhodné veličiny

Usuzování za neurčitosti

Požadavky k opravným zkouškám z matematiky školní rok

P ř e d m ě t : M A T E M A T I K A

Poznámka. Je-li f zobrazení, ve kterém potřebujeme zdůraznit proměnnou, píšeme f(x) (resp. f(y), resp. f(t)) je zobrazení místo f je zobrazení.

Spolehlivost a provozní vlastnosti kondenzátorů

Základy matematiky pro FEK

Požadavky k písemné přijímací zkoušce z matematiky do navazujícího magisterského studia pro neučitelské obory

Technisches Lexikon (cz.) 16/10/14

PRAVDĚPODOBNOST A STATISTIKA 1 Metodický list č 1.

Dnešní program odvozování v Bayesovských sítích exaktní metody (enumerace, eliminace proměnných) aproximační metody y( (vzorkovací techniky)

VYBRANÉ MOŽNOSTI SNIŽOVÁNÍ EMISÍ SO2 U STÁVAJÍCÍCH UHELNÝCH ZDROJŮ

CW01 - Teorie měření a regulace

1.3. Cíle vzdělávání v oblasti citů, postojů, hodnot a preferencí

Matice se v některých publikacích uvádějí v hranatých závorkách, v jiných v kulatých závorkách. My se budeme držet zápisu s kulatými závorkami.

Rozhodovací procesy v ŽP HRY A SIMULAČNÍ MODELY

2. Množiny, funkce. Poznámka: Prvky množiny mohou být opět množiny. Takovou množinu, pak nazýváme systém množin, značí se

5. Maticová algebra, typy matic, inverzní matice, determinant.

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od jara 2017

37 MOLEKULY. Molekuly s iontovou vazbou Molekuly s kovalentní vazbou Molekulová spektra

Mendelova zemědělská a lesnická univerzita v Brně Institut celoživotního vzdělávání Fakulta regionálního rozvoje a mezinárodních studií

NÁHODNÁ VELIČINA. 3. cvičení

MEZINÁRODNÍ AUDITORSKÝ STANDARD ISA 530 VÝBĚR VZORKŮ

TZB - VZDUCHOTECHNIKA

Teorie pravěpodobnosti 1

6. ANALYTICKÁ GEOMETRIE

Jak pracovat s absolutními hodnotami

Fuzzy množiny, Fuzzy inference system. Libor Žák

Y36BEZ Bezpečnost přenosu a zpracování dat. Úvod. Róbert Lórencz. lorencz@fel.cvut.cz

Inovace a zkvalitnění výuky prostřednictvím ICT

Vybrané přístupy řešení neurčitosti

zejména Dijkstrův algoritmus pro hledání minimální cesty a hladový algoritmus pro hledání minimální kostry.

Komplexní čísla, Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady

Funkce jedn e re aln e promˇ enn e Derivace Pˇredn aˇska ˇr ıjna 2015

Transkript:

Vysoká škola báňská - Technická univerzita Ostrava Fakulta elektrotechniky a informatiky Katedra měřicí a řídicí techniky APLIKOVANÁ UMĚLÁ INTELIGENCE Miroslav Pokorný Ostrava 2005

OBSAH 1 ÚVOD - MODELOVÁNÍ A UMĚLÁ INTELIGENCE 1.1 Teorie modelování a matematické modely 1.2 Meze aplikace matematických modelů, problematika modelování složitých soustav 1.3 Využití znalostí v procesu modelování a jazykové modely 2 - KVALITATIVNÍ MODELY 2.1 Princip kvalitativního popisu 2.2 Kvalitativní proměnná 2.3 Kvalitativní algebra 2.4 Kvalitativní simulace 5.5 Kvalitativní model vylučování toxinů 3 - FUZZY MODELY 3.1 Fuzzy množinová teorie 3.2 Jazyková proměnná 3.3 Vícehodnotová logika a jazykové modely 3.4 Prohlášení a typy modelů 3.5 Aproximace jazykového modelu 4 - FUZZY EXPERTNÍ SYSTÉMY 4.1 Definice expertního systému 4.2 Architektura expertního systému 4.3 Uživatelské programové vybavení 4.4 Aktivizace fuzzy modelu 4.5 Interpretace odpovědí expertních systémů 5 - FUZZY ŘÍDÍCÍ SYSTÉMY 5.1 Expertní systémy a řízení 5.3 Jazykový popis řízení systémů 5.4 Typy fuzzy regulátorů 5.5 Fuzzy systémy FLC 6 - KOGNITIVNÍ ANALÝZA 6.1 Definice inženýrského ekvivalentu experta 6.2 Konzistence a kognitivní analýza 6.3 Ternární diagram 7 - NEURONOVÉ SÍTĚ 7.1 Princip biologických a umělých neuronových sítí 7.2 Architektury neuronových sítí 7.3 Vícevrstvá neuronová síť 7.4 Strategie adaptační metody

8 GENETICKÉ ALGORITMY 8.1 Principy biologické evoluce 8.2 Evoluční algoritmy 8.3 Genetický algoritmus 8.4 Pokročilé evoluční algoritmy 9 INTEGROVANÉ SYSTÉMY SOFT-COMPUTINGU 9.1 Integrace principů umělé inteligence a její výhody 9.2 Fuzzy-neuronové systémy 9.3 Fuzzy-genetické systémy 9.4 Fuzzy-neuro-genetické systémy

POKYNY KE STUDIU Aplikovaná umělá inteligence Skriptum se dělí na kapitoly, které odpovídají logickému dělení studované látky, ale nejsou stejně obsáhlé. Předpokládaná doba ke studiu kapitoly se může výrazně lišit, proto jsou velké kapitoly děleny dále na číslované podkapitoly a těm odpovídá níže popsaná struktura. Při studiu každé kapitoly doporučujeme následující postup: Čas ke studiu Na úvod kapitoly je uveden čas potřebný k prostudování látky. Čas je orientační a může vám sloužit jako hrubé vodítko pro rozvržení studia celého předmětu či kapitoly. Někomu se čas může zdát příliš dlouhý, někomu naopak. Jsou studenti, kteří se s problematikou databází ještě nikdy nesetkali a naopak takoví, kteří již v tomto oboru mají bohaté zkušenosti. Cíl Ihned potom jsou uvedeny cíle, kterých máte dosáhnout po prostudování této kapitoly konkrétní dovednosti, znalosti. Výklad Následuje vlastní výklad studované látky, zavedení nových pojmů, jejich vysvětlením, vše doprovázeno řešenými příklady. Shrnutí pojmů Na závěr kapitoly jsou zopakovány hlavní pojmy, které si v ní máte osvojit. Pokud některému z nich ještě nerozumíte, vraťte se k nim ještě jednou.

Otázky Pro ověření, že jste dobře a úplně látku kapitoly zvládli, máte k dispozici několik teoretických otázek. Úlohy k řešení Protože většina teoretických pojmů tohoto předmětu má bezprostřední význam a využití v databázové praxi, jsou Vám nakonec předkládány i praktické úlohy k řešení. V nich je hlavní význam kurzu a schopnost aplikovat čerstvě nabyté znalosti při řešení reálných situací hlavním cílem kurzu. Výsledky zadaných příkladů stejně jako teoretických otázek výše jsou uvedeny v závěru učebnice v KLÍČI K ŘEŠENÍ. Používejte je až po vlastním vyřešení úloh, jen tak si samokontrolou ověříte, že jste obsah kapitoly skutečně úplně zvládli. Úspěšné a příjemné studium s touto učebnicí Vám přeje autor kurzu Miroslav Pokorný

1 ÚVOD - MODELOVÁNÍ A UMĚLÁ INTELIGENCE 1.1 Teorie modelování a matematické modely Čas ke studiu: 30 min Cíl Po prostudování tohoto odstavce budete umět Vysvětlit základní principy tvorby abstraktních modelů soustav Popsat problematiku konstrukce modelů složitých objektů Řešit postup nenumerického modelování s využitím znalostí Výklad Modelování je proces tvorby abstraktních (počítačových) modelů, v němž se v konvenčních přístupech využívá matematicko-fyzikální analýza i experimenty. Model je definován jako zobrazení existujících stránek reálného systému. Identifikace je pak proces ztotožnění modelu s objektem. Identifikace a modelování jsou procesy, které se navzájem prolínají. Na základě předběžných informací o systému, definovaném na zvolené rozlišovací úrovni a smyslu užití modelu přímo na objektu zkoumání, odhadneme pomocí matematicko-fyzikální analýzy strukturu modelu a vhodně volenými experimenty přímo na tomto systému pak v druhém kroku odhadujeme metodami identifikace hodnoty jeho parametrů. Cílem identifikace a modelování je vytvořit takový model systému, jehož chování by bylo v jistém smyslu - nejčastěji z hlediska minima kriteria ztráty - stejné jako u systému za stejných provozních podmínek. Zkoumaný systém nazýváme procesem a určený systém nazýváme modelem. Slovem objekt pak nazýváme onu hmotnou část skutečnosti, na které definujeme systém. Definovat systém na objektu z hlediska daného účelu a vytvořit vyhovující model jsou základní úlohy identifikace a modelování. Provedeme-li rozklad zkoumaného objektu na soubor složek a 1, a 2,..., a k vzájemně vázaných a reprezentujících objekt, pak soubor složek A a a,..., 1, 2 a k nazýváme složkovou charakteristikou objektu [1]. Označíme-li dále symboly r uv vzájemnou souvislost složek a u a a v, tedy r uv = r(a u,a v ), jako např. souvislost vstupních veličin složky a u a výstupních veličin složky a v, potom soubor všech uvažovaných závislostí 1

RC r uv nazýváme relační charakteristikou objektu. Vztah RC se určuje induktivním způsobem, v případě matematického (numerického) modelování výběrem nějakého všeobecného vztahu a konkrétními hodnotami jeho parametrů, tedy RC F, kde F je struktura a ß je množina parametrů vybraného vztahu. V procesu identifikace pak vzhledem k definici systému na objektu rozeznáváme dvě etapy: 1. Výběr struktury systému F. 2. Porovnání chování systému se vztahy patřícími do množiny F s cílem nalezení optimálních hodnot parametrů systému ß. Druhou etapu (parametrickou identifikaci systému) je možno vykonávat systematicky, avšak za podmínky, že byla ukončena etapa první, t.j. výběr struktury (kterou vykonáváme heuristicky). V procesu identifikace se při tvorbě operátoru modelu můžeme opírat jak o informaci apriorní, tak o informaci aposteriorní. Apriorní máme k dispozici ještě před začátkem pozorování a aposteriorní nám přináší vhodně volený experiment. Míra shody mezi reálným procesem a modelem je nejčastěji definována tak, že kriteriem kvality bývá míra shody modelu a procesu, určovaná pomocí funkce ztrát J y 0 * 0 * T 0 * T, y y y y y e e Taková kvadratická ztrátová funkce je funkcí výstupu procesu y 0 a výstupu z modelu y *. Odchylka e je mírou neshody mezi chováním procesu a modelu. Optimálním výsledkem identifikace pak bude určení takového modelu, pro který bude platit, že ztrátová funkce dosahuje minima J y 0, y * min Předběžné informace o zkoumaném procesu (jsou-li k dispozici) umožňují vytvořit výchozí struktury a proces identifikace pak spočívá v určení parametrů předpokládané struktury. Nejsou-li k dispozici apriorní znalosti o struktuře objektu, je třeba výchozí struktury rovněž identifikovat. Experimentálním způsobem identifikace je řešení úlohy definice modelu procesu na základě souboru jeho vstupních a jim odpovídajících výstupních dat (datově orientované modely). Je-li možno akceptovat předpoklad časové neproměnlivosti dynamických vlastností soustavy, 2

je možno použít identifikaci jednorázovou. Není-li tento předpoklad splněn, je třeba použít metod identifikace průběžné, kdy parametry (případně i struktura) matematického modelu jsou vyhodnocovány průběžně v reálném čase. Shrnutí pojmů Matematický model je vyjádřením problému pomocí fyzikálního a matematického formálního aparátu. Takto lze vyjadřovat složité vztahy symbolicky a zachovat při tom jednoduchost a racionálnost. Matematický model je představován soustavou matematických vztahů, jednoznačně popisujících zkoumaný jev nebo proces. Formální aparát je tvořen obvykle rovnicemi algebraickými, obyčejnými nebo parciálními diferenciálními rovnicemi, soustavami takových rovnic, dále různými vztahy z teorie klasických množin, algebry, teorie pravděpodobnosti, matematické statistiky a matematické logiky. Příklad 1 Jako příklad matematického modelu uvedeme známý Newtonův zákon, který uvádí závislost velikosti zrychlení a tělesa o hmotnosti m = 12,45kg, působí-li na něj síla F. F = 12,45.a a = F : 12,45 m/s 2 Otázky 1.1. Co je to matematický model objektu? Co je proces identifikace modelu? Úlohy k řešení 1.1. Vymyslete sami matematickou rovnici (nebo soustavu rovnic), reprezentující fyzikální soustavu. Určete parametry takto napsaného modelu soustavy a pouvažujte o možnosti přesného stanovení jejich číselných hodnot! 3

1.2 Meze aplikace matematických modelů, problematika modelování složitých soustav Čas ke studiu: 30 minut Cíl Po prostudování tohoto odstavce budete umět Popsat omezení v použití matematických modelů Vysvětlit úlohu vědního oboru umělá inteligence Výklad Konvenční matematicko-statistické analytické modely představují modely, pro jejichž sestavení je k dispozici (předem nebo následně) přesná a úplná informace. Pod přesnou a úplnou informací si zpravidla představujeme takovou informaci, která se dá reprezentovat či modelovat tak, že jak struktura tak i všechny parametry jsou jednoznačně určeny. Modely, vykazující takovou formální dokonalost, nejsou zpravidla adekvátní skutečnosti, která je vágní a složitá. Představa, že dostatečně složitý matematický model může reprezentovat realitu s libovolnou přesností či adekvátností, není zřejmě správná. Formálně složité matematické modely vyžadují informace, které jsou náročné jak způsobem svého objektivního získávání, tak i nároky na svoji kvalitu. Tato skutečnost je zvláště závažná u modelů, určených pro práci v informačních nebo řídících systémech reálného času. Potřebná rozsáhlá a náročná měření jsou v těžkých provozních podmínkách buď zcela nemožná, nadměrně náročná na údržbu, nebo při zajištění potřebné robustnosti je kvalita jejich informace tak nízká, že jsou nepoužitelná. Na tuto skutečnost poprvé upozornil L.A.Zadeh [2], když v r. 1973 formuloval princip inkompatibility slovy: "Tak, jak roste složitost nějakého systému, klesá naše schopnost činit precizní a přitom ještě použitelná tvrzení o jeho chování, dokud není dosaženo prahu, za nímž se stávají preciznost a použitelnost (nebo relevantnost) téměř vzájemně se vylučujícími charakteristikami." Studovaná část reálného světa vykazuje zpravidla mnoho nejasného a vágního. Klasické metody pro formalizaci nepřesnosti předpokládají stochastický charakter ne zcela přesně determinovaných jevů. Takový stochastický přístup ke zpracování neurčitosti pomocí aparátu pravděpodobnosti a matematické statistiky vyžaduje, aby příslušné jevy byly dobře definovanými prvky množiny a měly právě tak dobře definovaný význam výpovědí o nich. Dále je nutno dodržet řadu předpokladů o datech a mít k dispozici dostatečný počet pozorování. Inženýrské projekty řízení složitých technologických procesů ukázaly, že klasická matematická statistika se svým principiálním pojetím a řadou omezení není prostředkem k formalizaci a efektivnímu využití takového typu neurčitosti, který nazýváme vágností (pojmovou neurčitostí), jež je při jazykovém popisu složitých systémů podstatná. 4

V kap.1.1 jsme definovali složkovou charakteristiku objektu vztahem RC kde uv r uv u r r a, a v představuje souvislosti vstupních a výstupních veličin složek zkoumaného objektu. Matematické modely vycházejí z předpokladu, že relační charakteristika objektu je definována ostře, precizně a odchylky mezi odhadovanými a pozorovanými hodnotami závisle proměnné jsou tudíž výsledkem chyb pozorování. Původ odchylek mezi pozorovanými a vypočítanými hodnotami závisle proměnné veličiny mohou však být nezanedbatelnou měrou způsobeny špatnou definovaností systémové struktury. Příčiny těchto odchylek můžeme hledat i v ne zcela ostrém charakteru systémových parametrů. V této souvislosti vyvstává relevantní problém metod formalizace a efektivního zpracování neurčitých informací. Ukazuje se, že právě schopnost lidského mozku konstruovat a využívat jednoduché algoritmy pro vyvozování závěrů v podmínkách neurčitosti je hlavní příčinou kvality lidského uvažování. Problematika poznávání obecných zákonitostí kognitivních procesů prostřednictvím modelování a simulací a snaha vytvořit metody a jim odpovídající systémy pro řešení složitých úloh takovými způsoby, které bychom považovali při řešení stejných úloh člověkem jako projevy jeho intelektu, je jednou z definicí předmětu zájmu vědního oboru umělá inteligence [3]. Za jedny z jejích dosavadních výsledků můžeme považovat nekonvenční techniky modelování, simulací a řízení takových procesů, jejichž popis je vágní a pro jejich formalizaci nelze dobře použít klasickou metodu popisu neurčitosti - matematickou statistiku. V řadě inženýrských aplikací, které využívají statistických metod pro vyjádření míry neurčitosti jevů, narážíme na problém malých rozsahů výběrových souborů. Počty vykonaných experimentů bývají často nedostatečné. Doplňková pozorování přitom často nejsou z technických nebo ekonomických důvodů dostupná. Rozpor mezi informační náročností statistiky a omezenými informačními zdroji není jediný, na nějž se při použití klasických formálních prostředků na zpracování informací naráží. Další problémem může vyplývat ze složitosti studovaných soustav a dějů, které v nich probíhají. Nemáme-li k dispozici dostatečný počet pozorování za reprodukovatelných podmínek, nelze variabilitu přírodních dějů eliminovat tím, že vyhovíme požadavkům reprodukovatelnosti stanovením příliš obecných podmínek. Získáme tím výsledky, jejichž rozptyl či konfidenční intervaly jsou natolik široké, že výsledky znehodnotí. Potíže přetrvávají tehdy, pokud se snažíme pracovat pouze s objektivně zjištěnými informacemi. Problémy řeší metody, které připouštějí využití subjektivně zabarvených informací To jsou objektivní důvody, proč se ve zvýšené míře v řadě aplikací uplatňují metody umělé inteligence. Od ní se očekává, že nabídne východisko z problémů, které vznikly snahou o objektivizaci jak v přírodovědeckých, tak i inženýrských disciplínách. 5

Shrnutí pojmů Ani složitý matematický model nemůže reprezentovat realitu s libovolnou přesností či adekvátností. Formálně složité matematické modely vyžadují informace, které jsou náročné jak způsobem svého objektivního získávání, tak i nároky na svoji kvalitu. Potřebná rozsáhlá a náročná měření jsou v těžkých provozních podmínkách buď zcela nemožná, nadměrně náročná na údržbu, nebo při zajištění potřebné robustnosti je kvalita jejich informace tak nízká, že jsou nepoužitelná. Snaha vytvořit složité modely metody a jim odpovídající systémy pro řešení složitých úloh takovými způsoby, které bychom považovali při řešení stejných úloh člověkem jako projevy jeho intelektu, je jednou z definicí předmětu zájmu vědního oboru umělá inteligence. Za jedny z jejích dosavadních výsledků můžeme považovat nekonvenční techniky modelování, simulací a řízení takových procesů, jejichž popis je vágní a pro jejich formalizaci nelze dobře použít klasickou metodu popisu neurčitosti - matematickou statistiku. Příklad 1 Naprosto přesný matematický model z příkladu kap.1.1 nelze sestavit (identifikovat), pokud nemáme možnost stanovit hmotnost tělesa m a velikost působící síly F. Otázky 1.2. Jaké jsou problémy při tvorbě matematických modelů konvenčními metodami? Co je náplní vědního oboru umělá inteligence? Úlohy k řešení 1.2. Uveďte objekt, který považujete z hlediska jeho matematického modelování za složitý. 6

1.3 Využití znalostí v procesu modelování a jazykové modely Čas ke studiu: 30 minut Cíl Po prostudování tohoto odstavce budete umět Popsat a vysvětlit význam lidských znalostí a zkušeností pro modelování složitých soustav Výklad V souladu s rozvojem aplikací metod umělé inteligence vzniká trend přechodu od zpracování údajů ke zpracování znalostí [3]. Lidské znalosti můžeme rozdělit do dvou kategorií: a) v první jsou tak tzv. znalosti hluboké, jejichž zdrojem je vlastní poznání přírodních dějů ve formě přírodních zákonů. Jsou to znalosti objektivní, dostupné více či méně široké odborné veřejnosti. Jsou produktem analytických, abstraktních a teoretických postupů zkoumání jevů reality. Hluboké znalosti jsou vyjadřovány formou analytických matematických vztahů. b) druhou kategorii znalostí označujeme jako znalosti mělké, povrchové (nikoli však povrchní!). Jsou to poznatky, jejichž zdrojem je dlouhodobá zkušenost, praxe a vlastní experimentování. Jsou to subjektivní znalosti, které kvalifikují úroveň experta. Mělké znalosti jsou vyjádřitelné formou predikátových kalkulů, heuristických pravidel, rámců či kvalitativních vztahů. V procesu modelování hraje rovněž významnou roli dělení znalostí na znalosti apriorní, známé již ve fázi tvorby modelu a znalosti aposteriorní, získávané až v etapě jeho identifikace a využívání. Využití hlubokých znalostí je typické pro metody konstrukce konvenčních, matematických statisticko-analytických modelů. Tyto modely, formalizované soustavami algebraických či diferenciálních rovnic, odrážejí díky aplikaci objektivních znalostí a metod obvykle širší třídy problémů a mají ponejvíce obecnou platnost. Uplatnění subjektivních znalostí v takových modelech není typické. Cesta uplatnění specifických (subjektivních, heuristických) znalostí vede k metodám tvorby nekonvenčních nenumerických (jazykových) modelů, které využívají vícehodnotové logiky a různé formální aparáty jak pro reprezentaci neurčitých pojmů, tak i pro aproximativní (přibližné) vyvozování. Mělké znalosti však nepodchycují podstatu vztahů uvnitř modelované soustavy. Nedostatečnost mělkých znalostí vede k odkazům na metaznalosti - znalosti o znalostech. Použití mělkých znalostí vede mnohdy ke zjednodušení principů a mechanizmů metod vyvozování. Přesto, že řada takto koncipovaných přístupů dosáhla komerčního úspěchu, v mnohých případech se projevila významnost limit jejich funkčních schopností. 7

V první řadě zde stojí skutečnost, že konstrukce a kvalita takového modelu je plně závislá na existenci kvalitního experta v dané problémové oblasti. Dále pak celou řadu problémů přináší role znalostního inženýra, jehož úkolem je vedení dialogu s expertem, čerpání jeho znalostí, volba vhodné metody jejich formalizace a způsobu aproximativního vyvozování. Vyvození, která takové systémy poskytují, mají vyhraněně lokální charakter. Obecně je možno říci, že systémy, založené výhradně na mělkých znalostech, trpí ohraničenými možnostmi efektivního strukturování jimi realizovaných rozhodovacích procesů a zjednodušenými principy odvozovacích a vysvětlovacích mechanizmů. Snaha o přiměřené uplatnění hlubokých znalostí v nekonvenčních modelech z oblasti umělé inteligence vedla k přístupům, které umožňují integraci objektivních a subjektivních informací. Jejich výraznou charakteristikou je uplatnění globálních pohledů při rozhodování, plynoucích právě z uplatnění objektivních informací. Hluboké znalosti jsou rovněž nazývány znalostmi kvantitativními, mělké znalosti pak znalostmi kvalitativními. Možnost jejich integrace má zvláště velký význam v oblasti diagnostiky technologických procesů s ohledem na možnost predikce jejich poruchových stavů (bezpečnostní inženýrství). Shrnutí pojmů V souladu s rozvojem aplikací metod umělé inteligence vzniká trend přechodu od zpracování údajů ke zpracování znalostí. Lidské znalosti můžeme rozdělit do dvou kategorií znalosti mělké a znalosti hluboké. Využití hlubokých znalostí je typické pro metody konstrukce konvenčních, matematických statisticko-analytických modelů. Tyto modely, formalizované soustavami algebraických či diferenciálních rovnic, odrážejí díky aplikaci objektivních znalostí a metod obvykle širší třídy problémů a mají ponejvíce obecnou platnost. Cesta uplatnění mělkých znalostí vede k metodám tvorby nekonvenčních nenumerických (jazykových) modelů, které využívají vícehodnotové logiky a různé formální aparáty jak pro reprezentaci neurčitých pojmů, tak i pro aproximativní (přibližné) vyvozování. Příklad 1 V příkladu kap.1 můžeme uplatnit znalost, že čím větší je působící síla, tím větší je udělené zrychlení. Další znalostí může být zkušenost, že závislost působící síly a zrychlení není lineární. Otázky 1.3. Jaký je rozdíl mezi mělkými a hlubokými znalostmi? Úlohy k řešení 1.3. Uveďte příklad mělké a hluboké znalosti v oboru, který je Vám blízký (řízení automobilu, hra v šachy apod.). 8

2 - KVALITATIVNÍ MODELY 2.1 Princip kvalitativního popisu Čas ke studiu: 10 minut Cíl Po prostudování tohoto odstavce budete umět Vysvětlit principy kvalitativního modelování a simulací Výklad Ke kvalitativnímu popisu zkoumaných jevů přistupujeme tehdy, pokud nechceme (nebo neumíme) analyticky přesně popsat vztahy mezi proměnnými veličinami popisovaných dějů [4], [10]. Důležitým znakem kvalitativního uvažování (Common Sense - naivní fyzika) je přechod k novému oboru proměnných. Místo reálných čísel, typických pro matematický (numerický, kvantitativní) popis, je oborem hodnot množina hodnot, která umožňuje kvalitativně charakterizovat aktuální hodnotu číselné proměnné relativně vůči jejím významným hodnotám. Kvalitativní hodnota proměnné je pak dána údajem o velikosti hodnoty, charakterizující polohu aktuální hodnoty proměnné vůči významným mezním hodnotám (kladná větší než nula, záporná menší než nula a nulová) a údaji o vývojové tendenci proměnné (její velikost roste, klesá, je konstantní). Čas je reprezentován uspořádanou množinou symbolů, odpovídající významným okamžikům. Kvalitativní průběh proměnné v čase je funkce, která přiřazuje významným okamžikům a intervalům mezi nimi kvalitativní hodnoty. Chování soustavy (kvalitativní model) je vyjádřeno pomocí formulí (kvalitativních rovnic neboli konfluencí), vytvořených z množiny kvalitativních proměnných a kvalitativních vazeb. Vazby jsou relace, definované na kvalitativních hodnotách tak, aby co nejpřesněji popisovaly běžné aritmetické operace, vztahy derivací, rovností a nerovností. Zde je třeba zdůraznit, že na rozdíl od kvantitativního popisu, kde jsou vazby funkcemi, jde v případě kvalitativních vazeb o relace, neboť výsledek aplikace kvalitativní operace na kvalitativní hodnoty nelze určit jednoznačně Kvalitativní simulace systému spočívá v odvození kvalitativního průběhu jeho proměnných ze soustavy konfluencí, které systém charakterizují a z kvalitativních hodnot nezávisle proměnných ve zvoleném časovém okamžiku. 9

Shrnutí pojmů Ke kvalitativnímu popisu zkoumaných jevů přistupujeme tehdy, pokud nechceme (nebo neumíme) analyticky přesně popsat vztahy mezi proměnnými veličinami popisovaných dějů. Důležitým znakem kvalitativního modelování je přechod k novému oboru proměnných. Místo reálných čísel, typických pro matematický popis, je oborem hodnot množina hodnot, která umožňuje kvalitativně charakterizovat aktuální hodnotu číselné proměnné relativně vůči jejím významným hodnotám. Kvalitativní hodnota proměnné je pak dána údajem o velikosti hodnoty, charakterizující polohu aktuální hodnoty proměnné vůči významným mezním hodnotám (kladná větší než nula, záporná menší než nula a nulová) a údaji o vývojové tendenci proměnné (její velikost roste, klesá, je konstantní). Kvalitativní model je vyjádřen pomocí kvalitativních rovnic neboli konfluencí, vytvořených z množiny kvalitativních proměnných a kvalitativních vazeb. Kvalitativní simulace systému spočívá v odvození kvalitativního průběhu jeho proměnných ze soustavy konfluencí. Příklad 1 Kvalitativním popisem závislosti z příkladu kap.1.1 je věta: Jestliže působící síla roste, rychlost tělesa stoupá. Rychlost tělesa stoupá nelineárně, druhá derivace závislosti je kladná. Otázky 2.1. Jaký je rozdíl mezi kvantitativním (matematickým) a kvalitativním popisem (modelováním) chování složité soustavy? Úlohy k řešení 2.1. Promyslete kvalitativní popis řízení směru jízdy automobilu řízením natočením kol přední nápravy 10

2.2 Kvalitativní proměnná Čas ke studiu: 30 minut Cíl Po prostudování tohoto odstavce budete umět Vysvětlit pojem kvalitativní proměnné a jejích kvalitativních hodnot Výklad Kvalitativní proměnné jsou v přístupech kvalitativního modelování značeny X: X(1), X(2),..., X(n). Kvalitativní proměnné mohou nabývat tří kvalitativních hodnot, a to [K+, K0, K-]. Kvalitativní hodnota proměnné X může být tedy pozitivní (K+), negativní (K-) nebo nulová (K0). Kvalitativní dynamické chování systému je dáno hodnotami kvalitativních derivací jeho proměnných. DX(1) je první a DDX(1) druhá derivace proměnné X(1). Zkušenosti s řešením reálných inženýrských problémů ukazují, že pro postačující popis chování systému je dostatečné uvažovat kvalitativní specifikaci proměnné X(1) ve tvaru tzv. kvalitativního tripletu [X(1), DX(1), DDX(1)] Pro n- proměnných je pak užito n-tripletů [X(1),DX(1),DDX(1);X(2),DX(2),DDX(2);...;X(n),DX(n),DDX(n)] n-triplet pak udává kvalitativní stav soustavy ve zvoleném časovém okamžiku. Příklad 1 Hodnota kvalitativní proměnné X(1) roste a tento stav je označen jako K+ Hodnota jiné kvalitativní proměnné X(2) klesá, tento stav je označen jako K- Hodnota jiné kvalitativní proměnné X(3) se nemění, tento stav je označen jako K0 11

Shrnutí pojmů Kvalitativní hodnota proměnné X může být pozitivní (K+), negativní (K-) nebo nulová (K0). Kvalitativní dynamické chování systému je dáno hodnotami kvalitativních derivací jeho proměnných. DX(1) je první a DDX(1) druhá derivace proměnné X(1). Pro popis stavu kvalitativní proměnné se používá kvalitativního tripletu [X(1), DX(1), DDX(1)]. Otázky 2.2. Co je to kvalitativní triplet? Úlohy k řešení 2.2. Popište kvalitativním tripletem proměnnou, jejíž hodnota exponenciálně roste 12

2.3 Kvalitativní algebra Čas ke studiu: 30 minut Cíl Po prostudování tohoto odstavce budete umět Provádět počítání s kvalitativními hodnotami kvalitativních proměnných Výklad Kvalitativní algebra je tvořena kvalitativními operacemi, které jsou specifikovány následujícími předpisy. a) Kvalitativní součet je definován podle Tab.1 X ( i) X ( j) X ( s) [+] X(j) K+ K0 K- X(i) K+ K+ K+? K0 K+ K0 K- K-? K- K- Tab.1 b) Kvalitativní součin je definován předpisem podle Tab.2. X ( i) X ( j) X ( s) [] X(j) K+ K0 K- X(i) K+ K+ K0 K- K0 K0 K0 K0 K- K- K0 K+ Tab.2 c) Kvalitativní derivace součtu je definována vztahy DX ( s) DX ( i) DX ( j) DDX ( s) DDX ( i) DDX ( j) 13

d) Kvalitativní derivace součinu je definována vztahy DX ( i) DX ( j) X ( i) DX ( j) X ( j) DX ( ) DX ( s) i e) Druhou kvalitativní derivaci součinu lze vyjádřit pomocí vztahu pro derivaci první. Zkušenosti však ukazují, že toto vyjádření je příliš složité a výsledek je vágní. Proto je v inženýrské praxi hodnota druhé derivace součinu implicitně považována jako hodnota "?", tedy pro triplet proměnné X(s) X ( s) A DX ( s) B DDX( s)? f) Kvalitativní časová derivace je dána jednoduchými vztahy X ( j) DX ( j) DX ( j) DDX ( j) DDX ( j) DDDX ( j) Kvalitativní model QM je pak dán soustavou kvalitativních rovnic, kterou lze rozdělit do dvou podsoustav. První podsoustava SMD je soustavou takových kvalitativních rovnic, které jsou odrazem přírodních zákonů a reprezentují tedy tzv. hluboké znalosti. Jejich zdrojem je obvykle kvalitativní transformace rovnic matematických. Naproti tomu druhá podsoustava SMS je soustavou kvalitativních rovnic, generovaných využitím zkušeností, experimentů nebo heuristik, tedy znalostí mělkých. Charakteristickým rysem obou submodelů SMD a SMS je skutečnost, že společně reprezentují znalost úplnou. Kvalitativní modelování lze tedy považovat za jednu z metod, umožňující integraci znalostí. Příklad 1 Převeďte kvantitativní konvenční rovnici 2y + x/3 - z = 2 na kvalitativní transformací převést na kvalitativní rovnici (konfluenci)! Řešení: Y + X - Z = K+ Shrnutí pojmů Kvalitativní algebra je tvořena kvalitativními operacemi, které umožňují aritmetické operace s kvalitativními hodnotami. Operace jsou specifikovány předpisy pro kvalitativní součet, součin, derivaci součtu, derivaci součinu a časovou derivaci. 14

Otázky 2.3. Proč jsou některé kvalitativní operace nejednoznačné? Úlohy k řešení 2.3. Převeďte do kvalitativní formy následující rovnici 2 2 ( 3x 2x) ( 2z) y 15

2.4 Kvalitativní simulace Čas ke studiu: 1 hod Cíl Po prostudování tohoto odstavce budete umět Sestavovat kvalitativní modely a vyšetřovat jejich chování Výklad Kvalitativní simulace probíhá metodou položení kvalitativního dotazu QU. Dotaz QU je tvořen množinou kvalitativního zadání X ( 1), DX(1), DDX(1) T, T T kde T i K, K, K0,? 1 2, 3 Kvalitativní řešení kvalitativního modelu QM je množina M všech n-tripletů takových, které neodporují žádné modelové relaci. Nejjednodušším algoritmem odvození množiny řešení M je postupné generování všech možných n-tripletů a jejich testování proti modelu QM. Metodologie vytvoření kvalitativního modelu závisí v prvé řadě na dostupnosti matematického (kvantitativního) modelu konvenčního. V případě jeho existence lze kvalitativní model získat metodou kvalitativní transformace a jsou-li navíc známy i velikosti numerických konstant, lze výsledky kvalitativních řešení s výsledky kvantitativními konfrontovat. Typičtější je však situace, kdy kvantitativní model je znám jen částečně a velikosti numerických konstant jsou známy v nejlepším případě jen přibližně. Pro konstrukci kvalitativního modelu lze téměř vždy inženýrskou analýzou problému sestavit alespoň výchozí rovnice, odrážející platnost základních přírodních zákonů - zákona zachování hmoty nebo energie. Jiný přístup ignoruje algebraické (hluboké) znalosti a staví kvalitativní model pouze na "chování" soustavy a ne na interpretaci algebraických vztahů. Stavový graf Další formou výstupní informace kvalitativního modelu je tzv. stavový graf. Stavový graf udává možné přechody jednoho kvalitativního stavu do stavu druhého. Jako příklad lze uvést přechod, který je graficky interpretován na Obr.1. 16

ČASOVÝ INTERVAL BOD ČASOVÝ INTERVAL [ + + - ] [ + 0 - ] [+ - - ] Obr.1 Označení možných přechodů kvalitativních stavů dává kvalitativnímu modelu významnou predikční schopnost. Příklad 1 Konstrukce kvalitativního vyjádření jednoduchého kvantitativního průběhu, vyjádřeného jeho časovou funkcí, je uvedeno na Obr.2. Interval AB je kvalitativně reprezentován jako Obr.2 X PLUS( ), DX MINUS( ), DDX PLUS( AB ) Bod B a interval BC jsou kvalitativně charakterizovány triplety 0 BC B, Kvalitativní interpretace časového průběhu proměnné X na Obr.1 je tedy dána sekvencí tripletů 17

[+ - +] [+ 0 +] [+ + +] Kvalitativní znalost, popsaná touto sekvencí, není tak specifická, jako kvantitativní informace na Obr.1. Kvalitativní transformace tedy představuje jistou "degeneraci" kvantitativního popisu, je však schopna vyjádřit integrovaně v jednom modelu jak znalost kvantitativní (hlubokou), tak kvalitativní (mělkou - experimentálně zjištěnou či expertní nebo hypotetickou). Příklad 2 Na Obr.3 je nakreslen příklad jednoduchého chemického reaktoru, který lze popsat jednoduchou diferenciální rovnicí dv r / dt F i F o Obr.3 Jelikož nebyla definována funkce kvalitativního rozdílu, je třeba přepsat rovnici do tvaru dv / dt F r o F i Tuto rovnici lze vyjádřit blokovým schématem na Obr.4, které je pro konstrukci kvalitativního modelu velmi vhodné. 18

Obr.4 Toto blokové schéma lze zapsat ve formě soustavy dvou konfluencí s jednou pomocnou proměnnou P1 jako P1 dvr / dt F i P1 F 0 Soustavu těchto konfluencí lze dále zapsat ve formě matice, vhodné pro počítačové programování 1 d / t VR P1 0 2 add P1 F0 F1 Řešením tohoto kvalitativního modelu je množina n-tripletů, kde n je celkový počet kvalitativních proměnných modelu. Každá proměnná je popsána svým jednoduchým tripletem. Všechna možná řešení modelu jsou uvedena v následující tabulce Tab.3. DDV DF0 DFI 1 + + + 2 0 + + 3 + 0 + 4 + - +? 5 - + +? 6 0 0 0 7 - + 0? 8 + - 0? 9 - - - 10 0 - - 11-0 - 12 - + -? 13 + - -? Tab.3 19

Všechny proměnné jsou uvažovány jako pozitivní. V tabulce jsou jako příklad vybrány z tripletů proměnných pouze hodnoty jejich prvních derivací. Otazníky označují sporná (nejednoznačná) kvalitativní řešení, neboť např. v řešení č.4 DDV DF0? závisí polarita součtu na absolutní velikosti sčítanců. Shrnutí pojmů Kvalitativní simulace probíhá metodou položení kvalitativního dotazu QU. Dotaz QU je tvořen množinou kvalitativního zadání. Kvalitativní řešení kvalitativního modelu QM je množina M všech n-tripletů takových, které neodporují žádné modelové relaci. Nejjednodušším algoritmem odvození množiny řešení M je postupné generování všech možných N-tripletů a jejich testování proti modelu QM. Stavový graf udává možné přechody jednoho kvalitativního stavu do stavu druhého. Otázky 2.4. Jak probíhá proces kvalitativní simulace? Čím je významný kvalitativní stavový graf? Úlohy k řešení 2.4. Sestavte kvalitativní model funkce popsané jejím průběhem na následujícím obrázku. Obr.5 20

3 - FUZZY MODELY 3.1 Fuzzy množinová teorie Čas ke studiu: 1 hod Cíl Po prostudování tohoto odstavce budete umět Objasnit pojem fuzzy množiny Použít fuzzy množinu pro formalizaci vágního slovního výrazu Výklad V první části učebnice jsme zdůraznili úlohu zkušeností jako zdroje informací, které má k dispozici lidský expert a dovede jich velmi efektivně využívat při řešení složitých problémů, tedy např. i k řešení problému popisu chování či řízení složité soustavy. Lidské zkušenosti lze vyjádřit větami přirozeného jazyka, tedy jazykovým popisem. Slova, která jsou v takových popisech relevantními prvky, jsou nositeli neurčitosti, zvané, jak jsme již uvedli, pojmovou neurčitostí čili vágností. Jestliže jsme došli k závěru, že právě efektivní využití vágnosti spolu s exploatací jednoduchých, ale výkonných nenumerických algoritmů umožňují člověku činit dobré závěry, je potom jednou z principielních otázek nalezení formálního aparátu pro reprezentaci vágnosti a efektivní práci s ní. Vágnost, jako průvodní jev všech složitých, špatně popsatelných soustav, případně soustav, v jejichž funkci se uplatňuje lidský faktor, je nejčastěji formalizována pomocí aparátu fuzzy množinové teorie, jejímž zakladatelem je profesor kalifornské university v Berkeley Lotfi A. Zadeh [2], [5]. Ukázalo se, že fuzzy množiny jsou přirozeným prostředkem pro formalizaci vágnosti. V další části této kapitoly uvedeme základní principy fuzzy množinové matematiky, které jsou nezbytné pro pochopení jejích aplikací. V teorii klasických množin prvek do množiny buď patří nebo nepatří. Hovoříme pak o (plné) příslušnosti nebo o nepříslušnosti prvku do dané množiny. V Zadehově fuzzy množinové teorii, která je zobecněním teorie abstraktních množin, je fuzzy množina definována jako třída, která přiřazuje prvkům neurčitost pomocí vlastnosti jejich částečné příslušnosti formou tzv. míry příslušnosti. Nechť X 0 je klasická množina a µ A : X <0,1> nechť je zobrazení. Fuzzy množinou pak budeme nazývat uspořádanou dvojici A X, A Množinu X přitom nazveme univerzem fuzzy množiny A, µ A nazveme funkcí příslušnosti fuzzy množiny A. Pro každé x X nazveme reálné číslo µ A (x) stupněm příslušnosti prvku x k fuzzy množině A, přičemž µ A (x) budeme interpretovat takto: 21

µ A (x) = 0..... prvek x do množiny A nepatří µ A (x) = 1..... prvek x do množiny A patří µ A (x) (0,1)... nelze s jistotou určit, zda x patří do A, přičemž velikost µ A (x) je vyjádřením stupně příslušnosti x k A. Klasifikace určitého objektu stupněm příslušnosti k určité fuzzy množině je ryze subjektivní a její velikost záleží čistě na vnitřním přesvědčení lidského experta. Z tohoto hlediska nelze zaměňovat stupeň příslušnosti µ(x) se statistickou, objektivně vypočitatelnou hodnotou pravděpodobnosti P(x) <0,1>! Jak jsme již uvedli, má člověk k popisu reality k dispozici přirozený jazyk. Jednou z jeho hlavních schopností je efektivní používání vágních pojmů. Typickou vlastností vágního pojmu je při tom skutečnost, že charakterizuje určitou třídu problémů, jejíž hranice bychom velmi těžce určovali. Kdy lze např. o daném objektu prohlásit, že to je (není) vysoký strom, že to je (není) červená barva a pod.? Konvenční přístupy modelují vágní pojmy pomocí klasických množin a hraniční prvky tedy musí být zařazeny do množiny (míra příslušnosti 1), nebo mimo ni (míra příslušnosti 0). Ukazuje se, že v tom je hlavní příčina časté neadekvátnosti matematických metod v praxi. Příklad 1 Pokusme se popsat pomocí fuzzy množiny vágní pojem "středně vysoký strom". Každé výšce, která připadá v úvahu, přiřadíme číslo <0,1> vyjadřující stupeň našeho přesvědčení, že takový strom je "středně vysoký". Tento stupeň vyplývá z toho, jak rozumíme pojmu "vysoký strom", jak hluboká je v tomto ohledu naše zkušenost, jak dalece jsme v této oblasti experty. Přiřazení takových stupňů (měr příslušnosti) závisí tedy na subjektu a také na kontextu. Po přiřazení funkce příslušnosti prvkům fuzzy množiny je z principu subjektivní a odráží obecně koncept, z něhož je problém posuzován. Pokusme se tedy definovat fuzzy množinu, formalizující vágní pojem "středně vysoký strom". Jedna z možností znázornění takové fuzzy množiny je grafický způsob, kdy na vodorovnou osu budeme vynášet výšky, na svislou osu odpovídající míry příslušnosti. Naše definice je takto zobrazena na Obr.6. Takto jsou definovány jako "zcela určitě středně vysoké" stromy s výškou mezi 3m a 5m, (míra příslušnosti 1); naproti tomu mezi "středně vysoké" nejsou zařazeny zcela určitě stromy nižší než 2m a vyšší než 7m (míra příslušnosti 0). Čtenář si zcela určitě vytvoří podobné fuzzy množiny sám ("staré auto", "mladý člověk", "hodně peněz" a pod.). Spojitá křivka zvonového tvaru, představující průběh velikosti míry příslušnosti v závislosti na velikosti prvku univerza, je nazývána fuzzy charakteristikou formalizovaného pojmu. 22

Obr.6 Taková křivka bývá často parametrizována čtyřmi body zlomu (a,b,c,d) a aproximována lomenými přímkovými úseky, jak je uvedeno na Obr.7. Obr.7 Shrnutí pojmů Lidské zkušenosti lze vyjádřit větami přirozeného jazyka, tedy jazykovým popisem. Slova, která jsou v takových popisech relevantními prvky, jsou nositeli neurčitosti, zvané, jak jsme již uvedli, pojmovou neurčitostí čili vágností. Ukázalo se, že fuzzy množiny jsou přirozeným prostředkem pro formalizaci vágnosti. Funkci µ A nazýváme funkcí příslušnosti fuzzy množiny A. Pro každé x X nazveme reálné číslo µ A (x) stupněm příslušnosti prvku x k fuzzy množině A, přičemž µ A (x) budeme interpretovat takto: µ A (x) = 0, když prvek x do množiny A nepatří, µ A (x) = 1 když prvek x do množiny A patří a µ A (x) (0,1) kdy nelze s jistotou určit, zda x patří do A, přičemž velikost µ A (x) je vyjádřením stupně příslušnosti x k A. 23

Otázky 3.1. Jaký je rozdíl mezi klasickými a fuzzy množinami? Jakou výhodu mají fuzzy množiny oproti množinám klasickým? Úlohy k řešení 3.1. Nakreslete fuzzy množiny, formalizující jazykové pojmy mladý člověk a starý člověk. Popište tyto fuzzy množiny jejich parametry (body zlomů jejich funkcí příslušnosti). 24

3.2 Jazyková proměnná Čas ke studiu: 30 minut Cíl Po prostudování tohoto odstavce budete umět Definovat pojem jazykové proměnné jazykového modelu a její hodnoty Výklad Při konstrukci jazykových popisů chování či řízení systémů se dostáváme do nenumerické oblasti, v níž musíme definovat základní prvky a operace. Jedním ze základních pojmů nenumerické matematiky je bezpochyby jazyková proměnná. Podle definice, kterou podal L. A. Zadeh [2], nazýváme jazykovou proměnnou p uspořádanou pětici * * p : P, T( P ), U, SY, SE kde P * je jméno (identifikátor) jazykové proměnné p, T(P * ) je množina jazykových hodnot, kterých může P * nabývat, U je univerzum, SY je syntaktické pravidlo, pomocí kterého jsou generovány prvky T(P * ) a SE je sémantické pravidlo, které přiřazuje každé jazykové hodnotě její význam ve formě fuzzy množiny s univerzem U. Uvedenou obecnou definici obvykle interpretujeme takto: a) T(P * ) je konečná množina jazykových hodnot J = {J 1,J 2,...,J n } b) Syntaktické pravidlo SY je omezeno na výčet prvků množiny T(P * ). c) Sémantické pravidlo SE interpretuje každou jazykovou hodnotu J i, i = 1,2,3,...,n, jako fuzzy množinu J i = (R,µ Li ) kde R je univerzum reálných čísel. Znamená to tedy, že pravidlo SE označuje jednotlivé fuzzy množiny přímo názvy jejich odpovídajících jazykových hodnot. Tím je každá jazyková hodnota J i jazykové proměnné p formalizována pomocí fuzzy množiny J i. Tím je realizována fuzzy interpretace neurčitosti, kterou každá lingvistická hodnota obsahuje. Fuzzy množina J i, daná funkcí µ, tak reprezentuje hodnotu jazykové proměnné p, která bude vystupovat jako proměnná v jazykovém modelu. Příklad 1 Jako příklad můžeme uvést již zmíněnou jazykovou proměnnou "výška stromu", která může nabývat tří jazykových hodnot "nízký" J 1, "středně vysoký" J 2 a "vysoký" J 3. Tyto tři jazykové hodnoty jsou reprezentovány třemi fuzzy množinami, a to typy Z, a S, podle Obr.8. 25

Obr.8 Nyní definujme funkci příslušnosti µ Ji (x) takto: µ (x) = (x - a i )/(b i - a i ) pro a i < x < b i ; µ (x) = (x - d i )/(c i - d i ) pro c i < x < d i ; µ (x) = 1 pro b i x c i µ (x) = 0 pro a i ; x d i Každá jazyková hodnota J i je pak určena uspořádanou čtveřicí (a i,b i,c i,d i ). Uspořádaná čtveřice představuje body zlomu aproximační přímky a čtyři hodnoty tvoří v takovém případě čtyři parametry zde lichoběžníkové fuzzy množiny. Shrnutí pojmů Jedním ze základních pojmů nenumerické matematiky je bezpochyby jazyková proměnná. Podle definice, kterou podal L. A. Zadeh, nazýváme jazykovou proměnnou p, danou pětici symbolů : P * - jméno (identifikátor) jazykové proměnné p, T(P * ) - množina jazykových hodnot, kterých může P * nabývat, U - univerzum, SY - syntaktické pravidlo, pomocí kterého jsou generovány prvky T(P * ) a SE - sémantické pravidlo, které přiřazuje každé jazykové hodnotě její význam. Fuzzy množina, daná funkcí µ(x), tak reprezentuje hodnotu jazykové proměnné p, která bude vystupovat jako proměnná veličina v jazykovém modelu. Otázky 3.2. Vysvětlete princip použití fuzzy množin jako reprezentantů jazykových pojmů. 26

Úlohy k řešení 3.2. Formalizujte jazykovou proměnnou TEPLOTA V PECI a navrhněte tři její vhodné jazykové hodnoty. 27

3.3 Vícehodnotová logika a jazykové modely Čas ke studiu: 3 hod Cíl Po prostudování tohoto odstavce budete umět Použít fuzzy množiny v jazykových modelech Vyložit principy fuzzy logiky Popsat způsob použití fuzzy modelů v praxi Výklad Binární ohodnocování situací, které je typické pro klasickou logiku (ano-ne, černý-bílý, 0-1), se - jak jsme již konstatovali - stává na určité úrovni popisu chování a řízení systémů neefektivním. Je-li naším cílem vybudovat formální aparát pro reprezentaci a efektivní využití neurčitosti, je nezbytné nahradit binární logiku logikou vícehodnotovou. Vícehodnotová logika je jedním z typických nástrojů metod umělé inteligence. Vícehodnotovou nazýváme logiku, jejíž pravdivostní hodnoty mohou nabývat více než dvou stavů, nejčastěji z intervalu <0,1>. Jazykovou je pak nazývána taková vícehodnotová logika, ve které jsou pravdivostní hodnoty vyjádřeny pomocí slovního ohodnocení. Interpretace jednotlivých pravdivostních hodnot je přitom vágní. Logickou proměnnou je zde tedy nazývána taková proměnná, která může nabývat hodnot z intervalu <0,1>. Fuzzy logika je vícehodnotová jazyková logika, která využívá aparát a zákony fuzzy množinové matematiky. Pro potřebu fuzzy logiky budeme dále uvažovat množinu logických spojek {and, or, =>} jako konjunkci (logický součin), disjunkci (logický součet) a implikaci (logické vyplývání) [5], [6]. Spojením logických proměnných pomocí logických spojek získáme logické výroky. Jazykový model pak můžeme definovat jako složitý výrok, v němž se vyskytují jména jazykových proměnných, jména jejich jazykových hodnot, logické spojky a pravdivostní hodnoty logických výroků, které nabývají hodnot z intervalu <0,1>. Významnou výhodou jazykového modelu je možnost vytvoření formálního zápisu, který nám umožní zapsat jazykový model tak, jak je běžným způsobem napsána česká věta. Tato skutečnost je základem pro použití jazykového modelu k formalizaci lidské znalosti resp. pro slovní popis chování a řízení soustav. Máme-li např. jazykovou proměnnou p = {TEPLOTA, J 0, R} a množina jejích jazykových hodnot je 28

J 0 = {NÍZKÁ, STŘEDNÍ, VYSOKÁ}, µ VYSOKA (p) píšeme větu " TEPLOTA p je VYSOKÁ ". Dosadíme-li za teplotu p její určitou (konkrétní) hodnotu p 0, pak tento výrok bude mít pravdivostní hodnotu µ VYSOKA (p 0 ). Pro formalizaci zkušeností (znalostí) mají zásadní význam tzv. podmíněná tvrzení, která vzniknou formální úpravou zápisu logické implikace. Implikaci " => " píšeme ve formě podmíněného výrazu "Jestliže (IF) podmínka, pak (THEN) důsledek ". Výše uvedené úpravy umožňují, aby se formální zápis jazykového modelu blížil co nejvíce běžnému vyjadřování v přirozené lidské řeči. Je zřejmé, že jednoduché podmíněné výrazy ještě neumožňují zápis složitějších chování. K tomu je třeba vytvořit tzv. složené podmíněné výrazy. Složeným podmíněným výrazem (prohlášením) je např. jazykový model, představující větu: Jestliže (IF) TEPLOTA t je NÍZKÁ nebo TLAK p je VYSOKÝ, pak (THEN) RYCHLOST PROUDĚNÍ v je VYSOKÁ a STABILITA SOUSTAVY s je MALÁ. Část podmíněného výrazu vlevo od implikace "THEN" se nazývá jeho předpokladem (antecedentem, premisou), pravá část pak jeho důsledkem (konsekventem). Množina pravidel jako model Jediné pravidlo popisuje chování modelované soustavy velice omezeně. Uvažujeme-li soustavu s n- vstupními a jednou výstupní proměnnou s n- rozměrnou funkční závislostí mezi vstupy a výstupem y f x x,..., 1, 2 x n potřebujeme pro dostatečně bohatý popis takové funkce vyslovit pravidel více. Označíme-li jazykové hodnoty vstupních proměnných jako A a jazykové hodnoty výstupní proměnné jako B, potom množina pravidel popisující chování soustavy má tvar 29

R 1 : IF(x 1 is A 11 ) and (x 2 is A 12 ) and and (x n is A 1n ) THEN (y is B 1 ) ELSE R 2 : IF(x 1 is A 21 ) and (x 2 is A 22 ) and and (x n is A 2n ) THEN (y is B 2 ) ELSE...... R r : IF(x 1 is A r1 ) and (x 2 is A r2 ) and and (x n is A rn ) THEN (y is B r ) ELSE...... R R : IF(x 1 is A R1 ) and (x 2 is A R2 ) and and (x n is A Rn ) THEN (y is B R ) kde r = 1,2,,R je počet pravidel. Takové množině IF-THEN pravidel říkáme pravidlový fuzzy model. Konsekventy pravidel takového fuzzy modelu mají tvar fuzzy výroku o velikosti výstupní jazykové proměnné (y is B) a model je nazýván podle svého tvůrce pravidlovým modelem typu Mamdani. Fuzzy logické spojky v modelu V pravidlovém fuzzy modelu můžeme nalézt několik typů fuzzy logických spojek. Předně jednotlivá dílčí tvrzení o nezávisle proměnných v antecedentech pravidel jsou vázána spojkou and. Je to fuzzy spojka reprezentující fuzzy logický součin ( a ) neboli fuzzy konjunkci. Toto fuzzy logické spojení je v antecedentech fuzzy modelů nejčastější, velmi málo se pro spojení v antecedentu používá logické spojky disjunkce or (nebo). Podmínková (IF) a důsledková (THEN) část pravidel je spojena spojkou THEN. Tato spojka má charakter logické implikace a je opět v pravidlech standardní. Jednotlivá pravidla jsou spojena v modelu logickou spojkou ELSE (jinak). Interpretace fuzzy logických spojek funkce t-normy a funkce s-normy V klasické logice je význam (interpretace) všech logických spojek jednoznačná. Fuzzy logika se naopak vyznačuje tím, že interpretace fuzzy logických spojek jednoznačná není, každá spojka může být interpretována (vyhodnocována) několika možnými způsoby. Tato skutečnost je dána faktem, že fuzzy logické jazykové modely reprezentují lidskou (jazykovou) formulaci výroků o chování popisované soustavy a způsob chápání vazeb mezi výroky bývá interpretován různě, podle povahy popisovaného objektu. Jako příklad uveďme interpretaci spojky ELSE mezi pravidly. Tato spojka sjednocuje všechna dílčí pravidla R r do jednoho celkového modelu. Jestliže vyslovujeme dílčí výroky a slovně je spojujeme mezi sebou, můžeme použít dvou způsobů. První z nich je charakterizování interpretací spojky ELSE jako konjunkce (A), tedy slovně Platí pravidlo R 1 A pravidlo R 2 A pravidlo R 3 A - A - pravidlo R R Druhý ze způsobů interpretuje spojku ELSE jako disjunkci (NEBO) a slovní vyjádření má tvar 30

Platí pravidlo R 1 NEBO pravidlo R 2 NEBO pravidlo R 3 NEBO - NEBO - pravidlo R R Intuitivně jistě chápeme rozdíl v charakteru obou případů a můžeme tedy konstatovat, že máme možnost vytvořit dva různé modely, které mají sice stejná pravidla, avšak jinak lidsky chápaný význam. Základní fuzzy logické operace disjunkce (sjednocení) a konjunkce (průnik) dvou fuzzy množin A a B (definovaných na jednom univerzu) jsou dány vztahy A B A B ( x) max ( x), ( x) ( x) min ( x), ( x) A A B B Situace, kterou jsme popsali v případě víceznačné (zde dvojznačné) interpretace logické spojky ELSE, platí ve fuzzy logice i u spojek fuzzy konjunkce, fuzzy disjunkce a a také u fuzzy negace. Je to sice komplikace, která ale představuje velmi silný prostředek fuzzy logiky vytvářet modely s jemně odstupňovaným charakterem svého chování, tak jak je to obvyklé při lidském uvažování. Vezmeme-li v úvahu možné interpretace fuzzy logické spojky disjunkce (NEBO), musíme v první řadě zdůraznit, že všechny interpretace musí splňovat základní teoretické předpoklady kladené na logickou disjunkci, musí zachovat její typický logický charakter 6. Množina možných fuzzy interpretací logické spojky disjunkce tvoři skupinu fuzzy logických funkcí zvaných funkce t-konormy (triangulární konormy). Uvedeme příklad dvou různých (a často používaných): Algebraický součet ( x) ( x) ( x) ( x) ( x) A B A Omezený součet ( x) min 1, ( x) ( x) A B A B B A B Obrátíme-li pozornost na interpretace fuzzy logické spojky konjunkce (A), pak platí totéž co bylo řečeno o fuzzy disjunkci. Příslušná skupina možných interpretací fuzzy konjunkce je zde nazývána funkcemi t- normy (triangulární normy). Uveďme opět příklad dvou takových často používaných funkcí. Omezená diference ( x) max 0, ( x) ( x) A( ) B A B Algebraický součin ( x) ( x) ( x) A B A B 1 Spojka ELSE mezi pravidly fuzzy modelu může být tedy interpretována jakoukoliv funkcí s charakterem disjunkce (t-konormy) nebo s charakterem konjunkce (t-normy). Mamdaniho pravidlové modely, používajících zde funkce t-konormy se nazývají modely disjunktivní (součtové), modely používající funkci t-normy se nazývají modely konjunktivní (součinové). Pro charakter (chování) modelu je toto spojení určující. 31