ZNALOSTNÍ SYSTÉMY ŘÍZENÍ

Podobné dokumenty
Fuzzy množiny, Fuzzy inference system. Libor Žák

APLIKOVANÁ UMĚLÁ INTELIGENCE

Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice

0. ÚVOD - matematické symboly, značení,

Matematická logika. Miroslav Kolařík

1 Řešení soustav lineárních rovnic

Moderní technologie ve studiu aplikované fyziky CZ.1.07/2.2.00/ Množiny, funkce

Matematická analýza 1

Matematika B101MA1, B101MA2

Vybrané přístupy řešení neurčitosti

2. Množiny, funkce. Poznámka: Prvky množiny mohou být opět množiny. Takovou množinu, pak nazýváme systém množin, značí se

Fuzzy logika. Informační a znalostní systémy

Každé formuli výrokového počtu přiřadíme hodnotu 0, půjde-li o formuli nepravdivou, a hodnotu 1, půjde-li. α neplatí. β je nutná podmínka pro α

Usuzování za neurčitosti

Matematika (CŽV Kadaň) aneb Úvod do lineární algebry Matice a soustavy rovnic

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti.

Základní pojmy matematické logiky

Místo pojmu výroková formule budeme používat zkráceně jen formule. Při jejich zápisu

1 Báze a dimenze vektorového prostoru 1

1 Vektorové prostory.

(Cramerovo pravidlo, determinanty, inverzní matice)

0.1 Úvod do lineární algebry

ALGEBRA. Téma 5: Vektorové prostory

Formální systém výrokové logiky

Stavební fakulta Katedra mechaniky. Jaroslav Kruis, Petr Štemberk

V předchozí kapitole jsme podstatným způsobem rozšířili naši představu o tom, co je to číslo. Nadále jsou pro nás důležité především vlastnosti

Maticí typu (m, n), kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru:

1 Soustavy lineárních rovnic

1 Výroková logika 1. 2 Predikátová logika 3. 3 Důkazy matematických vět 4. 4 Doporučená literatura 7


Matematická logika. Miroslav Kolařík

1. Matematická logika

0.1 Úvod do lineární algebry

Teorie informace a kódování (KMI/TIK) Reed-Mullerovy kódy

Úlohy nejmenších čtverců

Pro zvládnutí této kapitoly budete potřebovat 4-5 hodin studia.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Základní pojmy teorie množin Vektorové prostory

Teorie pravěpodobnosti 1

Fuzzy regulátory Mamdaniho a Takagi-Sugenova typu. Návrh fuzzy regulátorů: F-I-A-D v regulátorech Mamdaniho typu. Fuzzifikace. Inference. Viz. obr.

1 Mnohočleny a algebraické rovnice

Úvod do informatiky. Miroslav Kolařík

5. Lokální, vázané a globální extrémy

9 Kolmost vektorových podprostorů

Lineární zobrazení. 1. A(x y) = A(x) A(y) (vlastnost aditivity) 2. A(α x) = α A(x) (vlastnost homogenity)

příkladů do cvičení. V textu se objeví i pár detailů, které jsem nestihl (na které jsem zapomněl) a(b u) = (ab) u, u + ( u) = 0 = ( u) + u.

U Úvod do modelování a simulace systémů

Booleovská algebra. Booleovské binární a unární funkce. Základní zákony.

Znalostní evaluace společenské odpovědnosti firem

7. Funkce jedné reálné proměnné, základní pojmy

i=1 Přímka a úsečka. Body, které leží na přímce procházející body a a b můžeme zapsat pomocí parametrické rovnice

CVIČENÍ 4 Doc.Ing.Kateřina Hyniová, CSc. Katedra číslicového návrhu Fakulta informačních technologií České vysoké učení technické v Praze 4.

Cílem kapitoly je opakování a rozšíření středoškolských znalostí v oblasti teorie množin.

7. Rozdělení pravděpodobnosti ve statistice

Logika. 2. Výroková logika. RNDr. Luděk Cienciala, Ph. D.

IB112 Základy matematiky

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od podzimu 2016

teorie logických spojek chápaných jako pravdivostní funkce

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Výroková logika. Teoretická informatika Tomáš Foltýnek

Množiny, relace, zobrazení

Poznámka. Je-li f zobrazení, ve kterém potřebujeme zdůraznit proměnnou, píšeme f(x) (resp. f(y), resp. f(t)) je zobrazení místo f je zobrazení.

MATEMATICKÁ TEORIE ROZHODOVÁNÍ

Necht tedy máme přirozená čísla n, k pod pojmem systém lineárních rovnic rozumíme rovnice ve tvaru

B i n á r n í r e l a c e. Patrik Kavecký, Radomír Hamřík

MATURITNÍ TÉMATA Z MATEMATIKY

Řídicí technika. Obsah. Fuzzy řízení Fuzzy množiny Operace s fuzzy množinami Fuzzy pravidla Fuzzy regulátory. Fuzzy řízení.

Matematika I, část I. Rovnici (1) nazýváme vektorovou rovnicí roviny ABC. Rovina ABC prochází bodem A a říkáme, že má zaměření u, v. X=A+r.u+s.

Unární je také spojka negace. pro je operace binární - příkladem může být funkce se signaturou. Binární je velká většina logických spojek

8.3). S ohledem na jednoduchost a názornost je výhodné seznámit se s touto Základní pojmy a vztahy. Definice

Jak je důležité být fuzzy

Základy fuzzy řízení a regulace

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od jara 2017

Výroková a predikátová logika - II

Predikátová logika. prvního řádu

Výroková logika - opakování

Pro každé formule α, β, γ, δ platí: Pro každé formule α, β, γ platí: Poznámka: Platí právě tehdy, když je tautologie.

Princip rozšíření a operace s fuzzy čísly

Aplikovaná matematika I, NMAF071

Teorie systémů TES 1. Úvod

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.

Úvod do lineární algebry

1 Projekce a projektory

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od podzimu 2014

Lineární algebra : Lineární prostor

Množiny, základní číselné množiny, množinové operace

1. Matematická logika

1. POJMY 1.1. FORMULE VÝROKOVÉHO POČTU

6 Skalární součin. u v = (u 1 v 1 ) 2 +(u 2 v 2 ) 2 +(u 3 v 3 ) 2

Úvod do logiky (presentace 2) Naivní teorie množin, relace a funkce

Maturitní témata profilová část

REÁLNÁ FUNKCE JEDNÉ PROMĚNNÉ

Úvod do informatiky. Miroslav Kolařík. Zpracováno dle učebního textu R. Bělohlávka: Úvod do informatiky, KMI UPOL, Olomouc 2008.

MATEMATICKÁ TEORIE ROZHODOVÁNÍ

Pojem binární relace patří mezi nejzákladnější matematické pojmy. Binární relace

Definice. Vektorový prostor V nad tělesem T je množina s operacemi + : V V V, tj. u, v V : u + v V : T V V, tj. ( u V )( a T ) : a u V které splňují

MATICE. a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij]

Predikátová logika. Teoretická informatika Tomáš Foltýnek

Kapitola 1. Úvod. 1.1 Značení. 1.2 Výroky - opakování. N... přirozená čísla (1, 2, 3,...). Q... racionální čísla ( p, kde p Z a q N) R...

Aplikovaná numerická matematika

Transkript:

VŠB - TECHNICKÁ UNIVERZITA V OSTRAVĚ Fakulta elektrotechniky a informatiky ZNALOSTNÍ SYSTÉMY ŘÍZENÍ Miroslav Pokorný Martin Moštěk Petr Želasko Ostrava 2005

OBSAH 1. ÚVOD... 1 1.1 Krize klasické matematiky... 1 1.2 Umělá inteligence a její přístupy... 3 1.3 Přechod od zpracování dat ke zpracování znalostí... 5 1.4 Formalizace neurčitosti v systémech řízení... 7 1.5 Fuzzy pojetí regulace... 8 2. ZÁKLADY FUZZY MNOŽINOVÉ TEORIE... 11 2.1 Fuzzy množiny... 11 2.2 Základní fuzzy množinové operace... 14 2.3 Princip rozšíření (extenzionální princip)... 16 2.4 Lingvistická proměnná... 18 3. VÍCEHODNOTOVÁ LOGIKA A LINGVISTICKÉ MODELY... 21 3.1 Vícehodnotová lingvistická logika... 21 3.2 Lingvistické modely... 23 3.3 Aproximace lingvistického modelu fuzzy funkcí... 26 3.4 Inženýrská interpretace odpovědí modelů... 38 3.5 Optimalizace lingvistického modelu... 41 4. EXPERTNÍ SYSTÉMY... 48 4.1 Definice expertního systému... 48 4.2 Architektura expertního systému... 50 4.3 Uživatelské programové vybavení... 53 5. FUZZY REGULAČNÍ SYSTÉMY FLC (Fuzzy Logic Control)... 56 5.1 Expertní systémy a fuzzy řízení... 56 5.2 Popis řízení procesů pomocí klasických algoritmů... 59 5.3 Lingvistický popis chování dynamických systémů... 62 5.4 Základní struktura a parametry systému FLC... 67 5.5 Funkce systému FLC... 70 5.6 Typy fuzzy regulátorů... 93 6. SYSTÉMY ZNALOSTNÍHO ŘÍZENÍ... 96 6.1 Vlastnosti expertního regulátoru... 96 6.2 Expertní systém v reálném čase... 100 7. PRAKTICKÁ REALIZACE FUZZY ŘÍDÍCÍCH SYSTÉMŮ... 105 7.1 Fuzzy systémy FLC... 105 7.2 Systémy znalostního řízení... 109 LITERATURA... 115 KLÍČ K PŘÍKLADŮM... 118

1. Ú V O D 1.1 Krize klasické matematiky Čas ke studiu: 30 minut Cíl Po prostudování tohoto odstavce budete umět Vysvětlit problematiku modelování složitých soustav Význam znalostí pro metody umělé inteligence Výklad Teorie i praxe tvorby klasických matematických modelů a jejich využívání v řídící technice jsou dnes všeobecně akceptovány. Matematické modely jsou vhodnou formou pro popis chování i řízení objektů a spolu s prostředky výpočetní techniky reprezentují velmi efektivní nástroj k hlubšímu poznání skutečnosti. Metodologie řídících systémů, využívajících klasických matematických analytickostatistických modelů, je dnes dobře popsána [1]. Základní přístupy při tvorbě takových modelů se opírají o znalosti fyzikálních principů a podstaty funkcí modelovaných a řízených objektů. Jsou to modely, postavené na bázi objektivních, kvantitativních znalostí. Matematické modely, reflektující exaktní, objektivně platné přírodní zákony, jsou z principu modely precizními. Takové modely však nejsou zcela a vždy adekvátní chování popisovaných soustav, které může být přirozeně ne zcela přesné, více či méně neurčité. Snaha o zvýšení preciznosti matematického modelu vede ke zvýšení jeho komplikovanosti, provázené zvýšenými nároky na přesnost vstupních dat a snížením celkové robustnosti modelu. Nároky takových modelů mohou přesáhnout míru praktické realizovatelnosti (např. možnost měření vstupních dat). Profesor univerzity v Berkeley, Lotfi A.Zadeh (zakladatel fuzzy matematiky), vyslovil v této souvislosti velmi důležitý závěr - princip inkompatibility [2]: To, jak roste složitost nějakého systému, klesá naše schopnost činit precizní a přitom ještě použitelná tvrzení o jeho chování, dokud není dosaženo prahu, za nímž se stávají preciznost a použitelnost (relevantnost) téměř vzájemně se vylučujícími charakteristikami Tyto problémy se vyskytují hlavně v případech, kdy popisujeme chování soustavy složité, neurčité, těžko popsatelné a obtížně měřitelné. Kvalita reálného modelu objektu a tudíž i kvalita jeho regulace je v takových případech dána především tím, jak se použitá 1

metodologie vyrovná s reprezentací a efektivním využitím velmi důležité vlastnosti reality - neurčitosti. Klasickou formou reprezentace neurčitosti je aparát matematické statistiky [3]. Přes svoji popularitu však trpí řadou omezení. Je to především schopnost reflektovat pouze neurčitost typu stochastičnost, dále pak problém časté nedostupnosti dostatečného počtu pozorování (důvody časové, technické, ekonomické a pod.) a problémy s platností řady apriorních předpokladů o datech. Nemáme-li k dispozici dostatečný počet pozorování za reprodukovatelných podmínek, nelze variabilitu přírodních dějů eliminovat tím, že vyhovíme požadavkům reprodukovatelnosti stanovením příliš obecných podmínek. Získáme tím výsledky, jejichž rozptyl či konfidenční intervaly jsou natolik široké, že výsledky znehodnotí. Potíže přetrvávají tehdy, pokud se snažíme pracovat pouze s objektivně zjištěnými informacemi. Problémy řeší metody, které připouštějí využití informací subjektivních - znalostí. Shrnutí pojmů Matematické modely jsou z principu modely precizními. Takové modely však nejsou zcela a vždy adekvátní chování popisovaných soustav, které může být přirozeně ne zcela přesné, více či méně neurčité. Snaha o zvýšení preciznosti matematického modelu vede ke zvýšení jeho komplikovanost a omezuje jeho použitelnost, což formuluje princip inkompatibility. Potíže přetrvávají tehdy, pokud se snažíme pracovat pouze s objektivně zjištěnými numerickými informacemi. Problémy řeší metody, které připouštějí využití informací subjektivních, nenumerických - znalostí. Úlohy k řešení 1.1. 1. Využili jste někdy svoje subjektivní, osobně získané znalosti k vyřešení problému, obtížně řešitelného matematickým modelováním? 2. Vymyslete sami matematickou rovnici (nebo soustavu rovnic), reprezentující fyzikální soustavu. Určete parametry takto napsaného modelu soustavy a pouvažujte o možnosti přesného stanovení jejich číselných hodnot! 2

1.2 Umělá inteligence a její přístupy Čas ke studiu: 30 minut Cíl Po prostudování tohoto odstavce budete umět Definovat základní přístupy a metody umělé inteligence Výklad V řadě případů, zvláště při diagnóze a řízení složitých a obtížně měřitelných soustav, jsou v praxi úspěšně využívány závěry, které získává zkušený operátor (expert) jako výsledek rozhodovacích procesů ve svém mozku. I když jsou tyto závěry postaveny, stejně jako v případě klasické matematické analýzy, na porovnávání vstupů a výstupů sledované soustavy, je k jejich vyvození použito zcela jiného než statistického aparátu. Jde o efektivní využívání neurčitosti typu vágnost, jež je u lidského subjektu vysoce vyvinuto. Účinná je i efektivní exploatace principielně jednoduchých, ale výkonných nenumerických algoritmů, založených na tzv. naivní fyzice (Common Sense), která umožňuje lidskému expertovi integrovat objektivní znalosti se znalostmi subjektivními s efektem dosažení vyšší úrovně při rozhodování nebo řízení [4]. Kvalita lidských úsudků je tedy podmíněna (a snad i dána) schopností efektivního zpracování ne zcela přesných informací, přičemž jejich neurčitost má jiný charakter než neurčitost stochastická. Tato schopnost, spolu s dalšími vlastnostmi lidského uvažování jako projevy lidského intelektu, se v posledních desetiletích stává středem zájmu nové vědní disciplíny - Umělé inteligence. Vědní disciplina Umělá inteligence se snaží o vytvoření algoritmů a systémů, projevujících v jistém smyslu inteligentní chování a schopnosti [5]. Vychází-li klasická matematická statistika ze zákonů empirické pravděpodobnosti s využitím rozložení pravděpodobnosti náhodných jevů, vychází metody pro práci s vágností ze zákonů distribuce možnosti. I když mezi možností a pravděpodobností existují kvalitativní vztahy, jde o dva zcela odlišné přístupy [jev, že v osobním automobilu Felícia bude cestovat 8 dospělých osob, je (technicky) vysoce možný; naproti tomu skutečnost, že v nejbližších 10 minutách pojede po sledovaném úseku ulice takto obsazený automobil, má M J 0, pravděpodobnost téměř nulovou]. Označíme-li možnost takového jevu J jako ( ) 1 a pravděpodobnost takového jevu jako N ( J ) 0, 1 vztah ( J ) N( J ) M., potom mezi jejich hodnotami musí platit 3

Umělá inteligence, která se ve své dílčí oblasti zabývá metodami rozhodování a řešení složitých problémů, poskytla prostředky, které se pro efektivní zpracování neurčitosti zdají velmi nadějné. Jsou postaveny na principech zpracování především nenumerických informací - znalostí. Prakticky nejvíce je rozpracována metodologie expertních systémů [6] a s nimi souvisejících fuzzy regulátorů [7], [11]. Shrnutí pojmů Kvalita lidských úsudků je podmíněna schopností efektivního zpracování ne zcela přesných informací, přičemž jejich neurčitost má jiný charakter než neurčitost stochastická. Tato schopnost, spolu s dalšími vlastnostmi lidského uvažování jako projevy lidského intelektu, se v posledních desetiletích stala středem zájmu vědní discipliny - umělé inteligence. Metody a nástroje umělé inteligence, jsou postaveny na principech zpracování především nenumerických informací - znalostí. Prakticky nejvíce je rozpracována metodologie expertních systémů a s nimi souvisejících fuzzy regulátorů. Úlohy k řešení 1.2. 1. Setkali jste se ve své praxi s procedurami, využívajícími umělou inteligenci? 2. Uveďte objekt, který považujete z hlediska jeho matematického modelování za složitý. 4

1.3 Přechod od zpracování dat ke zpracování znalostí Čas ke studiu: 30 minut Cíl Po prostudování tohoto odstavce budete umět Definovat typy znalostí Vysvětlit pojem nenumerického abstraktního modelu Výklad V souladu s rozvojem aplikací metod umělé inteligence vzniká trend přechodu od zpracování objektivních dat ke zpracování subjektivních znalostí [8]. Lidské znalosti můžeme přitom rozdělit do dvou kategorií: a) v první jsou tak zvané znalosti hluboké, jejichž zdrojem je vlastní poznání přírodních dějů ve formě přírodních zákonů. Jsou to znalosti objektivní, dostupné více či méně široké odborné veřejnosti. Jsou produktem analytických, abstraktních a teoretických postupů zkoumání jevů reality. Hluboké znalosti jsou vyjadřovány formou analytických matematických vztahů; b) druhou kategorii znalostí označujeme jako znalosti mělké, povrchové (nikoli však povrchní!). Jsou to poznatky, jejichž zdrojem je dlouhodobá zkušenost, praxe a vlastní experimentování. Jsou to znalosti subjektivní, které kvalifikují úroveň experta. Mělké znalosti jsou vyjádřitelné různými formami, např. formou predikátových kalkulů, rámců, kvalitativních vztahů či heuristických pravidel, jak bude uvedeno dále. Využití hlubokých znalostí je typické pro metody konstrukce konvenčních, matematických statisticko-analytických modelů. Tyto modely, formalizované soustavami algebraických či diferenciálních rovnic, odrážejí díky aplikaci objektivních znalostí a metod obvykle širší třídy problémů a mají ponejvíce obecnou platnost. Uplatnění subjektivních znalostí v takových modelech není typické. Snížená účinnost takových modelů v případech popisu a řízení složitých, špatně objektivně popsatelných a obtížně měřitelných soustav, vedla E. Feigenbauma [8] k vyslovení této teze: Příslibem úspěšného řešení problémů jsou specifické, na danou problémovou oblast zaměřené znalosti (metody), kterými je třeba nahradit slabé metody všeobecné. Cesta uplatnění specifických (subjektivních, heuristických) znalostí vede k metodám tvorby nekonvenčních nenumerických modelů, které využívají vícehodnotovou logiku a různé formální aparáty jak pro reprezentaci neurčitých pojmů, tak i pro přibližné 5

(aproximativní) vyvozování závisle proměnných veličin. Tyto modely se stávají i základem pro metodologii řídících systémů, které je využívají. Shrnutí pojmů Metod umělé inteligence jsou příkladem přechodu od zpracování objektivních dat ke zpracování subjektivních znalostí. Lidské znalosti můžeme přitom rozdělit do dvou kategorií: znalosti hluboké a znalosti mělké. Hluboké znalosti jsou vyjadřovány formou analytických matematických vztahů, mělké znalosti jsou vyjádřitelné např. formou predikátových kalkulů, rámců, kvalitativních vztahů či heuristických pravidel. Jsou základem tzv. jazykových (nenumerických) modelů. Úlohy k řešení 1.3. 1. Promyslete vyjádření 1. Newtonova pohybového zákona formou matematického vztahu a formou slovního vyjádření (popisu)! 2. Uveďte příklad mělké a hluboké znalosti v oboru, který je Vám blízký (řízení automobilu, hra v šachy apod.). 6

1.4 Formalizace neurčitosti v systémech řízení Čas ke studiu: 20 minut Cíl Po prostudování tohoto odstavce budete umět Vysvětlit význam vágních pojmů a jejich použití v jazykových modelech Výklad Neurčitost chování řízených objektů, vyjadřovaná pojmy jako velmi velký, téměř nulový, asi deset má charakter slovní (pojmové, jazykové) neurčitosti - vágnosti. Její formalizace je pro konstrukci jazykových (slovních, lingvistických, nenumerických) popisů objektů základním problémem. Určité řešení zavedla intervalová matematika použitím číselných intervalů. Věrohodnost reprezentace pojmové neurčitosti je však narušena v okolí intervalových mezí. Ostrá číselná horní mez 10,00 interpretuje číslo 9,99 jako hodnotu do intervalu zcela jistě náležející, zatímco číslo 10,01 jako hodnotu do intervalu zcela jistě nepatřící. Jestli bychom takovým intervalem formalizovali např. slovní pojem vysoký strom a číselné hodnoty by vyjadřovaly jeho výšku v [m], potom je rozpor takové reprezentace s lidským uvažováním evidentní. Pro formalizaci vágnosti bylo vyvinuto několik metod, z nichž největšího rozšíření doznala metoda tzv. mlhavých, neostrých neboli fuzzy množin. Zakladatelem fuzzy množinové matematiky je již výše zmíněný profesor univerzity v Berkeley Lotfi A. Zadeh. Ve své výchozí práci [2] zobecnil klasickou teorii množin a vyslovil fuzzy množinovou teorii, která je dnes v aplikačních oblastech umělé inteligence často využívána. Aplikace fuzzy přístupů v oblasti automatického řízení vedla ke vzniku tzv. fuzzy regulace, jinak řečeno - regulace s využíváním lidských zkušeností, znalostí. Shrnutí pojmů Neurčitost chování řízených objektů má charakter slovní (pojmové, jazykové) neurčitosti - vágnosti. Její formalizace je pro konstrukci jazykových (slovních, lingvistických, nenumerických) popisů objektů základním problémem. Nejrozšířenějším způsobem je reprezentace pomocí fuzzy množin. Úlohy k řešení 1.4. 1. Pojmenujte vágní pojmy související s pokojovou teplotou! 7

1.5 Fuzzy pojetí regulace Čas ke studiu: 40 minut Cíl Po prostudování tohoto odstavce budete umět Vysvětlit poslání jazykových modelů a fuzzy reprezentace vágnosti Zdůvodnit použití vícehodnotové fuzzy logiky Nakreslit a vysvětlit schémata fuzzy a inteligentního regulátoru Výklad Úvodní kapitola (1.1) pojednává o problémech dosažení dostatečné adekvátnosti a současného zachování praktické použitelnosti modelů složitých soustav (Zadehův princip inkompatibility). Tento problém se přenáší do problematiky automatického řízení tam, kde je použito principů řízení s matematickým modelem. Podobně jako modely matematické mohou být použity i modely slovní, jazykové. Slovní modely popisují chování soustavy prostředky přirozeného jazyka. Popisují chování řízené soustavy na základě znalostí svého tvůrce - experta a vytvářejí tzv. báze znalostí. Vágnost slovního popisu bude v našem případě formalizována pomocí aparátu fuzzy množinové matematiky. Pro vyhodnocování velikosti výstupních proměnných ze slovních (fuzzy) modelů - bází znalostí - je přitom využívána vícehodnotová lingvistická (fuzzy) logika [9]. Báze znalostí, orientovaná obecně na řešení určitého problému, spolu s aparátem vyhodnocování odpovědí (velikosti závisle proměnných veličin) na dotaz (tvořený konkrétními hodnotami vstupních veličin) tvoří základ expertních systémů. Lze tedy říci, že řídící systémy se znalostní bází jsou jejich speciálními případy. V inženýrské praxi automatického řízení, zvláště složitých procesů, je totiž známo, že zkušený operátor dosahuje při manuálním řízení nebo manuální adaptaci parametrů klasického regulátoru často lepších výsledků, než řídící počítač. Pro regulaci v uzavřené smyčce pomocí expertních systémů jsou tak známy dva přístupy. 1) Přístup fuzzy - pravidlový (FLC - Fuzzy Logic Control) [7], který je pokusem modelovat manuální řídící funkci zkušeného operátora procesu. Řídící model je vyjádřen slovními (lingvistickými) řídícími pravidly, která popisují, jak vybírat řídící signál (akční veličinu) v různých situacích. Tento přístup si klade za cíl reprezentovat empirické znalosti řízení procesu. Jeho schéma je na Obr.1. 8

v(t) ω(t) + - e(t) Fuzzy regulátor u(t) Regulovaná soustava y(t) Obr.1 2) Přístup expertního (znalostního) řízení [10], který pomocí expertních systémů rozšiřuje možnosti klasických řídících algoritmů (PI, PID). Používá obecných znalostí (jazykových modelů) pro řízení k nastavení a adaptaci struktury i parametrů klasického regulátoru pomocí dohlížecích expertních systémů. Jeho schéma je na Obr.2. e(t) Dohlížecí expertní systém y(t) u(t) v(t) ω(t) + - e(t) PID u(t) Regulovaná soustava y(t) Obr.2 Problematika, uvedená v dosavadních kapitolách, je dále rozpracována v těchto oblastech: - základy fuzzy množinové teorie, - základy vícehodnotové lingvistické logiky, - fuzzy orientované pravidlové expertní systémy, - fuzzy pravidlový přístup k řízení (Fuzzy Logic Control), - přístup znalostního (expertního) řízení, - programové systémy pro fuzzy modelování, simulaci a řízení. Kapitoly obsahují teoretické pozadí i zásady praktické realizace fuzzy regulátorů i systémů znalostní regulace. Pro dokonalé pochopení jejich principů a funkce je popsána i funkce klasického fuzzy orientovaného pravidlového expertního systému. Pro získání praktických zkušeností jsou teoretické pasáže doplněny příklady praktických řešení. 9

Shrnutí pojmů Slovní modely popisují chování řízené soustavy na základě znalostí experta a pomocí tzv. báze znalostí. Vágnost slovního popisu je formalizována pomocí aparátu fuzzy množinové matematiky. Pro vyhodnocování velikosti výstupních proměnných ze slovních (fuzzy) modelů je využívána vícehodnotová lingvistická fuzzy logika. Pro regulaci v uzavřené smyčce jsou tak známy dva přístupy - přístup fuzzy regulátoru (FLC) a přístup inteligentního řízení. Úlohy k řešení 1.5. 1. Pokuste se slovně popsat průběh regulace teploty v peci! 10

2. ZÁKLADY FUZZY MNOŽINOVÉ TEORIE 2.1 Fuzzy množiny Čas ke studiu: 40 minut Cíl Po prostudování tohoto odstavce budete umět Definovat princip fuzzy množiny Výklad Neurčitý fenomén má v případě slovních popisů chování řízené soustavy charakter vágnosti. Vágnost je průvodní jev všech složitých, špatně popsatelných objektů, případně systémů, v jejichž funkci se uplatňuje lidský faktor. Pro její formalizaci je v našem případě použito adekvátního aparátu fuzzy množinové teorie [11], [12]. Fuzzy množinový aparát je přirozeným prostředkem pro formalizaci vágnosti. V teorii klasických množin prvek x do množiny A buď patří (prvek x 1 ), nebo nepatří (prvek x 2 ), Obr 3a. Obr 3a Obr 3b V Zadehově fuzzy množinové teorii, která je zobecněním teorie abstraktních množin [2], je fuzzy množina Bx definována jako třída, která přiřazuje prvkům svého univerza x neurčitost pomocí vlastnosti jejich částečné příslušnosti formou tzv. míry příslušnosti B(x). Tak na Obr.3b prvek x 1 do fuzzy množiny Bx určitě a zcela jistě patří a prvek x 2 zcela jistě a určitě nepatří. Míru příslušnosti prvku x 1 k fuzzy množině Bx pak vyjádříme hodnotou B(x 1 ) = 1, zatímco míru příslušnosti prvku x 2 k fuzzy množině Bx vyjádříme hodnotou B(x 2 ) = 0. Uvažujme dále prvky např. x 3 a x 4, které k fuzzy množině Bx patří zřejmě jenom 11

částečně. To je vyjádřeno u prvku x 3 mírou příslušnosti např. B(x 3 ) = 0,3 a u prvku x 4 mírou příslušnosti B(x 4 ) = 0,7. Nechť X = 0 je množina a Ax : X 0, 1 nechť je zobrazení. Fuzzy množinou pak budeme nazývat uspořádanou dvojici [ X A( x) ] Ax =,. Prvky x X přitom nazveme univerzem fuzzy množiny Ax, A(x) = f(x) nazveme funkcí příslušnosti (charakteristickou funkcí) fuzzy množiny Ax. Pro každé x X nazveme reálné číslo A(x) stupněm (mírou) příslušnosti prvku x k fuzzy množině Ax, přičemž A(x) budeme interpretovat takto: ( x) = 0 A - prvek x do množiny Ax jistě nepatří, ( x) = 1 A - prvek x do množiny Ax jistě patří, ( x) ( 0,1) A - nelze s jistotou určit, zda x patří do Ax. Velikost A(x) je vyjádřením míry našeho přesvědčení (míry příslušnosti), nakolik prvek x k Ax patří. Příklad průběhu charakteristické funkce (funkce nebo míry příslušnosti, někdy stupně nebo míry náležení) A(x) fuzzy množiny Ax v závislosti na velikosti prvků x je na Obr.4. Tímto průběhem bývá často fuzzy množina Ax graficky popsána. Čárkovanou čarou je naznačena velmi často používaná aproximace průběhu A(x) = f(x) přímkovými úseky. Fuzzy množina Ax je tak parametrizována a bývá zadávána hodnotami bodů zlomů Ax = {a, b, c, d}. Obr.4 Shrnutí pojmů V Zadehově fuzzy množinové teorii, která je zobecněním teorie abstraktních množin, je fuzzy množina definována jako třída, která přiřazuje prvkům svého univerza neurčitost 12

pomocí vlastnosti jejich absolutní příslušnosti nebo nepříslušnosti, ale i formou částečné příslušnosti pomocí stupně příslušnosti jako reálného čísla z uzavřeného intervalu 0, 1. Úlohy k řešení 2.1. 1. Vymyslete fuzzy množinu a určete stupně příslušnosti jejích významných prvků! 13

2.2 Základní fuzzy množinové operace Čas ke studiu: 50 minut Cíl Po prostudování tohoto odstavce budete umět Popsat fuzzy množinu jejími parametry Vyjmenovat a vysvětlit základní fuzzy množinové operace Výklad Definujme základní vlastnosti fuzzy množin, které budeme potřebovat ve výkladu jejich aplikací v řízení (Obr.4) [11], [12]. a) Výškou fuzzy množiny Ax nazveme reálné číslo, definované vztahem hgta = sup A x ; x X ( ) b) Fuzzy množinu Ax nazveme normální, pokud hgt A = 1; c) Fuzzy množinu nazveme prázdnou, platí-li hgt A = 0; d) Nosičem fuzzy množiny Ax nazveme množinu supp A = { X / A( x) 0} x. e) α - řezem fuzzy množiny Ax nazveme množinu ( A) = { x X A( x) } C α / α ; α - řezy jsou zajímavé tím, že pomocí nich (jako klasických množin) lze vyjádřit fuzzy množinu vztahem ( ) Ax = α Cα A ; f) Jádrem fuzzy množiny Ax nazveme množinu ker = { x X / A( x) = 1} A. Fuzzy množinu Ax definovanou na univerzu reálných čísel R nazveme konvexní, jestliže (zjednodušeně) C α ( A) je spojitý interval pro každé α 0, 1. Takovou konvexní fuzzy množinu, je-li navíc množinou normální a její jádro je jednoprvkové, nazýváme trojúhelníkovým fuzzy číslem. 14

Pro fuzzy množiny se stejným univerzem X jsou definovány tyto základní operace: a) Sjednocením fuzzy množin Ax = [ X, A( x) ], Bx [ X, B( x) ] Ax + Bx = [ X,( A + B)( x) ], kde ( A + B)( x) = [ A ( x), B( x) ] b) Průnikem fuzzy množin Ax = [ X, A( x) ], Bx [ X, B( x) ] Ax Bx = [ X,( A B)( x) ], kde ( A B)( x) = [ A ( x), B( x) ] = nazveme fuzzy množinu max. = nazveme fuzzy množinu min. c) Odvážným průnikem fuzzy množin Ax = [ X, A( x) ], Bx [ X, B( x) ] množinu Ax Bx = [ X,( A B)( x) ], kde ( A B)( x) = max{ 0, [ ( x) + B( x) 1] } d) Doplňkem (komplementem) fuzzy množiny Ax [ X, A( x) ] A x = X, A( x) kde A( x) = 1 A( x). [ ] = nazveme fuzzy A. = nazveme fuzzy množinu e) Inkluzí fuzzy množin Ax = [ X, A( x) ], Bx = [ X, B( x) ] nazveme stav, kdy A( x) B( x) pro všechna x X (Ax je podmnožinou Bx). f) Rovností fuzzy množin Ax = [ X, A( x) ], Bx [ X, B( x) ] pro všechna x X. = nazveme stav, kdy A(x) = B(x) Pro fuzzy množiny, definované na různých univerzech, jsou definovány fuzzy množiny, zvané fuzzy relace R. Pro fuzzy množiny Ax = [ X, A( x) ], By = [ Y, B( y) ] s univerzy X a Y jsou fuzzy relace definovány na dvojrozměrném univerzu ( x, y). Obecně pro n fuzzy množin na n univerzech U 1, U 2,..., U n jsou fuzzy relace R: U 1 x U 2 x... x U n definovány na univerzu n-rozměrném. Jako příklad fuzzy relace uvedeme nejrozšířenější kartézský součin. Kartézským Ax = [ X, A x ], By = [ Y, B( y) ] nazveme fuzzy množinu Ax Bx = X Y, A B x, y A B x, y min A x, B y. součinem fuzzy množin ( ) [ ( )( )], kde ( )( ) = [ ( ) ( )] Dalšími fuzzy relacemi jsou např. projekce, cylindrické rozšíření nebo kompozice. Jejich definice uvedeme podle potřeby v dalším textu. Shrnutí pojmů Fuzzy množinu popisujeme jejím univerzem, nosičem, alfa-řezy, výškou a jádrem. Fuzzy množina může být normální, konvexní, prázdná. Speciálním typem normální konvexní fuzzy množiny je fuzzy číslo (fuzzy singleton). Základní operace mezi fuzzy množinami definovanými na jednom univerzu jsou fuzzy sjednocení, průnik a doplněk. Pro fuzzy množiny s různými univerzy jsou definovány fuzzy relace. Úlohy k řešení 2.2. 1. Popište parametry obyčejné (klasické) množiny! 15

2.3 Princip rozšíření (extenzionální princip) Čas ke studiu: 20 minut Cíl Po prostudování tohoto odstavce budete umět Vysvětlit princip rozšíření operací nad obyčejnými množinami na fuzzy množiny Provádět aritmetické operace s fuzzy množinami Výklad Jedním z nejdůležitějších zákonů fuzzy množinové matematiky je princip rozšíření, vyslovený L.A.Zadehem [2]. Podle tohoto principu lze operace nad prvky univerz (obyčejné, ne-fuzzy množiny) rozšířit na operace nad fuzzy množinami s příslušnými univerzy. Nechť X, Y jsou univerza, f : X Y je funkce, zobrazující (obyčejnou) množinu X do (obyčejné) množiny Y a Ax je fuzzy množina na univerzu X. Pak fuzzy množina Ax indukuje fuzzy množinu f [ A( x) ] = Ax na univerzu Y. Univerzum Y má prvky y. Funkci příslušnosti prvků y k fuzzy množině Ay určíme podle principu rozšíření jako A ( y) ( x) ; y = f ( x) sup A = 0, jestliže neexistuje žádné x X takové, že y = f(x). Podle tohoto principu se aplikací funkce f na prvky univerza X jejich stupně příslušnosti do libovolné fuzzy množiny nad X přenášejí beze změny na jejich obrazy. Ve speciálním případě může být funkce f binární operací * : X X X v univerzu X. Pak z principu rozšíření plyne: nechť v X je definována binární operace * a na univerzu X jsou definovány fuzzy množiny Ax, Bx. Výsledkem rozšířením uvažované binární operace * na fuzzy množiny Ax, Bx je pak fuzzy množina Cz = Ax * Bx. Její funkci příslušnosti C(z) = f(z) určíme jako C ( z) { min[ A( x), B( y) ]; x, y X, z x * y} sup = = 0 jinak pro všechna z X. 16

Shrnutí pojmů Podle Zadehova principu rozšíření se aplikací funkce na prvky univerza jejich stupně příslušnosti do libovolné fuzzy množiny přenášejí beze změny na jejich obrazy. Pomocí tohoto principu lze jednoduše přenést operace nad obyčejnými množinami na operace nad fuzzy množinami. Úlohy k řešení 2.3. 1. Promyslete aritmetiku fuzzy čísel! 17

2.4 Lingvistická proměnná Čas ke studiu: 40 minut Cíl Po prostudování tohoto odstavce budete umět Definovat lingvistickou proměnnou a její atributy Formalizovat jazykové hodnoty lingvistické proměnné fuzzy množinami Výklad Lingvistická proměnná p je jedním ze základních pojmů nenumerické matematiky; je základním kamenem slovních (jazykových, lingvistických) modelů - popisů chování vyšetřovaných nebo řízených soustav. Podle definice, kterou podal L. A. Zadeh [8], nazýváme lingvistickou proměnnou uspořádanou pětici ( P, T ( P), U, G M ) p :,, kde P je jméno (identifikátor) lingvistické proměnné p, T(P) je množina lingvistických hodnot, kterých může P nabývat, U je univerzum, G je syntaktické pravidlo, pomocí kterého jsou generovány prvky T(P) a M je sémantické pravidlo, které přiřazuje každé lingvistické hodnotě její význam ve formě fuzzy množiny s univerzem U. V našem případě interpretujeme lingvistickou proměnnou takto: a) T(P) je konečná množina lingvistických hodnot h s, s = 1, 2, 3,... b) Syntaktické pravidlo G je výčtem prvků množiny T(P). c) Sémantické pravidlo M interpretuje každou lingvistickou hodnotu h s, s = 1, 2, 3,... jako konvexní fuzzy množinu na univerzu R H S [ R H () r ] r R r =,,. S Znamená to tedy, že pravidlo M označuje jednotlivé fuzzy množiny přímo názvy jejich odpovídajících lingvistických hodnot. Tím je každá lingvistická hodnota h s lingvistické proměnné p formalizována pomocí fuzzy množiny H s r. Tak je realizována fuzzy interpretace neurčitosti, kterou každá lingvistická hodnota představuje. d) Pro každé s = 1, 2, 3,... platí: hgth s = 1 18

Jako příklad uvedeme interpretaci lingvistické proměnné RYCHLOST VOZIDLA, definovaná na univerzu v [km/hod]. Pro nenumerickou (jazykovou) kvantifikaci této proměnné zvolíme tyto tři lingvistické hodnoty: h 1 : NÍZKÁ H 1 v h 2 : STŘEDNÍ H 2 v h 3 : VYSOKÁ H 3 v Podle sémantického pravidla (expertní posouzení) interpretujeme každou lingvistickou hodnotu h s, s = 1,2,3, jako konvexní normální fuzzy množinu H s v. Možná interpretace je uvedena na Obr.5. Obr.5 Lingvistické proměnné a jejich hodnoty budou využity jako proměnné fuzzy lingvistických modelů vyšetřovaných soustav (expertní systémy) nebo řízených soustav (fuzzy regulátory). H S r =, Podle výše uvedené definice je každá lingvistická hodnota [ R H () r ] S konvexní normální fuzzy množinou (hgth s = 1). Vyvstává tedy problém určení funkce příslušnosti této fuzzy množiny. Praktické aplikace ukázaly, že je poměrně jednoduché určení množin supph s a kerh s, zatímco určení α - řezů pro ( 0,1) je velmi problematické; tak se v praxi zadávají pouze množiny supph s a kerh s jako intervaly, přičemž supph s je interval otevřený a kerh s interval uzavřený. Položme tedy (analogicky k Obr.4, kde r je prvkem univerza reálných čísel R) supph s = (, ) a, kerh s = b s, cs s d s 19

Nyní definujme funkci příslušnosti H s r takto: r as H S () r =, as < r < bs ; b a S S S r d S H S () r =, cs < r < d S ; c d H H S S () r =, bs r cs S 1 ; () r =, d S r as 0. Znamená to, že funkce H s (r) je lineární na všech intervalech, kde její hodnota není určena zadáním množin supph s a kerh s. Každá lingvistická hodnota H s r je pak určena uspořádanou čtveřicí {a s, b s,c s, d s } - Obr.4. Uspořádaná čtveřice představuje body zlomu aproximační přímky a čtyři hodnoty tvoří v takovém případě čtyři parametry zde lichoběžníkové fuzzy množiny. S využitím aproximace lomenými přímkovými úseky lze tak definovat celkem 9 typů fuzzy množin [13]. Shrnutí pojmů Lingvistická proměnná je základním kamenem slovních (jazykových, lingvistických) modelů. je definována jménem, množinou svých lingvistických hodnot, univerzem, syntaktickým a sémantickým pravidlem. Touto definicí je realizována fuzzy interpretace neurčitosti (vágnosti), kterou každá vágní lingvistická hodnota představuje. Jazykové hodnoty jsou formalizovány fuzzy množinami, jejichž funkce příslušnosti jsou nejčastěji aproximovány lomenými přímkovými úseky (lichoběžníková fuzzy množina). Úlohy k řešení 2.4. 1. Promyslete fuzzy množinovou reprezentaci jazykových hodnot výšky stromů! 20

3. VÍCEHODNOTOVÁ LOGIKA A LINGVISTICKÉ MODELY 3.1 Vícehodnotová lingvistická logika Čas ke studiu: 30 minut Cíl Po prostudování tohoto odstavce budete umět Vysvětlit pojem formule vícehodnotové logiky Definovat pravdivostní ohodnocení výsledků základních fuzzy logických operací Výklad Logickou proměnnou je v teorii vícehodnotové logiky nazývána taková proměnná, která může, na rozdíl od logiky klasické (dvouhodnotové), nabývat obecně libovolných hodnot z intervalu 0, 1. Označme množinu logických spojek [14] S { and, or, &, } = => jako konjunkci, disjunkci, odvážnou konjunkci a implikaci. Nechť D je konečná množina logických proměnných a S je množina logických spojek. Pak můžeme definovat formuli vícehodnotové logiky pomocí rekurzivní definice 1) jestliže x D, pak x je formule; 2) jestliže π 0, 1, pak π je formule; 3) jestliže Θ, Γ jsou formule a S *, pak ( Γ) Θ * je formule. Formulí rozumíme např. takový výrok: TEPLOTA je NÍZKÁ. Interpretací formule nazveme přiřazení pravdivostních hodnot všem logickým proměnným dané formule. Pravdivostním ohodnocením formule nazveme zobrazení V (.), které každé interpretaci formule Θ přiřadí pravdivostní hodnotu V ( Θ). Pravdivostní hodnoty jsou definovány takto: 1) ( π ) = π V pro každé π 0, 1 ; 2) V ( ΘandΓ) = ( V ( Θ), V ( Γ) ) min pro každé dvě formule Θ, Γ ; 21

3) V ( ΘorΓ) = ( V ( Θ), V ( Γ) ) max pro každé dvě formule Θ, Γ ; 4) ( Θ & Γ) = max( 0; V ( Θ) + V ( Γ) 1) V pro každé dvě formule Θ, Γ ; 5) V ( Θ Γ) = ( 1; 1 V ( Θ) + V ( Γ) ) min pro každé dvě formule Θ, Γ ; 6) V ( Θ Γ) = ( V ( Θ), V ( Γ) ) min pro každé dvě formule Θ, Γ. Předpis ad 5) představuje jednu z možných interpretací implikace ve vícehodnotové logice, kterou navrhl L.A.Zadeh [15]. Jinou interpretaci, ad 6), navrhuje např. Mamdani [16]. Velice důležitou problematiku interpretace spojky implikace probereme dále. Shrnutí pojmů Logickou proměnnou je v teorii vícehodnotové logiky nazývána taková proměnná, která může nabývat obecně libovolných hodnot z intervalu <0,1>. Nejdůležitější fuzzy logické operace jsou konjunkce, disjunkce, odvážnou konjunkce a implikace.definujeme formuli vícehodnotové logiky, její interpretací nazveme přiřazení pravdivostních hodnot všem jejím logickým proměnným. Úlohy k řešení 3.1. 1. Nalezněte v literatuře vyjádření složité logické funkce implikace pomocí logických funkcí jednoduchých! 22

3.2 Lingvistické modely Čas ke studiu: 40 minut Cíl Po prostudování tohoto odstavce budete umět Vytvořit jazykový model pomocí vět přirozeného jazyka Definovat jazykový model jako množinu IF-THEN podmíněných fuzzy pravidel Výklad Lingvistický model můžeme definovat jako výrok, v němž se vyskytují lingvistické proměnné p, jejich jména P, jména jejich lingvistických hodnot h s, logické spojky S a pravdivostní hodnoty V (). 0, 1. Popisujeme-li lingvistickým modelem chování reálné funkce f(x 1, x 2,..., x n ) o n proměnných, potom, řečeno intuitivně, je lingvistický model pravdivý výrok o chování funkce f. Významnou výhodou lingvistického modelu je možnost vytvoření formálního zápisu, který nám umožní zapsat lingvistický model tak, jak je běžným způsobem napsána česká věta. Nechť p = (P, h s, U) je lingvistická proměnná, kde P je její jméno (identifikátor), h s je množina jejich jazykových hodnot a U je univerzum, na němž je proměnná p definována. Místo H s p pak píšeme: P je h s Máme-li např. lingvistickou proměnnou p = (TEPLOTA, h s, R) a množina h s jejích lingvistických hodnot je h s = {NÍZKÁ, STŘEDNÍ, VYSOKÁ}, s = 1, 2, 3, potom místo zápisu funkce příslušnosti (VYSOKÁ)p píšeme větu TEPLOTA p je VYSOKÁ. (1) 23

Dosadíme-li za p konkrétní hodnotu p 0, pak tento výrok bude mít pravdivostní hodnotu rovnu míře příslušnosti hodnoty p 0 k fuzzy množině (VYSOKÁ)p, tedy (VYSOKÁ)(p 0 ). Proveďme nyní formální úpravu zápisu s využitím logického spojení (implikace). Napsanou implikaci logických formulí Θ, Γ Θ Γ interpretujeme ve formě podmíněného výrazu JESTLIŽE (IF) Θ PAK (THEN) Γ (2) Podmíněné výrazy nám umožňují, aby se formální zápis lingvistického modelu ještě více přiblížil běžnému vyjadřování v přirozené lidské řeči, než je jednoduchá věta (1). K tomu používáme skládání jednoduchých podmíněných výrazů (2) do výrazů složených. Složený podmíněný výraz (prohlášení) představuje např. tato věta, která je lingvistickým modelem (popisuje jednu, dílčí stránku chování jakési technologické soustavy: Jestliže (IF) (TEPLOTA t je NÍZKÁ) a (TLAK p je VYSOKÝ) a (RYCHLOST PROUDĚNÍ v je VYSOKÁ), pak (THEN) (STABILITA SOUSTAVY s je MALÁ) (3) Část podmíněného výrazu vlevo od implikace pak se nazývá jeho podmínkovou částí (antecendentem, premisou), pravá část pak jeho důsledkovou částí (konsekventem). Složený podmíněný výraz (3) je zapsán ve formě tzv. IF-THEN pravidla. Obecně má takové pravidlo tvar, jehož antecendent tvoří konjunkce jednoduchých tvrzení Γ (x j ) o chování jazykových proměnných x j (vstupní, nezávisle proměnné modelu) a jeho konsekventem je tvrzení Ω (y) o odpovídajícím chování proměnné y (výstupní, závisle proměnná modelu): IF [ Γ ( x1 ) andγ( x2 ) and... andγ( )] THEN [ ( y) ] x n Ω (4) Užití logické spojky and - konjunkce v tomto vztahu je zdůvodněno tím, že jsou-li x 1, x 2,..., x n nezávisle proměnné, neexistuje mezi nimi vnitřní souvislost. Lingvistický model může být také vytvořen složením několika prohlášení. Jednotlivá prohlášení jsou spojována logickou spojkou or, and resp. &. Tím vznikne model tvaru vícenásobného (multi) prohlášení typu CCD, CIC resp. CI&. Tak např. model CIC s m prohlášeními má tvar IF [ Γ ( ) andγ ( x ) and and ( )] THEN [ Ω ( y) ] and x1 21 2 n1 x n 11... Γ IF [ Γ ( ) andγ ( x ) and and ( )] THEN [ Ω ( y) ] and... x1 22 2 n2 x n 12... Γ and Γ x andγ x and... andγ IF [ 1 m ( 1 ) 2m ( 2 ) nm ( xn )] THEN [ Ω m ( y) ] 1 2 24

zatímco model CCD má za stejných podmínek tvar IF [ Γ ( ) andγ ( x ) and and ( )] THEN [ Ω ( y) ] or x1 21 2 n1 x n 11... Γ IF [ Γ ( ) andγ ( x ) and and ( )] THEN [ Ω ( y) ] or... or x1 22 2 n2 x n 12... Γ IF [ Γ 1 m ( x1 ) andγ2 m ( x2 ) and... andγnm ( xn )] THEN [ Ω m ( y) ] Oba modely se liší způsobem svého uvažování, jak bude uvedeno dále. Obecně dává konjunktivní model typu CIC (resp. CI&) při popisu chování systémů lepší výsledky, než disjunktivní model CCD. Jejich použití závisí na typu popisované soustavy (funkce, relace). 1 2 Shrnutí pojmů Významnou výhodou lingvistického modelu je možnost vytvoření formálního zápisu, který nám umožní zapsat lingvistický model tak, jak je běžným způsobem napsána česká věta. Znalosti o chování soustavy zapisujeme ve formě podmíněných IF-THEN pravidel. Pravidlo má část podmínkovou (antecedent) a důsledkovou (konsekvent). Lingvistický model je vytvořen složením několika prohlášení, čímž vznikne model tvaru vícenásobného (multi) prohlášení. Úlohy k řešení 3.2. 1. Sestavte jednoduchý jazykový model stability automobilu na kluzké vozovce v závislosti na jeho rychlosti. 2. Formalizujte jazykovou proměnnou TEPLOTA V PECI a navrhněte tři její jazykové hodnoty vyjádřené fuzzy množinami! 25

3.3 Aproximace lingvistického modelu fuzzy funkcí Čas ke studiu: 6 hodin Cíl Po prostudování tohoto odstavce budete umět Určit pravdivostní hodnotu pravidla Vysvětlit metodu Fuzzy modus ponens Použít Zadehovu interpolační metodu vyvozování odpovědi Pokládat dotazy jazykovému modelu Optimalizovat jazykový pravidlový model Výklad Až dosud jsme předpokládali, že vytváříme lingvistický model známé reálné funkce. V praxi je však většinou situace taková, že lingvistickým modelem popisujeme chování funkce neznámé. K tomu je třeba stanovit metodiku nalezení aproximací lingvistických modelů neznámých funkcí, vedoucí k tzv. aproximativnímu vyvozování závěrů. Jako příklad uvedeme metodu aproximativního vyvozování, postavenou na využití jednoho z vyvozovacích pravidel klasické logiky - pravidla MODUS PONENS. Pro jeho využití v metodě aproximativního vyvozování je třeba provést jeho zobecnění do formy FUZZY MODUS PONENS [13]. Toto zobecnění, jak uvidíme dále, vyžaduje definici nové fuzzy relace - kompozice. Klíčovou operací při simulaci chování systému s využitím jeho matematického modelu je dosazení konkrétních číselných hodnot jeho vstupních proměnných, na základě čehož je vypočítána číselná hodnota proměnné výstupní. V případě simulace s využitím jazykového modelu je operace dosazení konkrétních vstupních hodnot nazývána aktualizací jazykového modelu. Jelikož o každé vstupní proměnné existuje v antecendentu jedno dílčí tvrzení, získáváme tak pravdivostní ohodnocení jednotlivých dílčích tvrzení antecendentu. Taková aktualizace pak představuje vlastně položení dotazu jazykovému modelu, výsledkem simulace (aproximativního vyvození) je odpověď modelu na dotaz. Aktualizaci jazykového modelu můžeme provádět celkem třemi typy dotazů: - dosazením číselných změřených dat a provedením tzv. diskretizace antecendentu modelu. Diskretizace spočívá v tom, že každá konkrétní číselná vstupní proměnná je pro simulaci nahrazena mírou její příslušnosti k fuzzy množině jazykové hodnoty příslušné jazykové proměnné. Jedná se o dotaz bodový. Tento způsob je typický pro on-line režim expertního systému (fuzzy regulátoru) automatickým přenosem vstupních dat z informačního systému; 26

- dosazením příslušných fuzzy množin jazykových hodnot odpovídajících vstupních proměnných operátorem (obsluhou systému) v jazykové, nikoli číselné, formě; - dosazením vstupní informace ve formě definice obecné fuzzy množiny v případě, že nevystačíme s fuzzy množinami předdefinovaných jazykových hodnot. Druhé dva typy dotazů jsou typické pro off-line režim provozu expertního systému (fuzzy regulátoru) - tzv. režim konverzační, kdy aktualizaci provádí operátor. Určení pravdivostní hodnoty pravidla. Hledejme pravdivostní hodnotu složeného (multi) tvrzení podle (4). Takové tvrzení je typickým tvarem pravidla fuzzy modelu. Pravdivostní hodnota takového pravidla určuje míru pravdivosti (platnosti) jeho Ω y. Tato míra je dána pravdivostní hodnotou antecendentu (premisy) pravidla konsekventu [ ( )] IF [ Γ ( x ) andγ( x ) and... andγ( )] 1 2 x n, která je složena z konjunkce dílčích n jednoduchých tvrzení, tedy (x 1 is A 1 x 1 ) and (x 2 is A 2 x 2 ) and... and (x n is A n x n ). (5) Uvažujme dotaz A Dj x j jako konkrétní (aktuální, dosazovanou) hodnotu nezávisle proměnné modelu x j : A Dj x j : (x 1 is A D1 x 1 ) and (x 2 is A D2 x 2 ) and... and (x n is A Dn x n ). Označíme-li pravdivostní hodnoty dílčích tvrzení premisy (5) V ( j), platí pro velikost pravdivostní hodnoty dílčího tvrzení V ( j) vzhledem k dotazu A Dj x j vztah konzistence Cons tvrzení a dotazu: ( j) = Cons( A x, A x ) = Sup[ A x A x ] V j j Dj j x X j j Dj j Jelikož jednotlivá dílčí tvrzení premisy jsou spojena vztahem konjunkce (and), je pravdivostní hodnota premisy r-tého pravidla V () r dána výrazem V () r ) = V () 1 and V ( 2) and... and V ( n) = min ( j) Jestliže r-té pravidlo má tvar V, j = 1, 2,..., n. IF (x r1 is A r1 x 1 ) and (x r2 is A r2 x 2 ) and... and (x rn is A rn x n ) THEN (y r is B r y), potom hodnota V () r je současně hodnotou tzv. úrovně ořezání g r fuzzy množiny lingvistické hodnoty závisle proměnné y r, tedy množiny B r y. Tato úroveň ořezání má velký význam pro odvozování odpovědi modelu (aproximativní vyvozování), jak bude uvedeno dále. 27

Předpokládejme, že byl položen bodový dotaz (x 0 1, x 0 2,..., x 0 n) a model má m pravidel. Stanovení pravdivostních hodnot V ( j) dílčích tvrzení antecendentů jednotlivých pravidel se nazývá diskretizace antecendentů. Analogicky, pokud bychom ji předem znali, bychom mohli provést diskretizaci závisle proměnné (konsekventů pravidel). Její hodnotu však předem neznáme, proto hledáme její fuzzy aproximaci. Přejděme z bodového dotazu na konvexní fuzzy množinu (dotaz druhého typu). V tom případě prvky vektoru V ( j) diskretizace budou maximálními výškami průniku fuzzy množiny dotazu s fuzzy množinami jednotlivých lingvistických hodnot (konzistence tvrzení a dotazu). Situaci ukazuje Obr.6. Obr.6 Jestliže hodnotu nezávisle proměnné x v dotazu reprezentuje fuzzy množina Dx (fuzzy singleton x 0 ), potom podle situace na Obr.6 je výsledkem diskretizace dotazu Dx vektor {0,6; 0,8; 0,0}. Označme X r a Y r diskretizaci nezávisle resp. závisle proměnné r-tého prohlášení, r = 1, 2,...m. Např. pro model (8), obsahující dvě prohlášení, tedy m = 2: R 1 : IF (TEPLOTA je MALÁ) THEN (TLAK je MALÝ) or R 2 : IF (TEPLOTA je VELKÁ) THEN (TLAK je VELKÝ) (6) dostaneme podle Obr.7 a Obr.8 diskretizací vektory 1. X 1 = {1; 0,5} Y 1 = {1; 0,35} 2. X 2 = {0,5; 1} Y 2 = {0,35; 1} 28

Obr.7 Obr.8 Metoda FUZZY MODUS PONENS Pro stanovení aproximace výstupní hodnoty modelu (odpověď) při známých vstupních hodnotách (dotaz) by bylo velmi výhodné, kdybychom mohli nalézt přenos mezi vstupním dotazem a výstupní odpovědí, např. ve formě transformační matice R tak, aby platilo X r o R = Y r pro r = 1, 2,... m Funktorem o označíme novou operaci kompozice (superpozice) fuzzy relací X r a R. Tato operace kompozice je definována takto: Nechť F je fuzzy relace na univerzu (kartézském součinu) U = U 1 U 2 a G je fuzzy relace na univerzu (kartézském součinu) V = U 2 U 3. Potom kompozice F o G je fuzzy relace na univerzu U 1 U 3, pro jejíž funkci příslušnosti platí ( FoG)( u, u ) max[ min( F( u, u ), G( u u ))] =. 1 3 1 2 2, u2 U 2 3 Operace kompozice dvou fuzzy relací je analogická operaci násobení dvou matic. Namísto součinu dvou prvků matice zde vystupuje minimum dvou stupňů příslušnosti a namísto součtu je jejich maximum. 29

Známe-li transformační matici R, můžeme pro každý diskretizovaný dotaz Q = (x 1, x 2,..., x n ) pomocí kompozice (Q o R) vypočítat diskretizovanou odpověď pravidla B r y, r = 1, 2,..., m. Skutečnou (globální) odpověď modelu B nalezneme jako sjednocení přes všechny lingvistické hodnoty závisle proměnné, jak bude uvedeno dále. Přístup odvození odpovědi fuzzy modelu pomocí transformační matice R a operace kompozice odpovídá postupu vyvozování závěrů v klasické logice pomocí pravidla MODUS PONENS. Toto pravidlo je pomocí uvedené operace zobecněno do formy FUZZY MODUS PONENS a lze je vyjádřit tímto schématem: antecendent 1 : x is A'x (DOTAZ Q) antecendent 2 : IF x is Ax THEN y is By (MODEL) ------------------------------------------------------------------------------------- konsekvent : y is B o y (ODPOVĚĎ B o y) Toto schéma je v teorii aproximativního vyvozování formalizováno výrazem [13] Q, R B o y = (Q o R) v němž (Q o R) je hledaný důsledek B o y (výsledek vyvození, odpověď) dotazu Q při platnosti fuzzy mnohonásobného multiprohlášení R jako fuzzy lingvistického modelu (transformační matice). Je-li y libovolný bod univerza U závisle proměnné, pak pro hodnotu funkce příslušnosti v tomto bodě platí vztah [13] B ( y) = sup min min( A ( u ),max min ( ( ) ( )) min A u, B y u U 1< j< n j j 1< r< m 1< j< n rj j r (7) kde u = (u 1, u 2,..., u n ) je libovolný bod univerza U jako kartézského součinu univerz antecendentu prohlášení. Uvedený vztah vyžaduje, aby supremum na jeho pravé straně bylo počítáno přes celý kartézský součin (n-rozměrný prostor), což je algoritmicky i časově velmi náročné. Proto v používaném algoritmu výpočtu pro disjunktivní model CCD je vztah (7) optimalizován pomocí funkce fuzzy konzistence Cons [13]. Uvažujme dvě tvrzení R 1 : x is Au a R 2 : x is Bu (8) přičemž budeme považovat tvrzení R 2 jako platné, referenční. Hledejme míru souhlasu tvrzení R 1 za předpokladu platnosti referenčního tvrzení R 2. Tato míra konzistencí obou tvrzení a je dána vztahem Cons ( R R ) = Cons( Au, Bu) = Sup[ A( u) B( u) ] 1, 2 (9) u U Konzistence dvou tvrzení je dána velikostí maximální hodnoty míry příslušnosti průniku fuzzy množin, formalizujících lingvistické hodnoty jejich jazykových proměnných. 30

[13] Aplikace této operace na výraz (7) redukuje prohledávaný prostor na dvojrozměrný B ( y) = max min ( ) ( ( ) B y, min Cons A x, A x 1< r< m r 1< j< n j rj Takováto optimalizace výpočtového algoritmu (7) je použitelná pouze pro modely CCD. Pro konjunktivní modely CIC resp. CI& nelze tuto optimalizaci výpočtu použít. Algoritmus vyvození odpovědi konjunktivních modelů je dvoukrokový: v prvním kroku se vyhodnotí odpověď modelem CCD a v druhém kroku se modifikuje výsledek na odpověď CIC resp. CI& geometrickou transformací [13].. Zadehova interpolační metoda Jednoduchý postup pro aproximativní vyvození odpovědi uvedl v [15] i L.A.Zadeh. Tento postup, známý jako Zadehova interpolační metoda, je opět použitelná pro vyhodnocování odpovědí modelů typu CCD, pro něž platí, že implikace antecendentu a konsekventu jeho pravidel je vyhodnocována jako konjunkce (CCD: Conjunction - Conjunction - Disjunction) - interpretace Mamdani. Uvažujme x j, j = 1, 2,..., n jako vstupní, y jako výstupní proměnnou lingvistického CCD modelu, který obsahuje r = 1, 2,..., m pravidel. Sestavme pro přehlednost matici fuzzy množin hodnot proměnných modelu a dotazu. x 1 x 2..., x n y ------------------------------------------------------------------- A 11 x 1, A 12 x 2,..., A 1n x n B 1 y A 21 x 1, A 22 x 2,..., A 2n x n B 2 y... A m1 x 1, A m2 x 2,..., A mn x n B m y ------------------------------------------------------------------- A 1,x 1 A 2,x 2..., A n x n B o y Prvky ( n) m matice A rj x j jsou množiny lingvistických hodnot proměnných x j v jednotlivých pravidlech j = 1, 2,..., n. Fuzzy množiny sloupcového vektoru B r y, r = 1, 2,..., m, reprezentují lingvistické hodnoty výstupní proměnné jednotlivých pravidel. Řádkový vektor A 1 x 1, A 2 x 2,..., A n x n je vektor fuzzy množin lingvistických hodnot dotazu a B o y je hledaná fuzzy množina odpovědi na dotaz. Fuzzy množina s funkcí příslušnosti B o y = f(y), která představuje hledanou odpověď, je vytvořena z fuzzy množin B k y, k = 1, 2,..., K jednotlivých K lingvistických hodnot závisle proměnné, a to vodorovným ořezáním těchto množin na úrovních již zmíněných ořezávacích koeficientů g k. Uvažujme reálný pravidlový model, jehož m 1 pravidel se vyjadřuje k hodnotě B 1 y závisle proměnné y a m 2 pravidel se vyjadřuje k hodnotě B 2 y. Potom výsledné úrovně ořezání hodnot B 1 y a B 2 y určíme s ohledem na skutečnost, že pravidla r 1, r 1 = 1, 2,..., m 1 a pravidla r 2, 31

r 2 = 1, 2,..., m 2 jsou spolu v modelu typu CCD vázána spojkou or, tedy vztahem disjunkce. Proto platí g 1 = max ( ) a V, r 1 = 1, 2,..., m 1 (10) r 1 r 2 g 2 = max ( ) kde V ( r 1 ) a ( r 2 ) V, r 2 = 1, 2,..., m 2 (11) V jsou pravdivostní hodnoty pravidel r 1 a r 2. Zaveďme tedy dílčí ořezávací koeficienty g r, r =1, 2,..., m pro jednotlivá pravidla: g r = min ( Cons ( A x, A x ) j rj j j j, r = 1, 2,..., m, j = 1, 2,..., n z nichž vypočteme velikost ořezávacích úrovní g k pro jednotlivé fuzzy množiny B k y g k = max (, k) k g r, r = 1, 2,..., m, k = 1, 2,..., K kde g r,k jsou parciální koeficienty těch pravidel, která se vyjadřují vždy k určité k-té lingvistické hodnotě B k y závisle proměnné y. Označme fuzzy množinu B k y, ořezanou na úrovni g k jako B k (gk) y B k (gk) y = [ ] g k Bk y = min g k, Bk ( y) i Odpověď B o je pak dána disjunkcí (model CCD) jednotlivých ořezaných hodnot B k (gk) B o y = B 1 (g1) y or B 2 (g2) y or... or B K (gk) y Způsob ořezání je nakreslen na Obr.9. Obr.9 Pro praktické využití odpovědi v systému řízení je nezbytné, aby fuzzy výstupní hodnota byla nějakou metodou transformována na obyčejné číslo. Tomuto postupu říkáme defuzzifikace; metody defuzzifikace budou uvedeny v kap.5.5. 32

Typy dotazů. Všimněme si blíže problematiky aktualizace jazykového modelu, zmíněné v kap.3.3. Při zadávání dotazu A D x je možno použít libovolné kombinace ze tří možných typů dotazů, jimiž jsou dotazy bodové, dotazy lingvistickou hodnotou a dotazy normální fuzzy množinou. 1. Dotaz bodový: (x j is x j 0 ), uvedený na Obr.11. Obr.11 Bodový dotaz je tvořen obyčejnou (crisp) hodnotou x j 0 vstupní nezávisle proměnné x j. Tento dotaz je typický pro dosazení hodnoty v on-line fuzzy systémech. Hodnota x j 0 však může být explicitně předepsaným způsobem fuzzifikována do formy trojúhelníkového fuzzy čísla asi x j 0 (fuzzy singleton), čímž dostaneme typ dotazu ad 3), viz dále. 2. Dotaz lingvistickou hodnotou: (x j is A j x j ), uvedený na Obr.12. Obr.12 Zde je jako dotaz vybrána přímo jedna z definovaných lingvistických hodnot příslušné vstupní nezávisle proměnné x j a je použita její funkce příslušnosti A j x j. Tento způsob dotazu je typický pro konverzační interaktivní off-line režim provozu fuzzy systému, kdy hodnotu zadává slovně operátor. 33