VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA STROJNÍHO INŽENÝRSTVÍ ÚSTAV MECHANIKY TĚLES, MECHATRONIKY A BIOMECHNIKY ŘÍZENÍ MECHATRONICKÝCH SOUSTAV

Transkript

1 VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA STROJNÍHO INŽENÝRSTVÍ ÚSTAV MECHANIKY TĚLES, MECHATRONIKY A BIOMECHNIKY ŘÍZENÍ MECHATRONICKÝCH SOUSTAV Doc. RNDr. Ing. Tomáš Březina, CSc, Doc. Ing. Vladislav Singule, CSc Ing. Pavel Houška Ing. Tomáš Marada Ing. Vít Ondroušek Ing. Jaroslav Pulchart Ing. Stanislav Věchet Ing. Milan Turek

2 Obsah 1 Úvod Co je měkké programování? Význam a využití měkkého programování Fuzzy logika Neuronové sítě Genetické algoritmy 5 2 Sekce A 6 Fuzzy řízení Cíle Základy fuzzy množin Klasické množiny Korespondence mezi teorií množin, Booleovou algebrou a výrokovým počtem Fuzzy množiny Lingvistické proměnné Operace s fuzzy množinami Inferenční pravidla Fuzzyfikace Defuzzyfikace Center of Maximum (těžiště singltonů) Centre of Gravity (těžiště plochy) Fuzzy regulátory Jednoduchý fuzzy regulátor typu PID Tvorba báze pravidel Seřízení jednoduchého fuzzy regulátoru Fuzzy Logic Toolbox 35

3 2.9.1 Návrh vlastností fuzzy regulátoru Implementace fuzzy regulátoru v SIMULINKu Závěr 46 Literatura 46 3 Sekce B 47 Modelování Dynamických Soustav Neuronovými Sítěmi Úvod Motivace Úvod do vícevrstvých sítí Identifikace soustavy neuronovými sítěmi Úvod do identifikace soustavy Výběr struktury modelu Experiment 81 Literatura 90 3

4 1 Úvod V dnešní době se můžeme setkat v řízení a regulaci s přístupy a principy, které nejsou založeny na klasických metodách, ale na nové vědní disciplíně nazývané Soft Computing (měkké programování). 1.1 Co je měkké programování? Měkké programování se liší od tradičního deterministického (tvrdého) programování (přístupu) v možnosti zpracování nepřesností, nejistoty a částečně (nepřesně) platných údajů. Příkladem reálného modelu měkkého programování je lidský mozek. Princip měkkého programování spočívá ve využití výše zmíněných vlastností k dosažení poddajnosti, robustnosti a nízkých nároků výpočetního systému. Základní výchozí myšlenky měkkého programování spojují tyto metody teorie měkkých výpočtů: fuzzy množiny, analýza komplexních systémů, měkká datová analýza a neuronové sítě. Nejdůležitějšími částmi měkkého programování jsou: - fuzzy logika, - neuronové sítě, - pravděpodobnostní usuzování. V měkkém programování se dále využívá následujících metod: - genetické algoritmy, - teorie chaosu - teorie strojového učení Měkké programování není směs těchto metod, ale spíše se jedná o symbiózu a přispívání každé metody k řešení daného problému v jeho doméně působnosti, tedy použité metody se vzájemně doplňují.

5 1.2 Význam a využití měkkého programování V mnoha případech je možné problém vyřešit mnohem efektivněji při současném využití příspěvků jednotlivých metod, než výlučným zpracováním pomocí metody jediné, kde uspokojivé řešení nemusí být nalezeno a bylo by potřebné speciálně vybírat metodu pro každý specifický problém zvlášť. Příkladem velmi efektivních metod jsou fuzzy-neuronové systémy. Jejich využití jako expertního systému lze najít ve spotřební elektronice (klimatizace, pračky, kopírky, videokamery ) i v průmyslových aplikacích Fuzzy logika Jedná se o rozšíření klasické teorie množin na fuzzy množiny. Teorie fuzzy množin spočívá v zavedení tzv. stupně příslušnosti prvku k množině, který může nabývat hodnot z intervalu 0,1 na rozdíl od klasické teorie množin, kdy každý prvek do množiny buď patří nebo nepatří. Fuzzy logika nám poskytuje jazyk s vlastní syntaxí a sémantikou, který nám umožňuje použití kvalitativně formulovaných zkušeností a znalostí o řešeném problému Neuronové sítě Jedná se o výpočetní struktury složené z matematických neuronů. Vlastnosti těchto neuronů jsou odvozeny od reálného (živého) neuronu v lidském mozku. Neuronové sítě mají schopnost se učit, ale potřebují k tomu učitele (některé typy neuronových sítí jsou i samoučící, např. Kohonenovy neuronové sítě) Genetické algoritmy Tyto realizují náhodné prohledávání prostoru podobně, jako v přírodě probíhá vývoj života. Provádíme tedy simulovanou evoluci v následujících krocích. 1. Vznik jedinců, tj. vytvoření první generace jedinců. 2. Selekce, křížení a mutace. Nová generace vzniká křížením a selekcí, při které vybíráme jedince, kteří jsou blíže k požadovanému řešení. Připouštíme i náhodnou mutaci jedinců při křížení. 3. Nahrazení dokonalejšími jedinci. Starší a generace slabších jedinců je nahrazena novou generaci dokonalejších jedinců. 5

6 2 Sekce A FUZZY ŘÍZENÍ 6

7 2.1 Cíle Cílem této publikace je seznámit studenty pouze s principy fuzzy řízení, a proto soustředíme následující výklad pouze na následující základní charakteristiky fuzzy přístupů. 1. Základy fuzzy množiny a lingvistické proměnné. 2. Operace s fuzzy množinami. 3. Vyhodnocování rozhodovacích pravidel - inferenční pravidla. 4. Přiřazení k výstupní fuzzy množině vhodnou ostrou hodnotu akční veličiny - defuzzyfikace. 5. Strukturu fuzzy řízení. 7

8 2.2 Základy fuzzy množin Klasické množiny Množiny budeme označovat velkými písmeny A, B,, kdežto jejich prvky malými písmeny a,b,. Výrok prvek a patří do množiny M se označuje a M. Symbolem U budeme označovat univerzální množinu, univerzum. Naopak prázdnou množinu, která neobsahuje žádný prvek, budeme označovat jako. Jestliže každý prvek množiny A je součastně prvkem množiny B, potom množina A je podmnožinou množiny B, tedy A B. Jestliže současně platí A Ba B C pak platí, že A= B. Jestliže platí, že A Ba součastně A B, potom Aje vlastní podmnožinou množiny B, tedy A B. Číslo, které udává počet prvků patřící do množiny A, nazýváme kardinalitou množiny A a označujeme jej A. Množinu všech podmnožin množiny A nazýváme potenční množinou množiny A a platí pro ni Ρ ( A) = 2 A. Množiny lze charakterizovat: výčtem prvků množiny M { x, x, x, x } =, pravidlem, kterému musí prvky vyhovovat, např. prvky x mají společnou vlastnost V ( x ) což { } označujeme jako ( ) xv x. 8

9 charakteristickou funkcí ( x ) µ, pro kterou platí M Obr : Příklad charakteristické funkce množiny µ ( x ) Příklad charakteristické funkce množiny kladná teplota je uveden na obr Prvek x v klasické teorii množin do množiny bud patří nebo nepatří, protože jeho charakteristická funkce nabývá hodnot 1 nebo 0. V tomto případě hovoříme o ostrých množinách, tedy o ostrém rozlišení při rozhodování o příslušnosti Korespondence mezi teorií množin, Booleovou algebrou a výrokovým počtem M Teorie množin Booleova algebra Výrokový počet P(X) B F(V) X 1 1 Ø 0 0 Tab.1 Korespondence mezi teorií množin, Booleovou algebrou a výrokovým počtem Dá se dokázat, že mezi teorii množin, výrokovým počtem a Booleovou algebrou existuje izomorfismus, viz tab.1. Charakteristická funkce interpretovaná jako pravdivostní hodnota výroku a patří do množiny A nám neponechává mnoho volnosti při zařazování prvku do množiny. V mnoha případech by nám ale pomohlo, kdybychom měli více pravdivostních hodnot, např. pravda, nepravda a nelze rozhodnout. Přiřadíme-li těmto pravdivostním hodnotám numerické hodnoty 1, 0 a 0.5, rozšíříme klasickou booleovskou logiku na 9

10 logiku tříhodnotovou. Základní axiomy pro (nejen) tříhodnotovou logiku jsou uvedeny v tab.2. Pomocí těchto vztahů můžeme nalézt pravdivostní hodnoty pro základní operace v libovolné vícehodnotové logice Fuzzy množiny a = 1 a a b = min ( ab, ), a b = max ( ab, ), a b = min( 1,1 + b a), a b = 1 a b. Tab.2 Základní vztahy pro vícehodnotovou logiku Velmi často jen těžko rozhodneme, do jaké množiny prvek patří a zařazení nemusí být vůbec jednoznačné. Záleží na kontextu, postoji uživatele, náladě, aplikaci apod. Na příklad množina Daleký : pro astronomii je daleký objekt vzdálený desítky miliónu světelných let. Daleký je tedy vágní pojem, který záleží na kontextu a nelze jej jednoznačně interpretovat. Použijeme-li u charakteristické funkce základní vztahy pro vícehodnotovou logiku, můžeme chápat hodnotu charakteristické funkce jako stupeň, s jakým daný prvek patří do příslušné µ x množiny A množiny. Označme charakteristickou funkci jako funkci příslušnosti ( ) definované na univerzu U. Funkce příslušnosti je tedy zobrazením charakterizující stupeň z intervalu 0,1, s jakým daný prvek patří do příslušné množiny. Hodnota 0 znamená, že prvek do množiny určitě nepatří, zatímco 1 znamená, že prvek do množiny určitě patří. Fuzzy množinu tedy můžeme zapsat (pro zdůraznění, že se jedná o fuzzy množinu, označujme ji vlnkou A, B,. ) jako µ ( x ) A A= x U Poznámka: Různé prameny uvádějí odlišné formy zápisu fuzzy množin, význam je ale zachován. x. Příklad fuzzy množiny malé číslo A charakterizované výčtem prvků: kde x = { 0,1,2,4,6,8,10} A = { 0, 0, 0.1, 0.2, 0.5, 1, 1 } , A 10

11 2.3 Lingvistické proměnné Pomocí fuzzy množin můžeme: Aproximovat libovolné spojité funkce Postupujeme podobně, jako bychom používali aproximátory založené na metodách nejmenších čtverců, kde provádíme aproximaci pomocí goniometrických polynomů. Zaznamenáváme informaci o hodnotě veličiny pomocí lingvistické proměnné, která bude vyjádřena nepřesným verbálním způsobem. Formalizovat znalosti, které jsou ve vágní jazykové formě Chceme-li využít empirických zkušeností obsluh, personálu a expertů, které jsou převážně tlumočeny ve slovní formě, musíme zavést lingvistické proměnné. Lingvistická proměnná je taková proměnná, jejíž hodnoty jsou výrazy nějakého jazyka. Hodnoty lingvistické proměnné můžeme interpretovat jako fuzzy množiny. Množina lingvistických hodnot se označuje jako množina termů, které jsou definovány na univerzu. Např. při regulaci teploty vody v bazénu můžeme teplotu chápat jako lingvistickou proměnnou s názvem teplota vody v bazénu. Jakou bude mít lingvistická proměnná hodnotu? Teplotu měříme v technické praxi ve stupních Celsia. Kvantitativní vyjádření teploty v hovorovém jazyce však nemusí být vyjádřeno jen stupni, ale běžně jsou užívány pro označení teploty výrazy jako: voda v bazénu je LEDOVÁ, STUDENÁ, VLAŽNÁ, HORKÁ atd. Jako hodnotu lingvistické proměnné teplotu vody v bazénu pak můžeme označit prvek z množiny teplot {ledová( L ), studená( S ), vlažná(v ), teplá(t ), horká( H ) }. Takto zavedená jazyková kvantifikace teplot představuje term, který označuje neostrou µ S x, kde x je hodnota množinu, pro kterou je možno definovat charakteristickou funkci ( ) teploty. Poznámka: U některých typů lingvistických proměnných musíme zadat všechny použité termy. Je-li lingvistických proměnných velké množství, snažíme se tvorbu termů algoritmizovat a následně je generovat pomocí generativní gramatiky. Jako příklad těchto funkcí uvádíme funkce příslušnosti neostrých množin studená a vlažná. Příslušnosti µ S ( x) a µ V ( x) jsou uvedeny na obr Univerzum U je chápáno jako množina všech teplot. Každý z termů studená a vlažná je definován funkcí příslušnosti na daném univerzu ve stupních Celsia. 11

12 Obr : Funkce příslušnosti µ S ( x) a µ V ( x) - Naměříme-li teplotu x= 20 C, pak µ ( x) = 0 do termu lingvistické hodnoty studená, S a jistě tato naměřená teplota nepatří - naměříme-li teplotu x 0 C =, pak µ ( x) = 0,5 S což indikuje, že tato naměřená teplota patří do termu lingvistické hodnoty studená stupněm příslušnosti 0.5, - naměříme-li teplotu x 10 C =, pak µ ( x) = 0.9 S a je zřejmé, že tato naměřená teplota patří do termu lingvistické hodnoty studená stupněm příslušnosti 0.9, - naměříme-li teplotu x 20 C =, pak µ ( x) = 1 termu lingvistické hodnoty studená se stupněm příslušnosti 1, - naměříme-li teplotu x 15 C S =+, pak je µ ( x) = 0.2 S a i tato naměřená teplota patří do a tato naměřená teplota patří do termu lingvistické hodnoty studená se stupněm příslušnosti 0.2. Ale pozor, funkce příslušnosti µ ( x) = 0.9, z čehož plyne, že tato naměřená teplota patří také V do množiny-termu vlažná se stupněm příslušnosti 0.9. Vidíme tedy, že S = V = { } { 0.2, 0.9, 0, 0, 0 }.,,,,, Proces přiřazování měřených hodnot vstupních veličin do fuzzy množin pomocí funkcí příslušností se označuje jako fuzzyfikace (viz. podkapitola 2.6.). Pro regulační úlohy se používají standardní funkce příslušnosti: A -funkce (funkce trojúhelníková), L -funkce (viz obr ), Π -funkce (funkce lichoběžníková), Γ -funkce, S -funkce a Z -funkce. Dále se v textu omezíme na funkce složené z lineárních úseků. Pro označování hodnot lingvistických proměnných se též používají standardní označení, uvedené v tab.3. 12

13 Význam Hodnota velká záporná Hodnota střední záporná Hodnota malá záporná Hodnota záporná blízká nule Hodnota nulová Hodnota kladná blízká nule Hodnota malá kladná Hodnota střední kladná Hodnota velká kladná označení ZV ZS ZM ZN NU KN KM KS KV Příklady dalších lingvistických proměnných Tab.3 Lingvistické termy Lingvistická proměnná Úhel Vzdálenost Otevření ventilu Tepelný výkon Teplota Regulační odchylka Přírůstek regulační odchylky Označení lingvistické hodnoty - termy záporný, nulový, kladný nulová, blízká, střední, veliká, obrovská NU, KN, KM, KS, KV ZV, ZS, NU, KS, KV ZV, ZS, ZM, NU, KM, KS, KV ZV, ZS, ZM, ZN, NU, KN, KM, KS, KV záporný (Z), kladný (K) Pro lingvistické proměnné Úhel, Otevření ventilu, Regulační odchylka a Přírůstek regulační odchylky jsou na obr , 2.3.3, 2.3.4, zobrazeny funkce příslušnosti pro jejich lingvistické hodnoty - termy. 13

14 Obr : Funkce příslušnosti proměnné Otevření ventilu a její hodnoty (termy) Obr : Funkce příslušnosti proměnné Úhel a její hodnoty (termy) Obr : Funkce příslušnosti proměnné Regulační odchylka a její hodnoty (termy). Obr : Funkce příslušnosti proměnné Přírůstek regulační odchylky a jeho hodnoty (termy). 14

15 2.4 Operace s fuzzy množinami Fuzzy množiny jsou zobecněním klasických ostrých množin. Využijeme tedy vztahy z vícehodnotové logiky (viz. tab.2) a uvedeme jen základní operace a tvrzení pro práci s fuzzy množinami. Poznámka: Existují i některá tvrzení, které nemusí platit pro každou fuzzy množinu. Např. De Morganovy zákony, nebo dvojitá negace, tj. A= A, nemusí platit pro zobecněný fuzzy komplement. Operátory fuzzy logiky jsou následující. Fuzzy komplement (doplněk množiny A ) ( ) ( ) µ A x = 1 µ A x, x U. Fuzzy průnik množin A B : { } ( ) ( ) ( ) A ( ): A µ x = min µ x, µ x, x U. A B A B Fuzzy sjednocení množin A B : { } ( ) ( ) ( ) µ A B x = max µ A x, µ B x, x U. Fuzzy rozdíl množin A B= A B. Fuzzy symetrická diference A+ B= ( A B) ( B A) Operace fuzzy průnik, sjednocení a komplement jsou uvedeny na obr Platí následující tvrzení. Komutativní A B= B AA, B= B A. Asociativní ( A B) C = A ( B C) ( A B) C = A ( B C) Distributivní ( A B) C = ( A C) ( B C) ( A B) C = ( A C) ( B C) Některé další operace s fuzzy množinami jsou následující. Operace algebraický součet a součin, omezený součet a omezená diference.,.,.. 15

16 Obr : Operace s fuzzy množinami: průnik, sjednocení a komplement 16

17 2.5 Inferenční pravidla Dále se již budeme zabývat aplikací fuzzy množin pro řízení. Obecně je logické ovládání a řízení založeno na vyhodnocování rozhodovacích pravidel ve formě JESTLIŽE platí podmínka, PAK. Pro fuzzy ovládání a řízení je podmínka vyjádřena formou implikace dvou fuzzy výroků, většinou jako: JESTLIŽE <fuzzy výrok>, PAK <fuzzy výrok>, Eventuálně v anglické formě IF <fuzzy výrok>, THEN <fuzzy výrok>. Tato podmínka je označována jako produkční pravidlo. První fuzzy výroková množina je podmínka (ancedent), mívá často formu složeného výroku, vázaného logickými spojkami. Druhý fuzzy výrok odpovídá důsledku (konsekvent) (např. vykonání činnosti, platnost určitého fuzzy výroku ). Příklad jednorozměrné závislosti. Jestliže je regulační odchylka kladná, pak akční zásah bude též kladný IF < e. kladný>, THEN <u. kladný>. Ancedent je lingvistická proměnná e (regulační odchylka) a její hodnota je kladná (fuzzy e. Konsekvent obsahuje lingvistickou proměnnou množina ) s funkcí příslušnosti K ( ) K µ (akční veličinu) u s hodnotou kladná a její funkce příslušnosti je ( u ) na obr µ K, což je znázorněno Obr : Mamdaniho implikace na jednorozměrné závislost. Změříme-li hodnotu regulační odchylky e 0, pak můžeme v obr pomocí funkce e odečíst stupeň příslušnosti α, s jakým změřená hodnota přísluší k příslušnosti ( ) µ K množině hodnot e kladná (fuzzy množina K ). Úkolem regulace je však nalézt pro regulační odchylku odpovídající fuzzy množinu konsekventu. Nejčastějším postupem pro určení této množiny vychází z logického předpokladu, že důsledek může mít maximálně stupeň ten příslušnosti, který má podmínka (Mandaniho implikace). Stupeň příslušnosti naměřené hodnoty regulační odchylky e 0 tedy určuje hladinu, * µ K u. která nám ořízne výstupní fuzzy množinu. Funkce příslušnosti konsekventu pak je ( ) 17

18 Ukažme si nyní pravidlo používané v PI regulátoru. IF < e je velká záporná> AND < ė je kladné> THEN <u je kladné>. Zobecníme tento případ na dvourozměrnou závislost Pravidlo IF < x je velká záporná> AND < y je kladné střední> THEN <u je kladné střední>, vyjadřuje Mamdaniho a Larsenova implikace. Je možno ukázat celou řadu implikací (Zadehova, Stochastická, Gougenova, [1]), ale z hlediska ovládání a řízení jsou nejdůležitější Mamdaniho implikace, které definují funkci příslušnosti konsekventu jako { } ( xy, ) = min ( x), ( y) µ µ µ RC A B Minimalizací se vyjadřuje skutečnost, že důsledek (konsekvent) může mít maximálně takový stupeň příslušnosti, jako má podmínka (ancedent). Poznámka: Dále v textu použijeme i Larsenovu implikaci, a proto je třeba také uvést její funkci příslušnosti, tedy ( xy, ) = ( x) ( y) µ µ µ RL A B Nalezení výstupních množin pro dvourozměrnou závislost a jedno rozhodovací pravidlo vychází z toho, že překrývají-li se pravidla, pak každé pravidlo v ancedentu vygeneruje svou individuální výstupní fuzzy množinu, a tyto množiny se také překrývají. Dále vybíráme podle Mamdaniho minimum (operátor AND). Ukažme interpretaci tohoto pravidla na výše zmíněném pravidlu. Nalezení výstupní množiny pro jedno pravidlo a dvourozměrnou závislost je znázorněnona obr Použitím Mamdaniho implikace obdržíme funkci příslušnosti konsekventu jako minimum z ancedentu. To znamená oříznutí funkce příslušnosti konsekventu na hladině α, která odpovídá minimu ze stupňů příslušnosti pro obě vstupní ostré hodnoty x 0 a y 0, tedy ( x ) ( y ) min ( x ), ( y ). { } α = µ µ = µ µ Pro funkci příslušnosti konsekventu pak obdržíme ZV 0 KS 0 ZV 0 KS 0 ( u) = ( u) = ( u) * µ α µ min αµ,. { } KS ZS ZS Je-li použit operátor OR, pak vybíráme maximum z odpovídajících funkcí příslušnosti - viz. obr Oříznutí funkce příslušnosti konsekventu je provedeno na hladině β, která odpovídá maximu z obou funkcí příslušnosti vstupních hodnot... 18

19 Obr : Nalezení výstupní fuzzy množiny pro jedno pravidlo a dvourozměrnou závislost operátorem AND Obr : Nalezení výstupní fuzzy množiny pro jedno pravidlo a dvourozměrnou závislost operátorem OR Nalezení výstupní množiny pro dvě pravidla a dvourozměrnou závislost a Mamdaniho implikaci je zobrazeno na obr Rozhodovací pravidla mají nyní tvar IF <x.km> AND <y.km> THEN <u.km> ELSE IF <x.ks> AND <y.km> THEN <u.ks> Pro obě rozhodovací pravidla jsou určeny funkce příslušnosti dvou výstupních lingvistických proměnných, pro které platí: α = µ ( x) µ ( y) = min{ µ ( x) µ ( y)}, 1 α = µ ( x) µ ( y) = min{ µ ( x) µ ( y)}. 2 KM KM KM KM KS KM KS KM Pro konsekventy obou implikací dostaneme, že * µ ( u) = α µ ( u) = min{ α, µ ( u)}, KM 1 KM 1 KM * µ ( u) = α µ ( u) = min{ α, µ ( u)}. KS 2 KS 2 KS Konsekventy obou implikací * ( u ) a * ( u ) určují jejich dílčí podíly na velikosti akční µ KS µ KM veličiny u. Spojku ELSE (jinak) interpretujeme jako logický součet a poté pro výstupní fuzzy množinu obou účinků dostaneme, že { { α1 ( )} { α2 ( )}} * m ( u) = max min, m u,min, m u. C KM KS Toto pravidlo je možno rozšířit na libovolný počet rozhodovacích pravidel. 19

20 Obr : Nalezení výstupní množiny pro dvě pravidla a dvourozměrnou závislost Můžeme také použít Larsenovy implikace; pak výstupní množina pro dvě rozhodovací pravidla nebude oříznuta hladinami α a β, ale bude vynásobena těmito hladinami jak je vidět na obr Obr : Inference s použitím Larsenovy implikace Pro dvourozměrnou funkční závislost lingvistických proměnných x, y tvoří inferenční pravidla dvojice, které patří do množiny A B, která je dána kartézským součinem {(, ), } P= xy x Ay B 20

21 Počet pravidel pro dvě fuzzy veličiny (dvourozměrná závislost: regulační odchylka e a změna regulační odchylky e ) vysvětlíme následovně. Regulační odchylka e má 5 lingvistických hodnot-termů (ZV, ZS, NU, KS,KV). Změna regulační odchylky ė má 3 lingvistické hodnoty-termy (Z, NU, K). Protože regulační odchylka e je fuzzyfikována pěti termy a změna regulační odchylky ė má tři termy, je celkový počet pravidel P = 53 = 15, viz obr až Pro počet pravidel tedy platí, že P = n m, kde m a n je počet termů fuzzy množin. Změna akční veličiny u má 5 lingvistických hodnot-termů (ZV, ZS, NU, KS, KV) ė e ZV ZS NU KS KV Z ZV ZV ZS NU KS NU ZV ZS NU KS KV K ZS NU KS KV KV Tab.5 Báze pravidel Při praktickém využití fuzzy aproximací a jejich vlastností pro ovládání a řízení je třeba provést následující kroky: 1. Získat měřením vstupní veličiny. 2. Normalizovat změřené veličiny na použitá univerza. 3. Převést vstupní ostrá data na fuzzy data. 4. Nalézt výstupní fuzzy množinu. 5. Přiřadit (nalézt) k výstupní množině vhodnou ostrou hodnotu akční veličiny. Krok 1 je problémem měření a nebudeme ho podrobněji diskutovat. Krok 2 je většinou označován jako normalizace. Problém normalizace spočívá v transformaci proměnných, jejichž hodnoty se pohybují v různých rozsazích tak, aby všechny nabývaly hodnot z jistého normalizovaného univerza, např. z intervalu [-1,1]. Krok 3 je nazýván fuzzyfikací a spočívá v tom, že se každé ostře naměřené hodnotě přiřadí stupeň příslušnosti do jedné nebo více fuzzy množin, viz. podkapitola 2.6. Krok 4 je podrobně rozebrán v této kapitole. Krok 5 se nazývá defuzzyfikací a jeho podstatou je přiřadit výstupní fuzzy množině odpovídající ostrou výstupní hodnotu, viz podkapitola

22 2.6 Fuzzyfikace Při fuzzyfikaci se každé ostře naměřené hodnotě z normalizovaného univerza přiřadí stupeň příslušnosti do jedné nebo více fuzzy množin, které odpovídají významu základních termů použitých v pravidlech. Proto je nutné beze zbytku pokrýt normalizované univerzum nosiči příslušných fuzzy množin. To znamená, že provedeme rozklad univerza na jednotlivé nosiče a následně pak převedeme ostrá data na fuzzy data. K úspěšnému provedení tohoto kroku je zapotřebí stanovit tvar odpovídajících funkcí příslušnosti. Funkce příslušnosti je často možné definovat předem, nebo je odhadnout z dat. K tomuto účelu bylo odvozeno několik metod a podívejme se nyní na některé z nich. Fuzzy množiny odpovídající jednotlivým termům vstupních a stavových veličin budeme nazývat primárními fuzzy množinami. Pokrytí univerza nosiči jednotlivých fuzzy množin musí být takové, aby jejich sjednocení nejen pokrylo celé univerzum beze zbytku, ale aby ani jeden bod neměl stupeň příslušnosti 0. Proto pro žádný prvek univerza není funkce příslušnosti menší, než jisté ε. To znamená, že funkce příslušnosti se protínají v úrovních ε, a hovoříme o ε pokrytí. Tato vlastnost zaručuje, že vždy existuje alespoň jedno dominantní pravidlo. V jistých případech jsou aktivována dvě pravidla pro stejnou ostrou hodnotu se stupněm příslušnosti µ = ε. Hodnota ε se volí alespoň 0,5. Jedním ze základních problémů je volba počtu fuzzy množin. V minulosti bylo uveřejněno odborníky z oblasti psychologie, umělé inteligence atd několik studií, rozebírajících tento problém z různých úhlů pohledu. Z těchto prací vyplývá, že je ve většině případů vhodné volit nejméně 3 a nejvíce 7 primárních fuzzy množin. Při tom tam, kde jsme schopni přesněji rozlišovat počet úrovní, bychom měli volit větší počet fuzzy množin a naopak. Když jsme nyní vyřešili problém počtu základních fuzzy množin, musíme ještě nalézt odpověď na otázku, jakého tvaru jsou funkce příslušnosti těchto fuzzy množin. Pro mnohé úlohy je možné zvolit tvar a priori. Mnohé úlohy řízení a většinu příkladů aplikace fuzzy množin řešíme právě pomocí předem zvolených funkcí příslušnosti. Jinou možností při určování tvaru funkce příslušnosti je odhad funkce příslušnosti na základě naměřených dat. 22

23 Pokud můžeme zvolit tvar funkce příslušnosti, snažíme se zvolit tvar co nejjednodušší, často složený pouze z lineárních úseků. Sem patří např.: a) L funkce b) funkce trojúhelníkové ( Λ funkce ) c) funkce lichoběžníkové ( Π funkce ) d) Γ funkce e) S funkce 1 x < α Lx (, αβ, ) =( α x)/( β x) α x β; 0 x > β 0 x < α ( α x)/( β x) α x β Λ ( x, αβγ,, ) = ; ( α x)/( β α) β x γ 0 x > γ 0 x < α ( x α)/( β α) α x < β Π ( x, αβγδ,,, ) =1 β x γ ; ( γ x)/( δ γ) γ < x δ 0 x > δ 1 x < α Γ ( x, αβ, ) =( x α)/( β α) α x β; 0 x > β 0 x < α 2 2(( x α)/( γ α)) α < x β Sx (, αβγ,, ) = (( x γ)/( γ α)) β < x γ 1 x > γ V případě, že budeme tvar funkce příslušnosti odhadovat z naměřených dat, je možné použít některou z mnoha metod tzv. expertních odhadů. Rovněž se nabízí využití algoritmů jako fuzzy ISODATA či fuzzy C-means, které byly modifikovány pro práci s fuzzy množinami. 23

24 Obr : L funkce Obr : Λ funkce Obr : Π funkce Obr : Γ funkce Obr : S funkce 24

25 2.7 Defuzzyfikace Výsledkem činnosti bloku rozhodovacích pravidel je soubor funkcí příslušnosti pro jednotlivé termy výstupních lingvistických proměnných. Funkce příslušnosti výstupní množiny je dána sjednocením oříznutých (Mamdaniho implikace) nebo zmenšených (Larsenova implikace) funkcí příslušnosti, viz. obr a Pro praktické provedení akčních zásahů je třeba přiřadit výstupním lingvistickým proměnným ostrou hodnotu akční veličiny v přípustném rozsahu. Tento proces aproximace neostrých termů ostrou hodnotou akční veličiny se nazývá defuzzyfikace. Existuje celá řada metod defuzzyfikace. Poznamenejme, že většina metod nabízí ad hoc řešení, opírající se o empirické ověření, vycházející často z heuristik. Teprve v poslední době bylo pro některé z těchto metod nalezeno teoretické zdůvodnění. Obr : Funkce příslušnosti pro jednotlivé termy výstupních lingvistických proměnných Při volbě metody defuzzyfikace můžeme zvolit buď metody, které hodnotu akční veličiny určí výpočtem jako nejlepší kompromis (metody těžiště), nebo metody hledající přijatelné řešení (metody nejvýznamnějšího maxima). Přijatelné řešení: METODA NEJVÝZNAMNĚJŠÍHO MAXIMA U metod tohoto typu hledáme tzv. přijatelné řešení, které vyhovuje podmínkám daným v rozhodovacích pravidlech. Ze všech termů vybereme term s největší hodnotou funkce příslušnosti a nalezneme maximální hodnotu funkce příslušnosti. Tato maximální hodnota pak svým umístěním (v závislosti na zvolené metodě) určí ostrou hodnotu výstupní veličiny. Mezi tyto metody patří: a) Left of Maximum (LoM) - výsledkem je nejvíce vlevo položená hodnota z největší hodnoty funkce příslušnosti, 25

26 b) Mean of Maximum (MoM) - výsledkem je ve středu položená hodnota největší hodnoty funkce příslušnosti, c) Right of Maximum (RoM) - výsledkem je nejvíce vpravo položená hodnota z největší hodnoty funkce příslušnosti Na obr je uveden příklad určení akční veličiny u vys metodou Left of Maximum. Protože se hledá jen maximum, vyznačují se tyto metody vysokou výpočetní rychlostí. Naproti tomu jejich nevýhodou je, že akční veličina se může měnit nespojitě. Nejlepší kompromis: METODY TĚŽIŠTĚ Metody těžiště určí z průběhů výstupních termů ostrou výstupní proměnnou jako jejich těžiště. Existují dva základní přístupy "Center of Maximum" a "Center of Gravity" Center of Maximum (těžiště singltonů) Funkční závislosti jednotlivých termů nahradíme jejich typickými hodnotami a hledáme jejich těžiště. Funkci příslušnosti můžeme aproximovat Diracovým impulsem s vahou, kterou označujeme jako "typickou hodnotu". Poloha Diracova impulsu pro funkci příslušnosti typu Lambda funkce je ve vrcholu trojúhelníka, a pro funkci příslušnosti typu Π funkce je uprostřed úseku. V některých případech je možno umístit Diracův impuls do těžiště plochy pod funkcí příslušnosti. Vlastní váha je typická hodnota, která může býti dána koeficientem oříznutí (násobení) α nebo β. Metoda "Center of Maximum" nahrazuje funkční závislost každého výstupního termu jeho typickou hodnotou a ostrou výstupní veličinu u výs určí jako jejich těžiště - viz. obr Obr : Výpočet akční veličiny metodou Center of Maximum 26

27 Vidíme, že u výs = r α u k k = 1 r k = 1 α k k, kde u výs je výsledná hodnota výstupní veličiny, α k je hodnota příslušnosti k-tého termu, u k je souřadnice výstupní veličiny k-tého termu Centre of Gravity (těžiště plochy) Hledáme těžiště plochy funkce příslušnosti výstupní veličiny. Výslednou hodnotu akční veličiny u výs určíme jako souřadnici těžiště plochy vzniklé sjednocením dílčích ploch, které jsou určeny ohraničením funkcí výstupních termů s nenulovými hodnotami funkce příslušnosti - viz obr Výstupní hodnota akční veličiny se určí ze vztahu u výs = * η( u) i udu, * µ ( udu ) kde µ ( u) je průběh funkce příslušnosti výsledné plochy. Pro defuzzyfikaci je možno použít ještě celou řadu metod, kterými se již nebudeme podrobněji zabývat. Jedná se o např.o COS (Center of Sums), FOM(First of Maxima), HM (Height Method) atd. Je zřejmé, že každá metoda poskytuje mírně odlišné defuzzyfikované výstupy. Použitou metodu proto vždy volíme s ohledem na druh aplikace. 27

28 Obr : Výpočet akční veličiny metodou Center of Gravity 28

29 2.8 Fuzzy regulátory Nyní když již dokážeme lingvistickou aproximací, tedy fuzzyfikací a defuzzyfikací aproximovat libovolnou spojitou jednorozměrnou či vícerozměrnou funkci, se nabízí možnost využít této aproximace pro konstrukci regulátorů. Jako první se o konstrukci fuzzy regulátoru úspěšně pokusili prof. E. Mandami a dr. S. Assilian na univerzitě v Londýně. Problémy s popisem nelineárního systému je přivedli na myšlenku aproximovat charakteristiky regulátoru pomocí Zadehových pravidel IF-THEN a fuzzy množin. Zjistili, že stačí jen malé množství pravidel k úspěšnému řízení modelu parního stroje, a že regulátor s fuzzy řídicím členem má lepší dynamické vlastnosti, než při použití klasického PI nebo PD regulátoru. Jimi použitá struktura fuzzy regulátoru se stala základem pro konstrukci fuzzy P, PI, PD a PID regulátorů a je v současné době nejvíce používána. Charakteristickým znakem fuzzy řízení je možnost bezprostředního použití empirických znalostí člověka - operátora o řízeném procesu, které označujeme jako bázi znalostí. Báze znalostí tvoří: a) informace o stacionárních stavech, intervalech ve kterých se pohybují hodnoty vstupních a výstupních veličin, jejich mezní hodnoty, atd. Rozšíříme-li tato data o funkce příslušnosti všech vstupních a výstupních fuzzy množin (jak bude vysvětleno později), pak se všechny tyto informace o procesu v bázi znalostí označují jako báze dat; b) kvantitativně formulované zkušenosti včetně slovně definované strategie řízení, pomocí kterých je možno realizovat řízení, tj. generovat akční veličinu. Tyto zkušeností získané strategie řízení označujeme jako bázi pravidel. Struktura fuzzy regulátoru je nakreslena na obr Jeho ústřední člen tvoří tři základní bloky: fuzzyfikace F, inference I a blok defuzzyfikace D. V bloku fuzzyfikace se převádí ostrá data, která jsou naměřena nebo zadána, na fuzzy data. Bloku fuzzyfikace může předcházet blok normalizace, kde se fyzikální hodnoty naměřených či zadaných hodnot převedou na normalizovanou množinu - univerzum. V bloku inference, který tvoří ústřední část regulátoru, se realizuje inferenční mechanismus z rozhodovacích pravidel, pomocí kterého získáváme ze vstupních fuzzy množin výstupní množiny. Blok defuzzyfikace umožňuje přiřadit výstupní fuzzy množině určitou ostrou výstupní veličinu. Za blokem defuzzyfikace může následovat blok denormalizace, kde se provede denormalizace výstupní veličiny, tedy přepočet na fyzikální výstupní veličiny. 29

30 Obr : Základní struktura fuzzy regulátoru Jednoduchý fuzzy regulátor typu PID Výstup číslicového PI regulátoru v přírůstkovém tvaru, který zajišťuje nulovou regulační odchylku, lze vyjádřit takto: uk ( ) = uk ( 1) + uk ( ), uk ( ) = qek ( ) + qek ( 1). 0 1 Výstup číslicového PD regulátoru, který ovšem nezajišťuje nulovou regulační odchylku, lze vyjádřit ve tvaru: uk ( ) = Kek ( ) + K ek ( ). p Hovoříme-li o jednoduchém fuzzy regulátoru a chceme-li ho porovnávat s PI regulátorem nebo s PD regulátorem, je vstupem těchto regulátorů ek ( ) a ek ( ). Výstup je pak nelineární funkcí, která závisí na fuzzyfikaci, inferenci a defuzzyfikaci. Proto pro fuzzy regulátor typu PI bude platit, že uk ( ) = F (( ek), ek ( )); uk ( ) = uk ( 1) + uk ( ). PI Fuzzy regulátor typu PD dostaneme jako nelineární funkci ve tvaru uk ( ) = F (( ek), ek ( )). Struktura fuzzy regulátoru typu PI a PD je znázorněna na obr a PD D 30

31 Obr : Struktura jednoduchého fuzzy regulátorů typu PI Obr : Struktura jednoduchého fuzzy regulátorů typu PD Jednoduchý fuzzy regulátor s vlastnostmi PI a PD regulátoru vytvoříme nejjednodušším způsobem tak, že tyto dva regulátory paralelně propojíme Tvorba báze pravidel Bázi pravidel je možno vytvořit: a) na základě empirických znalostí obsluhy, b) na základě obecně platných metapravidel. Praxe ukázala, že pro jednoduchý fuzzy regulátor typu PI a PD je možno odvodit bázi pravidel pomocí následujících tří základních metapravidel: MP1: Jestliže regulační odchylka ek ( ) a její změna ek ( ) jsou nulové nebo blízké nule, pak by měl být přírůstek akční veličiny uk ( ) akční zásah - nulový nebo blízký nule. MP2: Jestliže regulační odchylka ek ( ) klesá k nule nebo se blíží nule s dostačující rychlostí, pak je vhodné neměnit akční veličinu. MP3: Jestliže se regulační odchylka ek ( ) nekoriguje sama, potom je třeba akční veličinu změnit a akční zásah uk ( ) bude nenulový. Jeho velikost a znaménko závisí na znaménku a velikosti regulační odchylky ek ( ) a velikosti její změny ek ( ). 31

32 Podle těchto metapravidel byla pro lingvistické proměnné a jejich hodnoty (termy) sestavena báze pravidel lingvistické proměnné a jejich hodnoty (termy) sestavena báze pravidel jednoduchého fuzzy regulátoru typu PI (odstraňuje trvalou regulační odchylku), která je uvedena v tab. č.6. Regulační odchylka e { Z, N, K } Změna regulační odchylky Akční zásah e { Z, N, K } u { Z, N, K } e e Z N K Z Z Z N N Z N K K N K K Tab.6: Báze pravidel pro PI fuzzy regulátor V bázi pravidel je možno rozlišit celkem pět následujících skupin pravidel. Skupina 1 Tato skupina pravidel se použije tehdy, jestliže regulační odchylka ek ( ) a její změna ek ( ) je nulová nebo blízká nule. Znamená to, že regulovaná soustava je v ustáleném stavu nebo v jeho blízkosti. Akční veličina se nemá měnit, čili změna akční veličiny je nulová nebo blízká nule. Skupina 2 Pro aplikaci pravidel této skupiny platí, že regulační odchylka ek ( ) je záporná (velká nebo střední) a její změna ek ( ) je kladná nebo blízká nule. Důsledkem toho je, že regulační odchylka ek ( ) se zmenšuje nebo se nemění. Akční zásah má zrychlit nebo zpomalit přibližování k ustálené hodnotě. Skupina 3 Pro tuto skupinu platí, že regulační odchylka ek ( ) je kladná (blízká nule, střední, veliká). Změna ek ( ) je kladná velká nebo střední, což znamená, že regulovaná veličina se bude vzdalovat od žádané hodnoty - ustáleného stavu. Kladnou změnou akční veličiny uk ( ) je třeba zajistit přibližování k ustálenému stavu. 32

33 Skupina 4 Pro aplikaci pravidel této skupiny je charakteristické, že regulační odchylka ek ( ) je kladná (velká nebo střední) a její změna ek ( ) je záporná nebo nulová. To znamená, že regulační odchylka ek ( ) se zmenšuje nebo se nemění. (Porovnej se skupinou 2) Akční zásah má zrychlit nebo zpomalit přibližování k ustálené hodnotě. Skupina 5 Pro tuto skupinu platí, že regulační odchylka ek ( ) je záporná (blízká nule, střední, veliká). Změna ek ( ) je záporná velká nebo střední. To znamená, že regulovaná veličina se bude vzdalovat od žádané hodnoty - ustáleného stavu. (Porovnej se skupinou 3) Zápornou změnou akční veličiny uk ( ) je třeba zajistit přibližování k ustálenému stavu. Báze pravidel většiny jednoduchých fuzzy regulátorů vychází z výše uvedených pěti skupin pravidel. Báze pravidel lze snadno modifikovat pro jiný počet termů regulační odchylky a její změny, viz. příklad Tab.č.7. Průběh regulačního pochodu závisí nejen na bází pravidel, ale také na tvaru funkcí příslušnosti a zvolené metodě defuzzyfikace. V případě, že průběhy regulačních pochodů nevyhovují zcela našim požadavkům, je třeba hledat nová rozhodovací pravidla, použít jiných metod defuzzyfikace a nebo upravit vhodně funkce příslušnosti. NB NB NB NB NM NS Z NB NB NB NM NS Z PS NB NB NM NS Z PS PM NB NM NS Z PS PM PB NM NS Z PS PM PB PB NS Z PS PM PB PB PB Z PS PM PB PB PB PB Tab.7. Regulační odchylka e{ NB, NM, NS, Z, PS, PM, PB } ; Změna regulační odchylky e{ NB, NM, NS, Z, PS, PM, PB} ; Akční zásah u{ NB, NM, NS, Z, PS, PM, PB} 33

34 2.8.3 Seřízení jednoduchého fuzzy regulátoru Odezvy regulačních obvodů s fuzzy regulátorem závisí na bázi rozhodovacích pravidel a na bázi dat. Součástí projektu fuzzy regulátoru je získání či vytvoření báze rozhodovacích pravidel, zadání funkcí příslušnosti pro jednotlivé vstupní a výstupní proměnné včetně volby metod fuzzyfikace a defuzzyfikace. Vlastní implementace těchto bázových znalostí pro daný řídící systém nebo produkt se realizuje softwarově. Vynikající podporu poskytuje modul Matlab Toolbox resp. Fuzzy ToolBox - viz podkapitola 2.9. Je zřejmé, že na dynamiku regulačních pochodů má vliv celá řada parametrů, jejichž účinky na dynamiku soustavy lze jen těžko odhadnout. Z těchto důvodů je nastavení všech hledaných parametrů velmi obtížné. Omezíme se proto na nastavování fuzzy regulátoru pomocí měřítek univerza, v anglické literatuře se hovoří o tzv. "Tuning via scaling universes". Princip metody je velmi jednoduchý. Spočívá ve vážení, tj. vstupní i výstupní proměnné fuzzy regulátoru se násobí konstantou - viz obr Pomocí vah na vstupu K a K měníme měřítka univerza na vstupu a pomocí zesílení K u měníme měřítka na výstupu - akční veličiny. Pokud nedosáhneme požadovaných průběhů regulačních pochodů, je nutno použít jiných postupů, což přesahuje rámec této publikace. e de Obr Struktura fuzzy regulátorů s vahami pro seřízení regulátoru 34

35 2.9 Fuzzy Logic Toolbox Pro návrh fuzzy regulátoru v MATLABu slouží Fuzzy Logic Toolbox. Vlastní simulační výpočty včetně reálných měření s využitím fuzzy regulátoru se provádí v SIMULINKu. Jedním z možných případů, kdy je možné fuzzy regulátor použít, je řízení natočení kol robotu. Úkolem je vytvořit regulátor, který na základě odchylky od požadovaného směru jízdy a rychlosti nastaví optimální natočení kol. Problém je v tom, že neexistují rovnice, které by popisovaly závislost optimálního natočení kol na základě uvedených hodnot. Jediné co je známo, jsou obecná pravidla typu: pokud je odchylka od požadovaného směru velká, je třeba velké natočení kol, ale jen při malé rychlosti, jinak hrozí převrácení robotu atd. Na základě takto vyjádřených údajů je vytvoření klasického regulátoru velmi obtížné, ne-li dokonce nemožné, ale pro vytvoření fuzzy regulátoru tyto údaje zcela postačují Návrh vlastností fuzzy regulátoru Předtím, než je možné fuzzy regulátor použít v SIMULINKu, je nutné definovat jeho chování. To je možné provést buď z příkazového řádku, nebo pomocí interaktivního grafického prostředí Graphical User Interface (GUI). Musí se nadefinovat vstupní a výstupní proměnné, jejich rozsahy, funkce příslušnosti, inferenční a rozhodovací pravidla a metody fuzzyfikace a defuzzyfikace. Pro tyto požadavky můžeme vyjádřit strukturu fuzzy regulátoru blokově dle obr Tuto strukturu v souladu s Fuzzy Logic Toolboxem budeme označovat jako inferenční fuzzy systém (FIS - Fuzzy Inference System). Obr : Inferenční fuzzy systém (FIS Fuzzy Inference Systém) Grafické uživatelské prostředí GUI obsahuje nástroje pro vytvoření, editaci a zobrazování inferenčního fuzzy systému (FIS). Inferenční fuzzy systém (FIS) zahrnuje všechny procesy od definování vstupů až po definování výstupů regulátoru. 35

36 FIS tvoří tři editory a dvě zobrazení. FIS Editor Membership Function Editor Rule Editor Rule Viewer Surface Viewer (editor inferenčního systému fuzzy regulátoru) definování počtu vstupů a výstupů a jejich pojmenování. (editor funkcí příslušnosti) definování funkcí příslušnosti vstupních a výstupních hodnot. (editor pravidel) definování inferenčních pravidel. (grafické zobrazení pravidel) grafické zobrazení pravidel a konkrétní hodnoty výstupu pro konkrétní hodnoty vstupu. (grafické zobrazení plochy akčních zásahů) zobrazení závislosti výstupu na vstupech FIS Editor FIS Editor se spustí napsáním příkazu: Fuzzy Spuštění FIS Editoru a současné nahrání uloženého FIS se provede napsáním příkazu: Fuzzy <jmeno_souboru> Nahrát uložený FIS je také možné z menu FIS Editoru. Hlavní menu FIS Editoru obsahuje tři položky. File, Edit, View, které obsahuje položky umožňující vytváření nového FIS, ukládání FIS, načítání FIS, tisk a ukončení FIS Editoru. které obsahuje položky vrácení posledního kroku, přidání vstupních a výstupních proměnných, smazání proměnných, spuštění Membership Function Editoru a Rule Editoru. ze kterého je možné zobrazit Rule Viewer a Surface Viewer. V grafickém okně existují tři typy bloků vstupní proměnné, typ inference a výstupní proměnné. Levá dolní část okna slouží k zadání způsobu výpočtu metod AND, OR, atd. V pravé části se zobrazují parametry jednotlivých proměnných a je možné zde proměnné přejmenovat. Jsou-li spojovací linky mezi bloky vyznačeny čárkovanou čarou, pak nejsou jednotlivé bloky parametrizovány nebo parametrizace není správně ukončena a tento blok není možné zapojit a spustit. Dvojím kliknutím na vybranou vstupní proměnnou reprezentovanou obrázkem je možno přejít do Membership Function Editoru (editoru funkcí příslušnosti). Dvojím kliknutím na typ inference reprezentované obrázkem je možno přejít do Rule Editoru (editoru rozhodovacích pravidel). 36

37 Dvojím kliknutím na vybranou výstupní proměnnou reprezentovanou obrázkem je možno přejít do Membership Function Editor (editoru funkcí příslušnosti). Obr : FIS Editor 37

38 Příklad: Nastavte parametry FIS: 2 vstupní proměnné v(t), Odchylka(t) a jedna výstupní proměnná NatoceniKol(t). Vše uložte do souboru robot.fis Postup: 1. Spustit FIS Editor (napsáním příkazu fuzzy). 2. Přidat druhý vstup (menu Edit Add variable Input). 3. Přejmenovat první vstup (kliknout na blok input1 a v políčku Name napsat v(t)). 4. Přejmenovat druhý vstup (kliknout na blok input2 a v políčku Name napsat Odchylka(t)). 5. Přejmenovat výstup (kliknout na blok output1 a v políčku Name napsat NatoceniKol(t)). 6. Uložit na disk (menu File Export To Disk ) Editor funkcí příslušnosti (Membership Function Editor) Spustí se z FIS Editoru buď přes menu (Edit Membership functions ) nebo dvojím kliknutím na blok vstupu nebo výstupu. Slouží pro definování rozsahů a funkcí příslušnosti jednotlivých proměnných. Jeho okno (viz obr ) se skládá ze čtyř hlavních částí. V levém horním rohu jsou ikony všech proměnných. Kliknutím na ikonu proměnné se proměnná stane aktivní a zbylé části okna slouží k její editaci. Vpravo vedle ikon proměnných je graf s funkcemi příslušnosti, který umožňuje jejich editaci. V levé dolní části je možné nastavit povolený rozsah vybrané proměnné (políčko Range) a zobrazovaný rozsah vybrané proměnné (políčko Display Range). V pravé dolní části je možné nastavit vlastnosti funkce příslušnosti, vybrané v grafu. Je zde možné nastavit jméno vybrané funkce příslušnosti (políčko Name), její tvar (rozbalovací seznam Type) a parametry (políčko Params). Jména funkcí příslušnosti je dobré nastavovat na smysluplné hodnoty, protože se později pomocí nich definují pravidla, která definují závislost výstupu na vstupu. Tvary funkcí příslušnosti, které je možné nastavit jsou: trimf (trojúhelníková), trapme (lichoběžníková), gbellmf, gausmf (gausovská), gaus2mf, pimf, dsigmf a psigmf. Intuitivnější nastavení parametrů funkce příslušnosti je možné pomocí myši v grafu. Výběr funkce příslušnosti se provede kliknutím na požadovanou funkci příslušnosti, editace její pozice se provádí uchopením a přetažením, změna rozměrů uchopením obdélníčku vykresleného na vybrané funkci příslušnosti a jeho přetažením na novou pozici. 38

39 Obr : Editor funkcí příslušnosti (Membership Function Editor) Smazání vybrané funkce příslušnosti se provede stiskem klávesy Delete, nebo pomocí menu (Edit Remove selected MF). Smazání všech funkcí příslušnosti je možné pomocí menu (Edit Remove all MFs). Přidat funkci příslušnosti lze pomocí menu Edit Add MFs Po jeho výběru se zobrazí dialog z obr , ve kterém vyberete tvar přidávaných funkcí příslušnosti (MF type) a jejich počet (Numer of MFs). Obr : Okno pro přidání funkce příslušnosti (Add membership functions) 39

40 Příklad: Nadefinujte rozsah hodnot a funkce příslušnosti proměnné vt () tak, jak jsou vidět na obr Postup: 1. Vybrat proměnnou vt ()(kliknout na její ikonu v levé horní části okna). 2. Nastavit rozsah hodnot proměnné (změnit hodnoty v políčku Range první je minimální hodnota a druhá oddělená mezerou je maximální hodnota). 3. Vymazat předdefinované funkce příslušnosti (Menu Edit Remove all MFs). 4. Přidat pět funkcí příslušnosti gausovského tvaru (Menu Edit Add MFs a v dialogu nastavit hodnoty podle obr ). 5. Nastavit pozici funkce příslušnosti (v grafu kliknout na funkci příslušnosti a přetáhnout ji na požadovanou pozici). 6. Nastavit velikost funkce příslušnosti (kliknout na obdélníček vykreslený na funkci příslušnosti a tažením změnit velikost). 7. Změnit jméno funkce příslušnosti (kliknutím vybrat a požadované jméno napsat do políčka Name). 8. Opakovat kroky 5, 6 a 7 pro zbylé čtyři funkce příslušnosti Editor pravidel (Rule Editor) Spustí se ve FIS Editoru přes menu View Edit Rules, nebo dvojitým kliknutím na blok typu inference. Slouží k nadefinování pravidel, která určují závislost mezi vstupními a výstupními proměnnými. Jak vypadá jeho okno, je vidět na obr V horní části okna je seznam nadefinovaných pravidel a pod ním jsou seznamy hodnot, které mohou nabývat jednotlivé proměnné. Nejsou zde konkrétní čísla, ale jména funkcí příslušnosti, nadefinovaných v Membership Function Editoru, neboli hodnoty lingvistických proměnných. Nadefinování nového pravidla se poté provádí následujícím způsobem. Vyberou se hodnoty vstupních proměnných a jejich vzájemný vztah, odpovídající hodnota výstupní proměnné a váha pravidla (políčko Weight). Stiskem tlačítka Add rule se pravidlo přidá. Vybrané pravidlo lze smazat pomocí tlačítka Delete rule. Postup změny již nadefinovaného pravidla je následující. Vybere se pravidlo, které se má změnit, poté se provede nadefinování nových hodnot jako při vytváření nového pravidla a stiskem tlačítka Change rule se provede změna pravidla. 40

41 Příklad: Nadefinujte pravidlo: Je-li rychlost velmi velká nebo odchylka velmi malá, bude natočení kol velmi malé. Váhu pravidla nastavte na 0,5. Předpokládá se, že jsou nadefinované funkce příslušnosti všech proměnných. Postup: 1. Vybrat hodnotu VelmiVelka vstupní proměnné vt (). 2. Vybrat hodnotu VelmiMala vstupní proměnné Odchylka() t 3. Vybrat hodnotu VelmiMale výstupní proměnné NatoceniKol() t. 4. V boxu Connection vybrat hodnotu or. 5. Nastavit váhu pravidla (do políčka Weight napsat 0,5). 6. Přidat pravidlo (stisk tlačítka Add rule). Obr : Editor pravidel (Rule Editor) 41

42 Rule Viewer Spustí se pomocí menu View Rules. Slouží ke grafickému zobrazení nadefinovaných pravidel a výsledků inference pro zadané hodnoty vstupů. Umožňuje zobrazit konkrétní hodnotu výstupu pro konkrétní hodnoty vstupů. Hodnota výstupu se zobrazí po vybrání hodnot vstupů a zároveň se zobrazí, která pravidla byla použita pro její zjištění a jaký měla pravidla podíl na výsledné hodnotě. Příklad: Zjistěte jaké natočení kol odpovídá rychlosti 1 3ms a odchylce od požadovaného směru Postup: 1. Vybrat ve sloupci vt () hodnotu 3 (kliknutím a případným tažením myší). 2. Vybrat ve sloupci Odchylka() t hodnotu 30 (kliknutím a případným tažením myší). 3. Přečíst hodnotu natočení kol. Obr : Rule Viewer 42

43 Surface Viewer Spustí se pomocí menu View Surface. Slouží ke grafickému zobrazení závislosti výstupu na vstupech. Zobrazí graf závislosti výstupu na vstupech pro všechny možné hodnoty vstupů - viz. obr Obr : Surface Viewer 43

44 2.9.2 Implementace fuzzy regulátoru v SIMULINKu Matrix (FIS matice) Aby bylo možno spustit simulaci v SIMULINKu, je třeba Fuzzy Inference System uložit pod jeho jménem do pracovního prostředí MATLABu (workspace). Protože v MATLABu je základem maticový popis i způsob ukládání informací, jsou informace uložené v Fuzzy Inference System FIS uloženy jako matice. Tato matice je označována jako FIS Matrix (FIS Matice). Uložení FIS matice do pracovního prostředí MATLABu se provede z FIS Editoru pomocí menu File Export To Workspace Před uložením se FIS editor dotáže na jméno FIS matice (jméno proměnné prostředí MATLABu) Fuzzy Logic Controler Fuzzy regulátor je v SIMULINKu reprezentován prvkem Fuzzy Logic Controler, který je umístěn ve Fuzzy Logic Toolboxu - viz. obr Do schématu simulovaného systému SIMULINKu se přidá klasickým způsobem, tj. uchopením a přetažením na pracovní plochu. Obr : Fuzzy Logic Controler Takto se získá fuzzy regulátor, který nemá implementovánu logiku neumí přiřadit správnou hodnotu výstupu vstupům. Implementace logiky regulátoru se provede jednoduše přiřazením vytvořené FIS matice zapsáním jejího jména do parametrů bloku Fuzzy Logic Controler -viz. obr

45 Poté je již fuzzy regulátor nadefinován a připraven k použití. Obr : Parametry bloku Fuzzy Logic Controler Závěrem této kapitoly je třeba zdůraznit, že předložený návod k používání Fuzzy Logic Toolboxu se omezuje na vysvětlení základních kroků v grafickém prostředí GUI. Nezabývá se vůbec návrhem fuzzy regulátoru pomocí příkazového řádku Command Line a vyžaduje proto pro hlubší pochopení další studium [4,5,6]. 45

46 2.10 Závěr Tato publikace zdaleka nepokrývá celou oblast fuzzy řízení. Je pouze podporou pro výuku a pro úspěšné zvládnutí fuzzy řízení je třeba dalšího studia. Literatura [1] Modrlák O.: FUZZY ŘÍZENÍ A REGULACE Studijní materiály, Technická univerzita v Liberci, Liberec, 2002 [2] Passino K.M., Yurkovich S.: Fuzzy control. Addison Wesley Longman, Inc., Menlo Park, California, 1998, ISBN X [3] Vysoký, P.: Fuzzy řízení. Skripta, ČVUT Praha, [4] Pivoňka, P.: Analysis and Design of Fuzzy Controller. In: Fuzzy Control. Theory and Praxis, Physica-Verlag, 2000, ISBN [5] Gulley, N., Jang,J.S.: Fuzzy Logic Toolbox. For Use with MATLAB.The Math Works, Inc.1995 [6] The Student Edition of MATLAB.Version 4, User s Guide.The Math Works, Inc. 1995, Prentice Hall, Englewood Cliffs. ISBN [7] SIMULINK Dynamic System Simulation for MATLAB.Using Simulink, Version 2 The Math Works, Inc

47 3 Sekce B MODELOVÁNÍ DYNAMICKÝCH SOUSTAV NEURONOVÝMI SÍTĚMI 47

48 3.1 Úvod Mnoho schopností člověk získává učením. Je tedy přirozené, že se člověk snaží tento didaktický princip formalizovat do počítačových programů tak, aby se naučily správně přiřadit výstup (očekávané/požadované odpovědi) danému vstupu. Umělá neuronová síť je právě jedním z takových programů; protože se jedná o matematický popis s mnoha rozdílně nastavitelnými parametry, které jsou nastavovány množinou vzorů. Tyto vzory reprezentují vztah mezi vstupy a výstupy, tedy určují, co se má objevit na výstupu pokud je na neuronovou síť přiveden daný vstup. Tato publikace popisuje dvě specifické aplikace neuronových sítí, jednak modelování a jednak řízení dynamických soustav. Přestože úloha učení z předložených vzorů zní jednoduše, je často velmi obtížné získat pomocí neuronové sítě kvalitní řešení. Metody a doporučení popisované v této publikaci by měly napomoci k úspěšným implementacím neuronových sítí Motivace Automatické řízení se stává běžnou součástí našeho života. Vstupuje do všeho, od elektronických domácích spotřebičů po letadla a kosmické lodě. Automatické řízení může nabývat mnoha podob, pouze účel se nemění. Jde o to řídit danou soustavu tak, aby dosahovala požadovaného chování. Při návrhu regulačního členu pro příslušnou soustavu je zapotřebí získat nějaké znalosti o jejím budoucím chování. Pokud tyto znalosti nejsou k dispozici, není možné plánovat, jak by měla být soustava řízena, aby vykazovala určité chování Modely a regulační členy odvozené z dat Běžné a prakticky orientované přístupy k návrhům regulačních členů jsou takové, které využívají fyzikálních principů použitého modelu, podpořených množstvím praktických testů. V těchto testech jsou dle zvolených pravidel získávány různé hodnoty parametrů, dokud není dosaženo správného nastavení regulačního členu. Jiný často používaný přístup je založen na provádění jednoduchých experimentů se soustavou vybuzenou k definované odezvě (např. typovými signály). V závislosti na tom, jak je tato odezva získána, je možné navrhnout automatický regulační člen [1]. Tyto procedury je možné automatizovat a v komerčním využití jsou známy jako ladění na dané soustavě. Občas nejsou tyto jednoduché metody návrhu regulačních členů adekvátní, buď proto, že jednoduše nezvládnou danou úlohu, nebo proto, že požadavky na jejich výkon jsou tak enormní, že je není možné těmito jednoduchými metodami nastavit. V těchto případech je nutné použít pokročilejších metod návrhu. Tyto návrhy vyžadují strukturovanější znalosti cílové soustavy, například její popis diferenciálními rovnicemi. Matematický popis tohoto typu je nazýván modelem soustavy. V podstatě existují dva základní způsoby, jak je možné takový model získat. Prvním způsobem je deduktivní odvození použitím fyzikálních zákonů, druhým je odvození z množiny dat, získaných během praktických experimentů s popisovanou soustavou. První zmíněná metoda je jednoduchá, ale v mnoha případech je velmi časově náročná. Je pravděpodobně časově nejnáročnější částí v proceduře návrhu řídicího členu. Často je velmi nepravděpodobné (někdy i nemožné) získat touto cestou vhodný model. Druhá metoda odvození matematického modelu, která se běžně nazývá identifikace parametrů, je výrazně 48

49 méně náročná na čas. Ačkoli identifikace soustavy nevede vždy na přesný model, je možné přiměřeným úsilím získat kvalitní model. Hlavní nevýhodou je nutnost provádění praktických experimentů, které obsáhnou celý rozsah možných pracovních parametrů soustavy. Je proto neustále potřeba jistá znalost dané soustavy. Identifikace soustavy je používána ve spojitosti s návrhem regulačního členu a během mnoha let bylo vytvořeno mnoho úspěšných aplikací. Často je identifikace systému implementována jako součást regulačního členu. Toto je typické pro tzv. adaptivní regulátor, který je používán především pro soustavy, jejichž dynamické charakteristiky se mění v čase. Typický adaptivní regulátor identifikuje za chodu model, který je platný pro aktuální podmínky a je přestavován v závislosti na aktuálním modelu. Identifikaci soustav, adaptivnímu řízení a návrhu regulačních členů je věnováno mnoho literatury, ale většina této literatury je zaměřena na modely a regulátory popisované diferenciálními rovnicemi. Protože většina soustav vykazuje nějaký druh nelineárního chování, je v poslední době značná pozornost věnována i jiným metodám návrhu regulačních členů pro tyto nelineární soustavy. Jeden z možných přístupů je použití umělých neuronových sítí. Umělé neuronové sítě představují metody, vzniklé z představ o napodobení funkce biologických neuronových sítí, především mozku. Umělé neuronové sítě, nebo zkráceně jen neuronové sítě, jsou jedním z nejčastěji používaných výrazů. Mimo identifikace soustav, případně řízení, jsou používány v mnoha rozdílných odvětvích, jako jsou pojišťovnictví, zdravotnictví, bankovnictví, rozpoznávání hlasu, zpracování obrazu a v mnoha dalších aplikacích. Typicky jsou implementovány softwarově, ale je možno nalézt i hardwarovou implementaci pro zvýšení rychlosti. Neuronové sítě mají širokou oblast aplikací, a proto lze jen velmi těžko všechny vyjmenovat. Je proto mnoho motivů, proč studovat neuronové sítě. Jeden z nejsilnějších motivů je vytvoření počítačového programu, který je schopen učení se z vlastní zkušenosti. Tím byl dán základ pro jinou alternativu běžného programování, kde jsou pravidla vkládána přímo do počítače. Pokud je zkušenost vnímána jako znalost ovlivňování soustavy jednotlivými vstupy, je potom zřejmé, že neuronová síť musí mít něco společného s technikami aplikovanými v identifikaci soustav a adaptivním řízením. Jak se vyvíjel výzkum neuronových sítí, bylo objevováno stále více typů neuronových sítí, ale na druhé straně se začala vytrácet souvislost s biologickými neuronovými sítěmi. Dnes populární typy neuronových sítí mají málo společného s prvotní představou a dalo by se říci, že se jedná o statistické metody. Neuronové sítě jsou schopny naučit se nelineárnímu zobrazení z množiny pozorování. Jsou jedinou dostupnou metodou, která je schopná obecně aproximovat nelineární zobrazení a přehled možných aplikací je proto velmi dlouhý. Několik příkladů je uvedeno v [2] Proč používat neuronové sítě Proč je neuronovým sítím věnována zvláštní pozornost v porovnání s ostatními metodami? Pro danou aplikaci je samozřejmě obtížné říci, že jedna metoda překoná druhou ještě před tím, než obě vyzkoušíme. Nicméně se jeví vhodnější mít jednu metodu pro mnoho typů aplikací, než zkoušet mnoho různých metod na každém novém problému. Z části proto, že se zjednodušuje modelování a také proto, že je možné implementovat vývojové nástroje pro řízení. Pokud se hledá jeden způsob, který poskytuje odpovídající výkon v mnoha různých případech, jsou neuronové sítě dobrá volba. Obzvláště pak vícevrstvé sítě získaly velkou popularitu. Z mnoha praktických aplikací publikovaných v posledních letech je vidět, že 49

50 vícevrstvé sítě mají impozantní schopnosti. Teprve nedávno se podařilo teoreticky dokázat důvod těchto schopností [3] a [4]. Jak jsou neuronové sítě používány v návrhu regulačních členů? Prakticky rozeznáváme dvě kategorie regulátorů: Vysoce specializované regulátory Mají uplatnění v případech, kdy je řízená soustava vysoce nestabilní, nebo kde je velice důležitá kvalita regulace. Obecné regulátory Kde může být stejná řídicí struktura použita na širokém spektru zařízení. Tyto regulátory jsou charakteristické tím, že jsou používány tam, kde je relativně jednoduché soustavu naladit na dostačující výkon při vynaložení značného úsilí. Použití neuronových sítí je opodstatněno v obou případech, ale velký potenciál mají právě v druhém ze zmiňovaných případů. Je možné předpokládat, že jejich schopnost vystihnout správně regulovanou soustavu v mnoha různých aplikacích může přispět k redukci času stráveného hledáním parametrů a může přinést zlepšení výkonu např. oproti PID regulátorům Úvod do vícevrstvých sítí Z velkého množství literatury o neuronových sítích se může zdát, že neexistuje jedna společná definice, se kterou by všichni souhlasili, ale je mnoho typů, které je možno popsat následující definicí: Neuronová síť je soustavou jednoduchých prvků, neuronů, které jsou propojeny do sítě množinou (synaptických) vah. Funkce neuronové sítě je určena její architekturou, hodnotou vah a způsobem zpracování dat v jednotlivých prvcích (neuronech). Často je připomínáno, že neurony mohou pracovat paralelně, tedy stejně, jako je tomu v mozku, ale pokud si představíme většinu z používaných sítí, slovo paralelní může být zavádějící Neuron Neuron, uzel nebo prvek, jak je často nazýván, je výpočetní prvek, který má mnoho vstupů, které jsou váženy, sečteny a výsledek je použit jako vstup ohodnocovací funkce, nazývané jako aktivační funkce. Model neuronu je na obr Vstupy do neuronu mohou být tvořeny výstupy z jiných neuronů, nebo to mohou být externí vstupy. Potenciál w i,0 může být interpretován jako váha přiřazená vstupu, který je nastaven na konstantní hodnotu 1. Aktivační funkce f i může mít v podstatě jakýkoli průběh, avšak často bývá monotónní. Obr ukazuje příklady nejběžnějších aktivačních funkcí. 50

51 n Obr : Neuron: yi = fi( hi) = fi( wi, j + wi,0) V této publikaci jsou používány pouze lineární a hyperbolické tangenciální aktivační funkce a) a b). Sigmoida ad c) má historický význam, přestože dříve byla hojně využívána. Jelikož je jednoduché ji transformovat na tanh pomocí jednouchého vztahu Fc = ( Fb + 1)/2, ztrácí svůj význam. Skoková funkce ad d) je důležitá pro sítě, které se používají pro kategorizaci, tzn. jeli požadována odpověď ano/ne. j= 1 Obr : Různé aktivační funkce. a) lineární fa ( x) = x; b) hyperbolický tangent: f ( x) = tanh ( x) ; c) sigmoida: f ( x) = 1/ 1+ exp( x) ; d) skok: f ( x) = sgn ( x). b c ( ) d 51

52 Vícevrstvý perceptron Neurony mohou být kombinovány do sítě mnoha způsoby. Mnoho autorů se zabývá různými způsoby uspořádání neuronů [5], [6] [7]. Bezpochyby nejběžnější způsob je vícevrstvá perceptronová (Multilayer perceptron - MLP) síť. Základ MLP sítě je tvořen neurony ve vrstvách, kde každý prvek jedné vrstvy má jako vstupy buď pouze výstupy prvků vrstvy předcházející, nebo externí vstupy. Pokud má neuronová síť dvě takové vrstvy, je označována jako dvouvrstvá. Pokud má tři vrstvy je třívrstvá atd. Takováto struktura sítě je často označována jako dopředná síť. Přiklad takové sítě je na obr Obr : Plně propojená dvouvrstvá dopředná síť se třemi vstupy, dvěma skrytými vrstvami a dvěma výstupy. Druhá vrstva na obr je označována jako výstupní vrstva, protože je výstupem neuronové sítě. První vrstva je označována jako skrytá vrstva, protože je mezi externími vstupy ϕ, ϕ, ϕ a výstupní vrstvou. Třívrstvá síť bude mít dvě skryté vrstvy atd. Zobrazená síť je ( ) nazývána plně propojenou, pokud jsou všechny vstupy všech prvků v jedné vrstvě propojeny se všemi prvky následující vrstvy. Matematický popis vyjadřující chování MLP sítě je dán výrazem n h n yˆ () t = g, = F W f w + w + W ϕ [ ϕθ],, ϕ,0,0 i i i i j j jl l j i j= 1 l= 1 (1.1) θ je vektor parametrů, který obsahuje všechny nastavitelné parametry sítě, tzn. váhy i w, W. I když potenciál může být interpretován jako váha aplikovaná na vstup potenciály { jl, i, j} nastavený na 1, pojem váha často znamená jak váhu, tak i potenciál. Pro určení hodnot vah musí být k dispozici množina vzorů popisující, v jakém vztahu jsou výstupy y ˆi vzhledem ke vstupům ϕ l. Úloha nastavení vah z množiny vzorů se nazývá trénování nebo učení a je to klasická úloha odhadu. Váhy jsou odhadovány ze vzorů tak, aby při dané metrice popisovaly požadovaný vztah co nejpřesněji. 52

53 Volba architektury neuronové sítě Před tím, než se začne s tréninkem sítě, je nutné věnovat pozornost několika otázkám. - Jaký typ vztahu je možné naučit vícevrstvý perceptron? - Kolik skrytých vrstev by měla síť mít a kolik prvků by měla každá vrstva obsahovat? - Jaká by měla být zvolena aktivační funkce? Bohužel ne na všechny otázky existuje jednoduchá odpověď. Cybenko [8] ukazuje, že všechny spojité funkce mohou být aproximovány s jakoukoli požadovanou přesností, a to s jednotkově normovanou sítí s jednou skrytou vrstvou a sigmoidními (nebo hyperbolickými tangenciálními) prvky a výstupní vrstvou tvořenou lineárními prvky. Nevysvětluje ovšem, kolik má mít skrytá vrstva prvků. Náznaky jsou vidět v [3] a významné výsledky jsou odvozeny z aproximačních schopností dvouvrstvých sítí, pokud funkce použitá pro aproximaci je spojitá. Bohužel, tento výsledek není možné aplikovat pro výběr počtu skrytých vrstev. Většinu funkcí je možné v praxi aproximovat jedině proto, že každá spojitá funkce může být aproximována dostatečně přesně MLP sítí. Z výše uvedeného se může zdát, že není důvod používat více než jednu vrstvu a/nebo kombinovat různé typy aktivačních funkcí. Toto však není úplně pravda, neboť je možné zjistit, že přesnost je možné zvýšit použitím sofistikovanější architektury sítě. Pokud je nutné dosáhnout vysoké přesnosti naučení, je důležitá možnost dalšího zlepšování. Protože je implementace, trénink a statistická analýza sítě s více vrstvami komplikovanější, je obvyklé používat pouze jednu skrytou vrstvu se stejnou aktivační funkcí a výstupní vrstvu s lineárními prvky Modelování dynamických soustav MLP sítě jsou přímo použitelné pro časově diskrétní modelování dynamických soustav, pro které platí nelineární vztah mezi vstupy a výstupy. Obr : Dynamická soustava s jedním vstupem (u) a výstupem (y) Předpokládejme t vzorkovací periodu. Pak yt () značí aktuální výstup, pokud yt ( 1) značí výstup získaný z předešlého vzorkování. Pokud předpokládáme, že výstup z dynamické soustavy v diskrétním časovém intervalu může být popsán jako funkce minulých vstupů a výstupů [ ] yt () = S yt ( 1),, yt ( n), ut ( n),, ut ( m) (1.2) pak může být MLP síť použita pro aproximaci S, jestliže jsou vstupy do sítě ( ϕ, ϕ, ) voleny jako n minulých výstupů a m minulých vstupů

54 nh n+ m yt ˆ( θ) = g θϕ, () t = Wf w ϕ () t + w + W j= 1 l= 1 [ ] j j jl, l j,0 i,0 (1.3) Toto je velmi jednoduchý příklad popisu nelineárních dynamických soustav pomocí vícevrstvých perceptronů. Za sofistikovanější model můžeme považovat např. soustavu ovlivňovanou šumem, nebo aplikaci stavového modelu. Jedním z atraktivních rysů použití MLP sítí při modelování neznámých nelineárních soustav je fakt, že není nutné provádět zvlášť diskretizační proces, pokud je k dispozici nelineární diskrétní model Rekurentní sítě Percepční síť nemusí mít nutně dopřednou strukturu, zobrazenou na obr Právě v kontextu s modely dynamických soustav je často k vidění MLP síťová architektura rozšířená o zpětnou vazbu, jak je ukázáno na obr V tomto případě je síť označována jako rekurentní síť. Na rozdíl od dopředné sítě, kde existuje algebraický vztah mezi vstupem a výstupem, rekurentní architektura obsahuje dopřednou síť jako speciální případ a často je proto representována jako obecnější prvek architektury. Matematický popis sítě zobrazené na obr je dán vztahem [ θϕ ] yˆ ( t θ) = g, (), t t i i n h = F W f (, t) + W i i, j i i,0 j= 1 nh n n+ m h = F W f w ϕ () t + ω f (, t 1) + w + W i i, j i jl, l jl, l j,0 i,0 j= 1 l= 1 l= 1 (1.4) Rekurentnost může být implementována mnoha způsoby. Příklad zobrazený na obr je jedním z nich. Pokud je také výstup výstupních prvků zpětnovazební (vnitřní zpětná vazba), jedná se o plně rekurentní síť. Rekurentní sítě popisované v této publikaci nemají vnitřní zpětnou vazbu, ale jen zpětnou vazbu z výstupu na vstup. Obr : Jednoduchý příklad rekurentní sítě 54

55 Jiné architektury neuronových sítí Multivrstvé neuronové sítě jsou jedním z mnoha typů neuronových sítí, a jedině tyto jsou zde popsány. Mnoho různých autorů popisuje další typy běžně dostupných neuronových sítí. Mnoho pramenů se také zabývá historií a také jejich vztahem k jejich biologickým protějškům. Např. [5], [6] a [7]. Ne všechny sítě jsou schopné regulovat dynamické systémy. Pro tyto aplikace je vhodná jiná alternativa, a to funkce s radiální bází (RBF Radial Basis Function) sítě [9] a [10]. Studium a srovnávání výkonů různých typů sítí je mimo rozsah této publikace. Avšak mnoho z teorie probírané v této publikaci je přímo aplikovatelné na mnoho jiných typů neuronových sítí. 55

56 3.2 Identifikace soustavy neuronovými sítěmi Identifikace soustavy je úloha odvození matematického popisu, modelu, dynamické soustavy ze série měření dané soustavy. Pro sestavení matematických modelů dynamických soustav existují různé důvody. Typická je aplikace při návrhu regulačního členu soustavy se zahrnutím simulací, predikce a detekce chyb. Pokud je to spojeno s tvorbou modelu s ohledem na fyzikální zákony, chemii, ekonomiku atd., lze předpokládat enormní zájem o metody identifikace soustavy. V této kapitole je věnována pozornost identifikaci nelineárních dynamických soustav neuronovými sítěmi. Mimo zvyšování komplexnosti v porovnání s identifikací lineárních soustav, může být mnoho výsledků známých z identifikace konvenčních soustav výhodně použito na identifikaci založené na neuronových sítích. V této kapitole chceme ukázat vývoj poznání, abychom provedli čtenáře celou cestou od počátečních experimentů po kvalitní model soustavy. Tato vývojová procedura zahrnuje mnoho kroků, které je možné implementovat tak, aby bylo dosaženo velkého stupně automatizace, numerické spolehlivosti a výpočetní efektivity Úvod do identifikace soustavy V závislosti na stupni prvotní znalosti o soustavě může identifikace soustavy probíhat několika způsoby. Pokud je identifikace založena na měřených datech a předpokládáme žádnou nebo malou znalost fyzikální podstaty soustavy, je identifikační proces nazýván modelováním černé skřínky (blackbox modelling). V kontrastu s tímto přístupem je modelování bílé skříňky (whitebox modelling), které je používáno pro fyzikální modelování soustavy. Pokud máme určitou znalost o soustavě a tato je použita pro zlepšení empirického modelu, pak je tento přístup nazýván modelováním šedé skříňky (graybox modelling). Tato kapitola pojednává především o modelování černé skříňky. Je to především proto, že je velmi obtížné podat obecný návod pro modelování nelineárních soustav typu šedá skříňka. Je jednoduše nemožné postihnout všechny typy základních znalostí, které mohou existovat. Jiný problém tkví v tom, že dokud není k dispozici homogenní znalost soustavy, je těžké ji popsat jako spojitou v čase (pomocí diferenciálních rovnic). Převedení znalostí na diskrétní popis je často obtížné a dochází ke ztrátě dat. Převedení na modelování černé skříňky je možné nezávisle na množině znalostí, která je k dispozici, i když pochopení chování soustavy přispívá k její identifikaci. Takovými znalostmi jsou např.: charakteristické vlastnosti soustavy tj., jestli se jedná o soustavy s rychlou nebo pomalou odezvou, vhodnost vzorkovací frekvence, stabilitní vlastnosti, pracovní rozsah, časové konstanty, stupeň nelinearity, základní charakteristiky nelinearit. 56

57 Bez ohledu na to, že v principu všechny soustavy jsou nelineární, hlavní část literatury o identifikaci soustavy se věnuje právě identifikaci lineárních soustav. Je proto několik důvodů, z nichž nejdůležitější jsou: - mnoho soustav je možno dobře popsat lineárním modelem, a pokud je nedosažitelný lineární model pro celý pracovní rozsah soustavy, je možné použít několik dílčích lineárních modelů pro odpovídající časti dané soustavy; - výpočetní náročnost je daleko menší; - ze statistického pohledu je méně náročná analýza; - je mnohem jednodušší navrhnout regulátor pro soustavu popsanou lineárním modelem. Poslední bod je hlavní oblastí našeho zájmu i přesto, že nelinearity mohou být takového charakteru, že jejich zahrnutí do modelu může výraznou měrou ovlivnit kvalitu regulace. Je zřejmé, že nelineární modelování černé skříňky je proto důležité ve vztahu k řízení neznámých nelineárních soustav. Tato kapitola popisuje cestu k použití neuronových sítí pro identifikaci černé skříňky v několika odstavcích. Tato kapitola se pokouší především poskytnout ucelený pohled na praktickou tvorbu identifikace soustavy pomocí neuronových sítí. To zahrnuje volbu znalostí z tradiční identifikace, optimalizační teorie, nelineární regrese a teorie neuronových sítí. Identifikace soustavy založená na neuronových sítích může být implementována jako přirozené rozšíření konvenčních identifikačních metod a přístup použitý v této kapitole je podobný tomu, který používá [11] a [12]. Přistup je zaměřen na popis implementace s přiměřeným důrazem na to, aby byl čtenář schopen implementovat popisované metody. 57

58 Postup Pokud se pokoušíme identifikovat model dynamické soustavy, je dobré držet se ověřeného postupu zobrazeného na obr Obr : Základní postup identifikace soustavy Otázky týkající se fyzikálních vlastností a použití daného modelu ovlivňují všechny kroky uvedeného postupu. Předběžná diskuze implementace každého stavu a i jednotlivých kroků v diagramu je následující. Čtyři základní kroky získání modelu Experiment Smyslem experimentu je získat soubor dat, který by popisoval chování systému v celém rozsahu jeho činnosti. Základní myšlenkou experimentu je sledovat vliv proměnné vstupní veličiny (vstupních veličin) u, na výstupní veličinu (výstupní veličiny) y, viz obr

59 Obr : Vstup přivedený na soustavu a zkoumání jeho vlivu na výstup soustavy Soubor dat odpovídajících vstupů a výstupů { (), (), 1,..., } N Z = u t y t T = N, je později použit pro odvození modelu soustavy. Pokud je soustava identifikována jako nestabilní nebo pokud je soustavou s malým tlumením, může být nezbytné provést experiment na soustavě s uzavřenou smyčkou. V podstatě existují dvě možnosti dosažení stabilizace soustavy: buď manuální ladění zpětnovazebního členu regulátoru, nebo řídit soustavu lidským operátorem. Základními problémy experimentu jsou především volba vzorkovací frekvence, návrh vhodného vstupního signálu a předzpracování dat. Předzpracování dat zahrnuje například nelineární testy, odstranění náhodných poruch, odstranění šumu a ostatních nežádoucích účinků získaných dat. Volba struktury modelu Struktura modelu je množina kandidátů na modely. Je to tedy množina, uvnitř které bude hledán model. Existují dva problémy při volbě struktury modelu: 1. Volba požadovaného druhu struktury modelu pro popis soustavy, například lineární struktura modelu, vícevrstvá perceptronová síť nebo Hammersteinovy modely. 2. Volba podmnožiny zvolené třídy struktury modelu. Ve třídě lineárních struktur to může být např. instance ARX ( 2,3,1) struktury modelu, kde (2,3,1) znamená časové zpoždění vzorkovací periody, a dále to znamená, že současný výstup závisí na dvou minulých výstupech a třech minulých vstupech. V dalším budou diskutovány jak vstupně-výstupní modely, tak také modely ve stavovém prostoru. Tato kapitola bude v první řadě pojednávat o soustavách, které mají pouze jeden výstup, ale některé části budou pojednávat také o soustavách s více výstupy. Model získaný odhadem Jakmile je zvolena množina možných kandidátů na modely, je dalším krokem volba jednoho konkrétního modelu z této množiny. Typicky se bude jednat o volbu modelu, který by nejlépe splňoval nějaký typ kritéria. Toto kritérium může být formulováno mnoha způsoby, ale mělo by v zásadě souviset se zamýšleným použitím daného modelu. Nejvíce používanou strategií je nalezení režimu, který by poskytl co nejlepší jednokrokovou předpověď vzhledem k 59

60 nejmenší očekávané kvadratické odchylce pozorovaných výstupů a předpovědí. Proces vybírání modelu ze struktur modelu je ve statistické literatuře nazýván jako odhad. Z historických důvodů jsou však některé procesy v neuronových sítích obvykle nazývány tréninkem nebo učením. Ověření modelu Pokud byl model získán odhadem nebo tréninkem, musí být ověřeno, zda vyhovuje potřebným požadavkům. Ověření je úzce spojeno se zamyšlením nad použitím modelu. Toto je často nejproblematičtější úloha celého identifikačního procesu, protože požadavky kladené na přijetí modelu mohou být neurčité. Návrat v procesu získání modelu. Proces získání modelu probíhá iteračním způsobem. Je to nezbytné pro návraty v procesu určení počtu různých modelů, k vyzkoušení různých struktur modelů, a v nejhorším případě dokonce pro přeplánování a nové provedení experimentu. -. Návrat k modelu odhadu: ačkoli se používá pouze jednoduché kriterium charakterizující nejlepší model ve struktuře modelu, je často obtížné zaručit, že tréninkový algoritmus bude konvergovat k tomuto modelu. Problémem je, že kriterium má obvykle několik lokálních minim a nalezení globálního minima proto nemusí jednoduché. Návrat také umožňuje potlačit zvýšení kriteria nazývaného regularizace. Toto rozšíření je velmi významné. - Návrat k výběru struktury modelu: některé strategie jsou použitelné ke zvýšení podílu automatizace výběru struktury modelu. Snad nejpopulárnější strategie je nazývána prořezání: Výchozí model struktury popisující soustavu je dostatečně obsáhlý a je postupně redukován tak dlouho, dokud není dosažena optimální struktura. - Návrat k experimentu: pokud není možné získat vyhovující model bez ohledu na to, jaká je zvolena jeho struktura, může to znamenat, že data jsou nedostatečná. Dodatečné úpravy dat, např. filtrace nepomohou, není li v získaných datech dostatek informací. Velmi častým je případe, kdy určitý provozní režim není v datech obsažen. V tomto případě je nezbytné provést dodatečný experiment pro získání dalších informací o tomto režimu. Obsah podkapitoly je následující: odstavce až se detailně zabývají čtyřmi základními kroky, ale pro srozumitelnost v mírně pozměněném pořadí. Proto je odstavec věnován výběru struktury modelu. Na základě dobře známé struktury lineárního modelu jsou navržena rozšíření používající neuronové sítě, která jsou vhodná pro nelineární systémy. V odstavci budou vysvětleny různé aspekty experimentu. Odstavec uvádí vhodné tréninkové algoritmy v souvislosti strukturami modelu, založených na neuronových sítích. Zvláštní důraz je kladen na získání rychlé a robustní konvergence algoritmů. Dále bude pojednáno o koncepci zobecnění toho, jak může být využito regularizace pro dosažení schopnosti modelů generalizovat vzhledem k neznámým hodnotám vstupům. Odstavec je zaměřen na různé metody pro ověření modelů s neuronovou sítí. Návraty v procesu získání modelu jsou diskutovány v odstavci Největší pozornost je věnována prořezávacím algoritmům. Na závěr je v odstavci zrekapitulován celý problém a bude navržena obecná metodika identifikace soustav neuronovými sítěmi. 60

61 3.2.2 Výběr struktury modelu V této kapitole jsou uvedeny struktury modelu vhodné pro identifikaci nelineárních dynamických soustav v stochastickém prostředí. K popisu nelineárního zobrazení může být použita vícevrstvá perceptronová neuronová síť. Je navržena celá řada struktur modelů založených na neuronových sítích, které představují rozšíření dobře známých lineárních struktur modelu. Použití lineární struktury modelu jako výchozí má řadu výhod.. Navíc k tomu, že je to přirozený přístup pro ty, kteří jsou již obeznámeni s konvenčními metodami identifikace, je to vhodné i pro návrh řídicích systémů, který je uveden v kapitole 3. V této kapitole je také uveden přehled různých základních lineárních struktur modelu. Struktury modelu založené na neuronových sítích vhodné pro identifikaci nelineárních systémů jsou postupně uvedeny jako zobecnění lineární struktury modelu Některé lineární struktury modelu Podle [11] je soustava lineární, pokud je možno její model popsat rovnicí: 1 1 ( ) ( ) ( ) ( ) ( ) y t = G q u t + H q et (2.1) Kde G a H jsou přenosové funkce operátoru časového zpoždění s využitím operátoru 1 q je následující: ( ) ( ) d q x t xt d 1 q. Reprezentace signálu = (2.2) kde d je násobek vzorkovací periody. et ( ) je signál bílého šumu, který je nezávislý na posledních vstupech a který může být charakterizován funkcí hustoty pravděpodobnosti. Při u t, více proměnných (nebo modelu MIMO, tj. modelu s více vstupy a více výstupy) jsou ( ) 1 y( t ) a et ( ) vektory; G a H jsou matice koeficientů polynomů v q. Pokud je systém lineární, je cílem identifikačního procesu určit vhodný odhad dvou přenosových funkcí G a H. Kritérium, které definuje význam vhodnosti bude v tomto odstavci především vztaženo ke schopnosti modelu vytvářet jednokrokové predikace s nízkým rozptylem. Pro obecný lineární systém (popsaný v odstavci 3.2.1) je lehce ověřitelné, že minimální rozptyl jednokrokové predikce je dán jako: ( 1) = ( ) ( ) () + 1 ( ) () y t t H q G q u t H q y t (2.3) Tato volba reprezentace modelu bývá někdy označována predikční tvar modelu. Terminologie pro zpřesnění významu pojmů soustava, struktura modelu a modelu bude definována v následujícím (viz také [11]). Toto je důležité nejen pro teorii odvozenou v této kapitole, ale také pro vysvětlení rozdílů v terminologii vztahující se k identifikaci soustavy a oblastí neuronových sítí. - Skutečnou soustavu je možno popsat jako: 1 1 ( ) ( ) ( ) ( ) ( ) y t = G q u t + H q e t (2.4)

62 kde e0 ( t ) je signál bílého šumu, působící nezávisle na vstupním signálu u( t ). - Struktura modelu, M je parametrizovaná množina možných kandidátů na modely 1 1 :{ (, θ), (, θ) θ } 1 1 () = (, θ) () + (, θ) () M G q H q D m y t G q u t H q et (2.5) p kde θ značí p nastavitelných parametrů, a D m je podmnožina z R, uvnitř které může být uskutečněno hledání modelu. Struktura modelu v predikovaném tvaru je obvykle dána jako: ( 1 ) = (, θ) (, θ) () + 1 (, θ) () y t t H q G q u t H q y t (2.6) Můžeme pozorovat, že zavedení θ jako argumentu znamená, že struktura modelu je reprezentací množiny modelů. Pokud není jinak specifikováno, budeme uvažovat predikci pouze pro jeden krok vpřed. V dalším proto budeme při označování t 1 vynechávat. Struktura modelu bude často zapisována druhým způsobem: T ( ) = () t y t θ ϕ θ (2.7) kde θ je vektor parametrů a ϕ je regresní vektor, který obsahuje poslední vstupy, poslední výstupy nebo signály odvozené ze vstupů a výstupů. Základním požadavek na formulaci podmnožiny D je následující [12] ( θ) ( θ) 1 1 ( θ) H q, G q, asymptoticky stabilní Dm = θ H q, asymptoticky stabilní, G( 0, θ) =0, H( 0, θ) =1 m (2.8) ale fyzikální náhled může ovšem způsobit dodatečné omezení této podmnožiny. Podmínka stability obvykle zaručuje, že prediktor zůstává stabilní. Předpoklad, že G = 0 je zaručen tím, že předpověď závisí pouze na posledním vstupu (tj. není přímé propojení), zatímco H = 1 zaručuje, že předpověď závisí pouze na posledním měřeném výstupu. Pro mnoho z dalších teorií je základním požadavkem, aby struktura modelu byla dostatečně velká pro popis skutečné soustavy. To znamená, že S M (2.9) - Model je jednoduše určen přesným výběrem vektoru parametrů, tedy říkáme že θ θ =. V mnoha případech je uvažována jednodušší struktura modelu, než ta, která je uvedena v obecném tvaru (2.5). Dále budou uvedena důležitá zjednodušení. Zjednodušení se navzájem liší různými předpoklady o spektrální hustotě šumu a tím, jaký šum předpokládáme na vstupu soustavy. To lze přirozeně přepsat do obecné struktury modelu jako 62

63 kde ( ) ( ) ( ) ( ) ( ) () B q d () C q Aq y t = q u t + et 1 1 F q D q ( ) ( ) ( ) ( ) ( ) Aq = 1 + aq +... aq 1 1 n 1 n B q = b + bq +... bq 1 1 m 0 1 m C q = 1 + cq +... cq 1 1 k 1 k D q = 1 + dq +... dq 1 1 l 1 l F q = 1 + fq +... fq 1 1 r 1 r () (2.10) (2.11) Polynomy A, C, D a F se nazývají normované a jsou vyjádřeny tak, aby jejich první člen byl roven 1. Konečná impulsní odezva struktury modelu (FIR Finite Impulse Response) Nejednodušší typ struktury modelu odpovídá volbě, kdy 1 d 1 (, θ ) = ( ) H( q θ) G q q B q A v tomto případě je prediktor dán vztahem 1, = 1 (2.12) d 1 ( θ ) = ( ) () y t q B q u t (2.13) To může být ekvivalentně vyjádřeno v regresním tvaru T ( ) = () t y t θ ϕ θ (2.14) Kde ϕ ( t) je regresní vektor definovaný vztahem () t u( t d),..., u( t d m) T (2.15) ϕ = Ve shodě s tím je parametrický vektor θ určen následovně: [... T θ = b0 b m ] (2.16) Soustava s póly nemůže být přesně popsána FIR modelem konečné řady. Pokud je však soustava stabilní a pokud impulsní odezva klesá přiměřeně rychle, může být soustava dobře 1 aproximována FIR modelem, jestliže za B( q ) odezvy. je zvolen první m koeficient impulsní 63

64 ARX (AutoRegresive, external input) struktura modelu. ARX struktura modelu je popsána vztahem: Prediktor má tudíž tvar: 1 1 ( ) (, ) B q d 1 θ = q H 1 ( q, θ ) Aq ( ) G q = 1 1 ( ) Aq (2.17) 1 1 ( ) d θ = ( ) () + 1 ( ) () y t q B q u t Aq y t T = ϕ () t θ (2.18) kde ϕ () t = y( t 1,..., ) y( t n), u( t d),..., u( t d m) [ a,..., a, b,..., b ] θ = 1 n 0 m T T (2.19) Ačkoli G má nyní póly, existuje pouze algebraický vztah mezi předpovědí a posledními vstupy a měřenými výstupy. to znamená, že prediktor bude vždy stabilní; i když systém je nestabilní. Toto je velmi důležitý rys ARX struktury modelu. Toto může být označováno názvy CAR (Controlled AutoRegressive) model, Equation error model, a nebo také sériově-paralelní (Series-parallel) model, které jsou používány častěji než ARX struktura modelu. ARMAX (AutoRegressive, Moving Average, external Input) struktura modelu Tato struktura modelu je obecnější, než ARX struktura modelu, tedy: Optimální prediktor je 1 1 ( ) (, ) B q d 1 θ = q H 1 ( q, θ ) Aq ( ) G q ( θ ) 1 ( ) 1 ( ) C q = Aq 1 1 B( q ) Aq ( ) d = () + () 1 1 C( q ) C( q ) ( ) () 1 ( ) () ( ) 1 ε(, θ) y t q u t 1 y t = + + d q B q u t Aq y t C q t T = ϕ ( t, ) θ θ, (2.20) (2.21) kde, ε( t,0 ) y y( t θ) = značí chybu odhadu nebo trvalou chybu. Regresní a parametrický vektor jsou definovány jako 64

65 ( t, ) = y( t 1,..., ) y( t n), u( t d),..., u( t d m), ( t, ),..., ( t k, ) ϕ θ ε θ ε θ [ a,..., a, b,..., b, c,..., c ] T 1 n 0 m 1 k θ = T (2.22) V důsledku přítomnosti C-polynomického prediktoru nyní existují póly. Tedy C musí mít kořeny uvnitř jednotkové kružnice, aby prediktor byl stabilní. Existence pólů také naznačuje, že regresní vektor závisí na parametrech modelu, což dále (jak uvidíme později) komplikuje odhad parametrů modelu. Poznamenejme, že závislost modelu je dána použitím argumentem θ funkce ϕ ve vztahu (2.22). OE (Output error) struktura modelu OE (nebo také paralelní) struktura modelu se používá tehdy, jestliže je model ovlivňován pouze měřitelným bílým šumem, daným vztahem. () 1 ( ) 1 ( ) = B q () + (), F q d y t q u t et (2.23) který odpovídá následující volbě G a H : 1 1 ( ) (, ) B q d θ = q H 1 ( q θ) F( q ) G q 1, = 1. (2.24) Prediktor této soustavy je kde ( θ) 1 ( ) 1 ( ) d y t = q u t () 1 1 ( ) () 1 ( ) ( θ ) d q B q u t F q y t T = ϕ ( t, ) θ θ B q F q = +, (2.25) ϕ θ θ θ ( t, ) = y( t 1 ),..., y( t r ), u( t d),..., u( t d m) [ f,..., f, b,..., b ] θ = 1 r 0 m T (2.26) Aby byl prediktor stabilní, musí kořeny F ležet uvnitř jednotkové kružnice. Upravený tvar stavového prostoru (SSIF State Space Innovation Form) Popis stavového prostoru je široce užíván jako alternativa k vstup-výstup strukturám modelů, které byly uvedeny výše. Předpokládejme, že soustava může být popsána následující množinou dvojic diferenčních rovnic prvního řádu ve tvaru 65

66 ( 1) ( θ) ( ) ( θ) ( ) ( ) xt+ = A xt + B u t + wt (2.27) ( ) ( θ ) ( ) ( ) y t = A xt + v t (2.28) kde ω ( t) a vt ( ) jsou signály bílého šumu nezávislé na řídícím signálu u( t ) a ( ) () ( θ) wv ( θ) ( θ) ( θ) wt () R T () = R. T w E w t v t T vt Rwv Rv (2.29) Lze ukázat [12], že optimální predikátor jednoho kroku vpřed, pro tuto soustavu má tvar: ( + 1, θ) = ( θ) (, θ) + ( θ) () + ( θ) ε(, θ) xt A x t B u t K t ( θ) = ( θ) (, θ) y t C xt (2.30) (2.31) K ( θ ) je nalezeno ze vztahu (θ je vynecháno z důvodu pohodlnějšího zápisu) [ ] 1 T K = APC + R wv CPC+ R v, (2.32) kde P ( θ ) reprezentuje kladný semi-definitní řešení stacionární Ricattiho rovnice T T T 1 T T P= APA + Rw APC Rwv CPC R + + v APC + Rwv (2.33) Optimálním prediktor je také znám jako Kalmanův filtr a matice K ( θ ) je označována jako Kalmanovo zesílení. Tvar (2.30) se označuje jako upravený tvar stavového prostoru. Jednoduchý vztah mezi upraveným tvarem stavového prostoru a obecným vztahem vstupvýstup je dán jako [11]: ( 1 1, θ) = ( θ) ( θ) ( θ) G q C qi A B ( 1 1, θ) ( θ) ( θ) ( θ) H q = C qi A K + I (2.34) (2.35) Maticovými operacemi může ověřit, že póly prediktoru jsou vlastními čísly matic A KC [12]. Podmnožina D m je dána jako: { θ ( θ) ( θ) ( θ) uvnitř jednotkové kružnice} Dm = eiga K C (2.36) Když odhadovaný stavový prostor modelu, prvky matice K ( θ ) jsou obvykle odhadovány přímo, spíše než použitím nepřímého odhadu kovariančních matic a řešením Ricattiho rovnice před výpočtem K ( θ ). 66

67 Výběr správné parametrizace např. struktury množin A, B, C, a K je problém, který je nepříznivý pro upravený tvar stavového prostoru. To je daleko horší, než pro vstupněvýstupní struktury modelu. Problémem je, že plně parametrizovaná struktura modelu znamená, že musí být odhadnut význam všech prvků matic A, B, C a K, protože obecně není identifikovatelný tvar souboru vstupních a výstupních dat. Je to proto struktura obsahuje více nastavitelných parametrů než je nezbytné, některé vstupně-výstupní vztahy mohou být popsány rozdílnou volbou matic A, B, C a K.Někdy může parametrizace založená na fyzikálních vlastnostech vyřešit tento problém. Jestliže použijeme pro řešení problému přístup černé skříňky, potřebujeme použít některé druhy obecně identifikovatelných parametrizací. V případě SISO existují takzvané kanonické tvary a jsou často užívány pro transformaci a popisu soustavy přenosovou funkcí do popisu ve stavovém prostoru [14]. V MIMO případě je vše komplikovanější. Ljung [11] navrhl pro MIMO soustavy rozšíření, vhodné pro identifikaci těchto soustav. Lungovo pravidlo pro výběr parametrizace je uvedeno níže ( n určuje řád modelu a n y je počet výstupů). Nechť je A( θ ) matice zpočátku vyplněna nulami a s jedničkami na hlavní diagonále. Nechť = n jsou vyplněna parametry. Mějme r 0 = 0 a nechť C ( θ ) je čísla řádků r 1, r 2,..., r ny, kde rny vyplněno nulami a potom nechť řádek i má jedničku ve sloupci i 1 1 jsou vyplněny parametry. r +. Nechť B ( θ ) a K ( θ ) Princip je ilustrován níže odpovídá na struktuře modelu pátého řádu ( n = 5) s dvěma výstupy ( n y = 2 ) a jedním vstupem. označuje parametr, který má být odhadnut A( θ ) = B( θ) = (2.37) C ( θ ) = K( θ) = (2.38) Pro rozhodnutí o struktuře musí tedy být stanoven řád modelu n a množina řádkových indexů n { } y 1 r. i i= 1 67

68 Nelineární struktura modelu založená na neuronových sítích Problém výběru modelu struktur stává složitějším, pokud zahrneme černou skříňku do identifikace nelineárních dynamických soustav. V kapitole 1 byla popsána vícevrstvá perceptronová síť (MLP), která je vhodná k modelování nelineárních problémů. Struktury modelů vhodných pro identifikaci nelineárních dynamických soustav, využívají MLP sítí. Výběr struktury modelu je standardně zjednodušován na řešení následujících dvou otázek: - Volba vstupů sítě - Volba vnitřní struktury sítě Často používaným přístupem je opětovné použití vstupu struktur z lineárního modelu zatímco jako vnitřní architektura je použita dopředná MLP síť. Tento přístup má několik výhod. - Je to rozšíření známého lineárního modelu - Vnitřní architektura může být postupně rozšiřována tak, aby byl model schopen řešit lépe složitější nelineární vztahy. - Požadovaná rozhodnutí o struktuře jsou snížena na minimum. - Je vhodný pro návrh řídících členů. Nelineární část lineární struktury modelu, který byl uveden v předchozí části je dán vztahem Nebo prediktorem ϕ ( t, ) ( ) ϕ(, θ) θ + ( ) y t g t et (2.39) (2.40) y( t θ) = gϕ( t, θ), θ θ je regresní vektor; θ je vektor obsahující nastavitelné parametry neuronové sítě jako jsou váhy; g je funkce realizovaná neuronovou sítí a předpokládá se její dopředná struktura. Nelineární struktura modelu vyplývá z volby regresního vektoru. Jestliže je jako regresní vektor zvolen model ARX, tak struktura modelu je nazývána NNARX (Neural Network ARX neuronová síť ARX). Dále jsou uvedeny modely NNFIR, NNARMAX, NNOE a NNSSIF. NNFIR a NNARX Prediktory těchto sítí jsou vždy stabilní, protože je zde přesný algebraický vztah mezi predikcí, posledním měřením a vstupy. Toto je velmi důležité v nelineárním případě, protože otázky stability jsou zde mnohem složitější než u lineárních soustav. Struktury modelů jsou zobrazeny na obr Tyto struktury modelů jsou upřednostňovány u detrministických soustav nebo u soustav se zanedbatelným vlivem šumu. 68

69 Obr : Struktury modelů NNFIR (vlevo) a NNARX (vpravo) NNARMAX Obr : Struktura modelu NNARMAX Ačkoli funkce g (2.40) je realizována jako dopředná sít. Pokud je zvolen ARMAX regresní vektor (2.41), má prediktor zpětnou vazbu. T ( t, ) = y() t,..., y( t n), u( t d),..., u( t d m), ( t, ),..., ( t k, ) (2.41) ϕ θ ε θ ε θ Poslední predikovaná chyba závisí na výstupu modelu a následkem toho vzniká zpětná vazbu. Model sítě se zpětnou vazbou je obvykle označován jako rekurentní síť[5]. Stabilitu prediktoru lineárního ARMAX modelu je možno snadno ověřit nalezením kořenů polynomu C. Analýza parametrů stability NNARMAX modelu je obtížnější. Obvykle odpovídá posuzované stabilitě v určitých pracovních režimech. Může se stát, že pro některé pracovní režimy je NNARMAX model stabilní, zatímco pro jiné je nestabilní. Zda-li to v praxi povede nebo nepovede k problémů, záleží na tom, k čemu je model použit. 69

70 NNOE Některé regresní vektory jsou predikce posledních výstupů a proto se nich vyskytují stejné problémy, jako u struktur NNARMAX. Struktura modelu NNOE je zobrazena na obr NNSSIF Obr : Struktura modelu NNOE Obtíže spojené s tvorbou nelineárního rozšíření na upravený tvar stavového prostoru jsou zde patrnější, než ve vstupně-výstupních strukturách modelů. Dále je použito přístupu navrženého Sørensenem [15] a [16], který vede na tvar prediktoru, zobrazený na obr Obr : Struktura modelu NNSSIF Nechť má prediktor tvar (obr ), xt ( + 1 θ) = gϕ( t, θ), θ, (2.42) ( θ) ( θ) ( θ) y t = C xt, (2.43) 70

71 kde ϕ ( t θ) x( t θ ) = u() t. et ( θ ) (2.44) Protože předchozí stav a vektor predikční chyby jsou součástí regresního vektoru, má tento model zpětnou vazbu, stejně jak modely NNOE a NNARMAX. Otázky identifikovatelnosti uvedené pro lineární SSIF struktury modelů jsou samozřejmě přeneseny na nelineární případ. Jeden ze způsobů jak se vypořádat s těmito problémy je vytvoření dvou oddělených sítí, každá je zodpovědná za predikci odpovídající části stavů: Nechť { r} = { r, r,... r = n} představuje stavy odpovídající řádkám v matici ( ) i 1 2 n že jsou vyplněny parametry. Dále, nechť { qi} { q1, q2,..., qn n} y zbývající stavy. Dvoustavové prediktory jsou pak dány { }( ) { }( ) j j+ 1 ( ) A θ v (2.30) = udává množinu odkazů na (2.45) x t+ 1 θ = x t θ + g ϕ t θ, θ q q q q q (2.46) x{ ri }( t+ 1 θ) = gq ϕ( t θ), θr (, ) ( ) (, ) q t = u t t (2.47) ϕ T θ T ε T θ Jak ukázal [15], identifikace NNSSIF modelu může být považována za rozšířený Kalmanův filtr pro neznámé nelineární soustavy. Struktura modelu je ve vztahu k návrhu stavového n, architekturu dvou prostoru řídicích členů. Návrh struktury musí zahrnovat řád modelu ( ) neuronových sítí ( q r) n g ag a ukazatele { } 1 y r i i= 1. Variace a hybridní struktura modelu Často je navrhováno použití variací výše uvedených struktur modelů a také použití kombinace lineárních a nelineárních struktur modelů. Některé použitelné příklady jsou uvedeny dále. - Někdy můžeme vidět, že NNARX struktura modelu je složen ze dvou separátních sítí, nebo ze sítě a lineárního členu.[17], [18] ( ) () () y t θ = gy ϕy t, θy + gu ϕu t, θu, d 1 ( θ) = ϕ (), θ + ( ) () y t g t g B q u t y y, 1 ( ) ( ) () () y t θ = 1 Aq y t + gϕu t, θu, (2.48) (2.49) (2.50) 71

72 kde ϕ ϕ y y () t = y( t 1... ) y( t n) () t = y( t 1... ) y( t d m) T T (2.51) - Podobným způsobem může být vytvořena struktura OE modelů. Modifikací vztahu (2.50) dostaneme 1 ( ) ( ) ( ) () y t θ = 1 Aq y t θ + gϕu t, θu (2.52) toto překoná problém s neznámými charakteristikami stability OE-modelů. - Podobnou logickou úvahou, můžeme získat variantu NNARMAX struktury modelu, která může být odvozena jako 1 ( θ) = ϕ (), θ + ( ) (, θ) y t g t C q et uy uy, (2.53) kde () ( 1,..., ) ( ), ( ),..., ( ) T (2.54) ϕ uy t = x t y t n u t d u t d m - Někdy mohou být zajímavé struktury modelů, které nejsou motivované tradičními lineárními strukturami modelů, např.: ( θ) = ϕ(), θ + ϕ(), θ ( 1) y t g1 t 1 g2 t 2 u t, (2.55) kde () t y( t 1,..., ) y( t n), u( t 2,..., ) u( t 1 m) T (2.56) ϕ = - Fyzikální znalosti mohou obvykle ovlivňovat volbu regresního vektoru. - Je možné implementovat strukturu modelu, tak že bude obsahovat svoji lineární část jako podmnožinu. Toto je získáno přímím propojením vstupu a výstupu. - Kromě NNOE struktury je možné přímo modifikovat strukturu modelu během analýzy pro různé časové úseky (např. bez externího vstupu). V regresním vektoru jsou jednoduše vynechány poslední vstupy. Při analýze v jednotlivých časových úsecích, nejsou experimenty řízeny, dokud není soustava ovlivňována. Mimo část zahrnující experimenty, všechny otázky probrané v této části jsou použitelné v pro tuto analýzu. 72

73 Několik poznámek o stabilitě Stabilita hraje velmi důležitou roli v teorii řízení. Nutnou podmínkou pro realizaci řídících soustav, které pracují v uzavřené smyčce, stávající se z řídicího členu a řízené soustavy. Řídicí člen musí být navržen tak, aby splňoval množství požadavků, např.: rychlost a tlumení. Také identifikaci soustavy se musíme někdy zabývat otázkou stability. Při identifikaci soustavy je důležitá stabilita ve spojení s asymptotickou analýzou metod odhadu. Mimoto je stabilita také důležitá ve vztahu s praktickou implementací tréninkových metod. Pokud je například pro určitou volbu parametrů modelu prediktor nestabilní, během tréninku se mohou vyskytnou určité numerické problémy. Nyní bude následovat několik poznámek, týkajících se stability diskrétních nelineárních metod. Pro hlubší seznámení s probíranou tématikou doporučujeme následující publikace [19], [20] nebo [21]. Obr : Příklad modelu s neuronovou sítí a se zpětnou vazbou Základní blok struktury modelu popsané výše je dán ( ) θϕ, ( ) y t = g t Jak je zobrazeno na obr Tento tvar může být snadno transformován do ( + 1 ) = u ( ), ( ) X ( t ) X t F X t U t = X, (2.57) 0 0 kde x(t) je část regresního vektoru ϕ ( t) obsahující poslední výstup z neuronové sítě a F u sestávající se z funkce neuronové sítě g a funkce posunu. Předpokládejme následují dynamickou soustavu, popsanou stavovým modelem, diskrétním v čase ( + 1 ) = ( ), X ( t ) X t F X t t = X, (2.58) 0 0 kde t Z. Poznamenejme, že (2.57) může být transformován na (2.58), pokud U( t ) je funkcí času nebo pokud U( t ) je stavově závislou funkcí a nebo kombinací obou. Nechť X ( ) 0 t které 73

74 je (nominální) řešení (2.58), kde X ( t ) = X a xt ( ) X ( t) X ( t) nominální hodnoty může být vypočtena vztahem ( ) ( ) ( ) Kde nominální odchylka odpovídá xt ( 0 ) = 0 a kde =. Potom odchylka od xt+ 1 = f xt, t (2.59) ( ) 0 0= f 0, t t t. Stabilita nominálního řešení může být nyní definována jako Definice (stabilita) Řešení xt ( ) = 0 je stabilní (2.59), jestliže ε > 0 δ ( ε, t ) > 0 ( ) δ ( ) xt xt ε t t (2.60) To je platné pouze pro jednotlivé vzorky; nelze říct nic o tom, co se stane mezi nimi. To je také to, co je nejzajímavější na identifikaci soustavy. Při návrhu řídicího členu je velmi důležité, aby soustava mohla být řízena spojité. Ve většině praktických situacích, stabilita v diskrétním čase také vyjadřuje stabilitu ve spojitém čase. Jestliže je platný výraz (2.60) pro δ nezávislé na t 0, potom řekneme, že řešení je rovnoměrně stabilní. Poznamenejme, že stabilita je spojitá vlastnost řešení s ohledem na počáteční stav. Stabilita znamená, že je možné získat řešení libovolně blízko k nominálnímu řešení, se startem x =. Často není toto v počátečním stavu, který je dostatečně blízko k nominálnímu řešení ( ) splněno z důvodu, že jsou k dispozici dvě řešení libovolně blízko. Pro asymptotickou stabilitu, jsou požadována dvě řešení, která jsou shodná. Definice (Asymptotická stabilita) 0 0 Řešení xt ( ) = 0 je asymptoticky stabilní, jestliže-li je stabilní a existují takové ( ) platí pro všechna xt ( 0 ) ρ. Definice (Exponenciální stabilita) ρ t 0 > 0, že xt ( ) 0 pro t (2.61) Řešení xt ( ) = 0 je exponenciálně stabilní, jestliže-li existují c > 0 a λ > 0 takové, že pro všechna t > t0. ( ) ( ) ( ) exp λ ( ) xt cxt t t

75 Někdy není významnou otázkou stabilita řešení pro získání ohraničeného výstupu při ohraničeném vstupu. Příklady norem použitých v těchto případech jsou ( ) = sup xt ( ) xt l, (2.62) t T xt () l 2 = x () t xt (), t= 0 () xt () xt 1 p p l p =. t= 0 (2.63) (2.64) Definice (BIBO stabilita) Řešení xt ( ) = 0 je BIBO stabilní, jestliže-li existují konstanty c u, cx takové, že ( ) ( ) u t < c xt < c l u V modelu s neuronovou sítí pouze s ohraničenými aktivačními funkcemi, jako jsou hyperbolický tangent, bude výstup vždy ohraničený. To bude také v případě, jestliže-li není xt) na výstupní vrstvu tvořeno pouze propojení ze vstupního prostoru ( u( t ) a stavu ( ) neohraničenými (např. lineárními) aktivačními funkcemi. Pro lineární, časově neměnnou soustavu je známo, že asymptotická, BIBO a exponenciální stabilita je získána, jestliže-li hodnoty vlastních čísel matice soustavy (odpovídající pólům přenosové funkce) jsou naprosto jasně uvnitř oblasti stability, tj. uvnitř jednotkové kružnice. Pro nezávislou nelineární soustavu jsou počátky asymptoticky lokálně stabilní, jestliže linearizovaná matice soustavy má všechny vlastní hodnoty menší než jedna. V souvislosti s v čase měnících se vstupů, lineárních soustav a modelů, jako jsou modely z neuronových sítí, je analýza mnohonásobně složitější. Za předpokladu, že časová změna, je dostatečně malá, stabilita neuronové sítě nebo řídicího členu může být zajištěna vyhodnocením vlastních hodnot linearizované soustavy. Následně, stabilita je rozuměna jako heurističtější pojem. Což je obvykle znamená, že signál by neměl explodovat a odchýlit se daleko od požadované hodnoty. Typický problém stability je, když se neuronová síť nebo výstup soustavy směřují směrem k přílišným oscilacím, namísto hladkého průběhu nebo se signál dostává do saturace. l x 75

76 Terminologie Používají-li se neuronové sítě k modelování, bývá často používána rozdílná terminologie. To vychází z toho, že základy problematiky neuronových sítí jsou položeny více či méně nezávisle na problematice statistického modelování. Již bylo uvedeno, že jako odhadování (ocenění) bývá nazýváno tréninkem nebo učením. Jak Ljung a Sjoberg [22] tak Starle [23] vytvořili malé slovníky obsahující běžné výrazy. Používá se obvykle termínů učitel a student : V reálném systému se vztah ( ) = ϕ(, θ ), θ + ( ) y t g0 t 0 0 et (2.65) obvykle nazývá učitel a struktura modelu (množina kandidátů modelu) :{ ϕ(, θ), θ θ p} () = ϕ(, θ), θ+ (), M g t D m y t g t et R (2.66) se nazývá prostor studenta. Jednotlivé modely jsou pak nazývány studenti. Podmínka S M je tedy vysvětlena slovně jako učitel leží v prostoru studenta Výběr prostoru zpoždění Výběr struktury modelu je zde upravován na velmi obecné úrovni. Přesnější pojednání bude provedeno později. Často je kladen malý důraz na volbu architektury sítě. Avšak špatný výběr prostoru zpoždění, např. počet zpožděných signálů (použitých jako regresní vektor), může mít katastrofální vliv na některé řídicí aplikace. Příliš malý prostor obvykle vede k tomu, že dynamika nemůže být dostatečně modelována, příliš velký prostor může také způsobovat problémy. Z teorie lineárních systémů je známo, že příliš velký prostor zpoždění se může samostatně objevit jako normální členy v identifikované přenosové funkci (funkcích). V nelineárním případě můžeme očekávat stejné chování. Ačkoliv to není vždy problém, takto vzniklé členy (odpovídající skrytým módům) mohou vést k těžkostem při návrhu některých řídicích členů. Přesný výběr architektury sítě a regresního vektoru bude probrán později. Některé metody známé jako prořezávací algoritmy mohou pracovat se strukturou modelu, která je příliš velká a postupně ji zmenšovat, dokud nenaleznou optimální strukturu. Vytvoření adekvátního dostatečně velkého počátečního modelu může být však těžko dosaženo metodou pokus-omyl. Je nezbytné určit jak dostatečně velký prostor zpoždění, tak i odpovídající počet skrytých jednotek. Pokud je obtížné použít fyzikálního přístupu k určení počtu skrytých jednotek, ale tento přístup může určovat vhodný prostor zpoždění. Je-li prostor zpoždění vhodně určen, je úloha výběru struktury modelu podstatně zúžena. Jestliže nemáme žádnou představu o prostoru zpoždění, je někdy možné jej určit empiricky. V [24] je jedna taková metoda popsána a tato může být použita pro deterministické soustavy. Metoda je založena na apriorním předpokladu, že soustava může být reprezentován přesně funkcí, která je na regresorech dostatečně hladká. 76

77 Předpokládejme, že je možné popsat soustavu pomocí modelu NNARX bez šumu, tedy ( ) = 0 ϕ( ), θ T () t = [,,..., ] y t g t ϕ ϕ ϕ ϕ 1 2 z (2.67) ( 1... ) ( ), ( )... ( ) T ϕ = y t y t n u t n u t d m (2.68) Nechť se množina dat skládá z N vstupně-výstupních párů poskytovaných { ϕ (), (), 1,... } N Z t y t t N V části 2.3 je vysvětleno, jak získat množinu dat z experimentu = = (2.69) Předpokládejme, že velikost derivace soustavy vzhledem ke každému z regresorů je omezena nějakou kladnou hodnotou B, g0 gt = Bl= 1,2,..., z. ϕ l (2.70) Pro všechny kombinace párů vstup-výstup, je nyní Lipschitzův kvocient zaveden jako ( i) y( tj) ( t ) ϕ( t ), y t qij = i j ϕ i j (2.71) kde je euklidovská norma, tj. vzdálenost. Lipschitzova podmínka tedy stavuje, že qij je vždy omezené, jestliže funkce g 0 je spojitá, tj. splňuje podmínku 0 i, j L. Předpokládejme nyní diference: δ y = y( ti) y( tj), δϕl ϕl( ti) ϕl( tj) ϕ l malé, platí následující aproximace =. Jsou-li diference g g g δy = δϕ + δϕ δϕz ϕ ϕ ϕ = gδϕ + g δϕ g δϕ z z z (2.72) Lipschitzův kvocient pak musí splňovat podmínku q ij ( z) = δ y ( δϕ ) ( δϕ ) z (2.73) gδϕ g δϕ 1 1 z z = 2 2 ( δϕ1) ( δϕz) zb Index ( ) z udává celkový počet regresních vektorů. 77

78 Zajímavé je použít tuto nerovnost ve dvou rozdílných případech: regresní vektor je nedostatečný a regresní vektor je příliš velký. Nedostatečný počet regresorů: předpokládejme, že z tý regresor chybí: q ij ( z 1) = δy ( δϕ ) ( δϕ ) z 1 ( ) ( ) 2 2 δϕ δϕ gδϕ g δϕ = 1 z 1 1 z z ( δϕ ) ( δϕ ) ( δϕ ) ( δϕ ) z 1 1 z (2.74) Jako extrémní příklad si představme, že rozdíl δϕ l = 0 pro všechny l s výjimkou l = z. Jestliže-li výstup závisí na z tém regresoru, pak bude obvykle existovat bod, kde rozdíl δ y 0. Bez ohledu na regresor ϕ z to povede na nekonečný Lipschitzův kvocient. Obecně se samozřejmě nelze spoléhat na možnost, že data obsahují takový případ. Avšak, musíme očekávat, že nedostatek regresorů velmi často vede na velmi velké kvocienty. Navíc, čím více regresorů chybí, tím rychleji kvocient roste. Více regresorů, než je nezbytné: Jestliže je v regresním vektoru zahrnuto příliš mnoho zpoždených signálů pak, vektor obsahuje nadbytečnou informaci. Předpokládejme například případ, kdy je jeden regresor navíc. Potom q ij ( z+ 1) = δy ( δϕ ) ( δϕ ) z+ 1 ( ) ( ) 2 2 δϕ δϕ gδϕ g δϕ = 1 z 1 1 z z ( δϕ ) ( δϕ ) ( δϕ ) ( δϕ ) z+ 1 1 z (2.75) Je zřejmé, že nadbytečný regresor má menší vliv na Lipschitzův kvocient, protože typicky vede k nevýznamnému zmenšení kvocientu. V článku [24] jsou tyto vlastnosti využity v kritériu pro stanovení optimální struktury regresoru. Celý postup je následující: Pro zvolený prostor zpoždění, se určí Lipschitzovy kvocienty pro všechny kombinace vstupně-výstupní párů. Vybere se největší kvocient p = 0,01 N ~0,02N. Největší kvocient se obvykle vyskytuje tam, kde jsou rozdíly δϕ l malé. Vyčíslí se kritérium 1 p p ( n) ( n ) qij = nq ( k). k = 1 (2.76) Opakují se výpočty pro všechny různé struktury zpoždění. 78

79 Vykreslí se kritérium jako funkce prostoru zpoždění a vybere se optimální počet regresorů jako zlomový bod křivky. Při výpočtu všech kvocientů je toto řešení velmi náročné na spotřebu výpočetního času. Platí to především tehdy, je-li N velké a přejeme-li si prozkoumat velký počet struktur zpoždění. Proto je vhodné zvážit, zda by se neměl zvětšovat počet zpožděných vstupů a výstupů součastně. Obr zobrazuje použití metody na množinu dat, získaných ze simulačního experimentu s nelineárním dynamickým systémem. Počet zpožděných vstupů a výstupů je zvětšován součastně z n= m= 1 na n= m= 8. Je vidět, že kritérium doporučuje použít prostor zpoždění n= m= 8, což je ve skutečnosti správná dimenze tohoto prostoru Souhrn kapitoly Obr : Hodnoty kritéria pro různé prostory zpoždění V této kapitole byly uvedeny různé modely včetně lineárních a nelineárních modelů založených na neuronových sítích. Struktura modelu Struktura modelu je množina kandidátů modelu. Výběr struktury modelu zahrnuje výběr množiny vstupů (regresorů) a určení jak kombinovat regresory do jednokrokové predikce. Lineární nebo nelineární Je-li získána predikce jako lineární kombinace regresorů, říkáme, že struktura modelu je lineární. Jsou-li regresory použity jako vstup do neuronové sítě, struktura modelu je nelineární. 79

80 Regresní vektor Regresory představují zpožděné signály. Některé obecné struktury modelů jsou získány následující volbou regresorů. FIR/NNFIR: poslední řídicí vstupy. ARX/NNARX: poslední řídicí vstupy a měřené výstupy. OE/NNOE: poslední řídicí vstupy a predikované výstupy ARMAX/NNARMAX: poslední řídicí vstupy, predikované výstupy a residuí SSIF/NNSSIF: poslední vstup, odhad stavu a rezidua Někdy se také používají kombinované lineární a nelineární struktury modelů. Fyzikální pochopení může také naznačit, že regresory jsou jednoduché signálové funkce, např. dva signály jsou násobeny nebo signály umocněny na druhou. Architektura sítě Stabilita Pro nelineární struktury modelů se musí kromě regresorů vybrat odpovídající architektura sítě. To předpokládá určit odpovídající počet skrytých jednotek. Prediktory musí být stabilní. Nestabilita se může vyskytnout u struktur modelů, které mají zpětnou vazbu. Jsou obvykle upřednostňovány NNFIR a NNARX modely, protože první volba jejich prediktorů nemůže být nestabilní ani tehdy, je-l modelovaná soustava soustava je nestabilní. Ačkoliv prediktor musí být z principu stabilní, problém se stabilitou se může vyskytnout v průběhu tréninku, nebo v případě, je-li získaný model nepřesný. Prostor zpoždění V případě prostředí bez rušení je někdy vhodné určit prostor zpoždění (počet zpožděných vstupů a výstupů) automaticky s takzvanými Lipschitzovými kvocienty. Terminologie Stejné záležitosti mají rozdílné názvy v odlišných oblastech. Například trénink nebo učení, které jsou používány ve většině publikací, zabývajících se neuronovými sítěmi, jsou nazývány jako odhad ve statistických publikacích. V terminologii existuje mnoho takových odlišností. 80

81 3.2.3 Experiment Prvotním účelem experimentu je vytvořit soubor příkladů k identifikaci odezvy dynamické soustavy na různé řídicí vstupy. První částí identifikačního procesu je stanovení úzkých míst v procesu a určení požadavků na přesnost modelu. Experiment je obzvlášť důležitý při modelování nelineárních systémů, jejichž vnitřní strukturu neznáme (černá skříňka). Zde musí být věnována zvýšená péče sběru dat, která popisují chování systém v celém jeho pracovním rozsahu. V této části bude zaměřena pozornost na různé otázky návrhu experimentu, zahrnující víc než jen generování dat pro trénink neuronové sítě. Tato část je zahrnuje tato témata: - Test na ověření rozhodnutí zda-li je nutné použít nelineární přístup. - Návrh vstupních signálů pro získání adekvátních souborů dat - Metody přípravy dat pro model založený na neuronových sítích. Rovněž výběr a poloha snímačů by také měly být součástí experimentu, a proto dále budeme předpokládat, že je k dispozici kompletní soustava i se snímači. Dále se předpokládá možnost více či méně libovolného nastavování vstupů, které v praxi také není vhodné předpokládat. Mnoho průmyslových soustav, které bychom si přáli identifikovat, je již v činnosti (vyrábí nějaké produkty). Například to jsou pece, reaktory, destilační kolony. Měnit vstup bez ohledu na vyráběný produkt může způsobit vážné problémy. Avšak strategie pro zahrnutí těchto omezení překračují rámec této publikace. V praktických situacích je potřeba vést experiment ve shodě s doporučeními návodů a maximálně se snažit zabránit poškození soustavy Kdy je lineární model nedostatečný? Je-li cílem identifikace soustavy vytvoření modelu, který může být použit k návrhu řídicího systému, je často dostačující použít méně přesný lineární model, i když bude soustava řízena nelineárně. Důvodem k tomuto rozhodnutí je podstatně jednodušší návrh a implementace řídicích členů založených na lineárním modelu. Jestliže jsou nedostatky ve znalosti fyzikálních principů nebo rozhoduje-li se, zda je lineární model přijatelný, může být jednoduše odhadnout počet různých lineárních modelů pro řešení úlohy. Tato volba představuje bezpečnější, ale samozřejmě také pracnější způsob ověření. Abychom se vyhnuli zbytečnému plýtvání časem, je žádoucí mít sadu jednoduchých testů pro určení jak moc lineární systém ve skutečnosti je. Několik jednoduchých testů nelinearity je uvedeno níže. Tyto a další testy jsou popsány v [25] a [26]. Kontrola principem superpozice U nelineárního systému neplatí princip superpozice a neplatí homogenita ( ) = ϕ ( ) + ϕ ( ) = ϕ ( ) + ϕ ( ) y t g t t g t g t , (2.77) 81

82 ( ) = αϕ( ) = α ϕ( ) y t g t g t, (2.78) alespoň ne v pracovním rozsahu. Jestliže-li systém neovlivňují žádné poruchy, je jednoduché tuto kontrolu provést. Je nezbytné předpokládat, že (2.77), (2.78) platí pro lineární soustavu v ustáleném stavu; jinak se také musí brát v úvahu počáteční podmínky. Jestliže-li je systém stabilní, může se také počkat s kontrolou podmínek, dokud neodezní přechodový jev. Jako příklad se může použít následující procedura: je použit nulový vstupní signál a počká se na dosažení ustáleného stavu a následně se prověří stejnosměrný offset ( D ). Poté se použijí dva rozdílné signály u 1, u 2, pro které platí: Jestliže-li je systém lineární, pak by poměr ( ) ( ) u t = cu t. (2.79) 2 1 () r t = 2 1 ( ) () y t D y t D (2.80) měl být v každém časovém okamžiku roven c. Pro tento příklad bude index nelinearity soustavy dán jako v = a pro lineární systémy měl být roven nule. max i ( ) r t c c (2.81) Kontrola frekvenční odezvy Obecně je známo že frekvenční odezva lineárního systému je jedinečná bez ohledu na amplitudu vstupního signálu. Pro kontrolu linearity mohou být použity odlišné sinusové signály působící na systém. Frekvence i amplituda signálu by se měla měnit. Jestliže-li je systém lineární, ustálený výstup by měl mít sinusový průběh se stejnou frekvencí a amplituda na výstupu musí být úměrná amplitudě na vstupu. Kontrola přítomnosti subharmonických frekvencí pomocí Fourierovy analýzy výstupního signálu může dát další představu o nelinearitě. Přirozeně, v případě systému zatíženého rušením, se musí věnovat tomuto problému určitá pozornost. Mimoto, jestliže je soustava silně zatížena nadměrným rušením, je doporučováno, aby byla průměrována sekvence výstupních hodnot z více pokusů Otázky při návrhu experimentu Jestliže-li fyzikální znalosti nebo testy nelinearity odůvodňují identifikaci založenou na neuronových sítích, musí být pro odhad uvažovány různé otázky týkající se získávání vhodných dat. Volba vzorkovací frekvence Jestliže je zvolená vzorkovací frekvence vyšší v porovnání s dynamikou uvažovaného systému, je pravděpodobné, že se vyskytne řada problémů se špatnou numerickou 82

83 podmíněností při pokusu o identifikaci modelu [27]. Když je prováděna identifikace spolu s návrhem systému řízení, pak výběr vzorkovací frekvence se stává poněkud komplikovaným. V tomto případě, by vzorkovací frekvence měla být vybírána ve shodě s navrhovanou dynamikou uzavřené smyčky, skládající se z řídicího členu a regulované soustavy. Měla by tedy být tak vysoká, aby umožnila rychlé sledování cíle a hladší průběh řídicího signálu. Vyvstává ovšem problém s numerickou podmíněností. Vzorkovací frekvence by tedy měla být vybrána jako rozumný kompromis mezi identifikací soustavy a návrhem regulátoru. Problém dimensionality Jak již bylo uvedeno dříve, superpozice a homogenita nejsou u nelineárních systémů použitelné. Navíc nelinearita vyvolává velký nárůst požadavků na budící vstupní signál. Zatímco při identifikaci lineárních systémů postačí použít signál obsahující konečný počet frekvencí, požadavky nelineárního systému jsou přibližně takové, že bychom ve vstupním signálu potřebovali všechny kombinace frekvencí a amplitud z pracovního rozsahu soustavy. Důsledkem toho je dramatický nárůst nezbytné velikosti souboru dat s počtem vstupů a výstupů. Naneštěstí není zde zjevné, jak dosáhnout nápravy. To představuje podstatný nedostatek v přístupu k nelineárním černým skříňkám a v zásadě to zabraňuje rozšíření neuronových sítí k identifikaci rozsáhlých soustav. Volba vstupního signálu Před výběrem vstupního signálu je důležité určit pracovní rozsah soustavy. Zvláštní pozornost musí být věnována pochopení dynamických jevů, které nejsou určeny k zahrnutí do modelu (např. mechanické rezonance). Obvykle to znamená, že vstupní signál musí být omezen na dostatečně nízké frekvence. Při identifikaci lineárního systému je obvyklé použití signálu sestávajícího z několika sinusoid s rozdílnou amplitudou. Rovněž jsou také populární takzvané PRBS signály (Pseudo Random Binary Sequence). Nicméně, když se pracuje s nelineárními strukturami modelů, je důležité, aby všechny amplitudy a frekvence byly reprezentovány tak, jak bylo uvedeno výše. Některé signály, které se snaží splnit tyto požadavky, budou vysvětleny. Doplňující informace lze nalézt například v [12]. Signál po N-vzorcích konstantní Nechť et ( ) je bílý šum s rozptylem 2 σ e. Signál je definován jako t 1 u() t = eint + 1, t = 1,2,... N (2.82) a skok na novou úroveň nastane pro každý N-tý vzorkovací okamžik (int představuje celou část). Kovariační funkce je R ( τ) N τ N e2 u = σ, (2.83) a její spektrální hustota je 2 e σ 1 cos Nω φ( ω) =. 2πN 1 cosω (2.84) 83

84 Příklad signálu je na obr Obr : Signál po N-vzorcích-konstantní pro N = 15. Signál je normován na interval 1;1 [ ] U většiny systémů řízení generuje řídicí člen výstupní signál, který se mění pouze málo mezi et Gausovo rozložení, lze předpokládat modifikace typu dvěmi následujícími vzorky. Má-li ( ) náhodný průchod, odpovídající filtru typu dolní propust: t 1 u() t = u( t N) + eint + 1, t = 1,2,.. N (2.85) Náhodná změna úrovně Rozšíření signálu po N-vzorcích-konstantního je získáno vnesením přídavné náhodné proměnné pro rozhodování, kdy se má úroveň měnit. () u t u( t 1) () spravděpodobností α = et spravděpodobností 1 α (2.86) Kovariační funkce tohoto signálu je ( τ) 2 R u ασ τ e = (2.87) a odpovídající spektrální hustota je 2 e 1 α cos σ φ( ω) =. π α α ω (2.88) 84

85 Obr : Vstupní signál, jehož úroveň je měněna náhodně. Signál je zobrazen pro α = 0,5 a 0,9 Signál je znázorněn na obr α = a v obou případech je normován na interval [ 1;1] Opět je možno předpokládat modifikaci signálu náhodným průchodem nebo filtrem typu dolní propust. Kmitočtově rozmítaný signál Kmitočtově rozmítaný signál je sinusový, s postupně se zvyšující frekvencí. S takovým signálem je možno přesně budit v požadovaném frekvenční rozsahu. Kmitočtově rozmítaný signál může být generován podle procedury, uvedené níže. [28] t ωt = ωstart + ( ωfinal ωstart ) N u() t = u0 + Asin ( ωttts), t = 1,2,.. (2.89) Průběh signálu je zobrazen na obr

Zobrazit více