ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ v Praze. Fakulta elektrotechnická Katedra měření



Podobné dokumenty
Úvod do zpracování signálů

Genetické algoritmy. Informační a komunikační technologie ve zdravotnictví

doc. Dr. Ing. Elias TOMEH Elias Tomeh / Snímek 1

Projekční algoritmus. Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění. Jan Klíma

1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15

Evoluční výpočetní techniky (EVT)

7. Rozdělení pravděpodobnosti ve statistice

Jak se matematika poučila v biologii

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ

31SCS Speciální číslicové systémy Antialiasing

U Úvod do modelování a simulace systémů

Signál v čase a jeho spektrum

SIGNÁLY A SOUSTAVY, SIGNÁLY A SYSTÉMY

doc. Dr. Ing. Elias TOMEH Elias Tomeh / Snímek 1

Kapitola 1. Signály a systémy. 1.1 Klasifikace signálů

CW01 - Teorie měření a regulace

Náhodné (statistické) chyby přímých měření

OSA. maximalizace minimalizace 1/22

Modelování a simulace Lukáš Otte

Posouzení přesnosti měření

Chyby měření 210DPSM

Biofyzikální ústav LF MU Brno. jarní semestr 2011

Vlastnosti a modelování aditivního

OPTIMALIZACE. (přehled metod)

Základy a aplikace digitálních. Katedra radioelektroniky (13137), blok B2, místnost 722

KTE/TEVS - Rychlá Fourierova transformace. Pavel Karban. Katedra teoretické elektrotechniky Fakulta elektrotechnická Západočeská univerzita v Plzni

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

VY_32_INOVACE_E 15 03

8. Sběr a zpracování technologických proměnných

1. Základy teorie přenosu informací

Číslicové zpracování signálů a Fourierova analýza.

ZPRACOVÁNÍ SIGNÁLŮ Z MECHANICKÝCH. Jiří Tůma

Algoritmizace diskrétních. Ing. Michal Dorda, Ph.D.

Markov Chain Monte Carlo. Jan Kracík.

Analýza dat na PC I.

SIGNÁLY A LINEÁRNÍ SYSTÉMY

Evoluční algoritmy. Podmínka zastavení počet iterací kvalita nejlepšího jedince v populaci změna kvality nejlepšího jedince mezi iteracemi

Numerické metody a programování. Lekce 8

PŘEDNÁŠKA 03 OPTIMALIZAČNÍ METODY Optimization methods

Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář,

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Algoritmy pro spojitou optimalizaci

Datové struktury 2: Rozptylovací tabulky

Kombinatorická minimalizace

SIGNÁLY A LINEÁRNÍ SYSTÉMY

SPM od A do Z. pozadí metody SPM. SPM od A do Z. Copyright SPM Instrument

Stanovení nejistot při výpočtu kontaminace zasaženého území

Úvod do optimalizace, metody hladké optimalizace

P9 Provozní tvary kmitů

A0M33EOA: Evoluční optimalizační algoritmy

TECHNICKÁ UNIVERZITA V LIBERCI

VY_32_INOVACE_ENI_2.MA_05_Modulace a Modulátory

1 Modelování systémů 2. řádu

Prohledávání do šířky = algoritmus vlny

UNIVERZITA PARDUBICE. 4.4 Aproximace křivek a vyhlazování křivek

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Hlavní parametry rádiových přijímačů

3 METODY PRO POTLAČENÍ ŠUMU U ŘE- ČOVÉHO SIGNÁLU

Návrh frekvenčního filtru

Náhodné chyby přímých měření

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

Pokročilé operace s obrazem

Zákony hromadění chyb.

Lineární a adaptivní zpracování dat. 2. SYSTÉMY a jejich popis v časové doméně a frekvenční doméně

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

Osnova. Idea ASK/FSK/PSK ASK Amplitudové... Strana 1 z 16. Celá obrazovka. Konec Základy radiotechniky

Náplň. v Jednoduché příklady na práci s poli v C - Vlastnosti třídění - Způsoby (algoritmy) třídění

Lineární a adaptivní zpracování dat. 3. SYSTÉMY a jejich popis ve frekvenční oblasti

Motivace příklad použití lokace radarového echa Význam korelace Popis náhodných signálů číselné charakteristiky

Náhodné signály. Honza Černocký, ÚPGM

VOLBA ČASOVÝCH OKEN A PŘEKRYTÍ PRO VÝPOČET SPEKTER ŠIROKOPÁSMOVÝCH SIGNÁLŮ

Časová a prostorová složitost algoritmů

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Číslicové filtry. Honza Černocký, ÚPGM

SPM SPECTRUM NOVÁ UNIKÁTNÍ METODA PRO DIAGNOSTIKU LOŽISEK

T- MaR. Ústav technologie, mechanizace a řízení staveb. Teorie měření a regulace. Podmínky názvy. 1.c-pod. ZS 2015/ Ing. Václav Rada, CSc.

A/D převodníky - parametry

Ctislav Fiala: Optimalizace a multikriteriální hodnocení funkční způsobilosti pozemních staveb

Regulační diagramy (RD)

Lineární a adaptivní zpracování dat. 2. SYSTÉMY a jejich popis v časové doméně a frekvenční doméně

filtry FIR zpracování signálů FIR & IIR Tomáš Novák

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

Seminář z umělé inteligence. Otakar Trunda

Inovace studia molekulární a buněčné biologie reg. č. CZ.1.07/2.2.00/

popsat princip činnosti základních zapojení čidel napětí a proudu samostatně změřit zadanou úlohu

9. PRINCIPY VÍCENÁSOBNÉHO VYUŽITÍ PŘENOSOVÝCH CEST

Direct Digital Synthesis (DDS)

SEMESTRÁLNÍ PRÁCE X. Aproximace křivek Numerické vyhlazování

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Metaheuristiky s populacemi

(Auto)korelační funkce Statistické vyhodnocování exp. dat M. Čada ~ cada

Numerické metody optimalizace - úvod

MĚŘENÍ A ANALÝZA ELEKTROAKUSTICKÝCH SOUSTAV NA MODELECH. Petr Kopecký ČVUT, Fakulta elektrotechnická, Katedra Radioelektroniky

Úloha D - Signál a šum v RFID

Analýza a zpracování ultrazvukových signálů

Použití derivací L HOSPITALOVO PRAVIDLO POČÍTÁNÍ LIMIT. Monotónie. Konvexita. V této části budou uvedena některá použití derivací.

Algoritmy I, složitost

ZÁKLADY AUTOMATICKÉHO ŘÍZENÍ

1. Statistická analýza dat Jak vznikají informace Rozložení dat

STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ. J. Pruška, T. Parák

Transkript:

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ v Praze Fakulta elektrotechnická Katedra měření Separace signálů vibrací točivých strojů s využitím genetických algoritmů Diplomová práce 2010 Pavel KRPATA ČVUT Praha

Abstrakt Práce se zabývá metodami detekce různých kombinací vad valivých ložisek v točivých strojích. Hlavní náplní je návrh a experimentální ověření metod pro separaci frekvenčních pásem signálů vibrací generovaných vadou s využitím Genetických algoritmů. Obsahuje také srovnání těchto metod s klasickými metodami. V praktické části jsou otestovány různé modifikace algoritmu na reálných datech a zhodnocena schopnost detekce a rozlišení typu vady. Abstract This diploma thesis deals with methods of detection different faults (fault combinations) on rolling bearings. The aim is to design and examine methods of separation of frequency bands from vibration signal generated by fault, exploiting Genetic algorithms. These methods are also compared with classical methods. In final part, different modifications of the algorithm are evaluated and their ability to distinguish the fault type is compared using real vibration signal.

Poděkování Na tomto místě bych chtěl poděkovat zejména vedoucímu mé diplomové práce Ing. Adamu Dočekalovi za konzultace, odborné připomínky a trpělivost, dále pak svému zaměstnavateli Ing. Ivanu Mikolášovi za poskytnutí času na studium i tuto práci, svým rodičům za poskytnutí zázemí a podpory a také všem ostatním, zejména přátelům, kteří mi přímo či nepřímo pomáhali při vzniku této práce.

2

OBSAH 3 Obsah 1 Úvod do řešeného problému 5 2 Metody detekce vad ložisek 7 2.1 Charakteristiky signálu vibrací ložisek... 7 2.2 Ukazatele přechodových dějů... 8 2.2.1 Crest faktor... 8 2.2.2 Kurtosis... 8 2.2.3 Robust Kurtosis... 9 2.2.4 Porovnání ukazatelů přechodových dějů... 10 2.3 Klasické metody... 10 2.4 Spectral Kurtosis a Kurtogram... 11 2.5 Využití adaptivní selekce frekvenčních pásem... 13 2.6 Určení opakovací periody přechodových dějů... 14 3 Optimalizační algoritmy 16 3.1 Úvod a přehled metod pro optimalizaci... 16 3.2 Genetické algoritmy... 18 3.2.1 Úvod... 18 3.2.2 Princip genetických algoritmů... 18 3.2.3 Ohodnocovací funkce... 22 3.2.4 Kódování jedinců... 22 3.2.5 Selekce.... 23 3.2.6 Křížení... 24 3.2.7 Mutace... 27 3.2.8 Nahrazování generací... 27 3.2.9 Teorie schémat... 28 3.3 Modifikace genetických algoritmů pro vyhledání více extrémů... 30 3.3.1 Sdílení hodnocení... 31 3.3.2 Dynamické sdílení hodnocení... 32 4 Genetický algoritmus pro detekci vad ložisek 35 4.1 Hodnotící funkce... 35 4.2 Porovnání a výběr vhodného filtru... 36 4.3 Parametry genetického algoritmu... 39 4.4 Modifikace genetického algoritmu... 39 5 Výsledky experimentů 40 5.1 Popis ložiska a soustrojí použitého pro měření... 40 5.2 Detekce vad... 43 5.2.1 Testy s využitím umělého signálu... 43 5.2.2 Testy s využitím reálného signálu... 46

4 OBSAH 5.3 Rozlišitelnost vad... 52 5.4 Identifikace vad... 52 5.4.1 Zhodnocení identifikace vad... 55 6 Závěr 57 A Slovník pojmů 61 A.1 Diagnostika... 61 A.2 Evoluční algoritmy... 61 B Adresářová struktura přiloženého DVD 63 B.1 Zdrojové kódy... 63 B.2 Data a dokumentace... 64

5 1 Úvod do řešeného problému Práce se zabývá rozborem a experimentálním porovnáním několika metod detekce vad valivých ložisek ve stádiích, kdy se ještě viditelně neprojevují a neovlivňují správnou funkci zařízení. Ložiska patří mezi důležité součásti většiny točivých strojů. Při poruše ložiska je nutné často na dobu nezbytnou k zajištění opravy odstavit celý stroj, což přináší časové a ekonomické ztráty. Vada ložiska může mít navíc nepříznivý vliv na ostatní komponenty stroje nebo dokonce ohrozit zdraví obsluhy. Možnost detekovat vadu v okamžiku, kdy se ještě neprojevuje, umožňuje naplánovat odstávku stroje za účelem opravy vadné součásti dostatečně předem a minimalizovat tak možné nepříznivé dopady. Z těchto důvodů byla vyvinuta celá řada diagnostických metod pro analýzu stavu ložisek. Pozornost bude věnována metodám založeným na analýze vibrací zkoumané části stroje, snímaných pomocí akcelerometrů pevně spojených s danou částí. Počínající vada ložiska je charakteristická periodicky se opakujícími tlumenými vysokofrekvenčními zákmity 1. Z frekvence opakování těchto zákmitů lze navíc odhadnout na které části ložiska se vada nachází. Tyto průběhy, specifické pro vadu, jsou však téměř vždy utopeny v dalších komponentách signálu generovaných soustrojím a v šumu vznikajícím na všech prvcích měřicího řetězce, takže obecné metody, jako je například použití výkonové spektrální hustory, pro jejich identifikaci selhávají. Data vibrací Pásmová propust Detekce obálky Vyhodnocení Obrázek 1.1: Schema analýzy vibrací v pevně zvoleném pásmu Klíčovou úlohou je proto nalezení vhodného frekvenčního pásma 2 a odfiltrování nežádoucích komponent signálu. Nejednodušší metody (viz obr. 1.1) pracují s pevně zvoleným frekvenčním rozsahem, kde je signál po filtraci posuzován metodami pro detekci průběhů charakteristických pro hledanou vadu. Rozbor použitých metod je v kapitole 2.2. Tento přístup je vhodný pouze pro specifické případy, neboť frekvence generované vadou závisí na pracovních podmínkách stroje například otáčkách, ale i dalších vlivech, které mohou ovlivnit vybuzené vlastní frekvence (módy). Dalším důležitým faktorem je typ a rozsah vznikající vady. Pozornost se proto zaměřuje na metody, schopné samostatně identifikovat a vybrat ze signálu komponenty charakteristické pro hledané vady, viz obr. 1.2. Oproti klasickým metodám je zde zavedena zpětná vazba, která se na základě vyhodnocení signálu po filtraci snaží adaptivně upravovat parametry filtru, tak aby charakter signálu po filtraci co nejvíce odpovídal průběhům charakteristickým pro vady ložiska. Jedná se vlastně o optimalizační úlohu, která se snaží pomocí různých modifikací filtru dosáhnout co nejlepšího vyhodnocení zvolenou funkcí pro detekci signálu charakteristického pro vadu 1 vznikajícími při styku poškozené části s dalšími částmi ložiska 2 resp. frekvenčních pásem, pokud má být možnost detekovat více vad najednou

6 ÚVOD DO ŘEŠENÉHO PROBLÉMU Data vibrací Adaptivní pásmová propust Detekce obálky Vyhodnocení Nastavení pásma Vyhodnocení prech. deju Obrázek 1.2: Schema analýzy vibrací s adaptivní selekcí frekvenčních pásem (viz kapitola 2.2). Blok Vyhodnocení přechodových dějů na obr. 1.2 představuje detekční metodu a blok Nastavení pásma odpovídá algoritmu, který provádí vhodnou adaptaci pásma (příp. pásem) filtru. Pokud v signálu není přítomna složka pocházející od vady, dojde k nalezení nějaké jiné (falešné) složky, která je hledanému charakteristickému tvaru nejvíce podobná. Tento případ lze snadno rozpoznat podle výrazně nižšího výsledného ohodnocení (míry shody) a většinou i podle netypického výsledného pásma. Tato práce se zabývá podrobným rozborem a testováním metod s adaptivní selekcí frekvenčních pásem s využitím optimalizačních algoritmů založených na simulované evoluci zejména genetických algoritmů. Výhodou těchto algoritmů je schopnost důkladného prozkoumání stavového prostoru, představovaného možnými frekvenčními pásmy, díky rysům paralelismu a vysoká odolnost proti uváznutí v lokálním extrému tedy nalezení jiné (falešné) složky i když je přítomen lépe odpovídající signál, pocházející od skutečné vady.

7 2 Metody detekce vad ložisek V této kapitole jsou rozebrány některé metody pro detekci vad valivých ložisek. Účelem je vytvoření představy a porovnání klasických metod a metod využívajících adaptivní selekci pásem. 2.1 Charakteristiky signálu vibrací ložisek Signál ze senzoru vibrací lze rozdělit na složku x(t) související s hledanou vadou a okolní šum, zahrnující signály generované ostatními součástmi soustrojí n(t). s(t) =x(t)+n(t) (2.1) Složku x(t) lze dále aproximovat sekvencí zákmitů, vyvolaných setkáním defektu (trhlinky, pitting apod.) s další částí ložiska podle vztahu (2.2). x(t) = k a k h(t τ k ) (2.2) průběh jednoho zákmitu vyvolaného defektem lze modelovat jako impulsní odezvu soustavy druhého řádu (2.3) se silným tlumením (malou časovou konstantou τ). h(t) =e t τ cos 2πfv t (2.3) {a k } je posloupnost náhodných veličin, které udávají proměnnou intenzitu nárazu a zpravidla mívá periodický charakter. {τ k } udává proměnný interval mezi nárazy, způsobený náhodnými prokluzy valivých elementů. 3 Shrnutí vlastností signálu x(t) viz [7] širokospektrý: vlivem silného tlumení je doba trvání zákmitu velmi krátká. Důsledkem je velká šířka spektra, 4 zvláště v prvopočátečních stádiích defektu. Se zvětšováním defektu přestává mít buzení charakter diracova impulsu a frekvenční rozsah zákmitu se snižuje. Čím širší rozsah frekvencí signál generovaný vadou zasahuje, tím obtížnější je jeho detekce a separace z toho plyne schopnost lepších metod 5 detekovat vady v dřívějších stádiích. malá energie: energie signálu vzniklého nárazem defektu je velmi malá, typicky méně než jedna tisícina celkové energie signálu. Větší podíl, nutný pro detekci, má pouze v omezeném frekvenčním rozsahu. nestacionární: z výše popsaných důvodů a ze vztahů (2.2) a (2.3) je zřejmá nestacionární podstata. Signál má cyklostacionární 6 charakter nebo přesněji, vlivem náhodných posunů vlivem prokluzů pseudo-cyklostacionární charakter. 3 odchylka od periody bez prokluzů je malá do 1 % 4 pro časovou a frekvenční lokalizaci platí obdoba Heisenbergova principu neurčitosti: Δt Δf = konst. 5 metody bez adaptivní selekce pásma zde výrazně zaostávají 6 statistické vlastnosti se v čase cyklicky opakují

8 METODY DETEKCE VAD LOŽISEK 2.2 Ukazatele přechodových dějů V této podkapitole jsou rozebrány metody vhodné pro určování přítomnosti přechodových dějů v signálu. Nejedná se přímo o metody detekce vad, ale často bývají jejich velmi důležitou součástí. 2.2.1 Crest faktor V české literatuře známý také jako činitel výkmitu. Jedná se o poměr špičkové a efektivní hodnoty určitého rozsahu vzorků, viz vztah (2.4). C = x peak (2.4) x rms V diagnostice je používaný pro detekci občasných výrazných vibračních rázů, které příliš neovlivní efektivní hodnotu, ale mají znatelný vliv na špičkovou hodnotu, čímž způsobí nárůst hodnoty crest faktoru. Při vyšší intenzitě rázů crest faktor, díky nárůstu efektivní hodnoty, opět klesá. Za rázy lze považovat i přechodové děje vzniklé vadami ložiska. Crest faktor je velmi jednoduchý ukazatel, vhodný pouze pro hrubé posouzení počínajících vad. Je také velmi náchylný na nahodilé špičky v signálu, které ani nemusí pocházet ze snímaných vibrací, ale mohou vzniknout později v některém místě měřícího řetězce a zpracování signálu. 2.2.2 Kurtosis Kurtosis, známá také jako koeficient špičatosti, je veličina používaná k podrobnějšímu popisu pravděpodobnostních rozdělení. Charakterizuje rozložení hustoty pravděpodobnosti veličiny kolem její střední hodnoty. 7 Rozdělení s málo se měnící pravděpodobností výskytu v celém rozsahu hodnot mají malou hodnotu kurtosis. Naopak rozdělení, kde se většina hodnot nachází blízko střední hodnoty, ale s jistou malou pravděpodobností je možný výskyt hodnot značně vzdálených od střední hodnoty dosahují vysokých hodnot kurtosis. Při výpočtu se obvykle kurtosis normuje tak, aby pro normální (Gaussovo) rozdělení vycházela nula. Na obr. 2.1 je ukázka různých pravděpodobnostních rozdělení a jejich hodnot kurtosis. Obecný vztah pro výpočet kurtosis je K = μ 4 σ 4 3=E([X E(X)]4 ) D(X) 2 3 (2.5) Dále se budou uvažovat pouze veličiny s nulovou střední hodnotou (u reálných dat dostatečné délky lze snadno dosáhnout jejím odečtením). 7 Obrazně tedy špičatost grafu hustoty pravděpodobnosti K = E(X4 ) E(X 2 ) 2 3 (2.6)

Ukazatele přechodových dějů 9 Obrázek 2.1: Hodnoty kurtosis pro různá pravděpodobnostní rozdělení Transformací náhodné veličiny Y = U 4, kde U je normované normální rozdělení, výpočtem střední hodnoty E(Y ) a využitím vztahu pro rozptyl D(X) =E(X 2 ) E(X) 2, z kterého pro normované normální rozdělení 8 plyne E(U 2 ) = 1, lze ověřit že pro normální rozdělení je hodnota kurtosis skutečně K(U) = 3. Vztah pro odhad kurtosis konečného diskrétního signálu: K = 1 n n i=1 x4 i ( 1 n n i=1 x2 i ) 2 3= n n i=1 x4 i ( 3 (2.7) n i=1 x2 i )2 Signál s osamoceně se vyskytujícími přechodovými ději s výrazným rozkmitem a krátkou dobou trvání (vysoké tlumení) dosahuje vysokých hodnot kurtosis, neboť většina vzorků se nachází poblíž 9 a během přechodového děje, vybuzeného vadou, se na krátkou dobu mnohonásobně zvětší amplituda. 2.2.3 Robust Kurtosis Kurtosis určená obvyklým způsobem (viz vztah (2.6)) je díky vysokým mocninám vstupních hodnot citlivá i na nahodile se vyskytující vyšší hodnoty 10, které nesouvisí s přechodovými ději. Pro zmírnění vlivu této vlastnosti se v diagnostice využívá tzv. robust kurtosis. Výpočet je obdobný, ale místo čtvrté mocniny vstupní veličiny v čitateli se používá druhá 8 pro které platí E(U) =0aD(U) =1 9 Uvažujeme-li nulovou stejnosměrnou složku 10 i když ne tak silně jako crest faktor

10 METODY DETEKCE VAD LOŽISEK mocnina a ve jmenovateli se rozptyl nahradí střední hodnotou absolutních hodnot veličiny, viz [12]. Na tuto modifikaci se dá také pohlížet jako na transformaci vstupní veličiny (signálu) pomocí druhé odmocniny X = (X). Vztah pro výpočet Robust kurtosis je opět normovaný tak, aby pro normální rozdělení vycházela kurtosis nulová a opět se uvažuje veličina s nulovou střední hodnotou. K = E(X2 ) 1.571 (2.8) E( X ) 2 Výpočtem střední hodnoty transformované veličiny Y = U lze, podobně jako u obecné kurtosis, ověřit, že K (U) =1.571. Pro odhad robust kurtosis z velkého počtu vzorků bude platit: K = n n i=1 x2 i ( n i=1 x 2 1.571 (2.9) i ) 2.2.4 Porovnání ukazatelů přechodových dějů Pro ukázku funkce popsaných ukazatelů byl použit testovací signál vytvořený opakováním přechodového děje, daného vztahem (2.3) s vlastní frekvencí f v = 8 khz a tlumením τ = 1/6000 s. Opakovací frekvence přechodového děje je 300 Hz a délka signálu 10 sekund. Souhrn hodnot ukazatelů pro bez šumu, různé kombinace signálu a aditivního šumu s gaussovským rozdělením amplitud a samotný šum je v tab. 2.1. Metoda pouze signál SNR(dB) -0,707-4,23-10,25-13,77 pouze šum Crest faktor 6,754 7,395 6,892 6,273 5,357 4,709 Kurtosis 23,59 5,037 1,812 0,506 0,04329 0,0018 Robust Kurtosis 9,733 0,418 0,160 0,0513 0,0064 0,0013 Tabulka 2.1: Porovnání ukazatelů přechodových dějů Z porovnání hodnot je zřejmá nejhorší rozlišovací schopnost u crest faktoru, kde je poměr mezi čistým signálem a čistým šumem pouze 1,43. Kurtosis a robust kurtosis mají rozumný poměr k hodnotě pro čistý šum ještě při SNR kolem 10 db robust kurtosis kolem 40 a klasická kurtosis dokonce 281. Nicméně je nutné si uvědomit, že se jedná o umělý signál, výsledky pro naměřená data budou zhodnocena v kapitole 5.2. 2.3 Klasické metody Tyto metody jsou s menšími či většími modifikacemi a rozšířeními založený na principu podle obr. 1.1. V této podkapitole je pro přehled popsán princip některých z nich.

Spectral Kurtosis a Kurtogram 11 Shock Pulse Method vyvinutá firmou SPM, využívá speciálních akcelerometrů s vlastní frekvencí okolo 32 khz. Při rázu v ložisku dojde k vybuzení této frekvence v samotném akcelerometru. Ze signál jsou pak pomocí filtru pevně nastaveného na tuto frekvenci odstraněny nežádoucí složky a dále zpracován klasicky. Empirical Mode Decomposition tato metoda provádí rozklad signálu na součet obecných kmitavých módů 11, nazývaných IMF Intrinsic Mode Function. Od ostatních metod se liší tím, že operuje čistě v časové oblasti. Princip spočívá v proložení lokálních minim a maxim dvěma kubickými spline a odečtení střední hodnoty obou funkcí vzniklých prokladem. Toto se cyklicky opakuje, dokud dochází při odečítání ke změně přesahující určitý práh. Tímto postupem se získá první IMF a jeho opakovanou aplikací na zbytek signálu se získají další IMF, až do požadovaného počtu. Pokud signál obsahuje vysokofrekvenční kmitavé módy, vzniklé poškozením ložiska, je možné je identifikovat analýzou jednotlivých IMF. Kepstrální analýza kepstrum (cepstrum) je definováno jako Fourierova transformace logaritmu výkonové spektrální hustoty a jeho jednotka je čas. Mezi jeho významné vlastnosti patří schopnost detekovat interval mezi frekvenčními složkami s konstantním rozestupem, které jinak nejsou ve spektru signálu rozeznatelné. Opakované tlumené přechodové děje si lze představit jako amplitudovou modulaci harmonického signálu o vlastní frekvenci komponenty ložiska nelineárním signálem. Produktem je řada postranních pásem s odstupem daném frekvencí opakování přechodového děje a jejich vyšších harmonických. Špička v kepstru pak přímo udává opakovací frekvenci zákmitů. Podobně jako u klasických metod je i tady nutné alespoň částečně ze signálu odstranit nežádoucí složky pomocí předřazeného filtru. 2.4 Spectral Kurtosis a Kurtogram Spectral Kurtosis je statistický nástroj určený k detekci nestacionárních komponent signálu, např. sekvencí přechodových dějů v zašumělém signálu, o kterých výkonová spektrální hustota nepřináší žádné informace. Je to jednorozměrná spojitá funkce závislá na frekvenci. Její přesné stanovení pro skutečný signál je problematické, proto se, podobně jako u výkonové spektrální hustoty používají odhady. Původní definice odhadu Spectral Kurtosis je standardizovaný čtvrtý centrální moment 12 přes reálné části STFT 13 přes všechny hodnoty časového parametru. Pro diskrétní STFT spektrum X(m, k) tedy platí SK(k) = N 1 n=0 (x x)4 X(n, k) [ N 1 ] 2 n=0 (x x)2 X(n, k) N 1 n=0 X(n, k) (2.10) 11 nemusí mít harmonický průběh 12 Kurtosis 13 Okénkové Fourierovy transformace

12 METODY DETEKCE VAD LOŽISEK Problémem je vhodná volba velikosti okna STFT, podle [11] je nutné aby jeho délka nebyla řádově větší než délka přechodového děje a zároveň zároveň šířka jeho spektra nebyla příliš velká vzhledem k frekvenčním změnám přechodového děje. Volbou délky okna se tedy nastavuje citlivost Spectral Kurtosis pouze na nestacionární děje s určitými parametry, které ale předem nejsou známé. Dalším parametrem na kterém závisí správnost funkce je velikost překryvu oken při posunu po časové ose. V [11] se doporučuje 75% překrytí. Kurtogram řeší tuto nevýhodu několikanásobným výpočtem kurtosis s postupným geometrickým zvyšováním frekvenčního rozlišení. Výpočet lze realizovat pomocí STFT a postupného zkracování délky okna tento způsob umožňuje zvyšovat frekvenční rozlišení s libovolně malým krokem (omezeným pouze vzorkovací frekvencí). Jiný, rychlejší způsob využívá dvou prototypů FIR filtru dolní a horní propust, kterými se signál rozdělí ve frekvenční oblasti na dva stejně velké úseky, pro které se vypočte kurtosis. Dále se u obou úseků vynecháním každého druhého vzorku (decimací) sníží vzorkovací frekvence na polovinu a znovu se aplikují na oba úseky stejné prototypy jako v prvním kroku. Tím dojde k dalšímu rozdělení obou podúseků ve frekvenční oblasti na poloviny. Tento postup se dále rekurzivně opakuje dokud není dosažena stanovená úroveň (počet úseků) viz obr. 2.2a. Po každém dělení se na všechny filtrací nově vzniklé signály aplikuje kurtosis. Takto vznikne diskrétní sada hodnot kurtosis, parametrizované dvojicemi hodnot (f c, Δf), kde f c je centrální frekvence pásma a Δf je šířka pásma. Tento způsob výpočtu se nazývá Fast Kurtogram. (a) (b) Obrázek 2.2: Princip kurtogramu převzato z [13] Modifikace pro jemnější dělení používá dalších tří prototypů, pomocí kterých se v každém kroku ještě signál vyhodnocuje po rozdělení na tři stejně velká pásma viz obr. 2.2b.

Využití adaptivní selekce frekvenčních pásem 13 Složitost algoritmu 14 je O(L.N log N), kde N je počet úrovní a L je délka prototypu filtru. Popsané metody výpočtu kurtogramu jsou podrobně rozebrány v [13]. Ukázka kurtogramu z reálného signálu s využitím robust kurtosis je na obr. 2.3. Maximum kurtogramu je na úrovni 3,5, což odpovídá šířce pásma 1365 Hz. Centrální frekvence pásma je 10240 Hz. Obrázek 2.3: Ukázka kurtogramu reálného signálu Z předchozího rozboru plyne že kurtogram je relativně jednoduchý, rychlý a deterministicky fungující algoritmus vhodný pro stanovení frekvenčního pásma defektu. Nevýhodou je omezená flexibilita testovaných frekvenčních pásem pozice i šířka pásma jsou dány binárním rozkladovým stromem. Přesto patří kurtogram mezi úspěšně používané metody a v případě náročnějších požadavků lze využít alespoň pro počáteční odhad hledaného pásma. 2.5 Využití adaptivní selekce frekvenčních pásem Princip adaptivní selekce frekvenčních pásem byl již naznačen v úvodní kapitole, blokové schéma je na obr. 1.2. Důvodem jejich vzniku je snaha o odstranění nevýhod výše uvedených metod a snaha o dosažení co nejpřesnější separace signálu generovaného defektem. Základem je filtr typu pásmová propust s proměnnými parametry, který je ovlivňován zpětnou 14 Notace O(g(n)) vyjadřuje asymptotický horní odhad složitosti nějaké funkce f(n). Pokud f(n) O(g(n), tak existuje c R + a n 0 N takové, že platí 0 f(n) c.g(n),n n 0.

14 METODY DETEKCE VAD LOŽISEK vazbou tak, aby bylo dosaženo jistých parametrů výstupního signálu zde co nejvyšší hodnoty některého z ukazatelů přechodových dějů. Využití zde nacházejí různé optimalizační algoritmy, kterým se věnuje následující kapitola. V případě klasických deterministických metod je třeba, aby počáteční nastavení filtru nebylo příliš vzdáleno od hledaného pásma, proto je třeba zvolit počáteční podmínky do místa předpokládaného výskytu rezonančních frekvencí ložiska, případně využít pro jejich hrubý odhad jinou metodu, například výše popsanou kurtosis. Pokročilejší optimalizační algoritmy, které již nemají čistě deterministickou podstatu, jsou schopny mnohem efektivnějšího prohledání prostoru možných řešení, a proto lze s jejich využitím nalézt správné pásmo i se značně vzdálenými počátečními podmínkami. 2.6 Určení opakovací periody přechodových dějů Metoda použitá v této práci, ale i většina ostatních popsaných metod, se zaměřuje na nalezení pásem vlastních frekvencí poškozených součástí a intenzity nestacionárních jevů v nich obsažených. Tyto výsledky jsou postačující pro stanovení diagnózy pouze v oboru hodnot { bez vady, vada přítomna }. Pokud je požadavek na určení předpokládaného typu vady, je potřeba detekovat i frekvenci opakování zákmitů generovaných vadou, neboť ta je závislá mimo rychlosti rotace pouze na typu vady a lze ji předem stanovit. Předpokládané opakovací frekvence lze určit podle těchto vztahů, viz [1] f BPFO = n ( 2 f r 1 RD ) PD cos β, vada vnějšího kroužku (2.11) f BPFI = n ( 2 f r 1 RD ) PD cos β, vada vnitřního kroužku (2.12) [ f BSF = PD ( ) ] 2 RD 2RD f r 1 PD cos β, vada valivého elementu (2.13) f FTF = 1 ( 2 f r 1 RD ) PD cos β, vada klece ložiska (2.14) kde RD je průměr valivého elementu, PD roztečný průměr ložiska (průměr dráhy středu valivých elementů) a β je úhel dotyku mezi valivým elementem a kroužky ložiska. Pro určení opakovací frekvence je nejprve nutné získat obálku signálu z vybraného pásma. Pro přesné stanovení obálky diskrétního signálu se používá Hilbertova transformace [1] definovaná následujícím vztahem x(t) =H{x(t)} = 1 π x(τ) t τ dτ = 1 π x(t) 1 t V praxi se Hilbertova transformace počítá s využitím Fourierovy transformace { { }} 1 1 x(t) =F 1 π F{x(t)} F t (2.15) (2.16)

Určení opakovací periody přechodových dějů 15 Pomocí hilbertovy transformace je definován tzv. analytický signál z analytického signálu lze obálku vyjádřit takto x a (t) =x(t)+jh{x(t)} (2.17) A(t) = x a (t) = x 2 (t)+ x 2 (t) (2.18) Získání obálky je v principu demodulace amplitudově modulovaného signálu, což v tomto případě znamená odstranění vysokých frekvencí vlastních kmitů součásti ložiska. Obálka bude mít charakter periodického signálu se základní frekvencí rovnou hledané opakovací frekvenci a jejích vyšších harmonických, viz spektrum na obr. 5.10. Pro automatické určení periody se osvědčila autokorelační funkce, která má u periodické funkce maxima v násobcích periody signálu, příklad je opět v experimentální části práce na obr. 5.11. V rámci práce byl pro automatickou detekci opakovací periody navržen a otestován algoritmus (viz schéma 2.4), využívající detekci špiček pomocí změny znaménka první diference nevychýleného odhadu autokorelační funkce ˆR xx (r) = 1 N r x(n) x(n + r) (2.19) N r n=1 Uvažujme pouze první polovinu kladné části autokorelační funkce, kde jsou hlavní maxima výrazná. Pro odstranění nevýrazných špiček je nejprve na autokorelační funkce aplikován filtr typu klouzavý průměr. Poté je získána první diference Δx(n) =x(n) x(n 1) a vyhledány body, kde dochází k přechodu z kladných do záporných hodnot diference maxima. Maxima jsou poté ještě prahována střední hodnotou autokorelační funkce, aby se odstranila nižší maxima, nesouvisející s opakovací frekvencí. Opakovací perioda je určena jako průměr časových vzdáleností mezi špičkami. Signál po filtraci Detekce obálky Autokorelační funkce (nevychýlený odhad) Klouzavý průměr N = 16 1.Diference Detekce špiček podle změny znaménka diference Odstranění špiček pod střední hodnotou autokor. funkce Střední hodnota diference časů špiček Perioda špiček Obrázek 2.4: Vývojový diagram detekce periody přechodových dějů

16 OPTIMALIZAČNÍ ALGORITMY 3 Optimalizační algoritmy Vzhledem k tomu že optimalizace patří mezi základní stavební kámen této práce, bude se následující kapitola věnovat obecnému úvodu do optimalizačních metod a podrobnějšímu popisu evolučních algoritmů, které byly v práci použity. 3.1 Úvod a přehled metod pro optimalizaci Obecná matematická definice optimalizační úlohy je nalezení takových hodnot vstupů určité funkce n-proměnných f(x 1,x 2,...,x n ), aby její hodnota dosahovala nějakého extrému 15. Funkce bývá nazývána jako účelová funkce, hodnotící funkce, případně ustáleným anglickým termínem fitness a její vstupní proměnné představují souřadnice v n-rozměrném prostoru, který se obyčejně nazývá stavový prostor. Ve stavovém prostoru dále nemusí být povoleny všechny kombinace hodnot jednotlivých proměnných například pro n-tice reálných čísel nemusí být přípustné všechny kombinace hodnot obsažené v R n. Zpravidla je snaha nalézt globální extrém, nicméně ve složitějších případech nelze globální extrém snadno nalézt, případně nelze ani zjistit zda nalezený extrém je globální nebo pouze jeden z lokálních. V těchto případech se lze spokojit i dostatečně kvalitním (splňujícím určité požadavky) lokálním extrémem. V praxi představuje optimalizační úloha nějaký netriviální fyzikální, ekonomický, logistický, algoritmický nebo jiný problém, který lze v některých případech vyjádřit exaktně matematicky řešitelnou funkcí. Většinou je matematický model klasickými matematickými metodami obtížně řešitelný a v nejhorším případě nelze sestavit vůbec a dosahované výsledky pro různé vstupy je nutné zjišťovat přímo na reálném systému, což přináší značná omezení. V nejtriviálnějším případě, kdy vstupy mohou nabývat pouze malého množství diskrétních hodnot lze použít postupného prohledání celého stavového prostoru, tedy vyzkoušení všech přípustných kombinací 16. Tato metoda však, zvláště u mnoharozměrných úloh, velmi brzy naráží na nepřijatelnost doby potřebné k prohledání celého stavového prostoru. Pro matematicky dobře popsané problémy lze použít deterministické informované metody, které využívají k orientaci ve stavovém prostoru informací získaných z popisu účelové funkce f. Volba konkrétní metody záleží na typu problému, zde je pro ukázku několik často používaných. Pro spojitý stavový prostor: Lineární programování pracuje pouze s lineární účelovou funkcí typu f = n j=1 c jx j a konvexními lineárními omezujícími podmínkami typu n j=1 a ijx j b i. Pomocí existujících algoritmů lze tyto úlohy vyřešit v malém počtu kroků a jedná se vždy o globální extrém. 15 minima nebo maxima 16 anglicky též brute-force

Úvod a přehled metod pro optimalizaci 17 Nelineární programování zahrnuje řadu metod využívajících zpravidla znalost několika prvních derivací zkoumané funkce. Nejednodušší metoda postupuje ve stavovém prostoru po malých krocích ve směru gradientu funkce z nějakého, vhodně zvoleného, počátečního bodu. Další metody využívají hodnotu druhé derivace k přímějšímu postupu k extrému. Nevýhodou je nutnost znalosti derivací funkce a nalezení pouze extrému, který je nejblíže k počátečnímu bodu a nemusí být globální. Pro diskrétní stavový prostor: Metoda větví a mezí využívá postupné větvení s podle různě modifikované vybrané vstupní proměnné. V průběhu hledání udržuje odhadem horní a dolní meze a vylučuje větve, které mají horní mez nižší než aktuální dolní mez řešení. Diskrétní gradientní metoda (Hill-Climbing) vychází z předem zvoleného bodu, v každém kroku vybere ze všech sousedních pozic ve stavovém prostoru bod s nejvyšším ohodnocením a pokud je lepší než aktuální, použije ho v příštím kroku. Pokud takový bod není, algoritmus končí. Nevýhodou je vyhledání pouze lokálního extrému v závislosti na zvoleném počátečním bodu. Výhodou je možnost použití na funkce, o jejichž vnitřním chování nejsou dostupné téměř nebo vůbec žádné informace 17. Dále popisované metody již budou zaměřeny právě na takový druh funkcí. Taboo Search jedná se o Hill Climbing rozšířený o paměť, do které se ukládá určité množství naposled navštívených míst tyto místa jsou v dalších krocích zakázaná (tabu). Další rozdíl oproti Hill Climbing je pokračování i v případě že žádný soused není lepší než aktuální pozice. Tento výčet je pouze orientační, zcela byly opomenuty algoritmy využívající postupné hledání částí výsledného řešení, využívané například pro hledání nejkratší a nejméně nákladné cesty k cíli. V případě potřeby nalezení globálního nebo alespoň co nejlepšího lokálního maxima komplikovaných účelových funkcí 18 a problémů typu Black Box 19 bývá šance na dosažení dobrého výsledku s využitím stochastických 20 algoritmů. Právě prvek náhody umožňuje s jistou nenulovou pravděpodobností i přechod od lepšího řešení k horšímu a tím uniknout z lokálního extrému, ve kterém čistě deterministické algoritmy uváznou. Lokální prohledávání (First-improving) náhodně se vybere bod z určitého okolí aktuální pozice. Pokud je lepší než aktuální, použije se v následujícím kroku jako nový, jinak se pozice nemění. Výchozí umístění se volí náhodně. Jedná se o nejednodušší stochastický algoritmus umí opustit lokální extrém, ale je značně pomalý. 17 funkce typu Black Box 18 zejména NP-těžké a NP-úplné problémy 19 o vnitřním fungování systému nevíme nic nebo je tak komplikovaný, že je jednodušší ho považovat za uzavřený 20 využívajících prvků náhody

18 OPTIMALIZAČNÍ ALGORITMY Simulované žíhání (Simulated Annealing) algoritmus inspirovaný procesy probíhajícími během chladnutí rozžhaveného kovu, jedná se o rozšíření lokálního prohledávání. Z určitého okolí 21 aktuální pozice x se vybere náhodně libovolný bod y. Pokud je lepší než aktuální, prohlásí se za nový aktuální. V opačném případě se může také stát aktuálním, ale jen s pravděpodobností p = e f(y) f(x) T, tedy čím horší je zvolený bod, tím menší pravděpodobnost přesunu. Faktor T se nazývá plán chladnutí (cooling schedule) a za běhu je postupně snižován, což vede ke snižování pravděpodobnosti přesunu na horší pozice. Zvláštnost algoritmu je v tom, že se z na počátku značně stochastického postupně přechází na deterministický, což umožní na začátku překonání oblastí nízké kvality a ke konci přesnější zaměření nahrubo nalezeného extrému. Evoluční algoritmy skupina algoritmů inspirovaných evolucí a přirozenou selekcí v přírodě. Nepracují s jedním dílčím řešením, ale zároveň z celou množinou vzájemně různých kandidátů řešení, což zavádí do prohledávání prvky paralelismu. Podstatou je simulace přirozeného výběru, kdy mají větší šanci kvalitnější jedinci 22 a jejich vzájemná kombinace (křížení) nebo vzájemné ovlivňování. Mezi evoluční algoritmy se řadí zejména Genetické algoritmy. Z dalších, méně obvyklých lze jmenovat Memetické algoritmy, Ant Colony Optimization 23 nebo Particle Swarm Optimization 24. 3.2 Genetické algoritmy Genetické algoritmy patří mezi nejznámější zástupce metod založených na simulované evoluci. Tato práce je na nich z velké části založena, proto budou rozebrány podrobněji. 3.2.1 Úvod Genetické algoritmy patří mezi evoluční algoritmy, jejichž charakteristickým znakem je simulace průběhu přirozeného vývoje živočišného nebo rostlinného druhu v přírodě. Využívají dvou principů, a to reprodukce, při které dochází ke kombinaci genetického materiálu více (zpravidla dvou) jedinců a přirozené selekce, podle které mají větší šanci na přežití lepší a silnější jedinci oproti horším a slabším. Kombinací těchto dvou principů se docílí postupného přizpůsobování jedinců prostředí (daného optimalizovanou úlohou). 3.2.2 Princip genetických algoritmů Jak již bylo zmíněno, genetické algoritmy patří do obsáhlejší množiny evolučních algoritmů, které nepracují s jedním kandidátem řešení 25, ale z celou množinou potenciálních řešení, 21 Nemusí jít jen o bezprostřední sousedy. 22 Jedinec je u evolučních algoritmů ekvivalentní pojem ke kandidátu na řešení. 23 Simulace spolupráce mravenců při hledání nejkratší cesty mezi hnízdem a potravou. 24 Simulace skupiny částic, pohybujících se stavovým prostorem určitým směrem a rychlostí, které se vzájemně ovlivňují. 25 Reprezentující nějakou pozici ve stavovém prostoru.

Genetické algoritmy 19 které se v průběhu navzájem vhodně ovlivňují. Tento princip zavádí prvky kooperativního paralelismu a umožňuje lépe prohledat stavový prostor. V genetických algoritmech pochází hlavní inspirace z reprodukce organismů v přírodě, kdy je předávána část genetické informace z obou rodičů na potomka, který obsahuje kombinaci jejich vlastností (ať už těch lepších nebo horších). U skutečných organismů je informace uložena v řetězcích DNA, které jsou rozděleny do určitého počtu chromozomů. Jednotlivé řetězce obsahují určité úseky, představující jednotlivé rysy jedince. Tyto úseky se nazývají geny a jejich možným hodnotám se říká alely. Souhrn všech genů se nazývá genotyp. Význam hodnot všech genů představuje fenotyp, což je souhrn vlastností jedince. Do hry vstupuje také mutace, která představuje nedokonalosti a chyby při kopírování genetické informace, a dává tak možnost vzniku zcela nových vlastností. Mutace je velmi důležitá v evolučním procesu, bez ní by se vývoj druhu v určitém okamžiku zastavil. Dalším prvkem, převzatým z oboru biologie, je přirozená selekce. Životní prostředí organismů není nikdy ideální, organismus musí odolávat nepříznivým vlivům a mít k dispozici dostatek potravy a jiných zdrojů, které jsou omezené. K tomu aby jedinec ve svém prostředí přežil potřebuje mít určité předpoklady (dobré vlastnosti). Tyto vlastnosti nejsou zárukou přežití, ale značně zvyšují jeho pravděpodobnost. Zároveň není vyloučeno přežití horších, slabších jedinců. Princip činnosti genetických algoritmů je znázorněn vývojovým diagramem na obr. 3.1. Prvním krokem je vytvoření množiny jedinců, kteří představují výchozí stav simulované evoluce druhu. Jedinci jsou v dalším kroku ohodnoceni pomocí fitness funkce. Inicializace bývá často náhodná, ale lze využít apriorních znalostí problému a část populace vytvořit tak, aby již na začátku obsahovala určité pozitivní rysy. Vždy by měla být alespoň část populace vytvořena čistě náhodně, jinak se snižuje kvalita prohledání stavového prostoru a významně zvyšuje riziko předčasné konvergence uváznutí v lokálním extrému. Následuje hlavní cyklus algoritmu, v němž proběhne nejprve selekce kandidátů na křížení na základě jejich kvality. V dalším kroku se z vybraných jedinců vytvoří náhodné páry a pomocí křížení a následné mutace vznikne množina potomků. V posledním kroku cyklu se pomocí nahrazovacího operátoru zkombinuje původní populace s potomky a dojde k vytvoření nové generace populace, stejně velké jako původní. Na konci každého cyklu se zkoumá pomocí ukončovacích podmínek, zda již bylo dosaženo nějaké mezní kvality populace 26, která je postačující nebo zda ještě dochází ke zlepšování nebo se kvalita populace ustálila a dále se nezlepšuje. Omezení může být také časovým limitem je potřeba nejlepší možné řešení, ale čas k jeho získání je omezený. Po skočení evoluce je jako řešení z populace vybrán jeden nebo několik nejlepších jedinců. 26 zpravidla kvalita nejlepšího jedince

20 OPTIMALIZAČNÍ ALGORITMY Generování výchozí populace n = 1 Ohodnocení počáteční populace Počátek n-té generace Selekce rodičů Křížení n = n +1 Mutace Nahrazení rodičů potomky Ohodnocení nové populace ne Splněny ukončovací podmínky? ano Finální populace Vyber nejlepšího jedince z populace Obrázek 3.1: Vývojový diagram obecného genetického algoritmu

Genetické algoritmy 21 Výhody genetických algoritmů schopnost pracovat se všemi druhy optimalizačních problémů od nelineárních, nehladkých, nespojitých, multimodálních 27 funkcí až po problémy typu Black Box. plošné prohledávání stavového prostoru na mnoha různých místech, využívající prvky paralelismu. odolnost proti uváznutí v lokálním extrému možnost aplikace na systém měnící se dynamicky v čase Nevýhody genetických algoritmů neopakovatelnost při následném běhu algoritmu zpravidla není dosaženo stejného (zpravidla však velmi blízkého) řešení jako v předchozím běhu, což je důsledek stochastických složek algoritmu. pomalejší konvergence k extrému, na rozdíl od většiny algoritmů pracujících s jedním kandidátem řešení. Základní parametry běhu genetického algoritmu jsou uvedené v tabulce 3.1. PopSize P x P m selekční tlak Velikost populace jeden z nejdůležitějších parametrů, má velký vliv na kvalitu prohledání stavového prostoru Pravděpodobnost s jakou bude na jedince vybrané selekcí aplikován operátor křížení, ostatní jedinci budou zkopírováni bez změny. Zpravidla je křížení aplikováno na všechny jedince, tedy P x =1 Pravděpodobnost mutace udává pro každý element (zpravidla bit) jedince, s jakou pravděpodobností dojde k jeho změně (zpravidla inverzi). Typická hodnota je 0,01 0,05. Určuje míru preference lepších jedinců nad horšími, většinou bývá dán implicitně operátorem selekce. V některých případech lze explicitně ovlivňovat, například počtem soupeřů v turnajové selekci. Velký selekční tlak urychluje eliminaci špatných jedinců, ale značně zvyšuje riziko předčasné konvergence v méně kvalitním lokálním extrému. Tabulka 3.1: Základní parametry běhu genetického algoritmu Možné ukončovací podmínky pro běh genetického algoritmu: maximální počet generačních cyklů maximální počet volání ohodnocovací (fitness) funkce maximální (resp. minimální) dosažená kvalita jedince 27 funkce má více extrémů

22 OPTIMALIZAČNÍ ALGORITMY maximální počet generací bez nalezení lepšího jedince minimální rozptyl (popř. směrodatná odchylka) kvality populace malý rozptyl indikuje zkonvergovanou populaci, kdy je již malá pravděpodobnost nalezení jiného extrému 3.2.3 Ohodnocovací funkce Ohodnocovací (fitness) funkce, společně s kódováním potenciálního řešení, jsou jedinými komponentami genetického algoritmu, které jsou problémově závislé, proto je třeba její tvorbě věnovat náležitou pozornost. Vstupem hodnotící funkce je chromozom představující jedince (potenciální řešení). Úkolem funkce je provést dekódování genotypu na fenotyp a stanovit míru kvality jedince jím představovaného. Míra kvality se většinou stanovuje jako reálné číslo. Jediný požadavek na ohodnocení je aby lepší jedinec dostal vyšší ohodnocení než horší jedinec. Funkce může obsahovat složité nelineární závislosti mezi vstupy (alely), může být nespojitá a nemusí přímo odrážet absolutní rozdíl kvality dvou porovnávaných jedinců. 3.2.4 Kódování jedinců Za základní způsob kódování se u genetických algoritmů považuje binární řetězec určité délky, do jehož jednotlivých částí jsou vhodně zakódovány vstupní veličiny optimalizovaného problému. Celý řetězec pak tvoří chromozom, jednotlivé úseky jsou geny, viz obr. 3.2. 1 bit Gen 1 Gen 2 Gen 3 Gen 4 Gen 5 Chromozom Obrázek 3.2: Struktura chromozomu Pokud jsou argumenty optimalizované funkce reálné je nutné zvolit vhodnou délku řetězce genu podle možného rozsahu hodnot a požadované přesnosti řešení ε. [ ] max(x) min(x) L =Int log 2 ε V případě konečného počtu diskrétních hodnot je třeba zvolit vhodné dekódování hodnoty, tak aby každé hodnotě alely odpovídal pokud možno stejné množství kombinací hodnot genu. Důležitá je i vhodná volba pořadí genů v chromozomu hodnoty významně přispívající k řešení by měly být u sebe, neboť je tak menší pravděpodobnost rozbití nadějného stavebního bloku (viz kapitola 3.2.9 o schématech).

Genetické algoritmy 23 Další možnosti kódování, mimo binárního řetězce, jsou například sada reálných čísel 28, hodící se pokud jsou všechny optimalizované hodnoty reálná čísla. Pro problémy typu Obchodní cestující se využívá permutační kódování, které udává pořadí výběru hodnot ze seznamu vrcholů grafu. Těmto reprezentacím je nutné přizpůsobit rekombinační operátory, které jsou popsány dále. 3.2.5 Selekce Selekce napodobuje princip přirozeného výběru, podle kterého mají větší šanci na přežití a tím i účasti na rozmnožovacím procesu (reprodukce) lepší a silnější (kvalitnější) jedinci. Zároveň nevylučuje přežití slabých ani eliminaci kvalitních jedinců. Proto i simulace přirozené selekce musí obsahovat pravděpodobnostní (stochastickou) složku. Ruletová selekce byla využívaná v genetických algoritmech jako první a proto je nutné ji zmínit i přes řadu nevýhod, kterými trpí. Název je odvozen od pomyslného ruletového kole, na kterém je každému jedinci přidělen úsek (viz obr. 3.3), jehož velikost je přímo úměrná ohodnocení (fitness) jedince. Poté se zatočí ruletovým kolem (náhodně zvolí bod na obvodu kola) a vybere jedinec, který daný úsek obsahuje. Tento postup se opakuje P 10 P 1 P 9 P 2 P 3 P 8 P 7 P 4 P 6 P 5 Obrázek 3.3: Ruletová selekce tolikrát, kolik jedinců je třeba vybrat. Pravděpodobnost výběru i-tého jedince je tedy P i = f(x i ) N j=1 f(x, i =1,...,N (3.1) j) 28 která jsou ovšem stejně interně v počítači uložena v binární formě

24 OPTIMALIZAČNÍ ALGORITMY Jak již bylo zmíněno, ruletová selekce má řadu nevýhod. Mezi nejvážnější patří použitelnost pouze na maximalizační problémy a vyžaduje nezápornost ohodnocení. Problém také nastane, pokud jsou absolutní rozdíly kvality jedinců velmi malé v porovnání s průměrným ohodnocením populace (hodnoty fitness se pohybují z nějakého důvodu ve velkých číslech). V tomto případě vyjdou všechny pravděpodobnosti (úseky ruletového kola) přibližně stejné a ztratí se vlastní podstata selekce. Někdy lze tento problém, nazývaný škálovací (scaling), řešit odečtením minimální možné hodnoty fitness meze hodnot fitness ovšem nemusí být známé. V případě nedostatečně velké populace 29 nastane problém vzorkování (sampling), který způsobí značné odchylky poměru zastoupení jedinců od teoretického předpokladu, daného vztahem (3.1). Pořadová selekce (Rank selection) řeší většinu problémů ruletové selekce. Tato metoda ignoruje absolutní rozdíly ohodnocení jedinců a bere v potaz jen pořadí jedince v populaci seřazené 30 od nejhoršího. Dává tak šanci i nejhorším jedincům nezávisle na rozdělení hodnot fitness Pravděpodobnost výběru i-tého jedince je pak P i = i N j=1 j = 2.i, i =1,...,N (3.2) N(N +1) Turnajová selekce (Tournament selection) využívá modelování soupeření jedinců o přežití z náhodně vybraných n-tic 31 jedinců je vždy vybrán nejlepší. Tento proces se opakuje dokud není vybrán potřebný počet jedinců. Počtem soupeřících jedinců lze ovlivňovat selekční tlak, tedy míru preference lepších jedinců před horšími. Pro tento typ selekce nelze nijak analyticky popsat jeho chování, přesto se v praxi osvědčil a je hojně využíván. 3.2.6 Křížení Křížení je prvním ze základních rekombinačních operátorů genetických algoritmů. Podstatou je kombinace dvou 32 jedinců (rodičů), doprovázená vznikem zpravidla dvou nových jedinců (potomků), kteří kombinují vlastnosti obou rodičů. Cílem je samozřejmě kombinace dobrých vlastností z obou jedinců v jednom potomkovi. Křížením dojde tedy ke vzniku nových, lepších, ale i horších jedinců. Oddělení kvalitních a nekvalitních potomků je již úkolem selekčního procesu v následující generaci. Křížení není nutné aplikovat na všechny selekcí vybrané jedince (P x < 1), z někteří rodiče se pak stanou potomky bez změny. Obvykle však bývá křížení aplikováno na všechny rodiče a jedinci z původní generace dostanou šanci přežít díky nahrazovacímu operátoru. 29 Teorém o schématech byl odvozen pro velmi velké populace, kdy platí zákon velkých čísel. 30 proto pořadová selekce 31 nejčastěji dvojic 32 Počet rodičů může být i větší, viz např. diferenciální evoluce popsaná v [5], která využívá čtyři rodiče.

Genetické algoritmy 25 Následující operátory křížení jsou použitelné pro binární kódování jedince. Pro jiné reprezentace je nutné operátory vhodně upravit. Jednobodové křížení (1-point crossover) V řetězci chromozomu je náhodně zvolen jeden bod, ve kterém se oba rodiče rozdělí a potomek se vytvoří prohozením částí za dělícím bodem podle schématu na obr. 3.4. Jedná ze o základní variantu křížení. Rodic 1 10110100010011011110 00011001 Rodic 2 010110110110 1 0110100010110110110 00011001 010011011110 Potomek 1 Potomek 2 Obrázek 3.4: Princip jednobodového křížení Rodic 1 Rodic 2 10110100010011011110 00011001010110110110 10110001010111011110 00011100010010110110 Potomek 1 Potomek 2 Obrázek 3.5: Princip dvoubodového křížení Dvoubodové křížení (2-point crossover) Průběh je podobný jako u jednobodového křížení, s rozdílem že jsou zvoleny dva body a prohozena je část řetězce mezi nimi. Princip lze nalézt na obr. 3.5. Dvoubodové křížení je flexibilnější v možnostech rekombinace stavebních bloků (viz kapitola 3.2.9). Uvádí se (např. [14]), že dvoubodové křížení také zmenšuje pravděpodobnost rozbití schématu.

26 OPTIMALIZAČNÍ ALGORITMY Částečně náhodné dvoubodové křížení (Partially Randomized 2-point crossover) Základní princip je stejný jako u klasického dvoubodového křížení. Při klasickém křížení je občas, zejména pokud je již populace částečně zkonvergovaná, část chromozomu obou rodičů stejná a shodný úsek se objeví i u obou potomků. Myšlenka částečně náhodného křížení je ve vybrání jednoho z potomků a provedení náhodné změny některých společných bitů (viz obr. 3.6). Jde tedy v podstatě o selektivní mutaci, zaměřující se na oblasti obsahující redundantní informace a automaticky zvyšující pravděpodobnost mutace při konvergenci populace. Rodic 1 Rodic 2 1 0 1 1 0 1 0 0 1 1 0 0 1 101 1 0 1 0 0 0 0 1 1 0 0 1 0 1 0 1 0 0 1 1 0 1 1 0 101100010101110110 10 00011100110000110110 Potomek 2 Potomek 2 *0*1**0**10****1**10 Spolecné schema odpovídající oboum potomkum 0000 11001 1 1 0 0010 0110 Potomek 2 po náhodné inverzi Obrázek 3.6: Princip dvoubodového křížení s mutací společného schématu rodičů Jedna z možných implementací (viz [16]), která byla využita v této práci, spočívá v náhodném vybrání určitého úseku chromozomu a inverzí bitů náležících společnému schematu potomků s pravděpodobností P PRX = I PRX 2 N CS (3.3) kde I PRX je délka náhodně zvoleného úseku a N CS je počet společných bitů v úseku délky I PRX. Rovnoměrné křížení (Uniform crossover) Při tomto způsobu křížení se rozhoduje pro každou jednotlivou pozici zvlášť, zda dojde k prohození bitů na této pozici. Obvykle je pravděpodobnost prohození každého jednotlivého bitu 0,5. Tento způsob křížení se hodí

Genetické algoritmy 27 spíše pro malé populace, kde může pomoc vnést do populace větší diverzitu a zvětšit okruh prohledaných míst stavového prostoru. U větších populací, kde je diverzita zajištěna především množstvím různorodých jedinců, se projeví vysoká pravděpodobnost rozbití schématu, proto je většinou preferováno spíše jedno- nebo dvoubodové křížení. 3.2.7 Mutace Pro binární reprezentaci chromozomu je nejčastěji používaná mutace náhodnou bitovou inverzí. Je definována pravděpodobnost s kterou se pro každý bit zvlášť rozhodně zda dojde k jeho inverzi nebo bude zachován. Tato pravděpodobnost bývá velmi malá, často kolem 0,01 značně větší hodnoty by způsobily převahu náhodně složky nad informovanou složkou (využívající znalosti kvality jedince) a prohledávání by částečně nebo úplně zdegenerovalo na náhodné, podobné Lokálnímu prohledávání (viz kapitola 3.1). 10 110100010011011110 P m 10 110100011 01101110 0 Obrázek 3.7: Princip mutace náhodnou bitovou inverzí Pro jiné než binární reprezentace jedinců je nutné samozřejmě zvolit jiný operátor mutace. V případě reálných čísel je možné s určitou pravděpodobností přičíst malou náhodně zvolenou hodnotu. Pro permutační kódování lze náhodně prohodit nějaké dva body v posloupnosti. Poznámka: pro zamezení předčasné konvergence lze využít dynamické zvyšování pravděpodobnosti mutace P m v případě malé diverzity nebo déletrvajícího stavu bez nalezení nového, lepšího řešení. Úspěch této metody je ovšem nejistý, vzhledem neinformované podstatě mutace. Při testování v rámci této práce se tato modifikace neukázala jako užitečná. 3.2.8 Nahrazování generací Posledním článkem simulované evoluce je vytvoření nové generace jedinců kombinací množiny nově vzniklých jedinců (potomků) a jedinců z původní generace (ještě před selekcí). Nejednoduší strategie, nazývaná generační (generational), spočívá ve vytvoření nové populace pouze z potomků pracuje tedy s nepřekrývajícími se populacemi. Nevýhoda této strategie je v možné ztrátě dosud nejlepšího nalezeného řešení, neboť vlivem rekombinačních operátorů může dojít k rozbití výhodných stavebních bloků a nenalezení lepších. Proto

28 OPTIMALIZAČNÍ ALGORITMY se generační strategie často doplňuje o elitismus, který zajistí přenesení nejlepšího jedince do následující generace, například nahrazením nejhoršího z potomků. Z nahrazovacích strategií pracujících s překrývajícími se populacemi (někdy nazýváno steady-state), lze uvést například sjednocení původní populace a potomků, seřazení podle kvality a odstranění (truncation) nejhorších jedinců, tak aby zůstala zachovaná velikost populace P opsize. Sofistikovanější strategie jsou založeny na podobných metodách jako selekce například vzájemné soutěžení (Tournament) původních jedinců a potomků v náhodně zvolených dvojicích. 3.2.9 Teorie schémat Z principu funkce genetických algoritmů není přímo zřejmé proč fungují, tedy proč dochází postupem času k přibývání kvalitnějších jedinců v populaci a naopak k úbytku méně kvalitních. Částečnou odpověď na tuto otázku poskytuje teorie o schématech, kterou odvodil J. Holland v r. 1975 [4, strana 129 133] pro standardní genetický algoritmus (SGA). Standardní genetický algoritmus 33 je nejstarší a nejzákladnější formou, která má řadu nevýhod, nicméně vzhledem k jednoduchosti lze vcelku průhledně provést odvození Schema teorému. SGA je definován jako GA s binárním kódováním, ruletovou selekcí, jednobodovým křížením, mutací bitovou inverzí a nepřekrývajícími se populacemi. 34 Teorie vychází z poznatku, že stejně kvalitní jedinci mají často na určitých pozicích stejné bity, tedy že určité pozice v řetězci chromozomu mají na kvalitu větší vliv než jiné. Hodnoty na těchto vlivných pozicích se pak nazývají stavební bloky (building blocks). Všechny řetězce obsahující tyto stavební bloky lze definovat pomocí schémat, což jsou šablony jedinců, definující pozice, které tvoří stavební bloky pomocí symbolů reprezentující konkrétní binární hodnoty {0,1} a zástupného symbolu *, který znamená že na hodnotě této pozice nezáleží. V souvislosti se schématy se dále definují parametry L o(h) δ(h) délka schematu celkový počet symbolů, rovná se délce jedince splňujícího schéma řád schematu počet specifických (pevně definovaných) symbolů definující délka schematu největší možná vzdálenost dvou specifických symbolů (pro schémata řádu 0 a 1 je konvencí stanoveno δ(h) =0) Například pro schéma H =(1, 1, 0,,, 1,, 0, 1, ) jel =10,o(H) =6,δ(H) =8 Dále definujme kvalitu schématu H jako střední ohodnocení (fitness) jedinců odpovídajících tomuto schématu x f(h) = i H f(x i) (3.4) x i H kde čitatel je součet fitness jedinců odpovídajících schématu a jmenovatel jejich počet. 33 Standard Genetic Algorithm, někdy také nazývaný Simple Genetic Algorithm 34 Potomci nahrazují vždy celou předchozí generaci