Dobývání znalostí Doc. RND. Iveta Mázová, CSc. Kateda teoetcké nfomatky Matematcko-fyzkální fakulta Unvezty Kalovy v Paze
Dobývání znalostí Umělé neuonové sítě Doc. RND. Iveta Mázová, CSc. Kateda teoetcké nfomatky Matematcko-fyzkální fakulta Unvezty Kalovy v Paze
Základní bologcké poznatky () Model neuonu ~ základní výpočetní ednotka složtěšího celku neuonové sítě ~ bologcký neuon se skládá z: těla (somatu), dendtů, aonu a synapsí I. Mázová: Dobývání znalostí 9
I. Mázová: Dobývání znalostí 0 Fomální neuon : TŘÍDA A < + + n n f y f 0 0 0 ϑ ϑ : TŘÍDA B VSTUP n M n VÝSTUP + n h f y ϑ ϑ DĚLICÍ NADROVINA A A A A A A A A B B B B B B B B B
Typy přenosových funkcí Skoková Sgmodální y 0 f f n n + ϑ 0 + ϑ < 0 : TŘÍDA A : TŘÍDA B V Ý S T U P 0.5 0 S -3 + e ( ξ ) ξ 0 3 POTENCIÁL Radální (RBF) Waveletová I. Mázová: Dobývání znalostí
Defnce fomálního neuonu I. Mázová: Dobývání znalostí
Defnce stavů neuonu I. Mázová: Dobývání znalostí 3
Učení a ozpoznávání Učení: S učtelem - ténovací množna tvau [ vstup/požadovaný výstup] Bez učtele (samooganzace) - chybí požadovaný výstup Cíl: nastavení (adaptace) synaptckých vah (např. mnmalzací střední kvadatcké odchylky) Cílová funkce: např. Rozpoznávání: ( y d ), p, y e skutečný a d e požadovaný výstup nově předkládaných vstupních vzoů > Cíl: získat odezvu (výstup) neuonové sítě p p I. Mázová: Dobývání znalostí 4
Pecepton a lneání sepaablta () D: Jednoduchý pecepton e výpočetní ednotka s pahem ϑ, kteá po n eálných vstupů,,, n a váhy,, n dává výstup, estlže platí neovnost n ϑ (tzn. pokud ) a 0 nak. Pozn.: Obdobně po tzv. ozšířený váhový a vstupní vekto: ( ) ϑ,, K, n, n+ ; n+, K,, ( ), n > výstup, estlže 0 ϑ I. Mázová: Dobývání znalostí 6
Pecepton a lneání sepaablta () Lneání sepaablta: D: Dvě množny A a B se nazývaí lneáně sepaablní v n-ozměném postou, pokud estue n+ eálných čísel,, n, ϑ takových, že každý ( ) A bod,, n splňue ϑ a, K ( ) B každý bod,, n splňue, K n n < ϑ I. Mázová: Dobývání znalostí 7
Pecepton a lneání sepaablta (4) Absolutní lneání sepaablta: D: Dvě množny A a B se nazývaí absolutně lneáně sepaablní v n-ozměném postou, pokud estue n+ eálných čísel,, n, ϑ takových, že každý ( ) A bod,, n splňue > ϑ a, K ( ) B každý bod,, n splňue, K n n < ϑ I. Mázová: Dobývání znalostí 9
Dělcí nadovna po ozšířený váhový, esp. příznakový posto () D: Dělcí nadovna učená n ozměným váhovým vektoem n e množna všech bodů R, po kteé 0 Poblém: Nalézt takové váhy, esp. páh, kteé by umožnly sepaac (oddělení) dvou množn vzoů > např. PERCEPTRONOVÝ ALGORITMUS UČENÍ Předpoklad: A množna vstupních vektoů v n ozměném postou B množna vstupních vektoů v n ozměném postou I. Mázová: Dobývání znalostí 34
Peceptonový algotmus učení () Hledáme váhový vekto s poztvním skaláním součnem po všechny vektoy epezentované body v P a se záponým skaláním součnem po všechny vektoy epezentované body v N I. Mázová: Dobývání znalostí 36
Peceptonový algotmus učení () OBECNĚ: za předpokladu, že P a N sou množny n ozměných vektoů chceme nalézt takový váhový vekto, že: > 0 < 0 P N Peceptonový algotmus učení začíná s náhodně zvoleným váhovým vektoem 0 Pokud estue vekto P takový, že < 0, znamená to, že úhel mez těmto dvěma vektoy e větší než 90 Váhový vekto e nutné zadaptovat (~ otočt) ve směu (tak, aby se tento vekto dostal do poztvního polopostou defnovaného I. Mázová: Dobývání znalostí 37
Peceptonový algotmus učení (3) Otočení ve směu lze povést přčtením k vektou Pokud estue vekto N takový, že > 0, znamená to, že úhel mez těmto dvěma vektoy e menší než 90 Váhový vekto e nutné zadaptovat (~ otočt) směem od (tak, aby se tento vekto dostal do negatvního polopostou defnovaného Otočení směem od lze povést odečtením od vektou vektoy z P tedy otáčeí váhový vekto opačným směem než vektoy z N Pokud estue řešení, lze ho nalézt v konečném počtu koků I. Mázová: Dobývání znalostí 38
Peceptonový algotmus učení (4) Kok : Incalzace vah malým náhodným hodnotam (0) (0) váha vstupu v čase 0 ; ( n+ ) Kok : Předložení ténovacího vzou ve tvau (,, n+ ) vstupní vzo a d(t).. požadovaný výstup (po předložený vstup) Kok 3: Výpočet skutečného výstupu (odezvy sítě) n () + y t sgn () t () t Kok 4: Adaptace vah podle: (t+) (t) výstup e spávný (t+) (t) + (t) výstup e 0 a měl být (t+) (t) - (t) výstup e a měl být 0 Kok 5: Pokud t nedosáhl požadované hodnoty, před ke Koku I. Mázová: Dobývání znalostí 39
Peceptonový algotmus učení (5) Heustka po počáteční nastavení vah: Začít s půměem poztvních vstupních vektoů mnus půmě negatvních vektoů Modfkace: paamet učení η ( 0 η ) (stupeň adaptvty vah ~ plastcta sítě) Adaptace vah podle: (t+) (t) výstup e spávný (t+) (t) + η (t) výstup e 0 a měl být (t+) (t) - η (t) výstup e a měl být 0 I. Mázová: Dobývání znalostí 40
Konvegence peceptonového algotmu učení (Rosenblatt, 959) V: Nechť P a N sou konečné a lneáně sepaablní množny. Potom povede peceptonový algotmus učení konečný počet aktualzací váhového vektou t. (Pokud se budou cyklcky testovat eden po duhém vzoy z P a N, nade peceptonový algotmus učení po povedení konečného počtu aktualzací váhový vekto, pomocí něhož lze navzáem sepaovat P a N.) I. Mázová: Dobývání znalostí 4
Vstevnaté neuonové sítě () D: Neuonová síť e uspořádaná 6-tce M(N,C,I,O,,t), kde: N e konečná nepázdná množna neuonů, C N N e nepázdná množna oentovaných spoů mez neuony I N e nepázdná množna vstupních neuonů O N e nepázdná množna výstupních neuonů : C R e váhová funkce t: N R e pahová funkce ( R označue množnu eálných čísel) I. Mázová: Dobývání znalostí 53
Vstevnaté neuonové sítě () D: Vstevnatá síť (BP-síť) B e neuonová síť s oentovaným acyklckým gafem spoů. Jeí množna neuonů e tvořena posloupností l + vzáemně dsunktních podmnožn zvaných vstvy. Pvní vstva zvaná vstupní vstva e množnou všech vstupních neuonů B, tyto neuony nemaí v gafu spoů žádné předchůdce; ech vstupní hodnota e ovna ech výstupní hodnotě. Poslední vstva zvaná výstupní vstva e množnou všech výstupních neuonů B; tyto neuony nemaí v gafu spoů žádné následníky. Všechny ostatní neuony zvané skyté neuony sou obsaženy ve zbylých l vstvách zvaných skyté vstvy. I. Mázová: Dobývání znalostí 54
Algotmus zpětného šíření () Cíl: naít takovou matc vah, kteá by zaučovala po všechny vstupní vzoy z ténovací množny to, že skutečný výstup neuonové sítě bude stený ako eí požadovaný výstup Přtom není specfkována an skutečná, an požadovaná aktvta skytých neuonů. Po konečnou množnu ténovacích vzoů lze celkovou chybu vyádřt pomocí ozdílu mez skutečným a požadovaným výstupem sítě u každého předloženého vzou. I. Mázová: Dobývání znalostí 55
Algotmus zpětného šíření () Chybová funkce vyadřue odchylku mez skutečnou a požadovanou odezvou sítě: E vzoy ( y d ) p cílem pocesu učení e mnmalzovat tuto, p, p výstupní neuony požadovaná odezva skutečná odezva odchylku na dané ténovací množně algotmus zpětného šíření (Back-Popagaton) I. Mázová: Dobývání znalostí 56
Vstevnaté neuonové sítě (BP-sítě) V Ý S T U P V S T U P výpočet skutečné odezvy po daný vzo poovnání skutečné a požadované odezvy adaptace vah a pahů pot gadentu chybové funkce od výstupní vstvy směem ke vstupní I. Mázová: Dobývání znalostí 57
BP-sítě: adaptační pavdla () Aktualzace synaptckých vah pot směu gadentu: Δ E ( t + ) ( t ) + Δ ( t ) () t. příůstek váhy chyba na výstupu sítě E přspívaící k mnmalzac E Δ E E E y y ξ ξ potencál neuonu skutečný výstup váha spoe I. Mázová: Dobývání znalostí 58
I. Mázová: Dobývání znalostí 59 BP-sítě: adaptační pavdla () Aktualzace synaptckých vah po výstupní vstvu: ( ) ( ) ( ) E y y f d y y f y E y y y E y y y E y y E E δ ξ ξ ξ ξ ξ ξ Δ
I. Mázová: Dobývání znalostí 60 BP-sítě: adaptační pavdla (3) Aktualzace synaptckých vah po skyté vstvy: ( ) k k k k k k k k k k k k E y y f y y E y y y y E y y y E E δ ξ δ ξ ξ ξ ξ ξ ξ ξ Δ
BP-sítě: adaptační pavdla (4) Výpočet devace sgmodální přenosové funkce podle: f ( ξ ) λ y ( y ) Aktualzace vah podle: ( ) ( t + ) ( t) + αδ y + α ( t) ( t ) m kde δ ( d y ) λ y ( δ k k λ y ( y ) k y ) po výstupní neuon po skytý neuon I. Mázová: Dobývání znalostí 6
Algotmus zpětného šíření () Kok : Zvolte náhodné hodnoty synaptckých vah Kok : Předložte nový ténovací vzo ve tvau: [vstup, požadovaný výstup d ] Kok 3: Vypočtěte skutečný výstup aktvta neuonů v každé vstvě e dána pomocí: ( ) y f ξ, kde ξ y λξ + e Takto vyádřené aktvty pak tvoří vstup následuící vstvy. I. Mázová: Dobývání znalostí 6
Algotmus zpětného šíření () Kok 4: Aktualzace vah Př úpavě synaptckých vah postupute směem od výstupní vstvy ke vstupní. Váhy se adaptuí podle: δ ( t + ) ( t ) + α δ y + α ( t ) ( t ) ( d y ) (t). váha z neuonu do neuonu v čase t α, α m... paamet, esp. moment učení ( 0 α, α m ) ξ, esp. δ. potencál, esp. chyba na neuonu k. nde po neuony z vstvy nad neuonem λ. stmost přenosové funkce Kok 5: Před ke Koku λ y δ k k λ y ( y ) k ( y ) m ( ) I. Mázová: Dobývání znalostí 63 po výstupní neuon po skytý neuon
BP-sítě: analýza modelu Jeden z nepoužívaněších modelů Jednoduchý algotmus učení Poměně dobé výsledky Nevýhody: ntení epezentace znalostí - čená skříňka chybová funkce (znalost požadovaných výstupů) větší a vyvážené ténovací množny kontola výstupů sítě př ozpoznávání počet neuonů a genealzační schopnost sítě pořezávání a doučování I. Mázová: Dobývání znalostí 64
BP-sítě: analýza modelu Nevýhody: větší a vyvážené ténovací množny I. Mázová: Dobývání znalostí 65
Algotmus zpětného šíření a uychlení učení () Standadní algotmus zpětného šíření e poměně pomalý špatná volba počátečních paametů ho může eště zpomalt Poblém učení umělých neuonových sítí e obecně NP-úplný výpočetní náočnost oste eponencálně s počtem poměnných přesto dosahue standadní algotmus zpětného šíření často lepších výsledků než mnohé ychlé algotmy -hlavně v případě, že má úloha ealstckou úoveň složtost a velkost ténovací množny přesáhne ktckou mez I. Mázová: Dobývání znalostí 66
Algotmus zpětného šíření a uychlení učení () Algotmy s cílem uychlt poces učení: Zachovávaící pevnou topolog sítě Modulání sítě Výazně zlepšuí apomační schopnost neuonových sítí Adaptace paametů (vah, pahů apod.) topologe sítě I. Mázová: Dobývání znalostí 67
Algotmus zpětného šíření s momentem () Mnmalzace chybové funkce pomocí gadentní metody I. Mázová: Dobývání znalostí 75
Algotmus zpětného šíření s momentem () Pokud e po danou úlohu mnmum chybové funkce v úzkém údolí, může vést sledování gadentu k náhlým (častým a velkým) osclacím během učení Řešení: zavést člen odpovídaící momentu Komě aktuální hodnoty gadentu chybové funkce e třeba vzít v úvahu předchozí změny paametů (vah) Setvačnost ~měla by pomoc zamezt etémním osclacím v úzkých údolích chybové funkce I. Mázová: Dobývání znalostí 76
Algotmus zpětného šíření s momentem (3) Po síť s n ůzným vaham,, n e změna váhy k v koku + dána vztahem E Δ ( + ) + Δ () k α α m k E α () () kde: α.. paamet učení α m moment učení k k + α m ( () ( ) ) k k I. Mázová: Dobývání znalostí 77
Algotmus zpětného šíření: statege po uychlení pocesu učení (). Adaptvní paamet učení: lokální paamet učení α po každou váhu E adaptace vah podle: Δ α Vaanty algotmů: Slva & Almeda Delta-ba-delta Supe SAB I. Mázová: Dobývání znalostí 83
Algotmus Slvy & Almedy () Heustka: URYCHLUJ, pokud se za poslední dvě po sobě doucí teace nezměnlo znaménko pacální devace ZPOMALUJ, pokud se znaménko změnlo Δ E (k) pacální devace chybové funkce podle váhy v k té teac α (0) počáteční hodnota paametu učení (,, n ) ncalzace malým náhodným hodnotam I. Mázová: Dobývání znalostí 85
I. Mázová: Dobývání znalostí 86 Algotmus Slvy & Almedy (3) V k té teac se hodnota paametu učení aktualzue po další kok (po každou váhu) podle: Konstanty u a d sou pevně zvolené tak, že u > a d < Adaptace vah podle: ( ) ( ) ( ) ( ) < > + 0 estlže, 0 estlže, ) ( ) ( ) ( k k k k k k k E E d E E u α α α ( ) ( ) ( ) k k k E Δ α
Algotmus zpětného šíření: statege po uychlení pocesu učení (). Algotmy duhého řádu: beou v úvahu více nfomací o tvau chybové funkce než en gadent zakřvení chybové funkce metody. řádu používaí kvadatckou apomac chybové funkce vekto všech vah sítě E( (, ) K, ) n chybová funkce Tayloova řada po apomac chybové funkce E: ( ) T T E + h E ( ) + E ( ) h + h E ( )h I. Mázová: Dobývání znalostí 9
I. Mázová: Dobývání znalostí 93 Algotmy duhého řádu (). Hessovská matce ( n n ) pacálních devací duhého řádu: ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) n n n n n E E E E E E E E E E L M O M M L L ( ) E
Algotmy duhého řádu (3) Gadent chybové funkce (zdevováním E h ): ( ) T T T E + h E ( ) + h E ( ) Gadent by měl být nulový (hledá se mnmum E ): h E E > Netonovské metody: Pacuí teatvně ( ( )) ( ) ( ) Aktualzace vah v k té teac podle: ( k + ) ( k ) ( E ( )) E ( ) Rychlá konvegence Poblémem může být výpočet nvezní Hessovské matce + I. Mázová: Dobývání znalostí 94
Algotmy duhého řádu (4) Pseudonetonovské metody: Pacuí se zednodušenou apomací Hessovské matce E ( ) V úvahu se beou pouze pvky na dagonále: Ostatní pvky Hessovské matce sou vynulovány Adaptace vah podle: ( ) ( k + ) ( k ) E E ( ) I. Mázová: Dobývání znalostí 95
Algotmy duhého řádu (5) Pseudonetonovské metody: Odpadá potřebná nveze Hessovské matce Metody dobře funguí, pokud má chybová funkce kvadatcký tva, v opačném případě však mohou nastat poblémy Vaanty algotmů: Quckpop Levenbeg-Maquadtův algtmus I. Mázová: Dobývání znalostí 96
Algotmus Quckpop () Bee v úvahu nfomace. řádu Mnmalzační koky povádí pouze v ednom ozměu Infomace o zakřvení chybové funkce ve směu adaptace se získává ze současné a předchozí pacální devace chybové funkce Nezávslá optmalzace po každou váhu pomocí kvadatcké ednoozměné apomace chybové funkce I. Mázová: Dobývání znalostí 97
Algotmus Quckpop () Aktualzace vah v k té teac podle: ( k ) ( k ) ( k ) + + Δ, kde Δ ( k ) ( k ) Δ E E ( k ) ( k ) ( k ) E Předpoklad: chybová funkce byla spočtena v koku ( k ) ( k ) a v koku k, a to po váhy s ozdílem Δ - buď standadním algotmem zpětného šíření nebo pomocí algotmu Quckpop I. Mázová: Dobývání znalostí 98
Algotmus Quckpop (3) Aktualzac vah lze psát ako: Δ ( k ) Jmenovatel odpovídá dskétní apomac pacální devace. řádu E ( ) Quckpop ~ pseudonetonovská dskétní metoda, kteá používá tzv. SEKANTOVÝ KROK E ( k ) E ( k ) ( k ) Δ ( k ) E I. Mázová: Dobývání znalostí 99
I. Mázová: Dobývání znalostí 00 Levenbeg-Maquadtův algotmus ychleší a přesněší v oblast mnma chybové funkce kombnace gadentní a Netonovy metody po výstup: ( ) y d y e g ( ) + y d y y y e ( ) H I g mn + 0 λ Hessovská matce gadent
Algotmus zpětného šíření: statege po uychlení pocesu učení (3) 3. Relaační metody petubace vah: V každé teac se počítá dskétní apomace gadentu poovnáním chybové funkce po výchozí váhy a chybové funkce po míně změněné váhy ( k váze byla přčtena malá petubace β ) E ( ) E ( ) E E Aktualzace vah pomocí: Δ ( ) ( ) Aktualzace se teatvně opakue po vždy náhodně zvolenou váhu α β I. Mázová: Dobývání znalostí 0
Hopfeldovy sítě Skoková přenosová funkce: f h + - n neuonů se skokovou přenosovou funkcí Bpolání vstupy výstupy { +, - } Synaptcké váhy (mez všem neuony navzáem) m ténovacích vzoů (tříd) Učení s učtelem Rozpoznávání Použtí: Asocatvní paměť Optmalzační úlohy I. Mázová: Dobývání znalostí 8
Hopfeldův model (bpolání) Kok : Učení - nastavte hodnoty synaptckých vah m s 0. Váha synapse mez neuony a s {-,+}. tá složka s tého vzou, n s s po po I. Mázová: Dobývání znalostí 9
Hopfeldův model (bpolání) () Kok : Incalzace - předložte neznámý vstupní vzo: y (0) n Kok 3: Iteace y (t). Výstup neuonu v čase t {-,+}. tá složka předloženého vzou y n + h ( t ) f y ( t ) n f h. Skoková přenosová funkce I. Mázová: Dobývání znalostí 30
Hopfeldův model (bpolání) (3) Iteatvní poces se př ozpoznávání opakue, dokud se výstupy neuonů neustálí. Výstupy neuonů pak epezentuí ten ténovací vzo, kteý nelépe odpovídá předloženému (neznámému) vzou. Kok 4: Předěte ke Koku. I. Mázová: Dobývání znalostí 3
Hopfeldův model (bpolání) (4) Konvegence (Hopfeld): Symetcké váhy: Asynchonní aktualzace výstupu ednotlvých neuonů Nevýhody: Kapacta ( m < 0.5 n ) n / log n Stablta ( otogonalzace) I. Mázová: Dobývání znalostí 3
Hopfeldův model příklad Učení: Vzoy: [-, -,, ] [, -,, -] Nastavení vah: M 0 m ( m ) ( m ) I. Mázová: Dobývání znalostí 33
I. Mázová: Dobývání znalostí 34 Hopfeldův model příklad () Nastavení vah: Rozpoznávání: Vzo: [-, -,, -] [, -,, -] [-, -,, ] 0 0 0 0 0 0 0 0 0 0 0 0 W 4 3 - -
I. Mázová: Dobývání znalostí 35 Hopfeldův model - ozpoznávání Po předložení vzou bude vekto potencálů sítě ( ) { { { ( ) 443 K K PERTURBACE m m T m T n T m T m T m n I m mi W m + + + + + + α ξ α α
Hopfeldův model ozpoznávání (), K, m Stav e stablní, estlže m < n a m petubace α e malá α,, α m. Skalání součn s každým dalším vektoem ( sgn ( ξ ) sgn ( ) ) Malý počet otogonálních vzoů I. Mázová: Dobývání znalostí 36
Hopfeldův model ozpoznávání (3) Stav neuonů zachován, dokud nesou vybány k aktualzac Výbě po aktualzac se povádí náhodně Neuony sou navzáem plně popoeny Symetcké váhy: 0 Konvegence ke stablnímu řešení př ozpoznávání - nutná podmínka: symetcká váhová matce s nulovou dagonálou a asynchonní dynamkou I. Mázová: Dobývání znalostí 37
Hopfeldůvmodel -příklady Váhová matce s nenulovou dagonálou nemusí vést ke stablním stavům W 0 0 0 0 0 0 Synchonní dynamka: (-, -, -) (,, ) Asynchonní dynamka: Náhodný výbě ednoho z osm možných vzoů I. Mázová: Dobývání znalostí 38
Hopfeldůvmodel příklady () Nesymetcká matce: W 0 0 Asynchonní dynamka: (, ) (, -) (-, ) (-, -) cyklcké změny - I. Mázová: Dobývání znalostí 39
Enegetcká funkce Enegetcká funkce Hopfeldovy sítě s n neuony a váhovou matcí W vyadřue eneg sítě ve stavu : E W ( ) E ( ) T ( Obdobně po sítě s pahovým neuony: T T E ( ) W + θ n n n + I. Mázová: Dobývání znalostí 40 n n ϑ )
Enegetcká funkce () Věta: Hopfeldova síť s asynchonní dynamkou dosáhne z lbovolného počátečního stavu sítě stablního stavu v lokálním mnmu enegetcké funkce. Idea důkazu: Počáteční stav ( ) Předložený vzo:, K,,, k n K I. Mázová: Dobývání znalostí 4
Enegetcká funkce (3) Idea důkazu (pokačování): E ( ) n n K aktualzac vybán neuon k k nezmění svů stav E( ) se nezmění k změní svů stav, K, k, K, n I. Mázová: Dobývání znalostí 4
I. Mázová: Dobývání znalostí 43 Enegetcká funkce (4) Idea důkazu (pokačování): ( ) n k k n k k n k k n k n k E symete vah
Enegetcká funkce (5) Idea důkazu (pokačování): Rozdíl enegí: E E kk 0 ( ) ( ) n ůzné znaménko (nak by nedošlo ke změně stavu) k k k k 443 443 POTENCIÁL k n n k k > 0 I. Mázová: Dobývání znalostí 44
Enegetcká funkce (6) Idea důkazu (pokačování): Vždy, když dode ke změně stavu neuonu, sníží se celková enege sítě Konečný počet možných stavů Stablní stav, kdy eneg sítě už nelze snžovat QED I. Mázová: Dobývání znalostí 45
Stochastcké modely neuonových sítí Hopfeldův model se používá k řešení optmalzačních poblémů, kteé lze vyádřt ve fomě mnmalzované enegetcké funkce ( když není zaučeno nalezení globálního optma) Poblém: zabánt uvíznutí v lokálním mnmu enegetcké funkce I. Mázová: Dobývání znalostí 66
Stochastcké modely neuonových sítí () Modfkace Hopfeldova modelu:. statege: zvětšení počtu možných cest k řešení ve stavovém postou dovolt stavy ve fomě eálných hodnot ( sgmodální přenosová funkce) > spotý model. statege: omezení lokálních mnm enegetcké funkce pomocí zašuměné dynamky sítě dočasné povolení aktualzace stavu sítě za cenu přechodného zvýšení enegetcké hladny > smulované žíhání, Boltzmannův sto I. Mázová: Dobývání znalostí 67
Smulované žíhání B B A A C C I. Mázová: Dobývání znalostí 74
Smulované žíhání () Př mnmalzac enegetcké funkce E se tento ev smulue následuícím způsobem: Hodnota poměnné se změní vždy, když může aktualzace Δ zmenšt hodnotu enegetcké funkce E Pokud by se př aktualzac naopak hodnota E zvýšla o ΔE, bude nová hodnota (t. + Δ ) přata s pavděpodobností p ΔE : Δ E kde T e tzv. teplotní konstanta p e Δ E I. Mázová: Dobývání znalostí 75 + T
Smulované žíhání (3) Po velké hodnoty T bude: p ΔE a aktualzace stavu nastane zhuba v polovně těchto případů Po T 0 bude docházet pouze k takovým aktualzacím, kdy se hodnota E sníží Postupná změna hodnot T z velm vysokých hodnot směem k nule odpovídá zahřátí a postupnému ochlazování v pocesu žíhání I. Mázová: Dobývání znalostí 76
Smulované žíhání (4) Navíc lze ukázat, že touto stategí lze dosáhnout (asymptotcky) globálního mnma enegetcké funkce Sgmoda nelépe odpovídá funkcím používaným v temodynamce (po analýzu teplotní ovnováhy) I. Mázová: Dobývání znalostí 77
Boltzmannův sto Defnce: Boltzmannův stoe Hopfeldova síť, kteá se skládá z n neuonů se stavy,,, n. Stav neuonu se aktualzue asynchonně podle pavdla: kde 0 p s s pstí pstí + e p p n I. Mázová: Dobývání znalostí 78 ϑ T
I. Mázová: Dobývání znalostí 79 Boltzmannův sto () Ve vztahu: označue T kladnou teplotní konstantu, váhy sítě a ϑ pahy neuonů Enegetcká funkce Boltzmannova stoe: + n n n E ϑ T n e p + ϑ
Boltzmannův sto (3) Rozdíl mez Boltzmannovým stoem a Hopfeldovým modelem spočívá ve stochastcké aktvac neuonů Pokud e T velm malé, bude p ~, estlže e n ϑ pokud e ectace neuonu záponá, bude p ~0 > dynamka Boltzmannova stoe apomue dynamku dskétní Hopfeldovy sítě a Boltzmannův sto nade lokální mnmum enegetcké funkce 0 I. Mázová: Dobývání znalostí 80
Boltzmannův sto (4) Po e T > 0 e pavděpodobnost změny anebo posloupnost změn ze stavu,, n do ného stavu vždy nenulová Boltzmannův sto nezůstane v edném stavu snžování a záoveň možnost zvyšování enege systému Po velké hodnoty T pode síť téměř celý stavový posto V ochlazovací fáz má síť tendenc zůstávat déle v oblastech blízkých ataktoům lokálních mnm I. Mázová: Dobývání znalostí 8
Boltzmannův sto (5) Pokud se teplota snžue spávným způsobem, můžeme očekávat, že systém dosáhne globálního mnma s pavděpodobností I. Mázová: Dobývání znalostí 8
Učení bez učtele Učení bez učtele: Samooganzace a shlukování Motvace: Síť sama ozhodne, kteá odezva e po daný vzo nelepší a podle toho nastaví své váhy Poblém: Učt počet a ozložení shluků v příznakovém postou I. Mázová: Dobývání znalostí 85
Učení bez učtele () I. Mázová: Dobývání znalostí 86
Učení bez učtele (3) I. Mázová: Dobývání znalostí 87
Učení bez učtele (4) Kompetční učení: Bo o pávo epezentovat předložený vzo Potlačování soupeřů INHIBICE Pavdlo vítěz bee vše (WTA Wnne_takes_all) Poslované učení (enfocement): Důaz na co nelepší epodukc vstupů I. Mázová: Dobývání znalostí 88
Kompetční učení bez učtele n ozměný vstupní vzo e zpacováván pomocí takového počtu neuonů, kteý odpovídá (předpokládanému) počtu shluků Neuony v tomto případě počítaí (Eukldovskou) vzdálenost mez předloženým vzoem a svým váhovým vektoem I. Mázová: Dobývání znalostí 89
Kompetční učení bez učtele () V kompetc vítězí neuon, kteý ke neblíže předloženému vzou Vítězný neuon bude neaktvněší a bude potlačovat nhbovat aktvtu ostatních neuonů I. Mázová: Dobývání znalostí 90
Kompetční učení bez učtele (a) Inhbce pomocí lateálních spoů > lateální nhbce Po ozhodnutí, zda bude neuon aktvní nebo ne, e nutná globální nfomace o stavu všech neuonů v sít Aktvta neuonu sgnalzue příslušnost předloženého vstupu ke shluku vektoů epezentovaných tímto neuonem I. Mázová: Dobývání znalostí 9
Kompetční učení bez učtele (3) Vítězný neuon zadaptue své váhy směem k předloženému vzou: Δ α ( ) plastcta sítě (během učení pomalu klesá) Cíl: Umístt neuony do středu shluků vzoů Zachovat ž vytvořenou stuktuu sítě I. Mázová: Dobývání znalostí 9
Kompetční učení bez učtele (4) Uychlení pocesu učení: Vhodná ncalzace vah Např. podle náhodně vybaných vzoů Poblémy: Mtvé (nevyužté) neuony Mřížka v Kohonenově vstvě Topologcké okolí neuonu Řízená kompetce a mechansmus svědomí I. Mázová: Dobývání znalostí 93
Kompetční učení bez učtele (5) Během učení by se měly váhy ednotlvých neuonů nastavt tak, aby odpovídaly těžšt příslušného shluku Enegetcká funkce množny n ozměných nomovaných vstupních vzoů X, K, m ; n e po neuon s váhovým vektoem dána pomocí: m E X { } ( ) ( ) n ; R I. Mázová: Dobývání znalostí 94
Kompetční učení bez učtele (6) > lze ukázat, že v optmálním případě e vekto vah umístěn v těžšt shluku vstupních vzoů E X ( ) ( ) m m m n ( + ) n n m m m n + m n I. Mázová: Dobývání znalostí 95
I. Mázová: Dobývání znalostí 96 Kompetční učení bez učtele (7) ( ) K m K m m m m m m E n m K m n n m m n m m m X + + + + 44444 4 3 44444 4
Kompetční učení bez učtele (8) vekto představue centod shluku a K e konstanta enegetcká funkce má globální mnmum v {, K, }, m I. Mázová: Dobývání znalostí 97
Kohonenovy mapy Teuvo Kohonen fonetcký psací sto Topologcké okolí NE (O) NE (t ) I. Mázová: Dobývání znalostí 3
Kohonenovy mapy () N výstupní neuony Učení: bez učtele Rozpoznávání Použtí: Fonetcký psací sto Ekonome I. Mázová: Dobývání znalostí 33
Kohonenův model algotmus učení Motvace: Mřížka, na níž sou uspořádané neuony, umožňue dentfkac neblžších sousedů daného neuonu v půběhu učení se aktualzuí váhy příslušných neuonů ech sousedů Cíl: sousední neuony by měly také eagovat na velm podobné sgnály I. Mázová: Dobývání znalostí 34
Kohonenůvmodel algotmus učení () Poblém (-dm): Rozčlenění n ozměného postou pomocí ednoozměného řetězce Kohonenovských neuonů Neuony uspořádané do posloupnost a označené od do n I. Mázová: Dobývání znalostí 35
Kohonenůvmodel algotmus učení (3) Poblém (-dm pokačování): Jednoozměná mřížka neuonů: Každý neuon dostává n ozměný vstup a na základě n ozměného váhového vektou,, spočítá svou ectac ( ) K n Cíl: specalzace každého neuonu na nou oblast vstupního postou (tuto specalzac chaaktezue mamální ectace příslušného neuonu po vzoy z dané oblast) I. Mázová: Dobývání znalostí 36
Kohonenůvmodel algotmus učení (4) Poblém (-dm pokačování): Kohonenovské neuony počítaí Eukldovskou vzdálenost mez vstupem a příslušným váhovým vektoem neblžšímu neuonu bude odpovídat mamální ectace I. Mázová: Dobývání znalostí 37
Kohonenůvmodel algotmus učení (5) Defnce okolí: V ednoozměné Kohonenově mapě patří do okolí neuonu k s poloměem neuony k a k + Neuony na obou koncích ednoozměné Kohonenovy mapy maí asymetcké okolí V ozměné Kohonenově mapě patří do okolí neuonu k o poloměu všechny neuony, kteé sou od k vzdáleny až o pozc doleva č dopava Obdobně po víceozměné Kohonenovy mapy a zvolenou metku na mřížce (čtvecová, heagonální, ) I. Mázová: Dobývání znalostí 38
Kohonenůvmodel algotmus učení (6) Funkce lateální nteakce Φ(,k): ~ síla lateální vazby mez neuony a k během učení Příklad: Φ(,k) z okolí k s poloměem a Φ(,k)0 ostatní Funkce meckého klobouku a další I. Mázová: Dobývání znalostí 39
Kohonenovy samooganzuící se příznakové mapy: algotmus Kok : Zvol hodnoty vah mez N vstupmín a M výstupním neuony ako malé náhodné hodnoty. Zvol počáteční polomě okolí a funkc lateální nteakce Φ. Kok : Předlož nový ténovací vzo. Kok 3: Spočíte vzdálenost d mez vstupním a váhovým vektoem po každý výstupní neuon pomocí: d N 0 () t () t ( ) Kde (t) e vstupem neuonu v čase t a (t) e váhou synapse ze vstupního neuonu k výstupnímu neuonu v čase t. Tuto vzdálenost lze upavt váhovým koefcentem a předat kompetční vstvě. I. Mázová: Dobývání znalostí 40
Kohonenovy samooganzuící se příznakové mapy: algotmus () Kok 4: Vybe (např. pomocí lateální nteakce) takový výstupní neuon c, kteý má mnmální d a označ ho ako vítěze. Kok 5: Váhy se aktualzuí po neuon c a všechny neuony v okolí defnovaném pomocí N c. Nové váhy sou: (t+) (t) + α(t) Φ(c,) ( (t) (t) ) Po N c ; 0 N- α(t) e vglanční koefcent ( 0 < α(t) < ), kteý klesá v čase (vglance ~ bdělost). I. Mázová: Dobývání znalostí 4
Kohonenovy samooganzuící se příznakové mapy: algotmus (3) Po volbu α(t) by mělo platt: α Př pocesu učení tak vítězný neuon upaví svů váhový vekto směem k aktuálnímu vstupnímu vektou. Totéž platí po neuony v okolí vítěze. Hodnota funkce Φ(c,) klesá s ostoucí vzdáleností neuonů od středu okolí N c. Kok 6: Před ke Koku. () t α () t < t t I. Mázová: Dobývání znalostí 4
Analýza konvegence ~ stablta řešení a uspořádaný stav (6) PROBLÉMY: ozvnutí planání mřížky a podmínky, za kteých k němu dode metastablní stavy a nevhodná volba funkce lateální nteakce (přílš ychlý pokles) konvegence po -dmenzonální případ za předpokladu ovnoměného ozložení a adaptačního plavdla ne k + γ ξ old k ( old ) kde k označue vítězný neuon a eho dva sousedy (Cottell & Fot, 986) I. Mázová: Dobývání znalostí 48 k
Vaanty algotmu učení po Kohonenovy mapy Učení s učtelem: (LVQ ~ Leanng Vecto Quantzaton) LVQ: Motvace: - ) by měl patřt ke stené třídě ako neblžší nechť c e nde ag mn ležícího neblíž { } k ( c ~ vítězný neuon) I. Mázová: Dobývání znalostí 49
I. Mázová: Dobývání znalostí 50 Vaanty algotmu učení po Kohonenovy mapy () LVQ (pokačování): adaptační pavdla ( 0 < α(t) < ): ( ) ( ) ( ) ( ) ( ) [ ] ( ) () () () () [ ] ( ) ( ) c t t t t t t t t t t t t c c c c c c c c + + + + estlže sou klasfkov ány nak a estlže sou klasfkov ány steně a estlže α α
Vaanty algotmu učení po Kohonenovy mapy (3) LVQ.: Motvace: adaptace dvou neblžších sousedů současně Jeden z nch musí patřt ke spávné třídě a duhý k nespávné Navíc musí být z okolí dělcí nadplochy mez a (~ z okénka ) Je-l d (esp. d ) Eukldovská vzdálenost mez a (esp. mez a ), lze okénko defnovat pomocí vztahu: d d mn, > s, kde s d d + (dopoučované hodnoty (~ šířky okénka ): 0. 0.3 ) I. Mázová: Dobývání znalostí 5
Vaanty algotmu učení po Kohonenovy mapy (4) LVQ. (pokačování): adaptační pavdla ( 0 < α(t) < ): t + t α t t t + t + α t t a leží neblíže k přtom a patří ke stené třídě a a patřík ůzným třídám ( ) ( ) ( )[ ( ) ( )] t ( ) () () () () t e z okénka [ ] I. Mázová: Dobývání znalostí 5
Vaanty algotmu učení po Kohonenovy mapy (5) LVQ3 (motvace): apomace ozložení tříd a stablzace řešení adaptační pavdla ( 0 < α(t) < ): t + t α t t t + t + α t t ( ) ( ) ( )[ ( ) ( )] t ( ) () () () () t [ ] a leží neblíže k ; přtom a patříke stené třídě a a patřík ůzným třídám a e z okénka k ( t + ) k ( t ) + εα ( t )[ ( t ) k ( t )] po k {, } estlže, patří do stené třídy I. Mázová: Dobývání znalostí 53
Vaanty algotmu učení po Kohonenovy mapy (6) LVQ3 (pokačování): volba paametů: 0. ε 0.5 0. 0.3 I. Mázová: Dobývání znalostí 54
Vaanty algotmu učení po Kohonenovy mapy (7) Další vaanty: Vícevstvé Kohonenovy mapy Stom abstakce Sítě se vstřícným šířením (Countepopagaton) Učení s učtelem dvě fáze učení Kohonenovská (klastovací) vstva Gossbegovská vstva (adaptace vah en po vítězné neuony z Kohonenovské vstvy I. Mázová: Dobývání znalostí 55
Sítě se vstřícným šířením výstupní neuony y y M Učení: s učtelem Rozpoznávání Použtí: Heteoasocatvní paměť vstupní neuony N I. Mázová: Dobývání znalostí 56
Učící algotmus po sítě se vstřícným šířením () Kok : Zvolte náhodné hodnoty synaptckých vah. Kok : Předložte nový ténovací vzo ve tvau (vstup, požadovaný výstup). Kok 3: Vybete v Kohonenově vstvě neuon c, ehož synaptcké váhy nelépe odpovídaí předloženému vzou ( t). Po tento neuon tedy bude platt, že vzdálenost e k mez příslušným váhovým vektoem v k ( t) a předloženým vzoem ( t) e mnmální. Použít lze např. Eukldovskou metku, potom: e c mn k e k mn k ( () t v () t ) k I. Mázová: Dobývání znalostí 57
Učící algotmus po sítě se vstřícným šířením () Kok 4: Aktualzueme váhy v k mez vstupním neuonem a neuony Kohonenovské vstvy, kteé se nacházeí v okolí N c neuonu c tak, aby lépe odpovídaly předloženému vzou t : v k α (t), kde 0 < α (t) <, e paamet učení po váhy mez vstupní a Kohonenovskou vstvou, kteý klesá v čase. t představue současný a t + následuící kok učení. () ( t + ) v ( t) + α( t) ( ( t) v ( t) ) k k I. Mázová: Dobývání znalostí 58
Učící algotmus po sítě se vstřícným šířením (3) Kok 5: Aktualzute váhy c mez vítězným neuonem c z Kohonenovské vstvy a neuony Gossbegovské vstvy tak, aby výstupní vekto y lépe odpovídal požadované odezvě d : c (t) e váha synaptckého spoe mez c-tým neuonem Kohonenovské vstvy a -tým neuonem Gossbeovské vstvy v čase t, c (t + ) označue hodnotu této synaptcké váhy v čase t +. β e kladná konstanta ovlvňuící závslost nové hodnoty synaptcké váhy na eí hodnotě v předchozím koku učení. Kladná konstanta γ představue paamet učení vah mez Kohonenovskou a Gossbegovskou vstvou, z c označue aktvtu vítězného neuonu Kohonenovské vstvy. Kok 6: Předěte ke koku. c ( t + ) ( β ) c ( t) + γ zcd I. Mázová: Dobývání znalostí 59
RBF-sítě (Radal Bass Functons) Hybdní achtektua (Moody & Daken) Učení s učtelem z z z 3 z n lneání asocáto n 3 n Kohonenovská vstva n neuonů s Gaussovskou přenosovou funkcí vstupní neuony I. Mázová: Dobývání znalostí 60
RBF-sítě (Radal Bass Functons) Každý neuon počítá svů výstup g (t) podle:, K, m g ( ) ep ep... vstupní vekto k ( ) σ ( ) σ... váhové vektoy skytých neuonů σ, K,σ m... konstanty (nastavené např. podle vzdálenost mez příslušným váhovým vektoem a eho neblžším sousedem) k k I. Mázová: Dobývání znalostí 6
I. Mázová: Dobývání znalostí 6 RBF-sítě (Radal Bass Functons) výstup každého sytého neuonu e nomován vzáemné popoení všech neuonů váhy z,, z m lze nastavt např. pomocí algotmu zpětného šíření: d... požadovaný výstup p... počet ténovacích vzoů γ... paamet učení ( ) ( ) ( ) Δ n p n p p z g d g z E z d z g E γ
ART Adaptve Resonance Theoy (Capente & Gossbeg) výstup 0 vstup I. Mázová: Dobývání znalostí 63
ART Adaptve Resonance Theoy () (Capente & Gossbeg) ART : Bnání vstupy, učení bez učtele Lateální nhbce po učení výstupního neuonu s mamální odezvou Váhy po zpětnou vazbu (z výstupních neuonů směem ke vstupním) po poovnání skutečné podobnost s ozpoznaným vzoem I. Mázová: Dobývání znalostí 64
ART Adaptve Resonance Theoy (3) (Capente & Gossbeg) ART (pokačování): Vglanční test paamet bdělost Mechansmus po vypnutí výstupního neuonu s mamální odezvou stablta plastcta sítě síť má velké poblémy př en tochu zašuměných vzoech naůstá počet ukládaných vzoů I. Mázová: Dobývání znalostí 65
ART algotmus učení Kok : Incalzace t ( 0 ) 0 N- b ( 0 ) / ( + N ) 0 M- ρ 0 ρ b ( t ) ~ váha mez vstupním neuonem a výstupním neuonem v čase t t ( t ) ~ váha mez výstupním neuonem a vstupním neuonem v čase t (učuí vzo specfkovaný výstupním neuonem ) ρ ~ páh bdělost (učue, ak blízko musí být předložený vstup k uloženému vzou - aby mohly patřt do stené kategoe) I. Mázová: Dobývání znalostí 66
ART algotmus učení () Kok : Předlož nový vstup Kok 3: Spočíte aktvac výstupních neuonů μ μ N 0 b ( t ) ; 0 M ~ výstup výstupního neuonu ~ tá složka vstupního vektou ( { 0, } ) Kok 4: Vybe uložený vzo, kteý nelépe odpovídá předloženému vzou (např. pomocí lateální μ ma μ nhbce): { } I. Mázová: Dobývání znalostí 67
ART algotmus učení (3) Kok 5: Test bdělost N 0 estlže před ke Koku 7 nak před ke Koku 6 T a N 0 t Kok 6: Zmazení nelépe odpovídaícího neuonu > ρ T výstup neuonu * vybaného v Koku 4 e dočasně nastaven na nulu (a neúčastní se mamalzace v Koku 4). Poté před ke Koku 4. I. Mázová: Dobývání znalostí 68
ART algotmus učení (4) Kok 7: Aktualzace nelépe odpovídaícího neuonu t t + t t b ( ) ( ) ( t + ) Kok 8: Před ke Koku a opaku 0.5 () t (Předtím znovu zapo všechny neuony zmazené v Koku 6) + t N 0 () t I. Mázová: Dobývání znalostí 69 t