Strojové učení. Things learn when they change their behavior in a way that makes them perform better in a future. (Witten, Frank, 1999) typy učení:

Strojové učeí The feld of mache learg s cocered wth the questo of how to costruct computer programs that automatcally mprove wth eperece. (Mtchell, 1997) Thgs lear whe they chage ther behavor a way that makes them perform better a future. (Wtte, Frak, 1999) typy učeí: učeí se koceptům (kowledge acqusto) učeí se dovedostem (skll refemet). vztah strojového učeí a dobýváí zalostí P. Berka, 2011 1/18

volba reprezetace učeí učeí rozhodováí zalost objekt pops rozhodováí rozhodutí objektu Obecé schéma učícího se systému Metody učeí: 1. učeí zapamatováím (rote learg ebol bflováí), 2. učeí se z strukcí (learg from structo, learg by beg told), 3. učeí se z aaloge (learg by aalogy, stacebased learg, lazy learg), 4. učeí a základě vysvětleí (eplaato-based learg), 5. učeí se z příkladů (learg from eamples), 6. učeí se z pozorováí a objevováím (learg from observato ad dscovery), P. Berka, 2011 2/18

Metody učeí: statstcké metody - regresí metody, dskrmačí aalýza, shluková aalýza, symbolcké metody umělé telgece - rozhodovací stromy a pravdla, případové usuzováí (CBR) subsymbolcké metody umělé telgece - euroové sítě, bayesovské sítě ebo geetcké algortmy. Iformace o správost učeí: příklady zařazeé do tříd (učeí s učtelem - supervsed learg) odměy za správé chováí a tresty za chováí esprávé (reforcemet learg) epřímé ázaky odvozeé s chováí učtele (appretceshp learg) žádé (učeí bez učtele - usupervsed learg) P. Berka, 2011 3/18

reprezetace příkladů: 1. atrbuty: kategorálí (bárí, omálí, ordálí) a umercké [barva_vlasu=cera & vyska=180 & vousy=ao & vzdela=vs] 2. relace otec(ja_lucembursky, karel_iv) Algortmy: dávkové všechy příklady se zpracovávají ajedou kremetálí příklady se zpracovávají postupě, systém lze doučovat Metody učeí: emprcké vychází se z velkého možství příkladů a žádých (ebo je mála) počátečích zalostí aalytcké vychází se z velkého možství počátečích zalostí a je ěkolka (lustračích) příkladů P. Berka, 2011 4/18

Prcpy emprckého učeí z dat 1. objekty, patřící do téže třídy mají podobé charakterstky (učeí a základě podobost, smlarty-based learg) příklady téže třídy vytvářejí shluky v prostoru atrbutů cílem učeí je tyto shluky alézt a popsat Nebezpečí garbage, garbage out Důležtost přípravy a předzpracováí dat P. Berka, 2011 5/18

2. z koečého počtu příkladů odvozujeme obecé zalost (duktvost) Příklady rozděley do 2 (ěkdy 3) mož: o tréovací data pro vytvořeí modelu o (valdačí data pro doladěí parametrů) o testovací data pro otestováí modelu P. Berka, 2011 6/18

Obecá defce strojového učeí (s učtelem) Aalyzovaá data: D = : 11 2 1 1 12 2 2 : 2......... 1m 2 m : m Řádky tabulky reprezetují sledovaé objekty Sloupce datové tabulky odpovídají atrbutům Přdáme-l cílový atrbut do datové tabulky, získáme data vhodá pro použtí ěkteré metody učeí s učtelem (tzv. tréovací data). D TR = : 11 2 1 1 1 2 2 2 : 2......... 1m 2 m : m y y y : 1 2 Klasfkačí úloha: hledáme zalost (reprezetovaé rozhodovací fukcí f), které by umožňovaly k hodotám vstupích atrbutů ějakého objektu přřadt vhodou hodotu atrbutu cílového f: y. P. Berka, 2011 7/18

V průběhu klasfkace se tedy pro hodoty vstupích atrbutů ějakého objektu odvodí hodota cílového atrbutu: ŷ = f (). Odvozeá hodota ŷ se pro objekty z tréovacích dat může lšt od skutečé hodoty y. Můžeme tedy pro každý objekt o D TR vyčíslt chybu klasfkace Q f (o, ŷ ). pro umercký atrbut C apř. Q (, y ) = (y - y ) 2 f o pro kategorálí atrbut C apř. Q (, y ) = f o 1 pro y y 0 pro y = y Pro celou tréovací možu D TR pak můžeme vyčíslt souhrou chybu Err(f,D TR ), apříklad jako středí chybu Err(f,D = 1 TR ) Q f ( o, y ) Cílem učeí je alézt takové zalost f*, které by mmalzovaly tuto chybu =1 Err(f*,D TR ) = m Err(f, D TR ). f. P. Berka, 2011 8/18

1. Učeí jako prohledáváí hledáme strukturu parametry modelu Modely jako popsy shluků: MGM - ejobecější model (jede shluk pro všecho) MSM - ejspecálější model(y) (co příklad to shluk) M1 obecější ež M2, M2 je specálější ež M1 B( ) B( ) 1 1 = B( k), k k B(0) = 1 1 2 3 4 5 10 1 2 5 15 52 115975 Bellova čísla P. Berka, 2011 9/18

Možost prohledáváí: Podle směru shora dolů (od obecějších modelů ke specálějším) zdola ahoru (od specálějších modelů k obecějším) Podle stratege slepé (bereme v úvahu všechy možost specalzace/geeralzace daého modelu) heurstcké (podle ějakého krtéra vybereme je ěkteré možost specalzace/geeralzace daého modelu) áhodé Podle šíře jedoduché (uvažujeme je jedu trasformac modelu) paralelí (uvažujeme více trasformací) P. Berka, 2011 10/18

Příklad: Předpokládejme, že jak vstupí atrbuty tak cílový atrbut jsou kategorálí - hodotě atrbutu budeme říkat kategore: 1. atomcká formule vyjadřující vlastost objektu o : A j (v k )( o ) 1 = 0 pro pro j j = v v 2. moža objektů majících daou vlastost { A (v )} { o : = } j k = j v k k k Spojováím kategorí logckou spojkou budeme vytvářet kombace Comb = [ A (v ), A (v ),..., A (v )] = A (v ) A (v )... A j1 k1 j2 k 2 jl k l j1 k1 j2 k 2 jl k l (v ) 1. o Comb( o 1 pro j = v k = v... = v 1 j2 k 2 jl ) = 0 jak l : 1 k 2. { Comb } = { o : = v k j = v k... j = }. j v 1 1 2 2 l k l Platí-l Comb(o ) = 1, říkáme, že kombace Comb pokrývá objekt o Přdáváím kategorí ke kombac vzkají její adkombace, odebráím kategorí z kombace vzkají její podkombace. P. Berka, 2011 11/18

Částečé uspořádáí mez kombacem: Je-l kombace Comb 1 podkombací kombace Comb 2, potom říkáme, že kombace Comb 1 je obecější ež kombace Comb 2 a že kombace Comb 2 je specálější ež kombace Comb 1. Je-l kombace Comb 1 obecější ež kombace Comb 2, potom Comb 1 pokrývá alespoň všechy ty objekty, které pokrývá Comb 2. Hledaé zalost budou reprezetováy kombacem, které budou popsovat (pokrývat) pouze příklady daé třídy. Kombace Comb je kozstetí, právě když pokrývá pouze příklady jedé třídy: C(v ) o D : Comb( o ) = 1 y = v Příklad: t TR příjem koto pohlaví ezaměstaý auto bydleí úvěr vysoký vysoké žea e ao vlastí Ao vysoký vysoké muž e ao vlastí Ao zký ízké muž e ao ájemí Ne vysoký vysoké muž e e ájemí Ao V kombac Comb (hypotéze popsující kocept úvěr ) se pro každý atrbut může objevt: t? jakožto dkace toho, že a hodotě atrbutu ezáleží, hodota atrbutu, jakožto dkace toho, že žádá hodota atrbutu evyhovuje. P. Berka, 2011 12/18

[?,?,?,?,?,?]... [?,?, žea,?,?,?] [vysoký,?,?,?,?,?] [?,vysoké,?,?,?,?] [?,?,?,?,?, vlastí]... [vysoký,?,?, e,?,?] [vysoký,vysoké,?,?,?,?] [?, vysoké,?, e,?,?,?] [vysoký,vysoké,?, e,?,?] [vysoký,vysoké,?, e,ao,?] [vysoký,vysoké,?,e,?,vlastí] [vysoký,vysoké,muž, e,?,?] [vysoký, vysoké,?, e,ao, vlastí] [vysoký, vysoké, muž,e,?,vlastí] [vysoký, vysoké, žea,e,?,vlastí] [vysoký, vysoké, muž,e, ao,?] [vysoký, vysoké, muž,e, e,?] [vysoký,vysoké,žea,e, ao, vlastí] [vysoký,vysoké,muž,e, ao, vlastí] [vysoký,vysoké,muž,e, e, ájemí] [,,,,, ] Prostor hypotéz Prostorem hypotéz se můžeme pohybovat dvěma způsoby: od obecějšího popsu ke specálějšímu (specalzace), od specálějšího popsu k obecějšímu (geeralzace). P. Berka, 2011 13/18

Fd-S algortmus 1. přřaď do h ejspecálější hypotézu v H 2. pro každý poztví příklad 2.1. pro každý atrbut a z hypotézy h f hodota atrbutu a eodpovídá příkladu the ahraď hdotu a ejblžší obecou hodotou která odpovídá 3. vydej h S: [vysoký, vysoké,?,e,?,?] [vysoký,vysoké,?, e,ao,?] [vysoký,vysoké,?,e,?,vlastí] [vysoký,vysoké,muž, e,?,?] [vysoký, vysoké,?, e,ao, vlastí] [vysoký, vysoké, muž,e, e,?] [vysoký,vysoké,žea,e, ao, vlastí] [vysoký,vysoké,muž,e, ao, vlastí] [vysoký,vysoké,muž,e, e, ájemí] P. Berka, 2011 14/18

Caddate-Elmato algortmus 1. přřaď do G možu ejobecějších hypotéz z H 2. přřaď od S možu ejspecálějších hypotéz z H 3. pro každý příklad 3.1. f je poztví příklad the odstraň z G všechy hypotézy kosstetí s příkladem pro každou hypotézu s z S která je kosstetí s příkladem odstraň s z S přdej do S ejmeší geeralzac h hypotézy s takovou, že h je kosstet s příkladem a že v G je hypotéza obecější ež h odstraň z S hypotézy, které jsou obecější ež jé hypotézy v S 3.2. f je egatví příklad the odstraň z S všechy hypotézy kosstetí s příkladem pro každou hypotézu g z G která je kosstetí s příkladem odstraň g z G přdej do G ejmeší specalzac h hypotézy g takovou, že h je kosstetí s příkladem a že v S je hypotéza specálější ež h odstraň z G všechy hypotézy, které jsou specálější ež jé hypotézy v G G: [vysoký,?,?,?,?,?] [?, vysoké,?,?,?,?] [vysoký,?,?, e,?,?] [vysoký,vysoké,?,?,?,?] [?, vysoké,?, e,?,?,?] S: [vysoký, vysoké,?,e,?,?] P. Berka, 2011 15/18

2. Učeí jako apromace hledáme pouze parametry modelu Příklad: a základě hodot fukce v koečém počtu bodů sažíme zrekostruovat její obecou podobu y=f() f() = q 1 + q 0 metoda ejmeších čtverců: Hledáí mma celkové odchylky m (y - f( )) 2 se převádí a řešeí rovce d dq (y - f( )) 2 = 0 P. Berka, 2011 16/18

řešeí: 1) aalytcké (záme typ fukce) řešeí soustavy rovc pro parametry fukce q 0 = ( ky k )( k k 2 ) - ( k k y k )( k k ) ( k k 2 ) - ( k k ) 2 q 1 = ( k k y k ) - ( k k )( k y k ) ( k k 2 )- ( k k ) 2 2) umercké (ezáme typ fukce) gradetí metody Err(q) = Err q 0, Err q 1,..., Err q Q. Modfkace zalostí q = [q 0, q 1,..., q Q ] pak probíhá podle algortmu kde q j q j + q j q j = Err - η q j a η je parametr vyjadřující velkost kroku kterým se přblžujeme k mmu fukce Err. P. Berka, 2011 17/18

Je-l apř. chybová fukce Err(f, D = 1 (y - y 1 TR ) ) = (y - f`( )) 2 2 =1 2 2 a předpokládaá fukce f leárí kombací vstupů f() = q, =1 můžeme odvodt gradet fukce Err jako Err q j = 1 2 2 ( y - y~ ) = 2( y - y~ ) ( y - y~ ) = 1 q j 2 = 1 q j 1 a tedy ( y - y~ ) ( y - q) = ( y - y~ )(- j) = q = 1 j = 1 ( ) j q = η y - y j =1 Obecě problém uvázutí v lokálím mmu P. Berka, 2011 18/18