Strojové učení. Things learn when they change their behavior in a way that makes them perform better in a future. (Witten, Frank, 1999) typy učení:

Podobné dokumenty
4. Strojové učení. 4.1 Základní pojmy

Rozhodovací stromy. Úloha klasifikace objektů do tříd. Top down induction of decision trees (TDIDT) - metoda divide and conquer (rozděl a panuj)

Metody zkoumání závislosti numerických proměnných

Cvičení 2: Rozhodovací stromy, RBF sítě, vlastní algoritmy v RapidMineru

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

4.2 Elementární statistické zpracování Rozdělení četností

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

Strojové uení. typy učení: Metody učení: učení se znalostem (knowledge acquisition) učení se dovednostem (skill refinement).

Generování dvojrozměrných rozdělení pomocí copulí

8 NELINEÁRNÍ REGRESNÍ MODELY

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

8. Odhady parametrů rozdělení pravděpodobnosti

Testování statistických hypotéz

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

Nejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

a další charakteristikou je četnost výběrového souboru n.

, jsou naměřené a vypočtené hodnoty závisle

11. Časové řady Pojem a klasifikace časových řad

Přednáška V. Úvod do teorie odhadu. Pojmy a principy teorie odhadu Nestranné odhady Metoda maximální věrohodnosti Průměr vs.

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2

9. Měření závislostí ve statistice Pevná a volná závislost

PRAVDĚPODOBNOST A STATISTIKA

1. Základy měření neelektrických veličin

Neuronové sítě. Biologický neuron. Modely neuronu. 1. Logický neuron (McCulloch, Pitts, 1943) w R, x, y {0, 1} Biologický neuron.

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

Deskriptivní statistika 1

IV. MKP vynucené kmitání

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

Regrese. Aproximace metodou nejmenších čtverců ( ) 1 ( ) v n. v i. v 1. v 2. y i. y n. y 1 y 2. x 1 x 2 x i. x n

5.5. KOMPLEXNÍ ODMOCNINA A ŘEŠENÍ KVADRATICKÝCH A BINOMICKÝCH ROVNIC

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

ANALÝZA A KLASIFIKACE DAT

vají statistické metody v biomedicíně

Úvod do korelační a regresní analýzy

vají statistické metody v biomedicíně Literatura Statistika v biomedicínsk nském výzkumu a ve zdravotnictví

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

1 Měření závislosti statistických znaků. 1.1 Dvourozměrný statistický soubor

PRAVDĚPODOBNOST A STATISTIKA

EKONOMETRIE 9. přednáška Zobecněný lineární regresní model

Odhady parametrů 1. Odhady parametrů

PRAVDĚPODOBNOST A STATISTIKA

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

VY_52_INOVACE_J 05 01

Přednáška VI. Intervalové odhady. Motivace Směrodatná odchylka a směrodatná chyba Centrální limitní věta Intervaly spolehlivosti

MATICOVÉ HRY MATICOVÝCH HER

Spolehlivost a diagnostika

Přednáška č. 10 Analýza rozptylu při jednoduchém třídění

IAJCE Přednáška č. 12

9 NÁHODNÉ VÝBĚRY A JEJICH ZPRACOVÁNÍ. Čas ke studiu kapitoly: 30 minut. Cíl:

Výstup a n. Vstup. obrázek 1: Blokové schéma a graf paralelní soustavy

Optimalizace portfolia

3. Hodnocení přesnosti měření a vytyčování. Odchylky a tolerance ve výstavbě.

PRAVDĚPODOBNOST A STATISTIKA

3. Lineární diferenciální rovnice úvod do teorie

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

P1: Úvod do experimentálních metod

Náhodný výběr 1. Náhodný výběr

Petr Šedivý Šedivá matematika

USTÁLENÉ PROUDĚNÍ V OTEVŘENÝCH KORYTECH

PRAVDĚPODOBNOST A STATISTIKA. Bodové a intervalové odhady

Statistika. Jednotlivé prvky této množiny se nazývají prvky statistického souboru (statistické jednotky).

Časová hodnota peněz. Metody vyhodnocení efektivnosti investic. Příklad

Dobývání dat a strojové učení

Money - Models of "Time" and Distance Between Risk Events

Interpolační křivky. Interpolace pomocí spline křivky. f 1. f 2. f n. x... x 2

Lineární regrese ( ) 2

2. Náhodná veličina. je konečná nebo spočetná množina;

Výukový modul III.2 Inovace a zkvalitnění výuky prostřednictvím ICT

Expertní Systémy. Tvorba aplikace

Doc. Ing. Dagmar Blatná, CSc.

a my chceme data proložit nějakou hladkou funkcí, která by vystihovala hlavní vlastnosti dat, ale ignorovala malé fluktuace a nepřesnosti.

K čemu slouží regrese?

Sekvenční logické obvody(lso)

Pravděpodobnostní model doby setrvání ministra školství ve funkci

6. FUNKCE A POSLOUPNOSTI

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

základním prvkem teorie křivek v počítačové grafice křivky polynomiální n

SOUKROMÁ VYSOKÁ ŠKOLA EKONOMICKÁ ZNOJMO. Statistika I. distanční studijní opora. Milan Křápek

Střední hodnoty. Aritmetický průměr prostý Aleš Drobník strana 1

UPLATNĚNÍ ZKOUŠEK PŘI PROHLÍDKÁCH MOSTŮ

PRAVDĚPODOBNOST A STATISTIKA

1 Základy Z-transformace. pro aplikace v oblasti

OKRUŽNÍ A ROZVOZNÍ ÚLOHY: OBCHODNÍ CESTUJÍCÍ. FORMULACE PŘI RESPEKTOVÁNÍ ČASOVÝCH OKEN

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

8. Analýza rozptylu.

Mendelova univerzita v Brně Statistika projekt

Analýza bodové množiny

[ jednotky ] Chyby měření

1. Měření ve fyzice, soustava jednotek SI

Úvod do teorie měření

jsou varianty znaku) b) při intervalovém třídění (hodnoty x

Statistika je vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter.

Matematická analýza I

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor

Metody statistické analýzy. doc. Ing. Dagmar Blatná, CSc.

Náhodné jevy, jevové pole, pravděpodobnost

Univerzita Karlova v Praze Pedagogická fakulta

Lineární regresní model (VJ REGMOD-2)

Transkript:

Strojové učeí The feld of mache learg s cocered wth the questo of how to costruct computer programs that automatcally mprove wth eperece. (Mtchell, 1997) Thgs lear whe they chage ther behavor a way that makes them perform better a future. (Wtte, Frak, 1999) typy učeí: učeí se koceptům (kowledge acqusto) učeí se dovedostem (skll refemet). vztah strojového učeí a dobýváí zalostí P. Berka, 2011 1/18

volba reprezetace učeí učeí rozhodováí zalost objekt pops rozhodováí rozhodutí objektu Obecé schéma učícího se systému Metody učeí: 1. učeí zapamatováím (rote learg ebol bflováí), 2. učeí se z strukcí (learg from structo, learg by beg told), 3. učeí se z aaloge (learg by aalogy, stacebased learg, lazy learg), 4. učeí a základě vysvětleí (eplaato-based learg), 5. učeí se z příkladů (learg from eamples), 6. učeí se z pozorováí a objevováím (learg from observato ad dscovery), P. Berka, 2011 2/18

Metody učeí: statstcké metody - regresí metody, dskrmačí aalýza, shluková aalýza, symbolcké metody umělé telgece - rozhodovací stromy a pravdla, případové usuzováí (CBR) subsymbolcké metody umělé telgece - euroové sítě, bayesovské sítě ebo geetcké algortmy. Iformace o správost učeí: příklady zařazeé do tříd (učeí s učtelem - supervsed learg) odměy za správé chováí a tresty za chováí esprávé (reforcemet learg) epřímé ázaky odvozeé s chováí učtele (appretceshp learg) žádé (učeí bez učtele - usupervsed learg) P. Berka, 2011 3/18

reprezetace příkladů: 1. atrbuty: kategorálí (bárí, omálí, ordálí) a umercké [barva_vlasu=cera & vyska=180 & vousy=ao & vzdela=vs] 2. relace otec(ja_lucembursky, karel_iv) Algortmy: dávkové všechy příklady se zpracovávají ajedou kremetálí příklady se zpracovávají postupě, systém lze doučovat Metody učeí: emprcké vychází se z velkého možství příkladů a žádých (ebo je mála) počátečích zalostí aalytcké vychází se z velkého možství počátečích zalostí a je ěkolka (lustračích) příkladů P. Berka, 2011 4/18

Prcpy emprckého učeí z dat 1. objekty, patřící do téže třídy mají podobé charakterstky (učeí a základě podobost, smlarty-based learg) příklady téže třídy vytvářejí shluky v prostoru atrbutů cílem učeí je tyto shluky alézt a popsat Nebezpečí garbage, garbage out Důležtost přípravy a předzpracováí dat P. Berka, 2011 5/18

2. z koečého počtu příkladů odvozujeme obecé zalost (duktvost) Příklady rozděley do 2 (ěkdy 3) mož: o tréovací data pro vytvořeí modelu o (valdačí data pro doladěí parametrů) o testovací data pro otestováí modelu P. Berka, 2011 6/18

Obecá defce strojového učeí (s učtelem) Aalyzovaá data: D = : 11 2 1 1 12 2 2 : 2......... 1m 2 m : m Řádky tabulky reprezetují sledovaé objekty Sloupce datové tabulky odpovídají atrbutům Přdáme-l cílový atrbut do datové tabulky, získáme data vhodá pro použtí ěkteré metody učeí s učtelem (tzv. tréovací data). D TR = : 11 2 1 1 1 2 2 2 : 2......... 1m 2 m : m y y y : 1 2 Klasfkačí úloha: hledáme zalost (reprezetovaé rozhodovací fukcí f), které by umožňovaly k hodotám vstupích atrbutů ějakého objektu přřadt vhodou hodotu atrbutu cílového f: y. P. Berka, 2011 7/18

V průběhu klasfkace se tedy pro hodoty vstupích atrbutů ějakého objektu odvodí hodota cílového atrbutu: ŷ = f (). Odvozeá hodota ŷ se pro objekty z tréovacích dat může lšt od skutečé hodoty y. Můžeme tedy pro každý objekt o D TR vyčíslt chybu klasfkace Q f (o, ŷ ). pro umercký atrbut C apř. Q (, y ) = (y - y ) 2 f o pro kategorálí atrbut C apř. Q (, y ) = f o 1 pro y y 0 pro y = y Pro celou tréovací možu D TR pak můžeme vyčíslt souhrou chybu Err(f,D TR ), apříklad jako středí chybu Err(f,D = 1 TR ) Q f ( o, y ) Cílem učeí je alézt takové zalost f*, které by mmalzovaly tuto chybu =1 Err(f*,D TR ) = m Err(f, D TR ). f. P. Berka, 2011 8/18

1. Učeí jako prohledáváí hledáme strukturu parametry modelu Modely jako popsy shluků: MGM - ejobecější model (jede shluk pro všecho) MSM - ejspecálější model(y) (co příklad to shluk) M1 obecější ež M2, M2 je specálější ež M1 B( ) B( ) 1 1 = B( k), k k B(0) = 1 1 2 3 4 5 10 1 2 5 15 52 115975 Bellova čísla P. Berka, 2011 9/18

Možost prohledáváí: Podle směru shora dolů (od obecějších modelů ke specálějším) zdola ahoru (od specálějších modelů k obecějším) Podle stratege slepé (bereme v úvahu všechy možost specalzace/geeralzace daého modelu) heurstcké (podle ějakého krtéra vybereme je ěkteré možost specalzace/geeralzace daého modelu) áhodé Podle šíře jedoduché (uvažujeme je jedu trasformac modelu) paralelí (uvažujeme více trasformací) P. Berka, 2011 10/18

Příklad: Předpokládejme, že jak vstupí atrbuty tak cílový atrbut jsou kategorálí - hodotě atrbutu budeme říkat kategore: 1. atomcká formule vyjadřující vlastost objektu o : A j (v k )( o ) 1 = 0 pro pro j j = v v 2. moža objektů majících daou vlastost { A (v )} { o : = } j k = j v k k k Spojováím kategorí logckou spojkou budeme vytvářet kombace Comb = [ A (v ), A (v ),..., A (v )] = A (v ) A (v )... A j1 k1 j2 k 2 jl k l j1 k1 j2 k 2 jl k l (v ) 1. o Comb( o 1 pro j = v k = v... = v 1 j2 k 2 jl ) = 0 jak l : 1 k 2. { Comb } = { o : = v k j = v k... j = }. j v 1 1 2 2 l k l Platí-l Comb(o ) = 1, říkáme, že kombace Comb pokrývá objekt o Přdáváím kategorí ke kombac vzkají její adkombace, odebráím kategorí z kombace vzkají její podkombace. P. Berka, 2011 11/18

Částečé uspořádáí mez kombacem: Je-l kombace Comb 1 podkombací kombace Comb 2, potom říkáme, že kombace Comb 1 je obecější ež kombace Comb 2 a že kombace Comb 2 je specálější ež kombace Comb 1. Je-l kombace Comb 1 obecější ež kombace Comb 2, potom Comb 1 pokrývá alespoň všechy ty objekty, které pokrývá Comb 2. Hledaé zalost budou reprezetováy kombacem, které budou popsovat (pokrývat) pouze příklady daé třídy. Kombace Comb je kozstetí, právě když pokrývá pouze příklady jedé třídy: C(v ) o D : Comb( o ) = 1 y = v Příklad: t TR příjem koto pohlaví ezaměstaý auto bydleí úvěr vysoký vysoké žea e ao vlastí Ao vysoký vysoké muž e ao vlastí Ao zký ízké muž e ao ájemí Ne vysoký vysoké muž e e ájemí Ao V kombac Comb (hypotéze popsující kocept úvěr ) se pro každý atrbut může objevt: t? jakožto dkace toho, že a hodotě atrbutu ezáleží, hodota atrbutu, jakožto dkace toho, že žádá hodota atrbutu evyhovuje. P. Berka, 2011 12/18

[?,?,?,?,?,?]... [?,?, žea,?,?,?] [vysoký,?,?,?,?,?] [?,vysoké,?,?,?,?] [?,?,?,?,?, vlastí]... [vysoký,?,?, e,?,?] [vysoký,vysoké,?,?,?,?] [?, vysoké,?, e,?,?,?] [vysoký,vysoké,?, e,?,?] [vysoký,vysoké,?, e,ao,?] [vysoký,vysoké,?,e,?,vlastí] [vysoký,vysoké,muž, e,?,?] [vysoký, vysoké,?, e,ao, vlastí] [vysoký, vysoké, muž,e,?,vlastí] [vysoký, vysoké, žea,e,?,vlastí] [vysoký, vysoké, muž,e, ao,?] [vysoký, vysoké, muž,e, e,?] [vysoký,vysoké,žea,e, ao, vlastí] [vysoký,vysoké,muž,e, ao, vlastí] [vysoký,vysoké,muž,e, e, ájemí] [,,,,, ] Prostor hypotéz Prostorem hypotéz se můžeme pohybovat dvěma způsoby: od obecějšího popsu ke specálějšímu (specalzace), od specálějšího popsu k obecějšímu (geeralzace). P. Berka, 2011 13/18

Fd-S algortmus 1. přřaď do h ejspecálější hypotézu v H 2. pro každý poztví příklad 2.1. pro každý atrbut a z hypotézy h f hodota atrbutu a eodpovídá příkladu the ahraď hdotu a ejblžší obecou hodotou která odpovídá 3. vydej h S: [vysoký, vysoké,?,e,?,?] [vysoký,vysoké,?, e,ao,?] [vysoký,vysoké,?,e,?,vlastí] [vysoký,vysoké,muž, e,?,?] [vysoký, vysoké,?, e,ao, vlastí] [vysoký, vysoké, muž,e, e,?] [vysoký,vysoké,žea,e, ao, vlastí] [vysoký,vysoké,muž,e, ao, vlastí] [vysoký,vysoké,muž,e, e, ájemí] P. Berka, 2011 14/18

Caddate-Elmato algortmus 1. přřaď do G možu ejobecějších hypotéz z H 2. přřaď od S možu ejspecálějších hypotéz z H 3. pro každý příklad 3.1. f je poztví příklad the odstraň z G všechy hypotézy kosstetí s příkladem pro každou hypotézu s z S která je kosstetí s příkladem odstraň s z S přdej do S ejmeší geeralzac h hypotézy s takovou, že h je kosstet s příkladem a že v G je hypotéza obecější ež h odstraň z S hypotézy, které jsou obecější ež jé hypotézy v S 3.2. f je egatví příklad the odstraň z S všechy hypotézy kosstetí s příkladem pro každou hypotézu g z G která je kosstetí s příkladem odstraň g z G přdej do G ejmeší specalzac h hypotézy g takovou, že h je kosstetí s příkladem a že v S je hypotéza specálější ež h odstraň z G všechy hypotézy, které jsou specálější ež jé hypotézy v G G: [vysoký,?,?,?,?,?] [?, vysoké,?,?,?,?] [vysoký,?,?, e,?,?] [vysoký,vysoké,?,?,?,?] [?, vysoké,?, e,?,?,?] S: [vysoký, vysoké,?,e,?,?] P. Berka, 2011 15/18

2. Učeí jako apromace hledáme pouze parametry modelu Příklad: a základě hodot fukce v koečém počtu bodů sažíme zrekostruovat její obecou podobu y=f() f() = q 1 + q 0 metoda ejmeších čtverců: Hledáí mma celkové odchylky m (y - f( )) 2 se převádí a řešeí rovce d dq (y - f( )) 2 = 0 P. Berka, 2011 16/18

řešeí: 1) aalytcké (záme typ fukce) řešeí soustavy rovc pro parametry fukce q 0 = ( ky k )( k k 2 ) - ( k k y k )( k k ) ( k k 2 ) - ( k k ) 2 q 1 = ( k k y k ) - ( k k )( k y k ) ( k k 2 )- ( k k ) 2 2) umercké (ezáme typ fukce) gradetí metody Err(q) = Err q 0, Err q 1,..., Err q Q. Modfkace zalostí q = [q 0, q 1,..., q Q ] pak probíhá podle algortmu kde q j q j + q j q j = Err - η q j a η je parametr vyjadřující velkost kroku kterým se přblžujeme k mmu fukce Err. P. Berka, 2011 17/18

Je-l apř. chybová fukce Err(f, D = 1 (y - y 1 TR ) ) = (y - f`( )) 2 2 =1 2 2 a předpokládaá fukce f leárí kombací vstupů f() = q, =1 můžeme odvodt gradet fukce Err jako Err q j = 1 2 2 ( y - y~ ) = 2( y - y~ ) ( y - y~ ) = 1 q j 2 = 1 q j 1 a tedy ( y - y~ ) ( y - q) = ( y - y~ )(- j) = q = 1 j = 1 ( ) j q = η y - y j =1 Obecě problém uvázutí v lokálím mmu P. Berka, 2011 18/18