O kurzu MSTU Témata probíraná v MSTU

Podobné dokumenty
ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Pokročilé neparametrické metody. Klára Kubošová

Obsah přednášky Jaká asi bude chyba modelu na nových datech?

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Projekční algoritmus. Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění. Jan Klíma

Moderní systémy pro získávání znalostí z informací a dat

Statistická analýza dat

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Miroslav Čepek. Fakulta Elektrotechnická, ČVUT. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Vytěžování znalostí z dat

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Strojové učení Marta Vomlelová

Obsah přednášky. 1. Principy Meta-learningu 2. Bumping 3. Bagging 4. Stacking 5. Boosting 6. Shrnutí

UČENÍ BEZ UČITELE. Václav Hlaváč

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence

1. Data mining. Strojové učení. Základní úlohy.

přetrénování = ztráta schopnosti generalizovat vlivem přílišného zaměření klasifikátorů na rozeznávání pouze konkrétních trénovacích dat

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvod do optimalizace, metody hladké optimalizace

Přednáška 13 Redukce dimenzionality

Získávání dat z databází 1 DMINA 2010

Pravděpodobně skoro správné. PAC učení 1

Inovace tohoto kurzu byla spolufinancována z Evropského sociálního fondu a státního rozpočtu České republiky.

Kybernetika a umělá inteligence, cvičení 10/11

Otázky ke státní závěrečné zkoušce

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Úloha - rozpoznávání číslic

Strukturální regresní modely. určitý nadhled nad rozličnými typy modelů

Klasifikace a rozpoznávání. Lineární klasifikátory

ANALÝZA A KLASIFIKACE DAT

Výpočetní teorie učení. PAC učení. VC dimenze.

1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15

Algoritmy a struktury neuropočítačů ASN P4. Vícevrstvé sítě dopředné a Elmanovy MLNN s učením zpětného šíření chyby

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Analýza dat pomocí systému Weka, Rapid miner a Enterprise miner

PRAVDĚPODOBNOST A STATISTIKA 1

Využití metod strojového učení v bioinformatice David Hoksza

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)

Základy vytěžování dat

Numerické metody optimalizace - úvod

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

Optimální rozdělující nadplocha 4. Support vector machine. Adaboost.

Neuronové časové řady (ANN-TS)

Statistika. Základní pojmy a cíle statistiky. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Ing. Michael Rost, Ph.D.

StatSoft Úvod do neuronových sítí

PRAVDĚPODOBNOST A STATISTIKA

Vytěžování znalostí z dat

vzorek vzorek

Katedra kybernetiky, FEL, ČVUT v Praze.

DATA MINING KLASIFIKACE DMINA LS 2009/2010

Neuronové sítě Ladislav Horký Karel Břinda

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

AVDAT Mnohorozměrné metody, metody klasifikace

ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT. Institut biostatistiky a analýz

Rozdělování dat do trénovacích a testovacích množin

6. Lineární regresní modely

Vytěžování znalostí z dat

Učící se klasifikátory obrazu v průmyslu

Získávání znalostí z dat

Předzpracování dat. Lenka Vysloužilová

Cvičení ze statistiky - 3. Filip Děchtěrenko

Datová věda (Data Science) akademický navazující magisterský program

Testování modelů a jejich výsledků. Jak moc můžeme věřit tomu, co jsme se naučili?

Zpětnovazební učení Michaela Walterová Jednoocí slepým,

Trénování sítě pomocí učení s učitelem

Analytické procedury v systému LISp-Miner

Metodologie pedagogického výzkumu II

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.

6. Lineární regresní modely

Korelační a regresní analýza

Automatické vyhledávání informace a znalosti v elektronických textových datech

Vytěžování znalostí z dat

Tomáš Karel LS 2012/2013

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od podzimu 2014

Testování modelů a jejich výsledků. tomu, co jsme se naučili?

Asociační i jiná. Pravidla. (Ch )

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

PROHLOUBENÍ NABÍDKY DALŠÍHO VZDĚLÁVÁNÍ NA VŠPJ A SVOŠS V JIHLAVĚ

5EN306 Aplikované kvantitativní metody I

Úvod do zpracování signálů

Dolování asociačních pravidel

Základní pojmy; algoritmizace úlohy Osnova kurzu

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy

REGRESNÍ ANALÝZA V PROSTŘEDÍ MATLAB

Vybrané partie z obrácených úloh. obrácených úloh (MG452P73)

Teorie systémů TES 1. Úvod

2019/03/31 17:38 1/2 Klasifikační a regresní stromy

Statistická teorie učení

Instance based learning

Pokročilé neparametrické metody. Klára Kubošová

OSA. maximalizace minimalizace 1/22

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Klasifikace a rozpoznávání. Bayesovská rozhodovací teorie

Speciální numerické metody 4. ročník bakalářského studia. Cvičení: Ing. Petr Lehner Přednášky: doc. Ing. Martin Krejsa, Ph.D.

6. Lineární regresní modely

STATISTICKÉ METODY; ZÍSKÁVÁNÍ INFORMACÍ Z DRUHOVÝCH A ENVIRONMENTÁLNÍCH DAT

Transkript:

O kurzu MSTU Témata probíraná v MSTU 1.: Úvod do STU. Základní dělení, paradigmata. 2.: Základy statistiky. Charakteristiky, rozložení, testy. 3.: Modely: rozhodovací stromy. 4.: Modely: učení založené na instancích. 5.: Odhad přesnosti modelu: Křížová validace, bootstrap. 6.: Chybové funkce. 7.: Předzpracování dat. 8.: Modely: bayesovské klasifikátory. 9.: Modely: diskriminační analýza, lineární modely, SVM 10.: Optimalizace: GA, DE, AC 11.: Meta algoritmy: bagging, boosting, stacking. 12.: Učení bez učitele. Shluková analýza. 13.: Dolování dat, dobývání znalostí z databází 2

Obsah přednášky jak zdárně absolvovat kurz MSTU motivační příklad definice SU, učení s učitelem a bez učitele rozdíl mezi SU (strojové učení) a UI (umělá inteligence), DM (dolování dat) a KDD (dobývání znalostí z databází) komponenty procesu učení s učitelem data podle typu vybraná terminologie teorémy SU (occamovo ostří, přeučení modelu) indukce vs. dedukce chyba bias vs. variance předpojatost modelu a schopnost generalizace 3

kurz MSTU 1/3 Jak úspěšně absolvovat MSTU studijní materiály (informační systém), materiály v pdf + slidy (?, VIS)! cvičení nahrazují konzultace! konzultace domluvám předem emailem s konkrétním dotazem, přicházím nasáklý znalostmi projekt za max 20 bodů datum zadání: do 3.11.2014 datum odevzdání: 8.12.2014 zápočet = za odevzdání projektu v termínu písemná zkouška 80 bodů (cca 40 bodů teorie, cca 40 bodů příklady) 4

kurz MSTU 2/3 Projekt do MSTU zadání: přidělené nebo vlastní zadání (pak musí být schváleno), možnost propojení s diplomovou prací komunikace: hlavička emailu začíná MSTU do pondělí 3.11.2014 potvrzení zadání (zažádat emailem, potvrdím emailem až poté je zadání oficiální) do pondělí 8.12.2014 odevzdání projektu (osobně předat tištěnou dokumentaci, emailem pdf a případné přílohy) práce v týmech: možnost pracovat až ve třech projekt (20b) = dokumentace a program nebo schéma v RapidMineru (rapid-i.com) zápočet se uděluje za v termínu odevzdaný projekt, bez zápočtu není možná účast na zkoušce zápočet není podmíněn minimálním počtem bodů za projekt 5

kurz MSTU 3/3 Program RapidMiner K řešení projektu doporučuji použít program RapidMiner (rapidminer.com) Do verze 5.x community edition bez problémů Od verze 6.0 (2014) omezení u free verze ve velikosti RAM (1 GB) což bylo i dříve, navíc ale podpora jen některých datových formátů (CSV a XLS) a zablokování přístupu k databázím (jen pro komerční verze) K řešení projektu doporučuji použít verzi RapidMiner 5.3 (pokud nepoužijete Matlab nebo vlastní kód a knihovny jako OpenCV, AForge.NET nebo další ) 6

Obsah přednášky jak zdárně absolvovat kurz MSTU motivační příklad definice SU, učení s učitelem a bez učitele rozdíl mezi SU (strojové učení) a UI (umělá inteligence), DM (dolování dat) a KDD (dobývání znalostí z databází) komponenty procesu učení s učitelem data podle typu vybraná terminologie teorémy SU (occamovo ostří, přeučení modelu) indukce vs. dedukce chyba bias vs. variance předpojatost modelu a schopnost generalizace 7

Motivační příklad 1/3 Příklad: KVALITA VÍNA Vyrábíte vlastní víno a rádi byste věděli, jak by si stálo při degustaci. Jak na to? (ideový příklad) VZORKY PŘÍZNAKOVÝ VEKTOR VÝSTUPNÍ VELIČINA DEGUSTACE 8

Motivační příklad 2/3 O čem je tedy strojové učení? Nejtypičtější úlohy jsou z oblasti učení s učitelem (supervised learning). Jsou dány: vstupní veličiny (příznaky) X výstupní veličina y (nebo g). Cílem je vytvořit model M, který co nejlépe postihne závislost výstupní veličiny y (g) na vstupech (příznacích) X, tedy y=m(x) y (g) značí výstup modelu Snahou je model M nastavit tak, aby pro nová data ideálně y=y (g=g) 9

Motivační příklad 3/3 Takže cílem SU je vytvořit model? Velmi často. Celé je to poněkud složitější, ale u většiny úloh s učitelem je výsledkem model a odhad jeho přesnosti. A na co je to dobré u vína? Pokud model máte, můžete odhadnout, jak je vaše víno kvalitní, nasadit tu správnou cenu na trhu, zamyslet se nad úpravou procesu výroby nebo zcela v rozporu se zákonem nad úpravou vína již hotového A to vše lze automatizovat (nakonec jsme ústav automatizace ). 10

Definice SU 1/2 Definice (strojového) učení učení je schopnost zlepšování výkonnosti (=přesnost modelu) tím, jak vzrůstá znalost (=nastavení parametrů modelu) na základě zkušenosti (=data) strojové učení je nauka o nástrojích (algoritmech, programech), které umožňují učení umělých objektů (artefaktů) program se učí pomocí zkušenosti E vzhledem k nějaké třídě úloh T a míře výkonnosti P, pokud se jeho výkonnost pro dané úlohy v T měřená pomocí P zlepšuje použitím E memorování není učení nezahrnuje proces indukce.? definujte pojem učení 11

Dělení SU 2/2 Dva základní typy problémů učení s učitelem je známa výstupní veličina y (g) predikce (regrese, klasifikace) učení bez učitele není známa výstupní veličina, pouze vstupní X hledání shluků (hypotetických tříd) či souvislostí v datech 12

SU vs. UI 1/2 Rozdíl mezi umělou inteligencí a strojovým učením Strojové učení nabízí matematický aparát a algoritmy, které jsou používané na řešení v úloh umělé inteligence. SU 13

SU vs. UI 2/2 Strojové učení vs. Umělá inteligence 14

KDD vs DM 2/2 Dolování dat a dobývání znalostí z databází Strojové učení je jako matematika nabízí efektivní aparát na řešení různých problémů, žádným konkrétním se však nezabývá. KDD (dobývání znalostí z databází) i DM (dolování dat) jsou procesy, jejichž cílem je získání nové znalosti či informace z rozsáhlé databáze (v literatuře uváděné definice jsou takřka identické, více v samostatné přednášce věnované této problematice). KDD provozuje ten, kdo vlastní data a problém a bude profitovat z řešení, tedy z nalezené znalosti (v obchodu, provozu, ). DM provozuje ten, kdo má know-how ve strojovém učení; dostane vybraná historická data a úloha pro něj končí předáním nové znalosti. Někdy KDD a DM dělá ta samá osoba/tým/pracoviště, potom rozdíly mezi oběma termíny mohou splývat v jedno a to samé. 15

Komponenty SU 1/2 Proces modelování s učitelem X M(b) Ŷ Err UA b Y Ŷ Err LF UA Err b Ŷ LF M(b) Y X Předzpracování dat Data z procesu, měření, VIS:? nakreslete schéma procesu modelování s učitelem 16

Komponenty SU 2/2 Komponenty procesu modelování 1) data X,Y,Ŷ (kvantitativní, kvalitativní) 2) předzpracování (ouliers, chybějící data, relevantní atributy, rozšíření příznakového prostoru) 3) model M (NS, rozhod. stromy, regresní modely) mající parametry b 4) chybové funkce LF (MNČ, ML, entropie) vracející chybu predikce Err 5) učicí algoritmy UA (optimalizační algoritmy; (ne)lineární prog., kvadratické, parametrické,..) 6) testy (cross-validation, bootstrap) 7) meta algoritmy (boosting, bagging, stacking) VIS:? vyjmenujte komponenty používané v procesu modelování 17

Data 1/4 DATA základní dělení, značení kvantitativní spojitá diskrétní kvalitativní nominální ordinální KVALITATIVNÍ DATA KVANTITATIVNÍ NOMINÁLNÍ ORDINÁLNÍ DISKRÉTNÍ SPOJITÁ X vstupní proměnná, nezávislá veličina, prediktor, vysvětlující proměnná y kvantitativní výstupní veličina, závislá veličina, cílový atribut, vysvětlovaná proměnná G kvalitativní výstupní veličina Ŷ predikovaná kvantitativní veličina Ĝ predikovaná kvalitativní veličina VIS? uveďte dělení a vysvětlete rozdíl mezi daty kvantitativními a kvalitativními 18

Data 2/4 DATA další dělení specifické typy text, datum, dichotomická/binární, data: čistá / zašuměná data: konzistentní / nekonzistentní doména (atributy): otevřená / uzavřená vzory: pozitivní / pozitivní i negativní? co je to otevřená/uzavřená doména 19

Data 3/4 Data, Informace, Znalost, Moudrost Data diskrétní prvky jednoduchá neorganizovaná fakta, obrázky, Informace vzájemně propojená data strukturovaná data s přidáním kontextu významnosti data a pravidla na ně aplikovaná data s významem popis CO Znalost organizovaná informace schopnost použít informace k dosažení cíle smysluplně využitá informace popis JAK Moudrost aplikovaná znalost schopnost výběru smysluplných cílů zdůvodnění PROČ Data cokoliv co ukládáte čísla, obrázky, dokumenty, videa svá data umíte interpretovat (víte, co znamenají) statistické údaje o libovolné veličině libovolný vzor (pattern) v datech Informace relevantní data informace jsou data, která jsou užitečná v kontextu řešeného problému přínosný (relevantní) vzor, statistický údaj Znalost funkce má vstupy (informace) a na jejich základě vrací smysluplný výstup (taky informace) znalost tvoří struktura + parametry vztahů mezi veličinami vstupními a výstupními (informacemi) Moudrost to je zpravidla lepší nechat na zákazníka

Data 4/4 DATA v SU od dat k metaznalosti data (soubor údajů + jejich popis) informace (vybrané relevantní údaje) znalost (model = hypotéza = funkce) metaznalost (model mající na vstupu výstupy jiných modelů)? vypište a vysvětlete význam úrovní od šumu po metaznalosti 21

Vybraná terminologie 1/5 MODEL model (též znalost, funkce, hypotéza) je z pohledu SU matematicko-logická reprezentace zařízení nebo procesů, do jejíž struktury a parametrů jsou uloženy znalosti získané z analyzovaných dat regresní modely (výstup kvantitativní data) klasifikátory (výstup kvalitativní data) regresní klasifikátory? vysvětlete rozdíl mezi regresním modelem a klasifikátorem 22

Vybraná terminologie 2/5 CHYBOVÁ FUNKCE smyslem chybové funkce je kvantifikovat míru odchylky výstupu modelu (Ŷ nebo Ĝ) oproti požadované hodnotě (Y nebo G) metoda nejmenších čtverců (MNČ) maximální věrohodnost (ML) nákladová matice (cost matrix) regularizace penalizace za složitost modelu, zabraňuje přeučení? co je smyslem chybové funkce 23

Vybraná terminologie 3/5 UČICÍ (OPTIMALIZAČNÍ) ALGORITMY smyslem učicích algoritmů je měnit parametry modelu tak, aby minimalizovaly hodnotu chybové funkce prakticky se jedná o prohledávání prostoru možných řešení některé metody: analytická/heuristická řešení gradientní metody simplexová metoda genetické algoritmy mravenčí kolonie, žíhání, 24

Vybraná terminologie 4/5 Přesnost modelu přesnost modelu lze pouze odhadnout rozdělení dat trénovací (verifikační) testovací metody odhadu chyby cross validation bootstrap 25

Vybraná terminologie 5/5 Meta algoritmy též meta-learning nebo ensemble methods meta-learning tvoří algoritmy, které umožňují predikovat na základě rozhodnutí více modelů vstupem do meta-modelu je Y, nikoliv X metody bagging boosting stacking 26

occam, přeučení 1/1 Teorémy SU occamovo ostří: nejjednodušší z více stejně přesných řešení je správné. Analýza oprávněnosti generalizace přesahující naměřená data. přeučení modelu: přesné naučení modelu na trénovací data vedoucí k naučení šumu nebo neexistujících souvislostí; 45 40 Trénovací data projeví se velkou chybou 35 Testovací data 30 25 na testovacích datech 20 15 kapacita funkce: 10 5 0 (Vapnik-Chervonenkis) VIS: Vysvětli pojmy: occamovo ostří, přeučení modelu Chyba [%] 0 20 40 60 80 100 Počet uzlů [-] 27

indukce, dedukce 1/1 Některé další pojmy indukce přechod od konkrétního k obecnému (od dat ke znalostem); algoritmy SU jsou induktivního charakteru, platné vždy jen s určitou pravděpodobností; (důsledek důvod) dedukce přechod od obecného ke konkrétnímu (od znalostí k datům, novým řešením), platné s jistotou (pokud jsou předpoklady pravdivé); (důvod - důsledek) Základní ideu učení s učitelem lze nalézt např. v tomto úryvku (Sir Arthur Conan Doyle: Poslední poklona Sherlocka Holmese, povídka Vila Vistárie): "Domníváte se, milý Watsone, že lidský důmysl dokáže najít VYSVĚTLENÍ, které by zahrnovalo OBĚ tyto SKUTEČNOSTI? Jestliže by pak takové vysvětlení nevylučovalo ani onen TAJUPLNÝ LÍSTEK, tak prazvláštně stylizovaný, stálo by za to, přijmout jej jako DOČASNOU HYPOTÉZU. Kdyby se VŠECHNY NOVÉ SKUTEČNOSTI, jež se dozvíme, HODILY DO JEJÍHO SCHÉMATU, možná že by se postupně ta hypotéza změnila v ODHALENOU PRAVDU." heuristika iterační stochastický postup, nová iterace ovlivněna zkušeností z předešlých iterací. VIS: Vysvětli pojmy: indukce, dedukce 28

bias, variance 1/1 Bias a Variance bias (předpojatost) odchylka konceptu modelu od skutečných vazeb (závislostí) v datech systematická chyba jak přesně odpovídá model skutečnosti existuje i při nekonečném množství dat variance chyba naučení dílčího modelu z konečné množiny dat odchylka od bias způsobená nedostatkem dat, nebo nevhodným výběrem z dat (není ideální ) chyba modelu = bias+variance (rozbor označován ang. termínem bias-variance decompostition) VIS: vysvětli rozdíl mezi chybou bias a variance 29

generalizace, specializace, předpojatost 1/6 Generalizace jedním ze základních požadavků na model je jeho generalizace = zobecnění, obecně platný popis vazeb mezi vstupy a výstupy získaný z dat rozlišujeme tři typy generalizace hypotéz (modelů) jiná sudá čísla než 2 nejsou prvočísla správná generalizace přirozená čísla končící na 1 jsou prvočísla neoprávněná generalizace žádné prvočíslo není větší než 100 podceněná generalizace 30

generalizace, specializace, předpojatost 2/6 Metoda prostoru hypotéz (verzí) metoda pracuje průběžně se dvěma hypotézami (modely) pomocí specializace a generalizace oba modely popisují všechny pozitivní prvky a vylučují všechny negativní prvky první model co nejspecifičtější s přibývajícími pozitivními prvky dochází k jeho generalizaci druhý model co nejobecnější s přibývajícími negativními dochází k jeho specializaci 31

generalizace, specializace, předpojatost 3/6 Metoda prostoru verzí tvorba hypotézy na počátku 2 modely, zcela speciální a obecný každý nový model je specializací (generalizací) modelu obecného (speciálního) úprava vždy minimální možnou změnou žádný nový speciální (obecný) model není generalizací (specializací) jiného specifického (obecného) modelu záporný příklad úprava specializací (obecného) kladný příklad generalizace (speciálního) vyškrtni nevyhovující specifické modely 32

generalizace, specializace, předpojatost 4/6 Příklad 1 princip induktivního učení pozitivní případ minimálně generalizuj negativní případ minimálně specializuj o o o + + + o o o + + + o o o + + + o o o + + + 33

generalizace, specializace, předpojatost 5/6 Příklad 2 induktivní učení Lékař léčí pacienta, který občas trpí diarrheou. Intuitivně předpokládá, že tyto souvisejí s místem stravování pacienta. Následující tabulka zahrnuje informace, které byly získány od pacienta. Restaurace Jídlo Den Cena Diarrhea U Pepy snídaně pátek levné ano Padovec oběd pátek drahé ne U Pepy oběd sobota levné ano Nádražní snídaně neděle levné ne U Pepy snídaně neděle drahé ne 34

generalizace, specializace, předpojatost 6/6 Příklad 2 význam předpojatosti označme X množinu všech úplných instancí (hodnoty všech atributů jsou definovány). Pak mohutnost X = X = 3 2 3 2 = 36 konceptem je v binární klasifikaci rozuměna hypotéza (soubor hypotéz) určující prvky jedné třídy (všechna x X jedné třídy) počet všech možných konceptů = počet podmnožin X = mohutnost potenční množiny P(X)= 2 X =2 36 10 10 při použití uvedené metody lze zapsat jen 4 3 4 3=144 konceptů; metoda je předpojatá, má schopnost generalizace u metody umožňující popis každého konceptu hrozí riziko přeučení (tzv. unbiased learner, např. rozhodovací strom bez prořezávání) bez předpojatosti by nedošlo k žádné generalizaci, byla by uložena pouze trénovací data 35