Marta Vomlelová marta@ktiml.mff.cuni.cz



Podobné dokumenty
Strojové učení Marta Vomlelová

a m1 a m2 a mn zobrazení. Operaci násobení u matic budeme definovat jiným způsobem.

Miroslav Čepek

Strojové učení Marta Vomlelová

Regresní analýza. Statistika II. Jiří Neubauer. Katedra ekonometrie FEM UO Brno kancelář 69a, tel

VYUŽITÍ NEURONOVÝCH SÍTÍ PROSTŘEDÍ MATLAB K PREDIKCI HODNOT NÁKLADŮ PRO ELEKTRICKÉ OBLOUKOVÉ PECE

Neuronová síť. x 2 x 3. σ j. x 4. x 5. Menu: QCExpert Prediktivní metody

3.5.8 Otočení. Předpoklady: 3506

Matematický model kamery v afinním prostoru

Lineární Regrese Hašovací Funkce

2 Trochu teorie. Tab. 1: Tabulka pˇrepravních nákladů

pracovní list studenta

MATEMATIKA I VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA STAVEBNÍ JIŘÍ NOVOTNÝ ZÁKLADY LINEÁRNÍ ALGEBRY

Na následující stránce je poskytnuta informace o tom, komu je tento produkt určen. Pro vyplnění nového hlášení se klikněte na tlačítko Zadat nové

3.1.4 Trojúhelník. Předpoklady: Každé tři různé body neležící v přímce určují trojúhelník. C. Co to je, víme. Jak ho definovat?

Moderní technologie ve studiu aplikované fyziky CZ.1.07/2.2.00/ Reálná čísla

Exponenciála matice a její užití. fundamentálních matic. Užití mocninných řad pro rovnice druhého řádu

( x ) 2 ( ) Další úlohy s kvadratickými funkcemi. Předpoklady: 2501, 2502

Algoritmizace a programování

Návrh induktoru a vysokofrekven ního transformátoru

3. Polynomy Verze 338.

Základy zpracování obrazů

Státnice odborné č. 19

Fyzikální praktikum FJFI ČVUT v Praze

Závěr: Je potřeba vytvořit simulaci a propočítat, zda krácení dle rozpočtu a člověkohodin bude spravedlivé.

V této části manuálu bude popsán postup jak vytvářet a modifikovat stránky v publikačním systému Moris a jak plně využít všech možností systému.

Osvětlovací modely v počítačové grafice

1.7. Mechanické kmitání

GEOMETRICKÁ TĚLESA. Mnohostěny

ROZCVIČKY. (v nižší verzi může být posunuta grafika a špatně funkční některé odkazy).

Strojové uení. typy učení: Metody učení: učení se znalostem (knowledge acquisition) učení se dovednostem (skill refinement).

Pokyny České pošty pro označování Doporučených zásilek čárovými kódy

Základní škola, Staré Město, okr. Uherské Hradiště, příspěvková organizace. Komenské 1720, Staré Město, Metodika

Příklad 1.3: Mocnina matice

5 Výměník tepla. 5.1 Cíle měření

Sada 2 Microsoft Word 2007

Předmět: Ročník: Vytvořil: Datum: ŠČERBOVÁ M. PAVELKA V. VZPĚR VZPĚR

Žáci mají k dispozici pracovní list. Formou kolektivní diskuze a výkladu si osvojí grafickou minimalizaci zápisu logické funkce

VYUŽITÍ M-LEARNINGU PŘI VÝUCE

Matematický KLOKAN kategorie Benjamín

Konzistence databáze v nekonzistentním světě

1 Matematické základy teorie obvodů

Dynamický model predikovaného vývoje krajiny. Vilém Pechanec

6. Matice. Algebraické vlastnosti

SBÍRKA PŘÍKLADŮ PRO OPAKOVÁNÍ NA PŘIJÍMACÍ ZKOUŠKY 2

Možnosti využití archivu historických povodní v operativní hydrologii na p íkladu povodí Otavy

Karel Johanovský Michal Bílek CD, DVD, HD-DVD, BD

NÁVRHOVÝ PROGRAM VÝMĚNÍKŮ TEPLA FIRMY SECESPOL CAIRO PŘÍRUČKA UŽIVATELE

Matematické metody rozhodování

Využití Pythagorovy věty III

c sin Příklad 2 : v trojúhelníku ABC platí : a = 11,6 dm, c = 9 dm, α = Vypočtěte stranu b a zbývající úhly.

Střední průmyslová škola strojnická Olomouc, tř. 17. listopadu 49. Výukový materiál zpracovaný v rámci projektu Výuka moderně

Analýza variance (ANOVA) - jednocestná; faktor s pevným efektem; mnohonásobná srovnání

řádově různě rostoucí rostou řádově stejně rychle dvě funkce faktor izomorfismus neorientovaných grafů souvislý graf souvislost komponenta

METODIKA PRO NÁVRH TEPELNÉHO ČERPADLA SYSTÉMU VZDUCH-VODA

Modul Řízení objednávek.

Zadání. Založení projektu

4 DVOJMATICOVÉ HRY. Strategie Stiskni páku Sed u koryta. Stiskni páku (8, 2) (5, 3) Sed u koryta (10, 2) (0, 0)

Skupina Testování obsahuje následující moduly: Síla a rozsah výběru, Testy a Kontingenční tabulka.

STŘEDOŠKOLSKÁ ODBORNÁ ČINNOST. Chemické výpočty. Aleš Kajzar Martin Honka

Při výpočtech vycházíme ze standardu 30E/360 (evropský standard) kdy používáme měsíce s 30dny a u jednoho roku uvažujeme 360 dní.

Operace nad celými tabulkami

Daniel Velek Optimalizace 2003/2004 IS1 KI/0033 LS PRAKTICKÝ PŘÍKLAD NA MINIMALIZACI NÁKLADŮ PŘI VÝROBĚ

4 Část II Základy práce v systému. 6 Část III Úvodní obrazovka. 8 Část IV Práce s přehledy. 13 Část V Kontakty. 19 Část VI Operativa

Aplikované úlohy Solid Edge. SPŠSE a VOŠ Liberec. Radek Havlík [ÚLOHA 05 VYŘÍZNUTÍ MATERIÁLU LINEÁRNÍ A ROTACÍ]

GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY CVIČENÍ 8

Data v počítači EIS MIS TPS. Informační systémy 2. Spojení: jan.skrbek@tul.cz tel.: Konzultace: úterý

Obsah. Úvodem 9 Komu je kniha určena 9 Forma výkladu 9 Konkrétní postup výuky 10 Příklady ke knize 11

Z OBRAZOVÉHO ZÁZNAMU. Jan HAVLÍK. Katedra teorie obvodů, Fakulta elektrotechnická

1 METODICKÉ POKYNY AD HOC MODUL 2007: Pracovní úrazy a zdravotní problémy související se zaměstnáním

Katedra obecné elektrotechniky Fakulta elektrotechniky a informatiky, VŠB - TU Ostrava 16. ZÁKLADY LOGICKÉHO ŘÍZENÍ

9. února algoritmech k otáčení nedochází). Výsledek potom vstupuje do druhé fáze, ve které se určuje, jestli se

Jazyk S Q L základy, příkazy pro práci s daty

Oborové číslo Hodnocení - část A Hodnocení - část B Hodnocení - část A+B

Metoda Lokální multiplikátor LM3. Lokální multiplikátor obecně. Ing. Stanislav Kutáček. červen 2010

Výuka algoritmizace patří především do informatiky

Digitální tlakoměr PM 111

Názory obyvatel na přijatelnost půjček leden 2016

Řešení: Dejme tomu, že pan Alois to vezme popořadě od jara do zimy. Pro výběr fotky z jara má Alois dvanáct možností. Tady není co počítat.

Databázové a informační systémy

M - Příprava na čtvrtletní písemnou práci

Staroegyptská matematika. Hieratické matematické texty

Jednoduchý fuzzy regresní model. A simplefuzzyregressionmodel

Moderní technologie ve studiu aplikované fyziky CZ.1.07/2.2.00/ Komplexní čísla

Obr. 1 Jednokvadrantový proudový regulátor otáček (dioda plní funkci ochrany tranzistoru proti zápornému napětí generovaného vinutím motoru)

DOPRAVNÍ ZNAČENÍ do 30/2001: změna / doplnění nový název

FYZIKÁLNÍ PRAKTIKUM FJFI ČVUT V PRAZE. Mikrovlny

Informační a komunikační technologie. 1.4 Data, informace, komprimace

NEJČASTĚJŠÍ POCHYBENÍ PŘI PODÁNÍ ŽÁDOSTI O PODPORU V RÁMCI INTEGROVANÉHO REGIONÁLNÍHO OPERAČNÍHO PROGRAMU, SC 2.5, VÝZVA Č

Ohmův zákon pro uzavřený obvod

Investice a akvizice

Nabídka programů pro podniky

PŘEHLED VYBRANÝCH ZJIŠTĚNÍ DOTAZNÍK PRO ABSOLVENTY POBYTŮ ERASMUS

Teleskopie díl pátý (Triedr v astronomii)

Příloha Průběžné zprávy. Shrnutí návrhu algoritmu

Metody hodnocení rizik

INTERNETOVÝ TRH S POHLEDÁVKAMI. Uživatelská příručka

Abstrakt. Klíčová slova. Statistika v Excelu, analýza dat, soubor, Excel. Abstract

Příloha č. 54. Specifikace hromadné aktualizace SMS-KLAS

4 Vyhodnocení naměřených funkčních závislostí

Transkript:

Strojové učení Úvod, lineární regrese Marta Vomlelová marta@ktiml.mff.cuni.cz

References [1] P. Berka. Dobývání znalostí z databází. Academia, 2003. [2] T. Hastie, R. Tishirani, and J. Friedman. The Elements of Statistical Learning, Data Mining, Inference and Prediction. Springer Series in Statistics. Springer, 2003. [3] T. Mitchell. Machine Learning. McGraw Hill, New York, 1997. [4] S. Russel and P. Norwig. Artificial Intelligence: A Modern Approach. Prentice Hall, 2003. [5] I.H. Witten and E.Frank. Data Mining - Practical machine learning tools and techniques with Java implementation. Accademic Press Pub., USA, 1999.

Strojové učení Program se učí ze zkušenosti data vzhledem k nějaké třídě úkolů T a míře úspěšnosti (chyby) U (resp. Err), pokud se jeho výkon na úkolech třídy T zlepšuje s přibývající zkušeností data.

Užití strojového učení příklady Predikce, zda pacient hospitalizovaný s infarktem bude mít druhý infarkt. Predikci můžeme založit na demografických datech, stravě a zdravotím stavu (výsledcích vyšetření) pacienta. Predikce ceny akcií za 6 měsíců, na základě informací o společnosti a celkovém stavu ekonomiky. Rozpoznat ručně psané PSČ z digitalizovaného obrazu. Odhadnout množsví glukózy v krvi diabetického pacienta z infračerveného spektra krve pacienta. Identifikovat rizikové faktory rakoviny, dle klinických a demografických dat.

Dva přístupy tvorby modelu Expertní expert vytvoří model ukázalo se jako těžko schůdné najít a zaplatit experta ochotného a schopného vytvořit model. Sehnat data a naučit model z dat daleko schůdnější cesta, otázka je, nakolik je model použitelný v praxi. Spolupráce experta a strojového učení (podle mě) ideální varianta, expert snáze kritizuje (opravuje) model vytvořený z dat než aby tvořil model celý sám.

Základní pojmy data A 1 A j A n Cílový atribut X = vektor X 1 X j X n Y nebo G x 1 x i = vektor x 1 x j x n y nebo g x N kvantitativní proměnné kvalitativní proměnné různé třídy (kategorie, diskrétní veličiny, faktory), dvě či více, uspořádané či neuspořádané

vstupní proměnné Vstupní (nezávislé) proměnné značíme symbolem X, j tou proměnnou odkazujeme X j (alternativně A j resp. velká písmena A, B,...). Pozorovanou hodnotu značíme malým písmenem x i i v případě, že jde o vektor. Index i znamená, že jde o i té pozorování, i = 1,..., N. Je li X vektor, všechna pozorování dohromady tvoří matici X rozměrů N n. Tučně značíme pouze vektory přes všechny příklady (tj. rozměru N), jinak vektory zůstávají normálním písmem, tj. x i je vektor i tého příkladu, x j je vektor pozorování j té proměnné přes všechny příklady. Cílová proměnná Proměnná, kterou známe u trénovacích dat, ale ve výsledku chceme na nových datech tuto proměnnou predikovat na základě ostatních (vstupních) veličin. Kvantitativní cílovou proměnnou značíme Y, kvalitativní značíme G (group, skupina).

Úloha strojového učení Cílem učení je vytvořit model (funkci), která pro každou hodnotu vstupních proměnných X vydá dobrou predikci Ŷ výstupu Y, resp. Ĝ kategorie G pro diskrétní případ. regrese Predikujeme li numerický atribut. klasifikace Predikujeme li diskrétní atribut.

Příklady modelů uložená data lineární funkce nelineární funkce (např. báze funkcí a koeficienty jejich lineární kombinace, logistická regrese, SVM) rozhodovací strom (rozhodovací známka a jejich kombinace) množina pravidel (jen konstanty nebo i proměnné ILP) bayesovská síť neuronová síť funkce skrytá v algoritmu vytvoření predikce...

Co vše je třeba připravit data my trochu, jinak data mining naučit model který typ modelu (záleží na problému) který model daného typu (funkce odhadující chybu modelu) otestovat model nejlépe na nových datech.

Software Weka http://www.cs.waikato.ac.nz/ ml/weka/ GNU program v Java mnoho jiných

Navrhněte model (1) DenVTýdnu VýrobceMěřáku MnožstvíSrážek po rr 2.0 po zz 0 út zz 1.1 st zz 1.9 st rr 0.0

Navrhněte model (2) BarvaTrička červená modrá zelená bílá bílá Snídal? ano ne ano ano ne

Navrhněte model (3) Pohlaví Výška muž 183 muž 179 žena 168 žena 182 muž 165

Navrhněte model (4) Výška Pohlaví 183 muž 179 muž 168 žena 182 žena 165 muž

Navrhněte model (5) Výška Váha

Navrhněte model (6) IDKlienta ZůstatekNaÚčtu

Lineární modely

Lineární modely n N β ŷ i j počet atributů, tj. dimenze x počet příkladů v datech n, resp. n + 1 rozměrný vektor parametrů modelu odpověďní veličina, tj. naše predikce cílové funkce f (x) index procházející jednotlivé příklady index procházející jednotlivé dimenze

Lineární regrese Cíl: aproximovat funkci f (x), kde x je n rozměrný vektor, pomocí lineární funkce ŷ = ˆ β 0 + n x j ˆβ j j=1 Pokud do x přidáme 1, tj. vytvoříme vektor 1, x, ˆβ 0 schováme do ˆβ a píšeme: n ŷ = x j ˆβ j = x T β j=0 Sumu n j=0 x j ˆβ j můžeme zapsat vektorově jakožto skalární součin x T β.

Lineární regrese Pokud navíc necháme index i procházet jednotlivé trénovací příklady, můžeme y chápat jako vektor odpovědí na jednotlivé příklady, X jako matici N n jednotlivých příkladů a psát: ŷ = Xβ Hledáme takové hodnoty parametrů ˆβ, aby chyba aproximace byla co nejmenší. Za míru chyby se téměř vždy bere součet čtverců reziduí (RSS residual sum squares), tj. RSS(β) = N i=1 (y i x T i β) 2 = (y Xβ) T (y Xβ)

Lineární regrese Derivací podle β dostaneme normální rovnici X T (y Xβ) = 0 Není li X T X singulární, dostaneme jednoznačné řešení ˆβ = (X T X) 1 X T y a odhad ŷ pro dané x i je ŷ(x i ) = x T i ˆβ Není li X T X invertibilní, uvereme závislé sloupce (tj. atributy) nebo se pokusíme překódovat či filtrovat data tak, aby matice invertibilní byla.

Lineární regrese pro klasifikaci Dvě třídy jednu třídu kódujeme 0, druhou 1, najdeme lineární model této kódované funkce. Pokud model predikuje y 0, 5, predikujeme první třídu, jinak predikujeme druhou třídu. Hranice {x : x T β = 0, 5} se nazývá rozhodovací hranice (decision boundary).

Lineární regrese pro klasifikaci K tříd Každý příklad v datech patří do (právě jedné) z k tříd G 1,..., G K. Pak zavedeme indikátory, tj. proměnné y k nabývající 1 právě když příklad patří do třídy G k, jinak y k = 0. Spočteme naráz modely pro všechny indikátory, tj. Y bude matice K N a ˆB = (X T X) 1 X T Y Pro klasifikaci nového příkladu x pak nejdříve spočteme vektor predikcí indikátorů ˆf (x) = [ x, 1 ˆB] T a pak najdeme takovou třídu, jejíž indikátor nabývá největší

hodnoty, tj. Ĝ(x) = argmax k=1,...,k ˆfk (x) Při použití lineární regrese pro klasifikaci může dojít k maskování tříd, např. pro tři třídy v přímce klasifikuji vždy do jedné z krajních, střední třída nikdy nenabyde maximální hodnoty indikátoru.