Vědecký tutoriál, část I. A Tutorial. Vilém Vychodil (Univerzita Palackého v Olomouci)

Podobné dokumenty
RELATIONAL DATA ANALYSIS

George J. Klir. State University of New York (SUNY) Binghamton, New York 13902, USA

Studijní program je těsně vázán na vědeckou činnost Katedry experimentální fyziky PřF UP či praxí Forma studia

Masterský studijní obor datové & webové inženýrství

Informatika na Univerzitě Palackého

George J. Klir Vilem Vychodil (Palacky University, Olomouc) State University of New York (SUNY) Binghamton, New York 13902, USA

Společnost vědeckotechnických parků ČR

Č. j.: TF/5/14 V Praze dne

Problematika transferu technologií ve výuce a praxi Zajištění vzdělávání v oblasti transferu technologií v rámci výuky na LF v Plzni

Formální konceptuální analýza

Informace pro studenty doktorského studijního programu obecná jazykověda a teorie komunikace (OJTK)

Studijní program Elektrotechnika a komunikační technologie. prof. Ing. Aleš Prokeš, Ph.D Ústav radioelektroniky FEKT VUT v Brně

Doktorský studijní obor Didaktika literatury. 1 Organizace doktorského studijního oboru Didaktika literatury

Soulad studijního programu. Aplikovaná informatika

Standard studijního programu Didaktika chemie

Geoinformatika. I Geoinformatika a historie GIS

NÁZEV HABILITAČNÍ PRÁCE: Využití diskriminační analýzy pro predikci budoucího vývoje firmy

Vyhodnocení koncepce rozvoje výzkumné činnosti FIS VŠE za rok 2017

Soulad studijního programu. Anorganická chemie / Inorganic Chemistry

Petr Hájek and Fuzzy Logic in this Country

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Vysoká škola ekonomická v Praze Fakulta managementu v Jindřichově Hradci Opatření děkana Fakulty managementu č. 7/2016

Bankovní institut vysoká škola, a.s. Praha Karlovy Vary Písek Teplice Břeclav

Spolupráce vysokých škol s absolventy. Ing. Roman Kozel, Ph.D. proděkan Ekonomické fakulty VŠB TU Ostrava

Algoritmy ořezávání. Habilitační práce. (Clipping Algorithms) (Habilitation Thesis) Prof.Ing.Václav Skala, CSc.

Distanční forma studia. dle studijního plánu, v rozsahu. dle určení školitele. po dohodě s doktorandem. alespoň jednou za studium

Databázové systémy úvod

DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Logika pro sémantický web

Hodnocení pracovišť a principy tvorby rozpočtů pracovišť

Informace pro uznávání předmětů ze zahraničních studijních pobytů (2016/17) Státnicové předměty navazujících magisterských studijních oborů

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Databázové systémy úvod

Klepnutím lze upravit styl předlohy nadpisů.

NAŘÍZENÍ DĚKANA č. 3/2017

Dolování z textu. Martin Vítek

Doporučení k hodnocení habilitačních řízení a řízení ke jmenování profesorem

KFC/CHL Chemická literatura. Rozvrh, Čt 15:00, LP O čem bude předmět, Informační zdroje Odpadá. Obsah Předmětu 9/22/2016

Umělá inteligence a rozpoznávání

V t í á t V á V s ČVU V T v v P r P a r ze

Sociální síť informatiků v regionech České republiky

Dobývání znalostí z databází (MI-KDD) Přednáška číslo 5 Zajímavé dvojice podmnožin objektů, procedura SD4ft-Miner

XLIII. zasedání Akademického sněmu Akademie věd České republiky. Praha 12. prosince Bod programu: 3

Databázové systémy. Úvod do teorie normalizace. Vilém Vychodil

Obsah. Seznam obrázků. Seznam tabulek. Petr Berka, 2011

Studijní program Elektrotechnika a komunikační technologie. prof. Ing. Aleš Prokeš, Ph.D Ústav radioelektroniky FEKT VUT v Brně

Soulad studijního programu. Obecná fyzika a matematická fyzika

Mgr. Lucie Křeménková, Ph.D.

George J. Klir State University of New York (SUNY) Binghamton, New York 13902, USA

Univerzita Karlova v Praze, Fakulta sociálních věd Institut politologických studií

Václav Matoušek KIV. Umělá inteligence a rozpoznávání. Václav Matoušek / KIV

Dolování asociačních pravidel

Dnešní témata Informační systém, informační služba Podnikový informační systém

P 7310 Filologie SLOVANSKÉ LITERATURY

KATEDRA SPECIÁLNÍ PRODUKCE ROSTLINNÉ

Analýza a modelování dat 3. přednáška. Helena Palovská

Konference projektu ROMODIS Inteligentní dopravní systémy Rozvoj, výzkum, aplikace , Ostrava

Ph.D. studium, aneb bez pomoci to nejde. Martina Kosinová (Brno)

AKTUALIZACE NA ROK 2014

TEORIE ZPRACOVÁNÍ DAT

Katedra aplikované matematiky a informatiky (180)

Zkušenosti s rozvojem talentů holdingu CONTIPRO ZUZANA VONDROVÁ

Znalostní technologie proč a jak?

Uživatelské preference v prostředí webových obchodů. Ladislav Peška, MFF UK

Úvodní slovo studentům informatických oborů

Otevřená věda III popularizace přírodovědných oborů a komunikace výzkumu a vývoje ve společnosti

Organizační řád Ústavu technické a experimentální fyziky Českého vysokého učení technického v Praze

Norské fondy a fondy EHP Spolupráce škol a stipendia (CZ07)

Vzdělávání v Biomedicínské a Zdravotnické Informatice

4IZ440 Propojená data na webu Organizační a kontextový úvod

Soulad studijního programu. Bioanorganická chemie

Fakulta strojní Technické univerzity v Liberci

Využití metod strojového učení v bioinformatice David Hoksza

Potřebujeme specializované knihovny?

UNIVERZITA PARDUBICE

Moderní systémy pro získávání znalostí z informací a dat

PILÍŘE UNIVERZITNÍHO STUDIA

Projekt TECH-NET. Nové materiály a technologie - spojení výzkumu, vývoje a technické praxe

Seminář k problematice spolupráce v OP VK 2.4

CMTF-B-17/03 Formální náležitosti žádosti o habilitační řízení a řízení ke jmenování profesorem na CMTF UP

Portál IT komunity v ČR Kamil Matoušek, Jiří Kubalík ČVUT Praha

A5M33IZS Informační a znalostní systémy. O čem předmět bude? Úvod do problematiky databázových systémů

VÝUKA SYSTÉMU IDRISI NA KATEDŘE GEOINFORMATIKY PŘÍRODOVĚDECKÉ FAKULTY UNIVERZITY PALACKÉHO V OLOMOUCI

Centrum školského managementu Pedagogická fakulta Univerzity Karlovy v Praze června 2012

Bc Doktorský studijní program (obor) a témata disertačních prací Vysoká škola

Směrnice děkana 8/2014 Organizace studia v doktorských studijních oborech

Uznávání předmětů ze zahraničních studijních pobytů

Zápatí prezentace 1

PLÁN REALIZACE STRATEGICKÉHO ZÁMĚRU FAKULTY STROJNÍ TECHNICKÉ UNIVERZITY V LIBERCI NA ROK 2017

Bakalářský studijní obor hospodářská informatika

Bonn, Rheinischen Friedrich-Wilhelms-Universität

GRANTOVÉ PŘÍLEŽITOSTI pro doktorandy PřF. Brno,

Pro rok 2016 byly vedením stanoveny následující cíle:

Představení projektu a řešitelského týmu

Směrnice děkana č. 1/2016 pro metodické hodnocení studentů doktorských studijních programů na ČVUT FD

Soulad studijního programu. Ochrana a tvorba krajiny. Biologie, ekologie a životní prostředí

Základy fuzzy logiky 1

ODBOR PRO VĚDU A VÝZKUM REKTORÁTU MU STRATIFIKACE PROCESŮ. Jaroslav Andrle

Geomatika v České republice

PLÁN REALIZACE STRATEGICKÉHO ZÁMĚRU VZDĚLÁVACÍ A TVŮRČÍ ČINNOSTI FARMACEUTICKÉ FAKULTY VETERINÁRNÍ A FARMACEUTICKÉ UNIVERZITY BRNO

Transkript:

..! POSSIBILISTIC Laboratoř pro analýzu INFORMATION: a modelování dat Vědecký tutoriál, část I A Tutorial Vilém Vychodil (Univerzita Palackého v Olomouci) George J. Klir State University of New York (SUNY) Binghamton, New York 13902, USA gklir@binghamton.edu Palacky University, Olomouc, Czech Republic prepared for International Centre for Information and Uncertainty, Palacky University, Olomouc!!!! V. Vychodil (DAMOL) Vědecký tutoriál I 18. září 2012 1 / 14

Laboratoř pro analýzu a modelování dat Historie: SUNY Binghamton, T. J. Watson School (2007) Odborní zaměstnanci laboratoře: vedoucí výzkumný pracovník (R. Bělohlávek) výzkumní pracovníci (J. Konečný, M. Krupka, P. Osička, V. Vychodil) studenti doktorského studia Výzkumné a vzdělávací aktivity laboratoře: buduje vědeckou školu a podporuje výzkumu v oblasti analýzy dat pořádá vědecké semináře pro akademické pracovníky a studenty pořádá čtecí semináře pro akademické pracovníky a studenty pořádá vědecký studentský seminář V. Vychodil (DAMOL) Vědecký tutoriál I 18. září 2012 2 / 14

... http://damol.info/ V. Vychodil (DAMOL) Vědecký tutoriál I 18. září 2012 3 / 14

Co je analýza dat? Zabývá se: formální popisem a hledáním informace skryté v datech, různá podoba dat, různá podoba hledané informace : shluky, závislosti, bezpečnost (kryptografie, steganografie) získávání znalostí (náš případ). Zahrnuje: formální metody (statistika, lineární algebra, logika, ), algoritmické problémy (možnost nalézt řešení pomocí počítačů, ), další (vizualizace a interpretace závislostí, ). Široká disciplína, různé metody závisející na vstupu a cíli analýzy. V. Vychodil (DAMOL) Vědecký tutoriál I 18. září 2012 4 / 14

Co je relační analýza dat? Analýza vztahů v tabulkových datech věk stav zaměstnaný hodnocení Alois 27 svobodný 1 ** Bolek 32 vdovec 0 * Carda 28 ženatý 1 *** David. 17. svobodný. 0. *. Řádky = objekty (osoby, výrobky, zákazníci, ) Sloupce = atributy (vlastnosti, ) Hodnoty v tabulkách: binární data (logická 0 a 1) vztah má/nemá ordinální data (obecně víc hodnot mezi kterými je hierarchický vztah) další druhy: nominální, symbolická data, V. Vychodil (DAMOL) Vědecký tutoriál I 18. září 2012 5 / 14

Proč je relační analýza dat důležitá? Zajímavá, protože: základní typ dat (redukovatelnost na tabulková data) data jsou k dispozici a je jich hodně (relační databáze) vyřešený problém: jak skladovat (velká) data otevřený problém: jak z uložených dat získávat další informace, znalosti, (KDD: Knowledge Discovery from Data dolování znalostí z dat) Výstupy relační analýzy dat: konceptuální shlukování závislosti v datech redukce dimensionality dat podobnostní dotazování a další, V. Vychodil (DAMOL) Vědecký tutoriál I 18. září 2012 6 / 14

RAD: Konceptuální shlukování Motivace: Nalezení zajímavých shluků v datech sdílejících stejné atributy. Vede na hierarchický pohled na koncepty v datech uživatelsky zajímavý pohled na data (aplikace v lékařství, bezpečnosti, ). pacienti symptomy = Bělohlávek: Fuzzy Relational Systems: Foundations and Principles. Kluwer Academic/Plenum Press, New York (2002) V. Vychodil (DAMOL) Vědecký tutoriál I 18. září 2012 7 / 14

RAD: Závislosti v datech Motivace: Rozpoznání závislostí mezi přítomností atributů nebo jejich hodnotami. Cílem je hledat pravidla (formule) nebo jejich množiny charakterizující závislosti přítomné v datech (aplikace v marketingu ). zákazníci produkty = pokud zákazník koupí syrečky a chleba, pak si koupí i pivo Bělohlávek, Vychodil: Fuzzy attribute logic over complete residuated lattices. Journal of Experimental and Theoretical Artificial Intelligence 18(4): 471 480 (2006) V. Vychodil (DAMOL) Vědecký tutoriál I 18. září 2012 8 / 14

RAD: Redukce dimenzionality dat Motivace: Vyjádření (velkého počtu) atributů v datech pomocí (malého počtu) nových základních atributů (faktorů) tak, aby byla zachována plná informace o vlastnostech objektů (aplikace v předzpracování dat, bezpečnosti, ) pacienti symptomy = pacienti 1 2 3 symptomy 1 2 3 Bělohlávek, Vychodil: Discovery of optimal factors in binary data via a novel method of matrix decomposition. Journal of Computer and System Sciences 76(1):3 20 (2010) V. Vychodil (DAMOL) Vědecký tutoriál I 18. září 2012 9 / 14

RAD: Podobnostní dotazování Motivace: Získání odpovědí na dotazy ohledně dat vyjadřující podobnost hodnot. Vede na problémy rozšíření databázových systémů o podobnosti a ranky a jejich zpracování (aplikace v marketingu). agent plocha lokalita cena 0.93 Brown 1185 Vestal $228,500 0.89 Clark 1120 Endicott $235,800 0.86 Brown 950 Binghamton $189,000 0.85 Brown 1300 Binghamton $248,600 0.81 Clark 1200 Vestal $293,500 0.81 Davis 1250 Binghamton $287,300 0.75 Davis 1040 Vestal $286,200 0.37 Davis 1890 Endicott $345,000 Domy na prodej za $200,000 s plochou 1200. Bělohlávek, Vychodil: Query systems in similarity-based databases: logical foundations, expressive power, and completeness. ACM Symp. Applied Computing, 1648 1655 (2010) V. Vychodil (DAMOL) Vědecký tutoriál I 18. září 2012 10 / 14

DAMOL: Shrnutí výsledků za předchozí akademický rok Výzkumné aktivity: logika v informatice (zejména fuzzy logika, čistá i aplikovaná), analýza dat (znalostní inženýrství, dolování informací z dat). Výstupy výzkumných aktivit: odborné práce, prezentace na konferencích, výstup laboratoře: 80 článků v časopisech, 60 příspěvků na konferencích Další: účast na uznávaných zahraničních konferencích, krátkodobé stáže na zahraničních pracovištích, pořádání seminářů (22 vědeckých, 15 studentských, 21 čtecích), práce se zahraničními hosty (12 hostů). V. Vychodil (DAMOL) Vědecký tutoriál I 18. září 2012 11 / 14

DAMOL: Vzdělávací činnost Čtecí semináře: probíhá formou referátů z odborných monografií a článků, vzdělávání akademických pracovníků a studentů, důležitý aspekt: samostudium (nezkouší se). Studentské semináře: přednášení odborných témat přijatelnou formou, získání nového vhledu, možnost volby diplomové práce podle témat semináře, další rysy semináře: studentské přednášky, neformální diskuse, důležitý aspekt: motivační úkoly (mohou pomoci). Cíl: Zvedat odbornou kvalifikaci cílových skupin. V. Vychodil (DAMOL) Vědecký tutoriál I 18. září 2012 12 / 14

DAMOL: Nadcházející akce v zimním semestru 2012 Vědecký seminář (Čt, 11:30, učebna 5006) Sergei Obiedkov (NRU HSE, Russia) Neville Holmes (University of Tasmania, Australia) Pablo Cordero (University of Malaga, Spain) Willem Waegeman (Ghent University, Belgium) doktorandi: Lucie Urbanová, Tomáš Kühr, Markéta Krmelová (KI PřF UP) Čtecí seminář (Čt, 19:00, zasedací místnost katedry) matematická fuzzy logika (referáty z knih P. Hájka, R. Bělohlávka, ) Studentský vědecký seminář (více M. Krupka v druhé části tutoriálu) V. Vychodil (DAMOL) Vědecký tutoriál I 18. září 2012 13 / 14

DĚKUJI ZA POZORNOST V. Vychodil (DAMOL) Vědecký tutoriál I 18. září 2012 14 / 14