Dobývání znalostí z databází (MI-KDD) Přednáška číslo 1 - Úvod

Podobné dokumenty
Studijní předmět: Základy teorie pravděpodobnosti a matematická statistika Ročník:

SYLABUS KURZU HODNOCENÍ VÝSLEDKŮ VAV

Analytické procedury v systému LISp-Miner

Maintenance. Tomáš Krátký. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Dobývání znalostí z databází (MI-KDD) Přednáška číslo 5 Zajímavé dvojice podmnožin objektů, procedura SD4ft-Miner

INFORMACE O KLÍČOVÉ AKTIVITĚ

Dobývání znalostí z databází MI-KDD ZS 2011 Přednáška 2. Projekt LISp-Miner.

Nabídka DVPP pro období září - prosinec 2011

Sylabus modulu: B - Strategické řízení organizace

Sylabus modulu: B - Strategické řízení organizace

Možnosti transformace vyšších odborných škol do terciárního vzdělávání

Tvorba elektronického herbáře

- Aplikace je napsána v C#.NET, je instalována na webovém serveru - Data jsou ukládána v databázi MS-SQL 2005 a vyšší

Odhady, nabídky, měření a historie

Výpočet na gridu a LM TaskPooler

VŠB Technická univerzita, Fakulta ekonomická. Katedra regionální a environmentální ekonomiky REGIONÁLNÍ ANALÝZA A PROGRAMOVÁNÍ.

Specifikace pro SW aplikaci Start-up business.

PODPORA VYBUDOVÁNÍ A PROVOZU ZAŘÍZENÍ PÉČE O DĚTI PŘEDŠKOLNÍHO VĚKU PRO PODNIKY I VEŘEJNOST MIMO HL. M. PRAHU / V HL. M. PRAZE

ZŠ ÚnO, Bratří Čapků 1332

Business Intelligence - principy, efekty, předpoklady. OKsystem, 26/11/2009

Configuration Management

ZŠ ÚnO, Bratří Čapků 1332

Podklady k práci s Intranetem - administrátor

Řízení kvality, kontroling, rizika. Branislav Lacko Martina Polčáková. Kateřina Hrazdilová Bočková - konzultantka

Výživa a sport, základy fitness

VYUŽITÍ MULTIMEDIÁLNÍ TECHNIKY VE VÝUCE ANGLIČTINY UČÍME SE ANGLIČTINU S INTERAKTIVNÍ TABULÍ SMARTBOARD

Zpráva pro uživatele

JAK SE LÉPE ORIENTOVAT VE VÝSLEDCÍCH KLINICKÝCH STUDIÍ

Témata modulu a úkoly jsou využitelné ve výuce tematické oblasti RVP Člověk a svět práce ve středních školách.

DOTAZNÍK ZKUŠENOSTI ČESKÝCH PŘÍJEMCŮ S METODAMI PRO URČOVÁNÍ A VYKAZOVÁNÍ NEPŘÍMÝCH NÁKLADŮ V PROJEKTECH

VY_32_INOVACE_2A03 INTERNETOVÁ BEZPEČNOST

Slezská univerzita v Opavě Obchodně podnikatelská fakulta v Karviné

9:45 10:20 Úvodní slovo Mgr. Miloslav Kvapil, ředitel společnosti DYNATECH s.r.o.

DODATEČNÉ INFORMACE K ZADÁVACÍM PODMÍNKÁM

Norské fondy Program CZ08

Standardy pro učitelské vzdělávání v Německu a ve Švýcarsku: okolnosti jejich vzniku a působení

Š K O L N Í R O K / ZÁKLADNÍ ŠKOLA PROSTĚJOV, E. VALENTY 52. Mgr. Radomír Palát koordinátor ICT. Plán práce 2012/2013

Naxos MULTIMEDIÁLNÍ ARCHIV

Fyzická bezpečnost z pohledu ochrany a odolnosti prvků kritické infrastruktury. Ing. Luboš Nečesal

KURZ: Inkluze v MŠ se zaměřením na problematiku PAS a syndrom ADHD

1. Státní fond rozvoje bydlení (dále jen Fond ) je právnickou osobou.

PŘÍLOHA 1 ENERGETICKÝ MODEL PŘÍRŮSTKOVÝ ZÁVAZNÁ OSNOVA ZPRÁVY K FA/FEA. Manuál k Energetickému modelu Projekt: Aktualizace modelů a manuálů FEA

cestovního ruchu

Studentská Agora. - Proběhne 6 krajských kol debatní soutěže pod dozorem poroty.

Maturitní prací student osvědčuje svou schopnost samostatně pracovat na projektech a aktivně využívat nabyté zkušenosti

Harmonogram instalačních a implementačních prací

Stanovisko k dokumentu Řešení dalšího postupu územně ekologických limitů těžby hnědého uhlí v severních Čechách ze srpna 2015

Instalace a technické informace

Zpráva o činnosti projektu Výtvarný kroužek za období 2014 a cíle projektu pro rok 2015

Manuál k vyplnění Monitorovacích listů za rok 2017 (datum podání do )

Výkonná rada Paktu zaměstnanosti. 15. června 2017 Hradec Králové

Software process (improvement)

Uživatelský manuál Sta4MilPRO

Manuál k vyplnění Monitorovacích listů za rok 2018 (datum podání do )

ARTISTA NEWS No 1. Vše závisí na chlazení

Vyrobeno pro váš televizor BRAVIA : nové flexibilní DVD rekordéry s pevným diskem

Sylabus modulu: E Finance a finanční nástroje

Š K O L N Í R O K / ZÁKLADNÍ ŠKOLA PROSTĚJOV, E. VALENTY 52. Mgr. Radomír Palát koordinátor ICT, metodik ICT. Plán práce 2015/2016

Ministerstvo vnitra České republiky vyhlašuje Výzvu k předkládání žádostí o finanční podporu v rámci Integrovaného operačního programu

[AVG-WEB] Zpř í stupně ní kořpořá tní ho wěbu Semestrální práce z předmětu A4M39NUR

Zlepšování mobility a dostupnosti bez bariér v Ústí nad Labem

ANALÝZA SEGMENTU TRHU

Analýza účetní uzávěrky a závěrky ve vybraném podniku

APLIKOVANÉ NANOTECHNOLOGIE

Informační audit teorie a praxe v České republice

Záměr první fáze redesignu webu Fakulty aplikovaných věd

Strategické rámce správy a rozvoje klasifikace DRG v roce 2013

ZŠ ÚnO, Bratří Čapků 1332

NÁVODNÁ STRUKTURA MÍSTNÍHO AKČNÍHO PLÁNU VZDĚLÁVÁNÍ

Etržiště České pošty Centrum veřejných zakázek.

Nabídky pro výzkumné projekty a spolupráci se studenty

INTRANET V JVK ČESKÉ BUDĚJOVICE

DOBRÁ ŠKOLA Ústeckého kraje 2013/2014

Výzva K PODÁNÍ NABÍDKY A K PROKÁZÁNÍ KVALIFIKACE VE ZJEDNODUŠENÉM PODLIMITNÍM ŘÍZENÍ DLE UST. 53 ZÁKONA Č. 134/2016 SB., O ZADÁVÁNÍ VEŘEJNÝCH ZAKÁZEK

Projektový manuál: SME Instrument Brno

EUROPEAN ENTREPRENEURS CAMPUS

Informační systém o státní službě (ISoSS) Pracovní postup pro práci v Servisdesku ISoSS

PODZIMNÍ ŠKOLA Zdravých měst

16. Kategorizace SW chyb, kritéria korektnosti a použitelnosti, spolehlivost SW

Zápis ze setkání koordinační skupiny Systém včasného varování před novými drogami EWS. 9. března 2012, 13:00 15:00 hod.

USNESENÍ. Č. j.: ÚOHS-S339/2012/VZ-21769/2012/523/Krk Brno 20. prosince 2012

Requirements Engineering

Střední průmyslová škola a Vyšší odborná škola technická Brno, Sokolská 1

Dotazník tvoří celkem 25 otázek. Jejich zpracování stanovujeme do Garantujeme důvěrnost veškerých získaných informácí.

22. základní škola Plzeň, Na Dlouhých 49, příspěvková organizace ABSOLVENTSKÉ PRÁCE INFORMACE PRO ŽÁKY

Příloha č. 2 Popis podporovaných aktivit

LIKOform SYSTÉMOVÉ PŘÍČKY ROZDĚLENÍ FIRMY. INTERNATIONAL LIKO-Style INTERIORS ENERGY. LIKOfon. Chytrá izolace Živé stavby Živá fasáda.

Zákon o zdravotních pojišťovnách

České vysoké učení technické v Praze, Fakulta strojní. DPŽ + MSK Jurenka, příklad I. Dynamická pevnost a životnost. Jur, příklad I

Dotazník pro neziskové organizace

Nová GUHA-procedura ETree-Miner v systému LISp-Miner

Ke studiu budou přijati všichni uchazeči, u kterých bylo ověřeno splnění požadovaných podmínek.

SPARTAN DAIRY 3.0. Uživatelský manuál. Vytvořeno s podporou Interní vzdělávací agentury projekt č. 2017FVHE/2220/47 VFU BRNO

Výzva. Prioritní osa 5 Národní podpora územního rozvoje Oblast intervence 5.1 Národní podpora využití potenciálu kulturního dědictví

ETICKÝ A OBCHODNÍ ŘÁD ANTIMONOPOLNÍ & KONKURENČNÍ POLITIKA

EXTRAKT z mezinárodní normy

SDRUŽENÍ NERATOV, o.s.

Metodologické aspekty diagnostiky a výzkumu žákovských prekoncepcí. Jakub Pivarč Katedra primární pedagogiky, PedF UK

NABÍDKA NA VEDENÍ ÚČETNICTVÍ ČI DAŇOVÉ EVIDENCE JE URČENA:

Pražské služby, a.s. Analýza ekonomické situace s ohledem na realizaci záměru propachtování části podniku ve prospěch TSK, a.s. - Manažerské shrnutí -

Transkript:

Dbývání znalstí z databází (MI-KDD) Přednáška čísl 1 - Úvd (c) prf. RNDr. Jan Rauch, CSc. KIZI, Fakulta infrmatiky a statistiky VŠE zimní semestr 2011/2012 Evrpský sciální fnd Praha & EU: Investujeme d vaší buducnsti

Dbývání Znalstí z Databází 1960 banky pjišťvny bchdní řetězce nemcnice výrbní pdniky státní správa.? návratnst úvěrů charakteristiky klientů? zajímavé segmenty klientů? vzrce chvání zákazníků? ptimalizace léčby?.. DZD Dbývání Znalstí z Databází = Knwledge Discvery in Databases; KDD = DZD 2

MI-KDD - výchdiska Prudký rzvj aplikací DZD v praxi, bank, pjišťven i velkých pdniků, viz např. http://www.kdnuggets.cm/ Využívány známé metdy matematické statistiky a strjvéh učení Vyvíjeny nvé metdy Nvé blasti aplikací, např. sciální sítě Integrace s metdami umělé inteligence a znalstníh inženýrství Mnh výzev pr výzkum suvisející s DZD, viz např. http://www.cs.uvm.edu/~icdm/ 3

MI-KDD - zásady Budeme se věnvat zejména metdám a nástrjům, které máme k dispzici a které suvisí s výzkumem Důraz na praktické aplikace těcht nástrjů, Řešení úlh na reálných datech (mžn i vlastní) Mžn využít metdy z jiných předmětů Přednášky dbrníků z praxe 4

Úvdní přednáška Lgika bjevvání pmcí pčítače Metda GUHA Prcedura ASSOC Témata dalších přednášek 5

Lgika bjevvání pmcí pčítače Mhu pčítače frmulvat a verifikvat vědecké hyptézy? Mhu pčítače racinálním způsbem analyzvat empirická data a vytvřit rzumný braz analyzvanéh empirickéh světa? Může t být udělán pmcí matematické lgiky a statistiky? Lgic f discvery 1978 http://www.cs.cas.cz/hajek/guhabk/ 6

Lgika bjevvání pmcí pčítače teretické předpklady, bservační tvrzení teretické tvrzení 7

Lgika bjevvání pmcí pčítače Teretické tvrzení Teretický kalkul 1: 1 Observační tvrzení Observační kalkul Testvání hyptéz Všechny zajímavé ptvrzené hyptézy 1: 1 Všechna zajímavá bservační tvrzení 8

Metda GUHA Definice mnžiny ptenciálně zajímavých bservačních tvrzení Relace bezprstředníh důsledku GUHA prcedura všechna prstá tvrzení všechna zajímavá bservační tvrzení 9

GUHA prcedura ASSOC A 1 (1) A 2 (3,4) A 3 (5,6,7) A 24 (1,9) je 4ft- kvantifikátr pdmínka na a,b,c,d a b 0.85, 30 a a b 0.85 a 30 c d 10

GUHA prcedura ASSOC V dané matici hledá dvjice daným způsbem vzájemně závislých blevských atributů dvzených ze slupců matice dat. Vzájemná závislst je dána 4ft-kvantifikátrem který se definuje pmcí pdmínky na kntingenční tabulku atributů. Jsu k dispzici desítky 4ft-kvantifikátrů. Prcedura ASSOC byla vícekrát implementvána, první verse vznikla v šedesátých letech minuléh stletí a byla určena pr pčítač MINSK22. Pčátkem devadesátých let minuléh stletí byla definvána asciační pravidla v suvislsti s analýzu nákupníh kšíku. Tat asciační pravidla jsu specielním případem dvjic blevských atributů se kterými pracuje prcedura ASSOC. Budeme pracvat s prceduru 4ft-Miner. Jedná se implementaci prcedury ASSOC rzšířenu pdmíněná asciační pravidla. 4ft-Miner je sučástí systému LISp-Miner, viz http://lispminer.vse.cz/prcedures/index.php?system=4ft-miner 11

Témata dalších přednášek přehled 2 typy přednášek Teretické autr prf. RNDr. J. Rauch, CSc O systému LISp-Miner autr ing. M. Šimůnek, Ph.D. 12

Témata dalších přednášek P02 Prjekt LISp-Miner P03 Příklad aplikace prcedury 4ft-Miner P04 Asciační pravidla P05 Příklad aplikace prcedury SD4ft-Miner P06 Předzpracvání dat P07 Analytické prcedury P08 Analytické prcedury P09 Dménvé znalsti P10 Výpčet na gridu a LM TaskPler P11 Dménvé znalsti v systému LISp-Miner P12 Observační kalkuly P13 Výzkumná témata 13

GUHA prcedury v systému LISp-Miner 4ft Miner ASSOC + pdmíněná pravidla, 17 4ft-kvantifikátrů SD4ft Miner dvě mnžiny se liší hledně pravidla AC4ft Miner návrh rzumné akce KL Miner SDKL Miner CF Miner kategriální atributy SDCF Miner 14

Seminární práce Samstatný student neb dvučlenný tým Něklik analytických tázek + jejich řešení prezentván pmcí systému SEWEBAR http://sewebar.vse.cz/ Pužít minimálně tři prcedury systému LISp-Miner Mžn pužít další sftware pr analýzy Refervat průběhu řešené tázky + stav Část analýz lze nahradit dreferváním článku Nutn průběžně knzultvat pr upřesnění Pdklady pr cvičení viz subry C01 až C11, jejich autrem je ing. Milan Šimůnek, CSc. 15

Příklad článku k refervání (1) 16

Příklad článku k refervání (2) http://www.gimac.uma.es/ipmu08/ 17

Pžadavky na abslvvání Vypracvat seminární práci Abslvvat závěrečný písemný test Abslvvat ústní zkušku 18

Při tvrbě těcht elektrnických pdkladů pr výuku byly využity výsledky těcht prjektů realizvaných na Vyské škle eknmické v Praze: Prjekt GAČR 201/08/0802 - Aplikace metd znalstníh inženýrství při dbývání znalstí z databází Prjekt MŠMT ME 913 - Nvé nástrje a terie pr dbývání znalstí z databází 19