Dobývání znalostí z databází MI-KDD ZS 2011 Přednáška 2. Projekt LISp-Miner.

Podobné dokumenty
Výpočet na gridu a LM TaskPooler

Analytické procedury v systému LISp-Miner

Projekt LISp-Miner. M. Šimůnek

Dobývání znalostí z databází (MI-KDD) Přednáška číslo 1 - Úvod

Dobývání znalostí z databází (MI-KDD) Přednáška číslo 5 Zajímavé dvojice podmnožin objektů, procedura SD4ft-Miner

Nová GUHA-procedura ETree-Miner v systému LISp-Miner

Univerzita Karlova v Praze Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE

Úvod do dobývání. znalostí z databází

Vysoká škola ekonomická. Katedra informačního a znalostního inženýrství. Fakulta informatiky a statistiky. Systém LISp-Miner

Vývoj informačních systémů. Přehled témat a úkolů

Vývoj informačních systémů. Přehled témat a úkolů

LISp-Miner: systém pro získávání znalostí z dat 1

Dobývání znalostí z databází (MI-KDD) Přednáška číslo 9 Využití doménových znalostí

Dobývání znalostí z databází (MI-KDD) Přednáška číslo 4 Asociační pravidla

Microsoft Access tvorba databáze jednoduše

4ft-Miner pro začátečníky Získávání znalostí z databází

Webová aplikace Znalostní testy online UŽIVATELSKÁ PŘÍRUČKA

Poznámky k verzi Remote support platform 3.1

DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Využití aplikace SketchUp pro tvorbu jednoduchého informačního systému

EvMO postup při instalaci

SRSW4IT Inventarizační SW. Prezentace aplikace. Vedoucí DP: ing. Lukáš Macura Autor: Bc. Petr Mrůzek

Hodnocení (ne)zajímavosti asociačních pravidel za využití báze znalostí

Testování a verifikace softwaru

Pražská energetika, a.s.

SolidWorks. SW je parametrický 3D modelář a umožňuje. Postup práce v SW: Prostředí a ovládání

InformatikaaVT(1) Cílem předmětu je: Žáci:

Modul IRZ návod k použití

1. Znalostní systémy a znalostní inženýrství - úvod. Znalostní systémy. úvodní úvahy a předpoklady. 26. září 2017

Web. Získání informace z internetu Grafické zobrazení dat a jejich struktura Rozšíření funkcí pomocí serveru Rozšíření funkcí pomocí prohlížeče

úvod Historie operačních systémů

Postup instalace ČSOB BusinessBanking pro MS SQL 2005/2008

Tvorba informačních systémů

Databázové a informační systémy

Obsah. Úvod 9 Komu je kniha určena 11 Konvence použité v knize 11

Hodnoticí standard. Správce aplikací (kód: M) Odborná způsobilost. Platnost standardu. Skupina oborů: Informatické obory (kód: 18)

NOVINKY v PROGRAMU DOCHÁZKA ADS

Masterský studijní obor datové & webové inženýrství

Obsahy kurzů MS Office

GTL GENERATOR NÁSTROJ PRO GENEROVÁNÍ OBJEKTŮ OBJEKTY PRO INFORMATICA POWERCENTER. váš partner na cestě od dat k informacím

POKROČILÉ POUŽITÍ DATABÁZÍ

Úvod. Programovací paradigmata

PRODUKTY Tovek Server 6

Dobrý CMS Popis produktu a jeho rozšíření

Versiondog Lukáš Rejfek, Pantek (CS) s.r.o. 7/2014

1 Administrace systému Moduly Skupiny atributů Atributy Hodnoty atributů... 4

ZEMĚMĚŘICKÝ ÚŘAD. Výzkum a vývoj programového aparátu pro generalizaci státního mapového díla. Ing. Přemysl JINDRÁK

EXPERIMENTÁLNÍ GUHA PROCEDURY

Administrace Oracle - Správa zdrojů

Kritéria hodnocení praktické maturitní zkoušky z databázových systémů

Metody tvorby ontologií a sémantický web. Martin Malčík, Rostislav Miarka

Uživatelská příručka k aplikaci Dell Display Manager

UŽIVATELSKÁ PŘÍRUČKA APLIKACE. Administrace dokumentů

Architektury informačních systémů

V t í á t V á V s ČVU V T v v P r P a r ze

KIG/1GIS2. Geografické informační systémy. rozsah: 2 hod přednáška, 2 hod cvičení způsob ukončení: zápočet + zkouška

rychlý vývoj webových aplikací nezávislých na platformě Jiří Kosek

IT ESS II. 1. Operating Systém Fundamentals

Kritéria hodnocení praktické maturitní zkoušky z databázových systémů

UŽIVATELSKÉ ŠKOLENÍ LOTUS NOTES

ČÁST 1. Základy 32bitového programování ve Windows

PC: Identifikace struktury zobecněného dynamického systému

Experimentální systém pro WEB IR

Příprava dat v softwaru Statistica

Radim Dolák Gymnázium a Obchodní akademie Orlová

AIDA64 Extreme. Příručka k nastavení. v

Management informačních systémů. Název Information systems management Způsob ukončení * přednášek týdně

Předmluva 11 Typografická konvence použitá v knize Úvod do Excelu

ZÁVAZNÉ FUNKČNÍ A TECHNICKÉ POŽADAVKY ZADAVATELE NA PROTOTYP

Novinky ve Visual Studio Tomáš Kroupa

Virtuální ověřování výroby Robotika Process Simulate Virtual Commissioning Virtuelle Inbetriebnahme

Nastavení hardwarové konfigurace pro CPU 314C-2DP v programu SIMATIC Manager

Novinky z vývoje v MetaCentru

Nephele systém. Akademie výtvarných umění v Praze. Ústav teorie informace a automatizace AV ČR, v.v.i. Ústav anorganické chemie AV ČR, v.v.i.

Základní škola Učební osnovy I. I. Sekaniny1804 Informatika

01 Teoretické disciplíny systémové vědy

ALGORITMIZACE A PROGRAMOVÁNÍ

Jan Horák. Pilíře řešení

Obsah. 1 Úvod do Visia Práce se soubory 47. Předmluva 11 Typografická konvence použitá v knize 13

C# &.NET. Cvičení Mgr. Filip Krijt.

Sada 1 - Základy programování

Prodejna SQL je maloobchodní pokladní software určený pro široké spektrum prodejen.komplet určený k propojení s Money S3 pomocí XML komunikace

Aktivací DOWN módu je možné zkrátit dobu přenosu parametrů (pouze však za klidu měniče).

Informační a komunikační technologie

UDS for ELO. Univerzální datové rozhraní. >> UDS - Universal Data Source

Obsah Úvod 4. TF Wmake 1.5

Stručný obsah. Úvod 15. KAPITOLA 1 První kroky v systému Windows KAPITOLA 2 Hlavní panel a jeho možnosti 41. KAPITOLA 3 Soubory a složky 51

ezkouška požadavky na IT

Získávání dat z databází 1 DMINA 2010

Dobrý SHOP Popis produktu a jeho rozšíření

Zjednodušení generativního systému redukcí rozlišení

Architektury informačních systémů

Vytvoření bootovatelného média

FORTANNS. 22. února 2010

Ceník programu DesignBuilder v4

POČÍTAČOVÉ SÍTĚ A KOMUNIKACE OBOR: INFORMAČNÍ TECHNOLOGIE

LISp-Miner Martin Šulc Projekt do předmětu Vyhledávání znalostí v databázích

Obsah. Předmluva KAPITOLA 1 Úvod do programu Microsoft Dynamics NAV KAPITOLA 2 Základy ovládání...33

Vrstvy programového vybavení Klasifikace Systémové prostředky, ostatní SW Pořizování Využití

Transkript:

Dobývání znalostí z databází MI-KDD ZS 2011 Přednáška 2 Projekt LISp-Miner http://lispminer.vse.cz (c) 2011 Ing. M. Šimůnek, Ph.D. KIZI, Fakulta informatiky a statistiky, VŠE Praha Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Projekt LISp-Miner http://lispminer.vse.cz M. Šimůnek

Obsah Systém LISp-Miner Vývoj systému v dlouhém období Architektura systému EverMiner Distribuovaný výpočet na gridu MI-KDD P02 M. Šimůnek: Projekt LISp-Miner 3

Systém LISp-Miner http://lispminer.vse.cz Vývoj od roku 1996 Cíle cca 1 mil. programových řádků vývojové prostředí MSVC++ použití ve výuce použití pro výzkum v oblasti DM použití pro řešení reálných DM úloh Navazuje na metodu GUHA (vývoj od roku 1966) předchozí implementace (IBM VM/370, PC-GUHA...) Akademické prostředí mj. důraz na nízké nároky na HW/SW, jednoduchou instalaci MI-KDD P02 M. Šimůnek: Projekt LISp-Miner 4

Systém LISp-Miner koncepce Objektový návrh Modulární a vrstvená architektura moduly + metabáze Důraz na rychlost výpočtu generování a verifikace co nejrychlejší i pro složitá zadání úloh rozsáhlé optimalizace Projektové řízení LM Modul n LM Modul 8 domovská stránka projektu (DP Ing. Z. Černý) standardizované dokumenty pro popis teorie, částí systému, doporučení pro další vývoj... LM Modul 1 META BÁZE LM Modul 2 LM Modul 7 LM Modul 6 LM Modul 3 LM Modul 4 LM Modul 5 MI-KDD P02 M. Šimůnek: Projekt LISp-Miner 5

LISp-Miner a fáze DZD ANALYZOVANÁ DATA Asociování analyzovaných dat pparams (ODBC DSN) META BÁZE LM Admin Administrace Read-Only Moduly Porozumění problematice Moduly Předzpracování dat Moduly Analýzy dat Moduly Interpretace výsledků KNOW LEDGE BÁZE Export (SEWEBAR,HTML ) MI-KDD P02 M. Šimůnek: Projekt LISp-Miner 6

Instalace systému Instalace volně k dispozici na http://lispminer.vse.cz/downlaod rozděleno do ZIP-souborů podle procedur stačí stáhnout a rozbalit doporučuje se rozbalovat do základního adresáře <disk>:\lisp-miner Verze modulu/systému v menu Help/About LISp-Miner na webových stránkách je číslo nejnovější verze Tutoriály http://lispminer.vse.cz/tutorial MI-KDD P02 M. Šimůnek: Projekt LISp-Miner 7

Uživatelské rozhraní Možné ovládat jak klávesnicí, tak myší Priorita klávesnice klávesové zkratky pomocí klávesy Alt vyhledávání v abecedních seznamech postupným zadáváním písmen názvu Automatické přenačtení metabáze např. když jsou vygenerovány nové hypotézy lze i ručně pomocí Ctrl+R Nejde však o komerční aplikaci a tvorbě rozhraní nemůže být věnován čas na úkor vlastních algoritmů generování, verifikace, gridu... Specializovaná rozhraní pro potřeby konkrétních úloh obvykle zjednodušené, ne tolik odborné terminologie obvykle jako webové stránky (viz např. SEWEBAR) MI-KDD P02 M. Šimůnek: Projekt LISp-Miner 8

Moduly a procedury LM LM LAQ Manager, LM KnowledgeSource porozumění problematice formulace LAQ doménové znalosti doporučení pro kategorizaci, prahové hodnoty vztahy mezi atributy LM DataSource, LM TimeTransf seznámení s daty a jejich předzpracování Procedury 4ft-Miner, CF-Miner, KL-Miner SDxx Procedury SD4ft-Miner, SDCF-Miner, SDKL-Miner Ac4ft-Miner Rozšiřující moduly AR2NL, 4ft-LiteralImportance, KL-Collaps, LM SwbExporter... MI-KDD P02 M. Šimůnek: Projekt LISp-Miner 9

Přiřazení modulů k fázím DZD ANALYZOVANÁ DATA Asociování analyzovaných dat pparams (ODBC DSN) META BÁZE LM Admin ControlPanel Administrace Read-Only LM LAQ Manager LM DataSource 4ftTask 4ftResult LM KnowledgeSource LM TimeTransf 4ftGen KExResult 4ftGridGen KNOW LEDGE BÁZE KExTask LM SwbExporter Export MI-KDD P02 M. Šimůnek: Projekt LISp-Miner (SEWEBAR,HTML ) 10

Dlouhodobý vývoj systému Reálie roku 1996 IBM PC i386, 640 KB RAM dbase, FoxBase, TurboPascal 32-bitová Windows95 horkou novinkou; web a e-mail také Jak se budeme za 15 let dívat na dnešní vymoženosti? Návrh koncepce SW systému musel vycházet z tehdejší úrovně znalostí a úrovně prostředků Konzistentní a stabilní návrh základní koncepce Snaha neuzavírat dveře možným směrům budoucího vývoje Vývoj a změny terminologie Přes deset let systém udržen ve stavu dovolujícím jeho nasazení ve výuce, jako téma závěrečných prací a podpora výzkumu DZD Srozumitelnost programového kódu i po mnoha letech dodržování konvencí úprava textu, pojmenování proměnných... MI-KDD P02 M. Šimůnek: Projekt LISp-Miner 11

LISp-Miner mezníky Implementace kvantifikátorů (1996) 4ftMiner (1998) DAO, serializace 4ftMiner s rodinami veličin (1999) Stav Délka Frekvence Lze prodloužit slepá ulička příliš složité, neuchopitelné co dál? Je další literál Lze výměna veličiny Lze zkrátit 1 0 ** ** ** ** ** ProdlouzeniCedentu 2 1 AA AA ** ** ** ProdlouzeniCedentu 3 1 AA NN AA ** ** DalsiLiteral 4 1 AA NN NN AA ** VymenaVeliciny 5 1 AA NN NN NN AA ZkraceniCedentu 6 1 AA NN NN NN NN KonecVetveVBNC 7 1 NN ** AA ** ** DalsiLiteral 8 1 NN ** NN AA ** VymenaVeliciny 9 1 NN ** NN NN AA ZkraceniCedentu 10 1 NN ** NN NN NN KonecVetveVBNC 11 2 ** ** AA ** ** DalsiLiteral 12 2 ** ** NN AA ** VymenaVeliciny 13 2 ** ** NN NN AA ZkraceniCedentu 14 2 ** ** NN NN NN KonecVetveVBNC Akce MI-KDD P02 M. Šimůnek: Projekt LISp-Miner 12 LISp-Miner jako akademický systém (od 1999) využití dosavadních zkušeností zahrnutí více odlišných procedur orientace na výzkum a výuku (pokročilé kurzy, BP/DP/DisP) podhoubí pro další projekty EverMiner, SEWEBAR, Ferda...

Projekt EverMiner Výzkum možností automatické analýzy dat využití již existujících modulů a přidání zastřešující logické vrstvy, která bude automaticky spouštět úlohy a upravovat jejich parametry na základě výsledků předchozích běhů na výstup budou vkládány pouze skutečně nové a zajímavé (netriviální) znalosti nevyplývající ze známých skutečností Vysoké nároky na rychlost výpočtu každé jedné úlohy využití počítačového gridu ANALYZED DATA Data Preprocessing mapping to meta-attributes KNOWLEDGE- BASE Domain knowledge Initial, Induced Synthesizer New knowledge induction logic Qustion Maker formulation of the LAQ logic MI-KDD P02 M. Šimůnek: Projekt LISp-Miner 13 Already known facts Newly induced knowledge Log History of each step and decision undertaken during automatic process FOUND PRIME PATTERNS Categorization hints, significant levels Task parameters fine-tuning LAQ Pool Initial, Induced Task Builder Task parameters setup logic 4ft KL Ac4ft Analytical procedures 4ft-Miner, KL-Miner DISTRIBUTED GRID simultaneous solving of many data-mining tasks

Počítačový grid Distribuovaný výpočet na více počítačích transparentní z pohledu uživatele Velmi dobré výsledky Snadné zvýšení výkonu zaregistrováním dalších PC do gridu MI-KDD P02 M. Šimůnek: Projekt LISp-Miner 14

Závěr Systém LISp-Miner Skripta Šimůnek, M.: Systém LISp-Miner Historie vývoje a popis ovládání Dlouhodobý vývoj Další rozvoj možnosti pro zapojení formou DP, DisP http://lispminer.vse.cz MI-KDD P02 M. Šimůnek: Projekt LISp-Miner 15

Prohlášení Při přípravě těchto elektronických podkladů pro výuku byly využity výsledky následujících projektů realizovaných na Vysoké škole ekonomické v Praze: Projekt GAČR 201/08/0802 - Aplikace metod znalostního inženýrství při dobývání znalostí z databází Projekt MŠMT ME 913 - Nové nástroje a teorie pro dobývání znalostí z databází MI-KDD P02 M. Šimůnek: Projekt LISp-Miner 16