Získávání dat z databází 1 DMINA 2010
|
|
- Ludmila Macháčková
- před 8 lety
- Počet zobrazení:
Transkript
1 Získávání dat z databází 1 DMINA 2010
2 Získávání dat z databází Motto Kde je moudrost? Ztracena ve znalostech. Kde jsou znalosti? Ztraceny v informacích. Kde jsou informace? Ztraceny v datech. Kde jsou data? Ztracena v databázích. T. S. Eliot, J. Celko
3 Přibližný sylabus 1. Data mining 2. Základy pravděpodobnosti a statistiky 3. Statistika. Kontingenční tabulky. Regresní analýza. Diskriminační analýza, shluková analýza 4. Zdroje. Relační DB. OLAP. Datové sklady 5. Strojové učení 6. Rozhodovací stromy 7. Asociační pravidla 8. Rozhodovací pravidla 9. Neuronové sítě, Bayesovská klasifikace 10. Vyhodnocení výsledků 11. Příprava dat 12. Systémy pro dobývání znalostí z DB
4 Software Excel či jiný tabulkový kalkulátor Statistica RapidMiner Tanagra WEKA
5 Literatura Berka Petr. Dobývání znalostí z databází. Praha, ISBN LACKO, M. Databáze: datové sklady, OLAP a dolování dat. Computer Press, ISBN
6 Zdroje na webu Software Data, kurzy Pravděpodobnost a statistika
7 Požadavky aktivní přístup k dané problematice vypracovat projekt z oblasti DM pomocí vybraného open-source softwarového nástroje zahrnující dostatečně velká sada dat (učící a testovací vzorek) předzpracování dat formulace a ověření (vyvrácení) hypotéz vybrané učící metody rozhodovací stromy, asociační pravidla testování vizualizace vyhodnocení
8 Data mining Data Mining (DM)- dolování dat dolování z dat Knowledge Discovering in Databases (KDD) získávání znalostí z databází Data Fishing, Data Dredging Data Archaeology Information Harvesting Information Discovery Knowledge Extraction Inteligence získaná z informací a dat společnosti (SAS) For also knowledge is power Francis Bacon
9 Počátky DM (90. léta 20. století) data v relačních databázích umělá inteligence metody strojového učení statistika modelování, analytické metody potřeba používat zpracované údaje pro podporu strategického rozhodování Cíl získat pravdivé, nové zákonitosti, které lze k něčemu využít v daném konkrétním oboru (marketing, technika, ekonomika, psychologie, medicína ) automatizace procesu získání zajímavých vzorů chování z reálných dat, tvorba jejich modelů - pomocí nástrojů strojového učení, statistiky, databázových technologií,
10 Vymezení pojmu KDD netriviální získávání implicitních dříve neznámých a potenciálně užitečných informací (znalostí) z dat Data Mining is the non-trivial process of identifying valid novel potentially useful and ultimately understandable patterns in data Advances in Knowledge Discovery and Data Mining, Fayyad, Piatetsky-Shapiro, Smyth, and Uthurusamy, Chapter 1, AAAI/MIT Press 1996
11 Proces dobývání dat Interaktivní a iterativní proces selekce předzpracování transformace vlastní dobývání interpretace příprava dat
12 Proces dobývání dat Výchozí data Vybraná data Předzpracovaná data Transformovaná data selekce předzpracování transformace Znalosti Vzorky interpretace
13 Manažerský pohled na proces KDD 1. Řešitelský tým 7. Interpretace 2. Specifikace problému 3. Získání dat Reálný problém impuls pro zahájení procesu dobývání dat Cíl získat co nejvíc relevantních informací vhodných k řešení daného problému 4. Výběr metod 6. Dolování dat 5. Předzpracování dat
14 Etapy KDD (1 4) 1. Stanovení řešitelského týmu skupina expertů na danou problematiku, na data, databáze, na metody KDD 2. Specifikace problému v kontextu dobývání dat 3. Zisk všech dostupných dat může dojít k přeformulování problému otázka kvality datové základny externí data popisující prostředí, v němž se analyzované děje odehrávají (období, reklama, politická situace, počasí ) 4. Volba metody pro analýzu dat (ev. kombinace více metod) klasifikační metody metody explorační analýzy dat metody pro získávání asociačních pravidel rozhodovací stromy genetické algoritmy neuronové sítě bayesovské sítě
15 Etapy KDD (5 6) 5. předzpracování dat data se převedou do tvaru požadovaného rpo aplikaci metod vyčištění dat doplnění chybějících dat 6. vlastní data mining aplikace zvolených analytických metod jednotlivé metody mohou být aplikovány i vícekrát hodnoty vstupních běhů závisejí na výstupech předchozích běhů typy metod se kombinují na základě dílčích výsledků
16 Etapa 7 - interpretace zpracování většinou velkého množství výsledků jednotlivých metod některé výsledky nejsou pro uživatele zajímavé či naopak jsou známé některé výsledky se dají použít přímo, některé je třeba podat srozumitelněji pro uživatele výsledky se uspořádají do analytické zprávy výstupem může být i provedení určité akce např. spuštění monitorovacího programu
17 Terminologie Koncept oblast zájmu co chceme předpověď počasí Instance jednotlivá data data o počasí jednoho konkrétního dne Atributy: jednotlivé vlastnosti instance teplota, tlak, množství srážek
18 Úlohy pro data mining klasifikace shlukování asociace zjišťování pravidel (A B C se vyskytují často společně) vizualizace sumarizace detekce odchylek a chyb odhady link analýza
19 Klasifikace Určit instanční třídu pro jednotlivé instance (výskyty dat) Postupy - statistika - rozhodovací stromy - neuronové sítě...
20 Shlukování Najít "přirozené" skupiny instancí v datech
21 Asociační pravidla Transakce Položka Produkt 1 MLÉKO, CHLÉB, VEJCE 2 CHLÉB, CUKR 3 CHLÉB, CEREÁLIE 4 MLÉKO, CHLÉB, CUKR 5 MLÉKO, CEREÁLIE 6 CHLÉB, CEREÁLIE 7 MLÉKO, CEREÁLIE 8 MLÉKO, CHLÉB, CEREÁLIE, VEJCE 9 MLÉKO, CHLÉB, CEREÁLIE Časté skupiny položek mléko, chléb (4) chléb, cereálie (3) mléko, chléb, cereálie (2) Pravidla Mléko Chléb (66%)
22 Úlohy pro data mining klasifikace (predikce) deskripce hledání nuggetů Koncept Z Klasifikace cílem je nalézt znalosti použitelné pro klasifikaci nových vzorů získané znalosti by měly co nejvíce odpovídat danému konceptu dává se přednost přesnosti pokrytí na úkor jednoduchosti Predikce snaha odhadnout ze starších hodnot nějaké veličiny její vývoj v budoucnu (předpověď počasí, kurzy, akcie )
23 Deskripce cílem je nalézt dominantní strukturu nebo vazby obsažené v daných datech požadují se srozumitelné znalosti pokrývající daný koncept menší množství méně přesných znalostí Koncept Z Popis (deskripce)
24 Hledání nuggetů zajímavé, nové (překvapivé, dosud neznámé) znalosti, které nemusejí plně pokrývat daný koncept Koncept Z Nuggety
25 Přehled typických úloh pro DM segmentace a klasifikace klientů banky rozpoznávání problémových klientů rozpoznávání vysoce bonitních klientů segmentace a klasifikace klientů pojišťovny predikce vývoje kurzu akcií predikce spotřeby elektrické energie analýza poruch v sítích analýza poruch automobilů analýza důvodů změny poskytovatele služeb (proč jsme přišli o zákazníky) rozbor nemocnosti predikce epidemií analýza nákupního košíku
26 Metodiky dobývání znalostí Cíl Poskytnout uživatelům jednotný rámec pro řešení různých úloh z oblasti dobývání znalostí z databází metodiky vyvinuté výrobci softwarových systémů (5A, SEMMA) metodiky vyvinuté výzkumnými a komerčními institucemi jakožto softwarově nezávislé (CRISP DM) sdílení a přenos zkušeností z úspěšných produktů
27 Metodika 5A Assess posouzení potřeb projektu stanovení kontextu cílů, strategií a procesů Access shromáždění potřebných data a jejich příprava Analyze provedení analýz přeměnit data na znalosti používá se více metod (porovnání výsledků, spolehlivosti, efektivity) Act přeměna znalostí na akční znalosti doporučení, dodatečné otázky a následná rozhodnutí jasná a srozumitelná prezentace nalezených výsledků Automate převedení výsledků analýzy do praxe možnost vytvoření rozhraní pro snadné použití umožnit aktualizaci výsledků dle nových modelů
28 metodika SEMMA (Enterprise Miner) SAMPLE výběr vhodných objektů EXPLORE vizuální explorace a redukce dat MODIFY seskupování objektů a hodnot atributů, datové transformace MODEL analýza dat neuronové sítě, rozhodovací stromy, statistické techniky, asociace, shlukování ASSESS porovnání modelů a interpretace (srozumitelně pro uživatele)
29 SAMPLE výběr vzorku dat EXPLORE vizualizace dat shlukování asociace MODIFY selekce a vytváření veličin selekce a vytváření veličin MODEL neuronové sítě modely založené na stromech logistické modely ASSESS zhodnocení modelu
30 Metodika CRISP-DM Cross-Industry Standard Process for Data Mining vznikl v rámci evropského výzkumného projektu Cíl navrhnout univerzální postup použitelný v nejrůznějších komerčních aplikacích standardní model procesu DM průvodce možnými problémy a jejich řešení v reálných aplikacích Proces DM 6 fází pořadí není přesně určeno výsledky jedné fáze ovlivňují (vstupují) do fáze další některé kroky a fáze je nutné provádět opakovaně
31 Životní cyklus procesu DM POROZUMĚNÍ PROBLEMATICE POROZUMĚNÍ DATŮM VYUŽITÍ VÝSLEDKŮ DATA PŘÍPRAVA DAT VYHODNOCENÍ VÝSLEDKŮ MODELOVÁNÍ
32 Fáze DM porozumění problematice (Business Understanding) pochopení cílů úlohy a požadavků na řešení revize zdrojů (datových, výpočetních i lidských) předběžný plán prací porozumění datům (Data Understanding) prvotní sběr dat seznámení s daty, posouzení kvality, vytipování zajímavých podmnožin záznamů v datech výpočet deskriptivních charakteristik dat rozsahy, četnosti atributů, průměrné hodnoty
33 Fáze DM příprava dat příprava, předzpracování dat (Data Preparation) vytvoření datového souboru, který bude zpracováván jednotlivými analytickými metodami data by měla obsahovat relevantní údaje a být ve tvaru, který vyžaduje příslušná analytická metoda selekce dat čištění transformace dat (typové konverze, diskretizace, binomizace ) doplnění chybějících údajů integrování dat příslušné úpravy se obvykle provádějí opakovaně
34 Fáze DM modelování, vyhodnocení výsledků modelování (Modeling) použití analytických metod pro dobývání znalostí vybrat vhodné metody, nastavit vhodně parametry metod iterativní činnost opakovaná aplikace algoritmů s různými parametry může vést k potřebě modifikovat data ověření nalezených znalostí vyhodnocení výsledků (Evaluation) z pohledu manažerů byly splněny cíle formulované v zadání úlohy rozhodnutí o způsobu využití výsledků
35 Fáze DM využití výsledků využití výsledků (Deployment) upravit získané znalosti do podoby využitelné pro zákazníka vizualizace implementace klasifikačního algoritmu v user-friendly podobě příprava uživatelského manuálu instalace programů zaškolení uživatelů změna metod řešení příslušných úkolů (např. poskytování úvěrů)
DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ
DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ Úvod a oblasti aplikací Martin Plchút plchut@e-globals.net DEFINICE A POJMY Netriviální extrakce implicitních, ch, dříve d neznámých a potenciáln lně užitečných informací z
VíceDobývání a vizualizace znalostí
Dobývání a vizualizace znalostí Olga Štěpánková et al. 1 Osnova předmětu 1. Dobývání znalostí - popis a metodika procesu a objasnění základních pojmů 2. Nástroje pro modelování klasifikovaných dat a jejich
VíceDobývání znalostí z databází
Dobývání znalostí z databází (Knowledge Discovery in Databases, Data Mining,..., Knowledge Destilery,...) Non-trivial process of identifying valid, novel, potentially useful and ultimately understandable
VíceZískávání znalostí z dat
Získávání znalostí z dat Informační a komunikační technologie ve zdravotnictví Získávání znalostí z dat Definice: proces netriviálního získávání implicitní, dříve neznámé a potencionálně užitečné informace
VíceDobývání a vizualizace znalostí. Olga Štěpánková et al.
Dobývání a vizualizace znalostí Olga Štěpánková et al. 1 Osnova předmětu Dobývání znalostí - popis a metodika procesu CRISP a objasnění základních pojmů Nástroje pro modelování klasifikovaných dat a jejich
VíceZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ
Metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných
VíceDobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze
Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Úvod do problematiky Doc. RNDr. Iveta Mrázová,
VíceDobývání a vizualizace znalostí
Dobývání a vizualizace znalostí Olga Štěpánková et al. 1 Osnova předmětu 1. Dobývání znalostí - popis a metodika procesu a objasnění základních pojmů 2. Nástroje pro modelování klasifikovaných dat a jejich
VíceZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ
metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných
VíceObsah. Seznam obrázků. Seznam tabulek. Petr Berka, 2011
Petr Berka, 2011 Obsah... 1... 1 1 Obsah 1... 1 Dobývání znalostí z databází 1 Dobývání znalostí z databází O dobývání znalostí z databází (Knowledge Discovery in Databases, KDD) se začíná ve vědeckých
Více1. Dobývání znalostí z databází
1. Dobývání znalostí z databází O dobývání znalostí z databází (Knowledge Discovery in Databases, KDD) se začíná ve vědeckých kruzích mluvit počátkem 90. let. První impuls přišel z Ameriky, kde se na konferencích
VíceMETODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1
METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1 DOLOVÁNÍ V DATECH (DATA MINING) OBJEVUJE SE JIŽ OD 60. LET 20. ST. S ROZVOJEM POČÍTAČOVÉ TECHNIKY DEFINICE PROCES VÝBĚRU, PROHLEDÁVÁNÍ A MODELOVÁNÍ
VíceIng. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence
APLIKACE UMĚLÉ INTELIGENCE Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence Aplikace umělé inteligence - seminář ING. PETR HÁJEK, PH.D. ÚSTAV SYSTÉMOVÉHO INŽENÝRSTVÍ A INFORMATIKY
VíceDobývání a vizualizace znalostí
Dobývání a vizualizace znalostí Olga Štěpánková, Lenka Vysloužilová, et al. https://cw.fel.cvut.cz/wiki/courses/a6m33dvz/start 1 Osnova přednášky Úvod: data, objem, reprezentace a základní terminologie
VíceZískávání znalostí z databází. Alois Kužela
Získávání znalostí z databází Alois Kužela Obsah související pojmy datové sklady, získávání znalostí asocianí pravidla 2/37 Úvod získávání znalostí z dat, dolování (z) dat, data mining proces netriviálního
Víceznalostí z databází- mnohostranná interpretace dat
Dobývání znalostí z databází- mnohostranná interpretace dat Petr Berka VŠE Praha berka@vse vse.cz Dobývání znalostí z databází Non-trivial process of identifying valid, novel, potentially useful and ultimately
VíceProfitabilita klienta v kontextu Performance management
IBM Technical specialist team Pre Sale 26/10/2010 Profitabilita klienta v kontextu Performance management Co všechno řadíme do PM? Automatická data Běžný reporting Pokročilé statistické modely Včera What
VíceKatedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group
Vytěžování dat Miroslav Čepek, Filip Železný Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group Evropský sociální fond Praha & EU: Investujeme
VíceObsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9
Obsah Úvod 9 Kapitola 1 Business Intelligence, datové sklady 11 Přechod od transakčních databází k analytickým..................... 13 Kvalita údajů pro analýzy................................................
VíceDolování asociačních pravidel
Dolování asociačních pravidel Miloš Trávníček UIFS FIT VUT v Brně Obsah přednášky 1. Proces získávání znalostí 2. Asociační pravidla 3. Dolování asociačních pravidel 4. Algoritmy pro dolování asociačních
VíceModerní systémy pro získávání znalostí z informací a dat
Moderní systémy pro získávání znalostí z informací a dat Jan Žižka IBA Institut biostatistiky a analýz PřF & LF, Masarykova universita Kamenice 126/3, 625 00 Brno Email: zizka@iba.muni.cz Bioinformatika:
VíceSegmentace bankovních zákazníků algoritmem k- means
Segmentace bankovních zákazníků algoritmem k- means LS 2014/2015 Michal Heřmanský xherm22 Obsah 1 Úvod... 3 1.1 CRISP- DM... 3 2 Porozumění problematice a datům... 4 3 Příprava dat... 5 4 Modelování...
VíceGRR. získávání znalostí v geografických datech Autoři. Knowledge Discovery Group Faculty of Informatics Masaryk Univerzity Brno, Czech Republic
GRR získávání znalostí v geografických datech Autoři Knowledge Discovery Group Faculty of Informatics Masaryk Univerzity Brno, Czech Republic GRR cílet 2 GRR - Popis systému - cíle systém pro dolování
VíceBA_EM Electronic Marketing. Pavel
BA_EM Electronic Marketing Pavel Kotyza @VŠFS Agenda Efektivní data mining jako zdroj relevantních dat o potřebách zákazníků Co je data mining? Je absolutní Je předem neznámý Je užitečný Co jsou data?
VíceInformační systémy 2006/2007
13 Vysoká škola báňská Technická univerzita Ostrava Fakulta strojní, Katedra automatizační techniky a řízení Informační systémy 2006/2007 Ivan Kedroň 1 Obsah Analytické nástroje SQL serveru. OLAP analýza
VíceVytěžování dat přednáška I
České vysoké učení technické v Praze Fakulta elektrotechnická Katedra kybernetiky Katedra počítačů Vytěžování dat přednáška I Úvod do vytěžování dat Filip Železný: zelezny@fel.cvut.cz Pavel Kordík: kordikp@fel.cvut.cz
VíceSurfujte v business analýze jako profík. Naučíme Vás podpořit klíčová rozhodnutí firmy.
Surfujte v business analýze jako profík Naučíme Vás podpořit klíčová rozhodnutí firmy. Intuice nestačí S čím Vám pomůžeme? Firmy čelí narůstající záplavě dat, posilují své analytické schopnosti a hledají
VíceAlgoritmy a struktury neuropočítačů ASN - P10. Aplikace UNS v biomedicíně
Aplikace UNS v biomedicíně aplikace v medicíně postup při zpracování úloh Aplikace UNS v medicíně Důvod: nalezení exaktnějších, levnějších a snadnějších metod určování diagnóz pro lékaře nalezení šetrnějších
VíceOkruhy ke státní závěrečné zkoušce z vedlejší specializace Informatika v řízení podniku
Okruhy ke státní závěrečné zkoušce z vedlejší specializace Informatika v řízení podniku Aplikace auditních postupů Vyberte si jeden typ auditu (útvaru, projektu, aplikace, procesu, ) a na něm demonstrujte
VíceUživatelská podpora v prostředí WWW
Uživatelská podpora v prostředí WWW Jiří Jelínek Katedra managementu informací Fakulta managementu Jindřichův Hradec Vysoká škola ekonomická Praha Úvod WWW obsáhlost obsahová i formátová pestrost dokumenty,
VíceVybrané partie použity s laskavým svolením Mgr. Martina Řezáče, Ph.D.
Vybrané partie použity s laskavým svolením Mgr. Martina Řezáče, Ph.D. M8DM1 Data mining I - informace Přednášky: metodologie data miningu Cvičení: použití metod v SASu Podmínky cvičení: Pravidelná aktivní
VíceARCHITEKTURA INFORMAČNÍCH SYSTÉMŮ PODLE ÚROVNĚ ŘÍZENÍ
ARCHITEKTURA INFORMAČNÍCH SYSTÉMŮ PODLE ÚROVNĚ ŘÍZENÍ Podle toho, zda informační systém funguje na operativní, taktické nebo strategické řídicí úrovni, můžeme systémy rozdělit do skupin. Tuto pyramidu
VíceStatistické metody v ekonomii. Ing. Michael Rost, Ph.D.
Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Cíle kurzu: seznámit posluchače s vybranými statistickými metodami, které jsou aplikovatelné v ekonomických
VíceProč studovat matematické programy na ÚMS PřF MU aneb co pak budu dělat
Proč studovat matematické programy na ÚMS PřF MU aneb co pak budu dělat Martin Řezáč 22.1.2011 Co budu po VŠ dělat? Co se dá dělat s matematikou??? Ukázka aktuálních pracovních nabídek: Analytik řízení
VíceDatová věda (Data Science) akademický navazující magisterský program
Datová věda () akademický navazující magisterský program Reaguje na potřebu, kterou vyvolala rychle rostoucí produkce komplexních, obvykle rozsáhlých dat ve vědě, v průmyslu a obecně v hospodářských činnostech.
VíceAnalýza dat pomocí systému Weka, Rapid miner a Enterprise miner
Vysoká škola ekonomická v Praze Analýza dat pomocí systému Weka, Rapid miner a Enterprise miner Dobývání znalostí z databází 4IZ450 XXXXXXXXXXX Přidělená data a jejich popis Data určená pro zpracování
VíceDolování z textu. Martin Vítek
Dolování z textu Martin Vítek Proč dolovat z textu Obrovské množství materiálu v nestrukturované textové podobě knihy časopisy vědeckéčlánky sborníky konferencí internetové diskuse Proč dolovat z textu
VíceÚvodní přednáška. Význam a historie PIS
Úvodní přednáška Význam a historie PIS Systémy na podporu rozhodování Manažerský informační systém Manažerské rozhodování Srovnávání, vyhodnocování, kontrola INFORMACE ROZHODOVÁNÍ organizace Rozhodovacích
VíceIng. Petr Kalčev, Ph.D.
Ing. Petr Kalčev, Ph.D. 17.10.2017 24.10.2017 31.10.2017 7.11.2017 14.11.2017 21.11.2017 28.11.2017 5.12.2017 12.12.2017 19.12.2017 Úvod do manažerský informačních systémů Typy informačních systémů Příklady
VíceÚvodem Dříve les než stromy 3 Operace s maticemi
Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová
VíceBusiness Intelligence
Business Intelligence Skorkovský KAMI, ESF MU Principy BI zpracování velkých objemů dat tak, aby výsledek této akce manažerům pomohl k rozhodování při řízení procesů výsledkem zpracování musí být relevantní
VíceZáklady business intelligence. Jaroslav Šmarda
Základy business intelligence Jaroslav Šmarda Základy business intelligence Business intelligence Datový sklad On-line Analytical Processing (OLAP) Kontingenční tabulky v MS Excelu jako příklad OLAP Dolování
Více3 zdroje dat. Relační databáze EIS OLAP
Zdroje dat 3 zdroje dat Relační databáze EIS OLAP Relační databáze plochá dvourozměrná tabulková data OLTP (Online Transaction Processing) operace selekce projekce spojení průnik, sjednocení, rozdíl dotazování
VíceA1 Marketingové minimum pro posílení výchovy k podnikavosti (8h)
A1 Marketingové minimum pro posílení výchovy k podnikavosti (8h) 2.1 Základy marketingové strategie (2,5h) Učitelé se seznámí se základní marketingovou terminologií a s možnými cestami rozvoje firmy. V
VíceAnalýza a vizualizace dat
Analýza a vizualizace dat Business intelligence Jednou z dalších oblastí, která spadá do sféry systémové integrace, je návrh a implementace řešení, spadajících do oblasti nazývané Business Intelligence
VíceSurfujte v business analýze jako profík. Naučíme Vás podpořit klíčová rozhodnutí firmy.
Surfujte v business analýze jako profík Naučíme Vás podpořit klíčová rozhodnutí firmy. Intuice nestačí. S čím Vám pomůžeme? Firmy čelí narůstající záplavě dat, posilují své analytické schopnosti a hledají
VíceÚvod do dobývání. znalostí z databází
POROZUMĚNÍ 4iz260 Úvod do DZD Úvod do dobývání DOMÉNOVÉ OBLASTI znalostí z databází VYUŽITÍ VÝSLEDKŮ POROZUMĚNÍ DATŮM DATA VYHODNO- CENÍ VÝSLEDKŮ MODELOVÁNÍ (ANALYTICKÉ PROCEDURY) PŘÍPRAVA DAT Ukázka slidů
VíceLekce 9 - Migrace dat
Lekce 9 - Migrace dat 1 Cíle lekce...1 2 Co je migrace dat?...1 3 Cíle migrace dat...1 4 Parametry migrace dat...1 5 Procesy migrace dat...2 6 Projekt migrace dat...3 7 Zařazení projektu migrace do projektu
VícePředzpracování dat. Lenka Vysloužilová
Předzpracování dat Lenka Vysloužilová 1 Metodika CRISP-DM (www.crisp-dm.org) Příprava dat Data Preparation příprava dat pro modelování selekce příznaků výběr relevantních příznaků čištění dat získávání
VíceANALÝZA A KLASIFIKACE DAT
ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc. INVESTICE Institut DO biostatistiky ROZVOJE VZDĚLÁVÁNÍ a analýz LITERATURA Holčík, J.: přednáškové prezentace Holčík, J.: Analýza a klasifikace signálů.
VíceANALÝZA NÁKUPNÍHO KOŠÍKU SEMINÁŘ
ANALÝZA NÁKUPNÍHO KOŠÍKU SEMINÁŘ 18.11.2012 Radim Tvardek, Petr Bulava, Daniel Mašek U&SLUNO a.s. I Sadová 28 I 702 00 Ostrava I Czech Republic PŘEDPOKLADY PRO ANALÝZU NÁKUPNÍHO KOŠÍKU 18.11.2012 Daniel
VícePŘÍLOHA C Požadavky na Dokumentaci
PŘÍLOHA C Požadavky na Dokumentaci Příloha C Požadavky na Dokumentaci Stránka 1 z 5 1. Obecné požadavky Dodavatel dokumentaci zpracuje a bude dokumentaci v celém rozsahu průběžně aktualizovat při každé
VíceInformace a znalosti v organizaci
Informace a znalosti v organizaci Vladimíra Zádová Postavení informací a znalostí z hlediska úspěšnosti firmy Vnitřní faktory Rámec 7S faktorů úspěchu firmy [ Mc Kinsey ] Struktura Strategie Systémy Spolupracovníci
VíceŘízení výkonnosti nemovitostního portfolia. Integrační platforma innosys. Květen 2014
Řízení výkonnosti nemovitostního portfolia Integrační platforma innosys Květen 2014 Technologické trendy 2014 Narušitelé zavedených postupů Kognitivní analýza Industrializace zdrojů mas Blízká setkávání
VíceDOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ PŘÍKLADY APLIKACÍ V KARDIOLOGICKÝCH DATECH Jan Rauch
DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ PŘÍKLADY APLIKACÍ V KARDIOLOGICKÝCH DATECH Jan Rauch Anotace: Příspěvek obsahuje základní informace o dobývání znalostí jakožto důležité disciplíně informatiky a ukazuje příklady
VíceINFORMAČNÍ SYSTÉMY (IS) Ing. Pavel Náplava Katedra počítačů K336, ČVUT FEL Praha 2004/2005
INFORMAČNÍ SYSTÉMY (IS) Ing. Pavel Náplava Katedra počítačů K336, ČVUT FEL Praha 2004/2005 AGENDA definice IS, zavedení pojmů možnosti a rozdělení typická struktura technologie nasazení praktická ukázka
VícePříprava dat v softwaru Statistica
Příprava dat v softwaru Statistica Software Statistica obsahuje pokročilé nástroje pro přípravu dat a tvorbu nových proměnných. Tyto funkcionality přinášejí značnou úsporu času při přípravě datového souboru,
VíceDobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze
Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Bayesovské modely Doc. RNDr. Iveta Mrázová, CSc.
VíceAnalytické procedury v systému LISp-Miner
Dobývání znalostí z databází MI-KDD ZS 2011 Přednáška 8 Analytické procedury v systému LISp-Miner Část II. (c) 2011 Ing. M. Šimůnek, Ph.D. KIZI, Fakulta informatiky a statistiky, VŠE Praha Evropský sociální
VíceSystémy pro podporu. rozhodování. 2. Úvod do problematiky systémů pro podporu. rozhodování
1 Systémy pro podporu rozhodování 2. Úvod do problematiky systémů pro podporu rozhodování 2 Připomenutí obsahu minulé přednášky Rozhodování a jeho počítačová podpora Manažeři a rozhodování K čemu počítačová
VíceUčící se klasifikátory obrazu v průmyslu
Učící se klasifikátory obrazu v průmyslu FCC průmyslové systémy s.r.o. FCC průmyslové systémy je technicko obchodní společností, působící v oblasti průmyslové automatizace. Tvoří ji dvě základní divize:
VíceObsah. Zpracoval:
Zpracoval: houzvjir@fel.cvut.cz 03. Modelem řízený vývoj. Doménový (business), konceptuální (analytický) a logický (návrhový) model. Vize projektu. (A7B36SIN) Obsah Modelem řízený vývoj... 2 Cíl MDD, proč
VíceVyužití metod strojového učení v bioinformatice David Hoksza
Využití metod strojového učení v bioinformatice David Hoksza SIRET Research Group Katedra softwarového inženýrství, Matematicko-fyzikální fakulta Karlova Univerzita v Praze Bioinformatika Biologické inspirace
VíceVysoká škola báňská Technická univerzita Ostrava METODY ANALÝZY DAT. Učební text. Jana Šarmanová
Vysoká škola báňská Technická univerzita Ostrava METODY ANALÝZY DAT Učební text Jana Šarmanová Ostrava 2012 Recenze: prof. RNDr. Alena Lukasová, CSc. Název: Metody analýzy dat Autor: Jana Šarmanová Vydání:
VíceIBM SPSS Decision Trees
IBM Software IBM SPSS Decision Trees Jednoduše identifikujte skupiny a predikujte Stromově uspořádané postupné štěpení dat na homogenní podmnožiny je technika vhodná pro exploraci vztahů i pro tvorbu rozhodovacích
VíceAnalytické metody v motorsportu
Analytické metody v motorsportu Bronislav Růžička Ústav konstruování Odbor konstruování strojů Fakulta strojního inženýrství Vysoké učení technické v Brně 26. června 2013, FSI VUT v Brně, Česká republika
VíceVYUŽITÍ DATA MININGOVÝCH METOD PŘI ZPRACOVÁNÍ DAT Z DEMOGRAFICKÝCH ŠETŘENÍ
UNIVERZITA KARLOVA V PRAZE Přírodovědecká fakulta Katedra demografie a geodemografie VYUŽITÍ DATA MININGOVÝCH METOD PŘI ZPRACOVÁNÍ DAT Z DEMOGRAFICKÝCH ŠETŘENÍ USING DATA MINING METHODS FOR DEMOGRAPHIC
VíceBig Data a oficiální statistika. Unicorn College Open 24. dubna 2015 Doc. Ing. Marie Bohatá, CSc.
Big Data a oficiální statistika Unicorn College Open 24. dubna 2015 Doc. Ing. Marie Bohatá, CSc. Obsah příspěvku Charakteristiky Big Data Výzvy a úskalí z perspektivy statistiky Výzvy z perspektivy computing
VíceAnalýza dat z porodnického modulu nemocničního informačního systému
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická Katedra kybernetiky Analýza dat z porodnického modulu nemocničního informačního systému Hospital information system Obstetrics-module data
VíceKritérium Orange Weka KEEL KNIME TANAGRA AlphaMiner RA, RS, RP, S, AP, DS, NS, BM, MNS, GA, + TXT, XLS, CSV, C45, ARF, + CSV, XLS, ARF, + BMP, PNG, +
4 Srovnání sad Následující kapitola shrnuje ohodnocení všech kritérií dle jednotlivých pohledů. Hodnocení vychází ze slovního popisu z předchozí kapitoly. První tři pohledy jsou pro přehlednost uspořádány
Více1. Data mining. Strojové učení. Základní úlohy.
1... Základní úlohy. Učení s učitelem a bez učitele. Petr Pošík Katedra kybernetiky ČVUT FEL P. Pošík c 2010 Aplikace umělé inteligence 1 / 36 Obsah P. Pošík c 2010 Aplikace umělé inteligence 2 / 36 Co
VíceKMI/ZZD Získávání znalostí z dat
KMI/ZZD Získávání znalostí z dat Úvod, motivace, modely KPD, úlohy DM Jan Konečný 17. února 2015 Rozvrh a sylabus http://phoenix.inf.upol.cz/~konecnyj/vyuka/zzd.html Rozvrh: Úterý: 8:00 10:15 (v tom je
VíceProjekční algoritmus. Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění. Jan Klíma
Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění Jan Klíma Obsah Motivace & cíle práce Evoluční algoritmy Náhradní modelování Stromové regresní metody Implementace a výsledky
VíceKvalita SW produktů. Jiří Sochor, Jaroslav Ráček 1
Kvalita SW produktů Jiří Sochor, Jaroslav Ráček 1 Klasický pohled na kvalitu SW Každý program dělá něco správně; nemusí však dělat to, co chceme, aby dělal. Kvalita: Dodržení explicitně stanovených funkčních
VíceManažerská ekonomika
PODNIKOVÝ MANAGEMENT (zkouška č. 12) Cíl předmětu Získat znalosti zákonitostí úspěšného řízení organizace a přehled o současné teorii a praxi managementu. Seznámit se s moderními manažerskými metodami
VíceRozhodovací procesy 3
Rozhodovací procesy 3 Informace a riziko Příprava předmětu byla podpořena projektem OPPA č. CZ.2.17/3.1.00/33253 III rozhodování 1 Rozhodovací procesy Cíl přednášky 1-3: Význam rozhodování Rozhodování
VíceObsah přednášky Jaká asi bude chyba modelu na nových datech?
Obsah přednášky Jaká asi bude chyba modelu na nových datech? Chyba modelu Bootstrap Cross Validation Vapnik-Chervonenkisova dimenze 2 Chyba skutečná a trénovací Máme 30 záznamů, rozhodli jsme se na jejich
VíceSystémy pro podporu rozhodování. Modelování a analýza
Systémy pro podporu rozhodování Modelování a analýza 1 Připomenutí obsahu minulé přednášky Datové sklady, přístup, analýza a vizualizace Povaha a zdroje dat (data, informace, znalosti a interní, externí,
Více2. Účel a cíl koncepce, zdroje dat
2. Účel a cíl koncepce, zdroje dat 2.1. Účel a cíl koncepce Koncepce vychází s principů a cílů Státního programu ochrany přírody a krajiny, který byl schválen usnesením vlády č.415 ze dne 17. června 1998.
VíceDATABÁZOVÉ SYSTÉMY. Metodický list č. 1
Metodický list č. 1 Cíl: Cílem předmětu je získat přehled o možnostech a principech databázového zpracování, získat v tomto směru znalosti potřebné pro informačního manažera. Databázové systémy, databázové
VíceObsah ČÁST I JAK SE UCHÁZET O ZÁKAZNÍKY NA WEBU KAPITOLA 1
Obsah O autorech 11 Poděkování 13 Předmluva 15 Úvod 17 Proč byste se měli přečíst tuto knihu 17 Co tato kniha obsahuje 18 Jak používat tuto knihu 19 Zpětná vazba od čtenářů 20 Errata 20 ČÁST I JAK SE UCHÁZET
VíceOkruhy ke státní závěrečné zkoušce z oboru Podniková informatika. platné pro studenty, kteří zahájili studium v ZS 2015/2016
Okruhy ke státní závěrečné zkoušce z oboru Podniková informatika platné pro studenty, kteří zahájili studium v ZS 2015/2016 Agilní metodiky Charakterizujte agilní metodiky, na jakých principech jsou založeny,
VíceIII. Informační systém & databáze
III. Informační systém & databáze IS základní terminologie IS konceptuální model informačního systému Vztah IS & databáze Systém řízení báze dat Databázové modely Záznam, pole, datové typy, atribut, instance,
VíceVysoká škola finanční a správní, o.p.s. Katedra řízení podniku a podnikové ekonomiky. Metodické listy pro předmět ŘÍZENÍ PODNIKU I
Vysoká škola finanční a správní, o.p.s. Katedra řízení podniku a podnikové ekonomiky Metodické listy pro předmět ŘÍZENÍ PODNIKU I Studium předmětu umožní studentům základní orientaci v moderních přístupech,
VíceHR reporting aneb kouzla s daty. 24.3.2015 Jan Pavelka
HR reporting aneb kouzla s daty 24.3.2015 Jan Pavelka HR snídaně vážně i s humorem 2 Agenda 1. Historie 2. Metody 3. Projekt 4. Nástroje 3 Hodnota pro business Analýza HR dat 4. Prediktivní analýza 2.
VíceVytěžování znalostí z dat
Pavel Kordík, Jan Motl (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2012, Přednáška 1 1/29 Vytěžování znalostí z dat Pavel Kordík, Jan Motl Department of Computer Systems Faculty of Information Technology
VíceMODERNÍ MARKETINGOVÝ VÝZKUM
KOZEL Roman MODERNÍ MARKETINGOVÝ VÝZKUM Obsah O hlavním autorovi... 9 Slovo úvodem...11 1. Marketingové prostředí...13 1.1 Charakteristika prostředí...14 1.2 Makroprostředí...16 1.2.1 Demografické prostředí...18
VíceDOLOVÁNÍ DAT Z DATABÁZÍ DATA MINING
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV AUTOMATIZACE A MĚŘICÍ TECHNIKY FACULTY OF ELECTRICAL ENGINEERING AND COMMUNICATION
VíceUniverzita Pardubice. Fakulta ekonomicko-správní
Univerzita Pardubice Fakulta ekonomicko-správní Model pro ohodnocení ojetého vozidla Bc. Ivo Brett Diplomová práce 2008 2 3 SOUHRN Diplomová práce se zabývá problematikou stanovení ceny ojetých vozidel.
VíceO autorech Úvodní slovo recenzenta Předmluva Redakční poznámka... 18
SMEJKAL Vladimír RAIS Karel ŘÍZENÍ RIZIK Obsah O autorech... 9 Úvodní slovo recenzenta... 13 Předmluva... 15 Redakční poznámka... 18 1. Zobrazení života podniku... 19 1.1 Jaké jsou příčiny neúspěchu v
VícePrůvodní dokument k rozpadu činností správa a rozvoj v DRG 2013
Průvodní dokument k rozpadu činností správa a rozvoj v DRG 2013 Správa a rozvoj DRG detailní rozpis plánovaných aktivit v DRG 2013 Národní referenční centrum Autor: Ing. Pavel Kožený, Ph.D., Ing. Eva Švecová,
VíceK možnostem krátkodobé předpovědi úrovně znečištění ovzduší statistickými metodami. Josef Keder
K možnostem krátkodobé předpovědi úrovně znečištění ovzduší statistickými metodami Josef Keder Motivace Předpověď budoucí úrovně znečištění ovzduší s předstihem v řádu alespoň několika hodin má význam
Vícev praxi Rizika a přínosy zavádění BI jako nástroje pro řízení podnikání
Podpora rozhodování v praxi Rizika a přínosy zavádění BI jako nástroje pro řízení podnikání HanušRais Business DevelopmentManager SAS Institute ČR s.r.o. Agenda Úvod - Profil SAS Institute Pojem Business
VíceRole BI v e-business řešeních pohled do budoucnosti
Ing. Ota Novotný, Ph.D. katedra informačních technologií Vysoká škola ekonomická v Praze novotnyo@vse.cz katedra informačních technologií VŠE Praha jsme uznávanou autoritou v oblasti aplikované informatiky
VíceP1: Informace o projektu MMR, rámec, význam a stav plánování obcí
Elektronická metodická podpora tvorby rozvojových dokumentů obcí (CZ 1.04/4.1.00/62.00008) Část III.b: Postupná realizace vzdělávacích aktivit projektu v řešených územích Dvoudenní vzdělávací kurz TVORBA
VíceNávrh datového skladu z hlediska zdrojů
Návrh datového skladu Návrh datového skladu OLTP ETL OLAP, DM Operativní data Datové sklady Zdroje dat Transformace zdroj - cíl Etapy realizace 1 Návrh datového skladu Hlavní úskalí analýzy a návrhu spočívá
VíceDoplňování chybějících hodnot v kategoriálních datech 2.00
Doplňování chybějících hodnot v kategoriálních datech 2.00 1. Cíle programu Účelem programu je umožnit uživateli doplnění chybějících hodnot v kategoriálních datech. Pro doplnění chybějících hodnot je
VíceAsociační i jiná. Pravidla. (Ch )
Asociační i jiná Pravidla (Ch. 14 +...) Učení bez učitele Nemáme cílovou třídu Y, G; máme N pozorování což jsou p-dimenzionální vektory se sdruženou pravděpodobností chceme odvozovat vlastnosti. Pro málo
VíceSystémový rozvoj a podpora nástrojů sociálně-právní ochrany dětí
Systémový rozvoj a podpora nástrojů sociálně-právní ochrany dětí 01.06.2017 Kdo jsme Odbor ochrany práv dětí (koncepční oddělení) Náhradní rodinná péče Projektové oddělení transformace služeb pro ohrožené
VíceStatSoft Úvod do data miningu
StatSoft Úvod do data miningu Tento článek je úvodním povídáním o data miningu, jeho vzniku, účelu a využití. Historie data miningu Rozvoj počítačů, výpočetní techniky a zavedení elektronického sběru dat
Více