Vybrané partie použity s laskavým svolením Mgr. Martina Řezáče, Ph.D.

Rozměr: px
Začít zobrazení ze stránky:

Download "Vybrané partie použity s laskavým svolením Mgr. Martina Řezáče, Ph.D."

Transkript

1 Vybrané partie použity s laskavým svolením Mgr. Martina Řezáče, Ph.D.

2 M8DM1 Data mining I - informace Přednášky: metodologie data miningu Cvičení: použití metod v SASu Podmínky cvičení: Pravidelná aktivní účast na cvičeních Úspěšné zvládnutí testu na počítači Pokud nesplníte danou podmínku, bude vám odebrán 1 bod u zkoušky! Zkouška: Obhájení projektu Otázky z přednesené teorie Konzultační hodiny: podle ( ové) dohody

3 M8DM1 Data mining I plán přednášek Úvod do data miningu Organizace dat, databázové systémy Příprava, čištění a předzpracování dat Metody redukce dimenze Exploratorní analýza, vizualizace dat Kontingenční tabulky, korespondenční analýza Asociační analýza (analýza nákupního košíku) Shluková analýza Lineární regrese (odlehlá pozorování, multikolinearita) Logistická regrese, credit scoring Rozhodovací stromy

4 M8DM1 Data mining I literatura Paolo Giudici: Applied Data Mining - Statistical Methods for Business and Industry (2003). David Hand, Heikki Mannila and Padhraic Smyth: Principles of Data Mining (2001). Matthew North: Data Mining for the Masses (2012). Jiawei Han and Micheline Kamber: Data Mining Concepts and Techniques (2006). Petr Berka: Dobývání znalostí z databází (2003). Pavel Petr: Data mining (2006).

5 M9DM2 Data mining II vyučován jednou za 2 roky (podzim 2016) pokračování DM1 s důrazem na praktické použití metod vybrané přednášky a cvičení vedené odborníky z praxe: 1 Air Bank 2 Home Credit 3 Knoyd 4 a další prohloubení znalostí z kurzu Data mining I: 1 SQL 2 Credit scoring 3 Text mining 4 Pokročilá příprava dat 5 Social Network Analysis

6 Certifikát Data mining in SAS Studenti vysokých škol zapojených do akademického programu SAS mají možnost získat certifikát prokazující získané znalosti softwaru SAS. Certifikáty uděluje společně Masarykova univerzita a SAS Institute ČR. Seznam držitelů uveden na internetu; možnost zapojení do praxe. Podmínky: úspěšné absolvování předmětu M8DM1 absolvování 3 e-learningových kurzů na stránkách SASu

7 Úvod do data miningu definice, historie, aplikace Software pro DM Seznámení se SASem 7

8 Ukázka aktuálních pracovních nabídek 8

9 Ukázka aktuálních pracovních nabídek 9

10 Ukázka aktuálních pracovních nabídek 10

11 Co je to Data mining? Data mining (DM), nebo také dolování z dat či vytěžování dat, je analytická metodologie získávání netriviálních skrytých a potenciálně užitečných informací z dat. [wikipedia] 11

12 Další definice DM proces výběru, prohledávání a modelování ve velkých objemech dat sloužící k odhalení dříve neznámých vztahů mezi daty za účelem získání obchodní výhody. proces vyhledávání skrytých závislostí a upozorňování na odlišnosti. DM znamená mnoho různých postupů a algoritmů, které umožní odhalit a plně využít vztahy ukryté v datech. Díky výkonným analytickým metodám objevíte důležité informace, které se stanou Vaší konkurenční výhodou. proces, který používá různé analytické nástroje pro odhalení ukrytých vzorů a závislostí v datech. Výsledkem je predikční model, který je podkladem pro rozhodování. proces objevování znalostí, pomocí získávání dříve neznámých akčních informací z velmi rozsáhlých databází. netriviální proces zjišťování platných, neznámých, potenciálně užitečných a snadno pochopitelných závislostí v datech. 12

13 Dobývání znalostí z databází (KDD, Knowledge Discovery in Databases) Se zaměřuje na celý proces získávání znalostí z dat: kde a jak jsou data ukládána a skladována jaké algoritmy použít pro velká data jaká je jejich efektivita interpretace a vizualizace výsledků automatizace [Fayyad et al., 1996] 13

14 Technologický proces KDD 1. Selekce: Příprava z dat, uložených v datovém skladu či tabulkách informačního systému, vede k vytvoření jedné tabulky, která obsahuje relevantní údaje o sledovaných objektech. 2. Předzpracování: Dochází k odstranění odlehlých hodnot, vyčištění datových chyb a výpočtu odvozených hodnot. Tato část procesu dobývání znalostí z databází může být vysoce výpočetně náročná. 3. Transformace: Dochází k diskretizaci spojitých veličin, například pro metody pracující s entropií jednotlivých atributů. 4. Data mining: Zde se používají vybrané analytické metody pro nalezení souvislostí v datech. Jedná se o výpočetně a paměťově nejnáročnější část celého procesu. Během procesu se využívají metody různých druhů v závislosti na předchozích výsledcích analytických metod. 5. Interpretace: Zpracovává velké množství výsledků jednotlivých metod. Některé výsledky lze přímo interpretovat, jiné se musí upravit do podoby srozumitelné pro uživatele. 14

15 Technologický proces KDD 15

16 Technologický proces KDD Increasing potential to support business decisions Making Decisions End User Data Presentation Visualization Techniques Data Mining Information Discovery Business Analyst Data Analyst Data Exploration Statistical Analysis, Querying and Reporting Data Warehouses / Data Marts OLAP, MDA Data Sources Paper, Files, Information Providers, Database Systems, OLTP DBA 16

17 Data mining vs. KDD KDD proces objevování užitečných informací z dat (od přípravy dat až po tvorbu výstupů a reportů). Data mining jeden krok tohoto procesu. Někdy se pod pojmem data mining myslí celý proces KDD. A tak ho také budeme chápat my. 17

18 Jsou všechny informace zajímavé? lehce pochopitelné platné i na nových datech potenciálně užitečné nové, dosud neznámé potvrzující nějakou naši domněnku Umí DM odhalit všechny užitečné informace? Umí DM odhalit jen ty užitečné informace? 18

19 Jsou všechny informace zajímavé? 19

20 Jsou všechny informace zajímavé? 20

21 Jsou všechny informace zajímavé? 21

22 Typické aplikace DM Analýza úvěrového rizika - výběr a ověřování kandidátů žádajících o úvěr; tvorba prediktivního modelu, založeného na známém chování stávajících klientů. Segmentace zákazníků- rozčlenění zákazníků do menších homogenních skupin dle segmentačních kritérií. Analýzou vzniklých údajů vznikne několik shluků s podobnými potřebami a charakteristikami (stejné postoje, podobná věková hranice apod.). Analýza odchodu zákazníků (churn management) - prediktivní model získaný analýzou dat o zákaznících lze použít pro plánování akcí, jenž mohou zabránit odchodu stávajících, nejrizikovějších, zákazníků. 22

23 Typické aplikace DM Detekce podvodů (fraud detection) - pomocí prediktivního modelování lze odhalit podezřelé chování či platební styk. Analýza produktů (market basket analysis) - přímá aplikace analýzy asociací - umožňuje definovat komplementární produkty pro dané segmenty zákazníků. Analýza chování zákazníků - predikce např. vývoje poptávky na základě historických dat. 23

24 Další aplikace DM Medicína: efektivita léčebné péče Analýza pacientovy historie (předchozí nemoci a jejich průběh): nalezení vztahu mezi nemocemi. Farmacie: identifikace nových léků Vědecká analýza dat: Identifikace nových galaxií. Design webových stránek: Nalezení vztahu návštěvníka stránek a příslušná změna podoby stránek. 24

25 Další aplikace DM Rozpoznávání psaného textu, řeči, obrázků. Sociální sítě Mapování, měření a monitorování vztahů a informačních toků mezi jednotlivci, skupinami, počítači, Průmysl Automatické přenastavení ovládacích prvků při změně parametrů procesu. Sport NBA-optimalizace herní strategie Další 25

26 Příklad - segmentace zákazníků obchodu s elektronikou Chceme oslovit své zákazníky s novou nabídkou. Jsou opravdu všichni zákazníci z jednoho těsta? Máme skutečně všem posílat stejnou nabídku? Cíl: identifikovat skupiny zákazníků, kteří mají podobné chování a posílat jim reklamu na míru prostřednictvím jednoho z následujících komunikačních kanálů: Papírový direkt mail Telemarketing Elektronický direkt mail SMS 26

27 Příklad - segmentace zákazníků obchodu s elektronikou 27

28 Příklad - Analýza nákupního košíku Cíl: identifikovat zboží, které je nakupováno souběžně dostatečným množstvím zákazníků. Účel: rozmístění zboží v regálech, tvorba letáků a akčních nabídek, doporučované produkty. Výsledek: Jestliže zákazník nakupuje dětské pleny a mléko, pak si velmi pravděpodobně koupí i pivo. 28

29 Příklad - Analýza nákupního košíku Jedna z možných interpretací: Správné interpretace výsledků analýz je schopen jen zkušený analytik. 29

30 Historie data miningu 1960 s: Data Fishing, Data Dredging (bagrování): rozvoj počítačové techniky, spíše akademické záležitosti 1970 s s: rozvoj statistických metod, databázových aplikací a umělé inteligence, rychlý růst rychlosti a paměti počítačů zpočátku terčem kritiky statistiků: analyzování dat bez nějaké apriorní hypotézy; hledání korelací ve velkých datech 1990 s: metody, umožňující vyhnout se nebezpečí falešných korelací (například kontrola založená na vynechaných datech, MCMC). Navíc zejména v USA rostla poptávka ze strany komerčních organizací (velké objemy dat, neschopnost z nich pomocí klasických metod získat potřebné podklady pro rozhodování). 30

31 Historie názvu DM 1980 s: Database Mining ochranná známka firmy HNC 1989 Knowledge Discovery (KD, KDD) užíváno komunitou zabývající se umělou inteligencí a strojovým učením 1990 Data Mining užíváno v komerční sféře a databázové komunitě Další názvy: Data Archaeology, Information Harvesting, Information Discovery, Knowledge Extraction, Predictive Analytics(2007), Data Science (2011),.. 31

32 Proč data mining? Proč dnes? Data jsou produkována. Data jsou skladována. Výpočetní síla je dostupná. Výpočetní síla je cenově dostupná. Konkurenční tlak je velice silný. Komerční produkty (DM software) jsou k dispozici. 32

33 Data mining nutnost? 33

34 Data mining nutnost? Terabytes -- 10^12 bytes: data obchodních řetězců, bank, Petabytes -- 10^15 bytes: geografická data Exabytes -- 10^18 bytes: národní databáze zdravotních záznamů Zettabytes -- 10^21 bytes: databáze meteo-snímků Zottabytes -- 10^24 bytes: video-databáze 34

35 Data mining nutnost? 35

36 Data mining vs. Statistická analýza Data Mining Původně vyvinuto pro expertní systémy automaticky řešící zadané problémy. Neklade takový důraz na přesné porozumění použité metody. Pokud něco dává smysl, pak to použijme! Žádné předpoklady o datech. Funguje i pro velmi rozsáhlá data. Vyžaduje porozumění problému z datovému a business pohledu. Statistická analýza Testuje se statistická korektnost modelu. Jsou statistické předpoklady modelu splněny? Testování hypotéz. Intervalové odhady. Pracuje se s výběrem hodnot. Standardní metody nejsou optimalizovány pro rozsáhlá data. Vyžaduje pokročilé statistické znalosti. 36

37 Vztah s ostatními disciplínami Databázové technologie Statistika Strojové učení Data Mining Vizualizace Informační technologie Ostatní vědní disciplíny 37

38 Data miningové metodologie 1. 5A (SPSS) - Assess, Access, Analyze, Act, Automate 2. SEMMA (SAS) - Sample, Explore, Modify, Model, Assess 3. CRISP-DM (Statistica) -CRoss Industry Standard Process for Data Mining 4. SixSigma - Define, Measure, Analyze, Improve, Control 38

39 SEMMA (Sample, Explore, Modify, Model, Assess) Sample - identifikovat vhodná učící data, určit odpovídající rozsah dat, a to jak z pohledu časového okna tak i z pohledu počtu případů. Dále se doporučuje rozdělit data na 3 skupiny: Trénovací využívá se pro vývoj modelu. Validační využívá se pro vyhodnocení modelu a pro prevenci proti přeučení (overfitting) modelu. Testovací využívá se pro finální vyhodnocení modelu. Zajímá nás především, jak dobře se model chová na datech disjunktních s daty, na kterých byl model vyvinut. Explore - připravit popisné statistiky, které poskytnou základní představu o obsahu a kvalitě podkladových dat. Pomocí vizualizačních technik odhalit skryté trendy a závislosti v datech. Modify - na základě předchozího kroku konsolidovat data a odvodit nové proměnné. Následně transformovat data do tvaru vhodného pro modelování. Model - vytvořit příslušný model. Assess - vyhodnotit úspěšnost modelu a případně implementovat model do praxe. 39

40 CRISP-DM (CRoss Industry Standard Process for Data Mining) 1. pochopení obchodních souvislostí 2. pochopení dat 3. příprava dat 4. modelování 5. vyhodnocení modelu 6. nasazení modelu do obchodního procesu 40

41 Fáze CRISP-DM procesu (1 & 2) Porozumění obchodu (Business Understanding): Stanovení business cílů. Stanovení data miningových cílů. Stanovení kriterií úspěchu. Porozumění datům (Data Understanding): Průzkum dat a ověření jejich kvality. Nalezení odlehlých hodnot. 41

42 Fáze CRISP-DM procesu (3) Příprava dat (Data preparation): Obvykle zabírá přes 90% celkového času. Sběr dat Konsolidace a čištění Vazební tabulky, agregace, chybějící hodnoty, Selekce Ignorování neužitečných dat? Odlehlá pozorování? Výběr dat? Vizualizační nástroje. Transformace vytváření nových odvozených proměnných 42

43 Fáze CRISP-DM procesu (4) Modelování (Model building) Výběr vhodných modelovacích technik závisí na stanovených data miningových cílech (deskriptivní vs. prediktivní modelování). Modelování je většinou iterační proces propojený s přípravou dat. Rozdílný přístup pro supervised a unsupervised learning. 43

44 Supervised a unsupervised learning Supervised learning: Supervize: Data (pozorování, měření, atp.) jsou označena předem definovanými/známými třídami. Nová/testovací data jsou následně rozřazena do těchto tříd. Z pohledu kauzality daný model definuje vztah mezi vstupními daty a daty výstupními. Unsupervised learning: Předem nejsou definované žádné třídy. Pro daná data je cílem prokázat existenci nějakých tříd. Z pohledu kauzality jsou všechna data chápána jako výstupní. Modelujeme závislost daných dat na jakýchsi neznámých skrytých proměnných. 44

45 Základní přístupy k modelování Deskriptivní: jde o matematický model popisující historické události a předpokládané nebo reálné vazby mezi nimi. Shluková analýza Asociační pravidla Korelační analýza Faktorová analýza, analýza hlavních komponent Prediktivní: jde o matematický model předpovídající (s určitou přesností) budoucí hodnotu/chování nějaké veličiny (entity). Regrese Klasifikační a regresní stromy Analýza časových řad 45

46 Deskriptivní modelování Základním cílem je získání ucelených a snadno srozumitelných informací z dostupných dat. Někdy součástí průzkumové (explorační) analýzy, předcházející prediktivnímu modelování, někdy je vytvoření deskriptivního modelu hlavním cílem DM projektu. 46

47 Shluková analýza V datech chceme nalézt skupiny (shluky) pozorování, které jsou si v jistém smyslu podobné Např. máme nalézt skupiny stávajících zákazníků na základě platební historie tak, aby podobní klienti byli ve stejné skupině. 47

48 Prediktivní modelování - klasifikace Příklad: Na základě známých údajů o starých zákaznících a jejich platební morálce máme predikovat platební způsobilost nového žadatele o úvěr. Předchozí zákazníci Věk Příjem Zaměstnání Bydliště Typ zákazníka Klasifikátor Rozhodovací pravidlo Příjem > x Zaměst. = y Data nového žadatele Dobrý/ špatný 48

49 Klasifikační metody Cíl: na základě historických dat vytvořit rozhodovací pravidlo, které budoucí pozorování zařadí do určité třídy. Lineární regrese Zobecněné lineární modely (GLM) např. logistická regrese Metody nejbližšího souseda (KNN) Rozhodovací stromy Diskriminační analýza (LDA, ) Neuronové sítě Support vector machines (SVM) Bayesovské modely 49

50 Fáze CRISP-DM Procesu (5) Vyhodnocení modelu (Model Evaluation): Evaluace modelu: jak se chová na testovacích datech. Metody a kritéria závisí na typu modelu: Např. koincidenční matice pro klasifikační modely, průměrná chyba pro regresní modely, Interpretace modelu: důležitost a obtížnost interpretace značně závisí na zvolené modelovacím algoritmu. 50

51 Fáze CRISP-DM Procesu (6) Nasazení do praxe (Deployment) Je třeba určit, jak mají být výsledky využity. Kdo je bude využívat? Jak často budou využívány? Nasazení data miningových výsledků pomocí: Skórování databáze. Využití výsledků pomocí obchodních pravidel. Interaktivní on-line scoring. 51

52 Potenciální nebezpečí DM Zneužití osobních údajů Spam Trestná činnost Zneužití v genetice Sledování a špehování 52

53 Data miningový software - komerční Angoss KnowledgeSTUDIO Clarabridge HP Vertica Analytics Platform IBM SPSS Modeler KXEN Modeler Grapheme LIONsolver Microsoft Analysis Services NetOwl Oracle Data Mining SAS Enterprise Miner STATISTICA Data Miner Qlucore 53

54 Data miningový software - free Carrot2: Text and search results clustering framework. Chemicalize.org: A chemical structure miner and web search engine. ELKI: A university research project with advanced cluster analysis and outlier detection methods written in the Java language. GATE: a natural language processing and language engineering tool. KNIME: The Konstanz Information Miner, a user friendly and comprehensive data analytics framework. Massive Online Analysis (MOA): a real-time big data stream mining with concept drift tool in the Java programming language. NLTK (Natural Language Toolkit): A suite of libraries and programs for symbolic and statistical natural language processing (NLP) for the Python language. OpenNN: Open neural networks library. Orange: A component-based data mining and machine learning software suite written in the Python language. R: A programming language and software environment for statistical computing, data mining, and graphics. It is part of the GNU Project. RapidMiner: An environment for machine learning and data mining experiments. Tanagra: A visualisation-oriented data mining software, also for teaching. Torch: An open source deep learning library for the Lua programming language and scientific computing framework with wide support for machine learning algorithms. Weka: A suite of machine learning software applications written in the Java programming language. 54

55 Software -SPSS : 55

56 SPSS IBM SPSS Modeler 13 (dříve Clementine) 56

57 SPSS - zákazníci Citibank Europe Česká spořitelna Prvá stavebná sporiteľna Raiffeisen stavební spořitelna Česká školní inspekce Český statistický úřad Český telekomunikační úřad Česká televize Český rozhlas Slovenská televízia VW Slovakia Škoda auto Seznam RWE Česká rep. Plzeňský prazdroj ČEZ Economia Karlovarské minerální vody 57

58 Software -Statistica 58

59 Statistica - zákazníci Allianz pojišťovna Czech Credit Bureau Česká exportní banka Česká kancelář pojistitelů Česká spořitelna Komerční banka Pojišťovna Kooperativa Pojišťovna VZP Prima banka Slovensko Raiffeisenbank ArcelorMittal Coca-Cola HBC ČR ČEPS Česká distribuční ČESKÁ RAFINÉRSKÁ Fischer Bohemia CHANCE Jaderná elektrárna Dukovany OLYMPUS C & S PEPSICO CZ RWE Interní služby Řízení letového provozu ČR Slovnaft ŠKODA AUTO 59

60 Software - SAS : 60

61 SAS (Statistical Analysis System) Vznik v univerzitním prostředí (North Carolina State University) Původně aplikace v zemědělství, zvýšení výnosu plodin První verze SAS 71, pak nedostatek financí 1976 vznik společnosti SAS Institute, Inc. Dnes: největší soukromá softwarová společnost na světě (více než zaměstnanců) Přes zákazníků 61

62 SAS - zákazníci

63 SAS - stručné seznámení 2 základní SAS rozhraní: SAS windowing environment SAS Enterprise Guide (GUI) 63

64 SAS - stručné seznámení SAS Output SAS Explorer window Program editor window Output tab Log tab Editor tab 64

65 SAS EG - stručné seznámení Pomocí klikání a přetahování myší je budován procesní tok. Process Flow Task List SAS Output 65

66 SAS Statistická analýza: Popisná statistika Analýza kontingenčních (frekvenčních) tabulek Regresní, korelační, kovarianční analýza Logistická regrese Analýza rozptylu Testování hypotéz Diskriminační analýza Shluková analýza Analýza přežití 66

67 SAS Analýza časových řad: Regresní modely Modely se sezónními faktory Autoregresní modely ARIMA Metody exponenciálního vyrovnání 67

68 SAS - stručné seznámení Interaktivní moduly nebo programovací prostředí SAS Enterprise Miner SAS Time Series Studio SAS Forecast Studio SAS IML Studio SAS Data Quality Server SAS OLAP Server SAS Text Miner 68

69 SAS podpora studentů Online tutoriály Vzorová data a příklady Licence pro studenty Zadání a vedení diplomových prací Soutěž o nejlepší studentskou práci s využitím SASu SAS Student Ambassador Program SAS Student Network 69

Získávání dat z databází 1 DMINA 2010

Získávání dat z databází 1 DMINA 2010 Získávání dat z databází 1 DMINA 2010 Získávání dat z databází Motto Kde je moudrost? Ztracena ve znalostech. Kde jsou znalosti? Ztraceny v informacích. Kde jsou informace? Ztraceny v datech. Kde jsou

Více

DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ

DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ Úvod a oblasti aplikací Martin Plchút plchut@e-globals.net DEFINICE A POJMY Netriviální extrakce implicitních, ch, dříve d neznámých a potenciáln lně užitečných informací z

Více

Dobývání znalostí z databází

Dobývání znalostí z databází Dobývání znalostí z databází (Knowledge Discovery in Databases, Data Mining,..., Knowledge Destilery,...) Non-trivial process of identifying valid, novel, potentially useful and ultimately understandable

Více

Získávání znalostí z dat

Získávání znalostí z dat Získávání znalostí z dat Informační a komunikační technologie ve zdravotnictví Získávání znalostí z dat Definice: proces netriviálního získávání implicitní, dříve neznámé a potencionálně užitečné informace

Více

Proč studovat matematické programy na ÚMS PřF MU aneb co pak budu dělat

Proč studovat matematické programy na ÚMS PřF MU aneb co pak budu dělat Proč studovat matematické programy na ÚMS PřF MU aneb co pak budu dělat Martin Řezáč 22.1.2011 Co budu po VŠ dělat? Co se dá dělat s matematikou??? Ukázka aktuálních pracovních nabídek: Analytik řízení

Více

Obsah. Seznam obrázků. Seznam tabulek. Petr Berka, 2011

Obsah. Seznam obrázků. Seznam tabulek. Petr Berka, 2011 Petr Berka, 2011 Obsah... 1... 1 1 Obsah 1... 1 Dobývání znalostí z databází 1 Dobývání znalostí z databází O dobývání znalostí z databází (Knowledge Discovery in Databases, KDD) se začíná ve vědeckých

Více

Profitabilita klienta v kontextu Performance management

Profitabilita klienta v kontextu Performance management IBM Technical specialist team Pre Sale 26/10/2010 Profitabilita klienta v kontextu Performance management Co všechno řadíme do PM? Automatická data Běžný reporting Pokročilé statistické modely Včera What

Více

Data Science projekty v telekomunikační společnosti

Data Science projekty v telekomunikační společnosti Data Science projekty v telekomunikační společnosti Jan Romportl Chief Data Scientist, O2 Czech Republic Data, mapa a teritorium Data Science Mezioborová technicky orientovaná oblast, která se zabývá inovativním

Více

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ Metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných

Více

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9 Obsah Úvod 9 Kapitola 1 Business Intelligence, datové sklady 11 Přechod od transakčních databází k analytickým..................... 13 Kvalita údajů pro analýzy................................................

Více

METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1

METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1 METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1 DOLOVÁNÍ V DATECH (DATA MINING) OBJEVUJE SE JIŽ OD 60. LET 20. ST. S ROZVOJEM POČÍTAČOVÉ TECHNIKY DEFINICE PROCES VÝBĚRU, PROHLEDÁVÁNÍ A MODELOVÁNÍ

Více

GRR. získávání znalostí v geografických datech Autoři. Knowledge Discovery Group Faculty of Informatics Masaryk Univerzity Brno, Czech Republic

GRR. získávání znalostí v geografických datech Autoři. Knowledge Discovery Group Faculty of Informatics Masaryk Univerzity Brno, Czech Republic GRR získávání znalostí v geografických datech Autoři Knowledge Discovery Group Faculty of Informatics Masaryk Univerzity Brno, Czech Republic GRR cílet 2 GRR - Popis systému - cíle systém pro dolování

Více

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence APLIKACE UMĚLÉ INTELIGENCE Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence Aplikace umělé inteligence - seminář ING. PETR HÁJEK, PH.D. ÚSTAV SYSTÉMOVÉHO INŽENÝRSTVÍ A INFORMATIKY

Více

MODERNÍ METODY SEGMENTACE ZÁKAZNÍKŮ Ing. Miloš Uldrich ZÁKAZNICKÁ LOAJALITA A AKVIZICE VE FINANČNÍCH SLUŽBÁCH. StatSoft CR

MODERNÍ METODY SEGMENTACE ZÁKAZNÍKŮ Ing. Miloš Uldrich ZÁKAZNICKÁ LOAJALITA A AKVIZICE VE FINANČNÍCH SLUŽBÁCH. StatSoft CR Váš pomocník pro analýzu dat MODERNÍ METODY SEGMENTACE ZÁKAZNÍKŮ Ing. Miloš Uldrich StatSoft CR StatSoft StatSoft CR Dodavatel komplexních analytických řešení Výhradní dodavatel softwaru STATISTICA pro

Více

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ metodický list č. 1 Dobývání znalostí z databází Cílem tohoto tematického celku je vysvětlení základních pojmů z oblasti dobývání znalostí z databází i východisek dobývání znalostí z databází inspirovaných

Více

Moderní systémy pro získávání znalostí z informací a dat

Moderní systémy pro získávání znalostí z informací a dat Moderní systémy pro získávání znalostí z informací a dat Jan Žižka IBA Institut biostatistiky a analýz PřF & LF, Masarykova universita Kamenice 126/3, 625 00 Brno Email: zizka@iba.muni.cz Bioinformatika:

Více

Dobývání a vizualizace znalostí

Dobývání a vizualizace znalostí Dobývání a vizualizace znalostí Olga Štěpánková et al. 1 Osnova předmětu 1. Dobývání znalostí - popis a metodika procesu a objasnění základních pojmů 2. Nástroje pro modelování klasifikovaných dat a jejich

Více

Získávání znalostí z databází. Alois Kužela

Získávání znalostí z databází. Alois Kužela Získávání znalostí z databází Alois Kužela Obsah související pojmy datové sklady, získávání znalostí asocianí pravidla 2/37 Úvod získávání znalostí z dat, dolování (z) dat, data mining proces netriviálního

Více

BA_EM Electronic Marketing. Pavel

BA_EM Electronic Marketing. Pavel BA_EM Electronic Marketing Pavel Kotyza @VŠFS Agenda Efektivní data mining jako zdroj relevantních dat o potřebách zákazníků Co je data mining? Je absolutní Je předem neznámý Je užitečný Co jsou data?

Více

Datová věda (Data Science) akademický navazující magisterský program

Datová věda (Data Science) akademický navazující magisterský program Datová věda () akademický navazující magisterský program Reaguje na potřebu, kterou vyvolala rychle rostoucí produkce komplexních, obvykle rozsáhlých dat ve vědě, v průmyslu a obecně v hospodářských činnostech.

Více

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

Strojové učení Marta Vomlelová

Strojové učení Marta Vomlelová Strojové učení Marta Vomlelová marta@ktiml.mff.cuni.cz KTIML, S303 Literatura 1.T. Hastie, R. Tishirani, and J. Friedman. The Elements of Statistical Learning, Data Mining, Inference and Prediction. Springer

Více

Dobývání a vizualizace znalostí. Olga Štěpánková et al.

Dobývání a vizualizace znalostí. Olga Štěpánková et al. Dobývání a vizualizace znalostí Olga Štěpánková et al. 1 Osnova předmětu Dobývání znalostí - popis a metodika procesu CRISP a objasnění základních pojmů Nástroje pro modelování klasifikovaných dat a jejich

Více

IBM SPSS Modeler Professional

IBM SPSS Modeler Professional IBM SPSS Modeler Professional 16 IBM SPSS Software IBM SPSS Modeler Professional Včasné rozhodnutí díky přesným informacím Metodami data miningu získáte detailní přehled o svém současném stavu i jasnější

Více

Dobývání a vizualizace znalostí

Dobývání a vizualizace znalostí Dobývání a vizualizace znalostí Olga Štěpánková et al. 1 Osnova předmětu 1. Dobývání znalostí - popis a metodika procesu a objasnění základních pojmů 2. Nástroje pro modelování klasifikovaných dat a jejich

Více

BIG DATA. Nové úlohy pro nástroje v oblasti BI. 27. listopadu 2012

BIG DATA. Nové úlohy pro nástroje v oblasti BI. 27. listopadu 2012 BIG DATA Nové úlohy pro nástroje v oblasti BI 27. listopadu 2012 AGENDA 1. Úvod 2. Jaké jsou potřeby? 3. Možné řešení 2 Jaké jsou potřeby? Dopady Analýza dat potřeba nového přístupu Jak na nestrukturovaná

Více

Dobývání a vizualizace znalostí

Dobývání a vizualizace znalostí Dobývání a vizualizace znalostí Olga Štěpánková, Lenka Vysloužilová, et al. https://cw.fel.cvut.cz/wiki/courses/a6m33dvz/start 1 Osnova přednášky Úvod: data, objem, reprezentace a základní terminologie

Více

Využití metod strojového učení v bioinformatice David Hoksza

Využití metod strojového učení v bioinformatice David Hoksza Využití metod strojového učení v bioinformatice David Hoksza SIRET Research Group Katedra softwarového inženýrství, Matematicko-fyzikální fakulta Karlova Univerzita v Praze Bioinformatika Biologické inspirace

Více

Vytěžování znalostí z dat

Vytěžování znalostí z dat Pavel Kordík, Jan Motl (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2012, Přednáška 1 1/29 Vytěžování znalostí z dat Pavel Kordík, Jan Motl Department of Computer Systems Faculty of Information Technology

Více

Big Data a oficiální statistika. Unicorn College Open 24. dubna 2015 Doc. Ing. Marie Bohatá, CSc.

Big Data a oficiální statistika. Unicorn College Open 24. dubna 2015 Doc. Ing. Marie Bohatá, CSc. Big Data a oficiální statistika Unicorn College Open 24. dubna 2015 Doc. Ing. Marie Bohatá, CSc. Obsah příspěvku Charakteristiky Big Data Výzvy a úskalí z perspektivy statistiky Výzvy z perspektivy computing

Více

Základy business intelligence. Jaroslav Šmarda

Základy business intelligence. Jaroslav Šmarda Základy business intelligence Jaroslav Šmarda Základy business intelligence Business intelligence Datový sklad On-line Analytical Processing (OLAP) Kontingenční tabulky v MS Excelu jako příklad OLAP Dolování

Více

Cíle supervizovaného učení Ondřej Háva

Cíle supervizovaného učení Ondřej Háva Cíle supervizovaného učení Ondřej Háva ACREA CR Využíváme více než 40 let zkušeností IBM s hlavním cílem: řízení rozhodovacích procesů Akvizice SPSS společností IBM v říjnu 2009 Přejmenování SPSS CR na

Více

Obohacení dat o statistické výsledky a potenciál jejich využití 2.2.2011

Obohacení dat o statistické výsledky a potenciál jejich využití 2.2.2011 Obohacení dat o statistické výsledky a potenciál jejich využití 2.2.2011 Společnost SPSS CR nyní výhradní partner IBM pro prodej software IBM SPSS v ČR a SR od roku 1998 franchise SPSS Inc. SPSS Inc. vývoj

Více

IBM SPSS Modeler. Hlavní přínosy. Intuitivní ovládání IBM

IBM SPSS Modeler. Hlavní přínosy. Intuitivní ovládání IBM IBM SPSS Software IBM SPSS Modeler Objevte vzory v historických datech, které budou sloužit k predikci budoucích událostí, dělejte lepší rozhodnutí a dosáhněte lepších výsledků. IBM SPSS Modeler je komlpexní

Více

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group Vytěžování dat Miroslav Čepek, Filip Železný Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group Evropský sociální fond Praha & EU: Investujeme

Více

Pokročilé neparametrické metody. Klára Kubošová

Pokročilé neparametrické metody. Klára Kubošová Pokročilé neparametrické metody Klára Kubošová Pokročilé neparametrické metody Výuka 13 přednášek doplněných o praktické cvičení v SW Úvod do neparametrických metod + princip rozhodovacích stromů Klasifikační

Více

Moderní metody automatizace a hodnocení marketingových kampaní

Moderní metody automatizace a hodnocení marketingových kampaní Moderní metody automatizace a hodnocení marketingových kampaní SAS CI Roadshow 2014 24/09/2014 Vít Stinka Agenda Představení společnosti Unicorn Systems Aliance Unicorn Systems a SAS Celkový koncept Customer

Více

STRUČNÝ PRŮVODCE ANALYTICKÝM PROCESEM

STRUČNÝ PRŮVODCE ANALYTICKÝM PROCESEM SPOLEČNOST ACREA Váš dlouholetý partner v oblasti analýzy dat - od dodání softwaru, přes řešení analytických úkolů, až po výuku statistických a dataminingových metod. STRUČNÝ PRŮVODCE ANALYTICKÝM PROCESEM

Více

Infor Performance management. Jakub Urbášek

Infor Performance management. Jakub Urbášek Infor Performance management Jakub Urbášek Agenda prezentace Stručně o produktu Infor PM 10 Komponenty Infor PM - PM OLAP a PM Office Plus Reporting Analýza Plánování / operativní plánování Infor Performance

Více

Zaměření Webové inženýrství doc. Ing. Tomáš Vitvar, Ph.D. Katedra softwarového inženýrství Fakulta informačních technologií České vysovké učení technické v Praze Den otevřených dveří 20.2.2014 http://www.fit.cvut.cz

Více

Informační systémy 2006/2007

Informační systémy 2006/2007 13 Vysoká škola báňská Technická univerzita Ostrava Fakulta strojní, Katedra automatizační techniky a řízení Informační systémy 2006/2007 Ivan Kedroň 1 Obsah Analytické nástroje SQL serveru. OLAP analýza

Více

Dolování asociačních pravidel

Dolování asociačních pravidel Dolování asociačních pravidel Miloš Trávníček UIFS FIT VUT v Brně Obsah přednášky 1. Proces získávání znalostí 2. Asociační pravidla 3. Dolování asociačních pravidel 4. Algoritmy pro dolování asociačních

Více

Předzpracování dat. Lenka Vysloužilová

Předzpracování dat. Lenka Vysloužilová Předzpracování dat Lenka Vysloužilová 1 Metodika CRISP-DM (www.crisp-dm.org) Příprava dat Data Preparation příprava dat pro modelování selekce příznaků výběr relevantních příznaků čištění dat získávání

Více

Vytěžování dat přednáška I

Vytěžování dat přednáška I České vysoké učení technické v Praze Fakulta elektrotechnická Katedra kybernetiky Katedra počítačů Vytěžování dat přednáška I Úvod do vytěžování dat Filip Železný: zelezny@fel.cvut.cz Pavel Kordík: kordikp@fel.cvut.cz

Více

Inovační vouchery s Univerzitou Hradec Králové. doc. Ing. Mgr. Petra Marešová, Ph.D. Ing. Richard Cimler

Inovační vouchery s Univerzitou Hradec Králové. doc. Ing. Mgr. Petra Marešová, Ph.D. Ing. Richard Cimler Inovační vouchery s Univerzitou Hradec Králové doc. Ing. Mgr. Petra Marešová, Ph.D. Ing. Richard Cimler Úvod Hlavní směry výzkumu: = Informační technologie = Bioinformatika = Ekonomika a management = Vzdělávání

Více

Segmentace bankovních zákazníků algoritmem k- means

Segmentace bankovních zákazníků algoritmem k- means Segmentace bankovních zákazníků algoritmem k- means LS 2014/2015 Michal Heřmanský xherm22 Obsah 1 Úvod... 3 1.1 CRISP- DM... 3 2 Porozumění problematice a datům... 4 3 Příprava dat... 5 4 Modelování...

Více

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D. Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Cíle kurzu: seznámit posluchače s vybranými statistickými metodami, které jsou aplikovatelné v ekonomických

Více

Analytika a SAP Quo Vadis? Jiří Přibyslavský Performance Management & Business Intelligence Business Consultant

Analytika a SAP Quo Vadis? Jiří Přibyslavský Performance Management & Business Intelligence Business Consultant Analytika a SAP Quo Vadis? Jiří Přibyslavský Performance Management & Business Intelligence Business Consultant Informační potřeby dříve Manuální zpracování dat v Excelu nám už nevyhovuje Potřebuji analýzu

Více

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Úvod do problematiky Doc. RNDr. Iveta Mrázová,

Více

IBM SPSS Decision Trees

IBM SPSS Decision Trees IBM Software IBM SPSS Decision Trees Jednoduše identifikujte skupiny a predikujte Stromově uspořádané postupné štěpení dat na homogenní podmnožiny je technika vhodná pro exploraci vztahů i pro tvorbu rozhodovacích

Více

Akademický Program SAS

Akademický Program SAS Akademický Program SAS Jana Honnerová, SAS Institute ČR Společnost SAS Institute Vznik 1976 v univerzitním prostředí Dnes: největší soukromá softwarová společnost na světě více než 11.000 zaměstnanců přes

Více

Schvalovací proces žádostí o úvěr

Schvalovací proces žádostí o úvěr Schvalovací proces žádostí o úvěr Milan Roupec Embedit (Home Credit International) Martin Řezáč ÚMS PřF MU K čemu schvalovací proces? Posouzení žádosti o úvěr Odhalení pokusů o podvod Falešné údaje na

Více

IBM SPSS Modeler Premium

IBM SPSS Modeler Premium IBM SPSS Modeler Premium 16 IBM SPSS Software IBM SPSS Modeler Premium Modelování strukturovaných a nestrukturovaných dat, identifikace entit a analýza sociálních sítí IBM SPSS Modeler Premium je software

Více

Stále větší množství dat uložených v databázích Neustále generujeme data Obchodní a bankovní transakce

Stále větší množství dat uložených v databázích Neustále generujeme data Obchodní a bankovní transakce Stále větší mžství dat uložených v databázích Neustále generujeme data Obchodní a bankovní transakce Biologická, astromická data atd Ukládáme stále více dat Úvod do problematiky Databázové techlogie jsou

Více

Text Mining: SAS Enterprise Miner versus Teragram. Petr Berka, Tomáš Kliegr VŠE Praha

Text Mining: SAS Enterprise Miner versus Teragram. Petr Berka, Tomáš Kliegr VŠE Praha Text Mining: SAS Enterprise Miner versus Teragram Petr Berka, Tomáš Kliegr VŠE Praha Text mining vs. data mining Text mining = data mining na nestrukturovaných textových dokumentech otázka vhodné reprezentace

Více

StatSoft Úvod do data miningu

StatSoft Úvod do data miningu StatSoft Úvod do data miningu Tento článek je úvodním povídáním o data miningu, jeho vzniku, účelu a využití. Historie data miningu Rozvoj počítačů, výpočetní techniky a zavedení elektronického sběru dat

Více

Obsah ČÁST I JAK SE UCHÁZET O ZÁKAZNÍKY NA WEBU KAPITOLA 1

Obsah ČÁST I JAK SE UCHÁZET O ZÁKAZNÍKY NA WEBU KAPITOLA 1 Obsah O autorech 11 Poděkování 13 Předmluva 15 Úvod 17 Proč byste se měli přečíst tuto knihu 17 Co tato kniha obsahuje 18 Jak používat tuto knihu 19 Zpětná vazba od čtenářů 20 Errata 20 ČÁST I JAK SE UCHÁZET

Více

BIG DATA je oveľa viac ako Hadoop. Martin Pavlík

BIG DATA je oveľa viac ako Hadoop. Martin Pavlík BIG DATA je oveľa viac ako Hadoop Martin Pavlík Analýza všech dostupných dat? Big data =? = Buzzword? = Hadoop? Hadoop Jen ke zpracování nestrukturovaných dat? Mentální posun něco za něco 2 Big data =

Více

Analýza a vizualizace dat

Analýza a vizualizace dat Analýza a vizualizace dat Business intelligence Jednou z dalších oblastí, která spadá do sféry systémové integrace, je návrh a implementace řešení, spadajících do oblasti nazývané Business Intelligence

Více

České Budějovice. 2. dubna 2014

České Budějovice. 2. dubna 2014 České Budějovice 2. dubna 2014 1 IBM regionální zástupci - Jihočeský kraj Michal Duba phone: +420 737 264 058 e-mail: michal_duba@cz.ibm.com Zdeněk Barlok phone: +420 731 435 534 e-mail: zdenek_barlok@cz.ibm.com

Více

Surfujte v business analýze jako profík. Naučíme Vás podpořit klíčová rozhodnutí firmy.

Surfujte v business analýze jako profík. Naučíme Vás podpořit klíčová rozhodnutí firmy. Surfujte v business analýze jako profík Naučíme Vás podpořit klíčová rozhodnutí firmy. Intuice nestačí S čím Vám pomůžeme? Firmy čelí narůstající záplavě dat, posilují své analytické schopnosti a hledají

Více

Dolování z textu. Martin Vítek

Dolování z textu. Martin Vítek Dolování z textu Martin Vítek Proč dolovat z textu Obrovské množství materiálu v nestrukturované textové podobě knihy časopisy vědeckéčlánky sborníky konferencí internetové diskuse Proč dolovat z textu

Více

Některé potíže s klasifikačními modely v praxi. Nikola Kaspříková KMAT FIS VŠE v Praze

Některé potíže s klasifikačními modely v praxi. Nikola Kaspříková KMAT FIS VŠE v Praze Některé potíže s klasifikačními modely v praxi Nikola Kaspříková KMAT FIS VŠE v Praze Literatura J. M. Chambers: Greater or Lesser Statistics: A Choice for Future Research. Statistics and Computation 3,

Více

1. Data mining. Strojové učení. Základní úlohy.

1. Data mining. Strojové učení. Základní úlohy. 1... Základní úlohy. Učení s učitelem a bez učitele. Petr Pošík Katedra kybernetiky ČVUT FEL P. Pošík c 2010 Aplikace umělé inteligence 1 / 36 Obsah P. Pošík c 2010 Aplikace umělé inteligence 2 / 36 Co

Více

HR reporting aneb kouzla s daty. 24.3.2015 Jan Pavelka

HR reporting aneb kouzla s daty. 24.3.2015 Jan Pavelka HR reporting aneb kouzla s daty 24.3.2015 Jan Pavelka HR snídaně vážně i s humorem 2 Agenda 1. Historie 2. Metody 3. Projekt 4. Nástroje 3 Hodnota pro business Analýza HR dat 4. Prediktivní analýza 2.

Více

Obsah Úvod 11 Jak být úspěšný Základy IT

Obsah Úvod 11 Jak být úspěšný Základy IT Obsah Úvod 11 Jak být úspěšný 13 Krok 0: Než začneme 13 Krok 1: Vybrat si dobře placenou oblast 14 Krok 2: Vytvořit si plán osobního rozvoje 15 Krok 3: Naplnit osobní rozvoj 16 Krok 4: Osvojit si důležité

Více

Konvergovaná bezpečnost v infrastrukturních systémech

Konvergovaná bezpečnost v infrastrukturních systémech Konvergovaná bezpečnost v infrastrukturních systémech Martin Click to Bajer edit Master subtitle style Click to edit Master 28.11.2018 subtitle style 1 HROZBY AKTIVA Postupná změna aktiv a bezpečnostních

Více

ANALÝZA NÁKUPNÍHO KOŠÍKU SEMINÁŘ

ANALÝZA NÁKUPNÍHO KOŠÍKU SEMINÁŘ ANALÝZA NÁKUPNÍHO KOŠÍKU SEMINÁŘ 18.11.2012 Radim Tvardek, Petr Bulava, Daniel Mašek U&SLUNO a.s. I Sadová 28 I 702 00 Ostrava I Czech Republic PŘEDPOKLADY PRO ANALÝZU NÁKUPNÍHO KOŠÍKU 18.11.2012 Daniel

Více

STATISTICKÉ PROGRAMY

STATISTICKÉ PROGRAMY Slezská univerzita v Opavě Obchodně podnikatelská fakulta v Karviné STATISTICKÉ PROGRAMY VYUŽITÍ EXCELU A SPSS PRO VĚDECKO-VÝZKUMNOU ČINNOST Elena Mielcová, Radmila Stoklasová a Jaroslav Ramík Karviná

Více

ANALÝZA A KLASIFIKACE DAT

ANALÝZA A KLASIFIKACE DAT ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc. INVESTICE Institut DO biostatistiky ROZVOJE VZDĚLÁVÁNÍ a analýz LITERATURA Holčík, J.: přednáškové prezentace Holčík, J.: Analýza a klasifikace signálů.

Více

Proces vývoje HRIS Vema (Human Resources Information System) Jaroslav Šmarda

Proces vývoje HRIS Vema (Human Resources Information System) Jaroslav Šmarda Proces vývoje HRIS Vema (Human Resources Information System) Jaroslav Šmarda Proces vývoje HRIS Vema Vlastnosti HRIS (Human Resources Information System) HRIS Vema Proces vývoje HRIS Vema Vema, a. s. Přední

Více

powerful SAP-Solutions

powerful SAP-Solutions We deliver powerful SAP-Solutions to the World! Praktický průvodce novými SAP technologiemi Září 2015 Martin Chmelař itelligence, a.s. Milníky: 2002: založení společnosti 2008: společnost členem itelligence

Více

IBM SPSS Exact Tests. Přesné analýzy malých datových souborů. Nejdůležitější. IBM SPSS Statistics

IBM SPSS Exact Tests. Přesné analýzy malých datových souborů. Nejdůležitější. IBM SPSS Statistics IBM Software IBM SPSS Exact Tests Přesné analýzy malých datových souborů Při rozhodování o existenci vztahu mezi proměnnými v kontingenčních tabulkách a při používání neparametrických ů analytici zpravidla

Více

Tovek Tools. Tovek Tools jsou standardně dodávány ve dvou variantách: Tovek Tools Search Pack Tovek Tools Analyst Pack. Připojené informační zdroje

Tovek Tools. Tovek Tools jsou standardně dodávány ve dvou variantách: Tovek Tools Search Pack Tovek Tools Analyst Pack. Připojené informační zdroje jsou souborem klientských desktopových aplikací určených k indexování dat, vyhledávání informací, tvorbě různých typů analýz a vytváření přehledů a rešerší. Jsou vhodné pro práci s velkým objemem textových

Více

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů) Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů) Autor: Vladimir Vapnik Vapnik, V. The Nature of Statistical Learning Theory.

Více

Přednáška 13 Redukce dimenzionality

Přednáška 13 Redukce dimenzionality Vytěžování Dat Přednáška 13 Redukce dimenzionality Miroslav Čepek Fakulta Elektrotechnická, ČVUT Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti ČVUT (FEL) Redukce dimenzionality 1 /

Více

PRODUKTY. Tovek Tools

PRODUKTY. Tovek Tools jsou desktopovou aplikací určenou k vyhledávání informací, tvorbě různých typů analýz a vytváření přehledů a rešerší. Jsou vhodné pro práci i s velkým objemem textových dat z různorodých informačních zdrojů.

Více

Nová dimenze rozhodovacího procesu

Nová dimenze rozhodovacího procesu Nová dimenze rozhodovacího procesu Marek Matoušek Pavel Mašek Data, nebo INFORMACE Využití dostupných firemních dat Několik systémů, mnoho různých dat Různé divize, různé potřeby Potřeba integrace dat

Více

Asociační i jiná. Pravidla. (Ch )

Asociační i jiná. Pravidla. (Ch ) Asociační i jiná Pravidla (Ch. 14 +...) Učení bez učitele Nemáme cílovou třídu Y, G; máme N pozorování což jsou p-dimenzionální vektory se sdruženou pravděpodobností chceme odvozovat vlastnosti. Pro málo

Více

Management informačních systémů. Název Information systems management Způsob ukončení * přednášek týdně

Management informačních systémů. Název Information systems management Způsob ukončení * přednášek týdně Identifikační karta modulu v. 4 Kód modulu Typ modulu profilující Jazyk výuky čeština v jazyce výuky Management informačních systémů česky Management informačních systémů anglicky Information systems management

Více

ADMINISTRACE POČÍTAČOVÝCH SÍTÍ. OPC Server

ADMINISTRACE POČÍTAČOVÝCH SÍTÍ. OPC Server ADMINISTRACE POČÍTAČOVÝCH SÍTÍ OPC Server Funkce a využití v průmyslové automatizaci Jiří NOSEK 2011 Co je OPC Server? OPC = Open Process Control (původně OLE for Process Control) sada specifikací průmyslového

Více

Surfujte v business analýze jako profík. Naučíme Vás podpořit klíčová rozhodnutí firmy.

Surfujte v business analýze jako profík. Naučíme Vás podpořit klíčová rozhodnutí firmy. Surfujte v business analýze jako profík Naučíme Vás podpořit klíčová rozhodnutí firmy. Intuice nestačí. S čím Vám pomůžeme? Firmy čelí narůstající záplavě dat, posilují své analytické schopnosti a hledají

Více

Úvod do informačních a řídicích systémů. lení

Úvod do informačních a řídicích systémů. lení Úvod do informačních a řídicích systémů Základní pojmy a rozdělen lení Informace Pojem vysoce abstraktní Skutečné informace musí být pravdivé, včasné, jednoznačné a relevantní (atributy informace) Základní

Více

Geoinformatika. I Geoinformatika a historie GIS

Geoinformatika. I Geoinformatika a historie GIS I a historie GIS jaro 2014 Petr Kubíček kubicek@geogr.muni.cz Laboratory on Geoinformatics and Cartography (LGC) Institute of Geography Masaryk University Czech Republic Motivace Proč chodit na přednášky?

Více

Dobývání znalostí z webu web mining

Dobývání znalostí z webu web mining Dobývání znalostí z webu web mining Web Mining is is the application of data mining techniques to discover patterns from the Web (Wikipedia) Tři oblasti: Web content mining (web jako kolekce dokumentů)

Více

PowerOPTI Řízení účinnosti tepelného cyklu

PowerOPTI Řízení účinnosti tepelného cyklu PowerOPTI Řízení účinnosti tepelného cyklu VIZE Zvýšit konkurenceschopnost provozovatelů elektráren a tepláren. Základní funkce: Spolehlivé hodnocení a řízení účinnosti tepelného cyklu, včasná diagnostika

Více

SAP a SUSE - dokonalá symbióza s open source. Martin Zikmund Technical Account Manager

SAP a SUSE - dokonalá symbióza s open source. Martin Zikmund Technical Account Manager SAP a SUSE - dokonalá symbióza s open source Martin Zikmund Technical Account Manager martin.zikmund@suse.com O mně 5 let na pozici Presale v SAP Zodpovědný za různá řešení: Mobilní platformy UX (SAP Fiori,

Více

Information and Data Management. RNDr. Ondřej Zýka

Information and Data Management. RNDr. Ondřej Zýka Information and Data Management RNDr. Ondřej Zýka 1 Informační a datový management Disciplína zaměřená na správu informací (z mnoha zdrojů) a spřístupnění informací různým typům uživatelů podle jejich

Více

KOMPETENČNÍ CENTRUM COLLABORATION SOLUTIONS

KOMPETENČNÍ CENTRUM COLLABORATION SOLUTIONS KOMPETENČNÍ CENTRUM COLLABORATION SOLUTIONS Představení členů a činnosti za rok 2012 Kdo jsme? Kompetenční centrum Collaboration Solutions vzniklo v červnu 2012 na Fakultě informatiky a statistiky Vysoké

Více

1. Dobývání znalostí z databází

1. Dobývání znalostí z databází 1. Dobývání znalostí z databází O dobývání znalostí z databází (Knowledge Discovery in Databases, KDD) se začíná ve vědeckých kruzích mluvit počátkem 90. let. První impuls přišel z Ameriky, kde se na konferencích

Více

Jak využít data o zákaznících ke zvýšení příjmů z prodeje

Jak využít data o zákaznících ke zvýšení příjmů z prodeje Jak využít data o zákaznících ke zvýšení příjmů z prodeje Michal Kadlec Marek Loukotka Lubomíra Červová www.acrea.cz info@acrea.cz Program Dívejte se na budoucnost, ne jen na minulost 1 Jaká data využíváme?

Více

Uznávání předmětů ze zahraničních studijních pobytů

Uznávání předmětů ze zahraničních studijních pobytů Uznávání předmětů ze zahraničních studijních pobytů Podnikání a administrativa 7 Mezinárodní obchod Ekonometrie Obecná ekonomie III 8 Velkoobchod a maloobchod Management 9 Marketingové řízení Strategický

Více

Data science pro Business. Jak řídit svého Nerda

Data science pro Business. Jak řídit svého Nerda Data science pro Business Jak řídit svého Nerda Příklad studie Amazon - podíl na Ecommerce trhu Příklad studie % tržeb USA Amazonu: vybrané kategorie Příklad studie Podívejme se na boty Příklad studie

Více

Obsah. Co je to Field-Map? Field-Map software Popis technologie Field-Map Zdroje

Obsah. Co je to Field-Map? Field-Map software Popis technologie Field-Map Zdroje Michal Zigo, ZIG012 Obsah Co je to Field-Map? Field-Map software Zdroje Co je to Field-Map? Field-Map je technologie, která vzniká spojením jedinečného software s vhodným hardwarem, takže umožňuje terénní

Více

Mgr. Jan Folbrecht Senior softwarový inženýr, softwarový architekt, manažer

Mgr. Jan Folbrecht Senior softwarový inženýr, softwarový architekt, manažer Mgr. Jan Folbrecht Senior softwarový inženýr, softwarový architekt, manažer SPECIALIZACE Konzultace a školení v oblastech softwarového inženýrství Zavádění vývojových metodik do projektů a vývojových týmů

Více

Neuronové časové řady (ANN-TS)

Neuronové časové řady (ANN-TS) Neuronové časové řady (ANN-TS) Menu: QCExpert Prediktivní metody Neuronové časové řady Tento modul (Artificial Neural Network Time Series ANN-TS) využívá modelovacího potenciálu neuronové sítě k predikci

Více

Mark tingový výzkum. Téma. Marketingový výzkum. Realizace. Tomek - Vávrová Katedra ekonomiky, manažerství a humanitních věd FEL-ČVUT Y16MVY

Mark tingový výzkum. Téma. Marketingový výzkum. Realizace. Tomek - Vávrová Katedra ekonomiky, manažerství a humanitních věd FEL-ČVUT Y16MVY Marketingový výzkum Realizace Tomek - Vávrová YMVY Proces marketingového výzkumu Návrh projektu výzkumu Stanovení zdrojů a způsobu získávání informací Sběr informací Vyhodnocení výzkumu a interpretace

Více

CASE. Jaroslav Žáček

CASE. Jaroslav Žáček CASE Jaroslav Žáček jaroslav.zacek@osu.cz http://www1.osu.cz/~zacek/ Co znamená CASE? Definice dle SEI A CASE tool is a computer-based product aimed at supporting one or more software engineering activities

Více

Analýzou dat k efektivnějšímu rozhodování

Analýzou dat k efektivnějšímu rozhodování Analýzou dat k efektivnějšímu rozhodování Chytrá řešení pro veřejnou správu Václav Bahník, ECM Solution Consultant Marek Šoule, ECM Software Sales Representative 8.4.2013 Řízení efektivního poskytování

Více

Role BI v e-business řešeních pohled do budoucnosti

Role BI v e-business řešeních pohled do budoucnosti Ing. Ota Novotný, Ph.D. katedra informačních technologií Vysoká škola ekonomická v Praze novotnyo@vse.cz katedra informačních technologií VŠE Praha jsme uznávanou autoritou v oblasti aplikované informatiky

Více