Business Intelligence. Adam Trčka

Podobné dokumenty
Podnikové informační systémy Jan Smolík

DATABÁZOVÉ SYSTÉMY. Vladimíra Zádová, KIN, EF TUL - DBS

Datový sklad. Datový sklad

Jak velká jsou? Obchodní analytici FB velké datové sady BI = business intelligence. OLAP = Online Analytical Processing. DWH = Data Warehouse

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

Dobývání znalostí z databází. Databáze. datum jmeno prijmeni adresa_ulice adresa_mesto cislo_uctu platba zustatek

Databázové systémy. 10. přednáška

QAD Business Intelligence

Multidimenzionální pohled na zdravotnické prostředí. INMED Petr Tůma


Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

BI v rámci IS/ICT komponenty BI architektura. Charakteristika dat a procesů v IS/ICT. Datové sklady ukládání dat návrh datového skladu

Základy business intelligence. Jaroslav Šmarda

Využití moderní self-service BI technologie v praxi

PostgreSQL jako platforma pro datové sklady

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

Marketingová komunikace. 3. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK3PH (vm3bph)

Databázové systémy I. 1. přednáška

Nová dimenze rozhodovacího procesu

Obsah Úvod 11 Jak být úspěšný Základy IT

Zdroje informací v organizaci IS/ICT BI v rámci IS/ICT historie architektura OLTP x DW ukládání dat

T T. Think Together Martin Závodný THINK TOGETHER. Business Intelligence systémy Business Intelligence systems

Datové sklady. Ing. Jan Přichystal, Ph.D. 1. listopadu PEF MZLU v Brně

Infor Performance management. Jakub Urbášek

10. Datové sklady (Data Warehouses) Datový sklad

Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph)

kapitola 2 Datové sklady, OLAP

Analýza a modelování dat. Přednáška 9

PV005 Služby počítačových sítí: Data Warehouses

Business Intelligence

Návrh ROLAP databáze v zemědělském podniku: Transformace ekonometrického modelu do konceptuálního modelu dat

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Výuka integrovaných IS firem a institucí na vysokých školách (zkušenosti, nové příležitosti, omezení)

Analýza a modelování dat. Přednáška 8

Data v informačních systémech

Institut biostatistiky a analýz MU. Zkušenosti s vyhodnocováním telemedicínských technologií

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9

GIS jako důležitá součást BI. Jan Broulík, Petr Panec ARCDATA PRAHA, s.r.o.

Obsah. Úvod do problematiky. Datový sklad. Proces ETL. Analýza OLAP

Přehled systému Microsoft SQL Server. Komu je kniha určena Struktura knihy Nejvhodnější výchozí bod pro čtení knihy Konvence a struktura knihy

Kvalita dat v datovém skladu nezbytný předpoklad reportingu

Analýza a modelování dat 5. přednáška. Helena Palovská

Bu B sin i e n s e s s I n I te t l e lig i en e c n e c Skorkovský KA K M A I, E S E F MU

NÁVRH APLIKACE BUSINESS INTELLIGENCE PRO SPOLEČNOST BREX S. R. O.

Pattern Datový sklad. RNDr. Ondřej Zýka

Profitabilita klienta v kontextu Performance management

Performance Management What if?

4IT218 Databáze. 4IT218 Databáze

Business Intelligence a datové sklady

Data Warehouses. Jaroslav Bayer 1. Fakulta informatiky Masarykova univerzita

KIV/SI. Přednáška č.8. Jan Valdman, Ph.D.

CPM/BI a jeho návaznost na podnikové informační systémy. Martin Závodný

2013 IBM Corporation

Základní informace o co se jedná a k čemu to slouží

Moderní metody automatizace a hodnocení marketingových kampaní

NÁSTROJE BUSINESS INTELLIGENCE

On line analytical processing (OLAP) databáze v praxi

Aplikace moderních informaèních technologií v øízení firmy Nástroje ke zvyšování kvality informaèních systémù

Modelování a návrh datových skladů

Mgr. Jan Folbrecht Senior softwarový inženýr, softwarový architekt, manažer

Business Intelligence - principy, efekty, předpoklady. OKsystem, 26/11/2009

Databázové systémy trocha teorie

Dátové sklady Prehľad

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

FINANČNÍ KONSOLIDACE TEORIE A PRAKTICKÁ REALIZACE PROSTŘEDNICTVÍM INFORMAČNÍCH SYSTÉMŮ

Ondřej Bothe, Richard Dobiš

3 zdroje dat. Relační databáze EIS OLAP

Manažerský reporting a finanční plánování Targetty

Pilotní projekt implementace Business Intelligence ve studijní agendě VŠE v Praze

1.1. Správa a provozní podpora APV ROS, HW ROS a základního SW

Možnosti analýzy podnikových dat

Nasazení CA Role & Compliance Manager

Integrace dat. RNDr. Ondřej Zýka

Trendy v IS/ICT přístupy k návrhu multidimenzionální modelování

Aplikace pro podporou manažerského rozhodování

Řešení IS/IT - produkty a služby. ERP systém

Vysoká škola ekonomická v Praze

Analýza a vizualizace dat

Snadný a efektivní přístup k informacím

ŘÍZENÍ OBCHODU (N_ROb)

RELAČNÍ DATABÁZOVÉ SYSTÉMY

Data Cube. Luboš Kulič Tomáš Kuthan

KIS A JEJICH BEZPEČNOST-I

Ing. Petr Kalčev, Ph.D.

Reportingová platforma v České spořitelně

Ing. Roman Danel, Ph.D. 2010

Architektury Informačních systémů. Jaroslav Žáček

KIV/SI. Rozílová témata. Jan Valdman, Ph.D.

Advanced SQL Modeling in RDBMS - SQL Spreadsheet part1. Your Organization (Line #1)

Nabízíme řešení. v oblastech: integrací zdrojů dat:

Nabídka manažerských simulátorů z EF JU

TVORBA DATABÁZOVÉ APLIKACE A ŘEŠENÍ PRO BUSINESS INTELLIGENCE

TM1 vs Planning & Reporting

Architektury Informačních systémů. Jaroslav Žáček

ÚVOD DO DATABÁZÍ. Metodické listy pro předmět

Databáze Bc. Veronika Tomsová

Datové sklady ve školství

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA PODNIKATELSKÁ ÚSTAV INFORMATIKY

Řízení správy rolí v rozsáhlých organizacích. Michal Opatřil Corinex Group

Získávání znalostí z dat

Transkript:

Business Intelligence Adam Trčka

09:00 11:30: BI v kostce Navrhněme si sklad Ukázka BI Datamining 12:30 14:30: Pokračování kurzu 14:30 15:00: Q&A Agenda

Co se dnes dovíme? Data informace znalost Business intelligence overview Proces BI Základy modelování Dolování dat

DATA INFORMACE - ZNALOSTI

Data Popis nebo vyjádření skutečnosti Zachycený obraz světa okolo nás Zachycení: Nominální, Ordinální, Kardinální,

DBMS/ SŘBD Database management systém (systém řízení báze dat) Nástroje (sw) pro ukládání a správu dat Používají se relační vazby Typický zástupci: MSSQL / Oracle DB MySQL, MS Access,

Uložení dat v DBMS Zákazník Jméno Sídlo 1 Microsoft Redmond 2 Apple Cupertino 3 Facebook SFO Objednávka Popis Zákazník 1 Konzultace 1 2 Školení 1 3 Školení 3

Uložení dat v DBMS #2 Zákazník Jméno Sídlo 1 Microsoft Redmond 2 Apple Cupertino 3 Facebook SFO ID Typ služby 1 Konzultace 2 Školení Objednávka Popis Zákazník 1 1 1 2 2 1 3 2 3

Informace Data, kterým byl dán význam Informace je to co si bereme z dat

Znalost Organizovaná (utříděná) informace určená k řešení problémů a rozhodování Vazba na konkrétního jednotlivce

Data informace - znalosti Význam Znalost Smysl Informace Data

Moudrost Schopnost aplikace znalostí v širším kontextu Abstrakce a generalizace znalostí Širší záběr (celá společnost)

Meta Předpona meta označuje přesah, něco za, Metadata: popis určitého objektu Slouží k rychlejšímu vyhledávání, kategorizaci, strukturovatelnosti, Příklad knížka v knihovně: Metadata: autor, počet stran, žánr,

Data ve společnosti V současné době jsme v tvz. Informačním věku => část ekonomiky tvoří právě obchod s informacemi, Na základě, některých výzkumů každé dva dny vytvoříme tolik dat co od začátku civilizace do roku 2003, Toto číslo se každý rok zdvojnásobí

Data v organizaci Mnoho navzájem nepropojených systémů ERP, CRM, SCM, Web, Wiki, Facebook Data vznikají neustále Nové objednávky, nové faktury, noví zákaznící Mnoho lidí je tzv. přehlceno daty

Problémy s daty Data jsou: Neúplná, Nepřesná, Nekonzistentní, V nevhodný čas, V nevhodné podobě, V nevhodné agregaci, V nevhodných rukou => Datová kvalita

Kontrolní otázky Co jsou to data? Co je to informace? K čemu slouží metadata? Jaké základní problémy s daty znáte?

Řešení? BUSINESS INTELLIGENCE

Definice Business intelligence (BI) jsou dovednosti, znalosti, technologie, aplikace, kvalita, rizika, bezpečnostní otázky a postupy používané v podnikání pro získání lepšího pochopení chování na trhu a obchodních souvislostech. Za tímto účelem provádí sběr, integraci, analýzu, interpretaci a prezentaci obchodních informací. Mohou zahrnovat samotné shromážděné informace nebo explicitní znalosti získané z informací. [Wikipedia]

Definice Business intelligence (BI) jsou dovednosti, znalosti, technologie, aplikace, kvalita, rizika, bezpečnostní otázky a postupy používané v podnikání pro získání lepšího pochopení chování na trhu a obchodních souvislostech. Za tímto účelem provádí sběr, integraci, analýzu, interpretaci a prezentaci obchodních informací. Mohou zahrnovat samotné shromážděné informace nebo explicitní znalosti získané z informací. [Wikipedia]

Definice Business intelligence (BI) jsou dovednosti, znalosti, technologie, aplikace, kvalita, rizika, bezpečnostní otázky a postupy používané v podnikání pro získání lepšího pochopení chování na trhu a obchodních souvislostech. Za tímto účelem provádí sběr, integraci, analýzu, interpretaci a prezentaci obchodních informací. Mohou zahrnovat samotné shromážděné informace nebo explicitní znalosti získané z informací. [Wikipedia]

Jinak tedy: BI je souhrn postupů a přístupů, nikoli jedna aplikace, Cílem BI je jednoduše zpřístupnit informace důležité pro rozhodování.

http://dmworks.com.br/dmreports/demo/dmreportswebdemo.as px?guest=true DEMO

Samostatné cvičení BUSINESS CASE

Supermarket Albert Navrhněte základní reporty, které by vás zajímaly pro rozhodnutí o: 1. Umístění produktů v provozovně, 2. Reklamnímu cílení na zákazníky,

PROCESS BUSINESS INTELLIGENCE

High level pohled ERP CRM Web ETL DataWareHouse DWH DM 1 DM 2 Marketing Sales Reporting

Slovníček DWH: DataWareHouse ETL: Extract Transform LOAD DM: Data Mart OLTP: online transaction processing OLAP: online analytical processing

Zdroje dat Rozdílné systémy (ERP, CRM, HR, WEB), Nesourodé datové základny Rozdílné identifikátory (RČ, IČO, ), Rozdílná časová souslednost vzniku dat Některé systémy poskytují data online, jiná v dávkách Možnost vzniků nových zdrojů dat

Extract Transform Load Proces slouží k vyzvednutí dat, jejich modifikaci a uložení do cílového systému. E: T: L: Vytažení dat z různorodých systémů, Transformace dat na požadované struktury, Čistění dat, Uložení do DWH

Datový sklad Komplexní databáze, Slouží k ukládání analytických dat, Obsahuje vyčištěná a kategorizovaná data ve tvaru pro potřeby organizace, Data jsou agregována a předpočítána pro potřeby rozhodovacích procesů

Datamart Část DWH pro specifické potřeby Pro konkrétní oddělení, část zákaznického segmentu Může být vytvořen samostatně, nebo jako součást DWH

Hlavní výhody DWH Možnost provádění analýz, Sloučený pohled na data (one truth), Jednoduší přístup k datům, Přehledy z více systémů na jednom místě, Usnadnění rozhodování, Lepší adresace potřeb zákazníků (interních i externích), Výhody v konkurenčním prostředí

Budování datových skladů Inmnonův model: Shora-dolů, Buduje se jedno centrální tržiště (EDW). Kimballův model: zdola nahoru, Budují se postupně jednotlivé DM.

Inmonův přístup Budování jednoho skladu od začátku Centrální projekt Větší pozornost společnosti Finanční i časová náročnost Obtížnější získání business case

Kimballův přístup Budování perpartes Rychlejší výsledky Možnost lokálních DM Synchronizace napříč organizací Návrh může být uzpůsoben jednomu oddělení (DM)

Reporting Definovaný výstup (report) Často má grafickou podobu, Snadno se jím prochází na nižší úrovně / mění se pohled na data Čistě uživatelský přístup pro procházení daty Není nutný zásah administrátorů pro reporting Možnost vytažení základních statistik na tzv. dashboard.

DEMO DASHBOARD

Základní kroky pro implementaci BI Definice požadavků na reporty: Jak často, jaká data, jak kvalitní, jak agregovaná, Identifikace zdrojových systémů, Výběr vhodného SW a následně HW Vytvoření datového modelu, Nastavení ETL procesu, Definice reportů.

High level pohled ERP CRM Web ETL DataWareHouse DWH DM 1 DM 2 Marketing Sales Reporting

Kontrolní otázky Popište základní prvky BI procesů Definujte základní role na BI projektu Definujte základní přístupy k tvorbě DWH Rozdíl DWH a DM

DATOVÉ MODELOVÁNÍ

Proč datové modelování Základem je pochopit z jakých dat se report připravuje, Je nutné definovat jeho strukturu a možnosti.

Uložení dat OLTP: Klasické databáze Data jsou uložena způsobem, který akcentuje jejich rychlé vložení, nalezení, smazání. Nikoli jejich agregaci a zobrazení napříč více pohledy na tato data. Základní operace: select, insert, update, delete.

Uložení dat #2 OLAP: Uložení dat je uzpůsobeno reportingovým potřebám, Dle nastavení může být část dat (jejich detail) dokonce odstraněn. Základní operace: slice, dice, drill down, drill up, Data jsou ukládána v tzv. kostkách

*OLAP MOLAP (Multidimensional OLAP) - specielní uložení dat v multidimenzionálních binárních OLAP kostkách, ROLAP (Relational OLAP) - řeší multidimenzionalitu uložením dat v relační databázi, HOLAP (Hybrid OLAP) - kombinace předchozích přístupů - detailní data v relační databázi a agregace v OLAP kostkách, DOLAP (Desktop OLAP) - umožňuje připojit se k centrálním úložišti OLAP dat a stáhnout si podmnožinu kostky na lokální počítač. Analytické operace - prováděny nad lokální kostkou - výhodné pro mobilní aplikace a podporu mobilních uživatelů WOLAP (WEB based OLAP) kombinace OLAP a web technologií.

další dimenze tabulky Kostka závod 1 organizační jednotky ukazatelé (např. prodej určité komodity, stav zaměstnanců, dosažené tržby) např. 30.9. 31.10. 30.11. 31.12. čas PRVEK TABULKY vyjadřuje hodnotu stav zaměstnanců k 31.12 v závodě 1 Novotný, O., Pour, J. (KIT VŠE), Slánský, D. (Adastra Corp.)

Slice / Dice

DEMO KOSTKA

Datový model Tabulky faktů Údaje v numerickém či symbolickém vyjádření, Odráží pozorování (reálného) světa. Tabulky dimenzí Obsahuje dimenze na základě, kterých jsou data v tabulce faktů agregována / sumarizována

Schéma star Centrální tabulka faktů (1) Obklopena tabulkami dimenzí (n) Nejjednodušší a nejběžnější přístup k budování DWH

Schéma star Dimenze: Čas Dimenze: Produkt Tabulka faktů: Objednávky Dimenze: Město Dimenze: Objednatel

Schéma snowflake Centrální tabulka faktů (1) Obklopena tabulkami dimenzí (n) Tabulky dimenzí se dále rozpadají do vzájemný vazeb Tzv. normalizace

Schéma star Tabulka faktů: Objednávky Dimenze: Stát Dimenze: Město Dimenze: Adresa Dimenze: Čtvrť Dimenze: Kontinent

Samostatný příklad Navrhněte základní datový model pro příklad reportů z předchozího příkladu Pokuste se o snowflake přístup

Kontrolní otázky OLAP vs. OLTP? Snowflake vs. star? Základní operace s kostkou?

DATAMINING

Definice dolování dat Označení procesu vyhledávání znalostí skrytých v rozsáhlých objemech dat popisující velká množství konkrétních jednotlivých pozorování. Metoda založená na statistice a průzkumu velkého množství dat

Co nám datamining umožnuje? Objevovat skryté vazby mezi různorodými veličinami, Generovat obecné poznatky na základě těchto zjištění, Zvýšení obratu / loajality zákazníků, Kreditní scoring, Odhalování podezřelého chování,

Využití Pojišťovnictví, Medicína, Automobilismus, Bankovnictví, Turismus, Reklama, TV, Facebook

Využití dataminingu (e)shop: Doporučování ( mohlo by se vám líbit / kupované spolu ), List přání (wish-list), Upsell (slevy, doporučení, sleva pokud, ), Cílená reklama, Kategorizace zákazníků / typických košů

Základní vzory Asociace vazby Predikce Předpověď dalšího kroku Shluky kategorizace Sekvenční vztahy Vztahy v čase

Proces CRISP - DM

Co je potřeba 1. Mít data (ideálně v DWH) 2. Znát svá data 3. Mít představu o tom co v datech hledm 4. Vědět jak výsledky využít

CO JSME SE DNES NAUČILI?

Otázky Co je to BI? Co je to informace? Jaké problémy mohou být s daty? Základní komponenty BI? Datamart vs DWH Přístupy k návrhu Star vs. Snowflake Datamining

Nárožní 2600/9a,158 00, PRAHA 5 tel. +420 841 133 166 info@vsem.cz www.vsem.cz