KIV/SI. Přednáška č.8. Jan Valdman, Ph.D. jvaldman@dns.cz



Podobné dokumenty
10. Datové sklady (Data Warehouses) Datový sklad

Základy business intelligence. Jaroslav Šmarda

Infor Performance management. Jakub Urbášek

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9

Performance Management What if?

Obsah Úvod 11 Jak být úspěšný Základy IT

Business Intelligence

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

Business Intelligence. Adam Trčka

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

Databázové systémy. 10. přednáška

Podnikové informační systémy Jan Smolík

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

BI v rámci IS/ICT komponenty BI architektura. Charakteristika dat a procesů v IS/ICT. Datové sklady ukládání dat návrh datového skladu

Ing. Petr Kalčev, Ph.D.

Datové sklady. Ing. Jan Přichystal, Ph.D. 1. listopadu PEF MZLU v Brně

<Insert Picture Here> Hyperion a vazba na reportovací nástroje

Od klasického reportingu k SAP BO Design studio na BW power by HANA Pavel Strnad

Reportingová platforma v České spořitelně

Nová dimenze rozhodovacího procesu


3 zdroje dat. Relační databáze EIS OLAP

Manažerský reporting a finanční plánování Targetty

Business Intelligence

kapitola 2 Datové sklady, OLAP

CPM/BI a jeho návaznost na podnikové informační systémy. Martin Závodný

PostgreSQL jako platforma pro datové sklady

QAD Business Intelligence

Zdroje informací v organizaci IS/ICT BI v rámci IS/ICT historie architektura OLTP x DW ukládání dat

TM1 vs Planning & Reporting

powerful SAP-Solutions

Bu B sin i e n s e s s I n I te t l e lig i en e c n e c Skorkovský KA K M A I, E S E F MU

Analytika a SAP Quo Vadis? Jiří Přibyslavský Performance Management & Business Intelligence Business Consultant

Marketingová komunikace. 3. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK3PH (vm3bph)

Datový sklad. Datový sklad

T T. Think Together Martin Závodný THINK TOGETHER. Business Intelligence systémy Business Intelligence systems

Introduction to Navision 4.00 Jaromír Skorkovský, MS., PhD.

IBM Information Management

Obsah. Úvod do problematiky. Datový sklad. Proces ETL. Analýza OLAP

Business Intelligence a datové sklady

Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph)

Ing. Roman Danel, Ph.D. 2010

DATABÁZOVÉ SYSTÉMY. Vladimíra Zádová, KIN, EF TUL - DBS

Vnitřní integrace úřadu Středočeského kraje

Trendy v IS/ICT přístupy k návrhu multidimenzionální modelování

Efektivní řízení pomocí Business Intelligence. Ján Zajíc (Clever Decision) Robert Havránek (Microsoft)

The following is intended to outline our general product direction. It is intended for information purposes only, and may not be incorporated into

Architektury Informačních systémů. Jaroslav Žáček

SAP Business One Analytics powered by SAP HANA: Analytic Content and Enterprise Search

On line analytical processing (OLAP) databáze v praxi

SAP PROCUREMENT DAY 2013

Informační systémy 2006/2007

Snadný a efektivní přístup k informacím

ARCHITEKTURA INFORMAČNÍCH SYSTÉMŮ PODLE ÚROVNĚ ŘÍZENÍ

Datová kvalita základ úspěšného BI. RNDr. Ondřej Zýka, Profinit

Architektury Informačních systémů. Jaroslav Žáček

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

Platforma Microsoft zajistila společnosti ISS nový finanční analytický systém

Inteligentní zpracování prostorových dat

STÁTNÍ POKLADNA. Integrovaný informační systém Státní pokladny (IISSP)

Data Warehouses. Jaroslav Bayer 1. Fakulta informatiky Masarykova univerzita

Jak velká jsou? Obchodní analytici FB velké datové sady BI = business intelligence. OLAP = Online Analytical Processing. DWH = Data Warehouse

Databáze. datum jmeno prijmeni adresa_ulice adresa_mesto cislo_uctu platba zustatek

Dobývání znalostí z databází. Databáze. datum jmeno prijmeni adresa_ulice adresa_mesto cislo_uctu platba zustatek

Metadata. RNDr. Ondřej Zýka

Základní informace o co se jedná a k čemu to slouží

Srovnání SQL serverů. Škálovatelnost a výkon. Express Workgroup Standard Enterprise Poznámky. Počet CPU bez limitu Obsahuje podporu

INFORMAČNÍ SYSTÉMY (IS) Ing. Pavel Náplava Katedra počítačů K336, ČVUT FEL Praha 2004/2005

Nabízíme řešení. v oblastech: integrací zdrojů dat:

Profitabilita klienta v kontextu Performance management

PV005 Služby počítačových sítí: Data Warehouses

<Insert Picture Here> Jak garantovat bezpečnost systémů ve státní správě

Není nic staršího než včerejší web

Moderní metody automatizace a hodnocení marketingových kampaní

Nová generace analytik mění zažité způsoby BI

Analýza a modelování dat. Přednáška 8

MIS. Manažerský informační systém. pro. Ekonomický informační systém EIS JASU CS. Dodavatel: MÚZO Praha s.r.o. Politických vězňů Praha 1

SEMINÁŘ MANAŢERSKÉ SYSTÉMY

Využití IT nástrojů pro měření a řízení výkonnosti. Michal Kroutil

Podpora manažerského rozhodování užitím Business Intelligence Ing. Jan Klimeš, ORTEX spol. s r.o., Hradec Králové

Business Intelligence nástroje a plánování

GINIS na KrÚ Středočeského kraje

System Center Operations Manager

Metadata. MI-DSP 2013/14 RNDr. Ondřej Zýka,

Business Intelligence pro univerzitní prostředí

INFORMAČNÍ SYSTÉMY , Ing. Jiří Mráz

Data v informačních systémech

Chytrá systémová architektura jako základ Smart Administration

Databázové a informační systémy

UNIVERZITA PRO OBCHODNÍ PARTNERY. Úvod do Midmarket, BP Cloud programy Miroslav Černík, Midmarket Manager

Možnosti reportingu v produktech řady EPM

Role BI v e-business řešeních pohled do budoucnosti

SOA a Cloud Computing

SAP S/4HANA & Analytika Jiří Přibyslavský, SAP Analytics Business Consultant. SAP Forum Slovensko

Využití moderní self-service BI technologie v praxi

Proces vývoje HRIS Vema (Human Resources Information System) Jaroslav Šmarda

Aplikace pro podporou manažerského rozhodování

4IT218 Databáze. 4IT218 Databáze

Helios Easy. integrované řešení pro řízení

Business Intelligence Hlavní témata, která budou v roce 2015 určovat vývoj business intelligence řešení a služeb.

Transkript:

KIV/SI Přednáška č.8 Jan Valdman, Ph.D. jvaldman@dns.cz 19.4.2011

Business Intelligence (BI)

The Top Challenges of Midsize Companies Improve efficiency, reduce costs Strengthen customer relationships, acquisition, sell more Predict and respond to trends, optimizing business models The highest-priority technology solution chosen by 75 percent of respondents Turn mountains of data into meaningful insights Inside the Midmarket: A 2009 Perspective IBM Survey

Business Intelligence, práce s daty Business Intelligence je soubor nástrojů, technologií a metod, které umožňují nalézt v datech informace (znalosti). Cílem je získávat podklady pro kvalitnější rozhodování (decision support). 1. Mít data. 2. Vědět, že mám data. 3. Vědět, kde mám data. 4. Mít přístup k datům. 5. Mít data z důvěryhodného zdroje!

Dashboards/Reports Planning Analysis

Accelerating Your Journey to Business Optimization Business Value 5X more value realized by organizations using information effectively Maturity of Information Use 6

Key Challenge is Unlocking the Value of Information 52% of users don t have confidence in their information 1 59% of managers miss information they should have used 2 42% of managers use wrong information at least once a week 2 1 AIIM 2008 Survey 2 Accenture 2007 Managers Survey 7

Business Intelligence & Performance Management Identify Explore Resolve and Issues Understand Plan for Issues the Future Financial Management Revenue Expense Scorecard Report Plan is updated shows or dashboard Cost to of shows Goods adjust for Profit Soldrising rising below fuel due plan to costs provides increase in fuel costs understanding of impact to other expenses and profit Asset Management 8

Performance Management is Relevant Across the Enterprise Finance Sales Operations How are we doing? Scorecards and Dashboards Marketing Why? Reporting & Analytics Customer Service IT/Systems Human Resources What should we be doing? Planning, Forecasting and Budgeting 9

The Performance Management Journey Customer Phases Departmental BI Applications Enterprise BI Capabilities Independent Planning Coordinated Decision Making Common Platform for ALL Performance Management needs, not a Suite Leading SOA capabilities make BI available as a service for easier integration 10

Nárůst objemu dat v čase, spolehlivost dat 3 roky 3 roky 3 roky Uvádí se, že každé přibližně 3 roky se objem dat uložený v databázích zdvojnásobí. Tento geometrický nárůst nutně znamená nutnost zkvalitnění procesu zpracování dat. Podle informací z IBM Infobahn 2009 BI naruby v téměř 50% případů uživatelé (manažeři, analytici) pracující s daty: 1. Pracují s nesprávnými nebo neúplnými daty. 2. Nedůvěřují svým datům (a podle 1. zdá se oprávněně). 3. Alespoň 1x týdně činí vědomě (!) rozhodnutí, která z takových dat vycházejí!

Vývoj Data Warehousingu

Stručná charakteristika podnikových IS Prvotní požadavky na IS se týkaly hlavně evidence. Data byla pořizována pokud možno v reálném čase a požadavky na výstupy byly (a jsou) obvykle v podobě: Přehledu detailních záznamů (např. přehled prodeje za období). Tisku dokladu (faktura, objednávka, dodací list, výpis telefonních hovorů, bankovní výpis, doručenka zásilky apod ). Tisk standardních výkazů (účetní výkazy, přiznání k DPH, atd ) Jednotlivé systémy nebyly (nejsou) vzájemně propojené. Mnoho informací (např. o zákaznících, produktech, apod ) bylo vedeno duplicitně. Byly použity různé technologie. Kromě IS podporovaných dodavatelskou firmou byly některé systémy vyvíjeny v rámci vlastních zdrojů (obvykle na technologiích FoxPro, Paradox, MS Access apod ) popř. bylo využíváno výstupů do Excelu s následnou úpravou dat. Pro získání souhrnných informací z více datových zdrojů bylo nutné data transformovat do 1 prostředí (obvykle MS Excel), nejčastěji pomocí různých automatizovaných postupů (maker). Tento proces mohl mít jistou časovou prodlevu a díky možnostem ručního vstupu do dat nemusí být dostatečně spolehlivý.

Trocha pohledu na vývoj IS Prvotní požadavky na standardní IS (ERP) Prvotní požadavky na IS vytvořený na zakázku Chceme vést účetnictví Mzdy a personalistiku Sklady, Odbyt, fakturaci Objednávky, Evidence dopravy, sledování zásilek online (doprava, logistika) Evidence dokladů (např. e-mailů), workflow Plánování (výroby, účetnictví, lidských zdrojů, atd ) Sledování hlasových a datových služeb (telekomunikace) Výběr peněz z bankomatů, použití platebních karet (banky)

Základní terminologie ERP (Enterprise Resource Planning) kompletní podnikový informační systém (IS) CRM (Customer Relationship Management) obvykle součást ERP Relační databáze (db) obsahuje tabulky a vazby mezi tabulkami. Používá jazyk SQL. OLTP (On-Line Transactional Processing) technologie zpracování dat, typická pro ERP. Multidimenzionální db (mdb) obsahuje data uložená do mdb struktur (kostek). Používá obvykle jazyk MDX OLAP (On-Line Analytical Processing) technologie zpracování dat typická pro MDB. Existuje relační (ROLAP), multidimenzionální (MOLAP) a hybridní (HOLAP). (De)Normalizace způsob optimálního uložení dat v db. Obvykle 3. normální forma. Dimension (dimenze) rozměr, podle kterého se sledují data (např. Zákazník, Období) Hierarchy (hierarchie) popisuje vztah nadřízenosti mezi prvky dimenze. Dimenze může mít víc hierarchií. Level (úroveň hierarchie) hierarchie obvykle obsahuje více úrovní (např. Rok Měsíc Den, Rok - Týden). Member hodnota na dané úrovni (např. Leden, Únor, ) Fact (hodnota) číselné vyjádření sledovaných hodnot v rámci dimenzí. KPI (Key Performance Indicator) klíčový ukazatel. Drill Up / Down průchod úrovněmi dané hierarchie, up = slučování, down = zjemnění. Drill Through průchod na jinou úroveň (obvykle detailnější), realizován často samostatným reportem. Data Mining (dolování dat) získávání skrytých informací a souvislostí z dat. Data Warehouse (datový sklad) centrální úložiště dat (další def. dále) Data Mart část datového skladu sloužící konkrétnímu účelu nebo určená konkrétní organizační jednotce. Operational Data Store (ODS) operační databáze sloužící k okamžitému rozhodování. ETL (ELT) proces plnění datového skladu (Extract, Transform, Load). Active Warehouse datový sklad pracující (téměř) v reálném čase.

Relační databáze vs. Analytický slovník

Multimediální DB

Reporty, Dashboardy

OLAP Operace Drill down Drill up

Reporting, Dashboardy

Dashboards Accelerator - šablony Scorecard Náhled -> Trend -> Detaily Moje alerty Zanořené tabulky Koláče Indikátory Trendy Graf -> Tabulka Filrování dat

Dva způsoby budování datového skladu 1. Data warehouse jako množina data martů (bus architecture) Ralph Kimball: "Data warehouse není nic jiného než sjednocení data martů. Data Warehouse ETL, DQ DMart DMart DMart DMart Data marty je možné sjednotit pouze za předpokladu tzv. "všeobecně přijatých" dimenzí a faktů (conformed dimension). V opačném případě není možné DM spojovat do 1 celku resp. pokud by se spojovaly, výsledkem budou špatná data! Plus Rychlá implementace data martů. Nízké počáteční náklady. Mínus Redundance dat. Každý DM má vlastní historii, ETL, dimenze, řešení datové kvality. Hůř monitorovatelné procesy, vyšší HW i SW nároky na údržbu.

Dva způsoby budování datového skladu 2. Centrální Data Warehouse (hub architecture) Bill Inmon: (Centrální) datový sklad je soubor integrovaných, předmětově orientovaných, stálých, časově se vyvíjejících detailních dat. ETL, DQ DMart Data Warehouse DMart DMart DMart Plus Centrální datový sklad plněný jednotným ETL postupem, použito 1 řešení datové kvality a vytvořeny společné dimenze. Minimalizována redundantnost dat. Možnost centrálního monitorování datového skladu Mínus Vyšší náklady na návrh a implementaci centrálního skladu. Delší přípravný čas. ODS je soubor integrovaných, předmětově orientovaných, nestálých aktuálních detailních dat vytvořená pro aktuální potřeby uživatelů.

Schéma datového skladu a Cognos IBM COGNOS 8 BI Reporting Adhoc OLAP Analýzy Datové kostky Cognos 8 GO! (XLS,...) Planning Řízení pomocí událostí DW Metriky Definice sémantické vrstvy Cognos Framework Manager DMart Datový sklad (Data Warehouse) DMart DMart ODS DMart ETL ETL Zdrojové systémy ERP / OLTP Zakázkový IS, XLS, CSV, DBF Externí data

Cognos co vše zahrnuje Budování DW MDM Oblast Cognos Jiné (IBM) řešení InfoSphere Warehouse InfoSphere MDM ETL, DQM Data Manager InfoSphere DataStage Správa metadat Reporting Ad-Hoc OLAP, datové kostky Scorecarding Framework Manager Report Studio Query Studio Analysis Studio, Transformer, PowerPlayer Metric Studio, Metric Designer Data Mining Cognos Scenario InfoSphere Warehouse Data Mining Plánování Řízení pomocí událostí Napojení na externí nástroje Planning Event Studio Cognos GO! Office a GO! Mobile

Porovnání transakčních systémů (OLTP) a analytických systémů (OLAP) Znak OLTP OLAP Charakteristika Provozní zpracování Informační zpracování Orientace Transakční Analytická Uživatel Běžný uživatel, databázový administrátor Znalostní pracovník (manažer, analytik) Funkce Každodenní operace Dlouhodobé informační požadavky, podpora rozhodování Návrh databáze Entitně-relační základ, aplikačně orientovaný Hvězda/sněžná vločka, věcná orientace Data Současná, zaručeně aktuální Historická Sumarizace dat Základní, vysoká podrobnost dat Shrnutá, kompaktní Náhled Detailní Shrnutý, multidimenzionální Jednotky práce Krátké, jednoduché transakce Komplexní dotazy Přístup Číst, pořizovat a aktualizovat Pouze číst Zaměření Vkládání dat Získávání informací Počet dostupných záznamů Desítky Miliony Počet uživatelů Stovky tisíce. Desítky stovky. Velikost databáze 100 MB až GB 100 GB až TB Přednosti Vysoký výkon, vysoká přístupnost Vysoká flexibilita, nezávislost koncového uživatele Míry hodnocení Propustnost transakcí Propustnost dotazů a doba odezvy

Rational Insight BI řešení pro vývoj SW 27

28

Datový zdroj (interní informační systém) Datový zdroj (běžná provozní data) Datový zdroj (XLS, textové soubory) Datový zdroj (externí data) Datový sklad Datové tržiště Datové tržiště Datové tržiště Nástroje business intelligence Ad-hoc dotazy Reporty Analýzy Data mining Metriky