3 zdroje dat. Relační databáze EIS OLAP



Podobné dokumenty
10. Datové sklady (Data Warehouses) Datový sklad

Databáze. datum jmeno prijmeni adresa_ulice adresa_mesto cislo_uctu platba zustatek

Základy business intelligence. Jaroslav Šmarda

Ing. Roman Danel, Ph.D. 2010

kapitola 2 Datové sklady, OLAP

Informační systémy 2008/2009. Radim Farana. Obsah. Obsah předmětu. Požadavky kreditového systému. Relační datový model, Architektury databází

Základní informace o co se jedná a k čemu to slouží

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Marketingová komunikace. 3. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK3PH (vm3bph)

Obsah. Úvod do problematiky. Datový sklad. Proces ETL. Analýza OLAP


Datový sklad. Datový sklad

Business Intelligence

Datové sklady. Ing. Jan Přichystal, Ph.D. 1. listopadu PEF MZLU v Brně

Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph)

Databázové systémy. 10. přednáška

Ing. Petr Kalčev, Ph.D.

BI v rámci IS/ICT komponenty BI architektura. Charakteristika dat a procesů v IS/ICT. Datové sklady ukládání dat návrh datového skladu

Informační systémy 2006/2007

4IT218 Databáze. 4IT218 Databáze

Trendy v IS/ICT přístupy k návrhu multidimenzionální modelování

Zdroje informací v organizaci IS/ICT BI v rámci IS/ICT historie architektura OLTP x DW ukládání dat

NÁSTROJE BUSINESS INTELLIGENCE

CPM/BI a jeho návaznost na podnikové informační systémy. Martin Závodný

Databáze Bc. Veronika Tomsová

Obr. 1 Plochý soubor s daty

Multidimenzionální pohled na zdravotnické prostředí. INMED Petr Tůma

Úvodní přednáška. Význam a historie PIS

ARCHITEKTURA INFORMAČNÍCH SYSTÉMŮ PODLE ÚROVNĚ ŘÍZENÍ

Bu B sin i e n s e s s I n I te t l e lig i en e c n e c Skorkovský KA K M A I, E S E F MU

MIS. Manažerský informační systém. pro. Ekonomický informační systém EIS JASU CS. Dodavatel: MÚZO Praha s.r.o. Politických vězňů Praha 1

Dobývání znalostí z databází. Databáze. datum jmeno prijmeni adresa_ulice adresa_mesto cislo_uctu platba zustatek

Architektura informačních systémů. - dílčí architektury - strategické řízení taktické řízení. operativní řízení a provozu. Globální architektura

Architektury Informačních systémů. Jaroslav Žáček

Podnikové informační systémy Jan Smolík

QAD Business Intelligence

Distanční opora předmětu: Databázové systémy Tématický blok č. 3: OLAP, operátory CUBE a ROLLUP Autor: RNDr. Jan Lánský, Ph.D.

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9

Jak velká jsou? Obchodní analytici FB velké datové sady BI = business intelligence. OLAP = Online Analytical Processing. DWH = Data Warehouse

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Modelování a návrh datových skladů

Data Warehouses. Jaroslav Bayer 1. Fakulta informatiky Masarykova univerzita

Analýza a modelování dat. Přednáška 8

Infor Performance management. Jakub Urbášek

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

TM1 vs Planning & Reporting

T T. Think Together Martin Závodný THINK TOGETHER. Business Intelligence systémy Business Intelligence systems

STÁTNÍ POKLADNA. Integrovaný informační systém Státní pokladny (IISSP)

Databázové systémy. Doc.Ing.Miloš Koch,CSc.

Architektury Informačních systémů. Jaroslav Žáček

Analýza a modelování dat 5. přednáška. Helena Palovská

PV005 Služby počítačových sítí: Data Warehouses

Návrh datového skladu z hlediska zdrojů

Analýza a modelování dat. Přednáška 9

Advanced SQL Modeling in RDBMS - SQL Spreadsheet part1. Your Organization (Line #1)

ARBES BI MODERNÍ ŘEŠENÍ pro podporu strategického, taktického a operativního řízení.

Zkušenosti s Business Intelligence ve veřejném sektoru České republiky

Business Intelligence a datové sklady

Business Intelligence

Business Intelligence. Adam Trčka

Základy databází. O autorech 17 PRVNÍ ČÁST. KAPITOLA 1 Začínáme 19

Systémy pro podporu rozhodování. Datové sklady, OLAP

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Podpora manažerského rozhodování užitím Business Intelligence Ing. Jan Klimeš, ORTEX spol. s r.o., Hradec Králové

Fakulta aplikovaných věd Katedra informatiky a výpočetní techniky DIPLOMOVÁ PRÁCE

Manažerský informační systém na MPSV. Mgr. Karel Lux, vedoucí oddělení koncepce informatiky MPSV

Datové sklady. Multidimenzionální modelování Modely datového skladu Návrh datového skladu v rámci návrhu IS/ICT. Vladimíra Zádová, KIN, EF, TUL

Oracle Sales Cloud. moderní řízení obchodu

Konceptuální modely datového skladu

MAGISTRÁT HLAVNÍHO MĚSTA PRAHY ODBOR INFORMATIKY ÚTVAR ROZVOJE HL. M. M. PRAHY. Geografický informační systém hl. m. Prahy (GIS)

Řešení potřeb veřejné správy pomocí velkých i malých BI systémů. Tomáš Jindřich Pavel Bobkov

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ

Datové sklady a možnosti analýzy a reportování dat ve výuce

Přístupy k efektivnímu využití modelu MBI

Úvod do informačních a řídicích systémů. lení

BIG DATA. Nové úlohy pro nástroje v oblasti BI. 27. listopadu 2012

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Kapitola 4. Úvod 11. Stručný úvod do relačních databází 13. Platforma 10g 23

Operátory ROLLUP a CUBE

Datová kvalita základ úspěšného BI. RNDr. Ondřej Zýka, Profinit

Využití IT nástrojů pro měření a řízení výkonnosti. Michal Kroutil

METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1

Kapitola 1: Úvod. Systém pro správu databáze (Database Management Systém DBMS) Účel databázových systémů

Projekt SEPIe - Datový sklad a analytická nadstavba MIS - manažerský informační systém pro vedoucí zaměstnance resortu MV (konference)

MASARYKOVA UNIVERZITA FAKULTA INFORMATIKY DIPLOMOVÁ PRÁCE. Manažerské systémy pro střední a menší firmy

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

Stručný obsah. K2118.indd :15:27

DATABÁZOVÉ SYSTÉMY. Vladimíra Zádová, KIN, EF TUL - DBS

Je právní systém opravdu pro právníky? Jan Kracík

Databázové systémy BIK-DBS

Snadný a efektivní přístup k informacím

ANALÝZA NÁKUPNÍHO KOŠÍKU SEMINÁŘ

Datové sklady ve školství

Manažerský informační systém pro podporu ekonomického řízení laboratoří

Efektivní řízení pomocí Business Intelligence. Ján Zajíc (Clever Decision) Robert Havránek (Microsoft)

Management IS1. Doc.Ing.Miloš Koch,CSc.

Dobývání dat z databází. Dagmar Létavková

předměty: ukončení: Zápočet + Zkouška / 5kb např. jméno, název, destinace, město např. student Jan Novák, narozen

Datové sklady. Zdeněk Kouba

Manažerský informační systém (MIS) Statistická analýza jako služba Bc. Alena Chodounská

Transkript:

Zdroje dat

3 zdroje dat Relační databáze EIS OLAP

Relační databáze plochá dvourozměrná tabulková data OLTP (Online Transaction Processing) operace selekce projekce spojení průnik, sjednocení, rozdíl dotazování SQL QBE

EIS Executive Information Systems první pokus o přiblížení dotazování manažerům snadné ovládání přívětivé prostředí výběr z množiny předdefinovaných dotazů málo flexibilní MIS manažerské informační systémy

Úloha MIS Model chování systému MIS/EIS Požadují se : - trendy - souvislosti - struktury - what-if - flexibilita Model stavu systému Transakční systémy - operační data Požaduje se: - rychlost odezvy - kapacita - integrita dat - konsistence dat

OLAP Online Analytical Processing rychlost flexibilita intuitivní ovládání vizualizace grafické rozhraní

OLAP (F. Codd) multidimenzionální koncept ukládání i manipulace s daty intuitivní manipulace s daty práce s daty z heterogenních zdrojů použití analytických metod statistické metody what-if analýzy architektura klient-server podpora víceuživatelských pohledů ukládání výsledků i mimo zdrojová data dynamická manipulace s řídkými maticemi zpracování chybějících hodnot neomezený počet dimenzí a agregačních úrovní

Technologické rozdíly OLTP dostat data dovnitř relační databáze velké objemy statických transakcí statické aplikace data s plynule mění OLAP dostat informace ven datové sklady malý počet komplexních dotazů dynamické aplikace informace jsou zmraženy

Koncepční rozdíly OLTP automatizace rutiny každodenní činnosti cílem je výkonnost poháněné technologií OLAP možnost kreativity dlouhodobé strategie, podpora rozhodování cílem je konkurenční výhoda poháněné obchodními potřebami

Datový sklad (Data Warehouse) Externí data Datový sklad Externí data Datová pumpa zásobování výroba ekonomika odbyt

Datový sklad univerzální úložiště všech potenciálně užitečných dat - konsistentní informace potřebné pro taktické a strategické rozhodování data organizována předmětně (náklady, prodeje apod.) datová tržiště vybrané dimenze a fakta (předzpracovaná data pro určitou tematickou oblast) u každého záznamu je uchována informace o čase, kdy byl do datového skladu přidán (sledování historie záznamů) změny v databázi (aktualizace) probíhají dávkově (Batch Processing - nejčastěji v noci) analytické dotazy nad datovým skladem probíhá v reálném čase (OLAP)

Vlastnosti DW Dostupnost Aktuálnost Odezva Čistota (kvalita) dat ETL (extraction, transformation, loading) - základní komponenta DW sběr dat z různých zdrojů čištění (konsolidace) uložení dat do databáze DW

Základ OLAP datová krychle (dat cube) - multidimenzionální Transakční databáze uživatelské řezy (slices) výběry

Základní operace OLAP analýzy Drill-down nastavení nižší (jemnější) agregační úrovně - navigace v hierarchii dimenzí směrem k většímu detailu. Roll-up opak drill-downu nastavení vyšší (hrubší) agregační úrovně - menší detail v hierarchii dimenzí Pivoting otáčení datovou krychlí změna úhlu pohledu na data na úrovni presentace obsahu datového skladu. Slicing řezy datovou kostkou pohled, kdy je jedna dimenze fixována v jisté instanci určité agregační úrovně - aplikace filtru na instance příslušné agregační úrovně dané dimenze. Dicing obdoba slicingu filtr pro více dimenzí.

REGION sever jih východ Analýza segmentů trhu PRODEJCI Hračky Hry Stavebnice Dealeři E-shop Maloobchod OBOR

S01 S02 S03 Analýza nákladů STŘEDISKO ČAS NÁKLADOVÝ DRUH Materiál Mzdy Energie DH12 H123 S007 VÝROBEK

OLAP krychle OLAP krychle Čas Řez krychlí OLAP aplikace (Excel) Kč (data) Druh účtu Org. jednotka

OLAP dimenze Rok Přímé náklady Výrobek Měsíc Náklady na materiál Výrobna

Vlastnosti dimenzí Hierarchie Granularita Sdílení Proměnlivost

Vlastnosti dimenzí Hierarchie dimenze katedra, fakulta, univerzita, vysoké školy stavba, závod, divize, celá společnost. Granularita dimenze základní úroveň detailu dat nejnižší úrovni detailu u všech dimenzí (objem dat x míra detailů dat) Sdílené dimenze společné pro všechna čas, organizační jednotka, produkt, zákazník Proměnlivost dimenze atributy dimenze se mohou v čase měnit komplikace historických přehledy (sledování trendů) ukládání dvojích hodnot (staré a nové)

Příklady dimenzí u aplikace prodeje Čas (rok, měsíc, případně den v roce či den v měsíci) Stav (prognóza, plán skutečnost) Útvar (dle konkrétního organizačního uspořádání) Zákazník (obchodní zástupce, významný zákazník, přímý odběratel apod.) Segment trhu (státní sektor, soukromý sektor, bytová výstavba apod.) Produkt/zakázka (typ, provedení apod.) Teritorium (Evropa, ČR, kraj apod.) Nákladový druh (materiál, mzdy, cestovné,provize a pod.) a další dle konkrétních požadavků obchodníků

Příklady fakt u aplikace prodeje Objem tržeb Náklady Zisk Počet zákazníků Z hodnot fakt a jejich dimenzí pak systém tvoří ukazatele

MOLAP, ROLAP MOLAP multidimenzionální OLAP pro středně velké statistické aplikace nevhodné pro dynamické aplikace požadující informace z pravidelně aktualizovaných dat ROLAP relační OLAP vhodný pro rozsáhlé aplikace využívající transakční data schémata hvězda (star) vločka (snowflake)

Příklad prodeje 3 dimenze prodejna produkt čas dimenze prodejen obchod okres region dimenze produktů výrobek značka výrobce dimenze času datum měsíc čtvrtletí rok

Schéma hvězdy 1 centrální tabulka faktů obsahující primární klíč a detailní data tabulka faktů dimenze prodejna Id_prodejna data_prodejny město Id_okres data o okresu Id_regionu data o regionu úroveň dimenze produkt Id_produkt data o produktu značka výrobce úroveň Id_prodejna Id_produkt Id_období cena množství dimenze čas Id_období data o období rok čtvrtletí měsíc den

Schéma vločky normalizované tabulky dimenzí, každá ukazuje na odpovídající agregovanou tabulku faktů dimenze prodejna Id_prodejna data_prodejny město Id_okres data o okresu Id_regionu data o regionu úroveň Id_okresu data o okresu Id_regionu fakta prodejny Id_prodejna Id_produkt Id_období Id_regionu data o regionu fakta okresu Id_okresu Id_produkt Id_období fakta regionu Id_regionu Id_produkt Id_období cena množství cena množství cena množství

Příklad chybné interpretace dat nesprávné zobecnění závěrů při přechodu mezi jednotlivými úrovněmi Vraždy na Floridě (1973 1979) oběť běloch pachatel běloch pachatel černoch oběť černoch pachatel běloch pachatel černoch rozsudek smrt 72 48 0 11 jiný rozsudek 2074 238 111 2309 Popraveno: v případě bílých obětí 48/(48+238) = 16,8 % černochů 72/(72+2074) = 3,4 % bělochů v případě černých obětí 11/(11+2309) = 0,5 % černochů 0 = 0 % bělochů

Tentýž příklad po provedení operace roll-up přechod na méně podrobnou úroveň Vraždy na Floridě (1973 1979) pachatel běloch pachatel černoch rozsudek smrt 72 59 jiný rozsudek 2185 2547 Popraveno: 72/(72+2185) = 3,2 % bělochů 59/(59+2547) = 2,3 % černochů Paradox relativních četností