Základní informace o co se jedná a k čemu to slouží

Podobné dokumenty

10. Datové sklady (Data Warehouses) Datový sklad

Základy business intelligence. Jaroslav Šmarda

TM1 vs Planning & Reporting

Analýza a modelování dat. Přednáška 9

Analýza a modelování dat. Přednáška 8

3 zdroje dat. Relační databáze EIS OLAP

Datové sklady. Ing. Jan Přichystal, Ph.D. 1. listopadu PEF MZLU v Brně

Databázové systémy. 10. přednáška

POKROČILÉ POUŽITÍ DATABÁZÍ

Operátory ROLLUP a CUBE

Informační systémy 2006/2007

Dotazovací jazyky I. Datová krychle. Soběslav Benda

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9

Marketingová komunikace. 3. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK3PH (vm3bph)

STÁTNÍ POKLADNA. Integrovaný informační systém Státní pokladny (IISSP)

kapitola 2 Datové sklady, OLAP

Business Intelligence

Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph)

A4M33CPM CORPORATE PERFORMANCE MANAGEMENT (CPM) Přednáška č. 01

Základy databází. O autorech 17 PRVNÍ ČÁST. KAPITOLA 1 Začínáme 19

Pilotní projekt implementace Business Intelligence ve studijní agendě VŠE v Praze

Distanční opora předmětu: Databázové systémy Tématický blok č. 3: OLAP, operátory CUBE a ROLLUP Autor: RNDr. Jan Lánský, Ph.D.

Informační systémy 2008/2009. Radim Farana. Obsah. Obsah předmětu. Požadavky kreditového systému. Relační datový model, Architektury databází

MBI - technologická realizace modelu

Úvod do databázových systémů. Ing. Jan Šudřich

Analýza a modelování dat 5. přednáška. Helena Palovská

Stručný obsah. K2118.indd :15:27

Ing. Roman Danel, Ph.D. 2010

Business Intelligence

Analýza dat skoro zadarmo možnosti rozborů pro malé organizace

NÁSTROJE BUSINESS INTELLIGENCE

Databáze v MS ACCESS

Obsah. Úvod do problematiky. Datový sklad. Proces ETL. Analýza OLAP

BI v rámci IS/ICT komponenty BI architektura. Charakteristika dat a procesů v IS/ICT. Datové sklady ukládání dat návrh datového skladu

8.2 Používání a tvorba databází

BIG DATA. Nové úlohy pro nástroje v oblasti BI. 27. listopadu 2012

SEMINÁŘ MANAŢERSKÉ SYSTÉMY

Infor Performance management. Jakub Urbášek

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Kapitola 4. Úvod 11. Stručný úvod do relačních databází 13. Platforma 10g 23

CPM/BI a jeho návaznost na podnikové informační systémy. Martin Závodný

Jak velká jsou? Obchodní analytici FB velké datové sady BI = business intelligence. OLAP = Online Analytical Processing. DWH = Data Warehouse

Data v informačních systémech

Bu B sin i e n s e s s I n I te t l e lig i en e c n e c Skorkovský KA K M A I, E S E F MU

Modelování a návrh datových skladů

4IT218 Databáze. 4IT218 Databáze

On line analytical processing (OLAP) databáze v praxi

Zdroje informací v organizaci IS/ICT BI v rámci IS/ICT historie architektura OLTP x DW ukládání dat

předměty: ukončení: Zápočet + Zkouška / 5kb např. jméno, název, destinace, město např. student Jan Novák, narozen

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

Databázové a informační systémy

Trendy v IS/ICT přístupy k návrhu multidimenzionální modelování

T T. Think Together Martin Závodný THINK TOGETHER. Business Intelligence systémy Business Intelligence systems

Databázové systémy. Doc.Ing.Miloš Koch,CSc.

Datový sklad. Datový sklad

Business Intelligence. Adam Trčka

Maturitní témata Školní rok: 2015/2016

Databáze II. 1. přednáška. Helena Palovská

Ukázka knihy z internetového knihkupectví

Novinky SQL Serveru 2005 v oblasti Business Intelligence

KAPITOLA 2. Architektura, modelování a implementace Business Intelligence procesů v SQL Serveru V této kapitole:

GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY 4

Databáze Bc. Veronika Tomsová

ARCHITEKTURA INFORMAČNÍCH SYSTÉMŮ PODLE ÚROVNĚ ŘÍZENÍ

Business Intelligence a datové sklady

METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1

BI & DWH & MIS nástroj 2. generace

Obsah přednášky. Představení webu ASP.NET frameworky Relační databáze Objektově-relační mapování Entity framework

Platforma Microsoft zajistila společnosti ISS nový finanční analytický systém

Informační systém pro podporu řízení, správu a zjišťování aktuálního stavu rozvrhované výuky

Multidimenzionální pohled na zdravotnické prostředí. INMED Petr Tůma

Autor. Potřeba aplikací sdílet a udržovat informace o službách, uživatelích nebo jiných objektech

NEJLEP Í NÁPADY PRO DÌTI

JAK SE ASERTIVNÌ PROSADIT

ISBN (elektronická verze ve formátu PDF)


NEJLEP Í NÁPADY PRO DÌTI


JAK SE DOMLUVIT S TCHYNÍ

KAPITOLY Z O ETØOVATELSKÉ PÉÈE I

A5M33IZS Informační a znalostní systémy. O čem předmět bude? Úvod do problematiky databázových systémů

Střední odborná škola a Střední odborné učiliště, Hořovice

13. blok Práce s XML dokumenty v databázi Oracle

SAP Business One Analytics powered by SAP HANA: Analytic Content and Enterprise Search

Fakulta aplikovaných věd Katedra informatiky a výpočetní techniky DIPLOMOVÁ PRÁCE

Archivace relačních databází

DATOVÉ SKLADY A OLAP V PROSTŘEDÍ MS SQL SERVERU

Podpora manažerského rozhodování užitím Business Intelligence Ing. Jan Klimeš, ORTEX spol. s r.o., Hradec Králové

Možnosti vzdáleného řízení a správy lékárenského mikrořetězce. Ing. Filip Debef Cyrmex, s.r.o.

powerful SAP-Solutions

Úvod do databází. Modelování v řízení. Ing. Petr Kalčev

7. Geografické informační systémy.

Reportingová platforma v České spořitelně

INFORMAČNÍ SYSTÉMY (IS) Ing. Pavel Náplava Katedra počítačů K336, ČVUT FEL Praha 2004/2005

Sada 1 - PHP. 14. Úvod do jazyka SQL

Advanced SQL Modeling in RDBMS - SQL Spreadsheet part1. Your Organization (Line #1)

Přehled systému Microsoft SQL Server. Komu je kniha určena Struktura knihy Nejvhodnější výchozí bod pro čtení knihy Konvence a struktura knihy

Importy dat z relační databáze do OLAP datových kostek

5. POČÍTAČOVÉ CVIČENÍ

Transkript:

Základní informace o co se jedná a k čemu to slouží

založené na relačních databází transakční systémy, které jsou určeny pro pořizování a ukládání dat v reálném čase (ERP, účetní, ekonomické a další podnikové systémy) proto se OLTP systémy, ve vztahu k OLAP systémům, chápou jako primární, zdrojové nebo produkční v běžném provozu probíhají desítky až statisíce transakcí za minutu (INSERT, UPDATE a DELETE. Obvykle mnoha uživateli zároveň) systémy jsou zatěžovány kontinuálně a jsou optimalizovány zejména na sběr dat a zobrazování jednotlivých dat OLTP systémy obsahují vysoké množství dat (GB, TB, PT) a provádění analýz nad těmito daty kolikrát znamená neúnosné zatížení celého systému, které má za následek prodloužení času odezvy respektive nedostupnost OLTP systémů pro jejich primární určení (pořizování, ukládání a zobrazování dat) OLTP systémy nejsou vhodné pro analýzy (i přesto, že je možné nad OLTP systémy vybudovat analytické aplikace) nejen proto byly k analytickým účelům vyvinuty OLAP systémy - 1 -

informační technologie založená na koncepci multidimenzionálních databází hlavním principem je několikadimenzionální tabulka (tzv. datová kostka) základní vlastností OLAP je tedy schopnost uživatelů analyzovat data z jakéhokoliv pohledu (tzv. multidimenzionalita), který si přejí a tudíž nejsou nuceni spoléhat na pohledy, které vytvořil někdo jiný (tvorba Adhoc uživatelských sestav koncovými uživateli) OLAP systémy jsou primárně určeny pro analýzu velkého množství údajů (podpora dotazování) OLAP systémy v drtivé většině aktualizují svá data periodicky (nejběžněji v denních a měsíčních intervalech. Lze i aktualizace dat v reálném čase, avšak jedná se o výjimečné případy) OLAP systémy využívají primární data vytvořená v OLTP systémech www.youtube.com/watch?v=2ryg3jy6eiy&feature=related - 2 -

stejně jako jsou v relačních databázích data ukládána v tabulkách, v OLAP databázích se k tomuto účelu používají datové kostky datové kostky jsou tedy vícerozměrným (vícedimenzionálním) rozšířením databázových tabulek (2-dimenzionální, 3-dimenzionální a více dimenzionální datové kostky. Počet dimenzí může být teoreticky nekonečně mnoho, vždy však záleží na konkrétní implementaci) Důležité pojmy: viz. www.youtube.com/watch?v=qkjoace9fzg&feature=related dimenze datové kostky elementy dimenze hierarchie dimenzí multidimenzionalita řídkost dat datové kostky - 3 -

- 2-dimenzionální dat. kostka může být například list v MS Excel (dimenzemi jsou sloupce a řádky). Viz. jedna tabulka na obrázku níže kde ve sloupcích je dimenze geografického umístění prodejen a v řádcích je dimenze produktů - 3-dimenzionální dat. kostka může být například soubor v MS Excel (dimenzemi jsou sloupce, řádky a listy) Viz. obrázek níže kde ve sloupcích je dimenze geografického umístění prodejen, v řádcích je dimenze produktů a v listech je dimenze času - 4 - Jelikož je nejpohodlnější se na vše dívat dvourozměrně (sloupce a řádky), tak musíme využít tzv. řezy, které nám ulehčují pohled na další dimenze datové kostky

Datová kostka složená z 5 dimenzí: 1) Dimenze výrobku 2) Dimenze verze výpočtu 3) Dimenze požadované doby výpočtu 4) Dimenze nákladů 5) Dimenze hodnot Příklad jednoho možného zobrazení vícedimenzionální datové kostky v technologii IBM Cognos TM1-5 -

dimenze reprezentuje určitou kategorii pro analýzu dat (například dimenze času, dimenze geografického umístění poboček, ) dimenze = soubor souvisejících objektů, nazývaných elementy dimenze Elementy dimenze: o typickými elementy v dimenzi výrobek může být například název výrobku, velikost výrobku, prodejní cena výrobku, náklady na výrobu, atd. - 6 -

Elementy dimenze mohou být uspořádány v hierarchické struktuře, tzn. že se rozdělují na skupiny elementů, podskupiny až na jednotlivé elementy v dimenzi je možné vytvořit více hierarchií umožnění uživateli pohybovat se pružně po požadovaných úrovních agregace, aniž by bylo nutné vždy znovu požadované agregace počítat tento princip se označuje: Drill-down - zpřístupnění dat od nejvyšší úrovně agregace až po nejnižší úroveň (např. v časové dimenzi rozpad od dat za celý rok až po data za jednotlivé dny) Drill-up - zpřístupnění dat od nejnižší úrovně agregace až po nejvyšší úroveň (např. v časové dimenzi od data za jednotlivé dny až po data za celý rok) - 7 -

Příklady hierarchické struktury dimenze: geografické umístění prodejen: o EU CZ Praha Brno DE Berlin Stuttgart dimenze času: o rok pololetí kvartál měsíc týden - 8 -

- 9 -

multidimensionální uložení dat v datové kostce umožňuje uživateli pružně realizovat různé pohledy (řezy) na data v datové kostce (analýza údajů podle určitých kritérií) tj. možnost pohlížet na realitu z několika možných úhlů (jiné pohledy na data mohou změnit celkový pohled nad daným problém) A - Analýza údajů podle geografických kritérií B - Analýza údajů podle produktu C - Analýza údajů podle časových kritérií Řezy kostkou podle časové, regionální a produktové dimenze - 10 -

Příklad změny pohledu jednoduchou záměnou dimenze času za dimenzi umístění prodejny. Přechod z analýzy podle časových kritérií na analýzu podle geografických kritérií. - 11 -

s narůstajícím počtem dimenzí kostky (se zvětšující se kostkou) je mnoho buněk (představujících specifické kombinace atributů) prázdných (viz. níže uvedený obrázek + popis) neefektivní využití kapacity uložiště není vhodné za každou cenu vytvářet jednu kostku o vysokém počtu dimenzí, ale spíše více kostek o menším počtu dimenzí - 12 - Popis: Jednotlivé produkty v určitém čase nejsou prodávány ve všech prodejnách (např. produkt je určen jen pro určitý trh a nelze ho beze změn prodávat na jiném trhu). Tudíž vzniká mnoho buněk prázdných (z určitého důvodu je nelze vyplnit daty)

Výhody + Rychlý komplexní přístup k velkému objemu údajů + Možnost komplexních analýz + Silné schopnosti pro modelování a prognózy Nevýhody - Vyšší nároky na kapacitu uložiště - Flexibilita Rozšiřování datových kostek je obtížné Vhodné spíše tam, kde jsou věci statického charakteru Pro věci dynamického charakteru je vhodnější spíše relační databáze Při spojování více kostek se objevuje problém podle čeho kostky spojit - 13 -

[1] NOVOTNÝ, Ota; POUR, Jan; SLÁNSKÝ, David. Business Intelliegence : Jak využít bohatství ve vašich datech. Praha : Grada Publishing, a.s., 2005. 256 s. ISBN 80-247-1094-3. [2] LACKO, Luboslav. Databáze: datové sklady, OLAP a dolování dat s příklady v Microsoft SQL Serveru a Oracle. Brno : Computer Press, a.s., 2003. 2003 s. ISBN 80-7226-969-0. [3] Computer Science 831: Knowledge Discovery in Databases [online]. 2007 [cit. 2011-07-25]. Introduction to Data Cubes. Dostupné z WWW: <http://www2.cs.uregina.ca/~hamilton/courses/831/notes/dcubes/dcubes. html>. [4] VLÁŠKOVÁ, Markéta. Návrh hybridního úložiště dat [online]. Plzeň, 2006. 65 s. Diplomová práce. Západočeská univerzita v Plzni. Dostupné z WWW: <http://zcu.arcao.com/kiv/db2/zkouska/_zvesela/db2%20- %20Kupka/DP_Marketa_Vlaskova_2006.pdf>. - 14 -