On line analytical processing (OLAP) databáze v praxi

Podobné dokumenty
Analýza a modelování dat. Přednáška 9

Analýza a modelování dat. Přednáška 8

Analýza a modelování dat 5. přednáška. Helena Palovská

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9

Manažerský reporting a finanční plánování Targetty

Multi-dimensional expressions

Marketingová komunikace. 3. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK3PH (vm3bph)

Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph)

Informační systémy 2006/2007

Operátory ROLLUP a CUBE

Základy business intelligence. Jaroslav Šmarda

Infor Performance management. Jakub Urbášek

Datový sklad. Datový sklad

PostgreSQL jako platforma pro datové sklady


ANALYSIS SERVICES PROJEKT VYTVOŘENÍ PROJEKTU A DATOVÉ KOSTKY

<Insert Picture Here> Na co se můžete s Oracle BI těšit

Přehled systému Microsoft SQL Server. Komu je kniha určena Struktura knihy Nejvhodnější výchozí bod pro čtení knihy Konvence a struktura knihy

Dotazovací jazyky I. Datová krychle. Soběslav Benda

Webový informační systém na podporu marketingu

Business Intelligence

Business Intelligence. Adam Trčka

Efektivní řízení pomocí Business Intelligence. Ján Zajíc (Clever Decision) Robert Havránek (Microsoft)

Obsah OLAP A ESO9... 3

Základní informace o co se jedná a k čemu to slouží

Dobývání znalostí z databází. Databáze. datum jmeno prijmeni adresa_ulice adresa_mesto cislo_uctu platba zustatek

ARBES BI MODERNÍ ŘEŠENÍ pro podporu strategického, taktického a operativního řízení.

Databáze Bc. Veronika Tomsová

Podpora OLAP na platformě.net

10. Datové sklady (Data Warehouses) Datový sklad

QAD Business Intelligence

MBI - technologická realizace modelu

TM1 vs Planning & Reporting

SEMINÁŘ MANAŢERSKÉ SYSTÉMY

Kurz Databáze. Obsah. Dotazy. Zpracování dat. Doc. Ing. Radim Farana, CSc.

Marketingová komunikace. 2. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK1aPH/N9KMK1bPH (um1a1ph/um1b1ph)

Představuje. Technický Informační Systém nové generace

KAPITOLA 2. Architektura, modelování a implementace Business Intelligence procesů v SQL Serveru V této kapitole:

Novinky SQL Serveru 2005 v oblasti Business Intelligence

Možnosti reportingu v produktech řady EPM

GIS jako důležitá součást BI. Jan Broulík, Petr Panec ARCDATA PRAHA, s.r.o.

Základy databází. O autorech 17 PRVNÍ ČÁST. KAPITOLA 1 Začínáme 19

Podnikové informační systémy Jan Smolík

kapitola 2 Datové sklady, OLAP

STÁTNÍ POKLADNA. Integrovaný informační systém Státní pokladny (IISSP)

Informační systémy 2008/2009. Radim Farana. Obsah. Obsah předmětu. Požadavky kreditového systému. Relační datový model, Architektury databází

Databázové systémy. Doc.Ing.Miloš Koch,CSc.

Stručný obsah. K2118.indd :15:27

Databázové systémy. 10. přednáška

ÚVOD DO DATABÁZÍ. Metodické listy pro předmět

Instalace. Produkt je odzkoušen pro MS SQL server 2008 a Windows XP a Windows 7. Pro jiné verze SQL server a Windows nebyl testován.

Metadata. MI-DSP 2013/14 RNDr. Ondřej Zýka,

MIS. Manažerský informační systém. pro. Ekonomický informační systém EIS JASU CS. Dodavatel: MÚZO Praha s.r.o. Politických vězňů Praha 1

Platforma Microsoft zajistila společnosti ISS nový finanční analytický systém

DATA CUBE. Mgr. Jiří Helmich

4IT218 Databáze. 4IT218 Databáze

Podpora manažerského rozhodování užitím Business Intelligence Ing. Jan Klimeš, ORTEX spol. s r.o., Hradec Králové

Datové modelování II

Data x Informace x Znalosti

Databázové a informační systémy

Efektívne riadenie financií v ISS Facility Services Prípadová štúdia BI

Data Cube. Luboš Kulič Tomáš Kuthan

3 zdroje dat. Relační databáze EIS OLAP

Aplikace pro srovna ní cen povinne ho ruc ení

Business Intelligence nástroje a plánování

BPC On Hana embedded. Mibcon. Karel Vydra

powerful SAP-Solutions

Wonderware Information Server 4.0 Co je nového

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

Srovnání SQL serverů. Škálovatelnost a výkon. Express Workgroup Standard Enterprise Poznámky. Počet CPU bez limitu Obsahuje podporu

OLAP PRO SOCIO-EKONOMICKÉ PRŮZKUMNÉ ANALÝZY A PREVENCI KRIMINALITY

Okruhy z odborných předmětů

KIV/ZIS cvičení 5. Tomáš Potužák

Michal Krátký. Tvorba informačních systémů, 2008/2009. Katedra informatiky VŠB Technická univerzita Ostrava. Tvorba informačních systémů

Performance Management What if?

Statistica Enterprise

Ukládání a vyhledávání XML dat

Datové sklady. Ing. Jan Přichystal, Ph.D. 1. listopadu PEF MZLU v Brně

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Kapitola 4. Úvod 11. Stručný úvod do relačních databází 13. Platforma 10g 23

Nápověda k části Generování sestav

KIV/ZIS - SQL dotazy. stáhnout soubor ZIS- 04_TestovaciDatabaze accdb. SQL dotazy. budeme probírat pouze SELECT

GTL GENERATOR NÁSTROJ PRO GENEROVÁNÍ OBJEKTŮ OBJEKTY PRO INFORMATICA POWERCENTER. váš partner na cestě od dat k informacím

xrays optimalizační nástroj

Kritéria hodnocení praktické maturitní zkoušky z databázových systémů

CPM/BI a jeho návaznost na podnikové informační systémy. Martin Závodný

Analýza dat skoro zadarmo možnosti rozborů pro malé organizace

Business Intelligence

Netezza. Martin Pavlík. 2. Února to pravé řešení pro analytický datový sklad

IW3 MS SQL SERVER 2014

Jak velká jsou? Obchodní analytici FB velké datové sady BI = business intelligence. OLAP = Online Analytical Processing. DWH = Data Warehouse

ŠTÍTKOVÁNÍ. informativní manuál pro uživatele HelpDesku

Novinky mobilních aplikací imos a imiks

Inteligentní zpracování prostorových dat

CSPUG 2011-květen. GridSQL a pg-pool II. Vratislav Beneš benes@optisolutions.cz

Konceptuální modely datového skladu

Nová dimenze rozhodovacího procesu

Databázové systémy úvod

Prezentace CRMplus. Téma: CRMplus jako nástroj pro kontrolu a vyhodnocení rozpracovanosti dílů na zakázkách

8.2 Používání a tvorba databází

Obsah. Úvod do problematiky. Datový sklad. Proces ETL. Analýza OLAP

Transkript:

On line analytical processing (OLAP) databáze v praxi Lukáš Matějovský Lukas.Matejovsky@CleverDecision.com Jan Zajíc Jan.Zajic@CleverDecision.com

Obsah Představení přednášejících Základy OLAP Příklady využití v praxi Komponenty databáze SQL Server Analysis Services Základy jazyka MDX

Jan Zajíc Zakladatel a jednatel Clever Decision 20+ let v IT 15+ let ve vývoji BI/DWH řešení a řízení projektů

Lukáš Matějovský Senior consultant 20+ let ve vývoji Business Intelligence a DWH řešení Specializace na SQL Server a datové modelování

Kde jsme? Datové zdroje Datový sklad Data Marts Staging Area Ruční čištění Klient

Základy OLAP Úvod do OLAP Scénáře SQL Server 2014 Analysis Services Unified Dimensional Model (UDM) Výhody UDM

Úvod do OLAP Obsahuje struktury které umožňují rychlý ad-hoc přístup k informacím Jeho součástí je také výpočetní nástroj pro rychlé a flexibilní transformace základních dat Podporuje vyhledávání trendů a statistik, které nejsou přímo viditelné na základě dotazů z datového skladu OLAP = OnLine Analytical Processing

Dotazy nad kostkou Jak vysoké prodeje očekáváme v Serverní Americe v 1. kvartále 2004? Q1 5,005,000 Q2 Q3 Q4 N/A Pacific Europe North America Sales Territory Sales Territory Sales Territory Sales Territory Measures Dimension

Scénáře Analýzy prodeje Rozpočtování, odhady budoucího vývoje, reportování Finanční reportování Analýza Webových statistik Vyhodnocování průzkumů Analýza ETL procesů Může být použito pro jakýkoliv scénář, který používá agregovaná data a odpovědi na dotaz mají být rychlé pro různé úrovně detailu

Ukázka využití Jeden ze scénářů využití -> Excel jako OLAP klient

SQL Server 2014 Analysis Services OLAP Uspořádává a agreguje data z datových zdrojů Provádí výpočty, které je obtížné provést v rámci dotazu nad relační databází Podporuje rozšířené funkcionality BI, např. Klíčové ukazatele výkonu (KPI) Data mining Vyhledává vzory jak v relačních tak OLAP datech O jeho výsledky lze rozšířit OLAP databázi

Unified Dimensional Model (UDM) Představuje most mezi koncovým uživatelem a zdrojovými daty Konsoliduje obchodní pravidla do jediného modelu Je lepší alternativou k tradičním modelům V SSAS je tento model nazýván Kostka (Cube) UDM

Výhody UDM Umožňuje rozsáhlé rozšíření uživatelského modelu Umožňuje velmi výkonné získávání informací, rychlé interaktivní analýzy i nad velkým objemem dat Díky zahrnutí obchodních pravidel umožňuje širší analýzy Výsledný model abstrahuje od použitých datových zdrojů

Komponenty databáze Data Source Data Source View Cube Dimensions Measures Calculations Key Performance Indicators Actions Perspectives Translations

Data Source Obsahuje informace o připojení k datovému zdroji OLE DB Provider Managed.NET Provider Je podporován SQL Server i další populární databáze

Data Source View Popisuje definici jednotlivých prvků v datovém zdroji Pro klientské aplikace je neviditelný Výhody: Zaměřuje se pouze na podmožinu tabulek z datových zdrojů Umožňuje integrování více datových zdrojů Vyžaduje pouze read-only přístup ke zdrojovým datům Lze vyvíjet databázi i bez nutnosti připojení k datovým zdrojům Izoluje databázové objekty od změn provedených v datovém zdroji:

Cube Kombinace dimenzí a ukazatelů v jednotném koncepčním modelu Ukazatelé vycházejí z faktových tabulek Dimenze vycházejí z dimenzních tabulek Bohatý datový model je rozšířen o: Kalkulace Klíčové ukazatele výkonu (KPIs) Akce Perspektivy Překlady Partice

Dimenze Jednotlivé atributy jsou vytvořeny na základě jedné či více tabulek nebo pohledů z data source view Atributy odpovídají sloupcům dimenzní tabulky Atributy jsou organizovány do hierarchií Hierarchie Atributu obsahují jednu úroveň All a jednu úroveň typu List Uživatelské hierarchie jsou víceúrovňové kombinace atributů Mohou být zobrazeny ve složkách Přirozená hierarchie

Typy a charakteristiky dimenzí Time (Server time dimension) Obsah dimenze je založen na zvoleném období nikoliv na obsahu dimenzní tabulky Je užitečná, pokud je kostka založena na OLTP databázi Speciální: Account, Currency Řídí způsob agregace účtů za různé časové období Do kostky přidá schopnost provádět přepočty směnných kurzů Charakteristiky: Parent-child Write-enabled Linked

Vztahy dimenzí Definuje vztah mezi dimenzemi a skupinami ukazatelů Vztahy mohou být: Regular Reference Fact (Degenerate) Many-to-many Data mining

Measures Ukazatelé vycházejí z faktových tabulek Ukazatel je číselná hodnota, kterou lze agregovat Sum Count Avg Distinct count Min, Max Ukazatelé z jedné faktové tabulky jsou zastřešeny zpravidla jednou skupinou ukazatelů Skupina ukazatelů je propojena s jednotlivými dimenzemi (viz. vztahy dimenzí)

Základy MDX MDX je dotazovací jazyk na OLAP kostkou Pracuje s až 128 osami COLUMNS (0) ROWS (1) WHERE (2) PAGE (3) TUPLE - () SET - {} MDX = MultiDimensional EXpressions

Základní MDX dotaz Příklady MDX dotazů: SELECT FROM [CDT] SELECT NON EMPTY {[Measures].[Work Task Count]} ON COLUMNS, NON EMPTY {[Date].[Month].MEMBERS} ON ROWS FROM [CDT] WITH MEMBER [Measures].[Calc] AS [Measures].[Work Task Count] * 1.1 SELECT NON EMPTY {[Measures].[Calc]} ON COLUMNS, NON EMPTY {[Date].[Month].MEMBERS} ON ROWS FROM [CDT]

Tuple Jedná se o referenci na konkrétní adresu v kostce Reference se skládá z jednoho ukazatele a jednoho člena z jedné či více dimenzí Tuple je v MDX dotazu syntakticky uveden v kulatých závorkách Závorky nemusí být uvedeny v případě jednoduchého tuple, který se skládá z jednoho člena jedné dimenze ([Date].[Month].&[2014][10], [Measures].[Work Task Count])

Set Jedná se o sadu žádného, jednoho či více tuplů Nejčastěji se používají na jednotlivých osách MDX dotazu V MDX je set uveden ve složených závorkách {[Date].[Month].&[2014][10] : [Date].[Month].&[2014][12]} {[Date].[Month].&[2014][10], [Date].[Month].&[2014][12]}

Výpočty Jedná se o výrazy vyhodnocované až při zpracování dotazu jež nelze uložit ve faktové tabulce Typy výpočtu: Kalkulované atributy Pojmenované sady Přiřazení rozsahu (Scope) Výpočty jsou definovány v jazyce MDX MDX = MultiDimensional EXpressions

Klíčové ukazatele výkonu (KPIs) Kvantifikovatelné ukazatele porovnávající skutečný výkon s definovanými cíly Pokud jsou zobrazeny v souhrnu výsledků, ukazují celkové zdraví společnosti

Definice KPI Value Goal Status Trend

Actions Akce je uživatelem vyvolaná operace na základě vybrané kostky či její části Akce může být různého typu: Drillthrough Report Zavolání Url Akce může být definována nad různými objekty v kostce: Attribute member Cell Cube Dimension member Hierarchy Hierarchy member Level Level member

Perspectives Perspektiva je podmnožina kostky Kostka je implicitní perspektivou Perspektiva je uživateli zobrazována jako další kostka

Q & A Děkujeme za pozornost :o) Prostor pro Vaše dotazy......a pokud Vás téma zaujalo, kontaktujte nás. Hledáme šikovné spolupracovníky do teamu (i na part-time). Kontakt: informace@cleverdecision.com