Dátové sklady a OLAP

Podobné dokumenty
Tvorba logického a fyzického dátového modelu relačnej databázy pomocou nástrojov od firmy Oracle výukový tutoriál

Štruktúra údajov pre kontajner XML údajov 1. Dátové prvky pre kontajner XML údajov

Datové sklady. Ing. Jan Přichystal, Ph.D. 1. listopadu PEF MZLU v Brně

DOCHÁDZKOVÝ SYSTÉM SVYDO. RS Alfa, spol. s r.o., Košice

Microsoft Project CVIČENIE 6 1

MS Dynamics NAV 2017 Čo je nové?

Organizačné štruktúry.

MS PowerPoint - Úvod.

Implementace SAP S/4HANA je skutečně S Simple

7.1 Návrhové zobrazenie dotazu

Microsoft POWERPOINT XP

Základy business intelligence. Jaroslav Šmarda

Import Excel Univerzál

Zverejnené informácie k nevyčerpaným prostriedkom z plateného portálu.

1. Delenie funkcionálnych vrstiev. 2. Vrstva dopytu

Užívateľská príručka systému CEHZ. Základné zostavy Farmy podľa druhu činnosti

Dátové sklady Prehľad

Hromadná korešpondencia v programe Word Lektor: Ing. Jaroslav Mišovych

Databázové systémy. 10. přednáška

Program "Inventúra program.xlsm"

MATLAB (1) - úvod do programovania vedeckých problémov. LS 2017, 8.predn.

Centrálny GIS MV SR. Ing. Kamil FAKO, PhD. OA, SITB MV SR

Pracovné prostredie MS EXCEL 2003.

Formuláre PowerPoint MGR. LUCIA BUDINSKÁ,

Obsah. 1 Úvod do Wordu Práca s dokumentmi 33. Obsah. Predhovor 1 Typografická konvencia použitá v knihe 2

Návrh, implementácia a prevádzka informačného systému

Informační systémy 2006/2007

Moderné vzdelávanie pre vedomostnú spoločnosť/projekt je spolufinancovaný zo zdrojov EÚ. Grafy

SKLADOVÁ INVENTÚRA 1 VYTVORENIE INVENTÚRY. 1.1 Nastavenie skladovej inventúry

3 zdroje dat. Relační databáze EIS OLAP

Návod na udelenie oprávnenia na prístup a disponovanie s elektronickou schránkou orgánu verejnej moci

Ukladanie údajov a databázové systémy. Prof. MUDr. Martin Rusnák, CSc Prof. MUDr. Viera Rusnáková, CSc PhDr. Marek Psota, PhD

Matematika pre tretiakov. Ako reaguje séria učebných materiálov M. Belica a J. Striežovskej na zmeny v išvp

ANALÝZA PRÍPADNÉHO ROZDIELU A SPÔSOB JEHO ODSTRÁNENIA

Manuál na prácu s databázou zmlúv, faktúr a objednávok Mesta Martin.

Multihosting Užívateľská príručka

Spoločnosť Wüstenrot monitoruje všetky bezpečnostné informácie a udalosti v informačnom systéme

Databázové systémy. Dátové modelovanie - relačný model

Názov: Osmóza. Vek žiakov: Témy a kľúčové slová: osmóza, koncentrácia, zber dát a grafické znázornenie. Čas na realizáciu: 120 minút.

CERTIFIKAČNÉ ELEKTRONICKÉ TESTOVANIA - PERSPEKTÍVA

Možnosti uplatnenia finančných mechanizmov pri hydrických funkciách lesov. Ing. Miroslav Kovalčík, PhD. Ing. Martin Moravčík, CSc.

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9

Spracovanie informácií

Používateľská príručka k aplikácii na SOČ

Ing. Marián Vasilečko, TT-IT s.r.o. Trnava GIS MESTA TRNAVA júna Konferencia CGIT 2013 hotel Partizán, Tále

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

TomTom Referenčná príručka

MS OFFICE OUTLOOK 2007

Používateľská príručka portálu

ZRÝCHLENIE EVIDENCIE VO VÝROBE

Hotline - účtovníctvo tel.: 0905/ , denne od 8 00 do HUMANET ÚČTOVNÍCTVO

Help pre Excel add-in "FinstatSk_FirmyDoExcelu"

POŽIADAVKY NORMY ISO 9001: OKTÓBRA 2017 HOTEL ELIZABETH TRENČÍN NORMA ISO 9001:2015 AKO SPRÁVNE POROZUMIEŤ POŽIADAVKÁM NORMY ISO 9001:2015

GIS riešenia pre samosprávy

Business Intelligence

TESTOVANIE SOFTVÉRU MANUÁLNE

Paretova analýza Regulačný diagram Bodový diagram

VYSPORIADANIE PREHRADENÝCH ZÁVÄZKOV A POHĽADÁVOK

Používateľské požiadavky na platformu FASTER: Výsledky prieskumu

Integrovaný systém manažérstva Nové požiadavky noriem ISO

Zásobovanie, výroba a odbyt

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

Základní informace o co se jedná a k čemu to slouží

Webové služby a bezpečnosť. Jan Jusko

LANGMaster etestme.com Možnosti využitia testovacej platformy a cenník služieb

Postup registrácie certifikátov do Windows

10. Datové sklady (Data Warehouses) Datový sklad

P R O L U C. POZNÁMKY individuálnej účtovnej závierky pre rok 2014

Úvodná strana IS ZASIELKY Prvky úvodnej stránky:

Bezpečnostný projekt egovernmentu

Katalóg cloudových služieb


Integrovaný systém manažérstva Nové požiadavky noriem ISO

Osoba podľa 8 zákona finančné limity, pravidlá a postupy platné od

Dátové rozhranie pre výmenu dát v stavebníctve NDS. Verzia 1.1

Návod na postúpenie podania orgánom verejnej moci

Referenčná ponuka na prístup ku káblovodom a infraštruktúre. Príloha 7 Poplatky a ceny

eformulár ČSOB Leasing užívateľský manuál verzia 1.0

Operačný systém Úvodná prednáška

Plánovanie rozvoja miest vo svetle adaptácie sa na zmenu klímy Trnava, Rozvoj miest a adaptácia na zmenu klímy

DOCHÁDZKA

Predaj cez PC pokladňu

Prínosy energetického manažmentu.

Vytvorenie účtovnej knihy

Systémy manažérstva kvality podľa normy ISO 9001: 2015

TELEKOMUNIKAČNÉ SLUŽBY SPOLOČNOSTI LAST MILE GALVÁNIHO 6

CHARAKTERISTIKA JEDNOROZMERNÝCH ŠTATISTICKÝCH SÚBOROV

Krok 1 Pochopenie systémov. Krok 2 Hodnotenie silných a slabých stránok. Krok 3 Zber podkladov. - hodnotenie - overenie - postupy a smernice

nastavenie a realizácia vzájomných zápočtov v Money S4 / Money S5

ONLINE POBOČKA. pre zamestnávateľov MANUÁL

Návod na udelenie oprávnenia na prístup a disponovanie s elektronickou schránkou a jeho zneplatnenie

kapitola 2 Datové sklady, OLAP

Informácia k odoslaniu Hlásenia DEV-MES(NBS)1-12 cez informačný systém Štatistický zberový portál

zákon č. 223/2001 Z.z. o odpadoch... zákon č. 17/2004 Z.z. o poplatkoch za uloženie zákon č. 582/2004 Z.z. o miestnych daniach a

ŠTATISTIKA V EXCELI 2007

Ako sme postavili Benátky

EKONOMICKÁ UNIVERZITA V BRATISLAVE

Práca s výkazmi v prostredí BEx Analyzer

Postup a podmienky spracovania výkazov INTRASTAT. Evidencia dod. faktúry podklady pre výkaz PRIJATIE TOVARU

1. prednáška MARKETING MANAŽMENT

Transkript:

Dátové sklady a OLAP

OBSAH Dátové sklady Dátové trhy Metódy budovania dátového skladu Mechanizmus napĺňania dátového skladu OLAP (definícia, typy) Operácie OLAP Prezentácia údajov v dátovom sklade Nástroje pre prezentáciu údajov dátového skladu

Dátové sklady B.Inmon: Dátový sklad je úložisko subjektovo orientovaných (orientované na predmet záujmu, nie na aplikáciu, v ktorej boli vytvorené), integrovaných(jednotná terminológia), časovo premenlivých (viac časových úsekov) a nemenných(dáta sa nemenia a neodstraňujú) historických dát použitých pre podporu rozhodovania Atomické a sumárne dáta

Dátové sklady

Dátové trhy Podmnožina dátového skladu, určená pre menšie organizačné jednotky firmy (účtovníctvo, marketing) Vytvárajú sa pre jednoduchšiu orientáciu používateľov, aj kvôli bezpečnosti citlivých údajov

Budovanie dátového skladu Metóda veľkého tresku Vytvorenie dátového skladu implementáciou jedného projektu Fázy: Analýza požiadaviek zo strany podniku Vytvorenie dátového skladu Vytvorenie prístupu buď priamo, alebo cez dátové trhy Nie je to veľmi dobrý prístup, pretože proces vytvárania dátového skladu je dynamický, môžu sa zmeniť požiadavky zákazníka, ako aj využiteľné technológie Je potrebné dlhé čakanie na návratnosť investície

Budovanie dátového skladu II. Prírastková metóda Vytvorenie dátového skladu po etapách Vytvorenie niekoľkých dátových trhov, postupné dopĺňanie projektu Iteratívny proces Výhody: Kontinuita budovaného projektu Implementácia škálovateľnej, rozšíriteľnej architektúry Rýchlejšia návratnosť investícií Fázy budovania: stratégia Definícia analýza návrh Zostavenie produkcia

Budovanie dátového skladu III. Metódy budovania prírastkovou metódou: Zhora nadol Zdola nahor

Mechanizmus napĺňania dátového skladu Extrakcia, transformácia a zavedenie údajov z produkčných systémov do DW. Etapy: 1. Definícia toho, kde sa dáta nachádzajú a popísať štruktúry, v ktorých sú uložené 2. Definovať mapovanie cieľových dát na zdrojové 3. Popísať spôsob dekódovania a transformácie dát 4. Určiť procesy, ktoré budú zabezpečovať napĺňanie DW 5. Určiť akým spôsobom budú dáta v DW obnovované

Mechanizmus napĺňania dátového skladu Spôsoby napĺňania: 1. Prvotné naplnenie 2. Naplnenie v prevádzke 1. Vytváranie snímok Vytvárajú sa snímky,po ukončení obdobia sa vytvorí konečná snímka, redundantné snímky sa odstránia bez straty informačnej hodnoty. Väčšie nároky na kapacitu úložiska, vyššie zaťaženie prenosových liniek Transparentnosť implementácie 2. Prírastkový spôsob Prenáša do DW iba zmeny v transakčnom systéme Minimalizuje zaťaženie prenosových liniek Neustále sledovanie zmien a stavu DW môže priniesť skryté problémy

Reprezentácia dát v dátovom sklade Dáta môžu byť reprezentované 1. Relačným dátovým modelom Dáta uložené v tabuľkách, Každý riadok obsahuje dáta,stĺpce predstavujú údaje o atribútoch 2. Multidimenzionálnym databázovým modelom Dátový model je možné zobraziť ako n-rozmernú kocku

Relačný databázový model

Multidimenzionálny databázový model

Relačný vs. Multidimenzionálny model Relačný model + potenciál odborníkov vo firmách, rutinná práca s modelom +využitie v transakčných databázach, aj dátových skladoch Relačný model - Potenciálne kapacitné obmedzenia - Obmedzenia dostupnosti dát v rozumnou čase Multidimenzionálny model + rýchly a komplexný prístup k veľkému množstvu údajov + prístup k multidimenzionálnym aj relačným dátovým štruktúram + možnosť komplexných analýz + schopnosti pre modelovanie a prognózy Multidimenzionálny model - Problémy pri zmenách dimenzií, menšia flexibilita - Vyššie kapacitné nároky

OLAP On-Line Analytical Processing Voľne definované princípy tvoriace rámec pre podporu rozhodovania

Typy OLAP-u 1.Relačný OLAP (ROLAP) Využíva dáta z relačného dátového skladu, ktoré poskytuje používateľovi ako multidimenzionálny pohľad Data a metadata sú takisto uložené v relačnej databáze a sú využité k tomu, aby boli pomocou nich generované príkazy SQL potrebné k vyhotoveniu používateľského dopytu Nevzniká redundancia 2.Multidimenzionálny OLAP (MOLAP) Ukladá dáta vo vlastných dátových štruktúrach a sumároch Počas tohto procesu vykoná čo najviac medzivýpočtov Výhodou je rýchly prístup k dátam, nevýhodou redundancia údajov 3.Hybridný OLAP (HOLAP) Údaje zostávajú v relačných databázach, agregáty sú uložené v multidimenzionálnej štruktúre

Analýza OLAP Pojmy II. Dimenzia Dimenzia obsahuje logicky alebo hierarchicky usporiadané údaje Tabuľky dimenzií Menšie než tabuľky faktov Dáta sa v nich často nemenia (výnimkou napr. dáta o zákazníkoch) Často sa používajú časové, produktové a geografické dimenzie

Analýza OLAP pojmy III. Dimenzia

Analýza OLAP Pojmy Fakt Fakt numerická merná jednotka Tabuľka faktov najväčšia tabuľka v databáze, obsahuje veľký objem dát Sledovaný fakt a odkazy (cudzie kľúče) na tabuľky jednotlivých dimenzií

Analýza OLAP Pojmy Tabuľka Faktov

Analýza OLAP pojmy IV. Dimenzia

Analýza OLAP pojmy V. Dimenzia

Analýza OLAP pojmy VI. Hierarchie Hierarchie dimenzie majú obvykle stromovú (hierarchickú štruktúru) Napr.: Dimenzia/ úrovne REGIÓN PRODUKT ČAS NAJVYŠŠIA Kontinent Druh Rok... Štát Kategória Kvartál... Kraj Subkategória Mesiac NAJNIŽŠIA Mesto Názov Deň

Analýza OLAP pojmy VII. Hierarchie II. Roll-up vystupovanie na vyššie úrovne danej dimenzie Drill-down zostupovanie na nižšie úrovne Slice projekcia cez jednu dimenziu Dice projekcia cez viac dimenzií

Prezentácia údajov v dátovom sklade Možnosti prezentácie údajov v dátovom sklade: 1. SQL Používateľský dopyt Na základe SQL dopytu sa vytvorí zostava dát Výsledky takýchto dopytov sú spravidla v RD uložené ako pohľady a sprístupnené patričnej skupine používateľov Typy dotazov: Základné dopyty Hierarchické dopyty Dopyty s využitím kalkulácií Využitie atribútov pre agregáciu

Príklad SQL dopytu

Výsledok vnoreného dopytu

Výsledok vonkajšieho dopytu

Prezentácia údajov v dátovom sklade 2. Tabuľka Umožňuje zobrazenie výsledku používateľského dopytu Typy: 1. tabuľka hodnota sledovaného faktu a požadovaných dimenzií sa nachádza len na jednej osi 2. krížová tabuľka hodnoty požadovaných dimenzií sú na oboch osiach,v ich priesečníku je zobrazená hodnota sledovaného faktu pre požadované hodnoty

Prezentácia údajov v dátovom sklade Jednorozmerná tabuľka Krížová tabuľka

Prezentácia údajov v dátovom sklade 3. graf Prezentácia údajov v grafickej forme Typy grafov: Stĺpcový Koláčový Čiarový Pruhový Plošný Kombinovaný

Nástroje pre prezentáciu údajov dátového skladu 1. Analytic Workspace Manager (AWM) Slúži na realizáciu multidimenzionálnej dátovej kocky a následnú realizáciu jednoduchých analýz Pracuje na multidimenzionálnej úrovni (MOLAP) Oproti ostatným analytickým nástrojom umožňuje len malé spektrum možností pre realizáciu analýz

Ukážka AWM

Nástroje pre prezentáciu údajov dátového skladu 2. OracleBI Spreadsheet Add-In for Excel Umožňuje spracovanie reportov z multidimenzionálnej kocky v programe Microsoft Excel Pracuje s multidimenzionálnou databázou (MOLAP) Umožňuje pre realizáciu reportov využívať okrem funkcionality BI pluginu aj samotné vstavané funkcie MS Excel

Ukážka BI Add-in for Excel

Nástroje pre prezentáciu údajov dátového skladu 3. Oracle Discoverer Umožňuje tvorbu analýz a používateľských zostáv v prostredí špeciálne pre to určenom Pracuje s dátami na relačnej úrovni (ROLAP) Má 2 časti: Administrator administrátorská časť realizácie používateľského dopytu ( definícia hierarchií, vytvorenie väzieb, definovanie privilégií...) Desktop časť pre realizáciu používateľských zostáv zo schém definovaných v časti Administrator

Ukážka Oracle Discoverer

Ďalšie možnosti spracovania a analýzy dát Vytváranie kalkulovaných (vypočítavaných) faktov Vytváranie predpovedí Zložité agregácie Vytváranie reportov Vývoj JAVA aplikácií pre OLAP