Návrh datového skladu z hlediska zdrojů



Podobné dokumenty
Trendy v IS/ICT přístupy k návrhu multidimenzionální modelování

BI v rámci IS/ICT komponenty BI architektura. Charakteristika dat a procesů v IS/ICT. Datové sklady ukládání dat návrh datového skladu

Databázové systémy. Doc.Ing.Miloš Koch,CSc.

Zdroje informací v organizaci IS/ICT BI v rámci IS/ICT historie architektura OLTP x DW ukládání dat

3 zdroje dat. Relační databáze EIS OLAP

ANALÝZA NÁKUPNÍHO KOŠÍKU SEMINÁŘ

Databáze Bc. Veronika Tomsová

Datový sklad. Datový sklad

S M Ě R N I C E č. 6/2014 ministra financí

Obsah. Úvod do problematiky. Datový sklad. Proces ETL. Analýza OLAP

Základní registry. Kvalita dat a jejich čištění v základních registrech veřejné správy. Připraveno pro konferenci ISSS. Ing.

Microsoft Access tvorba databáze jednoduše

Ing. Jiří Fejfar, Ph.D. Geo-informační systémy

Modely datové. Další úrovní je logická úroveň Databázové modely Relační, Síťový, Hierarchický. Na fyzické úrovni se jedná o množinu souborů.

10. Datové sklady (Data Warehouses) Datový sklad

Znalostní báze pro obor organizace informací a znalostí

INSPIRE a Územní plánování v ČR

Uživatelský manuál. Připojení přístroje SDT170 k aplikaci DDS2000

Efektivní práce s Excelem (středně pokročilí uživatelé)

Microsoft. Access. Nová databáze, návrh tabulky. Mgr. Jan Veverka Střední odborná škola sociální Evangelická akademie

Lekce 9 - Migrace dat

MINISTERSTVO PRO MÍSTNÍ ROZVOJ Č.j. 7022/ R O Z H O D N U T Í č. 19/2016. ministryně pro místní rozvoj. ze dne

Příprava dat v softwaru Statistica

Správa VF XML DTM DMVS Datový model a ontologický popis

Data management plan (DMP)

Import se spouští v Číselníku zboží stiskem klávesové kombinace <Shift F6>. Zobrazí se parametry:

Algoritmizace prostorových úloh

4IT218 Databáze. 4IT218 Databáze

Elektronické zpracování požadavků - evidence v databázi akcí

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Kapitola 4. Úvod 11. Stručný úvod do relačních databází 13. Platforma 10g 23

Transformace dílčích datových zdrojů na jednotnou datovou platformu kontaminovaných míst, analýza potřeb uživatelů a vývoj aplikací

Business Intelligence

PRAVIDLA PRO PROVÁDĚNÍ PRŮBĚŽNÉ AKTUALIZACE PLÁNU ROZVOJE VODOVODŮ A KANALIZACÍ KARLOVARSKÉHO KRAJE

Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová. 5. Statistica

Zhodnocení architektury podniku. Jiří Mach

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

Skartační řízení v elektronické podobě. předpokládaný postup AHMP

Ing. Roman Danel, Ph.D. 2010

MISYS import dat MISYS. Import dat. II/2012 Gepro, spol. s r.o. Ing. Stanislav Tomeš

Znalostní báze pro obor organizace informací a znalostí

Data v informačních systémech

Integrace dat. RNDr. Ondřej Zýka

JRV.CZ s.r.o. Bulharská Brno RosaData TM DEVELOPERSKÝ PROJEKT

SKLAD ODPADŮ modul EKO-KOM

Registr Osob. zveřejněno podepsáno

1.1 Úvod. 1.2 Dohadné položky (DP)

Základy business intelligence. Jaroslav Šmarda

Ukázka testu Informatiky pro přijímací zkoušky do navazujícího magisterského studia

STRATEGIE A PROJEKTY ODBORU INFORMATIKY MHMP

Add-on modul Microsoft Dynamics NAV. manuál

Algoritmizace prostorových úloh

Otázka č. 1 (bodů za otázku: 4)

Program finanční podpory poskytování sociálních služeb v Olomouckém kraji ZVLÁŠTNÍ ČÁST

1 Tabulky Příklad 3 Access 2010

Informační systémy 2006/2007

Business Intelligence

Každý písemný, obrazový, zvukový, elektronický nebo jiný záznam, ať již v podobě analogové či digitální, který vznikl z činnosti původce.

Integrace dat. RNDr. Ondřej Zýka

Základy databází. O autorech 17 PRVNÍ ČÁST. KAPITOLA 1 Začínáme 19

5 Požadavky a jejich specifikace

Portál digitální mapy veřejné správy Plzeňského kraje

TRANSPORTY výbušnin (TranV)

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9

Projekt SEPIe - Datový sklad a analytická nadstavba MIS - manažerský informační systém pro vedoucí zaměstnance resortu MV (konference)

Dlouhodobý vývoj Jihomoravského kraje

HLAVA I OBECNÁ PRAVIDLA PRO FORMÁT, STRUKTURU, PŘENOS A ZABEZPEČENÍ ÚČETNÍCH ZÁZNAMŮ

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Přenos mezi zkušební organizací a notebooky zkušebních orgánů příslušné

Obsah přednášky. Databázové systémy RDBMS. Fáze návrhu RDBMS. Coddových 12 pravidel. Coddových 12 pravidel

Logický datový model VF XML DTM DMVS

Univerzita Karlova. Opatření rektora č. 53/2017

Program finanční podpory poskytování sociálních služeb v Olomouckém kraji ZVLÁŠTNÍ ČÁST

Obsah přednášky. Databázové systémy. Normalizace relací. Normalizace relací. Normalizace relací. Normalizace relací

Informační systém o státní službě

Etapy hodnocení výsledků výzkumných organizací a uplatnění připomínek a způsob vypořádání připomínek

Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/ Vzdělávání v informačních a komunikačních technologií

Příloha: Dodatečné informace, včetně přesného znění žádosti dodavatele o dodatečné informace

Datové sklady ve školství

Královéhradecký kraj

STATISTICA Téma 8. Regresní a korelační analýza, regrese prostá

POPIS STANDARDU CEN TC278/WG7. 1 z 5. draft prenv Geografická silniční databáze. Oblast: ZEMĚPISNÁ DATA V SILNIČNÍ DOPRAVĚ ( GRD)

Geoportál DMVS využití a další rozvoj

Informační a znalostní systémy jako podpora rozhodování

Výměnný formát XML DTM DMVS PK

CPM/BI a jeho návaznost na podnikové informační systémy. Martin Závodný

Analýza podkladů a návrh DM

VIZE INFORMATIKY V PRAZE

Výsledek transformace dalších informačních zdrojů o kontaminovaných místech do NIKM (SEKM 3) Ing. Vladimír Hudec ARCDATA PRAHA, s.r.o.

Strategické cíle a jejich implementace

Význam a způsoby sdílení geodat. Ing. Petr Seidl, CSc. ARCDATA PRAHA, s.r.o.

Elektronické skartační řízení

Informační systémy 2008/2009. Radim Farana. Obsah. Základní principy XML

zobrazuje názvy polí, vložené hodnoty jednotlivých záznamů, lze v něm zadávat data (přidávat záznamy) v návrhovém zobrazení:

Vazba na Cobit 5

Kapitola 1: Úvod. Systém pro správu databáze (Database Management Systém DBMS) Účel databázových systémů

Elektronické skartační řízení

Rozdělení technické dokumentace

Novinky mobilních aplikací imos a imiks

Databáze. Logický model DB. David Hoksza

Transkript:

Návrh datového skladu Návrh datového skladu OLTP ETL OLAP, DM Operativní data Datové sklady Zdroje dat Transformace zdroj - cíl Etapy realizace 1

Návrh datového skladu Hlavní úskalí analýzy a návrhu spočívá právě v této části Problém se zdroji dat existence přístup vlastnictví důvěryhodnost konzistence dat Konzistence dat v OLTP systémech zajištěna specifikací integritních omezení navržením vhodných transakcí u datového skladu je jeho konzistence předpokládána Návrh datového skladu Řešení konzistence dat obsažených v datovém skladu je přeneseno k jeho tvorbě ETL procesu, eventuálně k EAI konzistence je zaměřena na zdroje dat jedná se o zjištění konzistence dat u každého zdroje zajištění konzistence s ostatními zdroji teprve po posouzení zdrojů je možné přistoupit k vlastnímu řešení 2

ETL proces extrakce, filtrování, čištění a vkládání ze zdrojových systémů do DW extrakce transformace restrukturalizace dat do podoby odpovídající DW filtrace (odstranění chybných i neúplných záznamů) standardizace dat odstranění nežádoucích atributů denormalizace dat kombinace datových zdrojů vkládání a indexace konzistence dat samých, konzistence s ostatními daty v DW zdroje důvěryhodnost Zdroje dat vše nebo část (atrib., projekce, selekce) porovnat stejné údaje z různých zdrojů z hlediska obsahu formátu významu stejné zdroje jsou různě pojmenovány a naopak 3

Zdroje dat pokr. změny zdrojů během let struktura dat ze stejných zdrojů (archiv a současnost) formálně stejný objekt z více zdrojů ( zákazník: zákazník x potenc. zákazník) četnost přenášení zdrojů Zdroje dat pokr. u atributů: identifikátor, název, typ dat, měr.j., doména, význam, vlastník typ atributu (dimenze, fakt), typ indexu, pro měr.j.: konverzní poměry (koeficienty převodu, popř. koeficienty proměnné v čase) pro dimenze klíče, definice hierarchie/hierarchií přiřazení zdrojových atributů cílovým, transformace, změny formátů vazby mezi zdroji ( kdo komu poskytuje data) 4

ETL pravidla pro přenos prosté kopírování přepočty jednotek standardizace formátů odstraňování duplicit v datech z různých zdrojů rozdělení atributu do několika cíl. atributů ( př. adresa) slučování atributu do jednoho odvozování nových atributů (př. datum) převodní funkce některé použijí pro více atributů, jinde pro atribut samostatná funkce Po přenosu Kontrola kvality a ošetření chybějících údajů vypuštění záznamů kde chybí jednotné označení chybějících údajů a upozornění na neúplnost dat rozhodnutí na základě charakteru konkrétní oblasti řešení Statistika pro každý atribut rozsah (doména) a četnost hodnot, které může nabývat (lze odhalit chybné hodnoty) 5

Etapy realizace Závisí na tom, zda budou požadována data současná, či i archivní vlastní vytvoření aktualizace ošetření případných změn Etapy realizace vlastní vytvoření DW/části DW více zdrojů během let více zdrojů v jednom období jedná se o různé procesy v návrhu a řešení transformací pro vstup dat do datového skladu V této etapě se jedná výhradně o ETL procesy 6

Etapy realizace Aktualizace nové přírůstky při stejných zdrojích dat jako v předchozí etapě pouze se určí, kdy a jakým způsobem budou přírůstky aktualizovány při jiných zdrojích dat než v předchozí etapě návrh a realizace nových procesů, kterými by byla požadovaná data ze zdroje/ů extrahována, transformována a vložena do datového skladu V této etapě se jedná o ETL procesy i o řešení pomocí EAI a on-line přihrávání. Etapy realizace ošetření případných změn změny zdrojů dat /inovace IS s dostatečným předstihem třeba zajistit informace o plánovaných změnách požadavků na datový sklad 7