Trendy v IS/ICT přístupy k návrhu multidimenzionální modelování



Podobné dokumenty
Návrh datového skladu z hlediska zdrojů

Zdroje informací v organizaci IS/ICT BI v rámci IS/ICT historie architektura OLTP x DW ukládání dat

BI v rámci IS/ICT komponenty BI architektura. Charakteristika dat a procesů v IS/ICT. Datové sklady ukládání dat návrh datového skladu

DATABÁZOVÉ SYSTÉMY. Vladimíra Zádová, KIN, EF TUL - DBS

Datový sklad. Datový sklad

Datové sklady. Multidimenzionální modelování Modely datového skladu Návrh datového skladu v rámci návrhu IS/ICT. Vladimíra Zádová, KIN, EF, TUL

Business Intelligence

Podnikové informační systémy Jan Smolík

3 zdroje dat. Relační databáze EIS OLAP

Základy business intelligence. Jaroslav Šmarda

Konceptuální modely datového skladu

Business Intelligence

10. Datové sklady (Data Warehouses) Datový sklad

Ing. Petr Kalčev, Ph.D.

Ing. Roman Danel, Ph.D. 2010

Informační systémy 2006/2007

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1

Databáze Bc. Veronika Tomsová

Data v informačních systémech


kapitola 2 Datové sklady, OLAP

Architektury Informačních systémů. Jaroslav Žáček

Multidimenzionální modelování v rámci analýzy a návrhu IS/ICT

PODNIKOVÁ INFORMATIKA

Základní informace o co se jedná a k čemu to slouží

Architektury Informačních systémů. Jaroslav Žáček

III. Informační systém & databáze

Bu B sin i e n s e s s I n I te t l e lig i en e c n e c Skorkovský KA K M A I, E S E F MU

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9

Business Intelligence

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

Business Intelligence. Adam Trčka

ARCHITEKTURA INFORMAČNÍCH SYSTÉMŮ PODLE ÚROVNĚ ŘÍZENÍ

Infor Performance management. Jakub Urbášek

Obsah. Úvod do problematiky. Datový sklad. Proces ETL. Analýza OLAP

T T. Think Together Martin Závodný THINK TOGETHER. Business Intelligence systémy Business Intelligence systems

4IT218 Databáze. 4IT218 Databáze

In orma I a. O nl Dva. Počítačové aplikace v podnikové a mezipodnikové praxi Technologie informačních systému R1zení a rozvoj podnikové informatiky

Marketingová komunikace. 3. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK3PH (vm3bph)

Databázové systémy. 10. přednáška

Datové sklady. Ing. Jan Přichystal, Ph.D. 1. listopadu PEF MZLU v Brně

Management IS. Doc.Ing.Miloš Koch,CSc. 22/ 1

Informace v organizaci. Vladimíra Zádová, KIN, EF TUL

KIS A JEJICH BEZPEČNOST-I

Datová kvalita základ úspěšného BI. RNDr. Ondřej Zýka, Profinit

CPM/BI a jeho návaznost na podnikové informační systémy. Martin Závodný

INFORMAČNÍ SYSTÉMY (IS) Ing. Pavel Náplava Katedra počítačů K336, ČVUT FEL Praha 2004/2005

Informační systémy 2008/2009. Radim Farana. Obsah. Obsah předmětu. Požadavky kreditového systému. Relační datový model, Architektury databází

Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph)

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

Analýza nestrukturovaných dat pomocí Oracle Endeca Information Discovery

NÁSTROJE BUSINESS INTELLIGENCE

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Obsah Úvod 11 Jak být úspěšný Základy IT

Snadný a efektivní přístup k informacím

Modelování a návrh datových skladů

Získávání znalostí z databází. Alois Kužela

Profitabilita klienta v kontextu Performance management

Management informačních systémů. Název Information systems management Způsob ukončení * přednášek týdně

Úvodní přednáška. Význam a historie PIS

2. Modelovací jazyk UML 2.1 Struktura UML Diagram tříd Asociace OCL. 3. Smalltalk 3.1 Jazyk Pojmenování

Inteligentní zpracování prostorových dat

Databázové a informační systémy

Moderní metody automatizace a hodnocení marketingových kampaní

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Databázové systémy. Doc.Ing.Miloš Koch,CSc.

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Získávání dat z databází 1 DMINA 2010

GIS jako důležitá součást BI. Jan Broulík, Petr Panec ARCDATA PRAHA, s.r.o.

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Využití IT nástrojů pro měření a řízení výkonnosti. Michal Kroutil

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence

Systémy pro podporu rozhodování. Datové sklady, OLAP

ANALÝZA NÁKUPNÍHO KOŠÍKU SEMINÁŘ

Hospodářská informatika

BA_EM Electronic Marketing. Pavel

Nová dimenze rozhodovacího procesu

Analýzou dat k efektivnějšímu rozhodování

Datová věda (Data Science) akademický navazující magisterský program

Business Intelligence a datové sklady

Zkušenosti s Business Intelligence ve veřejném sektoru České republiky

<Insert Picture Here> Na co se můžete s Oracle BI těšit

Modelování procesů s využitím MS Visio.

DI3MK_EPP2 Ekonomika Ekono a řízení mika průmyslových podn průmyslových iků podn iků

Analýza a modelování dat. Přednáška 8

Systémy pro podporu. rozhodování. 2. Úvod do problematiky systémů pro podporu. rozhodování

Moderní systémy pro získávání znalostí z informací a dat

Dobývání znalostí z databází. Databáze. datum jmeno prijmeni adresa_ulice adresa_mesto cislo_uctu platba zustatek

DOBÝVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Databáze. datum jmeno prijmeni adresa_ulice adresa_mesto cislo_uctu platba zustatek

SYSTÉMY ŘÍZENÍ PODNIKU OKRUHY OTÁZEK KE ZKOUŠCE Z PŘEDMĚTU MPH_SYRP V magisterském studiu

Surfujte v business analýze jako profík. Naučíme Vás podpořit klíčová rozhodnutí firmy.

On line analytical processing (OLAP) databáze v praxi

Produkty třídy BYZNYS

Zhodnocení architektury podniku. Jiří Mach

MBI - technologická realizace modelu

Přehled systému Microsoft SQL Server. Komu je kniha určena Struktura knihy Nejvhodnější výchozí bod pro čtení knihy Konvence a struktura knihy

Manažerský reporting a finanční plánování Targetty

Transkript:

Trendy v IS/ICT přístupy k návrhu multidimenzionální modelování Aplikace IS/ICT BI SCM e-business ERP ERP CRM II e-business Aplikace pro podporu základních řídících a administrativních operací 1

Informační systémy na počátku 3. tisíciletí pro řízení vnitřních procesů back-office aplikace pro podporu základních řídících administrativních operací podniku pro řízení vztahů podniků s okolím front-office aplikace, aplikace s přidanou hodnotou (value-added ) pro rozvoj řízení podniku a podporu rozhodování back-office aplikace Aplikace pro řízení vnitřních procesů podniku - klasické celopodnikové aplikace ERP (Enterprise Resource Planning) Aplikace pro podporu základních řídících a administrativních operací podniku kancelářské systémy řízení pracovních toků (workflow) aplikace a technologie pro správu dokumentů všeobecné informace a instrukce (hlavně na bázi Intranetu Vladimíra ) Zádová, KIN, EF TUL 2

Aplikace pro řízení s okolím vztahů organizací mění kooperace mezi podniky CRM (Customer Relationship Management) elektronické podnikání SCM (Supply Chain Management) CRM procesy a aktivity, které souvisí se zákazníkem existujícím či potenciálním podpora prodeje - SFA (Sales Force Automation ) podpora zákazníka - CSS (Customer Service and Support ) podpora marketingu - EMA (Enterprise Marketing Automation) 3

Elektronické podnikání elektronický obchod (e-commerce) elektronické zásobování (e-procurement) elektronická tržiště (Marketplaces) Elektronické obchodování rozlišuje realizace obchodních vztahů mezi dvěma organizacemi -B2B, B2C, B2R, B2G, B2E (R - reseller, G - government, E -employee) SCM, SCM/APS koordinuje toky výrobků, služeb, informací a financí mezi dodavateli surovin, jejich zpracovateli, výrobci, obchodníky, zákazníky dvě kategorie aplikace pro plánování optimální způsob směrování množství materiálu a zboží potřebného v místech určení aplikace pro realizaci fyzické zásoby, obrátky zboží, objednávek a dodávky materiálu, finance Pozn.: APS =Advanced Planning and Schedulling (systém pokročilého plánování) 4

Aplikace pro podporu rozhodování Business Intelligence EIS (Executive Information Systems - manažerské informační systémy) datové sklady ( Data Warehouse) datová tržiště (Data Mart) dolování dat (Data Mining), OLAP (On-line Analytical Processing), reporting.. Customer Intelligence CRM + BI = CI Aplikace pro podporu rozhodování Business Intelligence EIS (Executive Information Systems - manažerské informační systémy) datové sklady ( Data Warehouse) datová tržiště (Data Mart) dolování dat (Data Mining), OLAP (On-line Analytical Processing), reporting.. Customer Intelligence CRM + BI = CI 5

Obecná koncepce architektury BI Zdroj: Novotný, Pour, Slánský: Business Intelligence, Grada 2005 IS/ICT - vztahy mezi daty a procesy OLTP ETL OLAP, DM, Operativní data Datové sklady OLAM, EIS 6

Procesy v BI dotazy/reporting dotazy na to CO je v databázi OLAP PROČ jsou některé fakty pravdivé uživatel generuje hypotézu a OLAP slouží k jejímu ověření je závislý na schopnostech analytika, ten se iterací dostává k výsledku DM představuje nástroje, které generují hypotézy a pokračují v provádění objevování - bez navádění uživatelem 7

Reporting standardní dotazování jedná se zejména o SQL dotazy v relačním prostředí výstupy standardní předpřipravené dotazy, nepredikovatelné ad hoc dotazy určené zejména pro nižší management OLAP = Online Analytical Processing def. Definovaná řada principů, které poskytují dimenzionální rámec pro podporu rozhodování. Dynamická syntéza, analýza a fúze velkého objemu multidimenzionálních dat. OLAP systémy pracují s analytickými informacemi, primární zdroje dat jsou OLTP systémy, důl. faktor času 8

drill-down, roll-up Základní operace OLAP snížení, zvýšení stupně agregace slicing (selekce), dicing provedení řezu v multidimenzionální databázi pivoting mění úhel pohledu na data ( jedná se o prezentaci obsahu) drill across spojení tabulek faktů přes tabulky dimenzí ( na stejné úrovni granularity) Operace různě kombinovány v jedné i ve více dimenzích ovlivňují podobu datového skladu Dolování dat, Data Mining Dolování dat je proces výběru, prohledávání a modelování ve velkých objemech dat sloužící k odhalení dříve neznámých vztahů mezi daty za účelem získání obchodní výhody Cíl: obchodní výhoda řešení konkrétního problému nalezení cesty k zlepšení procesu předem definován, na jeho základě připravena data; není jednorázová analýza příprava podnikových procesů - aby umožnily využívání analýz (kontinuálně) a podporovaly zpětné vazby od uživatelů. Zpětné vazby ovlivňují proces sběru dat i definice nových cílů. 9

Dolování dat a objevování znalostí v datech Knowledge Discovery in Databases ( KDD, objevování znalostí v datech ) obecně netriviální proces objevování platných, nových, potenciálně užitečných vzorů z dat. Dolování dat ( Data Mining) pouze krok v procesu KDD založený na aplikaci výpočetních technik, které na základě daných omezení poskytují vzory či modely nad danými daty Dolování dat a objevování znalostí v datech vyhodnocení vzorů data relevantní pro úlohu dolování dat DW selekce čištění dat integrace dat DB 10

fáze procesu KDD selekce výběr nebo segmentace dat podle kriteria, výběr vzorků dat předzpracování dat pro efektivní vyhodnocení dotazu čištění dat od nepotřebných dat, úprava formátů dat transformace pro obohacení použitelnosti dat data mohou být rozšířena o další atributy (např. demografické z externích zdrojů) dolování dat extrakce vzorů z dat interpretace a vyhodnocení identifikované vzory jsou interpretovány jako znalosti lze je použít k podpoře rozhodování Dolování dat Není samostatný vědní obor, používané metody patří do statistiky (např. klasifikace, regrese, časové řady, shlukování, asociační analýza, rozhodovací stromy), umělé inteligence (např. genetické algoritmy, neuronové sítě)... 11

ETL ETL proces extrakce, filtrování, čištění a vkládání ze zdrojových systémů do DW extrakce transformace restrukturalizace dat do podoby odpovídající DW filtrace (odstranění chybných i neúplných záznamů) standardizace dat odstranění nežádoucích atributů denormalizace dat kombinace datových zdrojů vkládání a indexace konzistence dat samých, konzistence s ostatními daty v DW 12

Zdroje dat zdroje důvěryhodnost vše nebo část ( atrib.,..projekce, selekce) porovnat stejné údaje z různých zdrojů (1DW z různých zdrojů) z hlediska obsahu ( m.j. m, cm, dm) formátu (cena zboží jiná přesnost, m/ž 0/1) významově stejné zdroje jsou různě pojmenovány a naopak Zdroje dat pokr. změny zdrojů během let struktura dat ze stejných zdrojů (archiv a současnost) formálně stejný objekt z více zdrojů ( zákazník: zákazník x potenc. zákazník) četnost přenášení zdrojů 13

ETL pravidla pro přenos Prosté kopírování Přepočty jednotek Standardizace formátů Odstraňování duplicit v datech z různých zdrojů Rozdělení atributu do několika cíl. atributů ( př. adresa) Slučování atributu do jednoho Odvozování nových atributů (př. datum) Převodní funkce některé použijí pro více atributů, jinde pro atribut samostatná funkce Po přenosu Kontrola kvality a ošetření chybějících údajů Vypuštění záznamů kde chybí Jednotné označení chybějících údajů a upozornění na neúplnost dat Statistika pro každý atribut Rozsah (doména) a četnost hodnot, které může nabývat (lze odhalit chybné hodnoty) 14

Zdroje dat pokr. u atributů: identifikátor, název, typ dat, měr.j., doména, význam, vlastník typ atributu (dimenze, fakt), typ indexu, pro měr.j.: konverzní poměry (koeficienty převodu, popř. koeficienty proměnné v čase) pro dimenze klíče, definice hierarchie/hierarchií přiřazení zdrojových atributů cílovým, transformace, změny formátů vazby mezi zdroji ( kdo komu poskytuje data) Data v IS/ICT 15

OLTP - operativní data zdroje: zejména aplikace Data v OLTP a DW přístup: více současně pracujících uživatelů aktualizace: častá, relativně malých objemů dat Operace INSERT, UPDATE, DELETE dotazy nad daty selektivní ( zejména předpřipravené dotazy) přesnost výstupu - na Kč, haléře,.. četnost stejných dotazů - i vícekrát denně ukládání dat strukturovaně - normalizovaná relační databáze nověji objektově relační, objektová databáze požadavky - nekonfliktní zpracování operací, zajištění integrity dat procesní orientace Vladimíra ( stavy Zádová, procesů, KIN, EF TUL detailní data) Data Warehouse Data v OLTP a DW zdroje: podnikové OLTP, operativní data + externí data přístup: malé množství specializovaných uživatelů - management aktualizace: řídká - jen přidávání dat ze zdrojů, delší časové intervaly dotazy intenzivní na data, složité dotazy, postupná iterace, sumarizace výstupy zaokrouhlené (i na tisíce) ukládání dat strukturovaně speciálně navržená relační databáze multidimenzionální kostka 16

DW - definice je subjektově orientovaná, integrovaná, časově variantní a stálá kolekce dat pro podporu rozhodování manažerů subjektová orientace DW je organizován podle hlavních subjektů podniku (zákazníci, prodej, produkt..), ne podle procesů (aplikací) reflektuje potřeby uložení dat pro rozhodování v jedné databázi DW jsou uložena data pouze jednou (např. o produktu, zaměstnanci ) integrovaná do celku jsou vkládána data z různých aplikací - nekonzistentnost, různé formáty integrací těchto dat - prezentace unifikovaného pohledu B. Inmon časově variantní DW data v DW jsou platná a přesná jen v bodech, ne intervalech času uložení historie dat - hodnoty v časových bodech (den, měsíc, Q, rok..) v DW vždy dimenze času stálá data v DW nevznikají, nedají se žádnými nástroji měnit aktualizace DW - jen přidávání dat v pravidelných časových intervalech (jako doplněk), integrace přírustků 17

Datová tržiště (Data Mart) příčiny vytváření pro nejčastější analýzy pro skupinu uživatelů - business process, oddělení vytvoření DM s více agregovanými daty, s menším objemem dat - pro zlepšeníčasu odezvy k poskytování vhodněji strukturovaných dat - z hlediska požadavků nástrojů přístupu pro snazší implementaci pro nižší náklady proti DW pro lepší zaměření koncového uživatele Základní představa 18

Přístupy k návrhu IS/ICT Vypracovány pro OLTP popisuje konceptuální schémata, která jsou optimalizována pro OLTP systémy Nerespektují specifika datových skladů neposkytuje postačující informace, které má DW poskytovat pro analytické zpracování nepřehlednost, není vidět přímo dimenze a fakty není zřejmé jak jednoduše agregovat data Multidimenzionální modelování 19

Dimenzionální modelování speciální technika určená pro logický návrh DW tak, aby vedl k výsledku - multidimenzionálnímu schématu Dimenzionální modelování Požadavky uživatelů Proces návrhu 4 kroky: výběr procesu/ů stanovení granularity výběr dimenzí určení faktů Zdroje dat 20

Star schéma (hvězdicové schéma) 21

Schéma souhvězdí 22

Konceptuální úroveň D 1 D 2 F 1 D 1 D 2 F 1 D 3 D 4 F 2 D 3 D 4 D 5 D 6 Hvězdicové schéma Schéma souhvězdí Obr. 1-P4 Grafické znázornění schéma faktů Zdroj: [5] M. Golfarelli, D. Maio, S. Rizzi. The Dimensional Fact Model: a Conceptual Model for Data Warehouses. International Journal of Cooperative Information Systems,, pp. 215-247, 23

Obr. 2-P4 Grafické znázornění konceptuálního multidimenzionálního schématu Zdroj: [9] Hüsemann, B., Lechtenbörger, J., Vossen, G.: Conceptual Data Warehouse Design,In Proceedings of the International Workshop on Design and Management of Data Warehouses, DMDW, Stockholm, 2000 Obr. 3-P4 Multidimenzionální doménová struktura E. Thomsen 24

Technologická úroveň D 1 D 2 D 1 D 2 F 1 F 1 D 3 D 4 D 3 D 4 F 1-hierarch1 F 1-hierarch1 D 4-hierch1 D 5 F 1-hierarch2 D 5 F 1-hierarch2 D 4-hierch2 Schéma souhvězdí pro hierarchii faktů Schéma souhvězdí pro hierarchii faktů a dimenzí Zaměstnanec Zam Id Jméno zam Nástup zam Ved Id Čas Den Id Typ dne Teplota dne Týden Měsíc Čtvrtletí Rok F - Prodej Zak Id Zam Id Prod Id Den Id C fakt Qty-prodané Prodej v KČ Zákazník Zak Id Jméno zak Profese Odvětví Typ zak Země Produkt Prod Id Název prod Skupina Kategorie 25