Databázové systémy. 10. přednáška

Podobné dokumenty
Business Intelligence

Základy business intelligence. Jaroslav Šmarda

10. Datové sklady (Data Warehouses) Datový sklad

3 zdroje dat. Relační databáze EIS OLAP

Základní informace o co se jedná a k čemu to slouží

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

CPM/BI a jeho návaznost na podnikové informační systémy. Martin Závodný

Business Intelligence. Adam Trčka

Bu B sin i e n s e s s I n I te t l e lig i en e c n e c Skorkovský KA K M A I, E S E F MU

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9


Obsah. Úvod do problematiky. Datový sklad. Proces ETL. Analýza OLAP

Business Intelligence

4IT218 Databáze. 4IT218 Databáze

TM1 vs Planning & Reporting

Podnikové informační systémy Jan Smolík

Jak velká jsou? Obchodní analytici FB velké datové sady BI = business intelligence. OLAP = Online Analytical Processing. DWH = Data Warehouse

Datová kvalita základ úspěšného BI. RNDr. Ondřej Zýka, Profinit

Multidimenzionální pohled na zdravotnické prostředí. INMED Petr Tůma

BI v rámci IS/ICT komponenty BI architektura. Charakteristika dat a procesů v IS/ICT. Datové sklady ukládání dat návrh datového skladu

kapitola 2 Datové sklady, OLAP

Datové sklady. Ing. Jan Přichystal, Ph.D. 1. listopadu PEF MZLU v Brně

ARCHITEKTURA INFORMAČNÍCH SYSTÉMŮ PODLE ÚROVNĚ ŘÍZENÍ

Informační systémy 2008/2009. Radim Farana. Obsah. Obsah předmětu. Požadavky kreditového systému. Relační datový model, Architektury databází

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

Databáze. datum jmeno prijmeni adresa_ulice adresa_mesto cislo_uctu platba zustatek

Infor Performance management. Jakub Urbášek

Informační systémy 2006/2007

Business Intelligence a datové sklady

Databáze Bc. Veronika Tomsová

Ing. Roman Danel, Ph.D. 2010

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

Zdroje informací v organizaci IS/ICT BI v rámci IS/ICT historie architektura OLTP x DW ukládání dat

T T. Think Together Martin Závodný THINK TOGETHER. Business Intelligence systémy Business Intelligence systems

v praxi Rizika a přínosy zavádění BI jako nástroje pro řízení podnikání

Datový sklad. Datový sklad

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Systémy pro podporu. rozhodování. 2. Úvod do problematiky systémů pro podporu. rozhodování

Manažerská ekonomika

Konsolidovaný reporting CZ/SK v Cognos případová studie sanofi-aventis

Manažerský informační systém pro efektivní řízení zdravotnictví ve Středočeském kraji

Analýza a modelování dat 5. přednáška. Helena Palovská

Architektura informačních systémů. - dílčí architektury - strategické řízení taktické řízení. operativní řízení a provozu. Globální architektura

NÁSTROJE BUSINESS INTELLIGENCE

Trendy v IS/ICT přístupy k návrhu multidimenzionální modelování

Dnešní témata Informační systém, informační služba Podnikový informační systém

PV005 Služby počítačových sítí: Data Warehouses

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Data Warehouses. Jaroslav Bayer 1. Fakulta informatiky Masarykova univerzita

BIG DATA. Nové úlohy pro nástroje v oblasti BI. 27. listopadu 2012

Marketingová komunikace. 3. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK3PH (vm3bph)

Zkušenosti s Business Intelligence ve veřejném sektoru České republiky

2. Modelovací jazyk UML 2.1 Struktura UML Diagram tříd Asociace OCL. 3. Smalltalk 3.1 Jazyk Pojmenování

výskyt události reakce na událost

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

PŘÍLOHA C Požadavky na Dokumentaci

Analýza a modelování dat. Přednáška 8

Ing. Petr Kalčev, Ph.D.

Podpora manažerského rozhodování užitím Business Intelligence Ing. Jan Klimeš, ORTEX spol. s r.o., Hradec Králové

Manažerský reporting a finanční plánování Targetty

GIS jako důležitá součást BI. Jan Broulík, Petr Panec ARCDATA PRAHA, s.r.o.

Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph)

Obsah Úvod 11 Jak být úspěšný Základy IT

Role BI v e-business řešeních pohled do budoucnosti

Informační systémy. Jaroslav Žáček

1. Integrační koncept

Úvodní přednáška. Význam a historie PIS

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Dobývání znalostí z databází. Databáze. datum jmeno prijmeni adresa_ulice adresa_mesto cislo_uctu platba zustatek

Možnosti analýzy podnikových dat

Snadný a efektivní přístup k informacím

Datové sklady. Multidimenzionální modelování Modely datového skladu Návrh datového skladu v rámci návrhu IS/ICT. Vladimíra Zádová, KIN, EF, TUL

ARBES BI MODERNÍ ŘEŠENÍ pro podporu strategického, taktického a operativního řízení.

QAD Business Intelligence

Chytrá systémová architektura jako základ Smart Administration

GIS a Business Intelligence

Architektury Informačních systémů. Jaroslav Žáček

Okruhy z odborných předmětů

Analýza a modelování dat. Přednáška 9

Architektury Informačních systémů. Jaroslav Žáček

On line analytical processing (OLAP) databáze v praxi

Kapitola 1: Úvod. Systém pro správu databáze (Database Management Systém DBMS) Účel databázových systémů

Analýza a návrh datového skladu pro telekomunikační společnost. Bc. Josef Jurák

Aplikace pro podporou manažerského rozhodování

Business Intelligence

Moderní přístupy tvorby datových skladů

Využití IT nástrojů pro měření a řízení výkonnosti. Michal Kroutil

Datová věda (Data Science) akademický navazující magisterský program

Technologie pro maloobchod nové pohledy, nové příležitosti. Marta Nováková, Generální ředitelka, U&SLUNO a.s.

Problémové domény a jejich charakteristiky

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

STRATEGIE A PROJEKTY ODBORU INFORMATIKY MHMP

Databázové systémy úvod

Efekty a rizika Business Intelligence

Informační systémy. Jaroslav Žáček

Obsah. Zpracoval:

Vysoká škola ekonomická v Praze

Multidimenzionální modelování v rámci analýzy a návrhu IS/ICT

Transkript:

Databázové systémy 10. přednáška

Business Intelligence Poprvé byl termín BI použit Gartnerem a dále pak popularizován Howardem Dresnerem jako: proces zkoumání doménově strukturovaných informací za účelem zjištění trendů nebo jiných společenských informací pro tvorbu závěrů

Business Intelligence Lze označit za komplex přístupů a aplikací IS/ICT, které téměř výlučně podporují analytické a plánovací činnosti podniků a organizací a jsou postaveny na principu multidimenzionality. Aplikace Dotazovací (Query) Analytické (OLAP) Dolování z dat (Data Mining)

Nástroje a aplikace BI Produkční, zdrojové systémy Dočasná úložiště dat Operativní úložiště dat Transformační nástroje (ETL) Integrační nástroje (EAI) Datové sklady Datová tržiště OLAP reporting Manažerské aplikace Dolování z dat Nástroje pro zajištění kvality dat Nástroje pro správu metadat ostatní

Postavení BI v aplikační architektuře

Schéma komponent BI

Obecné komponenty pro správu dat Nástroje pro zajištění datové kvality, zajistit, aby data přesně reflektovala realitu Nástroje pro správu metadat, zjednodušeně řečeno popis a dokumentaci systémů i probíhajících procesů Technickou znalost, zahrnující programovací a technologicky závislé schopnosti implementačního týmu

Obecné komponenty pro správu dat

OLTP On Line Transaction Processing Obsahuje tzv. operativní informace Slouží pro realizaci obchodních a dalších transakcí v podniku Automatizace každodenních činností, které jsou předmětem podnikání Pozn. Pokrývá-li transakční systém většinu podnikových aktivit, nazýváme jej ERP Realizovány na relačních databázích Data OLTP jsou chápána jako primární, zdrojová nebo produkční

OLTP Vlastnosti Schéma dbs je komplexní a vysoce strukturované Optimalizace schématu pro výkon při transakcích Nemají k dispozici jednotný zdroj údajů, což vede na nutnost integrace dat heterogenních OLTP Transakční systém zpravidla neuchovává historické údaje Dlouhý čas přípravy údajů Analýza vyžaduje speciální techniky, použití multidimenzionálních schémat s tabulkami faktů

OLAP On Line Analytical Processing Často hovoříme o IT založené na koncepci multidimenzionálních databází, hlavním principem je vícedimenzionální tabulka umožňující rychle měnit jednotlivé dimenze Používá neformalizované tabulky Faktů Dimenzí Zajišťuje agregace hodnot podle definovaných hierarchických úrovní dimenzí

OLAP Vlastnosti Informace poskytují na základě vstupů získaných z primárních dat Data uložena v multidimenzionálních databázích Obsahují různé úrovně agregace Zohledňují faktor času Obvykle pracují se třemi dimenzemi Časová dimenze Dimenze ukazatele (ekonomická veličina) Dimenze cíle potřeby komodita, org. jednotka, zákazník,...

Typy OLAP MOLAP (Multidimenzionální OLAP) Speciální uložení dat v multidimenzionálních kostkách ROLAP (Relační OLAP) Řeší multidimenzionalitu uložením dat v relační databázi HOLAP (Hybridní OLAP) Kombinace předchozích přístupů, detailní data jsou uloženy v binárních OLAP DOLAP (Desktop OLAP) Nejmladší architektura, umožňuje se připojit vzdáleně k centrálnímu úložišti

Schémata V uložení hierarchických dimenzí jsou v zásadě dvě možnosti Z celé hierarchie vytvořím jednu dimenzní tabulku, ve které budou údaje pro vyšší stupně hierarchie uloženy redundantně. Vznikne schema, kde je každá dimenzní tabulka vázána přímo na faktovou tabulku - podle tvaru svého diagramu se takové schéma nazývá hvězda (Star schema) Na hierarchickou dimenzi budu aplikovat normalizační doporučení 3NF, takže pouze dimenze na nejnižším stupni hierarchie bude vázána přímo na faktovou tabulku, ostatní pak na některou z nižších dimenzí v hierarchické struktuře - podle tvaru svého diagramu se takové schéma nazývá vločka (Snowflake schema)

Hvězda

Sněhová vločka

Kroky při tvorbě OLAPu

OLAP vs Datový sklad Označení OLAP pro datové sklady není zcela správné. Ve třívrstvé architektuře DW rozlišujeme tři vrstvy: spodní do této vrstvy patří server skladu, na kterém jsou uloženy relační databáze. Této vrstvě odpovídá položka Datový sklad. prostřední tato vrstva zahrnuje OLAP server, který obvykle implementuje buď relační OLAP model (ROLAP), což je rozšířený relační DBMS, který převádí operace nad multidimenzionálními daty na standardní relační operace. Druhou možností je multidimensionální OLAP (MOLAP), který přímo umí pracovat s multidimenzionálními daty a operacemi. vrchní vrchní vrstvu označujeme jako klienta. Obsahuje nástroje pro provádění dotazů a vytváření zpráv, analýzy a/nebo data miningové nástroje (analýzy trendu, predikce, apod.). Shoduje se s prezentační vrstvou.

ETL (Extract, Transform, Load) mechanizmus získávání dat z provozních systémů podniku (ekonomika, skladové hospodářství, výroba, odbyt atd.), jejich následné zpracování a poskytnutí aplikacím pro podporu rozhodování (decission support systémy, datové sklady, business intelligence), tato problematika je poměrně komplikovaná a představuje nezanedbatelný podíl (někdy až 70 %) v nákladech na budování systémů pro podporu rozhodování

Proces budování DW 1. Orientace na DW, odsouhlasení rozhodnutí přijmout DW do informační strategie organizace 2. Analýza, požadavky, datové modely, zdrojové systémy 3. Návrh DW, realizuje se cyklus vzájemné diskuse obsahu DW, návrh akvizice dat, návrh přístupu k datům, návrh technického zabezpečení 4. Konstrukce, příprava technického prostředí, 5. Testování, iterace testovacího systému, vytvoření úplné populace dat

Proces budování DW 6. Implementace, iterativní implementace, iterativní vylepšování tréninku pro práci s DW přístupu k uživatelům, 7. Vyhodnocení, potvrzení dané probíhající iterace, určení další iterace 8. Řízení, řídí se organizační příprava, příprava iterací, zacvičování do projektu DW, vývoj iterací a správy DW, vnitřní marketing,...

OLAP vs. Data Mining OLAP Data Mining Interaktivní analýza Multidimenzionální datové kostky Předzpracovaná data Data Mining Tool Získané znalosti

OLAP vs. Data Mining OLAP Soubor operací (drill-down, roll-up ) poskytující různé pohledy na data Výsledků je dosahováno pomocí sumačních a předdefinovaných operací Data Mining Hledání zcela nových vzorů, znalostí, které v datech nejsou explicitně uvedeny Znalostí je dosahováno pomocí sofistikovaných algoritmů

OLAP vs. Data Mining Vlastnost OLAP Data Mining Motivace použití Co se děje v podniku? Predikce budoucnosti, skryté znalosti Granularita dat Sumační data Data na úrovni záznamu Počet obchodních dimenzí Počet vstupních atributů Velikost dat pro jednu dimenzi Omezený počet dimenzí Spíše velmi nízký počet atributů Ne velká pro každou dimenzi Velký (až nekonečný) počet dimenzí Mnoho atributů Obvykle velmi rozsáhlá pro každou dimenzi Zdroj: Bartík, V. Datové sklady

OLAP vs. Data Mining Vlastnost OLAP Data Mining Přístup k analýze Techniky analýzy Stav technologie Řízený uživatelem, interaktivní analýza Multidimenzionální, drilldown, slice-and-dice Známý a rozsáhle využívaný Autmatický, řízený daty Příprava dat, použití nástrojů pro získávání znalostí Stále se vyvíjející, některé metody jsou již využívané v praxi Zdroj: Bartík, V. Datové sklady

Multidimenzionální dbs Základní princip vícedimenzionální tabulka na úrovni n- dimenzionální Rubikovy kostky Obsah dimenzí je tvořen prvky dimenzí Prvek databáze = promítnutí všech dimenzí do jednoho bodu Každý prvek může obsahovat data, nebo algoritmy pro jejich transformace Prvky dimenzí jsou v hierarchických strukturách, rozdělují se na skupiny prvků, podskupiny až jednotlivé prvky Implementace na 2 úrovních Na úrovni RDBMS Na úrovni speciální binární DBS

Multidimenzionální dbs Příkladem hierarchické struktury může být např. organizační schéma Podnik celkem Závod 1 Provoz 11 Dílna 3 atd. Závod 2 atd Aplikace BI pak zajišťují automatické agregace hodnot výroby, produktů,..., podle výše zmíněné struktury

Multidimenzionální dbs Průběžné ukládání agregovaných dat pak zrychluje přístup k jednotlivým součtům, který by v on-line režimu byly neúnosně dlouhé Hierarchie uložení dat pak umožňuje se pružně pohybovat po požadovaných úrovních agregace, aniž by bylo nutné příslušné agregace znovu počítat Drill-down pohyb, zpřístupnění dat nižší úrovně agregace Drill-up pohyb, opačný směr

Srovnání Relační model Výhody Rutina s používáním, rozšířenost Množství nástrojů a podpory pro zlepšování funkčnosti Použitelnost OLTP i na datové sklady Nevýhody Absence komplexních analytických nástrojů Potencionální omezení objemu údajů dostupných v reálném čase Multidimenzionální model Možnost komplexních analýz Nástroje pro modelování a prognózy Problémy při změně dimenzí bez přizpůsobení časové dimenzi Vyšší nároky na kapacitu úložiště

Obecné problémy transakčních DBS Obtížná dosažitelnost dat skrytých v databázích Dlouhé prodlevy u komplikovaných dotazů Složitá, uživatelsky nepříjemná rozhraní DBS Cena v administrativě a složitosti podpory uživatelů Soutěžení o počítačové zdroje mezi transakčními systémy a systémy na podporu rozhodování Dlouhodobé řešení nabízí použití datových skladů

Competitive Intelligence (CI) vymezuje oblast, které se v České republice říká konkurenční zpravodajství tedy zjišťování a vyhodnocování informací, které organizacím pomáhají odhalovat slabé a silné stránky konkurence a rozpoznat její strategii. dá označit za podoblast znalostního managementu a klade si za cíl sledovat vnější prostředí firmy za účelem získání relevantních informací týkající se jeho rozhodovacího procesu.

Úkoly CI Hledání odpovědí na klíčové otázky související se současnou i budoucí situací společnosti z hlediska možných ohrožení a příležitostí. Negativní informace o obchodních partnerech a zákaznících; Otázky související se současnými a potenciálními konkurenty; Problematikou související s vědeckotechnickým rozvojem; Otázky související s defenzivním CI.

Cyklus CI CI lze chápat jako informační proces přinášející hodnotu, který vyžaduje vytváření, zavádění a udržování formalizovaných aktivit, produktů a služeb, stejně jako péči zahrnující neformální procesy, aby mohly být získané informace plně a efektivně využity.

KPI (Key performance indicator) Klíčové ukazatele jsou základním prvkem systémů pro měření výkonnosti a pomáhají organizacím dosahovat stanovených cílů. Jedná se o konkrétní měřitelnou hodnotu při vykonávání daného procesu. Například u procesu zpracování žádosti lze měřit dobu jejího vyřízení od přijetí žádosti nebo relativní počty formálních chyb kvůli nimž jsou žádosti zamítány. V každém podniku je samozřejmě řada procesů, které lze měřit velmi efektivně. Sledování aktuálních hodnost ukazatelů a porovnávání se stanovenými hodnotami pak směřuje vedoucí pracovníky organizace ke kritickým místům, kde je třeba zlepšit vykonávání stanovených procesů tak, aby se dosáhlo vytyčených cílů. Jednotlivá KPI jsou přesně ukotvena v procesní struktuře organizace. Při definici KPI se zpravidla postupuje shora dolů - od strategických cílů podniku k operativním cílům jednotlivých procesů.

Praktické zásady pro navrhování KPI Účelnost ukazatele uživatelé by si měli uvědomit, co přesně chtějí měřit a zjistit. Jednoznačnost ukazatele ukazatel musí být interpretovate-lný jen jedním způsobem. Zjistitelnost ukazatele pro měření ukazatele musí být v pod-niku dostupná data. Jejich zajištění je často relativně náročné. Interpretace ukazatele uživatelé musí být schopni KPI správně chápat a využívat

Procesní KPI - proces nákupu http://www.linkedin.com/today/post/article/20130905053105-64875646-the-75-kpis-every-manager-needs-to-know