Pattern Star Schema. RNDr. Ondřej Zýka
|
|
- Josef Liška
- před 7 lety
- Počet zobrazení:
Transkript
1 Pattern Star Schema RNDr. Ondřej Zýka 1
2 Star Schema Pattern spojený s datovými sklady a systémy pro reporting Modely používané pro Dimenzionální modelování Něco historie Bill Inmon Corporate Information Factory používá pro Data Marty Ralph Komball (1997) Dimensional Data Warehouse používá pro celé řešení Stand-Alone Data Marts doporučený pattern Pattern odděluje do tabulek Fakta hodnoty, které se mají analyzovat (ceny, počty,..) Dimenze - číselníky, podle kterých se má analyzovat (zákazníci, čas, produkty, pobočky,...) 2 2
3 Star Schema Silně denormalizovaný model Pochopitelné pro netechnicky orientované uživatele (byznys uživatele) Orientované na analytické dotazy Umožňují analyzovat extrémní objemy dat Podporuje historizaci a dosažitelnost historických dat Podporované datovými servery a analytickými nástroji (OLAP) Výhodný pro dotazovací servery, které jsou specializované na dotazy a mají špatný výkon pro update a delete operace. 3 3
4 Příklad Star schéma Time Date Full date description Day of Week Day Number in Epoch Week Number in Epoch Month Nuber in Epoch Day Number in Calendar Year Day Number in Calentar Month Day Number in Fiscal Year Last Day in Week Indicator Last Day in Calendar Month Indicator Calendar Week Ending Date Calendar Week Number in Year Calendar Month Ending Date Calendar Month Name Calendar Month Number in Year Calendar Year-Month (YYYY-MM) Calendat Quarter Calendar Year-Quarter Calendar Half Year Calendar Year Fiscal Week Fiscal Week Number in Year Fiscal Month Fiscal Month Number in Year Fiscal Year-Month Fiscal Quarter Fiscal Year-Quarter Fiscal Half Year Fiscal Year Holiday Indicator Weekday Indicator Selling Season Major Event Epoch_hierarchy Calendar_hierarchy Fiscal_hierarchy <Default> <h1> <h2> <h3> <h2:5> <h1:3> <h1:2> <h1:1> <h3:5> <h2:4> <h2:3> <h2:2> <h2:1> <h3:4> <h3:3> <h3:2> <h3:1> Sales - Time Sales - Titles Sales Quantity Unit Price Sales Price Unit Price USD Sales Price USD Discount Shipping Number Shipping Note Sales - Stores Title_name Title_type Publish_date Publisher_name Publisher_city Publisher_country Titles <h:1> Default_hierarchy <Default> <h> Store_name Store_address Store_city Store_country Store_postalcode Store_type Store_headquarter Stores <h:1> Default_hierarchy <Default> <h> 4 4
5 Standardní dotaz select SUM(qty) from F_SALES,D_TIME,D_TITLES,D_STORES where F_SALES.TITLES_KEY = D_TITLES.TITLES_KEY and F_SALES.STORES_KEY = D_STORES.STORES_KEY and F_SALES.DATE_KEY = D_DATE. DATE_KEY and podminky na D_TITLES and podminky na D_STORES and podminky na D_DATE group by pozadovana granularita vysledku 5 5
6 Snowflake schéma Dimension 2 Dimension 3 Fact Table Dimension 1 Dimension 1 Type Dimension 4 Dimension 4 Type Dimension 4 Type Category 6 6
7 Snowflake model Výhody Minimální redundance dat v rámci dimenzí Úspora místa v databázi Větší flexibilita pro modelování Užitečný pro dimenze se složitou strukturou Nevýhody Složitější konstrukce dotazů, mnoho joinů Nižší výkonnost Komplikovaný snowflake model může odradit uživatele od přímého přístupu k datům uživatelské nástroje zpravidla zavádějí sémantickou vrstvu, která uživatele odstíní od datového modelu Možný konflikt s bitmapovými indexy Úspora místa je většinou převážena nižší výkonností a složitější administrací 7 7
8 Constellation schema Dimension 9 Fact Table2 Dimension 4 Dimension 2 Dimension 3 Fact Table Dimension 1 Fact Table4 Fact Table3 Dimension 8 Dimension 7 Dimension 6 Dimension 5 8 8
9 Snowstorm schema 9 9
10 Vytvořen dimenzionálního modelu Výběr Sledovaných procesů Definice Metrik Definice Dimenzí Definice Hierarchií Definice Granularity Plnění dimenzionálního modelu Technologie Relační databáze OLAP technologie 10 10
11 Výběr sledovaných procesů Seznam procesů, které chceme analyzovat Od jednodušších ke složitějším Bus matrix Matice: Business procesy x Dimenze Často odpovídá jeden business proces jeden datamart jedna hvězda 11 11
12 Buss matrix příklad Letiště 12 12
13 Bus matrix příklad implementace 13 13
14 Date Customer Service Rate Category Local Svc Provider Calling Party Called Party Long Dist Provider Internal Organization Employee Location Equipment Type Supplier Item Shipped Weather Account status Bus matrix příklad telco operátor Custommer Billing Service Orders Trouble Reports Yellow Page Ads Customer Inquiries Promotion Billing Call Detail Network Call Detail Customer Inventory Network Inventory Real eastate Labor & Payroll Computer Charges Purchase Orders Supplier Deliverables 14 14
15 Tabulky faktů Transaction - co řádek to transakce (například obchody) Proces může obsahovat více typů transakcí, rozhodnutí zda jedna nebo více tabulek není jednoduché Snapshots - každý den se udělá celý snímek State model celé denní snímky Event model každý den pouze změněné záznamy Možnost dopočítání dalších hodnot ke každému snímku Akumulujíce se shapshoty (sklad) Id výrobku jako primární klíč a doplňují/updatují se hodnoty pro události popisující životní cyklus Do daného řádku se doplní datum expedice, fakturace, dodání, vyúčtování, Pozor - update v tabulce faktů (Fact tables bez faktů slouží jako n:n vazba mezi dimenzemi) 15 15
16 Fact tables Fakta aditivní - počet, cena v transakčních fact tabulkách Význam pro všaechny dimenze Nejlépe se s nimi pracuje Cílem je převést na aditivní fakta maximum Discount -> ceníková cena, prodejní cena semiaditivní - počet cena v snapshot tabulkách součet za produkty má význam, za čas nemá význam Obecně význam pouze pro některé dimenze nonadditive - procentuální profit Často text Někdy možné přenést do dimenzí (degenerované dimenze) Factless fact table pouze cizí klíče, žádná fakta Sales Quantity Unit Price Sales Price Unit Price USD Sales Price USD Discount Shipping Number Shipping Note Příznak existence (účast v kampani) 16 16
17 Určení dimenzí Konformní dimenze Jedna nejpodrobnější dimenze, ostatní jsou jejich agregací Jednotné dimenze pro všechny business procesy Jeden sloupec primárního klíče Hodně sloupců popisů, často přes 30, čím více tím lépe Atributy spíše textové (srozumitelnost) Hierarchie pro analýzy Časová dimenze Degenerovaná dimenze nemá popis (číslo faktury) Dimenze jsou denormalizované (jedna široká tabulka) Normalizace vločkové schéma Umělé klíče pro odstínění změn Řádek s hodnotu Not applicable, Uknown 17 17
18 Časová dimenze V každém datovém skladu Často mnoho hierarchií Provozní rok Fiskální rok Kalendářní rok Mnoho sloupců Textová informace Číselná informace Konce a začátky období Umožňuje dotazy na Kalendářní i fiskální kalendář Volné dny Dny v týdnu Time Date Full date description Day of Week Day Number in Epoch Week Number in Epoch Month Nuber in Epoch Day Number in Calendar Year Day Number in Calentar Month Day Number in Fiscal Year Last Day in Week Indicator Last Day in Calendar Month Indicator Calendar Week Ending Date Calendar Week Number in Year Calendar Month Ending Date Calendar Month Name Calendar Month Number in Year Calendar Year-Month (YYYY-MM) Calendat Quarter Calendar Year-Quarter Calendar Half Year Calendar Year Fiscal Week Fiscal Week Number in Year Fiscal Month Fiscal Month Number in Year Fiscal Year-Month <h2:5> <h1:3> <h1:2> <h1:1> <h3:5> <h2:4> <h2:3> <h2:2> <h2:1> <h3:4> 18 18
19 Časová dimenze Jména anglicky, česky nebo alternativní jména Definice prvního dne týdne Definice fiskálního roku Definice formátu datumu (Date) Definice svátků a prázdnin Name Data type Example Date Key Integer Date String Full date description String Tue Feb Day of Week String Thursday Dey Number in Week Integer 4 Day Number in Epoch Integer 6621 Week Number in Epoch Integer 946 Month Nuber in Epoch Integer 217 Day Number in Calendar Year Integer 43 Day Number in Calentar Month Integer 15 Day Number in Fiscal Year Integer 43 Last Day in Week Indicator Char N Last Day in Calendar Month Indicator Char N Calendar Week Ending Date Integer Calendar Week Number in Year Integer 6 Calendar Month Ending Date Integer Calendar Month Name String February Calendar Month Number in Year Integer 2 Calendar Year-Month (YYYY-MM) String Calendat Quarter String Q1 Calendar Year-Quarter String 2018Q1 Calendar Half Year String 2018H1 Calendar Year String 2018 Fiscal Week String F Week Fiscal Week Number in Year Integer 6 Fiscal Month String F Month Fiscal Month Number in Year Integer 2 Fiscal Year-Month String F Fiscal Quarter String FQ1 Fiscal Year-Quarter String F2018Q1 Fiscal Half Year String F2018H1 Fiscal Year String F2018 Holiday Indicator Char N Weekday Indicator Char Y Selling Season String S
20 Typy dimenzí z pohledu změn Statické Žádné ošetření změn Změna hodnot znamená změnu řešení Rostoucí dimenze Přidávají se nové záznamy Změna záznamu je chyba zpracování Rychle rostoucí dimenze změny několikrát denně Nutné speciální řešení Oddělení rychle se měnících atributů do vlastní dimenze (Jako Slowly changed dimension Type 2) Slowly changing dimenze Změny maximálně jednou denně Mnoho definic různých typů 20 20
21 Změny v dimenzích Identifikace záznamu Musí být definován identifikátor záznamu (přirozený klíč, kód) Je nutné rozlišovat Umělý klíč záznamu a Identifikátor řádku. Je možné uchovávat historické hodnoty v oddělené tabulce. Historizace musí řešit Vznik nového záznamu Změnu záznamu Zrušení záznamu Opětný vznik zrušeného záznamu se stejným identifikátorem Řešení může podporovat různé typy historizace pro různé sloupce tabulky. To vede ke změně modelu
22 Slowly changing dimension Typ 0 ignorování změn Typ 1 přepis hodnot Žádná historie Typ 2 přidávání řádků, vždy jeden platný Přidané pole: DWH_START_DATE, DWH_END_DATE, DWH_CURRENT_FLAG Kompletní historie Typ 3 přidání sloupců s historickými hodnotami Současné a předchozí hodnoty uchovávány v různých sloupcích (omezená délka historie) Redundance nebývá problém Dimenze zabírají cca 5% místa v DWH 22 22
23 SCD2 Nový záznam USER_CODE USER_NAME USER_LOCATION peterh Peter Horffer Prague USER_KEY USER_CODE USER_NAME USER_LOCATION DWH_START_DATE DWH_END_DATE DWH_CURRENT_FLAG 100peterh Peter Horffer Prague Y Technologické sloupce s identifikovatelnými jmény DWH_END_DATE definovaná maximální hodnota, nepoužívat null DWH_START_DATE, DWH_END_DATE datum dávky, identifikace aktuálnosti dat v datovém skladu (nemusí odpovídat datu zpracování), nedá se vztahovat k byznys platnosti záznamu. Hodnoty jako Recorded date, Load date, Transaction date, Effective date, Booking date a podobně musí být přesně definovány na analytické úrovni a zpracovávány jako standardní atributy entity
24 SCD2 Změna záznamu USER_CODE USER_NAME peterh USER_LOCATION Peter Horffer London USER_KEY USER_CODE USER_NAME USER_LOCATION DWH_START_DATE DWH_END_DATE DWH_CURRENT_FLAG 100peterh Peter Horffer Prague N 556peterh Peter Horffer London Y User_key je identifikace řádky (entita s verzí), nikoliv samotné entity. DWH_END_DATE je o den menší, než DWH_START_DATE Zrušení záznamu USER_KEY USER_CODE USER_NAME USER_LOCATION DWH_START_DATE DWH_END_DATE DWH_CURRENT_FLAG 100peterh Peter Horffer Prague N 556peterh Peter Horffer London N Pouze ukončení platnosti záznamu 24 24
25 SCD2 Nový záznam se stejným kódem USER_CODE USER_NAME USER_LOCATION peterh Peter Horffer London USER_KEY USER_CODE USER_NAME USER_LOCATI ON DWH_START_DA TE DWH_END_DATE DWH_CURRENT_FLAG 100peterh Peter Horffer Prague N 556peterh Peter Horffer London N 892peterh Peter Horffer London Y Není zachována nepřerušená řada ve v auditních sloupcích
26 SCD2 - poznámky Většinou více auditních sloupců DWH_DELETED_FLAG DWH_TRAMSFORMATION_ID DWH_PROCESS_ID DWH_ROW_HASH DWH_DATA_QUALITY_STATUS Neměnící se USER_KEY, USER_KEY odpovídá USER_CODE. USER_KEY není primární klíč tabulky Možnost více časových os DWH_START_TIME, DWH_END_TIME odpovídá přesnému času zpracování Údaj typu TIMESTAMP, DWH_START_TIME = DWH_END_TIME předchozího řádku Umožňuje vytvářet dotazy k danému okamžiku v historii skladu. Nutnost přesné definice pro konkrétní řešení a generování historizace pomocí odzkoušených template
27 Další typy dimenzí Konformní Pro celý podnik Ostatní dimenze jako podimenze konformních dimenzí Minidimenze a sběrné dimenze Číselníky Stavové a textové atributy Možné sloučit do sběrných dimenzí Degenerované dimenze Přímo v tabulce faktů (číslo objednávky) 27 27
28 Hierarchie Popis jak agregovat hodnoty jedné dimenze Může existovat několik nezávislých hierarchií na jedné dimenzi Drill-down podle dimenzí Dimenze času Nejmenší granularita den 6 nezávislých dimenzí 28 28
29 Hierarchie Schéma a instance dimenze lokace Použití srozumitelných dat, texty Často odvozeno z jiných zdrojů (i externích) Redundance dat je pouze v dimenzích (nikoliv ve faktových tabulkách) Umožňuje vybírat a agregovat data po úrovních Hierarchie by měli mít konstatní hloubku (nedoplňovat regiony jenom někde) Hierarchie jsou obsaženy v metadatech o dimenzích 29 29
30 Určení granularity Každý řádek faktové tabulky odpovídá hodnotám průniku všech dimenzí Všechny řádky musí mít stejnou granularitu Řádky s hodnotou nula se nezapisují Pokud zdroje neobsahují dostatečně detailní data, provádí se realokace dat na několik řádek tak, aby výsledky odpovídaly zdrojovým datům Granularita malá Jeden řádek jedno měření Velký objem dat Granularita velká (pouze sumy za měsíce, regiony, ) Malé databáze Omezená možnost analýz 30 30
31 Technologie Plnění schématu Dávkové plnění pomocí ETL nebo ELT procesů z primárních systémů Požadavky na persistence dat Podpora stár schématu Podpora historizace dimenzí Rychlý výpočet star-like dotazu Agregace přes dimenze a zejména přes hierarchie dimenzí 31 31
32 Multidimenzionální databáze Nutné rozlišit Princip Práce s dimenzemi Práce s hierarchiemi Skutečný způsob uložení dat Relační model Speciální úložiště se speciálními indexy Kategorizace dle místa uložení dat a agregací MOLAP veškerá data uložená v multidimenzionální databázi ROLAP veškerá data uložená v relační HOLAP hybrid Další typy RTOLAP real time, data pouze v RAM DOLAP desktop OLAP, data uložená na klientském počítači 32 32
33 OLAP technologie Uložení a zpracování dat podporující určité druhy analýz parameterized static reporting slicing and dicing with drill down what if? analysis goal seeking models Způsob uložení předpočítaných hodnot (denormalizace) Uložení agregovaných hodnot vyžadovaných analýzami podle zadaných Metrik Dimenzí Hierarchií na dimenzích 33 33
34 Příklad uložení Publishers Stores Aldata Infosystems Binnet & Hardley New Age Books Luxor Academia OC Centrum Kanzelsberger, a. s Time 34 34
35 Co si zapamatovat K čemu slouží dimenzionální datové modely Jaké jsou hlavní rozdíly relačního a dimenzionálního modelování Jaké jsou rozdíly mezi modely typu hvězda, souhvězdí, vločka nebo sněhová bouře Co to je Buss Matrix, k čemu slouží Jaké typy faktových tabulek se používají Co to je aditivní, semiaditivní a neaditivní metrika Jaké typy dimenzí se používají Co to je "Slowly changing dimension of type 2" Co to jsou Hierarchie a k čemu slouží Co to je OLAP databáze 35 35
36 Diskuse Otázky Poznámky Komentáře Připomínky 36
Pattern Datový sklad. RNDr. Ondřej Zýka
Pattern Datový sklad RNDr. Ondřej Zýka 1 Datový sklad Speciální logické modely Dimenzionální modelování Speciální datové servery Teradata Sloupcové ukládání dat OLAP databáze Speciální oblast Data Managementu
Dimenzionální modelování. 2014 Profinit. All rights reserved.
Dimenzinální mdelvání RNDr. Ondřej Zýka ndrej.zyka@prfinit.eu 2014 Prfinit. All rights reserved. Dimenzinální mdelvání Ralph Kimball (1997) Primárně mdely pr datvé sklady a analýzy Silně denrmalizvaný
Databázové patterny. MI-DSP 2013/14 RNDr. Ondřej Zýka, ondrej.zyka@profinit.eu
Databázové patterny MI-DSP 2013/14 RNDr. Ondřej Zýka, ondrej.zyka@profinit.eu Obsah o Co je databázový pattern o Pattern: Přiřazení rolí o Pattern: Klasifikace Databázové patterny o Odzkoušené a doporučené
Databázové patterny. RNDr. Ondřej Zýka
Databázové patterny RNDr. Ondřej Zýka 1 Co to je databázový pettern 2 Databázové patterny Odzkoušené a doporučené způsoby, jak řešit často se vyskytující požadavky Jednoduché N-ární relace Dědičnost Katalog
10. Datové sklady (Data Warehouses) Datový sklad
10. Datové sklady (Data Warehouses) Datový sklad komplexní data uložená ve struktuře, která umožňuje efektivní analýzu a dotazování data čerpána z primárních informačních systémů a dalších zdrojů OLAP
Ing. Roman Danel, Ph.D. 2010
Datový sklad Ing. Roman Danel, Ph.D. 2010 Co je to datový sklad a kdy se používá? Pojmem datový sklad (anglicky Data Warehouse) označujeme zvláštní typ databáze, určený primárně pro analýzy dat v rámci
Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph)
Marketingová komunikace Kombinované studium Skupina N9KMK3PH (vm3aph) 2. a 3. soustředění Mgr. Pavel Vávra 9103@mail.vsfs.cz http://vavra.webzdarma.cz/home/index.htm Co nás čeká: 2. soustředění 16.1.2009
01. Kdy se začala formovat koncept relačních databází (Vznik relačního modelu, první definice SQL)? a) 1950 b) 1960 c) 1970 d) 1980
01. Kdy se začala formovat koncept relačních databází (Vznik relačního modelu, první definice SQL)? a) 1950 b) 1960 c) 1970 d) 1980 02. Kdy přibližně vznikly první komerční relační databázové servery?
3 zdroje dat. Relační databáze EIS OLAP
Zdroje dat 3 zdroje dat Relační databáze EIS OLAP Relační databáze plochá dvourozměrná tabulková data OLTP (Online Transaction Processing) operace selekce projekce spojení průnik, sjednocení, rozdíl dotazování
Integrace dat. RNDr. Ondřej Zýka
Integrace dat RNDr. Ondřej Zýka 1 Obsah Kategorizace integračních přístupů Kroky integrace a řešení problematických stavů Master Data Management 2 2 Datová integrace Synchronní Akceptovaný požadavek na
Databáze. datum jmeno prijmeni adresa_ulice adresa_mesto cislo_uctu platba zustatek
Databáze datum jmeno prijmeni adresa_ulice adresa_mesto cislo_uctu platba zustatek 980103 Jan Novak Dlouha 5 Praha 1 9945371 100.00 100.00 980105 Jan Novak Dlouha 5 Praha 1 9945371 1500.00 1600.00 980106
Datový sklad. Datový sklad
Datový sklad Postavení v rámci IS/ICT Specifika návrhu Modelování Datový sklad POSTAVENÍ NÁVRH Postavení datového skladu (DW) v IS/ICT z hlediska aplikací jako součást Business Intelligence z hlediska
DATABÁZOVÉ SYSTÉMY. Metodický list č. 1
Metodický list č. 1 Cíl: Cílem předmětu je získat přehled o možnostech a principech databázového zpracování, získat v tomto směru znalosti potřebné pro informačního manažera. Databázové systémy, databázové
Analýza a modelování dat. Přednáška 8
Analýza a modelování dat Přednáška 8 OLAP, datová kostka, dotazování nad kostkou Motivace většina DB relační zaznamenání vztahů pomocí logicky provázaných tabulek jakou mají velmi často vztahy povahu vztah
kapitola 2 Datové sklady, OLAP
Tomáš Burger, burger@fit.vutbr.cz kapitola 2 Datové sklady, OLAP Získávání znalostí z databází IT-DR-3 / ZZD Co je to datový sklad A data warehouse is a subjectoriented, integrated, time-variant and nonvolatile
Základy business intelligence. Jaroslav Šmarda
Základy business intelligence Jaroslav Šmarda Základy business intelligence Business intelligence Datový sklad On-line Analytical Processing (OLAP) Kontingenční tabulky v MS Excelu jako příklad OLAP Dolování
Analýza a modelování dat. Přednáška 9
Analýza a modelování dat Přednáška 9 Další dotazování nad kostkou Rozšíření SQL99 rozšíření SQL99 (minulá přednáška): seskupovací operátory za GROUP BY CUBE statistiky dle řezů ROLLUP statistiky dle rolování
Marketingová komunikace. 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3bph)
Marketingová komunikace Kombinované studium Skupina N9KMK3PH (vm3bph) 3. soustředění Mgr. Pavel Vávra 9103@mail.vsfs.cz http://vavra.webzdarma.cz/home/index.htm Zdroje Studijní materiály Heleny Palovské
BI v rámci IS/ICT komponenty BI architektura. Charakteristika dat a procesů v IS/ICT. Datové sklady ukládání dat návrh datového skladu
BI v rámci IS/ICT komponenty BI architektura Charakteristika dat a procesů v IS/ICT Datové sklady ukládání dat návrh datového skladu BI CRM ERP SCM Aplikace pro podporu základních řídících a administrativních
Databáze Bc. Veronika Tomsová
Databáze Bc. Veronika Tomsová Databázové schéma Mapování konceptuálního modelu do (relačního) databázového schématu. 2/21 Fyzické ik schéma databáze Určuje č jakým způsobem ů jsou data v databázi ukládána
Business Intelligence. Adam Trčka
Business Intelligence Adam Trčka 09:00 11:30: BI v kostce Navrhněme si sklad Ukázka BI Datamining 12:30 14:30: Pokračování kurzu 14:30 15:00: Q&A Agenda Co se dnes dovíme? Data informace znalost Business
Datové sklady. Multidimenzionální modelování Modely datového skladu Návrh datového skladu v rámci návrhu IS/ICT. Vladimíra Zádová, KIN, EF, TUL
Datové sklady Multidimenzionální modelování Modely datového skladu Návrh datového skladu v rámci návrhu IS/ICT Multidimenzionální modelování (Multi)dimenzionální modelování speciální technika určená pro
AdventureWorksDW2014 SQL Server Data Tools Multidimenziona lnı model Tabula rnı model Multidimenziona lnı mo d Tabula rnı mo d MS SQL Server 2016 Tabula rnı mo d Azure Analysis Services 16 3.2 Dimenzionální
Integrace dat. RNDr. Ondřej Zýka
Integrace dat RNDr. Ondřej Zýka 1 Obsah Kategorizace integračních přístupů Kroky integrace a řešení problematických stavů Master Data Management 2 2 Datová integrace Synchronní Akceptovaný požadavek na
Databázové systémy. 10. přednáška
Databázové systémy 10. přednáška Business Intelligence Poprvé byl termín BI použit Gartnerem a dále pak popularizován Howardem Dresnerem jako: proces zkoumání doménově strukturovaných informací za účelem
Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Kapitola 4. Úvod 11. Stručný úvod do relačních databází 13. Platforma 10g 23
Stručný obsah 1. Stručný úvod do relačních databází 13 2. Platforma 10g 23 3. Instalace, první přihlášení, start a zastavení databázového serveru 33 4. Nástroje pro administraci a práci s daty 69 5. Úvod
Jak velká jsou? Obchodní analytici FB velké datové sady BI = business intelligence. OLAP = Online Analytical Processing. DWH = Data Warehouse
název B = Bajt KB = Kilobajt MB = Megabajt GB = Gigabajt TB = Terabajt PB = Petabajt EB = Exabajt ZB = Zettabajt YB = Yottabajt velikost 8 b 2^10 B 2^20 B 2^30 B 2^40 B 2^50 B 2^60 B 2^70 B 2^80 B Jak
Datové sklady. Ing. Jan Přichystal, Ph.D. 1. listopadu 2011. PEF MZLU v Brně
PEF MZLU v Brně 1. listopadu 2011 Úvod Intenzivní nasazení informačních technologií způsobuje hromadění obrovské spousty nejrůznějších údajů. Příkladem mohou být informace z obchodování s cennými papíry
Zkušební test. Kdy se začala formovat koncept relačních databází (Vznik relačního modelu, první definice SQL)? a) 1950 b) 1960 c) 1970 d) 1980
Zkušební test Gen Student: Ročník: Datum: Propozice: Pokud otázka nabízí výběr z více možností, více než jedna odpověď může být správná. Označte všechny správné možnosti. Pokud otázka vyžaduje slovní odpověď,
Datová kvalita. RNDr. Ondřej Zýka
Datová kvalita RNDr. Ondřej Zýka 1 Datová kvalita Jedna z kompetencí Data managementu Cíl: Zajistit uživatelům data v kvalitě potřebné k jejich činnosti Kvalita dat: Subjektivní pojem závislý na požadavcích
Datová kvalita. RNDr. Ondřej Zýka
Datová kvalita RNDr. Ondřej Zýka 1 Datová kvalita Jedna z kompetencí Data managementu Cíl: Zajistit uživatelům data v kvalitě potřebné k jejich činnosti Kvalita dat: Subjektivní pojem závislý na požadavcích
On line analytical processing (OLAP) databáze v praxi
On line analytical processing (OLAP) databáze v praxi Lukáš Matějovský Lukas.Matejovsky@CleverDecision.com Jan Zajíc Jan.Zajic@CleverDecision.com Obsah Představení přednášejících Základy OLAP Příklady
Obsah. Úvod do problematiky. Datový sklad. Proces ETL. Analýza OLAP
Petr Jaša Obsah Úvod do problematiky Data vs. informace Operační vs. analytická databáze Relační vs. multidimenzionální model Datový sklad Důvody pro budování datových skladů Definice, znaky Schéma vazeb
Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9
Obsah Úvod 9 Kapitola 1 Business Intelligence, datové sklady 11 Přechod od transakčních databází k analytickým..................... 13 Kvalita údajů pro analýzy................................................
Metadata. RNDr. Ondřej Zýka
Metadata RNDr. Ondřej Zýka 1 Metadata Jedna z kompetencí Data managementu Cíle kompetence: Zajistit jednotné porozumění a užití termínů Provázat informace na různých úrovních (byznys, aplikační, technické)
Zdroje informací v organizaci IS/ICT BI v rámci IS/ICT historie architektura OLTP x DW ukládání dat
Zdroje informací v organizaci IS/ICT BI v rámci IS/ICT historie architektura OLTP x DW ukládání dat Vladimíra Zádová BI CRM ERP SCM Aplikace pro podporu základních řídících a administrativních operací
Operátory ROLLUP a CUBE
Operátory ROLLUP a CUBE Dotazovací jazyky, 2009 Marek Polák Martin Chytil Osnova přednášky o Analýza dat o Agregační funkce o GROUP BY a jeho problémy o Speciální hodnotový typ ALL o Operátor CUBE o Operátor
Analýza a modelování dat 6. přednáška. Helena Palovská
Analýza a modelování dat 6. přednáška Helena Palovská Historie databázových modelů Jak je řešena temporalita? Temporalita v databázích Možnosti pro platnost faktu (valid time): platí nyní, je to aktuální
Databáze I. 5. přednáška. Helena Palovská
Databáze I 5. přednáška Helena Palovská palovska@vse.cz SQL jazyk definice dat - - DDL (data definition language) Základní databáze, schemata, tabulky, indexy, constraints, views DATA Databáze/schéma
Obsah. SQL konstrukce select join Rekurze (rekurzivní with) Analytické funkce, group by Pivoting
Cvičení 5 SQL 1 Obsah SQL konstrukce select join Rekurze (rekurzivní with) Analytické funkce, group by Pivoting 2 2 Oracle Model 3 3 Načtení modelu z katalogu Napojení: IP adresa: 193.85.191.165 Port:
Analýza a modelování dat 5. přednáška. Helena Palovská
Analýza a modelování dat 5. přednáška Helena Palovská Historie databázových modelů Multidimenzionální model Kvantitativní typ faktu s určitými hledisky např.: Kdo komu kdy jak moc čeho prodal. kdo, komu,
Základní informace o co se jedná a k čemu to slouží
Základní informace o co se jedná a k čemu to slouží založené na relačních databází transakční systémy, které jsou určeny pro pořizování a ukládání dat v reálném čase (ERP, účetní, ekonomické a další podnikové
Informační systémy 2008/2009. Radim Farana. Obsah. Obsah předmětu. Požadavky kreditového systému. Relační datový model, Architektury databází
1 Vysoká škola báňská Technická univerzita Ostrava Fakulta strojní, Katedra automatizační techniky a řízení 2008/2009 Radim Farana 1 Obsah Požadavky kreditového systému. Relační datový model, relace, atributy,
Metadata. MI-DSP 2013/14 RNDr. Ondřej Zýka, ondrej.zyka@profinit.eu
Metadata MI-DSP 2013/14 RNDr. Ondřej Zýka, ondrej.zyka@profinit.eu Co to jsou metadata Chybějící metadata Doplněná metadata Co o metadatech říkají autority Řízení metadata je nepochybně nejdůležitější
Information and Data Management. RNDr. Ondřej Zýka
Information and Data Management RNDr. Ondřej Zýka 1 Informační a datový management Disciplína zaměřená na správu informací (z mnoha zdrojů) a spřístupnění informací různým typům uživatelů podle jejich
Databáze I. Přednáška 4
Databáze I Přednáška 4 Definice dat v SQL Definice tabulek CREATE TABLE jméno_tab (jm_atributu typ [integr. omez.], jm_atributu typ [integr. omez.], ); integritní omezení lze dodefinovat později Definice
Business Intelligence
Business Intelligence Skorkovský KAMI, ESF MU Principy BI zpracování velkých objemů dat tak, aby výsledek této akce manažerům pomohl k rozhodování při řízení procesů výsledkem zpracování musí být relevantní
Použití databází na Webu
4IZ228 tvorba webových stránek a aplikací Jirka Kosek Poslední modifikace: $Date: 2010/11/18 11:33:52 $ Obsah Co nás čeká... 3 Architektura webových databázových aplikací... 4 K čemu se používají databázové
NÁVRH APLIKACE BUSINESS INTELLIGENCE PRO SPOLEČNOST BREX S. R. O.
NÁVRH APLIKACE BUSINESS INTELLIGENCE PRO SPOLEČNOST BREX S. R. O. Bakalářská práce Studijní program: Studijní obor: Autor práce: Vedoucí práce: B6209 Systémové inženýrství a informatika 6209R021 Manažerská
Kurz Databáze. Obsah. Dotazy. Zpracování dat. Doc. Ing. Radim Farana, CSc.
1 Kurz Databáze Zpracování dat Doc. Ing. Radim Farana, CSc. Obsah Druhy dotazů, tvorba dotazu, prostředí QBE (Query by Example). Realizace základních relačních operací selekce, projekce a spojení. Agregace
Základy databází. O autorech 17 PRVNÍ ČÁST. KAPITOLA 1 Začínáme 19
3 Obsah Novinky v tomto vydání 10 Význam základních principů 11 Výuka principů nezávisle na databázových produktech 12 Klíčové pojmy, kontrolní otázky, cvičení, případové studie a projekty 12 Software,
Multi-dimensional expressions
Multi-dimensional expressions Query sent to cube / returned from cube jazyk pro multidimenzionální dotazy ekvivalent SQL pro multidimenzionální databáze je jen prostředkem pro přístup k datům jako SQL
Dobývání znalostí z databází. Databáze. datum jmeno prijmeni adresa_ulice adresa_mesto cislo_uctu platba zustatek
Databáze datum jmeno prijmeni adresa_ulice adresa_mesto cislo_uctu platba zustatek 980103 Jan Novak Dlouha 5 Praha 1 9945371 100.00 100.00 980105 Jan Novak Dlouha 5 Praha 1 9945371 1500.00 1600.00 980106
4IT218 Databáze. 4IT218 Databáze
4IT218 Databáze Osmá přednáška Dušan Chlapek (katedra informačních technologií, VŠE Praha) 4IT218 Databáze Osmá přednáška Normalizace dat - dokončení Transakce v databázovém zpracování Program přednášek
Informační systémy 2006/2007
13 Vysoká škola báňská Technická univerzita Ostrava Fakulta strojní, Katedra automatizační techniky a řízení Informační systémy 2006/2007 Ivan Kedroň 1 Obsah Analytické nástroje SQL serveru. OLAP analýza
Temporální databáze. Jan Kolárik Miroslav Macík
Temporální databáze Jan Kolárik Miroslav Macík 2012 Úvod jak zachytit časově proměnnou povahu jevů konvenční databáze stav pouze v jednom bodě časové linie aktuální obsah ~ statický snímek (snapshot) temporální
Konsolidovaný reporting CZ/SK v Cognos případová studie sanofi-aventis
Konsolidovaný reporting CZ/SK v Cognos případová studie sanofi-aventis Rosťa Levíček 22. listopadu 2011 Obsah Výchozí stav a požadavky Architektura řešení v CZ Varianty konsolidace Klíčové faktory úspěchu
PV005 Služby počítačových sítí: Data Warehouses
PV005 Služby počítačových sítí: Data Warehouses Jaroslav Bayer 1 Fakulta informatiky Masarykova univerzita 26. 11. 2015 1 CVT FI MU, B310, email: xbayer@fi.muni.cz Jaroslav Bayer (FI MU) PV005 Služby počítačových
ANALYSIS SERVICES PROJEKT VYTVOŘENÍ PROJEKTU A DATOVÉ KOSTKY
ANALYSIS SERVICES PROJEKT VYTVOŘENÍ PROJEKTU A DATOVÉ KOSTKY Spusťte BIDS - z menu vyberte File/New/Project a vytvořte nový Analysis Services Project typu Bussines Inteligence Project - doplňte jméno projektu
Kapitola 1: Úvod. Systém pro správu databáze (Database Management Systém DBMS) Účel databázových systémů
- 1.1 - Kapitola 1: Úvod Účel databázových systémů Pohled na data Modely dat Jazyk pro definici dat (Data Definition Language; DDL) Jazyk pro manipulaci s daty (Data Manipulation Language; DML) Správa
Data Warehouses. Jaroslav Bayer 1. Fakulta informatiky Masarykova univerzita
PV005 Služby počítačových sítí: Data Warehouses Jaroslav Bayer 1 Fakulta informatiky Masarykova univerzita 28. 11. 2012 1 CVT FI MU, B310, email: xbayer@fi.muni.cz Jaroslav Bayer (FI MU) PV005 Služby počítačových
Vytvoření datového skladu
Bankovní institut vysoká škola Praha Katedra informatiky a kvantitativních metod Vytvoření datového skladu Diplomová práce Autor: Petr Havlas Informační technologie a management Vedoucí práce: doc. Ing.
Databáze SQL SELECT. David Hoksza http://siret.cz/hoksza
Databáze SQL SELECT David Hoksza http://siret.cz/hoksza Osnova Úvod do SQL Základní dotazování v SQL Cvičení základní dotazování v SQL Structured Query Language (SQL) SQL napodobuje jednoduché anglické
Databázové systémy. - SQL * definice dat * aktualizace * pohledy. Tomáš Skopal
Databázové systémy - SQL * definice dat * aktualizace * pohledy Tomáš Skopal Osnova přednášky definice dat definice (schémat) tabulek a integritních omezení CREATE TABLE změna definice schématu ALTER TABLE
Marketingová komunikace. 2. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK1aPH/N9KMK1bPH (um1a1ph/um1b1ph)
Marketingová komunikace Kombinované studium Skupina N9KMK1aPH/N9KMK1bPH (um1a1ph/um1b1ph) 2. soustředění Mgr. Pavel Vávra 9103@mail.vsfs.cz http://vavra.webzdarma.cz/home/index.htm Minulé soustředění úvod
Úvod do databázových systémů
Vysoká škola báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky Úvod do databázových systémů Cvičení 3 Ing. Petr Lukáš petr.lukas@vsb.cz Ostrava, 2014 Opakování 4 fáze vytváření
Jaký je rozdíl v definicicíh VARCHAR2(20 BYTE) a VARCHAR2(20 CHAR):
Mezi příkazy pro manipulaci s daty (DML) patří : 1. SELECT 2. ALTER 3. DELETE 4. REVOKE Jaké vlastnosti má identifikující relace: 1. Je relace, která se využívá pouze v případě modelovaní odvozených entit
Relační DB struktury sloužící k optimalizaci dotazů - indexy, clustery, indexem organizované tabulky
Otázka 20 A7B36DBS Zadání... 1 Slovníček pojmů... 1 Relační DB struktury sloužící k optimalizaci dotazů - indexy, clustery, indexem organizované tabulky... 1 Zadání Relační DB struktury sloužící k optimalizaci
Datová kvalita základ úspěšného BI. RNDr. Ondřej Zýka, Profinit
Datová kvalita základ úspěšného BI RNDr. Ondřej Zýka, Profinit 1.6.2012 Datová exploze Snižování nákladů o Zdvojnásobení objemu podnikových dat každé dva roky o Konkurenční tlak o Ekonomická krize o V
Datové modelování II
Datové modelování II Atributy Převod DM do schématu SŘBD Dotazovací jazyk SQL Multidimenzionální modelování Principy Doc. Miniberger, BIVŠ Atributy Atributem entity budeme rozumět název záznamu či informace,
DATA CUBE. Mgr. Jiří Helmich
DATA CUBE Mgr. Jiří Helmich Analytické kroky formulace dotazu analýza extrakce dat vizualizace Motivace n-sloupcová tabulka v Excelu vs. sloupcový graf Dimensionality reduction n dimenzí data obecně uspořádána
8.2 Používání a tvorba databází
8.2 Používání a tvorba databází Slide 1 8.2.1 Základní pojmy z oblasti relačních databází Slide 2 Databáze ~ Evidence lidí peněz věcí... výběry, výpisy, početní úkony Slide 3 Pojmy tabulka, pole, záznam
<Insert Picture Here> Na co se můžete s Oracle BI těšit
Na co se můžete s Oracle BI těšit Tomáš Pospíšil, Oracle Czech Olomouc, 6.3.2014 Oracle BI Ukázka Oracle BI Možnosti platformy Oracle Business
PostgreSQL jako platforma pro datové sklady
PostgreSQL jako platforma pro datové sklady Vratislav Beneš benes@optisolutions.cz 1. Co to jsou datové sklady? 2. Požadavky na datový sklady 3. Technické řešení datového skladu 4. PostgreSQL a datové
Podnikové informační systémy Jan Smolík
Podnikové informační systémy Jan Smolík Zobecněné schéma aplikační architektury Vlastníci, management Aplikační architektura podnikové informatiky Business Intelligence, manažerské aplikace Obchodní partneři
TM1 vs Planning & Reporting
R TM1 vs Planning & Reporting AUDITOVATELNOST? ZABEZPEČENÍ? SDÍLENÍ? KONSOLIDACE? PROPOJITELNOST???? TM1?? COGNOS PLANNING IBM COGNOS 8 PLANNING Cognos Planning Podpora plánovacího cyklu Jednoduchá tvorba
Data warehousing a ETL
Data warehousing a ETL Firemní semináře 2013/2014 MFF UK Praha, 21.5.2014 Filip Moudrý, filip.moudry@javlin.eu Program Javlin data warehouse ETL praktické ukázky diskuze Když se řekne: data warehouse ETL
František Ščuglík. Datové sklady a Technologie OLAP pro dolování dat
František Ščuglík Datové sklady a Technologie OLAP pro dolování dat Obsah Co to je Datový sklad? Multi-dimensionální datový model Architektura Datového skladu Implementace Datového skladu Dolování dat
Multidimenzionální pohled na zdravotnické prostředí. INMED Petr Tůma
Multidimenzionální pohled na zdravotnické prostředí INMED - 21.11.2003 Petr Tůma Koncepce multid pohledu Poskytování péče probíhá v multidimenzionálním světě; dimenze tento svět mapují podobně jako souřadnice
Úvod do databázových systémů
Vysoká škola báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky Úvod do databázových systémů Cvičení 8 Ing. Petr Lukáš petr.lukas@vsb.cz Ostrava, 2014 Opakování Entita Entitní typ
Dotazovací jazyky I. Datová krychle. Soběslav Benda
Dotazovací jazyky I Datová krychle Soběslav Benda Obsah Úvod do problematiky Varianty přístupu uživatelů ke zdrojům dat OLTP vs. OLAP Datová analýza Motivace Vytvoření křížové tabulky Datová krychle Teorie
Informační systémy 2008/2009. Radim Farana. Obsah. Dotazy přes více tabulek
5 Vysoká škola báňská Technická univerzita Ostrava Fakulta strojní, Katedra automatizační techniky a řízení 2008/2009 Radim Farana 1 Obsah Jazyk SQL, Spojení tabulek, agregační dotazy, jednoduché a složené
Business Intelligence
Business Intelligence Josef Mlnařík ISSS Hradec Králové 7.4.2008 Obsah Co je Oracle Business Intelligence? Definice, Od dat k informacím, Nástroj pro operativní řízení, Integrace informací, Jednotná platforma
Databázové systémy Cvičení 5.2
Databázové systémy Cvičení 5.2 SQL jako jazyk pro definici dat Detaily zápisu integritních omezení tabulek Integritní omezení tabulek kromě integritních omezení sloupců lze zadat integritní omezení jako
Jazyk PL/SQL Úvod, blok
Jazyk PL/SQL Úvod, blok 1 Bc. Tomáš Romanovský Procedural Language for Structured Query Language Součást systému Oracle, rozšíření SQL o procedurální rysy Prostředky pro vytváření a spouštění programových
Verzování a publikace dat na webu za pomoci PostgreSQL
Prague PostgreSQL Developers' Day 2013 Verzování a publikace dat na webu za pomoci PostgreSQL Jan Pěček Kdo jsem? Jan Pěček Programátor PostgreSQL Jyxo, s.r.o. (Blog.cz) MAFRA, a.s. - Internet Trading
Trendy v IS/ICT přístupy k návrhu multidimenzionální modelování
Trendy v IS/ICT přístupy k návrhu multidimenzionální modelování Aplikace IS/ICT BI SCM e-business ERP ERP CRM II e-business Aplikace pro podporu základních řídících a administrativních operací 1 Informační
QAD Business Intelligence
QAD Business Intelligence Vladimír Bartoš, Pavel Němec Konzultanti 13.6.2012 Komponenty QAD BI Analytické tabule pro podporu rozhodování Spolupráce uživatelů nad analyzovanými daty Reporty Generátor analytických
Databáze. Logický model DB. David Hoksza
Databáze Logický model DB David Hoksza http://siret.cz/hoksza Osnova Relační model dat Převod konceptuálního schématu do logického Funkční závislosti Normalizace schématu Cvičení převod do relačního modelu
Základy informatiky. 06 Databázové systémy. Kačmařík/Szturcová/Děrgel/Rapant
Základy informatiky 06 Databázové systémy Kačmařík/Szturcová/Děrgel/Rapant Problém zpracování dat důvodem je potřeba zpracovat velké množství dat, evidovat údaje o nějaké skutečnosti: o skupině lidí (zaměstnanců,
B0M33BDT Technologie pro velká data. Supercvičení SQL, Python, Linux
B0M33BDT Technologie pro velká data Supercvičení SQL, Python, Linux Sergej Stamenov, Jan Hučín 18. 10. 2017 Osnova cvičení Linux SQL Python 2 SQL pro uživatele aneb co potřebuje znát a umět bigdatový uživatel:
CSPUG 2011-květen. GridSQL a pg-pool II. Vratislav Beneš benes@optisolutions.cz
GridSQL a pg-pool II Vratislav Beneš benes@optisolutions.cz Agenda 1. Datové sklady a datová tržiště 2. pg-pool II 1. Infrastrukutra 2. Využití pro datové sklady 3. GridSQL 1. Infrastuktura 2. Vytvoření
Možnosti analýzy podnikových dat
Možnosti analýzy podnikových dat Business Data Analyses Possibilities Bc. Dagmar Pokorná Diplomová práce 2010 UTB ve Zlíně, Fakulta aplikované informatiky, 2010 4 ABSTRAKT Dnešní doba je charakterizována
MBI - technologická realizace modelu
MBI - technologická realizace modelu 22.1.2015 MBI, Management byznys informatiky Snímek 1 Agenda Technická realizace portálu MBI. Cíle a principy technického řešení. 1.Obsah portálu - objekty v hierarchiích,
Manažerský reporting a finanční plánování Targetty
Manažerský reporting a finanční plánování Targetty v O2 Milan Štoček Milan.Stocek@CleverDecision.com Agenda Představení Clever Decision a Uniwise Targetty - Enterprise Performance Management Planning Architektura
Návrh a tvorba WWW stránek 1/14. PHP a databáze
Návrh a tvorba WWW stránek 1/14 PHP a databáze nejčastěji MySQL součástí balíčků PHP navíc podporuje standard ODBC PHP nemá žádné šablony pro práci s databází princip práce s databází je stále stejný opakované
Konceptuální modely datového skladu
Vladimíra Zádová Katedra informatiky, TU Liberec, e-mail: vladimira.zadova@tul.cz Abstrakt: Příspěvek je zaměřen na modely datového skladu pro konceptuální úroveň návrhu. Existující modely pro tuto úroveň
Projekt Business Intelligence pro společnost Nutricia, a.s.
Vysoká škola ekonomická v Praze Fakulta informatiky a statistiky Vyšší odborná škola informačních služeb v Praze Student : Karel Hrubý Vedoucí bakalářské práce : PhDr. Kateřina Julišová TÉMA BAKALÁŘSKÉ
Platforma Java. Petr Krajča. Katedra informatiky Univerzita Palackého v Olomouci. Petr Krajča (UP) KMI/PJA: Seminář V. 27. říjen, / 15
Platforma Java Objektově relační mapování II Petr Krajča Katedra informatiky Univerzita Palackého v Olomouci Petr Krajča (UP) KMI/PJA: Seminář V. 27. říjen, 2016 1 / 15 Dotazování vyhledání objektu podle
Databázové systémy. Datová integrita + základy relační algebry. 4.přednáška
Databázové systémy Datová integrita + základy relační algebry 4.přednáška Datová integrita Datová integrita = popisuje pravidla, pomocí nichž hotový db. systém zajistí, že skutečná fyzická data v něm uložená