Projekt Business Intelligence pro společnost Nutricia, a.s.

Rozměr: px
Začít zobrazení ze stránky:

Download "Projekt Business Intelligence pro společnost Nutricia, a.s."

Transkript

1 Vysoká škola ekonomická v Praze Fakulta informatiky a statistiky Vyšší odborná škola informačních služeb v Praze Student : Karel Hrubý Vedoucí bakalářské práce : PhDr. Kateřina Julišová TÉMA BAKALÁŘSKÉ PRÁCE Projekt Business Intelligence pro společnost Nutricia, a.s. ROK: 2009

2 Zadávací list

3 Prohlášení Prohlašuji, že jsem bakalářskou práci na téma Projekt Business Intelligence zpracoval samostatně a použil pouze zdrojů, které cituji a uvádím v seznamu použité literatury. V Praze dne Podpis

4 Poděkování Děkuji své vedoucí PhDr. Kateřině Julišové za pomoc při tvorbě této bakalářské práce.

5 Abstrakt Firmy se stále více ohlížejí po systémovém řešení, které si poradí s jejich obrovským množstvím dat. Účelem Business Intelligence je konvertovat tyto data na poznatky, které jsou potřebné pro koncové uživatele. Cílem práce je analýza a návrh projektu Business Intelligence, který by byl vhodný pro danou firmu. Prvním krokem je transformace dat z transakčních databází do datového skladu. Tato kapitola se skládá z popisu datových pump. Z datového skladu se dají následně vytvářet reporty, které budou obsahem další části této práce, skládající se z příkladu manažerského reportu. Další důležitou součástí Business Intelligence je OLAP analýza uvedená v další kapitole, která popisuje postup vytvoření OLAP kostky. Abstract Companies are still looking for system solution, which can manage their huge amount of data. The purpose of Business Intelligence is to convert this data to knowledge which is needed for the end users. The goal of this paper is to outline a Business Intelligence project, which would be useful for the given company. First step is to transform data from transactional databases do the data warehouse. This chapter features the description of an ETL process. Consequently it is possible to create reports from data warehouse, which will highlight the next section. This part consists of an example of a manager report. Further important part of Business Intelligence is an OLAP analysis introduced in the next chapter describing the procedure of creating an OLAP cube.

6 Obsah 1 Úvod Datový sklad Datový tok z transakčního prostředí Vrstva L0 - Staging area Import dat do vrstvy L Vrstva L1 - Relational area Import číselníků do vrstvy L Import ostatních dat do L1(LoadL1.dtsx) Error databáze Reporty Koláčový graf Liniový graf OLAP kostka Metody uložení dat Faktová tabulka Dimenze Dimenze Article Dimenze Customer Dimenze Time Dimenze Person Dimenze Warehouse Příklad OLAP kostky Závěr Zdroje... 1

7 Seznam obrázků Obrázek 1.1 Informace, data, znalosti [1]... 1 Obrázek Popis procesu načítání dat... 5 Obrázek DTSX balíčky... 6 Obrázek Tabulky vrstvy L Obrázek Import do vrstvy L Obrázek 2.5 DTSX balíček Imp_Ciselniky.dtsx... 9 Obrázek Vymazání tabulek Obrázek Číselník v Excelu Obrázek 2.8 Tabulky L Obrázek Load číselníků z vrstvy L0 do vrstvy L Obrázek Load číselníku PartnerGroup do vrstvy L Obrázek Transformace z vrstvy L0 do vrstvy L Obrázek Data Flow Customer Obrázek Schema vrstvy L Obrázek 3.1 Graf prodeje výrobků za rok Obrázek Částka za jednotlivé měsíce Obrázek Snowflake schema Obrázek UDM je most mezi uživateli a jejich daty [17] Obrázek Výběr metody uložení dat Obrázek 4.4 Možnosti agregací Obrázek 4.5 Příklad OLAP kostky... 33

8 1 Úvod Business Intelligence (BI) je v poslední době nejvíce se rozvíjejícím oborem v podnikové oblasti. Firmy chtějí získat konkurenční výhodu a právě jedna z možností je Business Intelligence, tedy jinak řečeno transformace dat na informace, které se převádějí na poznatky. Podle [1] jsou data jakékoli vyjádření (reprezentace) skutečnosti, schopné přenosu, uchování, interpretace či zpracování. Jsou rovněž "surovinou", z níž se tvoří informace. Informace jsou data, která mají smysl (význam), jsou sdělitelná (komunikovatelná). I ony jsou "surovina", z níž se tvoří znalost. Poznatek resp. znalosti (soustava poznatků tvoří znalost) jsou informace a data, jež umíme použít, a jsou začleněná do souvislostí. Obrázek 1.1 Informace, data, znalosti [1] A co nám BI může nabídnout? Firmy se stále více ohlížejí po řešení, které je schopné efektivně zpracovat obrovské množství dat, které mají k dispozici a z toho vytvořit potřebné znalosti. Tyto znalosti dokážou například podstatně snížit náklady na marketingovou kampaň tím, že se jejich prostřednictvím nechá vyhledat optimální cílová skupina. 1

9 Definic BI je několik. Jedna například říká, že je to sada procesů, aplikací a technologií mající za cíl účinně ovlivňovat rozhodovací procesy ve firmě. Aplikace BI pokrývají analytické a plánovací funkce většiny oblastí podnikového řízení. Jak ukazuje tabulka 1.1, BI se dnes stává prioritou pro mnoho firem. Právě v době hospodářské krize, kdy převládá nejistota a pro situaci se vyhledává optimální řešení, hraje Business Intelligence rozhodující roli, jak zvýšit konkurenceschopnost. 1. Business intelligence 2. Enterprise applications (ERP, CRM and others) 3. Servers and storage technologies (virtualization) 4. Legacy application modernization 5. Collaboration technologies 6. Networking, voice and data communications 7. Technical infrastructure 8. Security technologies 9. Service-oriented applications and architecture 10. Document management Tabulka Top 10 Business and Technology Priorities in 2009 [19] Součástí této práce je i rozbor konkrétního BI řešení pro firmu Nutricia. Jde o vybudování datového skladu, z kterého se následně vytvářejí reporty, či OLAP kostky. Práce je ztížená tím, že zaměstnanci firmy Nutricia jsou zvyklí pracovat s Excelem, a proto budou všechny číselníky upravovat pomocí tohoto nástroje. Samozřejmě by bylo jednodušší 2

10 udělat front-end aplikaci přímo pro práci s databází, kde lze manipulovat s daty pouze v rámci této databáze a nemusí se při každé změně transformovat data do Excelu a zpět. Je však známo, že zaměstnanci se obecně neradi učí nové věci. 3

11 2 Datový sklad 2.1 Datový tok z transakčního prostředí Vytvoření datového skladu je nejdůležitější krok v celém procesu Business Intelligence. Bez kvalitních a vyčištěných dat nelze tvořit reporty či OLAP kostky, které mají nějakou vypovídající hodnotu. Data se čerpají z transakčních databází, které nejsou na analýzy moc vhodné. Hlavní rozdíl mezi transakční databází a datovým skladem je ten, že transakční databáze je navržena a optimalizována pro záznam. OLAP databáze má ale jiný úkol. Má ukázat to, co se stalo. Například v jakém časovém období jsme utržili peníze za daný výrobek. Datový sklad musí být navržen a optimalizován na odpovědi analytických dotazů, které jsou důležité pro naši firmu. Data v datovém skladu jsou optimalizována pouze na čtení. Nové data se nahrávají za určitý časový úsek, například jednou denně, týdně, měsíčně atd. Databáze firmy Nutricia se skládá z databáze MS SQL Server 2005, kterou využívá účetní software EXACT. Dále je mnoho dat uloženo v Excel tabulkách. V účetním systému EXACT probíhají následující procesy: 1. Vytvoří se prodejní objednávka 2. Z prodejní objednávky se vytiskne dodací list + vytvoří se záznam v tabulce faktura + vygeneruje se výdej ze skladu 3. Vytištění faktury + zápis do hlavní knihy - účty 604 K zajištění aktuálnosti údajů v datovém skladu firmy Nutricia je zapotřebí nastavit pravidelné procesy čerpající data do datového skladu ze zdrojových systémů. Jedná se o následující zdroje: 1. Databáze EXACT (Účetní software), ze které budou data načítána automaticky 2. Sada číselníků, udržovaných v tabulce Ciselniky.xls 4

12 Obrázek Popis procesu načítání dat Popis obrázku Přemístění souborů na Server 2. Datová pumpa z Excelu do vrstvy L0 3. Datová pumpa z vrstvy L0 do vrstvy L1 4. Vytvoření L2 pomocí Analysis Services 5. DB Link převedení databáze z Exactu do vrstvy L1 6. Použití dat pro reporty 7. Použití dat pro OLAP kostku Transformace dat se provádí pomocí MS Visual Studia 2005 Integration Services. Balíčky pro import Na obrázku 2.2 jsou vidět všechny dtsx balíčky, pomocí nichž se provádí import do vrstvy L0 a L1. 5

13 Obrázek DTSX balíčky 2.2 Vrstva L0 - Staging area Ve vrstvě L0 Stage nejsou definované žádné klíče, vztahy atd. Data se jen transformují z Excelu do databáze. Struktura tabulek odráží strukturu vstupních souborů. Data v L0 nejsou viditelná pro koncové uživatele a ještě nejsou připravená na analýzu. Je to jen mezistupeň, než se data dostanou do vrstvy L1. Staging area obsahuje extrakty z primárních systémů: 1. Účetní systém EXACT vzhledem k tomu, že tento systém užívá databázi MS SQL, tabulky se načtou prostřednictvím DTSX balíčků přímo z databáze a není potřeba žádné transformace. 2. Master data a ostatní zdrojová data jsou uložena v Excel tabulkách. Ty se nahrají prostřednictvím DB loaderu. 6

14 Během nahrání budou probíhat následující kontroly: 1. Kompletní počet a délka záznamů 2. Datový typ (date, integer, number,char ) Tabulky Zkratka Cis znamení číselník. Obrázek Tabulky vrstvy L0 7

15 2.2.1 Import dat do vrstvy L0 Jednorázový import Jednorázový import se týká DTSX balíčků (viz Obrázek 2.3), které začínají písmeny Imp. Jediná výjimka je balíček Imp_Ciselniky. Tento import se provádí opakovaně při změně číselníku. V těchto datových pumpách probíhá transformace z Excelu do databáze. Dále už se s těmito daty v Excel souborech pracovat nebude. V příkladu (Obrázek 2.5) je vidět ukázka ETL procesu (Extract, transform, load ) do vrstvy L0. Extract Extrakt dat z Excelu Transform Transformace dat do jiného kódování Load Import do tabulky v databázi Obrázek Import do vrstvy L0 Nejdříve se data nahrají do datové pumpy z listu Excelu. Poté se konvertují do požadované podoby a následně uloží do databáze. 8

16 Import číselníků z Excelu do vrstvy L0 (Imp_Ciselniky.dtsx) Tento proces probíhá opakovaně. Číselníky se aktualizují pomocí Excelu a potom se transformují do databáze vrstvy L0. Při importu číselníku do vrstvy L0 se nemusí provádět kontrola duplicity, protože se stará data vždy mažou a nahrazují se aktuálními. Data-flow rámeček Delete (Obrázek 2.5) obsahuje SQL příkazy truncate (Obrázek 2.6), který nejprve vymaže všechna data v tabulkách. Data se potom v aktualizované podobě nahrají z Excelu zpět do databáze. Obrázek 2.5 DTSX balíček Imp_Ciselniky.dtsx Každý data-flow na obrázku 2.5 obsahuje jednotlivé listy ze souboru Ciselniky.xls. Importují se tedy listy PartnerGroup, Subgroup1, PartnerName atd. 9

17 Obrázek Vymazání tabulek Na obrázku 2.8 je vidět jak vypadá číselník v Excelu, který se následně transformuje do databáze. Ve sloupci D se dá záznam ukončit. Obrázek Číselník v Excelu 2.3 Vrstva L1 - Relational area Struktury jsou zde zobecněné, popisují business procesy a vazby. Záznamy se historizují, fyzicky se tedy vůbec nemažou, jen se aktualizují. Historizace probíhá pomocí primárního klíče složeného z hodnot ID a ValidFrom. Když se záznam aktualizuje, změní se ve sloupci ValidTo datum na aktuální a k nové hodnotě se nastaví taktéž aktuální datum ve sloupci ValidFrom. Tím začne být nový záznam aktuální. Nové ValidTo se nastaví automaticky v databázi na datum ' '. 10

18 Vrstva L1 je nejdůležitější vrstva celého řešení je to integrační vrstva, která je: Detailní Historická Vyčištěná Konsolidovaná Tabulky Obrázek 2.8 Tabulky L1 11

19 2.3.1 Import číselníků do vrstvy L1 Obecný postup - Load číselníků (Load_Ciselniky.dtsx) Obrázek Load číselníků z vrstvy L0 do vrstvy L1 Každý data-flow na obrázku 2.9 obsahuje jednotlivou tabulku z vrstvy L0. Nejdříve se provede PartnerGroup a až po jeho dokončení se provede Subgroup1, následovaným Subgroup2. PartnerName může proběhnout nezávisle na ostatních. Všechny tyto data-flow jsou velmi podobné, proto bude rozebrán jako příklad data-flow PartnerGroup. V prvním kroku (Obrázek 2.10) se načtou všechny sloupce dané tabulky (v tomto případě PartnerGroup) z vrstvy L0. Každý záznam poté přechází dle funkce 'Conditional Split' do jedné ze tří větví. Do levé větve jdou záznamy, které jsou nové. Jejich ID má hodnotu null. Těmto záznamům se přiřadí díky funkci 'Derived Column' automaticky vygenerované ID. Do prostřední větve jdou záznamy s ID, které je již v databázi uloženo. Pokud má záznam identický ID i jméno (například jméno zákazníka) jedná se o záznam, který se již v databázi nachází, a proto se s ním dále nepracuje. Pokud je ID stejné, ale jméno je jiné, jde o aktualizovaný záznam. Tento záznam postupuje dále do databáze. Pomocí funkce 'Derived Column2' a 'OLE DB Command' se ukončí záznam tak, že se hodnotu ValidTo nastaví na předešlý den. Novému záznamu se nastaví automaticky v databázi hodnota ' '. Poté se nové a aktualizované záznamy uloží do databáze. Do pravé větve jdou záznamy, které mají ukončenou platnost, tedy v Excelu se jim nastavila hodnota 'Ukoncit'. Pomocí funkce 'Derived Column1' a 'OLE DB Command 1' se nastaví ValidTo na aktuální datum a tím se záznam ukončí. 12

20 Obrázek Load číselníku PartnerGroup do vrstvy L1 13

21 2.3.2 Import ostatních dat do L1(LoadL1.dtsx) Ostatní data jsou Master data z Excelu a data Exactu. Každý data-flow na obrázku 2.11 obsahuje jednotlivou tabulku z vrstvy L0. Nejdříve se provedou současně data-flow Customer a CostUnit, dále Article, PriceList, Prices, současně Account a CostCenter, CCAccRealtion, Person a na závěr Warehouse. Obrázek Transformace z vrstvy L0 do vrstvy L1 Všechny tyto data-flow jsou velmi podobné, proto bude rozebrán jako příklad data-flow Customer. V prvním kroku (Obrázek 2.12) se načtou všechny sloupce dané tabulky (v tomto případě Customer) z vrstvy L0. Každý záznam poté jde dle funkce 'Conditional Split' do jedné ze tří větví. Do levé větve postupují záznamy, které jsou nové. Jejich ID má hodnotu null. Těmto záznamům se přiřadí díky funkci 'Derived Column' automaticky vygenerované ID. 14

22 Do prostřední větve jdou záznamy s ID, které je již v databázi uloženo. Pokud má záznam identický ID i jméno (například jméno zákazníka), jde o záznam, který se již v databázi nachází, a proto se s ním dále nepracuje. Pokud je ID stejné, ale jméno je jiné, jde o aktualizovaný záznam. Tento záznam postupuje dále do databáze. Následně se kontrolují cizí klíče k nadřazeným tabulkám PartnerName, Subgroup2 a Country. Jestliže se žádné příslušné záznamy nevyhledají, spadnou do Error databáze (viz kapitola 2.4). Potom se připojí další databáze CICMPY (EXACT) a záznamy se sloučí. Následně se zkontroluje, zda není CustomerCode roven hodnotě NULL. Pomocí funkce 'Derived Column' a 'OLE DB Command' se ukončí záznam tak, že se hodnotu ValidTo nastaví na předešlý den. Novému záznamu se nastaví automaticky v databázi hodnota ' '. Potom se nové a aktualizované záznamy uloží do databáze. Do pravé větve jdou záznamy, které mají ukončenou platnost, tedy v Excelu se jim nastavila hodnota 'Ukoncit'. Pomocí funkce 'Derived Column1' a 'OLE DB Command 1' se nastaví ValidTo na aktuální datum a tím se záznam ukončí. 15

23 Obrázek Data Flow Customer 16

24 Schéma vrstvy L1 Obrázek Schema vrstvy L1 17

25 2.4 Error databáze Error databáze slouží pro záznamy, které nejsou kompletní, nebo jsou duplicitní. Zde nejsou definované žádné vztahy. Každá tabulka v této databázi obsahuje sloupec Chyba, takže se vždy pozná, proč daný záznam skončil právě zde. Předpokládá se, že uživatel podle chybové hlášky záznam upraví a díky tomu se dostane do datového skladu. Příklad chybových hlášek: "Nedošlo k vyhledání cizího klíče v tabulce 205.CICMPY" "Nedošlo k vyhledání cizího klíče v tabulce PartnerSubgroup2" "Sloupec reknr (Account) neobsahuje číselnou hodnotu" 18

26 3 Reporty Reporty se provádějí pomocí MS Visual Studia Reporting Services. Reporting Services dokážou získávat data z rozličných databází (př. SQL Server, Oracle, DB2) a přetransformovat je do různých formátů (HTML, PDF, Excel). Reportovací služby jsou často využívanou oblastí Business Intelligence. Slouží k vytváření jak papírových, tak interaktivních webových prezentací provedených analýz. Díky Report Modelu a Report Builderu jsou schopní i koncoví uživatelé pomocí Drag and Drop vytvořit své reporty. Jeho rozhraní je podobné Wordu či Excelu, takže uživatel by neměl mít problém s ním pracovat. Reportovací služby podporují úplný životní cyklus reportů. Ten začíná vytvořením reportu, což je práce pro vývojáře. Report je nutné spravovat. SQL Server Reporting Services podporují jak vyžádané (pull), tak i nabízené (push) doručování sestav. Uživatelům se musí report zpřístupnit nebo naopak doručit. Doručovány mohou být em a zpřístupnit je lze například uložením do sdíleného adresáře. Reporty skrývají cenné informace, proto zde hraje důležitou roli bezpečnost. Každá role má různé oprávnění. Každý uživatel by měl dostat práva jen na ty informace, které opravdu potřebuje a vše ostatní by se mělo zakázat. Report je uložen ve formátu RDL (Report Definition Language), který je založen na formátu XML (Extensible Markup Language). Díky tomu mohou s reportem pracovat i aplikace třetích stran. Následující reporty jsou manažerské. Data jsou v nich zpracována do přehledných tabulek a grafů. Vedení společnosti z nich může získat informace o prodejích rozčleněných na data jednotlivých zákazníků, dle časových období nebo místa prodeje. 19

27 3.1 Koláčový graf Výběr dat pro manažerský report SQL příkaz pro výběr dat SELECT Article.Article_Name, SUM([Transaction].Amount) AS SumAmount FROM [Transaction] INNER JOIN dimension_time ON [Transaction].TimeKey = dimension_time.day_key INNER JOIN Article ON [Transaction].Article_ID = Article.Article_ID AND [Transaction].Article_ValidFrom = Article.ValidFrom WHERE (dimension_time.year_name = 2009) AND ([Transaction].Amount <> 0) AND (Article.Article_ID <> 0) GROUP BY Article.Article_Name Graf číslo 3.1 ukazuje prodej výrobků za rok Pro data je použita suma částek (Sum(Fields!SumAmount.Value)). Pro třídění do kategorií je použito jméno výrobku (Group_Name). Legenda je řazena od nejprodávanějšího výrobku. 20

28 Koláčový graf Obrázek 3.1 Graf prodeje výrobků za rok

29 3.2 Liniový graf Výběr dat pro manažerský report SQL příkaz pro výběr dat SELECT FROM dimension_time.month_name, SUM([Transaction].Amount) AS SumAmount [Transaction] INNER JOIN dimension_time ON [Transaction].TimeKey = dimension_time.day_key WHERE (dimension_time.year_name = 2009) GROUP BY dimension_time.month_name Graf číslo 3.2 ukazuje prodej za jednotlivé měsíce v roce Pro data je použita suma částek (Sum(Fields!SumAmount.Value)). Pro třídění do kategorií jsou použity měsíce z časové dimenze (Month_Name). Obrázek Částka za jednotlivé měsíce 22

30 4 OLAP kostka OLAP (On Line Analytical Processing) kostka má rychle poskytnout odpovědi na analytické dotazy. Je nejmodernější podmnožinou systémů na podporu řízení (EIS). Relační databáze se hodí na transakční zpracování dat, ale ne už tolik na zpracování analytických dotazů nad daty. Databáze, které jsou určeny pro používání OLAPu, používají multidimenzionální datový model, který umožňuje velmi rychlé zpracování různých dotazů. Umožňuje to právě díky dimenzím. Pro vytvoření vrstvy L2 bylo využito MS Visual Studia - Analysis Services. Použito bylo schéma snowflake (Obrázek 4.1). Data ve vrstvě L2 nejsou uložena přímo v databázi, ale pouze cachována v Analysis Services serveru. Data jsou na tento server nahrána podle zvolené metody (viz kapitola 4.1). 23

31 Obrázek Snowflake schema 4.1 Metody uložení dat Kostka se dělí na tři důležité části metadata, detail a agregovaná data. Je jedno, jaká metoda bude využita; metadata jsou vždy uložena na OLAP serveru. Detailní data nebo agregovaná data jsou uložená podle zvolené metody. MOLAP (Multidimensional OLAP) Toto je nejčastější metoda uložení dat. Při zpracování kostky jsou zdrojová data nahrána z relační databáze, vyžadované agregace jsou vykonány a nakonec jsou data uložena v cachi na Analysis Services serveru v komprimovaném, optimalizovaném a multidimenzionálním formátu. Poté už neexistuje žádné spojení s relační databází. Jestliže následně dojde k nějaké 24

32 změně v relační databázi, v kostce už se to nemůže promítnout, dokud není kostka znovu zpracována. Díky tomu, že jsou data uložena přímo lokálně na OLAP serveru, je MOLAP metoda velmi efektivní a na pokládané dotazy. ROLAP (Relational OLAP) V porovnání s MOLAP, ROLAP nenahrává data z relační databáze na OLAP server, ale detailní data a agregovaná data zůstávají v relační databázi. Pro uložené agregace databázový server vytvoří dodatečné indexované pohledy. Data jsou nahrána z relační databáze, pouze pokud jsou potřeba. HOLAP (Hybrid OLAP) Tato metoda je hybrid mezi MOLAP a ROLAP. Pokouší se přinést lepší kapacitu dat ROLAPu a rychlost zpracování dotazů MOLAPu. V HOLAP metodě zůstávají detailní data v relační databázi a agregovaná data jsou uložena na OLAP serveru. Jestliže je dotaz položen pouze na agregovaná data bude HOLAP metoda podobná metodě ROLAP. Pro detailní data sahá HOLAP do relační databáze, pokud není dotaz uložen v cachi. UDM (Unified Dimensional Model) Díky novince v SQL Server 2005 již není zapotřebí vytvářet další databázovou vrstvu. Tato novinka se jmenuje Unified Dimensional Model (Obrázek 4.2). Dříve bylo běžné vytvořit datový sklad, který obsahoval jak relační databázi pro ukládání dat, tak i multidimenzionální databázi pro analytická data. 25

33 Obrázek UDM je most mezi uživateli a jejich daty [17] UDM nabízí podstatně pozměněnou strukturu a architekturu, tak aby jeden model posloužil jakékoliv aplikaci. Data mají nyní větší informační hodnotu než v relačním modelu a co víc, jsou lépe pochopitelná pro uživatele. Data mohou být uložena na různých operačních systémech a dokonce i na různých databázových serverech. V datovém skladu jsou data nejdříve uložena v relační databázi a poté teprve transformována do multidimenzionální. K propojení těchto dvou databází se dá využít jedna ze tří metod (viz kapitola 4.1). Metody uložení můžeme podle potřeby měnit (Obrázek 4.3). 26

34 Obrázek Výběr metody uložení dat Po zvolení metody je potřeba zadat počet řádku ve faktové tabulce nebo si je můžeme nechat spočítat automaticky. Poté je potřeba stanovit optimum mezi prostorem, který naše kostka zabere na pevném disku, a rychlostí výpočtu a přístupu k datům. Na obrázku 4.4 je vidět, že bylo spočítáno 21 agregací a optimalizovaná úroveň je 43%. 27

35 Obrázek 4.4 Možnosti agregací 4.2 Faktová tabulka Ve faktové tabulce jsou uložena analyzovaná data, v tomto případě data transakcí. V datovém skladu zabírá faktová tabulka nejvíce místa. Jediná faktová tabulka Transaction obsahuje měrné jednotky, viz tabulka 4.1. Faktová tabulka je propojena s dimenzemi pomocí cizích klíčů. Název měrné jednotky Amount FC Amount Discount Quantity Popis Částka ve standardní měně Částka v originální měně Procentní sazba slevy Množství, počet 28

36 Vat Amount Částka DPH ve standardní měně Tabulka 4.1 Faktová tabulka 4.3 Dimenze Data v dimenzích se nemění tak často jako ve faktových tabulkách. Obsahují seznamy hodnot sloužících ke kategorizaci a třídění dat ve faktových tabulkách. Díky hierarchiím v dimenzi je možno nastavit jak nižší agregační úroveň (Drill-down), tak naopak vyšší (Roll-up). Na dimenze můžeme také aplikovat filtr na instance příslušné agregační úrovně (Slicing) nebo také pro více dimenzí najednou (Dicing) Dimenze Article Dimenze Article slouží k zobrazení, jaký výrobek byl prodán. Atribut Cost Price Standart Description Group Name Item Code Item Group Item Type Net Weight Packing Sales Package Price Type Popis Prodejní cena výrobku Popis Jméno skupiny Kód výrobku Číslo skupiny Typ výrobku Váha samotného výrobku Váha zabaleného výrobku Prodejní cena balení Typ výrobku Tabulka 4.2 Dimenze Article Hierarchie Group Name Description 29

37 4.3.2 Dimenze Customer Dimenze Customer slouží k zobrazení zákazníka, který si koupil daný výrobek. Atribut Address City PSC Rating Classification Cust Name Cust Status Cust Type Customer Number Popis Adresa Město PSČ Hodnocení Klasifikace Jméno zákazníka Status zákazníka Typ zákazníka Číslo zákazníka Tabulka 4.3 Dimenze Customer Hierarchie Partner Group Partner Subgroup1 Partner Subgroup2 Cust Name Dimenze Time Časová dimenze slouží k zobrazení, v jakém časovém období byl výrobek prodán. Pomocí webové stránky [23] se vygeneruje časová dimenze. Poté je nutno updatovat faktovou tabulku pomocí následujícího SQL příkazu. 30

38 USE DWH_L1 GO UPDATE [Transaction] SET [Transaction].TimeKey = D.Day_Key FROM dimension_time D INNER JOIN [Transaction] ON DATEPART(YY,[Transaction].Date) = D.Year_Name AND DATEPART(MM,[Transaction].Date) = D.Month_Name AND DATEPART(DD,[Transaction].Date) = D.Day_NumberInMonth TimeKey je sloupec ve faktové tabulce, který bude použit jako cizí klíč k časové dimenzi. Atribut Day_IsWorkday Day_Name Day_NumberInMonth Day_NumberInWeek Day_NumberInYear Month_Name Month_NumberInYear Quarter_Name Quarter_NumberInYear Week_Name Week_NumberInYear Year_Name Popis Den je pracovní Datum Číslo dne v měsíci Číslo dne v týdnu Číslo dne v roce Jméno měsíce Číslo měsíce v roce Jméno čtvrtletí Číslo čtvrtletí v roce Číslo týdne Číslo týdne v roce Číslo roku Tabulka 4.4 Dimenze Time Hierarchie Year_Name Quarter_Name Month_Name Day_Name 31

39 4.3.4 Dimenze Person Dimenze Person slouží k zobrazení, jaký zaměstnanec prodal daný výrobek. Atribut First Name Last Name Full Name Popis Křestní jméno Příjmení Celé jméno Tabulka 4.5 Dimenze Person Dimenze Warehouse Dimenze Warehouse slouží k zobrazení, z jakého skladu pochází prodaný výrobek. Atribut Address City State Warehouse Name ZIPCode Popis Adresa Město Stát Jméno skladu PSČ Tabulka 4.6 Dimenze Warehouse 32

40 4.4 Příklad OLAP kostky V této kostce byla použita, v řádkovém poli, dimenze Time, u které se dá drilovat až na jednotlivé dny. V sloupcovém poli je dimenze Article, kde se nacházejí jednotlivé výrobky. Obrázek 4.5 Příklad OLAP kostky 33

41 5 Závěr V této bakalářské práci byl představen projekt Business Intelligence, který byl úspěšně ukončen. Cíle, které byly stanoveny, se podařilo řádně dokončit, tedy předně vytvořit datový sklad a pomocí datových pump do něj nahrát data ze zdrojových systémů. Další krok, který se podařil uskutečnit, bylo vytvoření ukázkového manažerského reportu. V závěru byla vytvořena multidimenzionální databáze, která využívá snowflake schéma pro účely OLAP kostky. Vytvoření OLAP kostky je velmi složitý úkol, ale k nastínění problematiky by ukázaná kostka jako příklad měla stačit. Až čas ukáže chyby v datovém skladu, které bude nutné opravit. 34

42 6 Zdroje [1] LACKO, Luboslav. Business Intelligence v SQL Serveru Computer press, s. ISBN [2] HUMPHRIES,, Mark, HAWKINS, Michael W., DY, Michelle C.. Data warehousing : Návrh a implementace. Computer press, s. ISBN [3] POUR, Jan, GÁLA, Libor, ŠEDIVÁ, Zuzana. Podniková informatika. GRADA, s. ISBN [4] LACKO, Luboslav. Databáze: datové sklady, OLAP a dolování dat. Computer Press, s. ISBN [5] SACK, Joseph. Mistrovství v Transact-SQL. Zoner Press, s. ISBN [6] KNIGHT, Brian, VEERMAN, Erik. Expert SQL Server 2005 Integration Services. Wrox Press, s. ISBN Expert SQL Server 2005 Integrační služby [7] HANCOCK, John, TOREN, Roger. Practical Business Intelligence with SQL Server Addison-Wesley Professional, s. ISBN Business Intelligence prakticky v SQL serveru 2005 [8] VIEIRA, Robert. Beginning SQL Server 2005 Programming. Wrox Press, s. ISBN Začínáme programovat v SQL serveru 2005 [9] DEWSON, Robin. Beginning SQL Server 2005 for Developers : From Novice to Professional. Wiley, s. ISBN Začínáme s SQL serverem 2005, pro vývojáře: od začátečníka po profesionály [10] WIGHTMAN, Jim. Pro SQL Server 2005 Integration Services. Apress, s. ISBN Pro SQL Server 2005 Integrační služby [11] TAYLOR, Allen G.. SQL For Dummies : 5th Edition. For Dummies, s. ISBN

43 [12] ENGLISH, Larry P. Improving Data Warehouse and Business Information Quality : Methods for Reducing Costs and Increasing Profits. John Wiley & Sons, s. ISBN Vylepšujeme datový sklady a kvalitu byznys informací [13] DBForums [online] Dostupný z WWW: < [14] The BI Verdict [online] Dostupný z WWW: < [15] Microsoft [online] Dostupný z WWW: < [16] Builder [online] Dostupný z WWW: < [17] Gartner CIO Survey Dostupný z WWW: < [18] POUR, Jan. 19. Co lze očekávat od business inteligence?. [online] [cit ]. [19] Materiály z přednášek [20] Regnecentralen [online] Dostupný z WWW: <

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9 Obsah Úvod 9 Kapitola 1 Business Intelligence, datové sklady 11 Přechod od transakčních databází k analytickým..................... 13 Kvalita údajů pro analýzy................................................

Více

10. Datové sklady (Data Warehouses) Datový sklad

10. Datové sklady (Data Warehouses) Datový sklad 10. Datové sklady (Data Warehouses) Datový sklad komplexní data uložená ve struktuře, která umožňuje efektivní analýzu a dotazování data čerpána z primárních informačních systémů a dalších zdrojů OLAP

Více

AdventureWorksDW2014 SQL Server Data Tools Multidimenziona lnı model Tabula rnı model Multidimenziona lnı mo d Tabula rnı mo d MS SQL Server 2016 Tabula rnı mo d Azure Analysis Services 16 3.2 Dimenzionální

Více

Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph)

Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph) Marketingová komunikace Kombinované studium Skupina N9KMK3PH (vm3aph) 2. a 3. soustředění Mgr. Pavel Vávra 9103@mail.vsfs.cz http://vavra.webzdarma.cz/home/index.htm Co nás čeká: 2. soustředění 16.1.2009

Více

Marketingová komunikace. 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3bph)

Marketingová komunikace. 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3bph) Marketingová komunikace Kombinované studium Skupina N9KMK3PH (vm3bph) 3. soustředění Mgr. Pavel Vávra 9103@mail.vsfs.cz http://vavra.webzdarma.cz/home/index.htm Zdroje Studijní materiály Heleny Palovské

Více

kapitola 2 Datové sklady, OLAP

kapitola 2 Datové sklady, OLAP Tomáš Burger, burger@fit.vutbr.cz kapitola 2 Datové sklady, OLAP Získávání znalostí z databází IT-DR-3 / ZZD Co je to datový sklad A data warehouse is a subjectoriented, integrated, time-variant and nonvolatile

Více

Business Intelligence. Adam Trčka

Business Intelligence. Adam Trčka Business Intelligence Adam Trčka 09:00 11:30: BI v kostce Navrhněme si sklad Ukázka BI Datamining 12:30 14:30: Pokračování kurzu 14:30 15:00: Q&A Agenda Co se dnes dovíme? Data informace znalost Business

Více

Základní informace o co se jedná a k čemu to slouží

Základní informace o co se jedná a k čemu to slouží Základní informace o co se jedná a k čemu to slouží založené na relačních databází transakční systémy, které jsou určeny pro pořizování a ukládání dat v reálném čase (ERP, účetní, ekonomické a další podnikové

Více

Základy business intelligence. Jaroslav Šmarda

Základy business intelligence. Jaroslav Šmarda Základy business intelligence Jaroslav Šmarda Základy business intelligence Business intelligence Datový sklad On-line Analytical Processing (OLAP) Kontingenční tabulky v MS Excelu jako příklad OLAP Dolování

Více

3 zdroje dat. Relační databáze EIS OLAP

3 zdroje dat. Relační databáze EIS OLAP Zdroje dat 3 zdroje dat Relační databáze EIS OLAP Relační databáze plochá dvourozměrná tabulková data OLTP (Online Transaction Processing) operace selekce projekce spojení průnik, sjednocení, rozdíl dotazování

Více

Analýza a modelování dat. Přednáška 8

Analýza a modelování dat. Přednáška 8 Analýza a modelování dat Přednáška 8 OLAP, datová kostka, dotazování nad kostkou Motivace většina DB relační zaznamenání vztahů pomocí logicky provázaných tabulek jakou mají velmi často vztahy povahu vztah

Více

Business Intelligence

Business Intelligence Business Intelligence Josef Mlnařík ISSS Hradec Králové 7.4.2008 Obsah Co je Oracle Business Intelligence? Definice, Od dat k informacím, Nástroj pro operativní řízení, Integrace informací, Jednotná platforma

Více

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Kapitola 4. Úvod 11. Stručný úvod do relačních databází 13. Platforma 10g 23

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Kapitola 4. Úvod 11. Stručný úvod do relačních databází 13. Platforma 10g 23 Stručný obsah 1. Stručný úvod do relačních databází 13 2. Platforma 10g 23 3. Instalace, první přihlášení, start a zastavení databázového serveru 33 4. Nástroje pro administraci a práci s daty 69 5. Úvod

Více

Analýza a modelování dat. Přednáška 9

Analýza a modelování dat. Přednáška 9 Analýza a modelování dat Přednáška 9 Další dotazování nad kostkou Rozšíření SQL99 rozšíření SQL99 (minulá přednáška): seskupovací operátory za GROUP BY CUBE statistiky dle řezů ROLLUP statistiky dle rolování

Více

Nová dimenze rozhodovacího procesu

Nová dimenze rozhodovacího procesu Nová dimenze rozhodovacího procesu Marek Matoušek Pavel Mašek Data, nebo INFORMACE Využití dostupných firemních dat Několik systémů, mnoho různých dat Různé divize, různé potřeby Potřeba integrace dat

Více

Infor Performance management. Jakub Urbášek

Infor Performance management. Jakub Urbášek Infor Performance management Jakub Urbášek Agenda prezentace Stručně o produktu Infor PM 10 Komponenty Infor PM - PM OLAP a PM Office Plus Reporting Analýza Plánování / operativní plánování Infor Performance

Více

Základy databází. O autorech 17 PRVNÍ ČÁST. KAPITOLA 1 Začínáme 19

Základy databází. O autorech 17 PRVNÍ ČÁST. KAPITOLA 1 Začínáme 19 3 Obsah Novinky v tomto vydání 10 Význam základních principů 11 Výuka principů nezávisle na databázových produktech 12 Klíčové pojmy, kontrolní otázky, cvičení, případové studie a projekty 12 Software,

Více

Informační systémy 2006/2007

Informační systémy 2006/2007 13 Vysoká škola báňská Technická univerzita Ostrava Fakulta strojní, Katedra automatizační techniky a řízení Informační systémy 2006/2007 Ivan Kedroň 1 Obsah Analytické nástroje SQL serveru. OLAP analýza

Více

Databázové systémy. Doc.Ing.Miloš Koch,CSc. koch@fbm.vutbr.cz

Databázové systémy. Doc.Ing.Miloš Koch,CSc. koch@fbm.vutbr.cz Databázové systémy Doc.Ing.Miloš Koch,CSc. koch@fbm.vutbr.cz Vývoj databázových systémů Ukládání dat Aktualizace dat Vyhledávání dat Třídění dat Výpočty a agregace 60.-70. léta Program Komunikace Výpočty

Více

Business Intelligence

Business Intelligence Business Intelligence Skorkovský KAMI, ESF MU Principy BI zpracování velkých objemů dat tak, aby výsledek této akce manažerům pomohl k rozhodování při řízení procesů výsledkem zpracování musí být relevantní

Více

MIS. Manažerský informační systém. pro. Ekonomický informační systém EIS JASU CS. Dodavatel: MÚZO Praha s.r.o. Politických vězňů 15 110 00 Praha 1

MIS. Manažerský informační systém. pro. Ekonomický informační systém EIS JASU CS. Dodavatel: MÚZO Praha s.r.o. Politických vězňů 15 110 00 Praha 1 MIS Manažerský informační systém pro Ekonomický informační systém EIS JASU CS Dodavatel: MÚZO Praha s.r.o. Politických vězňů 15 110 00 Praha 1 Poslední aktualizace dne 5.8.2014 MÚZO Praha s.r.o. je certifikováno

Více

Podnikové informační systémy Jan Smolík

Podnikové informační systémy Jan Smolík Podnikové informační systémy Jan Smolík Zobecněné schéma aplikační architektury Vlastníci, management Aplikační architektura podnikové informatiky Business Intelligence, manažerské aplikace Obchodní partneři

Více

Marketingová komunikace. 2. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK1aPH/N9KMK1bPH (um1a1ph/um1b1ph)

Marketingová komunikace. 2. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK1aPH/N9KMK1bPH (um1a1ph/um1b1ph) Marketingová komunikace Kombinované studium Skupina N9KMK1aPH/N9KMK1bPH (um1a1ph/um1b1ph) 2. soustředění Mgr. Pavel Vávra 9103@mail.vsfs.cz http://vavra.webzdarma.cz/home/index.htm Minulé soustředění úvod

Více

QAD Business Intelligence

QAD Business Intelligence QAD Business Intelligence Vladimír Bartoš, Pavel Němec Konzultanti 13.6.2012 Komponenty QAD BI Analytické tabule pro podporu rozhodování Spolupráce uživatelů nad analyzovanými daty Reporty Generátor analytických

Více

Metadata. RNDr. Ondřej Zýka

Metadata. RNDr. Ondřej Zýka Metadata RNDr. Ondřej Zýka 1 Metadata Jedna z kompetencí Data managementu Cíle kompetence: Zajistit jednotné porozumění a užití termínů Provázat informace na různých úrovních (byznys, aplikační, technické)

Více

Od klasického reportingu k SAP BO Design studio na BW power by HANA Pavel Strnad

Od klasického reportingu k SAP BO Design studio na BW power by HANA Pavel Strnad Od klasického reportingu k SAP BO Design studio na BW power by HANA Pavel Strnad CIO PIA5 NSC Prague Obsah Představení firmy Migrace BW to HANA BI architektura ve Wincor Nixdorf Migrační varianty z BW

Více

Databáze Bc. Veronika Tomsová

Databáze Bc. Veronika Tomsová Databáze Bc. Veronika Tomsová Databázové schéma Mapování konceptuálního modelu do (relačního) databázového schématu. 2/21 Fyzické ik schéma databáze Určuje č jakým způsobem ů jsou data v databázi ukládána

Více

Operátory ROLLUP a CUBE

Operátory ROLLUP a CUBE Operátory ROLLUP a CUBE Dotazovací jazyky, 2009 Marek Polák Martin Chytil Osnova přednášky o Analýza dat o Agregační funkce o GROUP BY a jeho problémy o Speciální hodnotový typ ALL o Operátor CUBE o Operátor

Více

Metadata. MI-DSP 2013/14 RNDr. Ondřej Zýka, ondrej.zyka@profinit.eu

Metadata. MI-DSP 2013/14 RNDr. Ondřej Zýka, ondrej.zyka@profinit.eu Metadata MI-DSP 2013/14 RNDr. Ondřej Zýka, ondrej.zyka@profinit.eu Co to jsou metadata Chybějící metadata Doplněná metadata Co o metadatech říkají autority Řízení metadata je nepochybně nejdůležitější

Více

Datové sklady. Ing. Jan Přichystal, Ph.D. 1. listopadu 2011. PEF MZLU v Brně

Datové sklady. Ing. Jan Přichystal, Ph.D. 1. listopadu 2011. PEF MZLU v Brně PEF MZLU v Brně 1. listopadu 2011 Úvod Intenzivní nasazení informačních technologií způsobuje hromadění obrovské spousty nejrůznějších údajů. Příkladem mohou být informace z obchodování s cennými papíry

Více

Novinky SQL Serveru 2005 v oblasti Business Intelligence

Novinky SQL Serveru 2005 v oblasti Business Intelligence Novinky SQL Serveru 2005 v oblasti Business Intelligence Seminární práce na předmět Business Intelligence (4IT435) Vypracoval Borek Bernard, leden 2006 1 Abstrakt Microsoft SQL Server 2005 je po mnoha

Více

Kurz Databáze. Obsah. Dotazy. Zpracování dat. Doc. Ing. Radim Farana, CSc.

Kurz Databáze. Obsah. Dotazy. Zpracování dat. Doc. Ing. Radim Farana, CSc. 1 Kurz Databáze Zpracování dat Doc. Ing. Radim Farana, CSc. Obsah Druhy dotazů, tvorba dotazu, prostředí QBE (Query by Example). Realizace základních relačních operací selekce, projekce a spojení. Agregace

Více

Přehled systému Microsoft SQL Server. Komu je kniha určena Struktura knihy Nejvhodnější výchozí bod pro čtení knihy Konvence a struktura knihy

Přehled systému Microsoft SQL Server. Komu je kniha určena Struktura knihy Nejvhodnější výchozí bod pro čtení knihy Konvence a struktura knihy Komu je kniha určena Struktura knihy Nejvhodnější výchozí bod pro čtení knihy Konvence a struktura knihy Konvence Další prvky Požadavky na systém Ukázkové databáze Ukázky kódu Použití ukázek kódu Další

Více

Ing. Roman Danel, Ph.D. 2010

Ing. Roman Danel, Ph.D. 2010 Datový sklad Ing. Roman Danel, Ph.D. 2010 Co je to datový sklad a kdy se používá? Pojmem datový sklad (anglicky Data Warehouse) označujeme zvláštní typ databáze, určený primárně pro analýzy dat v rámci

Více

Manažerský reporting a finanční plánování Targetty

Manažerský reporting a finanční plánování Targetty Manažerský reporting a finanční plánování Targetty v O2 Milan Štoček Milan.Stocek@CleverDecision.com Agenda Představení Clever Decision a Uniwise Targetty - Enterprise Performance Management Planning Architektura

Více

Pattern Datový sklad. RNDr. Ondřej Zýka

Pattern Datový sklad. RNDr. Ondřej Zýka Pattern Datový sklad RNDr. Ondřej Zýka 1 Datový sklad Speciální logické modely Dimenzionální modelování Speciální datové servery Teradata Sloupcové ukládání dat OLAP databáze Speciální oblast Data Managementu

Více

Obsah Úvod 11 Jak být úspěšný Základy IT

Obsah Úvod 11 Jak být úspěšný Základy IT Obsah Úvod 11 Jak být úspěšný 13 Krok 0: Než začneme 13 Krok 1: Vybrat si dobře placenou oblast 14 Krok 2: Vytvořit si plán osobního rozvoje 15 Krok 3: Naplnit osobní rozvoj 16 Krok 4: Osvojit si důležité

Více

Pilotní projekt implementace Business Intelligence ve studijní agendě VŠE v Praze

Pilotní projekt implementace Business Intelligence ve studijní agendě VŠE v Praze Úvod Pilotní projekt implementace Business Intelligence ve studijní agendě VŠE v Praze Ota Novotný, Lukáš Hrnčíř katedra informačních technologií VŠE v Praze email: novotnyo@vse.cz Business Inteligence

Více

On line analytical processing (OLAP) databáze v praxi

On line analytical processing (OLAP) databáze v praxi On line analytical processing (OLAP) databáze v praxi Lukáš Matějovský Lukas.Matejovsky@CleverDecision.com Jan Zajíc Jan.Zajic@CleverDecision.com Obsah Představení přednášejících Základy OLAP Příklady

Více

Jak velká jsou? Obchodní analytici FB velké datové sady BI = business intelligence. OLAP = Online Analytical Processing. DWH = Data Warehouse

Jak velká jsou? Obchodní analytici FB velké datové sady BI = business intelligence. OLAP = Online Analytical Processing. DWH = Data Warehouse název B = Bajt KB = Kilobajt MB = Megabajt GB = Gigabajt TB = Terabajt PB = Petabajt EB = Exabajt ZB = Zettabajt YB = Yottabajt velikost 8 b 2^10 B 2^20 B 2^30 B 2^40 B 2^50 B 2^60 B 2^70 B 2^80 B Jak

Více

Databázové patterny. MI-DSP 2013/14 RNDr. Ondřej Zýka, ondrej.zyka@profinit.eu

Databázové patterny. MI-DSP 2013/14 RNDr. Ondřej Zýka, ondrej.zyka@profinit.eu Databázové patterny MI-DSP 2013/14 RNDr. Ondřej Zýka, ondrej.zyka@profinit.eu Obsah o Co je databázový pattern o Pattern: Přiřazení rolí o Pattern: Klasifikace Databázové patterny o Odzkoušené a doporučené

Více

Datový sklad. Datový sklad

Datový sklad. Datový sklad Datový sklad Postavení v rámci IS/ICT Specifika návrhu Modelování Datový sklad POSTAVENÍ NÁVRH Postavení datového skladu (DW) v IS/ICT z hlediska aplikací jako součást Business Intelligence z hlediska

Více

Dotazovací jazyky I. Datová krychle. Soběslav Benda

Dotazovací jazyky I. Datová krychle. Soběslav Benda Dotazovací jazyky I Datová krychle Soběslav Benda Obsah Úvod do problematiky Varianty přístupu uživatelů ke zdrojům dat OLTP vs. OLAP Datová analýza Motivace Vytvoření křížové tabulky Datová krychle Teorie

Více

TM1 vs Planning & Reporting

TM1 vs Planning & Reporting R TM1 vs Planning & Reporting AUDITOVATELNOST? ZABEZPEČENÍ? SDÍLENÍ? KONSOLIDACE? PROPOJITELNOST???? TM1?? COGNOS PLANNING IBM COGNOS 8 PLANNING Cognos Planning Podpora plánovacího cyklu Jednoduchá tvorba

Více

MBI - technologická realizace modelu

MBI - technologická realizace modelu MBI - technologická realizace modelu 22.1.2015 MBI, Management byznys informatiky Snímek 1 Agenda Technická realizace portálu MBI. Cíle a principy technického řešení. 1.Obsah portálu - objekty v hierarchiích,

Více

Databáze SQL SELECT. David Hoksza http://siret.cz/hoksza

Databáze SQL SELECT. David Hoksza http://siret.cz/hoksza Databáze SQL SELECT David Hoksza http://siret.cz/hoksza Osnova Úvod do SQL Základní dotazování v SQL Cvičení základní dotazování v SQL Structured Query Language (SQL) SQL napodobuje jednoduché anglické

Více

Dobývání znalostí z databází. Databáze. datum jmeno prijmeni adresa_ulice adresa_mesto cislo_uctu platba zustatek

Dobývání znalostí z databází. Databáze. datum jmeno prijmeni adresa_ulice adresa_mesto cislo_uctu platba zustatek Databáze datum jmeno prijmeni adresa_ulice adresa_mesto cislo_uctu platba zustatek 980103 Jan Novak Dlouha 5 Praha 1 9945371 100.00 100.00 980105 Jan Novak Dlouha 5 Praha 1 9945371 1500.00 1600.00 980106

Více

Kapitola 1: Úvod. Systém pro správu databáze (Database Management Systém DBMS) Účel databázových systémů

Kapitola 1: Úvod. Systém pro správu databáze (Database Management Systém DBMS) Účel databázových systémů - 1.1 - Kapitola 1: Úvod Účel databázových systémů Pohled na data Modely dat Jazyk pro definici dat (Data Definition Language; DDL) Jazyk pro manipulaci s daty (Data Manipulation Language; DML) Správa

Více

BI v rámci IS/ICT komponenty BI architektura. Charakteristika dat a procesů v IS/ICT. Datové sklady ukládání dat návrh datového skladu

BI v rámci IS/ICT komponenty BI architektura. Charakteristika dat a procesů v IS/ICT. Datové sklady ukládání dat návrh datového skladu BI v rámci IS/ICT komponenty BI architektura Charakteristika dat a procesů v IS/ICT Datové sklady ukládání dat návrh datového skladu BI CRM ERP SCM Aplikace pro podporu základních řídících a administrativních

Více

Analýza nestrukturovaných dat pomocí Oracle Endeca Information Discovery

Analýza nestrukturovaných dat pomocí Oracle Endeca Information Discovery Analýza nestrukturovaných dat pomocí Oracle Endeca Information Discovery Petr Podbraný Oracle Business Intelligence Sales Consultant 1 2012 Oracle Corporation Co znamená Information Discovery? Zjednodušeně

Více

Návrh a tvorba WWW stránek 1/14. PHP a databáze

Návrh a tvorba WWW stránek 1/14. PHP a databáze Návrh a tvorba WWW stránek 1/14 PHP a databáze nejčastěji MySQL součástí balíčků PHP navíc podporuje standard ODBC PHP nemá žádné šablony pro práci s databází princip práce s databází je stále stejný opakované

Více

PODNIKOVÁ INFORMATIKA

PODNIKOVÁ INFORMATIKA GÁLA Libor POUR Jan TOMAN Prokop PODNIKOVÁ INFORMATIKA Obsah O autorech... 11 Na úvod jak chápat tuto knihu... 13 Část I: Principy podnikové informatiky... 17 1. Informatika, aplikovaná informatika, podniková

Více

4IT218 Databáze. 4IT218 Databáze

4IT218 Databáze. 4IT218 Databáze 4IT218 Databáze Osmá přednáška Dušan Chlapek (katedra informačních technologií, VŠE Praha) 4IT218 Databáze Osmá přednáška Normalizace dat - dokončení Transakce v databázovém zpracování Program přednášek

Více

Databáze MS-Access. Obsah. Co je to databáze? Doc. Ing. Radim Farana, CSc. Ing. Jolana Škutová

Databáze MS-Access. Obsah. Co je to databáze? Doc. Ing. Radim Farana, CSc. Ing. Jolana Škutová Databáze MS-Access Doc. Ing. Radim Farana, CSc. Ing. Jolana Škutová Obsah Principy a možnosti databází. Uložení dat v databázi, formáty dat, pole, záznamy, tabulky, vazby mezi záznamy. Objekty databáze

Více

8.2 Používání a tvorba databází

8.2 Používání a tvorba databází 8.2 Používání a tvorba databází Slide 1 8.2.1 Základní pojmy z oblasti relačních databází Slide 2 Databáze ~ Evidence lidí peněz věcí... výběry, výpisy, početní úkony Slide 3 Pojmy tabulka, pole, záznam

Více

DATOVÉ SKLADY A OLAP V PROSTŘEDÍ MS SQL SERVERU

DATOVÉ SKLADY A OLAP V PROSTŘEDÍ MS SQL SERVERU VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA INFORMAČNÍCH TECHNOLOGIÍ ÚSTAV INFORMAČNÍCH SYSTÉMŮ FACULTY OF INFORMATION TECHNOLOGY DEPARTMENT OF INFORMATION SYSTEMS DATOVÉ SKLADY

Více

SQL - trigger, Databázové modelování

SQL - trigger, Databázové modelování 6. přednáška z předmětu Datové struktury a databáze (DSD) Ústav nových technologií a aplikované informatiky Fakulta mechatroniky, informatiky a mezioborových studií Technická univerzita v Liberci jan.lisal@tul.cz

Více

Databáze. datum jmeno prijmeni adresa_ulice adresa_mesto cislo_uctu platba zustatek

Databáze. datum jmeno prijmeni adresa_ulice adresa_mesto cislo_uctu platba zustatek Databáze datum jmeno prijmeni adresa_ulice adresa_mesto cislo_uctu platba zustatek 980103 Jan Novak Dlouha 5 Praha 1 9945371 100.00 100.00 980105 Jan Novak Dlouha 5 Praha 1 9945371 1500.00 1600.00 980106

Více

STÁTNÍ POKLADNA. Integrovaný informační systém Státní pokladny (IISSP)

STÁTNÍ POKLADNA. Integrovaný informační systém Státní pokladny (IISSP) POKLADNA Integrovaný informační systém Státní pokladny (IISSP) Ing. Miroslav Kalousek ministr financí Praha 17.12.2012 Page 1 Integrovaný informační systém Státní pokladny (IISSP) Centrální systém účetních

Více

B0M33BDT Technologie pro velká data. Supercvičení SQL, Python, Linux

B0M33BDT Technologie pro velká data. Supercvičení SQL, Python, Linux B0M33BDT Technologie pro velká data Supercvičení SQL, Python, Linux Sergej Stamenov, Jan Hučín 18. 10. 2017 Osnova cvičení Linux SQL Python 2 SQL pro uživatele aneb co potřebuje znát a umět bigdatový uživatel:

Více

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1 Metodický list č. 1 Cíl: Cílem předmětu je získat přehled o možnostech a principech databázového zpracování, získat v tomto směru znalosti potřebné pro informačního manažera. Databázové systémy, databázové

Více

Bu B sin i e n s e s s I n I te t l e lig i en e c n e c Skorkovský KA K M A I, E S E F MU

Bu B sin i e n s e s s I n I te t l e lig i en e c n e c Skorkovský KA K M A I, E S E F MU Business Intelligence Skorkovský KAMI, ESF MU Principy BI zpracování velkých objemů dat tak, aby výsledek této akce manažerům pomohl k rozhodování při řízení procesů výsledkem zpracování musí být relevantní

Více

T T. Think Together 2012. Martin Závodný THINK TOGETHER. Business Intelligence systémy Business Intelligence systems

T T. Think Together 2012. Martin Závodný THINK TOGETHER. Business Intelligence systémy Business Intelligence systems Česká zemědělská univerzita v Praze Provozně ekonomická fakulta Doktorská vědecká konference 6. února 2012 T T THINK TOGETHER Think Together 2012 Business Intelligence systémy Business Intelligence systems

Více

Platforma Microsoft zajistila společnosti ISS nový finanční analytický systém

Platforma Microsoft zajistila společnosti ISS nový finanční analytický systém Microsoft Windows Server Platforma Microsoft zajistila společnosti ISS nový finanční analytický systém Přehled Země: Česká Republika Odvětví: Facility services Profil zákazníka: ISS WORLD Czech Republic

Více

O Apache Derby detailněji. Hynek Mlnařík

O Apache Derby detailněji. Hynek Mlnařík O Apache Derby detailněji Hynek Mlnařík Agenda Historie Vlastnosti Architektura Budoucnost Historie 1997 Cloudscape Inc. - JBMS 1999 Informix Software, Inc. odkoupila Cloudscape, Inc. 2001 IBM odkoupila

Více

Information and Data Management. RNDr. Ondřej Zýka

Information and Data Management. RNDr. Ondřej Zýka Information and Data Management RNDr. Ondřej Zýka 1 Informační a datový management Disciplína zaměřená na správu informací (z mnoha zdrojů) a spřístupnění informací různým typům uživatelů podle jejich

Více

Produkty třídy BYZNYS

Produkty třídy BYZNYS Produkty třídy BYZNYS - jistota, spolehlivost a dynamika ve Vašich datech Jiří Rákosník, obchodní ředitel ing. Vlastimil Fousek, vedoucí analytického a vývojového oddělení Produkty třídy BYZNYS informační

Více

Databázové systémy. 10. přednáška

Databázové systémy. 10. přednáška Databázové systémy 10. přednáška Business Intelligence Poprvé byl termín BI použit Gartnerem a dále pak popularizován Howardem Dresnerem jako: proces zkoumání doménově strukturovaných informací za účelem

Více

Management informačních systémů. Název Information systems management Způsob ukončení * přednášek týdně

Management informačních systémů. Název Information systems management Způsob ukončení * přednášek týdně Identifikační karta modulu v. 4 Kód modulu Typ modulu profilující Jazyk výuky čeština v jazyce výuky Management informačních systémů česky Management informačních systémů anglicky Information systems management

Více

Zdroje informací v organizaci IS/ICT BI v rámci IS/ICT historie architektura OLTP x DW ukládání dat

Zdroje informací v organizaci IS/ICT BI v rámci IS/ICT historie architektura OLTP x DW ukládání dat Zdroje informací v organizaci IS/ICT BI v rámci IS/ICT historie architektura OLTP x DW ukládání dat Vladimíra Zádová BI CRM ERP SCM Aplikace pro podporu základních řídících a administrativních operací

Více

Databázové a informační systémy

Databázové a informační systémy Databázové a informační systémy doc. Ing. Miroslav Beneš, Ph.D. katedra informatiky FEI VŠB-TUO A-1007 / 597 324 213 http://www.cs.vsb.cz/benes Miroslav.Benes@vsb.cz Obsah Jak ukládat a efektivně zpracovávat

Více

Databázové systémy. Cvičení 6: SQL

Databázové systémy. Cvičení 6: SQL Databázové systémy Cvičení 6: SQL Co je SQL? SQL = Structured Query Language SQL je standardním (ANSI, ISO) textovým počítačovým jazykem SQL umožňuje jednoduchým způsobem přistupovat k datům v databázi

Více

Možnosti reportingu v produktech řady EPM

Možnosti reportingu v produktech řady EPM Možnosti reportingu v produktech řady EPM Martin Répal Senior konzultant/manager EPM MCITP, MCP, MOS, MCTS, vtsp, Prince II martin.repal@autocont.cz 1 Jak je to s reportingem? Má SW produkt reporty? Tak

Více

Efektivní řízení pomocí Business Intelligence. Ján Zajíc (Clever Decision) Robert Havránek (Microsoft)

Efektivní řízení pomocí Business Intelligence. Ján Zajíc (Clever Decision) Robert Havránek (Microsoft) Efektivní řízení pomocí Business Intelligence Ján Zajíc (Clever Decision) Robert Havránek (Microsoft) Kde najdete nejefektivnějšího manažera? Hierarchie řízení a informační potřeby High level, agregované

Více

<Insert Picture Here> Na co se můžete s Oracle BI těšit

<Insert Picture Here> Na co se můžete s Oracle BI těšit Na co se můžete s Oracle BI těšit Tomáš Pospíšil, Oracle Czech Olomouc, 6.3.2014 Oracle BI Ukázka Oracle BI Možnosti platformy Oracle Business

Více

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček Aplikace IS, outsourcing, systémová integrace Jaroslav Žáček jaroslav.zacek@osu.cz http://www1.osu.cz/~zacek/ Kontext Dodavatelé Strategická Zákazníci Taktická Operativní Kategorie ERP - zaměřeno na řízení

Více

SEMINÁŘ MANAŢERSKÉ SYSTÉMY

SEMINÁŘ MANAŢERSKÉ SYSTÉMY 22.10.2008 SEMINÁŘ MANAŢERSKÉ SYSTÉMY S PŘÍVLASKEM Prezentace zajímavých projektů BUSINESS INTELLIGENCE 16.10.2008 Ing. Jan Klimeš, ORTEX 1 & Hyman K*A*P*L*A*N Mapa semináře (aneb co Vám chci říci ) Obsah

Více

Téma Školitel Počet dní Moderní principy řízení výrobního podniku

Téma Školitel Počet dní Moderní principy řízení výrobního podniku Katalog školení QAD Školení probíhají na adrese: Minerva ČR, Skálova 2490, Tábor začátek 9:00 hod do cca 16 hod Minerva ČR, AT Tower Pražákova 69, Brno začátek 9:00 hod do cca 16 hod cena 4000Kč/osoba,

Více

DATABÁZOVÉ SYSTÉMY. Vladimíra Zádová, KIN, EF TUL - DBS

DATABÁZOVÉ SYSTÉMY. Vladimíra Zádová, KIN, EF TUL - DBS DATABÁZOVÉ SYSTÉMY Současné aplikace IS/ICT Informační systémy a databázové systémy Databázová technologie Informační systémy Aplikační architektura Vlastníci, management Business Intelligence, manažerské

Více

Databázové patterny. RNDr. Ondřej Zýka

Databázové patterny. RNDr. Ondřej Zýka Databázové patterny RNDr. Ondřej Zýka 1 Co to je databázový pettern 2 Databázové patterny Odzkoušené a doporučené způsoby, jak řešit často se vyskytující požadavky Jednoduché N-ární relace Dědičnost Katalog

Více

PŘÍLOHA Č. 4 K ZADÁVACÍ DOKUMENTACI VEŘEJNÉ ZAKÁZKY MALÉHO ROZSAHU. Tvorba software pro reportování stavu projektů (dále jen IS)

PŘÍLOHA Č. 4 K ZADÁVACÍ DOKUMENTACI VEŘEJNÉ ZAKÁZKY MALÉHO ROZSAHU. Tvorba software pro reportování stavu projektů (dále jen IS) PŘÍLOHA Č. 4 K ZADÁVACÍ DOKUMENTACI VEŘEJNÉ ZAKÁZKY MALÉHO ROZSAHU Tvorba software pro reportování stavu projektů (dále jen IS) VERZE: finální DATUM: 6.9. 2013 1 ÚVOD Popis reportů potřebných pro sledování

Více

Databázové systémy. - SQL * definice dat * aktualizace * pohledy. Tomáš Skopal

Databázové systémy. - SQL * definice dat * aktualizace * pohledy. Tomáš Skopal Databázové systémy - SQL * definice dat * aktualizace * pohledy Tomáš Skopal Osnova přednášky definice dat definice (schémat) tabulek a integritních omezení CREATE TABLE změna definice schématu ALTER TABLE

Více

KIS A JEJICH BEZPEČNOST-I

KIS A JEJICH BEZPEČNOST-I KIS A JEJICH BEZPEČNOST-I INFORMAČNÍ SYSTÉMY POUŽÍVANÉ V MANAŽERSKÉ PRAXI pplk. Ing. Petr HRŮZA, Ph.D. Univerzita obrany, Fakulta ekonomiky a managementu Katedra vojenského managementu a taktiky E-mail.:

Více

KAPITOLA 2. Architektura, modelování a implementace Business Intelligence procesů v SQL Serveru 2008. V této kapitole:

KAPITOLA 2. Architektura, modelování a implementace Business Intelligence procesů v SQL Serveru 2008. V této kapitole: KAPITOLA 2 Architektura, modelování a implementace Business Intelligence procesů v SQL Serveru 2008 V této kapitole: Architektura Business Intelligence na platformě SQL Serveru 2008 Modelování procesů

Více

PostgreSQL jako platforma pro datové sklady

PostgreSQL jako platforma pro datové sklady PostgreSQL jako platforma pro datové sklady Vratislav Beneš benes@optisolutions.cz 1. Co to jsou datové sklady? 2. Požadavky na datový sklady 3. Technické řešení datového skladu 4. PostgreSQL a datové

Více

Jazyk SQL databáze SQLite. připravil ing. petr polách

Jazyk SQL databáze SQLite. připravil ing. petr polách Jazyk SQL databáze SQLite připravil ing. petr polách SQL - úvod Structured Query Language (strukturovaný dotazovací jazyk 70. léta min. století) Standardizovaný dotazovací jazyk používaný pro práci s daty

Více

GTL GENERATOR NÁSTROJ PRO GENEROVÁNÍ OBJEKTŮ OBJEKTY PRO INFORMATICA POWERCENTER. váš partner na cestě od dat k informacím

GTL GENERATOR NÁSTROJ PRO GENEROVÁNÍ OBJEKTŮ OBJEKTY PRO INFORMATICA POWERCENTER. váš partner na cestě od dat k informacím GTL GENERATOR NÁSTROJ PRO GENEROVÁNÍ OBJEKTŮ OBJEKTY PRO INFORMATICA POWERCENTER váš partner na cestě od dat k informacím globtech spol. s r.o. karlovo náměstí 17 c, praha 2 tel.: +420 221 986 390 info@globtech.cz

Více

cena jednodenního školení: 4000Kč/osoba, druhá a další z téže firmy 3000Kč cena dvoudenního školení: 7000Kč/osoba, druhá další z téže firmy 6000Kč.

cena jednodenního školení: 4000Kč/osoba, druhá a další z téže firmy 3000Kč cena dvoudenního školení: 7000Kč/osoba, druhá další z téže firmy 6000Kč. Katalog školení QAD Školení probíhají na adrese: Minerva ČR, Skálova 2490, začátek 9:00 hod do cca 16 hod Minerva ČR, AT Tower Pražákova 69, začátek 9:00 hod do cca 16 hod cena jednodenního školení: 4000Kč/osoba,

Více

powerful SAP-Solutions

powerful SAP-Solutions We deliver powerful SAP-Solutions to the World! Praktický průvodce novými SAP technologiemi Září 2015 Martin Chmelař itelligence, a.s. Milníky: 2002: založení společnosti 2008: společnost členem itelligence

Více

NÁSTROJE BUSINESS INTELLIGENCE

NÁSTROJE BUSINESS INTELLIGENCE NÁSTROJE BUSINESS INTELLIGENCE Milena Tvrdíková VŠB Technická univerzita Ostrava, Ekonomická fakulta, Katedra informatiky v ekonomice, Sokolská 33, 701021 Ostrava1, ČR, milena.tvrdikova@vsb.cz Abstrakt

Více

Distanční opora předmětu: Databázové systémy Tématický blok č. 3: OLAP, operátory CUBE a ROLLUP Autor: RNDr. Jan Lánský, Ph.D.

Distanční opora předmětu: Databázové systémy Tématický blok č. 3: OLAP, operátory CUBE a ROLLUP Autor: RNDr. Jan Lánský, Ph.D. Distanční opora předmětu: Databázové systémy Tématický blok č. 3: OLAP, operátory CUBE a ROLLUP Autor: RNDr. Jan Lánský, Ph.D. Obsah kapitoly 1 OLTP a OLAP 1.1 Datový sklad 1.2 Datová kostka 2 OLAP dotazy

Více

Stručný obsah. K2118.indd 3 19.6.2013 9:15:27

Stručný obsah. K2118.indd 3 19.6.2013 9:15:27 Stručný obsah 1. Stručný obsah 3 2. Úvod 11 3. Seznamy a databáze v Excelu 13 4. Excel a externí data 45 5. Vytvoření kontingenční tabulky 65 6. Využití kontingenčních tabulek 81 7. Kontingenční grafy

Více

Katalog školení QAD a SIMATIC IT Preactor. Školení probíhají na adrese: Minerva ČR, Skálova 2490, Tábor začátek 9:00 hod do cca 16 hod

Katalog školení QAD a SIMATIC IT Preactor. Školení probíhají na adrese: Minerva ČR, Skálova 2490, Tábor začátek 9:00 hod do cca 16 hod Katalog školení QAD a SIMATIC IT Preactor Školení probíhají na adrese: Minerva ČR, Skálova 2490, začátek 9:00 hod do cca 16 hod Minerva ČR, AZ Tower Pražákova 69, začátek 9:00 hod do cca 16 hod Cena: 4000Kč/osoba/den,

Více

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček jaroslav.zacek@osu.cz http://www1.osu.cz/~zacek/

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček jaroslav.zacek@osu.cz http://www1.osu.cz/~zacek/ Aplikace IS, outsourcing, systémová integrace Jaroslav Žáček jaroslav.zacek@osu.cz http://www1.osu.cz/~zacek/ Kontext Dodavatelé Strategická Zákazníci ERP Taktická Operativní Kategorie ERP - zaměřeno na

Více

Informační systémy 2008/2009. Radim Farana. Obsah. Dotazy přes více tabulek

Informační systémy 2008/2009. Radim Farana. Obsah. Dotazy přes více tabulek 5 Vysoká škola báňská Technická univerzita Ostrava Fakulta strojní, Katedra automatizační techniky a řízení 2008/2009 Radim Farana 1 Obsah Jazyk SQL, Spojení tabulek, agregační dotazy, jednoduché a složené

Více

Obsah. Úvod do problematiky. Datový sklad. Proces ETL. Analýza OLAP

Obsah. Úvod do problematiky. Datový sklad. Proces ETL. Analýza OLAP Petr Jaša Obsah Úvod do problematiky Data vs. informace Operační vs. analytická databáze Relační vs. multidimenzionální model Datový sklad Důvody pro budování datových skladů Definice, znaky Schéma vazeb

Více

Tvorba aplikace typu klient/server pomocí Windows Communication Foundation

Tvorba aplikace typu klient/server pomocí Windows Communication Foundation Tvorba aplikace typu klient/server pomocí Windows Communication Foundation Petr Kafka Ing. Václav Novák, CSc. Školní rok: 2008-09 Abstrakt Tato bakalářská práce se bude zabývat využitím programovacího

Více

Integrace dat. RNDr. Ondřej Zýka

Integrace dat. RNDr. Ondřej Zýka Integrace dat RNDr. Ondřej Zýka 1 Obsah Kategorizace integračních přístupů Kroky integrace a řešení problematických stavů Master Data Management 2 2 Datová integrace Synchronní Akceptovaný požadavek na

Více

Databáze. Velmi stručný a zjednodušený úvod do problematiky databází pro programátory v Pythonu. Bedřich Košata

Databáze. Velmi stručný a zjednodušený úvod do problematiky databází pro programátory v Pythonu. Bedřich Košata Databáze Velmi stručný a zjednodušený úvod do problematiky databází pro programátory v Pythonu Bedřich Košata K čemu jsou databáze Ukládání dat ve strukturované podobě Možnost ukládat velké množství dat

Více

Znalostní systém nad ontologií ve formátu Topic Maps

Znalostní systém nad ontologií ve formátu Topic Maps Znalostní systém nad ontologií ve formátu Topic Maps Ladislav Buřita, Petr Do ladislav.burita@unob.cz; petr.do@unob.cz Univerzita obrany, Fakulta vojenských technologií Kounicova 65, 662 10 Brno Abstrakt:

Více