Vysoká škola ekonomická v Praze

Rozměr: px
Začít zobrazení ze stránky:

Download "Vysoká škola ekonomická v Praze"

Transkript

1 Vysoká škola ekonomická v Praze Fakulta informatiky a statistiky Katedra informačních technologií Studijní program: Aplikovaná informatika Obor: Informační systémy a technologie Diplomant: Petr Okleštěk Vedoucí diplomové práce: Ing. Ota Novotný, PhD Recenzent: Ing. Jiří Tlapák TÉMA DIPLOMOVÉ PRÁCE SROVNÁNÍ KOMERČNÍCH BI NÁSTROJŮ S NÁSTROJI OPENSOURCE školní rok 2005/2006

2

3

4 Prohlášení Prohlašuji, že jsem diplomovou práci zpracoval samostatně a že jsem uvedl všechny použité prameny a literaturu, ze kterých jsem čerpal. V Praze dne Petr Okleštěk. podpis

5 Poděkování Děkuji Ing. Otu Novotnému za cenné připomínky, odborné vedení a trpělivost při zpracování této práce. Dále bych své poděkování chtěl věnovat kolegům Ing. Filipu Daďovi a Filipu Volejníkovi, kteří mi pomohli seznámit se s OpenSource komunitou a kteří mi udělili několik cenných rad.

6 Anotace (ČJ) Cílem této diplomové práce je porovnat komerční a OpenSource Business Intelligence řešení pro střední podnik. Za účelem srovnání byl vybrán databázový server MS SQL Server s Analysis Services a dva možné způsoby nasazení OpenSource technologií. Prvním z nich je komplexní BI řešení od společnosti Insight Strategy a.s. The Bee. Druhým způsobem je řešení pomocí dílčích aplikací nalezených na stránkách a to pomocí aplikací Keetle, Firebird, Mondrian a Openi. Jednotlivá řešení jsou porovnána na základě předem stanovených a popsaných metrik. Hlavním cílem je ověření na fiktivní firmě zda OpenSource BI řešení fungují a mohou nahradit komerční řešení a zda je to z finanční stránky výhodné. Anotace (AJ) The aim of this diploma thesis is comparison of commercial and OpenSource Business Intelligence solution for middle-sized company. For this purpose of comparison I choose database server MS SQL Server which contains Analysis Services and two possible ways how to use OpenSource applications. The first way is complex BI solution The Bee from company insightstrategy s.r.o. The second way is usage of separate application found on This means using of Keetle, Firebird, Mondrian and Openi applications. All solutions are compared based on given and described metrics. The main aim is to prove that simulated company based on OpenSource BI solution works and that this solutions is cheaper than commercial licences. Klíčová slova (ČJ) Business Intelligence (BI), OpenSource, OLAP, ETL, Metrika, Snowflake, Star, SQL, Data Mining, Reporting, Data Warehouse, MDX, Dimenzionální analýza Klíčová slova (AJ) Business Intelligence (BI), OpenSource, OLAP, ETL, Metrics, Snowflake, Star, SQL, Data Mining, Reporting, Data Warehouse, Dimensional Analysis

7 Obsah 1 ÚVOD PŘEDMLUVA CÍLE DIPLOMOVÉ PRÁCE Hlavní cíl diplomové práce Dílčí cíle diplomové práce VÝCHODISKA ŘEŠENÍ STRUKTURA DIPLOMOVÉ PRÁCE Vstupy řešení Jádro řešení Výstupy řešení Předpokládaný výsledek práce Stav řešené problematiky v ČR a ve světě POZNÁMKA K TERMINOLOGII ZÁKLADNÍ PRINCIPY BUSINESS INTELLIGENCE CHARAKTERISTIKA ZÁKLADNÍCH PRINCIPŮ HLAVNÍ KOMPONENTY Koncoví uživatelé Zdrojové systémy Komponenty Business Intelligence Nástroje pro koncové uživatele SHRNUTÍ FAKTORY ÚSPĚŠNOSTI A METRIKY SROVNÁNÍ PŘEVEDENÍ FAKTORŮ ÚSPĚŠNOSTI NA OBJEKTIVNÍ METRIKY FAKTORY KVALITY ŘEŠENÍ A SLUŽEB BI Kvalita celkové architektury BI FAKTORY ÚSPĚŠNOSTI DISPONIBILNÍCH ZDROJŮ Objem a doba pro získání financí Alokace dostatečných pracovních kapacit Kvalita technologické platformy BI FAKTORY ÚSPĚŠNOSTI ŘÍZENÍ A ŘEŠENÍ PROJEKTŮ BI FAKTORY ÚSPĚŠNOSTI SPOJENÉ S PROVOZEM APLIKACÍ BI Celková úroveň provozu BI aplikací Výkonnost BI řešení Způsob aktualizace datových skladů, řízení nárůstu dat Náročnost řešení na administraci Podpora uživatelů Úroveň řízení kvality dat

8 3.6 PŘEHLEDOVÁ TABULKA KRITÉRIÍ A METRIK SHRNUTÍ VÝBĚR POROVNÁVANÝCH NÁSTROJŮ A JEJICH ALTERNATIV KOMERČNÍ ŘEŠENÍ MICROSOFT SQL SERVER Popis společnosti Operační systém Windows server Databázový server a BI řešení Komponenty datové transformace Data Transformation Services Databázové komponenty Microsoft SQL Server Analytické komponenty Microsoft Analysis Servises Nástroje pro koncové uživatele Microsoft Excel Shrnutí OPENSOURCE ŘEŠENÍ KOMPLEXNÍ OPENSOURCE ŘEŠENÍ THE BEE PROJECT Popis společnosti Insight Strategy Operační systém Databázový server a BI řešení Komponenty datové transformace Databázové komponenty Analytické komponenty Nástroje pro koncové uživatele Shrnutí BI ŘEŠENÍ PROSTŘEDNICTVÍM DÍLČÍCH OPENSOURCE APLIKACÍ Operační systém - Kubuntu Komponenty datové transformace Databázové komponenty - Firebird Analytické komponenty - Mondrian Nástroje pro koncové uživatele - Internet SHRNUTÍ KONKRÉTNÍ PŘÍKLAD PRO PROVEDENÍ POROVNÁNÍ POPIS VYBRANÉ SPOLEČNOSTI Parametry IT společnosti Matastav Další údaje pro dimenzionální analýzu DIMENZIONÁLNÍ ANALÝZA SHRNUTÍ POROVNÁNÍ JEDNOTLIVÝCH NÁSTROJŮ KOMERČNÍ ŘEŠENÍ MICROSOFT SQL SERVER Instalace operačního systému

9 6.1.2 Instalace aplikací BI řešení Zprovoznění BI řešení Vyhodnocení metrik KOMPLEXNÍ OPENSOURCE ŘEŠENÍ THE BEE Instalace operačního systému Instalace aplikací BI řešení Zprovoznění BI řešení Vyhodnocení metrik ŘEŠENÍ PROSTŘEDNICTVÍM DÍLČÍCH OPENSOURCE APLIKACÍ Instalace operačního systému Instalace aplikací BI řešení Zprovoznění BI řešení Vyhodnocení metrik SHRNUTÍ Komerční řešení - nevýhody a výhody OpenSource řešení nevýhody a výhody SOUHRNNÁ PŘEHLEDOVÁ TABULKA VŠECH ŘEŠENÍ ZÁVĚR SHRNUTÍ VÝSLEDKŮ ZHODNOCENÍ SPLNĚNÍ STANOVENÝCH CÍLŮ PŘÍNOS TÉTO PRÁCE DALŠÍ NÁMĚTY PRO ŘEŠENÍ V UVEDENÉ OBLASTI PŘEHLED LITERATURY A POUŽITÝCH ZDROJŮ TERMINOLOGICKÝ SLOVNÍK PŘÍLOHY PŘÍLOHA Č. 1 VÝŇATEK Z KATALOGU PRODUKTŮ A SLUŽEB AUTOCONT PŘÍLOHA Č. 2 ARCHITEKTURA ŘEŠENÍ MONDRIAN SEZNAM TABULEK Tabulka č. 1: Definice metrik a kritérií Tabulka č. 2: Definice dimenze Kategorie zákazníků Tabulka č. 3: Definice dimenze Čas Tabulka č. 4: Definice dimenze Čas Tabulka č. 5: Definice dimenze - Zdroje Tabulka č. 6: Definice dimenze - Pobočky Tabulka č. 7: Definice dimenze - Regiony Tabulka č. 8: Definice dimenze - Operace Tabulka č. 9: Definice dimenze -Plán Tabulka č. 10: Definice dimenze - Tok

10 Tabulka č. 11: Multidimenzionální analýza definice kostky Tabulka č. 12: Vyhodnocení komerčního řešení Tabulka č. 13: Vyhodnocení OpenSource The Bee Tabulka č. 14: Vyhodnocení OpenSource Kertle, Mondrian, Openi Tabulka č. 15: Srovnání jednotlivých řešení SEZNAM OBRÁZKŮ Obr. č. 1: Struktura diplomové práce, struktura řešení... 7 Obr. č. 2: Koncepce architektury BI Obr. č. 3: Architektura BI řešení Obr. č. 4: Srovnání možností zavedení BI řešení s omezenými finančními zdroji Obr. č. 5: Schéma existujících dat firmy Matastav Obr. č. 6: Schéma datové pumpy - MS DTS Obr. č. 7: Schéma datového skladu vytvořeného pomocí datové pumpy- MS SQL Obr. č. 8: Schéma logického modelu dimezionální kostky - MS Analysis Services Obr. č. 9: Procházení dimezionální kostkou v Analysis Services Obr. č. 10: Procházení kostkou ve formě tabulky na klientské stanici v MS Excelu (výsledek dotazu, který slouží jako metrika srovnání) Obr. č. 11: Procházení kostkou ve formě grafu na klientské stanici v MS Excelu Obr. č. 12: Schéma datového skladu vytvořeného pomocí datové pumpy BeeTL Obr. č. 13: Schéma dimenzionální kostky v grafickém prostředí - BeeTL Obr. č. 14: Schéma definice dimenzionální kostky ve formátu XML - The Bee Obr. č. 15: Ukázka sestavování tabulky v aplikaci The Bee Obr. č. 16: Výsledná tabulka v aplikace The Bee Obr. č. 17: Schéma datového skladu vytvořeného pomocí datové pumpy - Keetle Obr. č. 18: Schéma dimenzionální kostky v grafickém prostředí Mondrian + Eclipse72 Obr. č. 19: Úvodní obrazovka projekt Matastav v prostředí OpenI

11 1 ÚVOD 1.1 Předmluva V dnešní době tvrdé konkurence a rychle se měnících podmínek si firmy, respektive vrcholové vedení firem, začínají uvědomovat nutnost mít všechny podstatné, relevantní informace o stavu jejich společnosti, jejím vývoji v čase a hlavně i předpovědi do budoucna. U řízení velkých firem se toto již delší dobu bere jako samozřejmost, ale v současnosti se začíná prosazovat i ve středních a pomalu i v malých firmách, které mají velký objem, ať už produkce nebo obratu finančních prostředků. k tomuto účelu se již dlouhou dobu vyvíjejí informační systémy a informační a komunikační technologie, jejichž hlavním úkolem je rychlé shromáždění, zpracování a interpretace informací. Obor, který se zabývá informačními systémy umožňující automatizované zpracování dle předem stanovených pravidel se jmenuje Business Intelligence (BI). Je samozřejmé, že firmy používají aplikační software pro zjednodušení evidence svých zakázek, zpřehlednění a hlavně pro lepší orientaci. U středních firem bývá většinou více druhů aplikačního SW, respektive vždy jeden pro určitou specifickou oblast a to ještě s přihlédnutím k ceně pořízení. Bohužel firmy si neuvědomují, že by měly shromažďovat veškerá data na jednom místě. To znamená, že by měly vytvořit Data WareHouse, kde by byla veškerá data uspořádána a propojena. Jakmile bude chtít firma provázané analýzy z dat různých aplikačních softwarů, uvědomí si, že musí navrhnout strukturu a architekturu Data WareHousu. V této chvíli začíná nastupovat již zmíněný obor Business Intelligence. Hlavním úkolem BI je uspořádat data a připravit je tak na další složité analýzy. Data musí mít jednotný systém číselníků a musí splňovat databázové normalizační pravidla. Jako součást BI je i transformace dat (ETL) z aplikačních softwarů, sjednocení, očištění a jejich uložení do datového skladu. Bohužel software, který zahrnuje veškeré potřebné části BI je pro malé a střední podniky příliš drahý. Odborná analýza firmy a navržení datového skladu, kostek a pravidel je příliš složitá, aby to mohl dělat každý správce počítačové sítě

12 1.2 Cíle diplomové práce Výše jsem se snažil upozornit na potřebu kvalitních informacích, které musí řídící pracovník mít pro kvalitní rozhodování. Zdůrazňoval jsem složitost tohoto problému a hlavně složitost řešení. Podstatnou je finanční stránka BI řešení, která brzdí nebo odrazuje řadu firem, které to potřebují. Tato práce se bude zabývat BI řešením s využitím OpenSource technologií, které jsou volně dostupné na Internetu Hlavní cíl diplomové práce Hlavním cílem diplomové práce je ověření možností OpenSource technologií a jejich srovnání se zástupcem komerční sféry. Stěžejní částí je vyhledání dostupných aplikací na Internetu a po krátkém seznámení výběr jedné, jakožto optimální varianty a její nasazení ve středním podniku Dílčí cíle diplomové práce Pro splnění hlavního cíle diplomové práce je nutné splnit následující dílčí cíle: nalézt co největší počet komplexních BI OpenSource řešení; nalézt dílčí součásti BI řešení, které by mohly společně nahradit komplexní komerční řešení; vypracovat datový model a následně zprovoznit OpenSource BI aplikaci; ověřit uplatnění OpenSource v komerční sféře a při běžné práci. 1.3 Východiska řešení Hledání informací a OpenSource aplikací je nejlepší hledat na internetové stránce [SFnet], která je zaměřena na podporu, evidenci a zveřejňování veškerých OpenSource aplikací. Na této stránce je možné nalézt budoucí projekty, projekty živé, tzn. že jsou již v určité funkční verzi a stále se dále vyvíjí, a v neposlední řadě i projekty mrtvé, které byly z různých důvodů ukončeny třeba i bez jakékoli prezentovatelné nebo spustitelné formy

13 Pro účely této práce budu sledovat pouze živé projekty a to, které budou splňovat základní funkční vlastnosti, které má BI aplikace mít. Jak minimální požadavky komplexní aplikace, tak i dílčích aplikací, budou popsány níže v teoretické části diplomové práce. Teoretická část se hlavně opírá o ustálené a již popsané základní řešení a postupy, které je možno nalézt např. v [BI04] nebo které se přednáší a vyučují na Vysoké škole ekonomické v rámci předmětu IT_569 Business Intelligence. 1.4 Struktura diplomové práce Následující schéma zobrazuje strukturu a postup řešení diplomové práce tak, aby nebyly opomenuty žádné zdroje a jejich využití bylo efektivní. Obr. č. 1: Struktura diplomové práce, struktura řešení - 7 -

14 1.4.1 Vstupy řešení Vstupy řešení byly již stručně popsány ve východiscích řešení, zde se jim budu věnovat více: kapitola Základní principy Business Intelligence, jejíž hlavním informačním zdrojem je Business Intelligence [BI04], stručně charakterizuje Business Intelligence jakož vědní disciplínu s určitými metodikami a požadavky na informační systémy, kapitola Faktory úspěšnosti a metriky srovnání je pouze zamyšlením nad možnými alternativami, jak co nejlépe a nejefektivněji navrhnout a zprovoznit BI řešení, jejíž základem je předchozí kapitola kapitola Výběr porovnávaných nástrojů a jejich alternativ je věnována popisu OpenSource a jeho dostupnosti na Internetu [SFnet]. Je zde popsán druh a rozdíly jednotlivých licencí a také doporučení, kde a jak hledat potřebné aplikace. V této části je také srovnání nákladů na pořízení, zakoupení komerční licence s možnými náklady na získání OpenSource aplikací. kapitola Konkrétní příklad pro provedení srovnání je popisem středního podniku, který slouží jako pokusný králík v této diplomové práci, a pro který je zpracovávána BI aplikace za pomocí OpenSource aplikací. Tato kapitola obsahuje další podčásti jako: Popis společnosti a současného stavu, Popis procesu zavedení BI aplikace Jádro řešení Jádrem řešení je sloučení všech předchozích kapitol do stadia: vybrání komplexní BI aplikace nebo jednotlivých částí BI aplikace na základě kritérií popsaných v kapitole Základní principy BI. navržení Datového skladu na základě popisu společnosti a jejího současného stavu na základě metodik a standardů popsaných v kapitole popisující BI. navrhnutí Dimenzionální analýza, podle stejného postupu jako u Datového skladu

15 1.4.3 Výstupy řešení Výstupem řešení a závěrem této práce je srovnání nasazení OpenSource technologií v běžném pracovním životě a to v oblasti, která ovlivňuje rozhodování firmy s komerčními technologiemi Předpokládaný výsledek práce Z přednášky LinuxExpo o OpenSource OLAP [BEE] technologiích je zřejmé, že nasazení OpenSource technologií je možné a dokonce k němu i dochází. Proto se nepředpokládá, že závěrem této práce bude, že takovéto řešení nelze najít nebo realizovat. Výsledkem této práce by mělo být také finanční srovnání zprovoznění OpenSource BI aplikace ve srovnání s cenou komerčního produktu Stav řešené problematiky v ČR a ve světě V České republice se touto oblastí zabývá společnost Insight Strategy, která je také výhradním zástupcem jedné z předních komerčních řešení na světových trzích, a to společnosti MicroStrategy. Zkušenosti z komerční sféry se snaží přenést do OpenSource nástroje The BEE project [BEE]. Řešení, které probíhají ve světě je možné nalézt na již zmiňované internetové stránce bohužel komplexní řešení je tady pouze český The BEE project, ale je možno zde nalézt jednotlivé aplikace BI řešení (ETL Octopus, MOLAP Mondrian) většinou založené na JAVA technologii. 1.5 Poznámka k terminologii V této práci se vyskytují zavedené termíny z oblasti informatiky, BI a podnikového řízení. Zkratky jsou při prvním výskytu vysvětleny a také jsou všechny uvedeny v příloze Terminologický slovník

16 2 ZÁKLADNÍ PRINCIPY BUSINESS INTELLIGENCE V dnešní době řada majitelů malých a středních firem žádá po svých zaměstnancích pravidelné výkazy a reporty o vývoji sledovaných charakteristik podniku, jako například jsou: denní tržba, objem prodaných výrobků určitých kategoriích v daném časovém horizontu, přehled vývoje zisku apod. Málo z nich ale ví, že touto problematikou se zabývá obor zvaný Business Intelligence. Tento obor zahrnuje komplex činností a technologií, které čím dál častěji tvoří běžnou součást řízení nejen velkých podniků. Celé řešení je dáno postupem jak se jednotlivá data zpracovávají, aby mohl konečný uživatel po jejich zpracování získat informace, na jejichž základě, kterých může kvalitně rozhodovat o řízení podniku. Tímto postupem jsou také stanoveny aplikace nebo části programu, které vykonávají jednotlivé činnosti, tak jak za sebou navazují. Následující schéma sestavené dle [BI04] popisuje hlavní komponenty Business Intelligence, které mohou být použity pro získávání dat, které koncoví uživatelé požadují. Je jen na koncových uživatelích, aby před sestavením konkrétního Business Intelligence řešení přesně definovali, jaké informace pro své rozhodování potřebují a odkud se mají brát data pro zpracování těchto informací. Je-li toto předem jasné a pevně stanovené a popsané, je pak na tvůrci architektury Business Intelligence řešení, aby vybral potřebné komponenty a seskládal je jako puzzle do funkční podoby tak, aby koncoví uživatelé dostávali data, která chtěli. 2.1 Charakteristika základních principů V podniku se zpravidla setkáváme se dvěma základními druhy informací, a to s informacemi operativními a analytickými. Operativní informace jsou informace, které se rychle mění a pro jejich vytváření a změny, hlavně v reálném čase, se používají samostatné aplikace jako ERP, CRM apod. Tyto aplikace jsou označovány jako transakční systémy a to

17 i přesnější zkratkou OLTP (OnLine Transaction Processing). Vzhledem k tomu, že se jedná o data, která jsou zaznamenána poprvé a slouží dalším nástrojům a aplikacím, jsou proto označována jako primární nebo zdrojová. Analytické informace jsou informace, které vznikly zpracováním operativních informací různými nástroji tak, že poskytují informace z různých pohledů a agregací. V odborné veřejnosti se používá již řadu let zkratka OLAP (OnLine Analytical Processing), v poslední době je ale nahrazována zkratkou BI (Business Intelligence), která zahrnuje nejen užší význam zkratky OLAP, ale zahrnuje širší definici tohoto oboru (viz výše). Užší význam zkratky OLAP vysvětluje [BI04] jako informační technologii založenou především na koncepci multidimenzionálních databází. Jejím hlavním principem je několikadimenzionální tabulka umožňující rychle a pružně měnit jednotlivé dimenze a měnit tak pohledy uživatele na modelovanou ekonomickou realitu. Tato definice přesně vystihuje účel, respektive princip fungování OLAP kostek. Při práci s multidimenzionální kostkou se používají tři základní operace. Jsou to slice and dice, drill-down, drill-up. Slice and dice znamená rozřezání kostky dle požadovaných dimenzí a prohlížení dat. Drill-down označuje pohyb, neboli zpřístupnění dat nižší úrovně hierarchické struktury. Drill-up je opačný pohyb, to znamená, že naopak zobrazuje sumární data vyšší hierarchické úrovně. Protože veškeré tyto operace s rostoucím objemem dat jsou velice náročné na výpočty a tak by docházelo k prodlužování doby odezvy na dotaz, jsou v OLAP kostkách data již spočítána. Toto je jeden ze zásadních rozdílů oproti OLTP a s tím je také potřeba počítat při sestavování serveru určeného pro datový sklad OLAP kostek. Tento server musí mít dostatečný výkon, kvalitní databázi a velké diskové pole. Multidimenzionalita dat může být implementována dvěma různými způsoby nebo jejich kombinací. Jedná se především o způsob pomocí relační databáze (STAR nebo SNOWFLAKE schéma) nebo pomocí speciální binární databáze. Relační databáze je projektována tak, že v centru je tabulka faktů, která obsahuje data, jež se mění v čase. Kolem této tabulky jsou dimenzionální tabulky, které jsou s tabulkou faktů propojeny pomocí klíčů. Dimenzionální tabulky jsou pouze

18 úložištěm textových informací, které jsou uloženy v tabulce faktů. Struktura relační databáze se definuje při vytváření datového skladu. 2.2 Hlavní komponenty Následující kapitola stručně popisuje jednotlivé části, které mohou být součástí BI řešení. Obr. č. 2: Koncepce architektury BI Nejdříve se blíže seznámíme se vším, co ovlivňuje a vstupuje do BI řešení

19 2.2.1 Koncoví uživatelé Ještě donedávné doby byli koncovými uživateli pouze pracovníci vrcholového managementu velkých firem. Dnešní technologie umožňují zpřístupnit části výsledků všem pracovníkům ve firmě v závislosti na jejich pracovní náplni a oprávnění přístupu k informacím. OpenSource technologie tímto výrazně snižují náklady na jednoho pracovníka, který s touto technologií pracuje. a proto je možné do řízení zapojit i pracovníky nižší úrovně a v některých případech i s nižší kvalifikací, protože správně nastavené řešení Business Intelligence je dokáže upozornit a spočítat věci, které by sami nezvládli Zdrojové systémy Jedná se o veškeré způsoby, jakými všichni pracovníci ukládají data, která mají být zpracovávána pomocí Business Intelligence řešení. Nejedná se pouze o databáze, do kterých se data ukládají prostřednictvím ERP nebo CRM aplikací. Mohou zde být zahrnuta i data, která si někteří pracovníci ukládají v jednotlivých souborech. Jako například seznamy a přehledy v tabulkových procesorech. Zahrnují se sem i data, která společnost získává od svých dodavatelů, zákazníků nebo veřejné správy a to v jakékoli podobě. To jestli se podaří veškerá data správně přenést do BI řešení a udržovat je dle požadavků uživatelů patřičně aktualizovaná je nejtěžším úkolem při zprovozňování Business Intelligence Komponenty Business Intelligence Komponenty datové transformace Tyto komponenty slouží k již zmíněnému přenosu dat z různých formátů zdrojových systémů do datového skladu. Rozeznáváme dvě základní komponenty a to z hlediska jejich propojení se zdrojovými daty. ETL Komponenta Extraction, Transformation and Loading je nejdůležitější částí celého BI řešení. Někdy je tato komponenta zjednodušeně označována jako datová pumpa, což vystihuje typ propojení se zdrojovými systémy. Datová pumpa má za úkol získat a vybrat (Extraction) data ze zdrojových systémů

20 a následně je upravit (Transformation) a uložit je do předem stanovených datových struktur datového skladu (Loading). Tyto nástroje by měly být schopny získat data ze všech zdrojových systémů, které podnik používá, což může být značný problém vzhledem k různorodosti aplikací. Výhodou datové pumpy je, že pracuje v dávkovém režimu tzn., že pokud je správně nastavena a vyzkoušena funkčnost datové pumpy, stačí pak pouze dle požadavků koncových uživatelů nastavit časové intervaly, v kterých má datová pumpa aktualizovat data v datovém skladu. Tato aktualizace může probíhat denně, týdně, měsíčně, čtvrtletně a to v závislosti na datech a jejich častých přírůstcích a aktualizacích. EAI Komponenta EAI (Enterprise Application Integration), respektive nástroje jak integrovat data různých aplikací, je další možností, jak propojit data zdrojových systémů s datovými sklady. Dnešní systémy již předpokládají, že se bude dále pracovat s daty, která se do nich vkládají, a proto většina z nich již obsahuje tyto nástroje. Na rozdíl od ETL (datových pump) úkolem EAI je pracovat s daty v reálném čase a to v obou směrech Databázové komponenty Jedná se o vrstvu, která slouží k ukládání dat, jejich aktualizaci a správu dat pro BI řešení. k tomuto účelu firmy pořizují výkonné databázové servery, kde se veškerá data ukládají. Na těchto serverech vznikají další samostatné databázové komponenty tak, aby všichni uživatelé měli rychlý přístup k datům, která aktuálně potřebují Dočasné úložiště Jak sám název napovídá dočasné úložiště slouží k dočasnému uložení extrahovaných dat ze zdrojových systémů za účelem podpory a zrychlení výběru dat. Data jsou do dočasného úložiště uložena v přesně stejné struktuře, v jaké jsou uložena ve zdrojových systémech, tzn. data nejsou agregována, kontrolována proti číselníkům nebo ostatním datům v datovém skladu. Po zpracování dat a jejich zapsání do datového skladu se dočasné úložiště ruší

21 Operativní úložiště Hlavním účelem operativního úložiště je zpřístupnit uživatelům nebo ostatním systémům data pro analýzy či dotazy s minimálním zpožděním. To znamená, že operativní úložiště bývá většinou až za datovým skladem. Operativní úložiště na rozdíl od dočasného obsahuje data konsolidovaná, konzistentní, subjektově orientovaná. Operativní úložiště je trvalého charakteru. Datový sklad Definici datového skladu nejlépe vystihuje definice Billa Inmona, na kterou se také odkazují v [BI04]: Datový sklad je integrovaný, subjektově orientovaný, stálý a časově rozlišený souhrn dat, uspořádaný pro podporu potřeb managementu. Jednotlivé výrazy definice datového skladu se dají vyložit následovně: Integrovaný data se ukládají centrálně v rámci celého podniku do jednoho datového skladu, nikoli odděleně. Následuje pak vytváření datových tržišť (viz dále). Subjektově orientovaný data se rozdělují podle typu, nikoli podle aplikací, do kterých byla zadána. To umožňuje, aby se veškerá data vyskytovala pouze jednou. Stálý datové sklady jsou určeny pouze pro čtení, to znamená že se nedají přímým zásahem nebo uživatelskými nástroji měnit. Veškerá data se pořizují z operativních úložišť (viz výše) nebo z jiných externích zdrojů a existují po celou dobu života datového skladu. Časově rozlišený pro potřeby analytického srovnání musí být data ukládána s časovým označením. Tato informace se pak využívá k vytvoření dimenze času v multidimenzionálních kostkách (viz dále OLAP). Datové tržiště Datové tržiště je rozdělení, nebo-li decentralizace datového skladu podle určitého hlediska dělení. V nejčastějším případě se jedná o decentralizaci firemních datových skladů dle divizí nebo poboček. Hlavním účelem datových tržišť je zkrácení doby odpovědi z divize vzdálené od centrálního skladu a tím i snížení nákladů na komunikaci s centrálou

22 Analytické komponenty Tyto komponenty slouží k vlastnímu zpřístupnění v závislosti na požadovaném dotazu a způsobu analyzování dat uložených v datovém skladu nebo datovém tržišti. Reporting Reportingem jsou označovány formy dotazů do datového skladu nebo tržiště (databáze), které se provádí standardním typem dotazů nad danou databází (např. SQL). Rozeznáváme dva základní druhy reportingu: standardní definované dotazy se provádí v předem stanovených časových intervalech, ad hoc uživatelem zadaný jednorázový dotaz na data, která potřebuje v danou chvíli získat. OLAP Jedná se o rozšíření klasické databáze do tzv. kostek. OLAP databáze se skládá z jedné nebo několika souvisejících kostek. Tyto kostky na rozdíl od datových skladů obsahují již předzpracované agregace dat podle předem definovaných struktur dimenzí a jejich vzájemných kombinací. OLAP databáze je možné vytvářet v několika základních variantách: MOLAP Multidimensional OLAP uložení dat v multidimenzionálních OLAP binárních kostkách; ROLAP Relational OLAP multidimenzionalita je zajištěna uložením a vazbami v relační databázi; HOLAP Hybrid OLAP kombinace předchozích dvou způsobů, tzn. detailní data uložena v relační databázi a agregované hodnoty v binárních kostkách; DOLAP Desktop OLAP je určen k připojení se k centrálním OLAP kostkám a odkud se extrahují pouze potřebné podmnožiny jednotlivých kostek na lokální počítač (Desktop). Toto umožňuje mít veškeré potřebné informace na cestách a provádět analytické operace pouze nad touto off-line kostkou

23 Data Mining Data Mining, česky také označován jako Dolovaní dat, slouží k zjišťování strategických informací z databází pomocí speciálních algoritmů. Autoři [BI04] charakterizují dolovaní dat jako proces extrakce relevantních, předem neznámých nebo nedefinovaných informací z velmi rozsáhlých databází. Informace jsou odvozena z obsahu dat, tudíž je uživatel může předem specifikovat. Data Mining využívá znalosti z několika oborů především z matematiky a statistiky Nástroje pro koncové uživatele Nástroje pro koncové uživatele mají jediné poslání, a to zpřístupnit data i lidem, kteří jsou méně počítačově nadaní. Proto se klade velký důraz na uživatelskou přívětivost a intuitivní ovládání. Lidé, kteří s takto získanými informacemi pracují jsou odborníky ve svém oboru nikoli odborníky na práci s OLAP kostkami nebo databázemi, a proto musí být data pro ně velice jednoduše dostupná. Intranet Jednou z možností jak uživatelům zpřístupnit data je formou internetové/intranetové aplikace, která někdy také bývá označována jako dashboard. Na tomto portálu si uživatelé mohou nadefinovat jaká data chtějí vidět při spuštění nebo přihlášení do aplikace. To jim umožňuje získat data, která potřebují ke svým každodenním rozhodnutím, velice rychle. Pokud chtějí jiná data nebo dotazy na OLAP kostky, mohou si je velice snadno sestavit s přednastavených schémat. EIS manažerské aplikace Manažerské aplikace jsou určeny pro podporu řízení vrcholového managementu a to na ně klade ještě vyšší nároky. Tyto aplikace musí podporovat firemní procesy a jejich stavy a výsledky zahrnovat do BI řešení. Musí také obsahovat množství jak interních tak externích datových zdrojů, které jsou důležité pro správné rozhodnutí. Vypovídací schopnost těchto aplikací musí být

24 jednoznačná a přehledná. i zde se spíše používají styly dashboardů, kokpitů, semaforů a jiných spíše grafických zobrazeních, kterým dávají manažeři přednost. 2.3 Shrnutí Je zřejmé, že data musí projít dlouhou cestou a řadou aplikací než se změní jejich vypovídací hodnota pro management. Každá součást BI řešení musí být volena s přihlédnutím ke všem výše specifikovaným problémům tak, aby BI řešení jako celek fungovalo a to bez častých zásahů, změn a úprav. V potaz musí analytik řešení vzít jak velikost firmy a s tím spojený počet uživatelů, tak také objem produkovaných a tím pádem také zpracovávaných dat. Náklady na pořízení a zprovoznění BI řešení nejsou zrovna nejnižší, proto musí být počítáno jak s určitými rezervami, tak také s nejnovějšími trendy ve způsobech komunikace manažerů s kanceláří, kteří získávají data v terénu, kdy nesedí u svého počítače. Obr. č. 3: Architektura BI řešení

25 3 FAKTORY ÚSPĚŠNOSTI A METRIKY SROVNÁNÍ Tato kapitola staví základ pro rovné srovnávání komerčních a OpenSource aplikací. Vychází z kapitoly 10. Faktory úspěšnosti řešení Business Intelligence knížky [BI04]. Zde jsou přesně popsány veškeré faktory, které mohou mít vliv na správné nebo špatné zavedení nebo výběr BI řešení. Veškeré faktory a metriky jsou hodnoceny na základě CASE případu, to znamená, že cena licencí a čas potřebný na zprovoznění BI řešení vychází z dat, popisu společnosti a multidimenzionální analýzy uvedené v kapitole 5. Faktor úspěšnosti se definuje [BI04] jako: Nastavení vlastností nebo parametrů řešení, případně uplatnění osvědčených přístupů a zkušeností, které povedou ke splnění definovaných cílů BI řešení a k dosažení požadovaných efektů. Rozeznáváme celou škálu faktorů úspěšnosti, které mají různý dopad na kvalitu řešení. Zásadní faktory, které mají rozhodující vliv na výsledné řešení označujeme jako kritické faktory úspěšnosti. Faktory úspěšnosti jsou chápány jako aspekty řešení nebo situace, jejichž neošetření vede k riziku neúspěšného ukončení projektu nebo k neúspěšnému provozu a rozvoji BI řešení. Standardně jsou projekty považovány za úspěšné, pokud splňují následující podmínky: projekt je dodán v požadovaném a schváleném čase projekt je dodán v rámci požadovaných a schválených zdrojů (finančních, lidských a dalších) projekt je vnímán koncovými uživateli jako úspěšný, tzn. uživatelé pokládají jeho výsledky za adekvátní svým potřebám Řešení BI má několik upřesňujících podmínek úspěšnosti: aplikace jsou provozovány bez chyb a výpadků

26 aplikace uspokojují požadavky koncových uživatelů, definované na počátku projektu nebo ve změnových řízeních ekonomický přínos aplikací odpovídá očekávání při definici projektu nebo je dokonce vyšší V současné době se používá několik možných pohledů na členění faktorů úspěšnosti. Tak jako celá tato práce, tak i členění faktorů úspěšnosti vychází z [BI04], které nejlépe vystihuje jednotlivé etapy zavádění BI řešení a k nim i přiřazuje kritické faktory úspěšnosti. V této publikaci jsou faktory úspěšnosti členěny do pěti základních skupin, které jsou tvořeny na základě členění řízení celého informačního systému. To znamená, že se řízení BI uskutečňuje v obvyklých oblastech řízení celého systému a úrovních řízení, jako jsou strategické, taktické a operativní. Pro další rozbor faktorů úspěšnosti budeme dále vycházet z následujícího členění vytvořeného na základě výše popsaných kritérií: Faktory úspěšnosti ve strategii a plánování BI Faktory kvality řešení a služeb BI Faktory úspěšnosti disponibilních zdrojů Faktory úspěšnosti řízení a řešení projektů BI Faktory úspěšnosti spojené s provozem aplikací BI Jednotlivá členění budou níže podrobněji rozepsána, a to vzhledem k tématu této práce. To znamená, že jsou popsány faktory, které jsou důležité pro objektivní srovnání komerčních a OpenSource nástrojů nebo přímo řešení aplikací Business Intelligence. 3.1 Převedení faktorů úspěšnosti na objektivní metriky Metriky slouží jako nástroj zjištění efektivnosti a výkonnosti na základě stanovených faktorů úspěchu. Metriku [MI01] definujeme jako: přesně vymezené finanční či nefinanční ukazatele nebo hodnotící kriteria, které jsou používány k hodnocení úrovně efektivnosti konkrétní oblasti řízení podnikového výkonu a jeho efektivní podpory prostředky IS/ICT

27 Metriky členíme na dva základní druhy: tvrdé metriky objektivně měřitelné ukazatele, způsob a postup měření hodnot tvrdých metrik je jednoduchý, časově a finančně nenáročný, jelikož ve většině případů jsou hodnotami číselné ukazatele; měkké metriky slouží k měření a hodnocení úrovně informatické podpory jednotlivých procesů či funkčních oblastí podniku, měkké metriky se hodnotí auditním způsobem, to znamená, že vlastníci procesů či funkčních oblastí a jim náležejících metrik hodnotí prostřednictvím bodového ohodnocení (škála bodů 0-100). Jelikož není náplní této práce řešit zda BI ano či ne, ale vytvářet návrh dle procesů určité společnosti, budu se zabývat pouze metrikami, které slouží k přímému porovnání různých BI řešení stejného podniku a pokud bude možno i stejného datového skladu. 3.2 Faktory kvality řešení a služeb BI Faktory úspěšnosti zařazené do této oblasti vycházejí hlavně z nabídky řešení BI na trhu, řešení dodavatelů a jejich kvality. Publikace [BI04] uvádí v této oblasti čtyři základní faktory. Pro účely srovnání nám ale postačí pouze jeden z nich a to následující Kvalita celkové architektury BI Při volbě architektury celkového BI řešení je třeba vybrat optimální kombinaci aplikačních a technologických komponent, které budou tvořit celkové řešení. Tato kombinace ovlivňuje základní parametry úspěšného řešení. Mezi tyto základní parametry především počítáme finanční stránku, vnímání řešení managementem organizace a koncovými uživateli i časovou náročnost jednotlivých kroků zavádění BI řešení. Při návrhu architektury musí řešitel brát v potaz několik klíčových požadavků, níže jsou uvedeny jen některé z nich: otevřenost architektura musí podporovat propojení s novými systémy a současně musí být schopna přizpůsobit se organizačním i procesním změnám

28 škálovatelnost architektura musí umožnit rozšiřovat řešení jak po věcné, tak i po technologické stránce integrovatelnost schopnost integrace na ostatní produkty a projekty, výstupy BI řešení musí být integrovatelné do jiných řešení organizace, tzn. data musí být využitelná v ostatních aplikacích používaných v organizaci jednoduchost (transparentnost) zvládnutí poměru komplexnosti a šíře funkcí vůči jednoduchosti řízení a manipulace výkonnost, funkcionalita a řada dalších Metriky vyplývající z tohoto faktoru: Metrika Způsob řešení Otevřenost body Účel: tato metrika bude sloužit pro ohodnocení otevřenosti a škálovatelnosti v následujícím rozmezí pokud produkt není vůbec otevřený a pracuje jen s určitým datovým omezením (0 b.), pokud produkt podporuje v dnešní době nejrozšířenější formáty (MS Office, csv, dbf apod.) a nejrozšířenější databáze (100 b.) Integrovatelnost body Účel: tato metrika hodnotí zda je možno jednoduše napojit BI řešení na stávající podnikové zdroje dat pokud to umožňuje bez jakékoli změny pro pracovníky se zdrojovými systémy (100 b.), je-li nutno kompletně předělat systém práce se zdrojovými daty (0 b.) Jednoduchost body Účel: tato metrika subjektivně hodnotí jednoduchost instalace a zprovoznění pokud je instalace jednoduchá pro běžného uživatele a tvořena formou průvodců a obdobně je řešena i tvorba BI řešení (100 b.). Pokud je instalace náročná, bez průvodců a pokyny pro zprovoznění aplikací i samotného BI řešení jsou nedostatečné a není dostupný ani řádný manuál nebo nápověda (0 b.)

29 3.3 Faktory úspěšnosti disponibilních zdrojů Faktory úspěšnosti, jež vycházejí ze zdrojů, které má podnik pro řešení BI k dispozici, jsou vyjádřením jejich objemu, kvality, dostupnosti. Níže jsou uvedeny základní faktory, které jsou důležité z hlediska srovnání Objem a doba pro získání financí Objem vyčleněných financí je těžké pro management určit, protože sám neví, jaký přínos bude pro ně BI řešení mít. Ještě komplikovanější to je u malých a středních podniků, které investují do ICT/IS pouze nejnutnější prostředky. Řešením proto pro ně často bývá OpenSource. Komerční řešení na míru Komerční řešení OpenSource řešení s drahou implementací s levnou impl. s důrazem na impl. Obr. č. 4: Srovnání možností zavedení BI řešení s omezenými finančními zdroji Z obrázku je patrné, pokud chce firma provést kvalitní implementaci řešení BI, musí zákonitě najít kvalitní software za co nejnižší cenu. Druhou finanční stránkou je doba pro získání financí. Tato doba závisí na plánech rozvoje a hlavně na ochotě organizace přistoupit k implementaci BI řešení

30 Metriky vyplývající z tohoto faktoru: Metrika Náklady na zakoupení SW licencí Způsob řešení součet nákladů za licence operačního systému a BI aplikací (Kč) Účel: tato metrika popisuje náklady, které jsou spjaty s nákupem licencí softwaru, který bude využíván pouze na BI řešení. V této práci se nebere v úvahu, že software může být využíván i za jiným účelem např. doménový, souborový a databázový server pro celou firmu na jedné stanici. To by totiž znamenalo započítat pouze část nákladů, kterou nelze jednoduše vyčíslit Alokace dostatečných pracovních kapacit Alokace dostatečných pracovních kapacit je chápána ze dvou základních pohledů. První pohled řeší alokaci interních pracovníků implementačního týmu na straně zadavatele, tj. zaměstnanců spolupracujících na analytické části, uživatelského testování a zaměstnanců, kteří se budou muset účastnit školení. Druhým pohledem je alokace pracovníků oddělení informatiky, rozhodne-li se společnost pro OpenSource řešení, které bude implementovat vlastními silami. k tomuto pohledu je nutno připočítat i pracovní kapacity z prvního pohledu. V celkovém objemu pracovních kapacit a jejich přepočtu na finanční náklady podniku může být toto řešení dražší. Metriky vyplývající z tohoto faktoru: Metrika Náklady na pracovní síly potřebné ke zprovoznění BI řešení Způsob řešení odpracovaný čas pracovníků při tvorbě a implementaci BI řešení * 800 Kč/hod. (průměrná cena za hodinu instalace SW) Účel: tato metrika má za účel vyčíslit náklady na instalaci a zprovoznění BI řešení, což je hlavní parametr pro srovnání nákladů na komerční a OpenSource

31 řešení; čas je počítán jako čistý pracovní čas. V této práci neberu v úvahu čekání na zaslaný dotaz tvůrci OpenSource aplikace, v úvahu beru pouze čas strávený hledáním řešení problému na internetových stránkách tvůrce, na fórech nebo jiných stránkách pomocí vyhledávače Kvalita technologické platformy BI Správná volba technologie výrazně ovlivňuje jak finanční tak i časovou stránku BI řešení, které se odrážejí do celkového vnímání uživatelů. Dražší řešení se zpravidla implementují v kratším časovém horizontu. Naopak u OpenSource řešení, která jsou zcela zdarma (viz Český překlad Obecné veřejné licence GNU [GNU]) musí vedení společnosti počítat s výrazně delší dobou implementace a možnou nižší stabilitou. Technologická platforma BI musí splňovat požadavky na kvalitu celkové architektury BI, to znamená otevřenost a škálovatelnost, použitelnost BI komponent pro jiné projekty a v neposlední řadě soulad s podnikovými standardy. Faktory úspěšnosti související se zdroji informatiky se odvíjejí od celkové náročnosti BI na finanční a pracovní zdroje, která není tak značná jak tomu je u transakčních aplikací. Na druhé straně datová a technická náročnost BI řešení je podstatně větší než u transakčních aplikací a vyžaduje i speciální organizační a projekční znalosti a opatření. Z výše uvedeného vyplývá nutnost vyšší kvalifikace na všech úrovních implementace BI řešení a také na straně uživatelů. Metriky vyplývající z tohoto faktoru: Metrika Způsob řešení Kvalita technologické platformy subjektivní hodnocení (body ) Účel: tato metrika navzájem komplexně porovnává všechny tři řešení na základě průběhu instalace a implementace, nebere v potaz náklady nejlepší řešení (100 b.), snížení za každou nevyhovující část (- 25 b.)

32 Počet známých implementací počet uvedených referenčních instalací Účel: tato metrika srovnává počet známých instalací jednotlivých BI řešení, to má vliv na kvalitu samotného produktu pokud tvůrce řešení neuvádí konkrétní číslo, je uveden odhad kolik licencí je na světa nainstalováno (např. 10, >100, <1000) 3.4 Faktory úspěšnosti řízení a řešení projektů BI Se samotným řešením projektu BI souvisí řada dalších důležitých faktorů, které výrazně ovlivňují kvalitu výsledného řešení. Mezi ně patří: úroveň řízení projektu závisí na kvalitě řídících orgánů; doba trvání projektu představuje celkovou dobu od zadání projektu po předání do provozu (obvykle ve dnech nebo měsících); úroveň sdílení informací ovlivňuje efektivní předávání informací o problémech a jejich opravách, funkcionalitě, případně o nových potřebách uživatelů; kvalita modelování datových skladů a tržišť vytvoření datového skladu a tržišť vyžaduje správné pochopení datových prvků, které se v dosavadních systémech vyskytují a pochopení jejich vzájemných vztahů. Metriky vyplývající z tohoto faktoru: Metrika Doba trvání projektu Způsob řešení součet času instalace SW a zprovoznění BI řešení (dny) Účel: tato metrika má za úkol vyčíslit celkovou dobu potřebnou na instalaci a zprovoznění BI řešení, včetně čekání na odpovědi při řešení problémů se zprovozněním OpenSource řešení nebo upravování zdrojového kódu, vyhledávání odborné pomoci apod

33 Jednoduchost instalace subjektivní hodnocení jednoduchosti instalace BI řešení (body 0-100) Účel: tato metrika hodnotí jednoduchost a způsob instalace pokud je instalace téměř automatická za pomoci průvodců (100 b.), pokud je instalace jednoduchá na základě krátkých pokynů (75 b.), jestli je při instalci potřeba postupovat na základě pokynů delších než 1 strana (50 b.), jestli je potřeba stahovat jiné aplikace, knihovny nebo ovladač a pokyny jsou delší než 3 strany (25 b.) Kvalita modelování DWH jednoduchost modelování pomocí tvorby datové pumpy (body 0-100) Účel: tato metrika má za účel ohodnotit složitost modelování DWH pomocí datové pumpy pokud ETL není funkční (0 b.), pokud umožňuje vytvoření pomocí SQL příkazů nebo jiným způsobem (100 b.), pokud umožňuje pouze přidávat data do již vytvořené struktury tabulek (50 b.) Kvalita ETL podporované vstupní formáty datové pumpy (body 0-100) Účel: tato metrika hodnotí podporované vstupní formáty pro datovou pumpu pokud ETL podporuje základní formáty jako csv soubory, ODBC (25 b.), předchozí plus podpora Excelu (50 b.), předchozí plus podpora jiných databází (75 b.), nejširší podpora nativních formátů (100 b.) 3.5 Faktory úspěšnosti spojené s provozem aplikací BI Samotný provoz BI je ovlivňován faktory, které souvisí jak s výslednou kvalitou provozovaných jednotlivých aplikací, které jsou součástí BI řešení, tak i způsobem zajištění a řízení provozu

34 3.5.1 Celková úroveň provozu BI aplikací Hlavním faktorem je úroveň provozu aplikací, která je součástí předání projektu a následné podpory. Celkovou úroveň provozu lze zjistit sledováním používání a vytížení aplikací. Management podniku zajímá zda prostředky, které vynaložil na toto řešení, byly vynaloženy efektivně, a že řešení je používáno. Pokud tomu tak není, zajímá ho proč tomu tak je. Metriky vyplývající z tohoto faktoru: Metrika Použitelnost řešení Způsob řešení Ano/Ano částečné/ne Účel: tato metrika má objektivně stanovit zda na základě znalostí zprovozněné řešení je použitelné (Ano/NE) nebo zda je použitelná jeho určitá část (Ano částečné) Výkonnost BI řešení Výkonností BI řešení se většinou myslí doba, po kterou trvá určitá činnost. Dostatečná výkonnost řešení BI je nejčastěji sledována prostřednictvím doby trvání běhu datové pumpy nebo uživatelských dotazů. Doba běhu datové pumpy je objektivně měřitelná, a proto srovnatelná u všech typů možných řešení. Dobou běhu datové pumpy je rozdíl mezi časem spuštění a časem ukončení běhu pumpy. Jedná se proto o tvrdou metriku. Vysvětlení pojmu metriky a členění metrik následuje níže, před samotnými metrikami, které budou použity pro objektivní srovnání jednotlivých BI řešení. Doba odezvy uživatelských dotazů je ovlivněna subjektivním vnímáním koncových uživatelů. Jedná se proto o metriku měkkou (viz níže). Reakční doba systému závisí na typu analytické úlohy, čím složitější analytické operace, tím je doba odezvy delší. V některých případech se může jednat o hodiny až dny. Oproti tomu doba odezvy dotazů na jednoduché analytické dotazy by se měla pohybovat v řádech sekund. Podle Coddových pravidel OLAPu se [BI04] odkazuje na to, že doba odezvy by neměla být větší než 30 sekund

35 Metriky vyplývající z tohoto faktoru: Metrika Výkonnost datové pumpy Způsob řešení doba běhu datové pumpy na stejných datech (sekundy) Účel: srovnání rychlosti funkčních datových pump a databází, rychlost načtení dat, jejich zpracování a zapsání do databáze. Doba odezvy na stejný dotaz doba potřebná na zadání dotazu a získání správných dat (minuty) Účel: tato metrika má porovnat rychlost získání dat na stejný požadavek uživatele, v úvahu se bere čas od spuštění aplikace, přes zadávání dotazu až po získání výsledku. Dotaz: Tržby a náklady u VIP zákazníků v kraji Hlavní město Praha za rok 2003 a Správnost výsledku Ano/Ne Účel: tato metrika má porovnat, zda všechna řešení vrátila správný výsledek na stejný dotaz Způsob aktualizace datových skladů, řízení nárůstu dat Vzhledem k velkým objemům dat v datových skladech se v dnešní době používá inkrementální aktualizace skladu, která je náročnější na návrh, než kompletní znovu naplnění. Toto řešení musí sledovat změny v datech a jejich dopad na stávající data v datovém skladu. Tento způsob je jediným možným řešením, jak zaručit vysokou dostupnost a aktuálnost datového skladu. Metriky vyplývající z tohoto faktoru: Metrika Možnost inkrementálního přidávání dat Způsob řešení Ano/Ne Účel: metrika hodnotí zda BI řešení, respektive datová pumpa, umožňuje inkrementální přidávání dat

36 3.5.4 Náročnost řešení na administraci Administrátoři jsou ti, kteří jsou zodpovědní za plynulý a bezproblémový chod po převzetí hotového BI řešení. Každé řešení by mělo být realizováno v takovém administrátorském prostředí, které umožňuje jednoduše a přehledně sledovat každodenní činnost systému. Toto prostředí by mělo umožňovat monitoring běhu datové pumpy v reálném čase, včetně upozornění v případě výskytu problému. Dále by měl umožňovat sledování statistiky dotazů do databáze, včetně doby jejich průběhu. Metriky vyplývající z tohoto faktoru: Metrika Náročnost na administraci Způsob řešení Jednoduchost správy uživatelů a jejich přístupových práv (body 0-100) Účel: metrika posuzuje náročnost na administraci a správu uživatelů pokud je zahrnuta administrace uživatelů a je jednoduchá (tvořena průvodci, obsahuje nápovědu nebo manuál apod.) 100 b., je-li správa složitější nebo není manuál nebo nápověda (50 b.), neobsahuje-li řešení správu uživatelů (0 b.) Podpora uživatelů Je samozřejmostí, že uživatelům nestačí pouze jednorázové školení, ale je třeba nastavit způsob podpory, který zahrnuje další konzultační a případně školící možnosti. Nejčastěji to bývá řešeno mezi dodavatelem a odběratelem pomocí systému help-desk. Metriky vyplývající z tohoto faktoru: Metrika Způsob řešení Podpora uživatelů a administrátorů způsob podpory (body 0-100) Účel: metrika posuzuje dostupnost informací pro administrátory a běžné uživatele pokud je k dispozici nápověda, manuály, dohledatelné postupy na internetu nebo popsané postupy v odborných publikacích, bezplatná podpora ( , telefon), možnost placeného školení (100 b.), každá chybějící část (- 20 b.)

37 3.5.6 Úroveň řízení kvality dat Data by měla objektivně a správně popisovat reálnou situaci, to je to co dělá data kvalitními. Kvalita dat by měla být řešena již ve zdrojových systémech, případně komponenty datové transformace by neměly nekvalitní data zahrnovat do BI řešení, aby nedocházelo ke zkreslování informací. Provozní faktory úspěšnosti BI řešení popisují kvalitu řešení, které bylo dosaženo projektem zavedení, ale i úroveň specifického provozu aplikací, které rozhoduje o finální použitelnosti BI řešení a tudíž i o akceptaci projektu jako celku. Z provozního hlediska se úspěšnost BI řešení posuzuje podle výkonnosti a náročnosti na správu při běžném provozu datového skladu, tak i podle transformačních procedur ETL. V rámci samotného provozu je také důležitá průběžná podpora uživatelů, způsob řešení jejich požadavků, včetně požadavků na změny. Metriky vyplývající z tohoto faktoru: Metrika Řízení kvality dat Způsob řešení způsob řízení kvality dat (body 0-100) Účel: metrika hodnotí zda datová pumpa nebo BI řešení umožňuje řízení kvality pokud umožňuje (100 b.), pokud jen částečně tak podle způsobu (25-50 b.), pokud nikoli (0 b.)

38 3.6 Přehledová tabulka kritérií a metrik Metrika Způsob řešení Faktory kvality celkové architektury Otevřenost body Integrovatelnost body Jednoduchost body Faktor objemu financí Náklady na zakoupení SW licencí Faktor alokace pracovních kapacit Náklady na pracovní síly potřebné ke zprovoznění BI řešení součet nákladů za licence operačního systému a BI aplikací (Kč) odpracovaný čas pracovníků při tvorbě a implementaci BI řešení * 800 Kč/hod. (průměrná cena za hodinu instalace SW) Faktor kvality technologické platformy Kvalita technologické platformy body Počet známých implementací počet uvedených referenčních instalací Faktory úspěšnosti řízení a řešení projektu Doba trvání projektu součet času instalace SW a zprovoznění BI řešení (dny) Jednoduchost instalace body Kvalita modelování DWH jednoduchost modelování pomocí tvorby datové pumpy (body 0-100) Kvalita ETL podporované vstupní formáty datové pumpy (body 0-100) Faktor celkové úrovně provozu Použitelnost řešení Faktor výkonnosti řešení: Výkonnost datové pumpy Doba odezvy na stejný dotaz Správnost výsledku Faktor aktualizace DWH Možnost inkrementálního přidávání dat Faktor náročnosti na správu Náročnost na administraci Ano/Ano částečné/ne doba běhu datové pumpy na stejných datech (sekundy) doba potřebná na zadání dotazu a získání správných dat (sekundy) Ano/Ne Ano/Ne Jednoduchost správy uživatelů a jejich přístupových práv (body 0-100) Faktor podpory uživatelů Podpora uživatelů a administrátorů způsob podpory (body 0-100) Faktor úrovně řízení kvality dat Řízení kvality dat způsob řízení kvality dat (body 0-100) Tabulka č. 1: Definice metrik a kritérií

39 3.7 Shrnutí Jak je z výše uvedeného zřejmé, správná volba řešení Business Intelligence a jeho jednotlivých částí a způsobu zavádění je velice obtížná. Veškeré kritické faktory se navzájem ovlivňují a s tím musí podnik i řešitel od začátku počítat

40 4 VÝBĚR POROVNÁVANÝCH NÁSTROJŮ A JEJICH ALTERNATIV V současnosti je na trhu řada komerčních řešení, které nabízí tuzemské i nadnárodní společnosti. Tato práce se zabývá pouze jedním, nejznámějším a nejdostupnějším komerčním řešením, a to od společnosti Microsoft. Souběžně s komerčními aplikacemi řada programátorů nebo i menších společností pracuje na vývoji vlastních řešení, které pak nabízí ostatním zdarma jako OpenSource řešení (licenční podmínky viz [GNU]). Komerční i OpenSource řešení jsou vybrána s ohledem na počet aktivních uživatelů. U komerčních licencí počet aktivních uživatelů výrazně ovlivňuje náklady na operační systém a na databázi. Z tohoto důvodu bude srovnání provedeno pro malé podniky (1-5 přistupujících uživatelů k BI řešení) a pro střední podniky (1-20 přistupujících uživatelů BI řešení). Při popisu jednotlivých řešení je větší důraz kladen na popis méně známého řešení pomocí OpenSource aplikací a jejich popisu. 4.1 Komerční řešení Microsoft SQL Server Komerční licence znamená, že tvůrce softwaru dává souhlas uživateli k instalaci a užívání jeho softwaru za sjednaných podmínek a za sjednanou úplatu. Toto je hlavní rozdíl mezi komerčním a OpenSource řešením Popis společnosti Tato společnost i její řešení je v odborné veřejnosti známé, a proto jsou níže uvedena pouze základní fakta, která slouží pro srovnání Operační systém Windows server Před samotným nainstalováním SQL serveru musíme nejdříve vybrat a nainstalovat operační systém serveru. V současnosti si malé a střední podniky

41 mohou zakoupit licenci Small Business Serveru, která plně pokryje požadavky přístupu k BI řešení. Oba typy serverů, Small Business i SQL Standard Server, mají podobné licenční podmínky. To znamená, že si společnost zaplatí za licenci severu a za počet aktivních uživatelů, kteří budou přistupovat k tomuto serveru. Tento počet je nutné stanovit před zakoupením licence a počítat s určitou rezervou, protože počet přistupujících uživatelů se zpravidla s postupem doby zvyšuje a podnik by tak musel dokupovat další licence. Ceny jsou převzaty z [AC06] viz příloha č. 2. Cena Small Business Serveru je stanovena na ,- Kč za server a 5 aktivních uživatelů, což plně pokrývá námi stanovené řešení pro malý podnik. Podnik má přesto možnost dokupovat počet aktivních uživatelů, další 5 aktivních uživatelů jej ale přijde na ,- Kč. Z toho můžeme jednoduše dopočítat cenu pro námi stanovený střední podnik (1 20 aktivních uživatelů) ,- Kč. Toto je cena pouze operačního systému serveru, cena SQL serveru bude teprve následovat Databázový server a BI řešení Před několika měsíci i společnost Microsoft uvolnila část svých produktů bezplatně. Bohužel tyto produkty jsou velice očesané, neobsahují tudíž tolik funkcí. Tyto produkty jsou určeny na základní seznámení a vyzkoušení. V domácích podmínkách mohou být bez problémů používány. Při nasazení do podnikového řešení narazíme na jejich limity. Naštěstí Microsoft dává k dispozici srovnání funkcí jednotlivých verzí (viz [MSSQL]), a tím nám usnadní další výběr. Podle této přehledové tabulky je zřejmé, že pro vybudování BI řešení jsou použitelné pouze dvě verze a to Standard a Enterprise. Obě předchozí verze totiž neobsahují podporu ETL a Analysis services pro vytvoření multidimenzionální kostky. SQL Standard Server je licencován za server bez uživatele ,- Kč a za jednoho přistupujícího uživatele 5 161,- Kč. Další možností je i nákup licence per procesor, kdy se už nebere v ohled počet přistupujících uživatelů, tato cena je bohužel vyšší ,- Kč. Pro malý i střední podnik vychází levněji nákup licence severu a uživatelů. Pro malý podnik pak náklady na licence SQL serveru vyjdou na ,- Kč a pro střední podnik ,- Kč

42 4.1.4 Komponenty datové transformace Data Transformation Services Tato komponenta je součástí jen některých verzí Microsoft SQL Serverů, jak již bylo zmíněno. Jedná se o velice důležitý nástroj pro načtení potřebných dat do databáze. Uživatel může pomocí velmi přívětivého prostředí sestavit složitou datovou pumpu ve velmi krátkém čase Databázové komponenty Microsoft SQL Server SQL Server je základním prvkem, kde jsou spravována veškerá data Analytické komponenty Microsoft Analysis Servises Microsoft Analysis Servises slouží k vytvoření multidemenzinálních kostek a k jejich procházení nebo k tvorbě složitějších dotazů pomocí jazyka MDX. Jak již bylo zmíněno, je součástí jen některých verzí MS SQL Serverů Nástroje pro koncové uživatele Microsoft Excel Jediným možným způsobem jak si uživatel může prohlížet vytvořené multidimenzionální kostky je pomocí aplikace Microsoft Excel a to pomocí připojení k této kostce. Pak může sestavovat tabulky a grafy dle jeho požadavků. Pokud vezmeme do úvahy i cenu klientského nástroje na prohlížení dimezionálních kostek MS Excel, jehož jedna licence stojí 4500 Kč, pro 15 uživatelů navýší se cena o ,- Kč. Cenu operačního systému na klientských stanicích neberu v úvahu, protože předpokládám, že stanice jsou používány i za jiným účelem

43 4.1.8 Shrnutí Společnost kupující nové licence Toto byly náklady na jednotlivé licence, které musí podnik sečíst. Kompletní řešení navíc předpokládá, že na všech klientských počítačích je operační systém Microsoft Windows s kancelářským balíkem Microsoft Office, který obsahuje MS Excel, pomocí kterého mohou uživatelé přistupovat k multidimezionálním kostkám. Konečná cena pouze serveru pro malý podnik znamená investici ,- Kč a pro střední podnik ,- Kč (v přehledové tabulce metrik jako cena a). Tyto ceny jsou bez DPH. Pokud by byl malý podnik neplátcem DPH zvýšila by se cena o dalších 19 % Společnost již využívající produkty Microsoft Pokud vezmeme v úvahu, že společnost již má a využívá licenci MS Small Business Severu a na klientských stanicích již má nainstalován MS Office, sníží se budoucí investice do celkového řešení. Pak bychom museli brát v úvahu pouze cenu MS SQL Serveru, která tak činí ,- Kč. K dalšímu snížení ceny dojde, pokud společnost plánuje využívat SQL server i ukládání dat z primárních zdrojů. Pak by bylo správné započítat pouze polovinu ceny serveru, což činí ,50 Kč (v přehledové tabulce metrik jako cena b). 4.2 OpenSource řešení Na internetu je možno najít řadu OpenSource řešení BI, ať už komplexních nebo dílčích aplikací BI. OpenSource znamená, že užívání softwaru, které je vydáno pod touto licencí je zdarma, tudíž není potřeba řešit rozdíl mezi malým a středním podnikem, protože náklady na licenci jsou u obou 0,- Kč. Rozdíl spočívá v jednoduchosti instalace a nastavení a o tom pojednává kapitola 6. Porovnání jednotlivých nástrojů. Dlouhodobým sledováním nabídky OpenSource řešení na internetu jsem se rozhodl, že pro účely srovnání vyberu dva možné způsoby řešení. Prvním způsobem je využití komplexního BI řešení The Bee od společnosti Microstrategy. To je postaveno na multidimenzionální databázi ROLAP

44 s využitím databázového serveru MySQL. Druhým možným způsobem řešení je využití dílčích aplikací od různých tvůrců a jejich postupné složení do komplexního řešení BI. 4.3 Komplexní OpenSource řešení The Bee Project Vzhledem k informacím, které se mi během roku hledání OpenSource BI aplikací podařilo získat a na základě osobní schůzky se zástupci Insight Strategy, vidím toto řešení jako favorita mezi OpenSource řešeními, a proto mu také věnuji větší prostor Popis společnosti Insight Strategy Společnost Insight Strategy, a. s. se orientuje na dodávku a implementaci technologií pro systémy business intelligence, modelování datových skladů a analýzu dat. Poskytuje implementační a konzultantské služby, školení a technickou podporu. Jejím cílem je poskytovat kvalitní řešení, které je dostatečně robustní z hlediska spolehlivosti i bezpečnosti, a je také schopné plnit analytické funkce manažerského informačního systému s požadovanými výkonovými a ekonomickými parametry. V současné době rozvíjí aktivity zejména ve dvou směrech. a to jako autorizovaný distributor robustního řešení pro velké projekty postaveného na technologii Microstrategy Inc., předního světového dodavatele OLAP řešení, kde zajišťuje technickou a prodejní podporu v České republice a na Slovensku. Druhým směrem je vývoj a podpora ekonomického řešení pro střední firmy postavené právě na OpenSource technologiích. Toto řešení je již vyvíjeno delší dobu. V roce 2004 bylo dokonce nominováno na křišťálový disk INVEX

45 4.3.2 Operační systém Toto řešení využívá řady aplikací, které jsou také dostupné pod GNU/GPL již od samotného operačního systému. The Bee může být zprovozněno jak nad Windows tak i nad Linuxem. Náklady na softwarovou licenci linuxu jsou nulové a uživatel si dokonce může vybrat z několika distribucí. Pro účely této práce jsem zvolil Kubuntu 6.06, což je jedna z novějších distribucí postavená na Debianu a její poslední dostupnou verzi Databázový server a BI řešení Celé řešení je postaveno nebo naprogramováno a poskytováno jako OpenSource řešení přístupné přes webové rozhraní. Z toho vyplývá, že ani přistupující uživatel není zatížen žádným potřebným softwarem. Vystačí pouze se zařízením, které je připojené k internetu a podporuje standardní http protokol. Nevýhodou na druhé straně je nemožnost offline práce s multidimezionální kostkou. Celý The Bee Project se skládá z několika částí, obdobně jako jsou rozděleny jednotlivé komponenty Business Intelligence (viz výše). Společnost Insight Strategy využívá přenesených názvů a celého procesu, který je obdobný v přírodě. Business Intelligence architektura: Primární zdrojové ETL DWH ROLAP Webové rozhraní Uživatel Květiny Srovnání s přírodou, jak uvádí Insight Strategy: Včela Úl Medvěd (beard) Medvídě (Osito) člověk pozorující Jen pro vysvětlení pojmů, které používá tato společnost, Osito znamená ve španělštině medvídě

46 4.3.4 Komponenty datové transformace Pro získání dat ze zdrojových systému je určena aplikace Bee ETL (stejně jako včela sbírá pyl, který přenáší do úlu). Tento nástroj je napsán v jazyku Perl pod přímým dohledem společnosti Insight Strategy Databázové komponenty Jak již bylo zmíněno dříve, databázová komponenta je tvořena v MySQL s využitím dalších nastavení, které je pod označením (Common). MySQL je známý a také velice rozšířený databázový software pro webové aplikace. Pro použití s OpenSource aplikacemi je také poskytován pod licencí GPL Analytické komponenty ROLAP server, který využívá cachovaní k rychlému přístupu k datům, je označován jako Beard Nástroje pro koncové uživatele A v neposlední řadě nástroje pro koncové uživatele, které jsou tvořeny prostřednictvím webového serveru s využitím standardního http severu Apache, který je označován jako OSITO Shrnutí I když jsou nástroje vyvinuty v různých jazycích a různými lidmi, společnost Insight Strategy nám ukazuje způsob jak je navzájem propojit a dokonce nám dává k dispozici vyzkoušet si demo. V neposlední řadě si můžeme přečíst, v kterých známých společnostech toto řešení implementovala. Toto jsou pro nás jakési záruky, které dělají toto řešení vzhledem k jeho ceně zajímavým

47 4.4 BI řešení prostřednictvím dílčích OpenSource aplikací Na internetu je možno najít řadu aplikací. Nejrychlejším způsobem jak najít OpenSource aplikace je hledat přímo na stránkách, kde se soustředí většina OpenSource programátorů a jejich aplikací [Sfnet]. Zde je zapotřebí probrat se výsledkem hledání a odfiltrovat řešení, která nemají ještě žádný výsledný program. Vyhledání jakéhokoli druhu programu je tak otázkou 30 minut, další otázkou zůstává jeho funkčnost v závislosti na požadavcích uživatele. Postupně budou uvedeny různé aplikace, které budou členěny dle zjednodušené architektury BI řešení. Tato podkapitola se od předchozích dvou liší v obráceném popisu, tzn. nejdříve bude uveden nástroj a pak teprve popis společnosti. V ostatních znacích je struktura obdobná Operační systém - Kubuntu Stejně jako komplexní řešení, tak i řešení pomocí dílčích aplikací bude postaveno nad operačním systémem Linux Kubuntu. Kubuntu je uživatelsky přívětivý operační systém postavený na KDE. Má 6měsíční plánovaný cyklus vydávání nových stabilních verzí. Je součástí projektu Ubuntu distrubuce pro každého pod GNU/Linux Komponenty datové transformace Nalézt ETL aplikaci není takový problém, jako je splnění kritérií různých zdrojů, jako je například databáze, Excelový soubor apod. Pokud firma má veškerá data již konsolidována v určité databázi, má o starost méně. Pak pouze stačí najít nástroj, který převede data z databáze a vykoná nad nimi pouze SQL příkazy, což je znatelně jednodušší. Po dlouhém hledání na internetu a zadávání různých kombinací vyhledávaných slov se mi na [SF] podařilo najít nejkomplexnější a nejpropracovanější ETL nástroj Keetle. Během psaní této práce se projekt Keetle spojil s projektem Mondrian a spolu začali vyvíjet komplexní BI OpenSource řešení pod názvem Pentaho. V současnosti jsou k dispozici jen určité

48 části a demo tohoto řešení a některé části dokonce pro tři platformy (Windows, Unix Linux, Mac OS) Databázové komponenty - Firebird Databáze, která bude použita je často srovnávána právě s MySQL a s databází PostgreSQL. Jedná se o databázi Firebird, která je vyvíjena komunitou Mozilla, obdobně jako FireFox, Thunderbird a řada dalších aplikací. Tato databáze je také vybrána proto, že analytická nadstavba, která bude použita, byla původně pro tuto databázi napsána Analytické komponenty - Mondrian Jako analytická komponenta byl vybrán Mondrian, který je používán v některých zemích již řadu let. V dnešní době jsou k němu další rozšiřující aplikace, jako například grafické rozhraní pro tvorbu multidimenzionálních kostek obdobné jako Analysis services u MS SQL. Schéma architektury Mondrian naleznete v příloze č. 4. V současnosti komunita pod označením Pentaho [Pent] vyvíjí komplexní BI řešení vycházející právě z této analytické komponenty. Při rozhovoru se zástupci společnosti Insigh Strategy jsme právě diskutovali o jejich jediném výrazném konkurentu v této oblasti a to právě o řešení Mondrian a to před vznikem komunity Pentaho. Je zřejmé, že je kladen tlak na veškeré softwarové odvětví, které má za následek postupný přechod k OpenSource řešením (viz Novell, Suse apod.). Pokud se Pentaho bude vyvíjet tímto tempem, je zřejmé že brzy předčí The Bee Project, to znamená že česká společnost z Brna bude muset také vyvinout velké úsilí, aby oslovila více potencionálních uživatelů a hlavně aby svůj projekt dál zdokonalila a zjednodušila Nástroje pro koncové uživatele - Internet Jsou na výběr tři aplikace, které využívají OLAP řešení Mondrian. Starší aplikace Jpivot a novější řešení Pentaho a Openi. Všechny aplikace slouží k vytvoření dashboardu, který je umístěn na intranetových stránkách společnosti

49 OpenSource řešení Pentaho založené na OLAP nástroji Mondrian dostalo ocenění stránek Výsledná aplikace, stejně jako u předchozích OpenSource řešení, bude záležet na složitosti instalace a zprovoznění. Na stránkách demo Openi.org je dokonce možnost přímého srovnání multidimenzionálních kostek, které byly vytvořeny pomocí Microsoft Analysis Services, s kostkami, které byly vytvořeny v aplikaci Mondrian. Je na první pohled znatelné, že obě řešení dochází ke stejnému výsledku. 4.5 Shrnutí Každá společnost má na výběr řadu variant při zavádění Business Intelligence řešení, které jsou výraznou mírou omezeny finančními zdroji, časem a znalostmi, které jsou potřeba. Tyto základní věci je třeba brát v úvahu při výběru jedné z výše uvedených variant řešení BI. k tomu by mělo napomoci srovnání, které naleznete v 6. kapitole a které vás seznámí se všemi úskalími jednotlivých řešení, ačkoli se na první pohled všechna jeví jako jednoduchá na zprovoznění, údržbu a administraci. Ne vždy platí, že to co je zdarma, je použitelné a u komerčního využití to platí dvojnásobně. Ale nepředbíhejme, teprve jsme na startovní čáře, a to kdo zvítězí se dozvíme až v cíli kapitole 7. Závěr

50 5 KONKRÉTNÍ PŘÍKLAD PRO PROVEDENÍ POROVNÁNÍ Reprezentativní malou, respektive střední, firmou je firma Matastav. Jedná se o fiktivní firmu, jejíž data se využívají při výuce Business Intelligence aplikací na Vysoké škole ekonomické. Vybraná firma vystihuje jak rozsahem dat, tak i různorodostí zdrojových systémů většinu firem na území České republiky. Data, která jsou určena pro BI aplikaci, jsou ve dvou formátech. Prvním formátem je jednoduchá databáze v Microsoft Access. Tato databáze obsahuje data z ERP systému a skládá se z 11 tabulek, přičemž tabulka faktů obsahuje řádků. Obr. č. 5: Schéma existujících dat firmy Matastav

51 Druhým formátem jsou dva soubory ve formátu Microsoft Excel získané ze dvou primárních zdrojů z Českého statistického úřadu a z České pošty. Tyto soubory mají různý formát a slouží k vytvoření dimenze regiony, to znamená, že na základ PSČ u jednotlivých zákazníků dojde k jejich přiřazení do správných krajů. To umožňuje sledovat prodejnost a ziskovost dle jednotlivých krajů, což je velice zajímavé pro všechny tuzemské malé a střední podniky. 5.1 Popis vybrané společnosti Firma Matastav se zabývá pronájmem stavební mechanizace a stavebních dělníků (dále jen zdroje). Svojí činností pokrývá celou ČR. Centrála firmy sídlí v Praze a dále má celkem 5 dalších poboček po celé ČR Parametry IT společnosti Matastav Počet uživatelů BI řešení Optimální řešení přístupu k BI aplikaci je pro vedoucího a zástupce vedoucího každé pobočky, tzn. 2 uživatelé na pobočku. Vzhledem k tomu, že v centrále nejsou pouze vedoucí pro danou oblast, ale také ředitel společnosti a jednatelé, je zde potřeba počítat s 5 aktivními uživateli. Celkem tedy musíme brát v úvahu, že BI řešení musí být sestaveno na současný přístup 15 lidí z celkových 40 pracovníků pracujících s PC. Z toho vyplývá zařazení společnosti Matastav mezi střední podnik z hlediska licencí BI řešení Struktura oddělení IT Oddělení ICT/IS se ve společnosti Matastav skládá z vedoucího oddělení, jehož hlavní působiště je Praha. Dále se v Praze nachází další 3 pracovníci, kteří mají na starosti informační a komunikační technologie v centrále a pobočkách nacházejících se v Čechách. V Brně jsou obdobně také 2 pracovníci, kteří mají na starosti pobočky na Moravě. Jeden z pracovníků oddělení ICT/IS nacházející se v centrále může být pověřen zprovozněním BI řešení. Tomu může věnovat 2/3 svého pracovního času a maximálně po dobu 2 měsíců

52 5.1.2 Další údaje pro dimenzionální analýzu Následují stručné komentáře k datům, která jsou uložena v databázi a která jsou důležitá pro správnou dimenzionální analýzu: Centrála a každá z poboček může pronajímat všechny zdroje, které firma Matastav vlastní. Na centrále i na jednotlivých pobočkách pracují zaměstnanci s různým základním platem, který je zvyšován o ohodnocení spojené s výkonem určité funkce. Zdroje jsou rozděleny do kategorií (Speciální stroj, Nákladní auto, Pracovní četa zedníci, Pracovní četa kopáči, Pracovní četa malíři, Pracovní četa nerozlišeno) Na každé z poboček a na centrále existuje jeden nebo více obchodníků, kteří se starají o svoje zákazníky. Zákazník vždy patří pod patronaci jednoho obchodníka (může sídlit i v jiném kraji než obchodníkova pobočka) Zákazníci jsou rozděleni do kategorií (Normal, Malozákázník, Velkozákazník, VIP) O každém pronájmu zdroje se sepíše "Kontrakt", ve kterém je uvedeno který zdroj, od kdy, do kdy a za jakou cenu je danému zákazníkovi pronajímán. Cena pronájmu se počítá z doporučené ceny uvedené u každého zdroje (tato cena je případně zvyšována či snižována podle toho do jaké kategorie daný zákazník spadá). Ve chvíli uzavření se kontrakt zařadí do plánu příjmů a výdajů (s kontraktem jsou také spojeny určité náklady) firmy. Údaje o pronájmech se sledují v tabulce Kontrakty, jejich plánovaná a skutečná finanční realizace v tabulce Položky (údaje cena a náklady v tabulce Kontrakty jsou pouze plánované hodnoty, nikoliv skutečně realizované). Všechny účetní operace spojené s činností firmy a jejich poboček jsou účtovány do hlavní účetní knihy (jako tzv. Položky). Základní princip je takový, že se do knihy zaznamenávají plánované i skutečné operace následujících typů (u každé položky jde vždy o kombinaci následujících charakteristik):

53 A (idskut) plán (2), Skutečnost (1) B (idtok) tok hotovosti (1 příjem, 2 výdaj) C (idoper) - předmět operace (1 nájem, 2 kontrakty, 3 mzdy, 4 osobní výdaje, 5 režie) Dále jsou pro relevantní typy operací vyplněny následující informace. idzam (id zaměstnance, jehož se účetní položka týká) idpob (id pobočky, které se účetní položka týká) idzdroje (id zdroje, kterého se účetní položka týká) idkontr (id kontraktu, kterého se účetní položka týká) např. u mzdy je uvedeno idzam, idpob; u režie idpob atd. 5.2 Dimenzionální analýza Dimenzionální analýze je řešena metodikou MDS (Multidimensional Domain Structure) podle Erika Thomsena, stejně jak je popsána v [BI04]. Jedná se o nerozšířenější a také o nejpřehlednější způsob modelování dimezionální kostky. Tato metodika je postavena na tabulce faktů, která obsahuje hodnoty veškerých sledovaných ukazatelů a na odpovídající tabulky dimenzí se tabulka faktů odkazuje prostřednictvím cizích klíčů. Tento přístup umožňuje využít při tvorbě logického modelu jak schéma hvězdy (star), tak i vločky (snowflake)

54 Dimenze: zakaznici Id.: zak Struktura Prvky: Počty Poznámka Struktura: Zákazníci_Kategorie_Celkem 1 Normál 3 Malozákazník 2 Velkozákazník 6 VIP 5 Výpočty: Zdroje: Kategorie_zakazniku Zakaznici Poznámky: Tabulka č. 2: Definice dimenze Kategorie zákazníků Dimenze: čas_rok_měsíc Id.: csa Struktura: Struktura Prvky: Počty Poznámka Rok 1 Měsíc 12 Výpočty: Zdroje: Poznámky: PomDen Tabulka č. 3: Definice dimenze Čas

55 Dimenze: čas_rok_kvartál_měsíc Id.: csb Struktura: Struktura Prvky: Počty Poznámka Rok 1 Kvartál 4 Měsíc 12 Výpočty: Zdroje: Poznámky: PomDen Tabulka č. 4: Definice dimenze Čas 2 Dimenze: Zdroje Id.: zdr Struktura Prvky: Počty Poznámka Struktura: Zdroje_typ_celkem 1 Spec. stroj 4 Nákladní auto 3 Zedníci 2 Kopáči 5 Malíři 8 Pracovní četa - nerozlišeno 4 Výpočty: Zdroje: Typy_zdroju Zdroje Poznámky: Tabulka č. 5: Definice dimenze - Zdroje

56 Dimenze: Pobočky Id.: pob Struktura Prvky: Počty Poznámka Struktura: Pobocky_Celkem 1 Centrála 4 Borohrádek 3 Brno 2 Hodkovičky Výpočty: Zdroje: Pobocky Poznámky: Tabulka č. 6: Definice dimenze - Pobočky Dimenze: Regiony Id.: reg Struktura Prvky: Počty Poznámka Struktura: Regiony_Celkem 1 Kraj 1 1 Okres Okres Kraj Výpočty: Zdroje: Poznámky: Excel tabulky není název, rozlišeno datem od do Tabulka č. 7: Definice dimenze - Regiony

57 Dimenze: Operace Id.: ope Struktura Prvky: Počty Poznámka Struktura: Operace_Celkem 1 Nájem 1 Zdroje 1 Mzdy 1 Osobní výdaje 1 Režie 1 Výpočty: Zdroje: pomoper Poznámky: Tabulka č. 8: Definice dimenze - Operace Dimenze: Plán, skutečnost Id.: psk Struktura: Struktura Prvky: Počty Poznámka Plán 1 Skutečnost 1 Výpočty: Zdroje: pomskut Poznámky: Tabulka č. 9: Definice dimenze -Plán

58 Dimenze: Tok Id.: tok Struktura: Struktura Prvky: Počty Poznámka Příjem 1 Výdaj 1 Výpočty: Zdroje: pomtok Poznámky: Tabulka č. 10: Definice dimenze - Tok

59 ID Ukazatel Jednotka Zdroj / kalkulace Čas A Čas B Zákazníci Zdroje Pobočky Regiony Psk Operace Tok Poznámky cena_celkem Cena za pronájem Kč Kontrakty X X X X X X naklady_celkem Náklady pronájem na Kč Kontrakty X X X X X X castka Částka účtovaná Kč Polozky X X X X X X Tabulka č. 11: Multidimenzionální analýza definice kostky Z výše uvedené tabulky je zřejmé, že BI řešení bude pracovat s dvěmi tabulkami faktů, což znamená, že bude třeba vytvořit dvě multidimezionální kostky

60 5.3 Shrnutí Většina malých nebo středních firem má svá klíčová data uložena buď ve sdílených Excelových souborech nebo v malých jednoduchých databázích souborového typu jako je Access, FoxPro apod. Vybraná fiktivní společnost, jak jsem již upozornil, zcela vystihuje tuto situaci v českých podnicích. Systém souborů různých formátů je typický a pro vytvoření automatických ETL procedur je složitější než zpracovávání dat uložených v databázových systémech. Formát souborů může být problémem pro OpenSource nástroje, ale v tuto chvíli je předčasné uvádět věci, které jsou popsány v následující kapitole

61 6 POROVNÁNÍ JEDNOTLIVÝCH NÁSTROJŮ Úvodem bych chtěl pouze upozornit, že srovnání nástrojů pro Windows a Linux mohou být drobně zkresleny mou uživatelskou znalostí jednotlivých prostředí. V prostředí Windows se pohybuji již 10 let a považuji se za pokročilého uživatele na úrovni správce stanic. Ale s Unixovým prostředím pracuji zhruba 3 roky (3 roky s Mac OS a poslední rok a půl Linux) a označil bych se spíše středně pokročilým uživatelem. Porovnání jednotlivých nástrojů probíhalo za stejných podmínek dle předchozích metrik. Postup srovnávání probíhal v následujících úrovních: instalace operačního systému; instalace aplikací BI řešení; zprovoznění BI řešení; vyhodnocení metrik. Jednotlivá řešení byla zprovozněna a popsána v pořadí jak jsou uvedeny v kapitole 4 Výběr porovnávaných nástrojů tzn., že první bude následovat komerční řešení od společnosti Microsoft, dále následuje komplexní OpenSource řešení The Bee od společnosti Insight Strategy a jako poslední je řešení pomocí dílčích OpenSource nástrojů pro BI. U každého řešení je vyplněna tabulka metrik a popsány veškeré poznatky, které souvisí s tímto řešením. Vzájemné porovnání stejně jako celkovou přehledovou tabulku metrik za všechny tři řešení pohromadě naleznete v shrnutí této kapitoly. Porovnání všech nástrojů proběhlo na stejném počítači, respektive notebooku Acer Aspire 1203 XV, Celeron 1,3 GHz, 352 RAM

62 6.1 Komerční řešení Microsoft SQL Server Jak již bylo uvedeno cena komerčního řešení SQL Server od společnosti Microsoft stojí pro 1-20 uživatelů Kč za Server a přístup k němu. Pokud vezme do úvahy i cenu klientského nástroje na prohlížení dimezionálních kostek MS Excel, jehož jedna licence stojí 4500 Kč, pro 15 uživatelů, dostaneme se na konečnou cenu Kč. Cenu operačního systému na klientských stanicích neberu v úvahu, protože předpokládám, že stanice jsou používány i za jiným účelem Instalace operačního systému Z důvodu nedostupnosti dema nebo nemožnosti zapůjčení licence Windows Server byla instalace provedena na Windows XP Proffesional, která poskytuje velice obdobné možnosti do deseti aktivních uživatelů. Instalace a nastavení operačního systému Windows je velice jednoduchá a celkem i rychlá. Trvala mi 2 hodiny Instalace aplikací BI řešení Instalace aplikací BI u komerčního řešení se skládá ze dvou kroků, a to z instalace a nastavní MS SQL Serveru a instalace Analysis Services. Instalace stejně jako instalace Windows je velice primitivní, stačí pouze zaškrtávat, co potřebujete a klikat na další. Nainstalovaní a základní nastavení SQL Serveru a Analysis Services mi zabralo taktéž necelé 2 hodiny Zprovoznění BI řešení Zprovoznění ETL a vytvoření datového skladu Součástí MS SQL Serveru je Enterprise Manager, který obsahuje velice silný nástroj Data Transformafion Services. Naučit se pracovat s tímto nástrojem je velice jednoduché a rychlé. k dispozici je nápověda a k dohledání na internetu jsou i postupy tvorby datových pump

63 DTS, jak bývá také označován, podporuje veškeré zdrojové formáty, do kterých bývají data ukládána, tak i databázové systémy, s kterými se v současnosti můžeme setkat. Následují obrázky z prostředí MS SQL Serveru a DTS. Z nich je patrné, že naklikáním jednotlivých objektů, které zastupují zdroje a cíle a jejich nastavení pomocí průvodců, se dají vytvořit jednodušší i složitější datové pumpy, které se dají spouštět ve stanovený okamžik nezávisle na sobě. Obr. č. 6: Schéma datové pumpy - MS DTS Navazuje obrázek se schématem datového skladu. Propojení jednotlivých tabulek je tvořeno automaticky pomocí SQL příkazů již při tvorbě tabulek pomocí primárních a cizích klíčů v jednotlivých tabulkách. Tento postup má vliv na sekvenci tvorby tabulek i jejich následné načítání

64 Obr. č. 7: Schéma datového skladu vytvořeného pomocí datové pumpy- MS SQL Vytvoření OLAP kostek K vytvoření dimezionální kostky slouží součást MS SQL Serveru, která se jmenuje Analysis Services. Zde správce severu a BI řešení nakliká pomocí průvodců strukturu jednotlivých dimenzí a následně i celou dimenzionální kostku. Pro začátečníky je k dispozici skvěle připravený Analysis Manager Concepts & Tutorial. Uživatelé mají k dispozici také přímé odkazy na internet, kde mohou najít více informací. Následuje obrázek logického modelu dimezionální kostky, pod ním je ukázka procházení daty v dimezionální kostce přímo v Analysis Services. Tímto způsobem může s daty manipulovat a kostku připravovat pouze jeden uživatel pracující přímo na serveru

65 Obr. č. 8: Schéma logického modelu dimezionální kostky - MS Analysis Services Obr. č. 9: Procházení dimezionální kostkou v Analysis Services

66 Práce s BI řešením v uživatelském prostředí Pokud správce BI řešení vytvořil a nastavil dimenzionální kostky dle dimenzionální analýzy, která byla udělaná podle požadavků uživatelů, stačí pak uživatelům připojit se k dimezionální kostce pomocí aplikace MS Excel a funkce kontingenčních tabulek. Zde jak je patrné z následujících obrázků můžeme pracovat s daty jak ve formě tabulek tak i v přehlednější formě grafů. Jedno z omezení je, že můžeme pracovat pouze s měřitelnými proměnnými, které jsou nadefinovány v dimezionální kostce. Pokud chceme vytvořit složitější dotaz, musíme se obrátit na správce BI řešení, aby mu jej připravil pomocí MDX jazyka přímo v Analysis Services. Obr. č. 10: Procházení kostkou ve formě tabulky na klientské stanici v MS Excelu (výsledek dotazu, který slouží jako metrika srovnání)

67 Obr. č. 11: Procházení kostkou ve formě grafu na klientské stanici v MS Excelu Procházení kostky v aplikaci Excel je velice rychlé a dynamické. Práci s dimezionální kostkou zvládnou i méně počítačově nadaní lidé, jak tomu většinou bývá v řídících pozicích. Jejich hlavní prací je vyvozovat závěry z dat, která dostanou, nikoli se učit pracovat s počítačem. Další velkou předností Excelu je možnost vytvoření offline kostky a její procházení bez nutnosti připojení k serveru. Uživatel si může vybrat jaké dimenze a hodnoty má offline kostka obsahovat a Excel mu do souboru vytvoří offline obraz kostky

68 6.1.4 Vyhodnocení metrik Metrika Faktory kvality celkové architektury Otevřenost Integrovatelnost Jednoduchost Faktor objemu financí Náklady na zakoupení SW licencí Faktor alokace pracovních kapacit Náklady na pracovní síly potřebné ke zprovoznění BI řešení Faktor kvality technologické platformy Kvalita technologické platformy Způsob řešení 100 bodů 100 bodů 100 bodů a) Kč b) ,50 Kč Kč 100 bodů Počet známých implementací > 1000 Faktory úspěšnosti řízení a řešení projektu Doba trvání projektu 2 dny Jednoduchost instalace 100 bodů Kvalita modelování DWH 100 bodů tvorby datové pumpy Kvalita ETL 100 bodů Faktor celkové úrovně provozu Použitelnost řešení Ano Faktor výkonnosti řešení: Výkonnost datové pumpy 25 s Doba odezvy na stejný dotaz 5 min. Správnost výsledku Ano Faktor aktualizace DWH Možnost inkrementálního přidávání dat Ano Faktor náročnosti na správu Náročnost na administraci 100 bodů Faktor podpory uživatelů Podpora uživatelů a administrátorů 100 bodů Faktor úrovně řízení kvality dat Řízení kvality dat 100 bodů Tabulka č. 12: Vyhodnocení komerčního řešení

69 6.2 Komplexní OpenSource řešení The Bee Instalace operačního systému Jak jsem se již zmínil, jako OpenSource operační systém jsem si vybral Linux Kubuntu 6.06 LTS. Jedná se o distribuci založenou na Debianu, která nemá žádné placené verze jak se můžeme v dnešní době setkat u SuSe nebo Red Hatu. Instalace je jednoduchá a v celku také rychlá. Instalace probíhá s pomocí jednoduchého textového průvodce. Jednoduchá grafika obdobná průvodci vytvořenému v MS-DOSU, stejně jako se můžeme setkat u úplného začátku instalace Windows. Instalace byla obdobně náročná a rychlá jako tomu bylo u MS Widnows, tedy 2 hodiny. Což mě mile překvapilo Instalace aplikací BI řešení Instalace OpenSource řešení na platformě Linuxu nebývá vždy jednoduchá. Filozofie Linuxu je stažení zdrojových souborů, jejich kompilace a pak následný test a instalace. To má za následek pomalejší a občas komplikovanější instalaci, která zaručuje plné využití vlastností vašeho počítače. Řešení pak bývá rychlejší a stabilnější než tomu je na platformě Windows. Další filozofií, kterou se řídí Linux je využívání jiných OpenSource knihoven a aplikací. U instalace The Bee řešení to znamenalo doinstalování knihoven a aplikací dle pokynů v readme souborech. Každá část aplikace pak obsahovala kontrolu zda počítač obsahuje veškeré potřebné součásti pro chod aplikace. Instalace ETL nástroje zabrala 5 hodin za pomoci 3 stránkových pokynů. Instalace OLAP aplikace (Beard) trvala 7 hodin a částečně mi s ní pomohl i kolega, který s OpenSource aplikacemi a Linuxem pracuje delší dobu, bez jeho pomoci by to trvalo ještě déle. Instalace uživatelské rozhraní znamená zprovoznění internetového serveru, který bude sloužit jako webové rozhraní pro uživatele k prohlížení dimenzionálních kostek. Tato instalace mi zabrala dalších 15 hodin

70 6.2.3 Zprovoznění BI řešení Zprovoznění ETL a vytvoření datového skladu Po zdánlivě zdárné a dlouhé instalaci se mi podařilo spustit aplikaci BeeTL, která je ETL nástrojem. Bohužel aplikace neobsahuje žádnou nápovědu a společnost Insight Strategy prozradila, že zatím není ani žádný manuál. Při rozhovoru mi zástupci Insight Strategy přiznali, že se jedná spíše o jejich aplikaci, která jim má usnadňovat převedení dat a není tudíž ani v jejich hlavním zájmu, jako je OLAP aplikace beard. Tvůrce uvádí, že aplikace podporuje zdrojové formáty jako MySQL, Excel, Postgres a ODBC. Přes protokol ODBC by se mělo dát přistupovat k většině databázím i k souborové databázi MS Access. Při práci s aplikací je zřejmé, že je na tyto formáty připravena. Připojit se mi ale podařilo pouze databázi MySQL, Excel a Access nikoli, proto jsem strhl body za otevřenost a integrovatelnost. Hledání chyby nebo správného způsobu práce se soubory je obtížné a časově náročné, což by navýšilo celkový čas ještě více. Náklady na instalaci a zprovoznění by se tak přiblížily k ceně komerční licence, proto jsem se rozhodl, že vytvořím datový sklad pomocí SQL příkazů. Toto mi zabralo 5 hodin, což je kratší než hledání chyby nebo způsobu zprovoznění aplikace a umožnilo mi to pracovat dál na porovnávání dalších částí BI řešení. Následné nadefinování datového skladu v aplikaci BeeTL trvalo 1 hodinu

71 Obr. č. 12: Schéma datového skladu vytvořeného pomocí datové pumpy BeeTL Práce s aplikací BeeTL je intuitivní, plnému využití chybí nápověda a již zmiňovaný manuál. Aplikace není pouze ETL nástrojem, ale slouží i k definici dimenzionálních kostek (viz následující kapitola) Vytvoření OLAP kostek Aplikace BeeTL slouží jako grafické rozhraní při psaní XML schématu dimenzionální kostky, se kterým pak následně pracuje OLAP aplikace beard. Vzhledem k chybějící nápovědě a manuálu je vytvoření kostky složité, pro vytvoření dimenzí jsem musel zasahovat přímo do XML schématu. Jedinou pomocí při vytváření schématu jsou vzorová data a schéma bee_demo. S pomocí vzoru se mi podařilo vytvořit datovou kostku za 4 hodiny, vytvoření dvou kostek pak trvalo celkem 6 hodin

72 Obr. č. 13: Schéma dimenzionální kostky v grafickém prostředí - BeeTL Obr. č. 14: Schéma definice dimenzionální kostky ve formátu XML - The Bee

73 Práce s BI řešením v uživatelském prostředí Jak již bylo zmíněno výhodou OpenSource řešení je využití webových serverů pro přístup ke kostkám. To má ale také za následek delší čas pro zprovoznění a odladění chyb. Instalace, zprovoznění a napojení prezentační vrstvy na OLAP kostku mi zabralo 15 hodin. Práce s kostkou je obdobná jako práce s kostkou ve formě tabulky v aplikaci MS Excel. The Bee ale poskytuje řadu dalších možností jako například podmíněné formátování tabulek a grafů podle vytvořené šablony, tvorbu mapových grafů pro Českou republiku, tvorbu prostorových 3D grafů, zasílání alertů podle připravených parametrů a řadu dalších. Jednou z výhod je možnost exportu dat podle vytvořených šablon do standardních formátů (csv, Excel, Word apod.). V neposlední řadě je výhodou přístupnost z téměř jakéhokoli zařízení připojeného k internetu. Obr. č. 15: Ukázka sestavování tabulky v aplikaci The Bee

74 Procházení již nadefinované tabulky je velice jednoduché. Pomocí pravého tlačítka myši můžeme vykonávat operace nad kostkou jako Drill-Down nebo Up, Slice&Dice. Obr. č. 16: Výsledná tabulka v aplikace The Bee

75 6.2.4 Vyhodnocení metrik Metrika Způsob řešení Faktory kvality celkové architektury Otevřenost 50 bodů Integrovatelnost 50 bodů Jednoduchost 50 bodů Faktor objemu financí Náklady na zakoupení SW licencí 0 Kč Faktor alokace pracovních kapacit Náklady na pracovní síly potřebné ke Kč (47 člověkohodin) zprovoznění BI řešení Faktor kvality technologické platformy Kvalita technologické platformy 75 bodů Počet známých implementací > 100 (z toho jen 5 významných) Faktory úspěšnosti řízení a řešení projektu Doba trvání projektu 1 měsíc Jednoduchost instalace 25 bodů Kvalita modelování DWH 0 bodů tvorby datové pumpy Kvalita ETL 0 bodů Faktor celkové úrovně provozu Použitelnost řešení Ano částečné Faktor výkonnosti řešení: Výkonnost datové pumpy -- Doba odezvy na stejný dotaz 5 min. Správnost výsledku Ano Faktor aktualizace DWH Možnost inkrementálního přidávání dat -- Faktor náročnosti na správu Náročnost na administraci 50 bodů Faktor podpory uživatelů Podpora uživatelů a administrátorů 60 bodů Faktor úrovně řízení kvality dat Řízení kvality dat -- Tabulka č. 13: Vyhodnocení OpenSource The Bee

76 6.3 Řešení prostřednictvím dílčích OpenSource aplikací Instalace operačního systému V kapitole popisuji instalaci operačního systému Linux, je obdobně náročná jako instalace systému Windows, tedy 2 hodiny práce Instalace aplikací BI řešení Instalace aplikací se skládá z dílčích kroků a z instalace aplikací třetích stran, které jednotlivé aplikace využívají. Jednotlivé nástroje jsou stavěny na jazyce Java. To umožňuje dělat robustní řešení, ale na druhou stranu toto řešení má větší nároky na hardware. ETL nástroj Keetle není třeba nějak instalovat, vyžaduje pouze Javu JRE. Pokud váš počítač toto splňuje můžete jej spustit dávkovým souborem určeným pro Linux, Windows nebo Mac. Instalace není třeba, nutné je pouze mít nainstalovanou JAVu a konektory k databázi, což zabere 3 hodiny. Analytická komponenta OLAP je napsána pro J2EE server, tudíž je ve formátu war. Instalace vyžaduje pouze zprovoznění JAVA serveru (Apache a Tomcat v tomto případě). Instalace serveru, který funguje i jako uživatelské rozhraní zabere 2 hodiny. Instalace OLAP aplikace a uživatelského rozhraní zabere další 2 hodiny. Nástroj určený pro vytvoření datového schématu je aplikace pro vývojáře Eclipse spolu se stanovenými plug-iny a plug-inem Mondrian. Tento plug-in usnadňuje vytvoření XML schématu definice dimenzionální kostky a nadefinování přístupových práv. Toto schéma, stejně jako tomu je u aplikace The Bee, je pak nutno načíst OLAP aplikací spolu s definicí datového skladu. Instalace vývojového prostředí Eclipse a plug-inu zabere 2 hodiny. Nejvíce času zabralo odladění funkčnosti OLAP aplikace samotné a také její propojení s uživatelským rozhraním, což trvalo 17 hodin. Tento problém řeší více lidí, což je patrné z fóra na internetových stránkách projektu (viz [SFnet])

77 6.3.3 Zprovoznění BI řešení Zprovoznění ETL a vytvoření datového skladu Nástroj Keetle je velice podobný nástroji Data Transformation Services. Stejně jako on podporuje řadu formátů souborů a databází. Ovládání je také velice podobné, jednotlivé kroky jsou tvořeny průvodci s možností náhledů vybraných a upravovaných dat a tabulek. Je zde možnost nadefinovat sekvenci jednotlivých kroků. Z následujícího obrázku je možné vidět podporované databáze a vytvoření jednotlivých transformačních kroků. Obr. č. 17: Schéma datového skladu vytvořeného pomocí datové pumpy - Keetle Jedná se o aplikaci napsanou v jazyce Java, tzn. její načítání a některé složitější kroky trvají déle než je tomu například u produktů Microsoft. To se odrazilo i na trvání datové pumpy. k aplikaci je rozsáhlá nápověda (145 stran) a několik ukázek práce ve flash animaci nebo pomocí obrazovek. Vytvoření datového skladu tímto způsobem zabere zhruba 8 hodin

78 Vytvoření OLAP kostek Vytvoření schématu OLAP kostky je v celku jednoduché. Jako pomůcku můžeme použít krátký návod a ukázku, která slouží jako demo pro aplikaci Mondrian. Je možno vytvářet kostky, virtuální kostky, sdílené dimenze mezi různými kostkami nebo přímo dimenze v kostce. Pomocí pravého tlačítka myši vždy vyberete zda chcete nového potomka (atribut nižší úrovně) nebo sourozence (atribut na stejné úrovni). Následně v okně Properties je nutno vyplnit údaje o daném atributu. Stejně jako je Eclipse podobný Visual Studio, je vytváření schématu podobné práce ve Visual Studiu. Je zřejmé, že některé aplikace OpenSource se inspirovaly nebo se snaží vzhledem, ovládáním a uživatelskou přívětivostí přiblížit komerčním nástrojům. Nadefinování dimezionální kostky za pomoci vzoru trvá zhruba 4 hodiny. Obr. č. 18: Schéma dimenzionální kostky v grafickém prostředí Mondrian + Eclipse

79 Práce s BI řešením v uživatelském prostředí Uživatelské prostředí je velice přívětivé. Dále jednoduše umožňuje společnosti upravit vzhled dle grafických standardů, které používá. Vše se nastavuje buď pomocí internetového formuláře nebo pomocí XML souboru, který obsahuje definici projektu. Tento způsob dále umožňuje práci s více různými projekty na jedné adrese. Grafické prostředí jde napojit jak na OLAP kostky vytvořené v Microsoft Analysis Services nebo Mondrian, tak i na datové sklady v serverových databázích (Firebird, MySQL) nebo na souborové databáze typu MS Access. Obr. č. 19: Úvodní obrazovka projekt Matastav v prostředí OpenI Samotná práce s v tomto prostředí je jednoduchá a v celku rychlá. Rychlost načítání stránek je v celku rychlé pokud bereme v úvahu, že vše je napsáno v jazyce Java, která má vyšší hardwarové nároky

80 6.3.4 Vyhodnocení metrik Metrika Způsob řešení Faktory kvality celkové architektury Otevřenost 75 bodů Integrovatelnost 80 bodů Jednoduchost 80 bodů Faktor objemu financí Náklady na zakoupení SW licencí 0 Kč Faktor alokace pracovních kapacit Náklady na pracovní síly potřebné ke zprovoznění BI řešení Kč (50 člověkohodin) Faktor kvality technologické platformy Kvalita technologické platformy 85 bodů Počet známých implementací > 1000 Faktory úspěšnosti řízení a řešení projektu Doba trvání projektu 1 měsíce Jednoduchost instalace 50 bodů Kvalita modelování DWH 75 bodů tvorby datové pumpy Kvalita ETL 75 bodů Faktor celkové úrovně provozu Použitelnost řešení Ano Faktor výkonnosti řešení: Výkonnost datové pumpy 1 min. Doba odezvy na stejný dotaz 5 min. Správnost výsledku Ano Faktor aktualizace DWH Možnost inkrementálního přidávání dat Ano Faktor náročnosti na správu Náročnost na administraci 75 bodů Faktor podpory uživatelů Podpora uživatelů a administrátorů 75 bodů Faktor úrovně řízení kvality dat Řízení kvality dat -- Tabulka č. 14: Vyhodnocení OpenSource Kertle, Mondrian, Openi

81 6.4 Shrnutí Z předcházejících podkapitol je zřejmé, že s určitými předpoklady a rezervami jsou použitelná všechna řešení. Jak komerční tak i OpenSource řešení mají své výhody a nevýhody. Společnost, která se rozhodne využívat BI řešení k podpoře rozhodování, tak musí zvážit jaké faktory jsou pro ni rozhodující Komerční řešení - nevýhody a výhody Komerční řešení má pouze jednu nevýhodu (závažný kritický faktor), jejím celková cena řešení. Celková cena včetně licence softwaru a nákladů na zprovoznění činí ,- Kč, což při 20 uživatelích činí ,50 Kč na jednoho uživatele. Pokud vezmeme v úvahu variantu firmy, která již využívá server a kancelářské aplikace Microsoft a která plánuje využít SQL server i na jiné účely, se celková cena sníží na ,50 Kč, což na jednoho uživatele činí 3784,- Kč. Na druhou stanu komerční řešení má řadu výhod mezi něž hlavně patří jednoduchost instalace a administrace, nejrůznější nástroje a vlastnosti a v neposlední řadě i rychlost instalace a zprovoznění. Řešení je možno zprovoznit v řádech dnů od obdržení licence, což může vyvážit vyšší cenu řešení OpenSource řešení nevýhody a výhody OpenSource řešení má více nevýhod než komerční řešení. Mezi ty nezávažnější patří složitost instalace, nevyhovující návody a pokyny a opravdu tím nejzávažnějším je čas potřebný na zprovoznění, který se pohybuje od týdnů až po měsíce u složitějších řešení. Značnou výhodou je porovnání ceny s komerčním řešením pro stejný počet uživatelů. Cena za licence je nulová a tudíž celková cena řešení je složena pouze ze mzdových nákladů pracovníků, kteří zprovozňují řešení. Celková cena se podle druhy řešení pohybuje od ,- do ,- Kč. To znamená, že cena na jednoho z dvaceti uživatelů vychází na 2000,- až 2500,- Kč, což je čtvrtinová cena

82 proti jednoúčelovému komerčnímu řešení a o 35 % nižší cena než u společnosti již plně využívající komerční řešení od společnosti Microsoft

83 6.5 Souhrnná přehledová tabulka všech řešení Metrika Komerční řešení OpenSource The Bee OpenSource - Mondrian Faktory kvality celkové architektury Otevřenost 100 bodů 50 bodů 75 bodů Integrovatelnost 100 bodů 50 bodů 80 bodů Jednoduchost 100 bodů 50 bodů 80 bodů Faktor objemu financí Náklady na zakoupení SW licencí Faktor alokace pracovních kapacit Náklady na pracovní síly potřebné ke zprovoznění BI řešení Faktor kvality technologické platformy a) Kč b) ,50 Kč Kč (8 člověkohodin) 0 Kč 0 Kč Kč (47 člověkohodin) Kvalita technologické platformy 100 bodů 75 bodů 85 bodů Počet známých implementací > 1000 > 100 (z toho jen 5 významných) > 1000 Faktory úspěšnosti řízení a řešení projektu Doba trvání projektu 2 dny 1 měsíc 1 měsíc Jednoduchost instalace 100 bodů 25 bodů 50 bodů Kvalita modelování DWH 100 bodů 0 bodů 75 bodů tvorby datové pumpy Kvalita ETL 100 bodů 0 bodů 75 bodů Kč (50 člověkohodin)

84 Faktor celkové úrovně provozu Použitelnost řešení Ano Ano částečné Ano Faktor výkonnosti řešení: Výkonnost datové pumpy 25 s -- 1 min. Doba odezvy na stejný dotaz 5 min. 5 min. 5 min. Správnost výsledku Ano Ano Ano Faktor aktualizace DWH Možnost inkrementálního přidávání dat Ano -- Ano Faktor náročnosti na správu Náročnost na administraci 100 bodů 50 bodů 75 bodů Faktor podpory uživatelů Podpora uživatelů a administrátorů 100 bodů 60 bodů 75 bodů Faktor úrovně řízení kvality dat Řízení kvality dat 100 bodů Tabulka č. 15: Srovnání jednotlivých řešení

85 7 ZÁVĚR 7.1 Shrnutí výsledků Během psaní této práce jsem se přesvědčil, že vývoj jak v oblasti komerčních BI nástrojů, tak i v oblasti OpenSource nástrojů jde velmi rychle. OpenSource softwary se postupně začínají přibližovat úrovni komerčního softwaru. Již dnes je ale zřejmé, že jej mohou za určitých podmínek nahradit. Náklady na jednoho uživatele totiž klesají rychleji než je tomu u komerčního softwaru, což může být pro firmy lákavé. 7.2 Zhodnocení splnění stanovených cílů V této práci se mi podařilo objektivně zhodnotit jednotlivé způsoby BI řešení. Upozornil jsem na zásadní rozdíly a veškeré potencionální problémy, které souvisí jak s komerčním, tak i s OpenSource řešením. V následující kapitole je uvedeno doporučení, které umožňuje vybrat si vhodnou variantu řešení BI. Hlavní cíl ověření možností OpenSource technologií a jejich srovnání s komerčním řešením definovaný v kapitole byl splněn v kapitole 4 a 6. Dále byly splněny následující dílčí cíle z kapitoly 1.2.2: - nalezení komplexního BI OpenSource řešení, kde byl nalezen jeden kompletní projekt a to The Bee (viz kapitola 4.3 a 6.2) a jeden projekt Pentaho, v který se po dobu práce začal přeměňovat projekt Mondrian; - nalezení dílčích součástí BI řešení, kde byly nalezeny nejlepší možné aplikace z jednotlivých BI komponent a aplikace Keetle, Mondrian a Openi (viz kapitola 4.4 a 6.3); - zprovoznění datového skladu a OpenSource BI aplikací, což se podařilo a výsledky z těchto aplikací jsou stejné jako z komerční aplikace (viz kapitola 6.4);

86 - ověření použitelnosti OpenSource v komerční sféře a při běžné práci, to se také potvrdilo (viz kapitola 6.) a část textu a obrázků vznikla v OpenSource aplikacích. 7.3 Přínos této práce V kapitole 2 jsem popsal základní komponenty BI. V následující kapitole 3 jsem na základě kritických faktorů BI projektu stanovil metriky pro srovnání jednotlivých řešení. Ve 4. kapitole jsem popsal jednotlivá řešení, a to komerční řešení, komplexní OpenSource řešení a OpenSource řešení pomocí dílčích aplikací. Na základě fiktivní firmy popsané v kapitole 5 jsem provedl srovnání jednotlivých řešení. Průběh srovnání a vyhodnocení metrik je popsáno v kapitole 6. Výhody a nevýhody jednotlivých řešení jsou specifikovány v podkapitole 6.4. Výsledky, které jsem zaznamenal mají významný dopad na budoucí rozhodování o budoucím řešení BI ve společnosti. Mým osobním přínosem je, že mohu upozornit, na to, že OpenSource řešení, byť je na první pohled zdarma, může být v konečném důsledku dražší než komerční řešení. A to v případě, že se společnosti, která již používá MS Server a kancelářské nástroje, nepodaří zprovoznit OpenSource řešení do 95 člověkohodin.což je možné jak mi potvrdili někteří zastánci OpenSource řešení. V tomto případě jsou náklady na zprovoznění ,- Kč, což je více než rozpočítané náklady na licenci a instalaci MS SQL Serveru (viz kapitola Komerční řešení nevýhody). Dalším osobním přínosem je následující doporučení, jak by měla společnost postupovat, pokud se rozhodne zavádět OpenSource BI řešení: ve svém okolí by měla zjistit jestli někdo již nepoužívá obdobné řešení, které si zamýšlí vybrat, a zjistit si úskalí při zprovozňování; měla by si najít doporučení k jednotlivým možným řešením; na zprovoznění by si měla najmout firmu nebo pracovníky, kteří mají zkušenosti se zprovozňováním OpenSource aplikací, toto jí může ušetřit spoustu času a s tím spojené finanční náklady;

87 měla by mít dostatek času na zprovoznění. Pokud některý z těchto kroků nemůže společnost zajistit, je ohrožena funkčnost a vnímání celého budoucího OpenSource BI řešení. Náklady by se pak mohli vyrovnat komerčnímu řešení. V tomto případě bych společnosti doporučoval využít komerčního řešení. Na druhou stranu pokud se společnosti podaří splnit tyto požadavky, může jí toto řešení přinést velké úspory do IS/ICT obzvláště když nepoužívá komerční nástroje. Z diplomové práce vyplývá, že ne vždy je OpenSource řešení pro společnost výhodnější než komerční, jak mylně někteří zastánci tohoto způsobu pořizování aplikací popisují managerům společností. 7.4 Další náměty pro řešení v uvedené oblasti Zajímavé by mohlo být porovnání nákladů komerčního a OpenSource řešení na jednoho uživatele a to s odstupňováním po deseti uživatelích až do počtu, kdy je výhodnější nákup procesorové licence MS SQL Serveru. V budoucnu by stálo za to podrobně se zabývat OpenSource řešením Pentaho, postaveném na ETL nástroji Keetle a OLAP nástroji Mondrian. Tento projekt má za cíl předčít nástroje Microsoft

88 8 PŘEHLED LITERATURY A POUŽITÝCH ZDROJŮ [AC06] Autocont Katalog prodkutů a služeb, Praha: Autocont, s., platí od [BEE] Insight Strategy, a. s. The BEE Project [online]. Brno: Insight Strategy, a. s Dostupné z WWW: [BI04] NOVOTNÝ, Ota, POUR, Jan, SLÁNSKÝ, David. Business Intelligence. 1. vyd. Praha: Grada Publishing, a. s., s. ISBN [CSSI] Terminologický slovník ČSSI, Česká společnost pro systémovou integraci, Dostupné z WWW: [GNU] Free Software Foundation, Inc. Český překlad Obecné veřejné licence GNU [online]. Cesnet.cz Dostupné z WWW: [LI04] Marcel Gagné. Přejděte na Linux: Dejte sbohem modré obrazovce! (Moving to Linux; Kiss the Blue Screen of Death Goodbye!), Praha: SoftPress s.r.o., s. ISBN [MI01] Pavel Učeň a kolektiv. Metriky v informatice. 1. vyd. Praha: Grada Publishing, a. s., s. ISB [Mond] Mondrian. Mondrian Architecture [online]. Mondrian Dostupné z WWW: [MSSQL]Microsoft. SQL Server 2005 Features Comparison [online]. Microsoft.com Dostupné z WWW: are-features.mspx. [Pent] Pentaho. Open source business intelligence [online]. Pentaho.org Dostupné z WWW:

89 [SFnet] SourceForge.net. OpenSource software development website [online]. SourceForge.net Dostupné z WWW: [WIKI] Wikipedia Otevřená encyklopedie [online]. Wikimedia Foundation, Inc, Dostupné z WWW:

90 9 TERMINOLOGICKÝ SLOVNÍK Termín Zdroj Význam Termíny přejaté z terminologického slovníku katedry informačních technologií Business intelligence (BI) je sada postupů, procesů a technologií, jejímž cílem je účinně a účelně podporovat rozhodovací procesy ve firmě. Představuje komplex Business Intelligence aplikací -> IS/ICT, které podporují CSSI (BI) analytické a plánovací činnosti podniků a organizací a jsou postaveny na specifických, tzv. -> OLAP (On-Line Analytical Processing) technologiích a jejich modifikacích. Computer Aided System Engineering) - komplex počítačových nástrojů pro podporu analýzy, návrhu a implementace informačních systémů a informačních a komunikačních technologií, ale i dalších činností, souvisejících s vývojem IS/ICT. CASE CSSI Nástroje typu CASE umožňují zachycení modelů zkoumaného světa ideálně na třech úrovních konceptuální, technologické a implementační. Dalšími výstupy CASE systémů jsou dokumentace IS/ICT a programové kódy a skripty pro definici obsahu datové základny. CRM CSSI Řízení vztahů se zákazníky (CRM) zahrnuje pracovníky, podnikové -> procesy a technologii -> IS/ICT s cílem maximalizovat loajalitu zákazníků a v důsledku toho i ziskovost podniku. Je součástí podnikové strategie a jako takové se stává součástí podnikové kultury. Technologicky stále více využívá potenciálu a možností -> Internetu. drill-down CSSI Drill-down a drill up jsou operace, které umožňují prohlížet hodnoty libovolného ukazatele detailněji, tzn. za nižší úrovně dimenzí nebo obecněji, tzn. za vyšší úrovně dimenzí. Drill-down je přechod na nižší úroveň

91 Termín Zdroj Význam drill-up CSSI Drill-down a drill up jsou operace, které umožňují prohlížet hodnoty libovolného ukazatele detailněji, tzn. za nižší úrovně dimenzí nebo obecněji, tzn. za vyšší úrovně dimenzí. Drill-up je přechod na vyšší úrovně. EAI CSSI EAI je metodický přístup a sada technologických nástrojů pro integraci podnikových procesů. Zajišťuje vzájemnou spolupráci mezi různými aplikacemi informačního systému a pomáhá organizaci reagovat rychle na změny podmínek trhu. EIS CSSI EIS, resp. manažerské aplikace jsou součástí aplikací -> business intelligence. Jsou to aplikace -> IS/ICT, které v sobě integrují všechny nejdůležitější datové zdroje systému, významné pro řízení organizace jako celku. s tím jsou spojeny i specifické nároky na presentace informací a jejich zpřístupnění vedoucím pracovníkům firmy. EIS je především analytický a presentační nástroj založený na využití již existujících dat. ERP CSSI ERP je charakterizován jako typ aplikace, resp. -> aplikačního software v -> informačním systému, který umožňuje řízení a koordinaci všech disponibilních podnikových zdrojů a aktivit s cílem zajištění potřeb trhu i vlastního podniku. ETL jsou nástroje, které umožňují propojit různé databáze a přenášet data mezi těmito databázemi. Přitom se provádějí operace jako jsou transformace datových typů Extraction Transformation a formátů, oprava dat, výpočet agregací, Loading CSSI doplňování primárních klíčů, atd. Tyto (ETL) nástroje umožňují vytvořit datové pumpy (data stages) tzn. definovat zdrojové databáze, cílové databáze a nastavit transformační proces. http CSSI Protokol pro přenos dokumentů v Internetu (používá se nejčastěji na WWW)

92 Termín Zdroj Význam Metrika ODBC (Open Database Connectivity) OLAP slice and dice Snowflake schéma CSSI CSSI CSSI CSSI CSSI Metrika IS/ICT je přesně vymezený ukazatel nebo hodnotící kriterium, který je používán k hodnocení úrovně efektivnosti či jakosti konkrétní oblasti IS/ICT k hodnocení podnikového výkonu nebo k hodnocení úrovně podpory podnikového procesu prostředky IS/ICT. Přesným vymezením metriky IS/ICT se rozumí definovaný postup, který se použije pro získání hodnoty metriky (metoda měření) a definice způsobu, jakým budou získané hodnoty mezi sebou porovnávány (měřící stupnice). Skupinu metrik sdružených za určitým cílem (tzn. vztahujících se ke konkrétním oblasti, procesu či projektu) nazýváme portfolio metrik. Standard datového rozhraní databází. OLAP (On-Line Analytical Processing) je informační technologie založená především na koncepci multidimenzionálních databází. OLAP je základní technologie, na níž jsou založeny aplikace -> business intelligence. Jejím hlavním principem je několikadimenzionální tabulka umožňující rychle a pružně měnit jednotlivé dimenze a měnit tak pohledy uživatele na modelovanou ekonomickou realitu. Operace slice&dice umožňuje kombinovat různé dimenze a ukazatele Sněhová vločka (Snowflake) je typ dimenzionálního modelu tvořeného více normalizovanými a nenormalizovanými tabulkami dimenzí. Normalizovaná tabulka popisuje pouze jednu reálnou entitu. Normalizované jsou například tabulky SORTIMENTNÍ POLOŽKA, SORTIMENTNÍ SKUPINA, DODAVATEL, které popisují entity sortimentní položka, sortimentní skupina a dodavatel. Tyto tabulky mohou tvořit dimenze pojmenované jako dodavatelé a sortiment. Pokud dimenzionální model obsahuje jak normalizované tak i nenormalizované tabulky, potom je typem sněhová vločka

93 Termín Zdroj Význam SQL CSSI Nejrozšířenější databázový jazyk umožňující uživateli IS komunikovat s databázovým systémem (viz databáze). Tento jazyk byl původně vyvinut pro práci s daty ukládanými v relačních databázích, ale je používán i v databázích objektověrelačních. Jazyk umožňuje zejména definovat datové struktury, manipulovat s daty (operace Insert, Update, Delete, Select) a řídit přístup k datům. V současné době je do jazyka SQL zakomponována celá řada rozšíření směřujících k zajištění výpočetní úplnosti jazyka a implementujících objektová rozšíření. Jazyk je standardizován institucemi ANSI a ISO, v jednotlivých databázích je však naimplementován s různými dialekty. Star schéma CSSI Hvězda (Star) je typ dimenzionálního modelu tvořeného pouze nenormalizovanými tabulkami dimenzí. Nenormalizovaná tabulka popisuje více reálných entit. Například tabulka SORTIMENT, obsahující atributy název sortimentní položky, název sortimentní skupiny, název dodavatele, popisuje entity sortimentní položka, sortimentní skupina, dodavatel. Nad touto tabulkou je možné vytvořit dvě dimenze pojmenované jako dodavatelé a sortiment. XML schéma CSSI Překonává problémy hlavní problémy DTD. Používá se v architektuře webových služeb. Jeho nevýhodu je snad až velká složitost a poněkud nesystémové řešení datových typů. Další termíny dashboard Přehledová úvodní obrazovka s uživatelsky nadefinovanými daty. Data Mining BI04 Dolování dat. Proces objevování znalostí pomocí získávání dříve neznámých akčních informací z velmi rozsáhlých databází. Integrovaný, subjektově orientovaný, stálý Data Warehouse BI04 a časově rozlišený souhrn dat, uspořádaný (DWH) pro podporu potřeb managementu

94 Termín Zdroj Význam Debian WIKI Debian GNU/Linux je distribuce GNU/Linuxu, kterou nevyvíjí komerční subjekt, ale je vyvíjena velkým množstvím dobrovolníků z celého světa. Dimenzionální analýza BI04 Proces, při kterém se vymezí plánovací a analytické ukazatele, dimenze a jejich vzájemné vazby. DOLAP (Desktop OLAP) BI04 Přístup k centrální OLAP z pracovní stanice a stažení kostky nebo její části k offline používání. GNU/GPL WIKI GNU GPL (česky všeobecná veřejná licence GNU ) je licence pro svobodný software, která spolu s licencí GFDL tvoří základ celého projektu GNU. HOLAP (Hybrid OLAP) BI04 Detailní data jsou uložena v relační databázi a agregované hodnoty jsou uloženy v binárních kostkách. Inkrementální neboli přírůstkový způsob Inkrementální přidávání dat BI04 přidávání dat. Založeno je na identifikaci jednotlivých projektů (přírůstků) a jejich návazností. JAVA WIKI Programovací jazyk Java je objektově orientovaný programovací jazyk. KDE WIKI K Desktop Environment je grafické uživatelské rozhraní (GUI) pro Linux a další unixové operační systémy. První verze KDE byla vytvořena roku KDE je velice oblíbené a je zastoupené téměř v každé linuxové distribuci. Snaží se napodobit vzhled Windows při zachování originality. Linux WIKI Je známým příkladem svobodného softwaru a OpenSource vývoje: narozdíl od proprietárních operačních systémů jako Windows či Mac OS je celý jeho zdrojový kód volně k dispozici pro veřejnost a kdokoli jej může svobodně používat, upravovat a dále distribuovat. MDX (Multidimensional Dotazovací jazyk multidimenzionálních BI04 Expressions) kostek. Speciální uložení dat MOLAP (Multidimensional BI04 v multidimenzionálních-binárních OLAP) kostkách. OLTP (On Line Transaction Processing) BI04 Transakční systémy realizující zpracování dat v reálném čase

95 Termín Zdroj Význam OpenSource WIKI OpenSource nebo také open-source software (OSS) je počítačový software s otevřeným zdrojovým kódem. Otevřenost zde znamená jak technickou dostupnost kódu, tak legální dostupnost - licenci software, která umožňuje uživatelům zdrojový kód využívat, například prohlížet a upravovat. Perl WIKI Perl je interpretovaný programovací jazyk vytvořený Larry Wallem v roce s rozvojem internetu se Perl stal velmi populárním nástrojem pro tvorbu CGI skriptů. Reporting BI04 Dotazování do databází pomocí standardních rozhraní databází. ROLAP (Relational OLAP) BI04 Multidemezionalita řešená uložením dat v relační databázi

96 10 PŘÍLOHY 10.1 Příloha č. 1 Výňatek z katalogu produktů a služeb Autocont (zdroj viz [AC06])

97 10.2 Příloha č. 2 Architektura řešení Mondrian (zdroj viz [Mond])

MIS. Manažerský informační systém. pro. Ekonomický informační systém EIS JASU CS. Dodavatel: MÚZO Praha s.r.o. Politických vězňů 15 110 00 Praha 1

MIS. Manažerský informační systém. pro. Ekonomický informační systém EIS JASU CS. Dodavatel: MÚZO Praha s.r.o. Politických vězňů 15 110 00 Praha 1 MIS Manažerský informační systém pro Ekonomický informační systém EIS JASU CS Dodavatel: MÚZO Praha s.r.o. Politických vězňů 15 110 00 Praha 1 Poslední aktualizace dne 5.8.2014 MÚZO Praha s.r.o. je certifikováno

Více

Základy business intelligence. Jaroslav Šmarda

Základy business intelligence. Jaroslav Šmarda Základy business intelligence Jaroslav Šmarda Základy business intelligence Business intelligence Datový sklad On-line Analytical Processing (OLAP) Kontingenční tabulky v MS Excelu jako příklad OLAP Dolování

Více

Infor Performance management. Jakub Urbášek

Infor Performance management. Jakub Urbášek Infor Performance management Jakub Urbášek Agenda prezentace Stručně o produktu Infor PM 10 Komponenty Infor PM - PM OLAP a PM Office Plus Reporting Analýza Plánování / operativní plánování Infor Performance

Více

Business Intelligence

Business Intelligence Business Intelligence Skorkovský KAMI, ESF MU Principy BI zpracování velkých objemů dat tak, aby výsledek této akce manažerům pomohl k rozhodování při řízení procesů výsledkem zpracování musí být relevantní

Více

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9 Obsah Úvod 9 Kapitola 1 Business Intelligence, datové sklady 11 Přechod od transakčních databází k analytickým..................... 13 Kvalita údajů pro analýzy................................................

Více

Business Intelligence

Business Intelligence Business Intelligence Josef Mlnařík ISSS Hradec Králové 7.4.2008 Obsah Co je Oracle Business Intelligence? Definice, Od dat k informacím, Nástroj pro operativní řízení, Integrace informací, Jednotná platforma

Více

Informační systémy 2006/2007

Informační systémy 2006/2007 13 Vysoká škola báňská Technická univerzita Ostrava Fakulta strojní, Katedra automatizační techniky a řízení Informační systémy 2006/2007 Ivan Kedroň 1 Obsah Analytické nástroje SQL serveru. OLAP analýza

Více

AdventureWorksDW2014 SQL Server Data Tools Multidimenziona lnı model Tabula rnı model Multidimenziona lnı mo d Tabula rnı mo d MS SQL Server 2016 Tabula rnı mo d Azure Analysis Services 16 3.2 Dimenzionální

Více

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1 Metodický list č. 1 Cíl: Cílem předmětu je získat přehled o možnostech a principech databázového zpracování, získat v tomto směru znalosti potřebné pro informačního manažera. Databázové systémy, databázové

Více

Podnikové informační systémy Jan Smolík

Podnikové informační systémy Jan Smolík Podnikové informační systémy Jan Smolík Zobecněné schéma aplikační architektury Vlastníci, management Aplikační architektura podnikové informatiky Business Intelligence, manažerské aplikace Obchodní partneři

Více

3 zdroje dat. Relační databáze EIS OLAP

3 zdroje dat. Relační databáze EIS OLAP Zdroje dat 3 zdroje dat Relační databáze EIS OLAP Relační databáze plochá dvourozměrná tabulková data OLTP (Online Transaction Processing) operace selekce projekce spojení průnik, sjednocení, rozdíl dotazování

Více

Datové sklady. Ing. Jan Přichystal, Ph.D. 1. listopadu 2011. PEF MZLU v Brně

Datové sklady. Ing. Jan Přichystal, Ph.D. 1. listopadu 2011. PEF MZLU v Brně PEF MZLU v Brně 1. listopadu 2011 Úvod Intenzivní nasazení informačních technologií způsobuje hromadění obrovské spousty nejrůznějších údajů. Příkladem mohou být informace z obchodování s cennými papíry

Více

10. Datové sklady (Data Warehouses) Datový sklad

10. Datové sklady (Data Warehouses) Datový sklad 10. Datové sklady (Data Warehouses) Datový sklad komplexní data uložená ve struktuře, která umožňuje efektivní analýzu a dotazování data čerpána z primárních informačních systémů a dalších zdrojů OLAP

Více

Marketingová komunikace. 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3bph)

Marketingová komunikace. 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3bph) Marketingová komunikace Kombinované studium Skupina N9KMK3PH (vm3bph) 3. soustředění Mgr. Pavel Vávra 9103@mail.vsfs.cz http://vavra.webzdarma.cz/home/index.htm Zdroje Studijní materiály Heleny Palovské

Více

ARCHITEKTURA INFORMAČNÍCH SYSTÉMŮ PODLE ÚROVNĚ ŘÍZENÍ

ARCHITEKTURA INFORMAČNÍCH SYSTÉMŮ PODLE ÚROVNĚ ŘÍZENÍ ARCHITEKTURA INFORMAČNÍCH SYSTÉMŮ PODLE ÚROVNĚ ŘÍZENÍ Podle toho, zda informační systém funguje na operativní, taktické nebo strategické řídicí úrovni, můžeme systémy rozdělit do skupin. Tuto pyramidu

Více

Projekt informačního systému pro Eklektik PRO S EK. Řešitel: Karolína Kučerová

Projekt informačního systému pro Eklektik PRO S EK. Řešitel: Karolína Kučerová Projekt informačního systému pro Eklektik PRO S EK Řešitel: ÚVODNÍ ZPRÁVA ZADÁNÍ PROJEKTU Zefektivnění komunikace ve firmě Eklektik, a to především v oblasti informací o klientech a o tištěných materiálech

Více

PŘÍLOHA C Požadavky na Dokumentaci

PŘÍLOHA C Požadavky na Dokumentaci PŘÍLOHA C Požadavky na Dokumentaci Příloha C Požadavky na Dokumentaci Stránka 1 z 5 1. Obecné požadavky Dodavatel dokumentaci zpracuje a bude dokumentaci v celém rozsahu průběžně aktualizovat při každé

Více

KATALOG SLUŽEB NÁSLEDNÉ PODPORY

KATALOG SLUŽEB NÁSLEDNÉ PODPORY KATALOG SLUŽEB NÁSLEDNÉ PODPORY Společnost WEBCOM a. s. Vám nabízí kompletní pokrytí Vašich požadavků na zajištění služeb technické podpory Microsoft Dynamics přesně podle Vašich potřeb a v požadovaném

Více

Snadný a efektivní přístup k informacím

Snadný a efektivní přístup k informacím Snadný a efektivní přístup k informacím 12. 4. 2010 Hradec Králové Petr Mlejnský Siemens Protection IT Solutions and Services, notice s.r.o.2010. / Copyright All rights notice reserved. Agenda Přístup

Více

Specifikace předmětu plnění Datová tržiště

Specifikace předmětu plnění Datová tržiště Příloha 1 Specifikace předmětu plnění Datová tržiště Etapa 1 Analýza statistické domény produkčních statistik 1 Obsah ETAPA 1 ANALÝZA STATISTICKÉ DOMÉNY PRODUKČNÍCH STATISTIK... 3 1.1. Koncepční shrnutí...

Více

Wonderware Information Server 4.0 Co je nového

Wonderware Information Server 4.0 Co je nového Wonderware Information Server 4.0 Co je nového Pavel Průša Pantek (CS) s.r.o. Strana 2 Úvod Wonderware Information Server je výrobní analytický a reportní informační portál pro publikaci výrobních dat

Více

Business Intelligence. Adam Trčka

Business Intelligence. Adam Trčka Business Intelligence Adam Trčka 09:00 11:30: BI v kostce Navrhněme si sklad Ukázka BI Datamining 12:30 14:30: Pokračování kurzu 14:30 15:00: Q&A Agenda Co se dnes dovíme? Data informace znalost Business

Více

Multidimenzionální pohled na zdravotnické prostředí. INMED Petr Tůma

Multidimenzionální pohled na zdravotnické prostředí. INMED Petr Tůma Multidimenzionální pohled na zdravotnické prostředí INMED - 21.11.2003 Petr Tůma Koncepce multid pohledu Poskytování péče probíhá v multidimenzionálním světě; dimenze tento svět mapují podobně jako souřadnice

Více

GIS Libereckého kraje

GIS Libereckého kraje Funkční rámec Zpracoval: Odbor informatiky květen 2004 Obsah 1. ÚVOD...3 1.1. Vztah GIS a IS... 3 2. ANALÝZA SOUČASNÉHO STAVU...3 2.1. Technické zázemí... 3 2.2. Personální zázemí... 3 2.3. Datová základna...

Více

Business Intelligence nástroje a plánování

Business Intelligence nástroje a plánování Business Intelligence nástroje a plánování pro snadné reportování a vizualizaci Petr Mlejnský Business Intelligence pro reporting, analýzy a vizualizaci Business Intelligence eporting Dashboardy a vizualizace

Více

Obsah. Zpracoval:

Obsah. Zpracoval: Zpracoval: houzvjir@fel.cvut.cz 03. Modelem řízený vývoj. Doménový (business), konceptuální (analytický) a logický (návrhový) model. Vize projektu. (A7B36SIN) Obsah Modelem řízený vývoj... 2 Cíl MDD, proč

Více

Databáze Bc. Veronika Tomsová

Databáze Bc. Veronika Tomsová Databáze Bc. Veronika Tomsová Databázové schéma Mapování konceptuálního modelu do (relačního) databázového schématu. 2/21 Fyzické ik schéma databáze Určuje č jakým způsobem ů jsou data v databázi ukládána

Více

Základní informace o co se jedná a k čemu to slouží

Základní informace o co se jedná a k čemu to slouží Základní informace o co se jedná a k čemu to slouží založené na relačních databází transakční systémy, které jsou určeny pro pořizování a ukládání dat v reálném čase (ERP, účetní, ekonomické a další podnikové

Více

Úvodní přednáška. Význam a historie PIS

Úvodní přednáška. Význam a historie PIS Úvodní přednáška Význam a historie PIS Systémy na podporu rozhodování Manažerský informační systém Manažerské rozhodování Srovnávání, vyhodnocování, kontrola INFORMACE ROZHODOVÁNÍ organizace Rozhodovacích

Více

3. Očekávání a efektivnost aplikací

3. Očekávání a efektivnost aplikací VYUŽÍVANÍ INFORMAČNÍCH SYSTÉMŮ V ŘÍZENÍ FIREM Ota Formánek 1 1. Úvod Informační systémy (IS) jsou v současnosti naprosto nezbytné pro úspěšné řízení firem. Informačním ním systémem rozumíme ucelené softwarové

Více

MBI - technologická realizace modelu

MBI - technologická realizace modelu MBI - technologická realizace modelu 22.1.2015 MBI, Management byznys informatiky Snímek 1 Agenda Technická realizace portálu MBI. Cíle a principy technického řešení. 1.Obsah portálu - objekty v hierarchiích,

Více

Datová věda (Data Science) akademický navazující magisterský program

Datová věda (Data Science) akademický navazující magisterský program Datová věda () akademický navazující magisterský program Reaguje na potřebu, kterou vyvolala rychle rostoucí produkce komplexních, obvykle rozsáhlých dat ve vědě, v průmyslu a obecně v hospodářských činnostech.

Více

Cíle a architektura modelu MBI

Cíle a architektura modelu MBI MBI, Management byznys informatiky Cíle a architektura modelu MBI Jiří Voříšek Katedra IT, FIS, VŠE MBI, Management byznys informatiky Snímek 1 Agenda 1. Aktuální výzvy podnikové informatiky 2. Využívané

Více

Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph)

Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph) Marketingová komunikace Kombinované studium Skupina N9KMK3PH (vm3aph) 2. a 3. soustředění Mgr. Pavel Vávra 9103@mail.vsfs.cz http://vavra.webzdarma.cz/home/index.htm Co nás čeká: 2. soustředění 16.1.2009

Více

Tovek Server. Tovek Server nabízí následující základní a servisní funkce: Bezpečnost Statistiky Locale

Tovek Server. Tovek Server nabízí následující základní a servisní funkce: Bezpečnost Statistiky Locale je serverová aplikace určená pro efektivní zpracování velkého objemu sdílených nestrukturovaných dat. Umožňuje automaticky indexovat data z různých informačních zdrojů, intuitivně vyhledávat informace,

Více

Manažerský informační systém na MPSV. Mgr. Karel Lux, vedoucí oddělení koncepce informatiky MPSV

Manažerský informační systém na MPSV. Mgr. Karel Lux, vedoucí oddělení koncepce informatiky MPSV Manažerský informační systém na MPSV Mgr. Karel Lux, vedoucí oddělení koncepce informatiky MPSV Konference ISSS-2009 Hradec Králové Aldis 6. dubna 2009 MIS na MPSV časové údaje projektu Vytvoření MIS MPSV

Více

Hospodářská informatika

Hospodářská informatika Hospodářská informatika HINFL, HINFK Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na disciplíny společného základu reg.

Více

Nová dimenze rozhodovacího procesu

Nová dimenze rozhodovacího procesu Nová dimenze rozhodovacího procesu Marek Matoušek Pavel Mašek Data, nebo INFORMACE Využití dostupných firemních dat Několik systémů, mnoho různých dat Různé divize, různé potřeby Potřeba integrace dat

Více

Ing. Pavel Rosenlacher

Ing. Pavel Rosenlacher Marketing v sociálních sítích Webová analytika Ing. Pavel Rosenlacher pavel.rosenlacher@vsfs.cz Krátké shrnutí SEO spočívá v lepším zobrazování stránek ve výsledcích vyhledávání na vyhledávačích Souhrnně

Více

PŘÍLOHA Č. 4 K ZADÁVACÍ DOKUMENTACI VEŘEJNÉ ZAKÁZKY MALÉHO ROZSAHU. Tvorba software pro reportování stavu projektů (dále jen IS)

PŘÍLOHA Č. 4 K ZADÁVACÍ DOKUMENTACI VEŘEJNÉ ZAKÁZKY MALÉHO ROZSAHU. Tvorba software pro reportování stavu projektů (dále jen IS) PŘÍLOHA Č. 4 K ZADÁVACÍ DOKUMENTACI VEŘEJNÉ ZAKÁZKY MALÉHO ROZSAHU Tvorba software pro reportování stavu projektů (dále jen IS) VERZE: finální DATUM: 6.9. 2013 1 ÚVOD Popis reportů potřebných pro sledování

Více

4IT218 Databáze. 4IT218 Databáze

4IT218 Databáze. 4IT218 Databáze 4IT218 Databáze Osmá přednáška Dušan Chlapek (katedra informačních technologií, VŠE Praha) 4IT218 Databáze Osmá přednáška Normalizace dat - dokončení Transakce v databázovém zpracování Program přednášek

Více

Studie webů automobilek

Studie webů automobilek Studie webů automobilek červen 2006 [manažerské shrnutí] Obsah Obsah... 1 Manažerské shrnutí... 2 Kvalita obsahu a použitelnost webu... 3 Základní nedostatky negativně ovlivňují použitelnost většiny webů...

Více

SW pro správu a řízení bezpečnosti

SW pro správu a řízení bezpečnosti Integrační bezpečnostní SW pro správu a řízení bezpečnosti Systém je vlastním produktem společnosti Integoo. Trvalý vývoj produktu reflektuje požadavky trhu a zákazníků. Ať už je velikost vaší organizace

Více

Jednotný NIS Prezentace k zahájení projektu pro Radu kraje Vysočina. Projektový manažer - Ing. Ivan Sokolov, Ph.D.

Jednotný NIS Prezentace k zahájení projektu pro Radu kraje Vysočina. Projektový manažer - Ing. Ivan Sokolov, Ph.D. Prezentace k zahájení projektu pro Radu kraje Vysočina Projektový manažer - Ing. Ivan Sokolov, Ph.D. Obsah Úvod Cíle projektu Rozsah projektu Projektové řízení základní východiska Základní organizační

Více

Reportingová platforma v České spořitelně

Reportingová platforma v České spořitelně Reportingová platforma v České spořitelně Agenda Implementované prostředí Cognos 8 v ČS Marek Varga, Česká spořitelna, a.s. Využití platformy Cognos z pohledu businessu Petr Kozák, Česká spořitelna, a.s.

Více

Microsoft SharePoint Portal Server 2003. Zvýšená týmová produktivita a úspora času při správě dokumentů ve společnosti Makro Cash & Carry ČR

Microsoft SharePoint Portal Server 2003. Zvýšená týmová produktivita a úspora času při správě dokumentů ve společnosti Makro Cash & Carry ČR Microsoft SharePoint Portal Server 2003 Zvýšená týmová produktivita a úspora času při správě dokumentů ve společnosti Makro Cash & Carry ČR Přehled Země: Česká republika Odvětví: Velkoobchod Profil zákazníka

Více

Řízení prací na vodovodních sítích

Řízení prací na vodovodních sítích Řízení prací na vodovodních sítích Ing. Josef Fojtů 1) Ing. Jiří Tajdus 1), Ing. Milan Koníř 2) 1) QLine a.s., 2) Severomoravské vodovody a kanalizace Ostrava a.s. Cílem příspěvku je představení základních

Více

Databázové systémy. 10. přednáška

Databázové systémy. 10. přednáška Databázové systémy 10. přednáška Business Intelligence Poprvé byl termín BI použit Gartnerem a dále pak popularizován Howardem Dresnerem jako: proces zkoumání doménově strukturovaných informací za účelem

Více

RDF DSPS ROZVOJ PORTÁLU

RDF DSPS ROZVOJ PORTÁLU RDF DSPS ROZVOJ PORTÁLU ČEZ Distribuce, a.s. HSI, spol. s r.o. Zbyněk Businský Miroslav Kaňka ZÁKAZNÍK A DODAVATEL ČEZ DISTRIBUCE, A.S. ČEZ distribuční síť Od r. 2012 implementován GEOPORTÁL (1. ETAPA),

Více

1 Popis předmětu plnění projektu implementace MIS

1 Popis předmětu plnění projektu implementace MIS 1 Popis předmětu plnění projektu implementace MIS Vytvořit Manažerský rozpočet Tzn. vytvoření metodiky pro zajištění Manažerského účetnictví, přičemž metodikou se rozumí soubor postupů a pravidel popisujících

Více

Architektury Informačních systémů. Jaroslav Žáček jaroslav.zacek@osu.cz http://www1.osu.cz/~zacek/

Architektury Informačních systémů. Jaroslav Žáček jaroslav.zacek@osu.cz http://www1.osu.cz/~zacek/ Architektury Informačních systémů Jaroslav Žáček jaroslav.zacek@osu.cz http://www1.osu.cz/~zacek/ Nutné pojmy Co je to informační systém? Jaké oblasti zahrnuje? Jaká je vazba IS na podnikovou strategii?

Více

komplexní podpora zvyšování výkonnosti strana 1 Využití Referenčního modelu integrovaného systému řízení veřejnoprávní korporace Město Hořovice

komplexní podpora zvyšování výkonnosti strana 1 Využití Referenčního modelu integrovaného systému řízení veřejnoprávní korporace Město Hořovice strana 1 Využití Referenčního modelu integrovaného systému řízení veřejnoprávní korporace Město Hořovice 19.3.2018 Zpracoval: Roman Fišer, strana 2 1. ÚVOD... 3 2. POPIS REFERENČNÍHO MODELU INTEGROVANÉHO

Více

Formy komunikace s knihovnami

Formy komunikace s knihovnami Formy komunikace s knihovnami Současné moderní prostředky Jiří Šilha a Jiří Tobiáš, Tritius Solutions a.s., Brno Osnova Základní požadavky na komunikaci s knihovnami Historie komunikace s knihovnami Confluence

Více

Bu B sin i e n s e s s I n I te t l e lig i en e c n e c Skorkovský KA K M A I, E S E F MU

Bu B sin i e n s e s s I n I te t l e lig i en e c n e c Skorkovský KA K M A I, E S E F MU Business Intelligence Skorkovský KAMI, ESF MU Principy BI zpracování velkých objemů dat tak, aby výsledek této akce manažerům pomohl k rozhodování při řízení procesů výsledkem zpracování musí být relevantní

Více

vlastnosti Výsledkem sledování je: a) Využití aplikací b) Používání internetu c) Vytížení počítačů d) Operační systém e) Sledování tisků

vlastnosti Výsledkem sledování je: a) Využití aplikací b) Používání internetu c) Vytížení počítačů d) Operační systém e) Sledování tisků Program Aktivity propojuje prvky softwarového a personálního auditu, které jsou zaměřeny na optimalizaci firemních nákladů. Slouží ke zjištění efektivity využívání softwarového a hardwarového vybavení

Více

T T. Think Together 2012. Martin Závodný THINK TOGETHER. Business Intelligence systémy Business Intelligence systems

T T. Think Together 2012. Martin Závodný THINK TOGETHER. Business Intelligence systémy Business Intelligence systems Česká zemědělská univerzita v Praze Provozně ekonomická fakulta Doktorská vědecká konference 6. února 2012 T T THINK TOGETHER Think Together 2012 Business Intelligence systémy Business Intelligence systems

Více

Ing. Roman Danel, Ph.D. 2010

Ing. Roman Danel, Ph.D. 2010 Datový sklad Ing. Roman Danel, Ph.D. 2010 Co je to datový sklad a kdy se používá? Pojmem datový sklad (anglicky Data Warehouse) označujeme zvláštní typ databáze, určený primárně pro analýzy dat v rámci

Více

Datová kvalita základ úspěšného BI. RNDr. Ondřej Zýka, Profinit

Datová kvalita základ úspěšného BI. RNDr. Ondřej Zýka, Profinit Datová kvalita základ úspěšného BI RNDr. Ondřej Zýka, Profinit 1.6.2012 Datová exploze Snižování nákladů o Zdvojnásobení objemu podnikových dat každé dva roky o Konkurenční tlak o Ekonomická krize o V

Více

Příloha 1 Specifikace předmětu plnění

Příloha 1 Specifikace předmětu plnění Příloha 1 Specifikace předmětu plnění Centrální zpracování Etapa V Tvorba kontrolních výstupů 1 Obsah ETAPA V - TVORBA KONTROLNÍCH VÝSTUPŮ PRO VPO... 3 1.1. Koncepční shrnutí... 3 1.2. Obsahová náplň etapy

Více

Možnosti reportingu v produktech řady EPM

Možnosti reportingu v produktech řady EPM Možnosti reportingu v produktech řady EPM Martin Répal Senior konzultant/manager EPM MCITP, MCP, MOS, MCTS, vtsp, Prince II martin.repal@autocont.cz 1 Jak je to s reportingem? Má SW produkt reporty? Tak

Více

1 Úvod 1.1 Vlastnosti programového vybavení (SW)

1 Úvod 1.1 Vlastnosti programového vybavení (SW) 1 Úvod 1.1 Vlastnosti programového vybavení (SW) - dávkové zpracování - omezená distribuce - zakázkový SW - distribuované systémy - vestavěná inteligence - laciný HW - vliv zákazníka 1950 1960 1970 1980

Více

Wonderware Historian 10.0

Wonderware Historian 10.0 Wonderware Historian 10.0 Příklady vícevrstvých architektur Jiří Nikl Pantek (CS) s.r.o. Strana 2 Wonderware Historian 10.0 využití vícevrstvé architektury Nová verze historizační databáze Wonderware Historian

Více

Charta projektu úplné znění pro MŠMT a jeho příspěvkové organizace a Českou školní inspekci

Charta projektu úplné znění pro MŠMT a jeho příspěvkové organizace a Českou školní inspekci Charta projektu úplné znění pro MŠMT a jeho příspěvkové organizace a Českou školní inspekci 1 Obsah Manažerské Shrnutí... 3 Definice projektu rámcová část... 3 Stručný kontext realizace projektu... 3 Cíle

Více

Aplikace modelu CAF 2006 za podpory procesního řízení. Ing. Vlastimil Pecka Ing. Zdeněk Havelka, PhD.

Aplikace modelu CAF 2006 za podpory procesního řízení. Ing. Vlastimil Pecka Ing. Zdeněk Havelka, PhD. Aplikace modelu CAF 2006 za podpory procesního řízení Ing. Vlastimil Pecka Ing. Zdeněk Havelka, PhD. Cíle prezentace 1. Přiblížit důvody zavádění modelu CAF 2009 za podpory procesního řízení. 2. Shrnutí

Více

POŘÍZENÍ A IMPLEMENTACE INFORMAČNÍCH SYSTÉMŮ

POŘÍZENÍ A IMPLEMENTACE INFORMAČNÍCH SYSTÉMŮ POŘÍZENÍ A IMPLEMENTACE INFORMAČNÍCH SYSTÉMŮ ŽIVOTNÍ CYKLUS IS Stejně jako stroje a technologické linky, které jsou pořízeny, provozovány a následně, po opotřebování vyřazeny, má i informační systém svůj

Více

Informační systém pro centrální správu lokální sítě a služeb ISP

Informační systém pro centrální správu lokální sítě a služeb ISP MASARYKOVA UNIVERZITA Fakulta informatiky PV098 Řízení implementace IS semestrální práce Informační systém pro centrální správu lokální sítě a služeb ISP Jiří Kratochvíla, učo 207622, semestr 6, ročník

Více

2015 GEOVAP, spol. s r. o. Všechna práva vyhrazena.

2015 GEOVAP, spol. s r. o. Všechna práva vyhrazena. 2015 GEOVAP, spol. s r. o. Všechna práva vyhrazena. GEOVAP, spol. s r. o. Čechovo nábřeží 1790 530 03 Pardubice Česká republika +420 466 024 618 http://www.geovap.cz V dokumentu použité názvy programových

Více

GTL GENERATOR NÁSTROJ PRO GENEROVÁNÍ OBJEKTŮ OBJEKTY PRO INFORMATICA POWERCENTER. váš partner na cestě od dat k informacím

GTL GENERATOR NÁSTROJ PRO GENEROVÁNÍ OBJEKTŮ OBJEKTY PRO INFORMATICA POWERCENTER. váš partner na cestě od dat k informacím GTL GENERATOR NÁSTROJ PRO GENEROVÁNÍ OBJEKTŮ OBJEKTY PRO INFORMATICA POWERCENTER váš partner na cestě od dat k informacím globtech spol. s r.o. karlovo náměstí 17 c, praha 2 tel.: +420 221 986 390 info@globtech.cz

Více

CPM/BI a jeho návaznost na podnikové informační systémy. Martin Závodný

CPM/BI a jeho návaznost na podnikové informační systémy. Martin Závodný CPM/BI a jeho návaznost na podnikové informační systémy Martin Závodný Agenda Význam CPM/BI Aplikace CPM/BI Projekty CPM/BI Kritické body CPM/BI projektů Trendy v oblasti CPM/BI Diskuse Manažerské rozhodování

Více

Příloha č. 3. Charta projektu plné znění (pro jiné OSS než MŠMT)

Příloha č. 3. Charta projektu plné znění (pro jiné OSS než MŠMT) Příloha č. 3. Charta projektu plné znění (pro jiné OSS než MŠMT) Charta projektu má za cíl poskytnout úplné a pevné informační základy pro schválení projektu. Následně je Charta projektu rozpracována do

Více

NÁSTROJE BUSINESS INTELLIGENCE

NÁSTROJE BUSINESS INTELLIGENCE NÁSTROJE BUSINESS INTELLIGENCE Milena Tvrdíková VŠB Technická univerzita Ostrava, Ekonomická fakulta, Katedra informatiky v ekonomice, Sokolská 33, 701021 Ostrava1, ČR, milena.tvrdikova@vsb.cz Abstrakt

Více

Role BI v e-business řešeních pohled do budoucnosti

Role BI v e-business řešeních pohled do budoucnosti Ing. Ota Novotný, Ph.D. katedra informačních technologií Vysoká škola ekonomická v Praze novotnyo@vse.cz katedra informačních technologií VŠE Praha jsme uznávanou autoritou v oblasti aplikované informatiky

Více

Wonderware Historian. Příklady vícevrstvých architektur. Jiří Nikl, Tomáš Mandys Pantek (CS) s.r.o.

Wonderware Historian. Příklady vícevrstvých architektur. Jiří Nikl, Tomáš Mandys Pantek (CS) s.r.o. Wonderware Historian Příklady vícevrstvých architektur Jiří Nikl, Tomáš Mandys Pantek (CS) s.r.o. Strana 2 Wonderware Historian Server využití vícevrstvé architektury Historizační databáze Wonderware Historian

Více

INFORMAČNÍ SYSTÉMY (IS) Ing. Pavel Náplava Katedra počítačů K336, ČVUT FEL Praha 2004/2005

INFORMAČNÍ SYSTÉMY (IS) Ing. Pavel Náplava Katedra počítačů K336, ČVUT FEL Praha 2004/2005 INFORMAČNÍ SYSTÉMY (IS) Ing. Pavel Náplava Katedra počítačů K336, ČVUT FEL Praha 2004/2005 AGENDA definice IS, zavedení pojmů možnosti a rozdělení typická struktura technologie nasazení praktická ukázka

Více

Informační systémy 2008/2009. Radim Farana. Obsah. Obsah předmětu. Požadavky kreditového systému. Relační datový model, Architektury databází

Informační systémy 2008/2009. Radim Farana. Obsah. Obsah předmětu. Požadavky kreditového systému. Relační datový model, Architektury databází 1 Vysoká škola báňská Technická univerzita Ostrava Fakulta strojní, Katedra automatizační techniky a řízení 2008/2009 Radim Farana 1 Obsah Požadavky kreditového systému. Relační datový model, relace, atributy,

Více

Příloha č.2 - Výběrová kritéria

Příloha č.2 - Výběrová kritéria Příloha č.2 - Výběrová kritéria Program INOVACE-inovační projekty Výzva č. I Dělení výběrových kritérií Pro každý projekt existují tyto typy kritérií: I. Binární kritéria - kritéria typu ANO/NE. Aby projekt

Více

BI & DWH & MIS nástroj 2. generace

BI & DWH & MIS nástroj 2. generace Pavel Seibert KOMIX s.r.o. Avenir Business Park Radlická 751/113e, 158 00 Praha 5 tel.: +420 257 288 211 Úvod Pro oblast Business Intelligence je na trhu celá řada osvědčených produktů osvědčených firem

Více

Srovnání implementace a využití systému Microsoft Project v rozdílném produkčním prostředí případová studie

Srovnání implementace a využití systému Microsoft Project v rozdílném produkčním prostředí případová studie Srovnání implementace a využití systému Microsoft Project v rozdílném produkčním prostředí případová studie 11.9.2012 Kateřina Rubišarová Martin Malčík Rožnov pod Radhoštěm Agenda Případová studie obecně

Více

Softwarová podpora v procesním řízení

Softwarová podpora v procesním řízení Softwarová podpora v procesním řízení Zkušenosti z praxe využití software ATTIS Ostrava, 7. října 2010 www.attis.cz ATTN Consulting s.r.o. 1 Obsah Koncepce řízení výkonnosti Koncepce řízení výkonnosti

Více

1. Integrační koncept

1. Integrační koncept Příloha č. 2: Technický popis integrace 1. Integrační koncept Z hlediska koncepčního budování Smart Administration na Magistrátu města Mostu je možno hovořit o potřebě integrace tří úrovní systémové architektury

Více

Leady & MERK Integrace Microsoft Dynamics CRM s aplikacemi Leady a MERK

Leady & MERK Integrace Microsoft Dynamics CRM s aplikacemi Leady a MERK Integrace Microsoft Dynamics CRM s aplikacemi Leady a MERK Strana 1 z 12 Obsah 1. Leady... 3 a. Shrnutí... 3 b. Popis modulu... 3 c. Technické podrobnosti o modulu... 5 2. MERK... 6 a. Shrnutí... 6 b.

Více

ARBES BI MODERNÍ ŘEŠENÍ pro podporu strategického, taktického a operativního řízení.

ARBES BI MODERNÍ ŘEŠENÍ pro podporu strategického, taktického a operativního řízení. ARBES BI MODERNÍ ŘEŠENÍ pro podporu strategického, taktického a operativního řízení www.arbes.com ARBES BI BUSINESS INTELLIGENCE Většina firem dnes již ví, jak důležité je mít relevatní informace ve správný

Více

Jak vytvořit správné Zadání IS

Jak vytvořit správné Zadání IS Jak vytvořit správné Zadání IS 26. dubna 2013 Jiří Svačina Jiří Svačina Unicorn Systems, Senior Consultant Unicorn, 1993 Vývoj Softwarová architektura Projektové řízení Business analýza Univerzita Hradec

Více

ÚVOD DO PROBLEMATIKY PROJEKTŮ, KATEGORIE

ÚVOD DO PROBLEMATIKY PROJEKTŮ, KATEGORIE PROJEKTOVÉ ŘÍZENÍ STAVEB ÚVOD DO PROBLEMATIKY PROJEKTŮ, KATEGORIE Vysoká škola technická a ekonomická v Českých PROJEKTŮ Budějovicích Institute of Technology And Business In České Budějovice Tento učební

Více

Metadata. MI-DSP 2013/14 RNDr. Ondřej Zýka, ondrej.zyka@profinit.eu

Metadata. MI-DSP 2013/14 RNDr. Ondřej Zýka, ondrej.zyka@profinit.eu Metadata MI-DSP 2013/14 RNDr. Ondřej Zýka, ondrej.zyka@profinit.eu Co to jsou metadata Chybějící metadata Doplněná metadata Co o metadatech říkají autority Řízení metadata je nepochybně nejdůležitější

Více

Dnešní témata Informační systém, informační služba Podnikový informační systém

Dnešní témata Informační systém, informační služba Podnikový informační systém Dnešní témata Informační systém, informační služba Podnikový informační systém VOŠIS UIM 5 1 Rekapitulace Kde jsou dokumenty? Osobní informační systém Informace v organizaci Veřejné informační systémy

Více

Téma Školitel Počet dní Moderní principy řízení výrobního podniku

Téma Školitel Počet dní Moderní principy řízení výrobního podniku Katalog školení QAD Školení probíhají na adrese: Minerva ČR, Skálova 2490, Tábor začátek 9:00 hod do cca 16 hod Minerva ČR, AT Tower Pražákova 69, Brno začátek 9:00 hod do cca 16 hod cena 4000Kč/osoba,

Více

Podrobná analýza k aktivitě č. 3 - implementace procesního řízení do praxe úřadu

Podrobná analýza k aktivitě č. 3 - implementace procesního řízení do praxe úřadu Příjemce dotace: Město Moravská Třebová Název projektu: Zvýšení kvality řízení a poskytovaných služeb MÚ Moravská Třebová Registrační číslo projektu: CZ.1.04/4.1.01/89.00116 Podrobná analýza k aktivitě

Více

Management informačních systémů. Název Information systems management Způsob ukončení * přednášek týdně

Management informačních systémů. Název Information systems management Způsob ukončení * přednášek týdně Identifikační karta modulu v. 4 Kód modulu Typ modulu profilující Jazyk výuky čeština v jazyce výuky Management informačních systémů česky Management informačních systémů anglicky Information systems management

Více

Outsourcing v podmínkách Statutárního města Ostravy

Outsourcing v podmínkách Statutárního města Ostravy Outsourcing v podmínkách Statutárního města Ostravy Říjen 2009 Ing. Stanislav Richtar Ředitel společnosti 1 OBSAH PREZENTACE 1. Outsourcing - obecně 2. Výchozí stav projektu 3. Model poskytovaných služeb

Více

kapitola 2 Datové sklady, OLAP

kapitola 2 Datové sklady, OLAP Tomáš Burger, burger@fit.vutbr.cz kapitola 2 Datové sklady, OLAP Získávání znalostí z databází IT-DR-3 / ZZD Co je to datový sklad A data warehouse is a subjectoriented, integrated, time-variant and nonvolatile

Více

Architektura informačních systémů. - dílčí architektury - strategické řízení taktické řízení. operativní řízení a provozu. Globální architektura

Architektura informačních systémů. - dílčí architektury - strategické řízení taktické řízení. operativní řízení a provozu. Globální architektura Dílčí architektury Informační systémy - dílčí architektury - EIS MIS TPS strategické řízení taktické řízení operativní řízení a provozu 1 Globální Funkční Procesní Datová SW Technologická HW Aplikační

Více

Databázové systémy. Doc.Ing.Miloš Koch,CSc. koch@fbm.vutbr.cz

Databázové systémy. Doc.Ing.Miloš Koch,CSc. koch@fbm.vutbr.cz Databázové systémy Doc.Ing.Miloš Koch,CSc. koch@fbm.vutbr.cz Vývoj databázových systémů Ukládání dat Aktualizace dat Vyhledávání dat Třídění dat Výpočty a agregace 60.-70. léta Program Komunikace Výpočty

Více

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček jaroslav.zacek@osu.cz http://www1.osu.cz/~zacek/

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček jaroslav.zacek@osu.cz http://www1.osu.cz/~zacek/ Aplikace IS, outsourcing, systémová integrace Jaroslav Žáček jaroslav.zacek@osu.cz http://www1.osu.cz/~zacek/ Kontext Dodavatelé Strategická Zákazníci ERP Taktická Operativní Kategorie ERP - zaměřeno na

Více

Přístupy k efektivnímu využití modelu MBI

Přístupy k efektivnímu využití modelu MBI MBI, Management byznys informatiky Přístupy k efektivnímu využití modelu MBI Jan Dohnal Katedra softwarového inženýrství, F, ČVUT Jan Pour Katedra, FIS, VŠE MBI, Management byznys Snímek informatiky 1

Více

Znalostní systém nad ontologií ve formátu Topic Maps

Znalostní systém nad ontologií ve formátu Topic Maps Znalostní systém nad ontologií ve formátu Topic Maps Ladislav Buřita, Petr Do ladislav.burita@unob.cz; petr.do@unob.cz Univerzita obrany, Fakulta vojenských technologií Kounicova 65, 662 10 Brno Abstrakt:

Více

BI v rámci IS/ICT komponenty BI architektura. Charakteristika dat a procesů v IS/ICT. Datové sklady ukládání dat návrh datového skladu

BI v rámci IS/ICT komponenty BI architektura. Charakteristika dat a procesů v IS/ICT. Datové sklady ukládání dat návrh datového skladu BI v rámci IS/ICT komponenty BI architektura Charakteristika dat a procesů v IS/ICT Datové sklady ukládání dat návrh datového skladu BI CRM ERP SCM Aplikace pro podporu základních řídících a administrativních

Více

Management rizika Bc. Ing. Karina Mužáková, Ph.D. BIVŠ,

Management rizika Bc. Ing. Karina Mužáková, Ph.D. BIVŠ, Management rizika Bc. Ing. Karina Mužáková, Ph.D. BIVŠ, 2015 1 5/ Řízení rizika na úrovni projektu, podniku a v rámci corporate governance. BIVŠ, 2015 2 Definice projektu říká, že se jedná o činnost, která

Více

Architektury Informačních systémů. Jaroslav Žáček

Architektury Informačních systémů. Jaroslav Žáček Architektury Informačních systémů Jaroslav Žáček jaroslav.zacek@osu.cz http://www1.osu.cz/~zacek/ Nutné pojmy Co je to informační systém? Jaké oblasti zahrnuje? Jaká je vazba IS na podnikovou strategii?

Více

PRODUKTY. Tovek Tools

PRODUKTY. Tovek Tools jsou desktopovou aplikací určenou k vyhledávání informací, tvorbě různých typů analýz a vytváření přehledů a rešerší. Jsou vhodné pro práci i s velkým objemem textových dat z různorodých informačních zdrojů.

Více