NÁSTROJE BUSINESS INTELLIGENCE



Podobné dokumenty
3 zdroje dat. Relační databáze EIS OLAP

Základy business intelligence. Jaroslav Šmarda

Business Intelligence

Informační systémy 2008/2009. Radim Farana. Obsah. Obsah předmětu. Požadavky kreditového systému. Relační datový model, Architektury databází

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9


Business Intelligence

Informační systémy 2006/2007

10. Datové sklady (Data Warehouses) Datový sklad

Základní informace o co se jedná a k čemu to slouží

METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1

ARCHITEKTURA INFORMAČNÍCH SYSTÉMŮ PODLE ÚROVNĚ ŘÍZENÍ

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

Datové sklady. Ing. Jan Přichystal, Ph.D. 1. listopadu PEF MZLU v Brně

Softwarová podpora v procesním řízení

Úvodní přednáška. Význam a historie PIS

STÁTNÍ POKLADNA. Integrovaný informační systém Státní pokladny (IISSP)

Datová věda (Data Science) akademický navazující magisterský program

MIS. Manažerský informační systém. pro. Ekonomický informační systém EIS JASU CS. Dodavatel: MÚZO Praha s.r.o. Politických vězňů Praha 1

Marketingová komunikace. 3. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK3PH (vm3bph)

Bu B sin i e n s e s s I n I te t l e lig i en e c n e c Skorkovský KA K M A I, E S E F MU

Databázové systémy. Doc.Ing.Miloš Koch,CSc.

Moderní systémy pro získávání znalostí z informací a dat

Databázové systémy. 10. přednáška

Chytrá systémová architektura jako základ Smart Administration

Manažerský informační systém na MPSV. Mgr. Karel Lux, vedoucí oddělení koncepce informatiky MPSV

Datová kvalita základ úspěšného BI. RNDr. Ondřej Zýka, Profinit

Ing. Petr Kalčev, Ph.D.

Architektura informačních systémů. - dílčí architektury - strategické řízení taktické řízení. operativní řízení a provozu. Globální architektura

4IT218 Databáze. 4IT218 Databáze

Podnikové informační systémy Jan Smolík

Vzdělávací obsah vyučovacího předmětu

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

Analýza nestrukturovaných dat pomocí Oracle Endeca Information Discovery

TM1 vs Planning & Reporting

Architektury Informačních systémů. Jaroslav Žáček

BI v rámci IS/ICT komponenty BI architektura. Charakteristika dat a procesů v IS/ICT. Datové sklady ukládání dat návrh datového skladu

Databáze. datum jmeno prijmeni adresa_ulice adresa_mesto cislo_uctu platba zustatek

Analýza a modelování dat. Přednáška 8

Vývoj moderních technologií při vyhledávání. Patrik Plachý SEFIRA spol. s.r.o.

Datový sklad. Datový sklad

Business Intelligence. Adam Trčka

Snadný a efektivní přístup k informacím

Management informačních systémů. Název Information systems management Způsob ukončení * přednášek týdně

Jan Horák. Pilíře řešení

Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph)

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Business Intelligence nástroje a plánování

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

GTL GENERATOR NÁSTROJ PRO GENEROVÁNÍ OBJEKTŮ OBJEKTY PRO INFORMATICA POWERCENTER. váš partner na cestě od dat k informacím

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Databáze Bc. Veronika Tomsová

Management IS. Doc.Ing.Miloš Koch,CSc. 22/ 1

Infor Performance management. Jakub Urbášek

PŘÍLOHA C Požadavky na Dokumentaci

Základy databází. O autorech 17 PRVNÍ ČÁST. KAPITOLA 1 Začínáme 19

VIZE INFORMATIKY V PRAZE

Systémy pro podporu rozhodování. Datové sklady, OLAP

Profitabilita klienta v kontextu Performance management

DATABÁZOVÉ SYSTÉMY. Vladimíra Zádová, KIN, EF TUL - DBS

BIG DATA. Nové úlohy pro nástroje v oblasti BI. 27. listopadu 2012

SMART GRID SYSTEM TECHNOLOGIE PRO ANALYTIKU A SPRÁVU ENERGETICKÝCH SÍTÍ. Představení společnosti Analyzátor sítě

Analýza a modelování dat. Přednáška 9

Architektury Informačních systémů. Jaroslav Žáček

Konsolidovaný reporting CZ/SK v Cognos případová studie sanofi-aventis

VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA STROJNÍ DATABÁZOVÉ SYSTÉMY ARCHITEKTURA DATABÁZOVÝCH SYSTÉMŮ. Ing. Lukáš OTTE, Ph.D.

Wonderware Information Server 4.0 Co je nového

PostgreSQL jako platforma pro datové sklady

SW pro správu a řízení bezpečnosti

Okruhy z odborných předmětů

kapitola 2 Datové sklady, OLAP

CPM/BI a jeho návaznost na podnikové informační systémy. Martin Závodný

QAD Business Intelligence

Aplikace moderních informaèních technologií v øízení firmy Nástroje ke zvyšování kvality informaèních systémù

Jak velká jsou? Obchodní analytici FB velké datové sady BI = business intelligence. OLAP = Online Analytical Processing. DWH = Data Warehouse

Trendy v IS/ICT přístupy k návrhu multidimenzionální modelování

Databázové systémy BIK-DBS

Památkový katalog prostředek pro evidenci a prezentaci památkového potenciálu. Ing. arch. Renata Vrabelová, Ing. Petr Svoboda

Zdroje informací v organizaci IS/ICT BI v rámci IS/ICT historie architektura OLTP x DW ukládání dat

Obsah. Úvod do problematiky. Datový sklad. Proces ETL. Analýza OLAP

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Geografické informační systémy ArcGIS Pavel Juška (jus011) 4. března 2010, Ostrava

Jak připravit podnikový controlling a ABC Multidimenzionální vyhodnocování ziskovosti

POKROČILÉ POUŽITÍ DATABÁZÍ

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Kapitola 4. Úvod 11. Stručný úvod do relačních databází 13. Platforma 10g 23

Databáze v MS ACCESS

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence

Ontologie. Otakar Trunda

8.2 Používání a tvorba databází

Výčet strategií a cílů, na jejichž plnění se projektový okruh podílí: Strategický rámec rozvoje veřejné správy České republiky pro období

3. Očekávání a efektivnost aplikací

Vývoj informačních systémů. Obecně o IS

Infor APS (Scheduling) Tomáš Hanáček

Projektové řízení jako základ řízení organizace

1. Integrační koncept

Připravte se na konjunkturu se systémem řízení údržby SGM. SGM moderní nástroj pro řízení údržby nejen výrobních zařízení

GIS Geografické informační systémy

Multidimenzionální pohled na zdravotnické prostředí. INMED Petr Tůma

<Insert Picture Here> Na co se můžete s Oracle BI těšit

Transkript:

NÁSTROJE BUSINESS INTELLIGENCE Milena Tvrdíková VŠB Technická univerzita Ostrava, Ekonomická fakulta, Katedra informatiky v ekonomice, Sokolská 33, 701021 Ostrava1, ČR, milena.tvrdikova@vsb.cz Abstrakt Nástroje business intelligence se ve stále větší míře uplatňují v podnicích a institucích po celém světě. Jsou speciálně zaměřeny na podporu potřeb řídících pracovníků. Je to část celkového IS firmy, která pracuje s vybranými nebo upravenými daty, a která se těmito úpravami stává nositelem komplexních informací, charakterizujících příslušné procesy ve firmě. Primárně slouží k identifikaci a lokalizaci určitých jevů ve firmě, v dalším kroku pak k jejich podrobné analýze. Za velmi významné považuji rovněž působení nástrojů business intelligence jako integračního faktoru IS firmy. V příspěvku jsou probrány základní principy fungování těchto aplikací. 1. Úvod Jedním z posunů, ke kterým v podnikové informatice došlo během několika posledních let, byl přesun priorit ke strategickému řízení. Pro takovýto přístup je podstatné mít dostatek správných informací. Toto nám nabízí systém nástrojů, projektových řešení a organizačních opatření známých pod pojmem business intelligence (BI), umožňujících řízení organizací podle znalostí. Rozsáhlá oblast business intelligence se skládá z řady samostatných komponent, má vlastní architekturu i metodiky a s provozními systémy je provázaná řadou vazeb. Kromě tradičních aplikací, rozvíjí koncept MIS také EIS (Executive Information Systems) a nástroje dolování dat. Infrastruktura celé oblasti bývá založena na konceptu datového skladu. Existence datového skladu je předpokladem pro fungování nástrojů BI. Jedná se o ucelenou databázi optimalizovanou pro dotazování a analýzu dat, společně s nástroji, které dotazy, analýzy a kvalitní prezentaci výstupů umožňují. V datovém skladu jsou data integrována a ukládána, ať už se jedná o data z interních nebo externích zdrojů. Konečným cílem je poskytnout čitelné, organizované, analyzovatelné a v reálném čase dostupné informace z maxima podnikových databází i externích zdrojů, které jsou ve velkém rozsahu využitelné při řízení firmy či instituce. 2. EIS Executive Information System Prostupování integrovaných informačních systémů (ERP - např.sap R/3 nebo BAAN) do všech procesů v organizaci spolu s nástupem komunikačních technologií vede k dramatickému růstu objemu dat v těchto systémech. Proto potřeby efektivního řízení vyžadují sledování souhrnných informací, jejichž objem není tak veliký, ale jsou to data se značnou mírou agregace. Tento účel splňují EIS. Jde o efektivní propojení datového potencionálu provozního transakčního systému s řídícími mechanismy organizace a analytickými potřebami jednotlivých složek řízení. Jsou navrhovány tak, aby jednak 304

umožňovaly přístup k externím datům, jednak byly napojeny na informační systém organizace. EIS dokáží transportovat značné objemy primárních dat, generovaných základními procesy dané firmy do logických struktur, které reprezentují řídící a rozhodovací procesy v konkrétní firmě. Jsou charakteristické jednoduchým ovládáním (často intuitivním) a obsahují účinné prostředky pro přehlednou prezentaci dat. 2.1 Charakteristika EIS EIS využívají tzv. OLAP ( On Line Analytical Processing ) nástrojů,,zajišťujících vysoce efektivní mechanizmus vícekriteriální analýzy. Pro jejich hodnocení bylo definováno zhruba 18 pravidel, z nichž prvních 12 definoval E.F.Codd. Základní vlastnosti: Multidimenzionální koncept a manipulace s daty: realizuje uložení dat v kombinaci definovaných dimenzí, umožňuje různé pohledy na data podle dimenzí a dokáže je dynamicky měnit. Intuitivní manipulace s daty z pohledu uživatele: grafické rozhraní, zooming. Možnost získávat data z heterogenních datových zdrojů: OLAP nástroje musí mapovat stav uložení dat, přístup k nim a zajistit příslušné konverze do vlastní datové báze. Nabídka vlastních databází pro OLAP i přímý přístup do externích dat. Podpora moderních analytických přístupů. Klient/server architektura. Transparentnost a otevřenost: schopnost integrace s jinými nástroji bez vlastního ohrožení, uživatel může využívat data z databáze nástroji, na které je zvyklý. Transparentnost vnitřní organizace dat. Podpora víceuživatelského provozu: paralelní přístupy, zajištění integrity a bezpečnosti provozu. Speciální vlastnosti: Efektivní zpracování řídkých matic: chybějící hodnoty musí být ignorovány OLAP analyzátory bez ohledu na jejich zdroj. Zpracování nenormalizovaných dat: integrace OLAP stroje a nenormalizovaných zdrojových dat. Odlišení chybějících hodnot od nulových. Přehledové vlastnosti (reporting): Flexibilní poskytování výstupů: snadné úpravy výstupů, zobrazení a kombinace výstupů podle okamžitých potřeb uživatele. Konzistentní výkon na výstupech: výkon by neměl být ovlivněn počtem definovaných dimenzí. Řízení dimenzí: Generická dimenzionalita: dodatečně dodávané funkce musí být zajištěny pro jakoukoliv dimenzi. 305

Neomezený počet dimenzí a agregačních úrovní: počet dimenzí pro model by neměl být limitován. Neomezené operace napříč dimenzemi: operace s daty mezi jednotlivými dimenzemi nemohou být omezeny počtem dimenzí. Dodržení OLAP standardů, spolu s posouzením jednoduchosti nasazení a ovládání systému a schopnosti dodavatele zhotovit v krátké době prototyp budoucí aplikace nad vzorkem vašich skutečných dat, jsou jednoznačným kritériem pro výběr konkrétního EIS. 2.2 Multidimenzionalita EIS Typickou vlastností EIS je multidimenzionalita, která umožňuje rychle a jednoduše vytvářet nové pohledy na data, jejich řazení do nových souvislostí, vyhledávání zákonitostí (trendových charakteristik), indikaci odchylek klíčových ukazatelů od plánovaných hodnot, práci s historií a anticipaci budoucího vývoje. Aplikace EIS jsou založeny především na využití tzv. multidimenzionálního uložení dat. Základem je multidimenzionální tabulka umožňující rychle a pružně měnit jednotlivé dimenze, tedy měnit pohledy uživatele na modelovanou ekonomickou realitu. Pohled na ekonomiku jakékoliv organizace je multidimenzionální. Pro ekonomické aplikace, jež jsou rozvinutelné v čase, je počet tří dimenzí, užívaný v tabulkových kalkulátorech, nedostatečný. U malých organizací manažer neztrácí globální přehled a dokáže sledovat i podrobnosti. U větších organizací musí být informace pro manažera pečlivě připravovány. Multidimenzionální forma informací je pak velmi praktická, možná i nutná. Úlohy tohoto charakteru jsou typickými úlohami v podnicích, ve státní správě, v bankovnictví, kontrolních úřadech apod. Výhoda EIS při řešení těchto úloh spočívá ve schopnosti velmi operativně pracovat v nadprostorové matici s výrazně větším počtem buněk. Několika dimenzionální uložení dat je většinou realizováno na bázi metadatové nadstavby nad relačními tabulkami. Metadata přiřazují řádky a sloupce relačních databází jednotlivým dimenzím a buňkám v n-dimenzionální tabulce. V metadatech jsou také obsažena pravidla agregace dat na jednotlivých úrovních definovaných dimenzí. Toto je princip OLAP technologie ukládání dat neboli on-line analytického zpracování dat. Odezva na změnu definice pohledu je pak v nástrojích využívajících OLAP technologie téměř okamžitá. Problém expanze multidimenzionálních dat se projevuje až v určitých situacích, jako jsou přílišná hierarchická složitost dimenzí, zvětšující se počet dimenzí a s tím související řídkost dat apod. Otázka administrace multidimenzionálních dat rovněž úzce souvisí s typem ukládání a dalším zpracováním těchto dat. 2.3 Využívané technologické principy OLAP technologie jsou rozdělovány do tří skupin podle typu ukládání a způsobu zpracování dat: ROLAP ( Relational On-Line Analytical Processing ) MOLAP ( Multidimensional On-Line Analytical Processing ) HOLAP ( Hybrid On-Line Analytical Processing ) 306

ROLAP MOLAP HOLAP výhody nevýhody výhody nevýhody Přímý přístup k datům až na konkrétní doklad Bez časové prodlevy od změn v primárním systému Dlouhá doba odezvy Musí se definovat metadata popisující relační databázi Jednodušší nastavení komunikace Rychlejší zpracování požadavku Bez omezení použitého SQL jazyka Nižší zátěž využívaného hardware Lze získat pouze agregovaná data Realizace databáze s určitým zpožděním Kombinace obou předešlých technologií ROLAP reprezentuje přímý přístup k datům relačního primárního systému, což znamená, že data prezentovaná v zobrazovacím nástroji jsou získávána přímo z původních datových zdrojů, např. z tabulek databáze Oracle ( přístup do těchto tabulek je obvykle realizován prostřednictvím ODBC ovladačů v okamžiku potřeby). Pro uložení dat se tedy používají standardní relační databáze a data z nich jsou vybírána pomocí SQL dotazů. Produkty kategorie MOLAP využívají specifickou multidimenzionální databázi. Informace jsou v této speciální databázi, navržené jako množina multidimenzionálních matic a jsou aktualizovány a doplňovány v určeném pravidelném intervalu. HOLAP představuje přístup kombinující obě předešlé technologie. V tomto případě jsou data čerpána přímo z primárních zdrojů, přičemž jejich část je ukládána do multidimenzionálních matic ( model MOLAP ). V zásadě se do multidimenzionální databáze ukládají agregované údaje, jejichž získávání bývá nejvíce časově náročné. Rozlišení správného stupně agregace, který bude představovat hranici mezi podrobnějšími daty ukládanými do relační datové struktury a agregovanými informacemi zaváděnými do multidimenzionálních databází, je významným úkolem pro implementátora EIS. Lze říci, že nástroje dostupné na trhu v ČR podporují HOLAP přístup, přičemž stanovení hranice mezi ukládáním dat do OLAP struktur a přímým přístupem do relačních zdrojů je možno individuálně stanovit v rozmezí 0-100% ( tedy od případu, kdy se v multidimenzionálních databázích neukládá nic, až po situaci, kdy zobrazovací nástroj čerpá data pouze z OLAP zdrojů ). 3. Datové sklady Datový sklad (DS) je dlouhodobým úložištěm, kam data shromážděná klasickými informačními systémy přibývají po jednotlivých dávkách. V datovém skladu: odezvy na dotaz nemusí být okamžité připouští se určitá redundance dat 307

data se z datového skladu nikdy nelikvidují (mohou se provádět souhrnné agregace některých údajů a zálohy na externí média). Data Data Data personalistiky hlavní knihy objednávek SQL (OLTP) SQL (OLTP) SQL (OLTP) Transakční zprac. Transakční zprac. Transakční zprac.. Datový Sklad Multidimenzionální (SQL) ( OLAP ) Externí data Zpracování standardních výstupů Stav skladu Historie dodavatele Seznam zákazníků Aplikace business intelligence Finanční výkazy a plánování Prodejní a marketingová analýza Analýza ziskovosti podniku Obr.1. Schéma technologie OLAP komplexního řešení podpory rozhodovacích procesů, nazývané též business intelligence Charakteristickou vlastností datového skladu je různorodost zdrojů. Zdroje pro datové sklady jsou uloženy ve zcela odlišných strukturách, formátech, mají odlišnou filozofii záznamu, jsou uloženy na různých médiích apod. Datové sklady fungují na principu tří kroků (ETL): Extrakce schopnost převzít data z co nejširšího spektra datových zdrojů nejrůznějšího charakteru. (Jedním ze způsobů přístupu může být standardizované rozhraní ODBC.) Transformace postupná řada operací, které extrahovaná data připraví pro vlastní načtení do datového skladu. (Dochází ke kontrole, doplnění nebo změně dat, převodu na stejné formáty a odstranění nekonzistence.) Load Data jsou natažena do vlastního fyzického prostoru datového skladu. (Jsou připravena na vytěžování čili pokládání dotazů.) 308

V architektuře datových skladů se prosadily dva koncepty nezávislé data marty (virtuální datové sklady), - integrované datové sklady. Nezávislé data marty jsou samostatná datová úložiště pro jednotlivé aplikace nebo útvary. Jejich nevýhodou je možná nekonzistence mezi jednotlivými úložišti a komplikované načítací procesy. Integrovaný datový sklad je centrální datové úložiště, kde je požadavek konzistence naprosto zásadní (DS musí poskytovat jedinou verzi pravdy ). Tento přístup v současnosti převládá. 3. Dolování dat Datový sklad je pak nástroji business intelligence využíván přes službu nazývanou dolování dat. Dolování dat na základě určitého předpokladu umožňuje vyhledat ve velkém objemu dat souvislosti a vzájemné vztahy, které nebyly známy dopředu. Tím, že umí vyhledávat data o souvislostech, které nebyly dopředu známy, se dolování dat liší od jiných metod počítačem zpracovávaných datových analýz. Dolování dat by mělo mít vždy za cíl řešení konkrétního obchodního problému nebo nalezení cesty k vylepšení procesu. Cíl musí být předem definován a na jeho základě by se měla připravovat data. Dolování dat je hledáním skrytých souvislostí, procesem výběru, prohledávání a modelování ve velkých objemech dat. Slouží k odhalení dříve neznámých vztahů mezi daty. Data musí být samozřejmě očištěna od chyb, úplná a formáty z různých systémů musí být sjednoceny. To zajistí jejich uložení v datovém skladu. Charakter dolování dat vyžaduje, aby data byla průběžně aktualizována. Spektrum metod, které se využívají při budování modelu dolování dat je velmi rozsáhlé. O žádném modelu nelze říci, že je univerzální a nejlepších výsledků se dosahuje kombinací různých přístupů. Dnes užívanými metodami dolování dat jsou například: odhady hodnot vysvětlované proměnné (lineární regresní analýza, nelineární regresní analýza, neuronové sítě) klasifikace (diskriminační analýza, logistická regresní analýza, rozhodovací stromy, neuronové sítě), segmentace shlukování (shluková analýza, genetické algoritmy, neuronové shlukování Kohonenovy mapy) analýza vztahů ( asociační algoritmus pro odvozování pravidel typu if X then Y ) predikce v časových řadách (Boxova-Jenkinsonova metoda, neuronové sítě) detekce odchylek (vizualizace, statistické postupy). Některé přístupy jsou založeny na přesně popsaném matematickém modelu a aplikace na konkrétní data se sestává z testování hypotéz a výpočtu neznámých koeficientů. Druhá skupina modelů mění svou strukturu dynamicky, na základě dat, která zpracovávají. Užívané metody dolování dat jsou bedlivě střeženým know-how SW firem. 309

4. Integrační charakter nástrojů business intelligence Za velmi významné považuji působení nástrojů business intelligence jako integračního faktoru IS firmy. Přispívají k: integraci řídících procesů data jsou dostupná pro všechny úrovně řízení a to v téměř stejném časovém úseku, integraci dat tvorba datového skladu a realizace dolování dat integraci informačních technologií minimálně prostřednictvím dat propojují i různé ve firmě užívané informační technologie a technologické platformy, stávají se motorem propojení IS firmy do jednotně fungujícího celku, celkové integraci systému aplikace BI patří v rámci firmy k aplikacím strategickým. Přenášejí data mezi všemi úrovněmi řízení ve firmě a tak představují významný faktor pro integraci celého IS firmy. Při jejich vývoji a implementaci dochází k uvědomování si jednotlivých částí IS firmy a tím dochází k jejich konečné integraci do synergicky fungujícího celku integrovaného IS firmy. Naše století se dá bez nadsázky charakterizovat nebývalou informační explozí. Největšímu informačnímu nátlaku jsou vystaveni manageři a řídící pracovníci firem. Čím je firma rozsáhlejší nebo rozmístěna na více místech, tím roste i tlak na kvalitu, relevantnost, spolehlivost i kvantitu předávaných informací. Schopný a vzdělaný manager potřebuje pro svou důležitou činnost adekvátní nástroj kvalitní manažerskou nadstavbu informačního systému. Lze říci, že nástroje business intelligence integrují informační a podnikatelskou strategii a pomáhají podniku přežít v současném turbulentním prostředí. Literatura: 1. Systémová integrace, roč.4., č.3., 1997 2. Firemní příručka Media M, Speedware Corporation Inc., 1998 3. Geldner, D.: Role a architektury Business Intelligence ve strategickém řízení IS/IT finančních institucí, Systémová integrace, č.1., 2002 4. Tvrdíková, M.: Materiály k výuce předmětu Systémový hardware a software 310