Business Intelligence



Podobné dokumenty
Business Intelligence

Bu B sin i e n s e s s I n I te t l e lig i en e c n e c Skorkovský KA K M A I, E S E F MU

Podíl zdrojů informací

Objektově orientované databáze

Vícetabulková databáze. Vztahy mezi tabulkami

MĚŘENÍ NÁKLADŮ, VÝKONNOSTI

Bezpečná výměna dat. Petr Dolejší Project manager, Solution consultant

Použití GIS v práci krajské hygienické stanice

Střední průmyslová škola a Vyšší odborná škola technická Brno, Sokolská 1. Podpora digitalizace a využití ICT na SPŠ CZ.1.07/1.5.00/34.

Data v počítači EIS MIS TPS. Informační systémy 2. Spojení: jan.skrbek@tul.cz tel.: Konzultace: úterý

Střední škola pedagogická, hotelnictví a služeb, Litoměříce, příspěvková organizace

Podnikové informační systémy Jan Smolík

Prostorové indexační techniky. Zdeněk Kouba

Karty externích médií

MS Word 2007 REVIZE DOKUMENTU A KOMENTÁŘE

PRŮVODCE PRAVIDLY PUBLICITY v projektech spolufinancovaných z Integrovaného operačního programu.

OBEC PŘIBYSLAVICE. Zastupitelstvo obce Přibyslavice. Obecně závazná vyhláška. Obce Přibyslavice Č. 1/2015

Dobývání znalostí z databází. Databáze. datum jmeno prijmeni adresa_ulice adresa_mesto cislo_uctu platba zustatek

PROJEKT BAKALÁŘSKÉ PRÁCE

Novinky v programu Majetek 2.06

-1- N á v r h ČÁST PRVNÍ OBECNÁ USTANOVENÍ. 1 Předmět úpravy

Výrazy lze též zavést v nečíselných oborech, pak konstanty označuji jeden určitý prvek a obor proměnné není množina čísel.

Vítězslav Bártl. prosinec 2013

KNIHOVNY SILESIA MUZEA T ÍNSKA

Projekty PPP vní aspekty. Martin Vacek, advokát PETERKA & PARTNERS v.o.s. Praha, Bratislava

VYHLÁŠKA ze dne. června 2009 o stanovení podrobností užívání a provozování informačního systému datových schránek

účetních informací státu při přenosu účetního záznamu,

Novinky verze ArCon 14 Small Business

DODATEČNÉ INFORMACE K ZADÁVACÍM PODMÍNKÁM

Čl. 3 Poskytnutí finančních prostředků vyčleněných na rozvojový program Čl. 4 Předkládání žádostí, poskytování dotací, časové určení programu

Pokyn D Sdělení Ministerstva financí k rozsahu dokumentace způsobu tvorby cen mezi spojenými osobami

2.1. Pojem funkce a její vlastnosti. Reálná funkce f jedné reálné proměnné x je taková

Modul Řízení objednávek.

Formulář návrhu projektu pro 4. veřejnou soutěž programu ALFA

IT jako služba konference ISSS Autor prezentace: Otakar Školoud

Počítačová grafika 2. Opakování. Úprava barev a tónů. Retuše a efekty.

Rychlé vyrovnávací paměti (cache)

PROBLEMATIKA TERÉNNÍCH ÚPRAV

Poruchy modul pro rychlé hlášení poruch z provozu.

Mapy Stabilního katastru jako zdroj informací pro státní správu a samosprávu

ROZKLIKÁVACÍ ROZPOČET - ONLINE ZVEŘEJŇOVÁNÍ EKONOMICKÝCH DAT ÚŘADU

PŘÍLOHA 1.6 SMLOUVY O PŘÍSTUPU K VEŘEJNÉ PEVNÉ KOMUNIKAČNÍ SÍTI LOGISTIKA KONCOVÝCH ZAŘÍZENÍ

Algoritmizace a programování

MODEL HYDRAULICKÉHO SAMOSVORNÉHO OBVODU

SMLOUVA O PODMÍNKÁCH A PRAVIDLECH ÚČASTI NA ELEKTRONICKÝCH AUKCÍCH DŘÍVÍ

Programový komplet pro evidence provozu jídelny v modul Sklad Sviták Bechyně Ladislav Sviták hotline: 608/

Databázovéa informačnísystémy NÁVRH IMPLEMENTACE 2 KONZISTENCE DATABÁZE

VŠEOBECNÉ OBCHODNÍ PODMÍNKY E-SHOP (Doplňující podmínky k Všeobecným smluvním podmínkám užívání služeb Národního geoportálu INSPIRE)

KALOVÉ KOŠE KOŠE DO ULIČNÍCH VPUSTÍ KOŠE DO DVORNÍCH VPUSTÍ LAPAČE NEČISTOT

Modul pro testování elektrických obvodů

VÝZVA K PODÁNÍ CENOVÝCH NABÍDEK

Ekonomika Společnost s ručením omezeným

Obecně závazná vyhláška města Žlutice č. 2/2011 Požární řád obce

Dne obdržel zadavatel tyto dotazy týkající se zadávací dokumentace:

Metodika testování navazujících evidencí

Metodický pokyn č. 45. ke změně Pokynů pro zadávání veřejných zakázek ROP SV v souvislosti s novelou zákona o veřejných zakázkách

Všeobecné obchodní podmínky portálu iautodíly společnosti CZ-Eko s.r.o.

MOBILNÍ KOMUNIKACE STRUKTURA GSM SÍTĚ

Celková částka pro tuto výzvu: Kč v rozdělení dle tabulky č.1

Změnu DPH na kartách a v ceníku prací lze provést i v jednotlivých modulech.

Jednotkové ceny za m 2 podlahové plochy bytu a jejich meziroční změna 1 ÚVOD

O pohár starosty MČ Praha - Zličín

SITEMAP / STRUKTURA. VÝVOJ ONLINE PREZENTACE / ETAPA I. CLIENT / DHL Global Forwarding THEQ ALL GOOD THINGS

BRICSCAD V16. Modelování strojírenských sestav

Smluvní podmínky (KTv)

Příloha č. 13. Statistický metainformační systém - úvod

1.1 Seminář z Informatiky. Charakteristika volitelného vyučovacího předmětu Seminář z Informatiky

č. A/0../10 Smlouva o poskytnutí sociální služby v Azylovém domě Samaritán

Operace nad celými tabulkami

OBEC HORNÍ BOJANOVICE obecně závazná vyhláška č. 05/2005

Příloha č. 2 - Integrace SpiritÚAP do ESB Jihočeského kraje

ECB-PUBLIC ROZHODNUTÍ EVROPSKÉ CENTRÁLNÍ BANKY (EU) 2015/[XX*] ze dne 10. dubna 2015 (ECB/2015/17)

4. Počítačová síť. Co je to počítačová síť

Rozdílová tabulka návrhu předpisu ČR s legislativou ES V. Ustanovení Obsah Celex č. Ustanovení

Výzva pro předložení nabídek k veřejné zakázce malého rozsahu s názvem Výměna lina

EFESSO. Uživatelský manuál

funkční na dual-sim telefonech možnost přesměrovat příchozí hovory možnost nastavení více telefonních čísel pro případ, že je jedno nedostupné

ORGANIZACE VELETRHU Z POHLEDU VYSTAVOVATELE

Zvyšování kvality výuky technických oborů

HASIČSKÝ ZÁCHRANNÝ SBOR OLOMOUCKÉHO KRAJE Schweitzerova 91, Olomouc

Profilová část maturitní zkoušky 2015/2016

Soubory a databáze. Soubor označuje množinu dat, která jsou kompletní k určitému zpracování a popisují vybrané vlastnosti reálných objektů

Zvyšování kvality výuky technických oborů

Uživatelský manuál k instalaci a aktivaci systému BUILDpower S

MAGIS MIS - Manažerský systém v předním dřevařském podniku AGROP NOVA a.s.

GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY CVIČENÍ 8

Veřejnoprávní smlouva o poskytnutí investiční dotace č. 1/2016

Budování aplikačních rozhraní pro obousměrnou komunikaci mezi ERMS a jejich vztah k Národnímu standardu pro komunikaci mezi ERMS.

C. 2. Pořízení a implementace IS

Studie proveditelnosti. Marketingová analýza trhu

Zvyšování kvality výuky technických oborů

Pokyn pro příjemce dotace

Obsah přednášky. Pojem modelu Organizační teorém

Národní mnohostranné fórum České republiky pro elektronickou fakturaci

Změna sazby DPH v HELIOS Red po

PRAVIDLA soutěže COOP DOBRÉ RECEPTY Jarní probuzení

Sekvenční obvody. S R Q(t+1) 0 0? Q(t)

POŘÍZENÍ NÍZKOEMISNÍHO ZDROJE A ZATEPLENÍ KULTURNĚ SPOLEČENSKÉ BUDOVY DŘEŠÍNEK

Všeobecné obchodní podmínky Simply Events s.r.o.

Tento projekt je spolufinancován. a státním rozpočtem

Transkript:

Business Intelligence Skorkovský KAMI, ESF MU

Principy BI zpracování velkých objemů dat tak, aby výsledek této akce manažerům pomohl k rozhodování při řízení procesů výsledkem zpracování musí být relevantní informace, kterou dostanou manažeři ve správném čase základní zdroj dat, která se často ukládají do datových skladů jsou ERP systémy (relační DB) získání informací jako výsledek strukturovaných dotazů musí probíhat rychle (krátká odezva) používá se pro řízení na strategické, taktické u operační úrovni

Principy BI Definice 1 : BI je sběr a analýza dat, jejímž cílem je lepší porozumění a reakce na změny, kterým organizace neustále čelí Definice 2 : BI je znalost podniku získaná za použití HW a SW technologií, která umožní přeměnit data organizace v informaci Definice 3 : sada procesů, aplikací a technologií, jejíchž cílem je účinně a účelně podporovat rozhodovací procesy ve firmě. Tyto procesy podporují analytické a plánovací činnosti podniků a organizací a jsou postaveny na principech multidimenzionálních pohledů na podniková data

Nástroje BI ERP systémy Dočasná úložiště (DSA: Data Staging Area) Operativní úložiště (ODS : Operational Data Store) Transformační nástroje (ETL : Extraction Transformation Loading) Integrační nástroje (EAI : Enterprise Application Integration) Datové sklady Datová tržiště OLAP Reportingové nástroje EIS (Executive Information Systém) Data Mining

Omezení ERP jako poskytovatele dat Neumožňují rychle a pružně měnit kriteria výběru Okamžitý přístup uživatelů k velkým objemům agregovaných dat ERP jsou primárně určeny k pořizovaní dat a jejich aktualizaci V každém podniku se objem dat za každých pět let zdvojnásobí, což ovšem také znamená, že systém je zahlcen redundantními daty Vícedimenzionální pohled na data v ERP je problematický. DB ERP není pro tento pohled stavěná. Databáze, které vzniknou přeměnou primárních dat z ERP a jsou využívány např. OLAP technologií jsou pro drilling a slice operace optimalizovány

Zjednodušené schéma využívání ERP ERP Transakce - položky Partneři DB ERP Podnik Zprávy Náhledy Informace (trendy) Informace Rozhodnutí Znalost metod řízení procesů a metrik Klíčová rozhodnutí Klíčová znalost

Schematické a zjednodušené schéma BI Extraction Transformation Loading

Jiný pohled na BI

Konstatování V poslední dekádě minulého tisíciletí firmy hýčkaly mantru ERP. Důvodem byla utkvělá představa, že miliony utracené za licence a implementační služby se projeví tak, že pro uživatele už nebude chytrost žádné čáry. A to navždy..

Organizačně-technologické schéma podniku Vedení podniku BI,ERP,EIS,datové sklady, reporting BI BI Dodavatelé EDI CRM Řízení výroby Řízení zdrojů, majetku a PAM Intranet, workflow,ois BI Řízení financí Řízení nákupu, prodeje a logistiky CRM EDI Zákazníci

OLAP kostka http://www.databaseanswers.org/designing_olap_cubes.htm Částky(prodej, náklady,doprava, ) Čas (Rok,Měsíc, den) řez

Relační dimenzionální model: STAR PRODUKT Kategorie Skupina Název cena Vařečka Jižní Čechy 12 ks 240 Kč Jan Hromada ČAS Rok Měsíc Den xxx =dimenze OBLAST Název Popis Prodejce

Relační dimenzionální model: SNOWFLAKE DIM:KATEGORIE Kategorie_ID Kategorie_název DIM: SKUPINA Skupina_ID Kategorie_ID Skupina_název Výsledek Produkt_ID Oblast_ID Čas_ID Prodej_ks Prodej_Kč DIM: PRODUKT Produkt_ID Skupina_ID Produkt_název DIM: ČÁST Čas_ID Čas_rok Čas_měsíc Čas_den DIM: OBLAST Oblast_ID Oblast_název

Datový sklad Podniková DB Transakce Zákazníci Dodavatelé Zakázky Atd. Atd. Kopie,, organizace dat Sumarizace dat Datoví horníci : Profíci vědí co chtějí Výzkumníci nepředvídané výsledky Datový sklad Dolování dat

Definice Datový sklad: základní komponenta BI Datové tržiště : subjektově orientované analytické DB- součást datového skladu Operativní datová úložiště : podpůrné analytické DB Dočasná úložiště dat : úložiště dat před jejich zpracování do databázových komponent řešení BI

Vrstvy pro analýzu dat Reporting : ad hoc dotazovací proces do DB komponent BI (ad hoc = k tomuto, za tímto účelem, pro tento jednotlivý případ OLAP : pokročilé a dynamické analytické úlohy Data Mining (dolování dat) : sofistikovaná analýza většího množství dat Algoritmy pro dolování dat : rozhodovací stromy Neuronové sítě Clustering a klasifikace

Datový sklad->datové tržiště (anglická verze) Data Mart Decision Support Information Data Warehouse Data Mart Decision Support Information Data Mart Decision Support Information

Vysvětlení pojmu METADATA Metadata jsou data o datech, kde pomocí předem definovaných dat s jasně danou a popsanou strukturou uchováváme informace o jiných datech. Typickým příkladem metadat jsou katalogizační záznamy v knihovnách, což byla jejich původní funkce.

Architektura OLAP (anglická verze) METADATA viz definice na předchozím snímku

Hlavní komponenty BI a jejich vazby ERP,CRM, EAI ETL Dočasné úložiště Operativní úložiště Datový sklad Datové úložiště Reporting Dolování dat Transformační nástroje (ETL : Extraction Transformation Loading) Integrační nástroje (EAI : Enterprise Application Integration)

Dolování dat Rozhodovací stromy Neuronové sítě Genetické algoritmy Clustering a klasifikace

Dolování dat Rozhodovací stromy (RS) - prediktivní model, který se zobrazuje v podobě stromu, kde každý uzel určuje kritérium pro následní rozvětvení. Strom rozděluje veškerá zdrojová data do segmentů, kde každý list odpovídá určitému segmentu definovanému předešlými uzly.data v jednom segmentu mají shodné vlastnosti.

B + tree-jeden z příkladů RS Data Dividers (no data) Searching Sandy = Search path

Příklad vytvoření RS Typy stromů : a) CART=Classificaion and Regression Trees (kriterium redukce směrodatné odchylky) b) CHAID =Chi-squared Automatic Interaction Detector http://lisp.vse.cz/~berka/docs/izi456/sl-idt.pdf

Rozdělení postaviček podle atributů Hlava Úsměv Ozdoba Tvar těla Předmět Přátelský Kruh Ne Kravata Čtverec Šavle NE Čtverec Ano Motýlek Čtverec NIC ANO Kruh Ne Motýlek Kruh Šavle ANO Trojúhelník Ne Kravata Čtverec Balon NE Kruh Ano NIC Trojúhelník Květina NE Trojúhelník Ne NIC Trojúhelník Balon ANO Trojúhelník Ano Kravata Kruh NIC NE Kruh Ano Kravata Kruh NIC ANO

Rozhodovací strom jako logický výraz

Neuronové sítě Neuronové sítě (NS) - užívané pro tvorbu prediktivních modelů, Jsou založeny na obdobných principech, které napodobují organizaci nebo způsob chování lidského mozku, založeném na systému neuronů. Synapse je vazba a má dva typy : Excitační (vybuzující) a Inhibiční (tlumící)

Učení neuronových sítí

Vícevrstvé neuronové sítě

OLAP databáze OLAP DB představují jednu nebo více souvisejících OLAP kostek OLAP kostka na rozdíl od datových skladů zahrnuje předzpracované agregace dat podle definovaných hierarchických struktur dimenzí a jejich kombinací Technologie OLAP má několik variant (uvádím zde pouze dvě z nich): MOLAP - Multidimensional OLAP (speciální uložené v multidimenzionálních-binárních kostkách) ROLAP Relational OLAP (uloží data do relační DB)

Datová pumpa Primární transakční systém (ERP,CRM,..) Datová pumpa Datový sklad

Datová pumpa (kritické místo celé aplikace) Datová pumpa, nebo-li ETL nástroj umožňuje efektivní zpracování velkých objemů z různých zdrojů a jejich uložení do datového skladu. Každý ETL nástroj musí umět: a) zpracovávat různorodá data obvykle fyzicky umístěná na různých místech, b) navrhovat transformace pro přenos dat mezi různými datovými formáty Primární transakční systém (ERP,CRM,..) Pumpa, provádějící Transformaci dat Datový sklad Zpracování = odstranění redundancí, agregace podle dimenzí, zapomínání dat Zapomínání dat = úmyslné odstranění nepotřebných dat z datového skladu

Datová pumpa (kritické místo celé aplikace) Datová pumpa = Extraction Transformation and Loading = ETL Primární transakční systém (ERP,CRM,..) Pumpa Datový sklad Položky zboží Položky ocenění Věcné položky Pumpa 2006 (1)->2006 (3) časový filtr-dimenze čas Částečná změna struktury dat a případně další aplikace dimenzí (oblast, typ zákazníka,.. ) Test správnosti dat (konzistence) Zákaznické položky 2002 (4)->2007 (2) IF NOT OK THEN Opravná zpětná vazba=true