Analýza a vizualizace dat

Podobné dokumenty
METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1

Základy business intelligence. Jaroslav Šmarda

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9

Marketingová komunikace. 3. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK3PH (vm3bph)

Datová věda (Data Science) akademický navazující magisterský program

ARCHITEKTURA INFORMAČNÍCH SYSTÉMŮ PODLE ÚROVNĚ ŘÍZENÍ

Business Intelligence nástroje a plánování

Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph)

Ukázka knihy z internetového knihkupectví

Architektury Informačních systémů. Jaroslav Žáček

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

Stručný obsah. K2118.indd :15:27

Architektury Informačních systémů. Jaroslav Žáček

Obsah. Funkce grafu Zdrojová data pro graf Typ grafu Formátování prvků grafu Doporučení pro tvorbu grafů Zdroje

Profitabilita klienta v kontextu Performance management

Pojem a úkoly statistiky

Nová dimenze rozhodovacího procesu

Informační systémy 2006/2007

ECM. Enterprise Content Management. čt 9:15 Petr Bouška (xboup00) Zbyněk Hostaš Lukáš Maršíček Martin Nikl (xnikm00)

ELO Analytics Vaše obchodní metriky na jednom místě. Vaše obchodní metriky na jednom místě. Enterprise Content Management

Ing. Petr Kalčev, Ph.D.

Nabízíme řešení. v oblastech: integrací zdrojů dat:

Surfujte v business analýze jako profík. Naučíme Vás podpořit klíčová rozhodnutí firmy.

Business Intelligence

Využití IT nástrojů pro měření a řízení výkonnosti. Michal Kroutil

Zdokonalování gramotnosti v oblasti ICT. Kurz MS Excel kurz 6. Inovace a modernizace studijních oborů FSpS (IMPACT) CZ.1.07/2.2.00/28.

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA Sylabus pro předmět STATISTIKA Pomůcky... 7

Získávání znalostí z databází. Alois Kužela

Big Data od velkých očekávání k praktickému využití. DSW, Praha,

Úvod do informačních a řídicích systémů. lení

10. Předpovídání - aplikace regresní úlohy

Modelování procesů s využitím MS Visio.

Analytické znaky laboratorní metody Interní kontrola kvality Externí kontrola kvality

ZÁKLADNÍ NÁSTROJE ŘÍZENÍ JAKOSTI

Trendy v (mobilní) Business Inteligence v ČR dotazníkové šetření

Business Intelligence. Adam Trčka

Nabízíme řešení. v oblastech: integrací zdrojů dat:

IBM SPSS Decision Trees

Předmluva 11 Typografická konvence použitá v knize Úvod do Excelu

MS Excel grafická prezentace dat

Základní informace o co se jedná a k čemu to slouží

Surfujte v business analýze jako profík. Naučíme Vás podpořit klíčová rozhodnutí firmy.

7. Rozdělení pravděpodobnosti ve statistice

GIS Geografické informační systémy

ANALÝZA NÁKUPNÍHO KOŠÍKU SEMINÁŘ

23. Matematická statistika

OVLÁDÁNÍ RIZIKA ANALÝZA A MANAGEMENT

HR reporting aneb kouzla s daty Jan Pavelka

MULTIMEDIÁLNÍ A HYPERMEDIÁLNÍ SYSTÉMY

Podpora manažerského rozhodování užitím Business Intelligence Ing. Jan Klimeš, ORTEX spol. s r.o., Hradec Králové

Fyzikální laboratoř. Kamil Mudruňka. Gymnázium, Pardubice, Dašická /8

Tovek Tools. Tovek Tools jsou standardně dodávány ve dvou variantách: Tovek Tools Search Pack Tovek Tools Analyst Pack. Připojené informační zdroje

Bezpečně Vás provedeme světem GIS. Možnosti a přínosy využití GIS při zpracování dat

Business Intelligence a datové sklady

Soukromá střední odborná škola Frýdek-Místek, s.r.o.

Analýza dat na PC I.

Inovace bakalářského studijního oboru Aplikovaná chemie

Obsah. Seznámení s prostředím Excelu. Poděkování 25 O přiloženém CD 26 Co je na CD 26 Použití CD 26 Systémové požadavky 26 Podpora 27

Měření závislosti statistických dat

III. Informační systém & databáze

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat

TVORBA GRAFŮ A DIAGRAMŮ V ORIGIN. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Informační systémy. Jaroslav Žáček

Inteligentní zpracování prostorových dat

Manažerská ekonomika KM IT

QAD Business Intelligence

Snadný a efektivní přístup k informacím

2. Systémová analýza SA návrhová část projektu = příručka projektu - systémový přístup k analýze problémů, nejdůležitější etapa projektu - podrobné st

základní FAkTA CO Je PROFeSSIOnAL COMPUTInG? CíLOVÁ SkUPInA DISTRIBUCe

Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář,

Analýza a prezentace dat

Základy algoritmizace, návrh algoritmu

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

Kapitola 1 INTERNÍ AUDIT A JEHO POSTUPY 5. Kapitola 2 LOGIKA V INTERNÍM AUDITU 11

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group

Podnikové informační systémy Jan Smolík

Bezpečné město Zvýšíme bezpečnost měst v ČR. Libor Webster, Tomáš Ulrych

Úvodem Dříve les než stromy 3 Operace s maticemi

GIS S SYSTÉMY KRIZOVÉHO ŘÍZENÍ. Bc. Vladimír Bátrla,BAT027

CPM/BI a jeho návaznost na podnikové informační systémy. Martin Závodný

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

TREND POPIS ODPOVĚDNOSTI PRACOVNÍKA MANAŽER VÝVOJE

Název DUM: VY_32_INOVACE_2B_16_ Tvorba_grafů_v_MS_Excel_2007

Moderní systémy pro získávání znalostí z informací a dat

Controlling ve zdravotnických zařízeních

přesné jako tabulky, ale rychle a lépe mohou poskytnou názornou představu o důležitých tendencích a souvislostech.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

MS Excel druhy grafů

Statistika pro geografy

Analytika a SAP Quo Vadis? Jiří Přibyslavský Performance Management & Business Intelligence Business Consultant

Richard Bébr Petr Doucek PRO PODPORU MANAZERSKE PRÁCE

Modelování podnikových procesů

František Hudek. červenec 2012

Databázové systémy. 10. přednáška

IQ - SixSigma. IQ SixSigma Software pro analýzu a sledování procesů

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Uživatelská doumentace

3.5.2 Členění a klasifikace kontrolních procesů Kritéria hodnocení používaná v kontrolní činnosti Specifika strategické kontroly 3.

Marketingová komunikace. 2. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK1aPH/N9KMK1bPH (um1a1ph/um1b1ph)

Hlavní rysy produktu MapInfo Professional

Transkript:

Analýza a vizualizace dat Business intelligence Jednou z dalších oblastí, která spadá do sféry systémové integrace, je návrh a implementace řešení, spadajících do oblasti nazývané Business Intelligence (BI). Jedná se o integraci informací a znalostí, uložených v databázích, jejich následná analýza a prezentace řídicím pracovníkům pro podporu rozhodovacích procesů. Pojem byl zaveden v roce 1989 (Howard Dresner) jakožto souhrn konceptů, metodik a nástrojů, které zlepšují rozhodovací proces. Do této kategorie patří následující softwarové prostředky: Datový sklad (Data Warehouse) OLAP (On-line Analytical Processing) Dolování dat (Data Mining) Důvod vzniku BI je různorodost a značná velikost provozních databází (OLTP; On-line Transaction Processing). Získání spontánních informací pro podporu manažerského rozhodování je sice z OLTP databází možné, avšak je hodně pracné a neefektivní. Databáze také mohou obsahovat informace, které jsou nějakým způsobem zahaleny a je třeba je vydolovat. Obr. 9.1 Schéma prostředků business intelligence [Zdroj: datawarehouse4u] Typy problémů, které lze řešit pomocí dolování dat 1. Klasifikace: Proč ztrácíme zákazníky? Bude produkt úspěšný? 2. Regrese závislost mezi dvěma proměnnýma. Regrese může být lineární nebo logická. Do této kategorie úloh patří odhad tržby, příčina platební neschopnosti, odhad ceny bytů v závislosti na lokalitách apod. APS EKO 09 Analýza a vizualizace dat 1

3. Shlukování (segmentace) matematicky jde o rozdělení do množin dle společných znaků, např. segmentace zákazníků 4. Přiřazování (asociace) např. analýza nákupního koše odhalení produktů, které se prodávají společně 5. Prognózování trendy, cykly 6. Analýza časových řad předpověď trendu, forecasting 7. Risk management pravděpodobnost výskytu událostí, např. podvodného jednání v bance 8. Analýza sekvencí nalezení vzorců v řadách diskrétních hodnot (stavů) např. sekvence procházení firemního webu návštěvníkem 9. Analýza odchylek nalezení objektů, které jsou velmi odlišné od ostatních; využití např. při detekci podvodů (banky) nebo detekce výrobních vad 10. Analýza textu (nestrukturovaných dat). Při analýze dat posuzujeme: Spolehlivost dává metoda při opakovaném nasazení stejné výsledky? Platnost zachycuje měření objekt přesně? Použitelnost můžeme na základě informací provádět rozhodnutí? Big Data Objem dat pořizovaných a zpracovávaných v informačních systémech neustále roste. Zároveň se objevují úlohy, kdy je nutné zpracovat data, která nemají striktně strukturovaný charakter. Vznikl nový fenomén, označovaný termínem Big Data. Existuje celá řada definic, podstatu ale nejlépe vystihuje definice dle Gartner: Big Data jsou soubory dat, jejichž velikost je mimo schopnosti zachycovat, spravovat a zpracovávat data běžně používanými softwarovými nástroji v rozumném čase. Základní charakteristika Big Data: Objem (Volume) množství dat vznikajících v rámci provozu firem roste exponenciálně každý rok, Typ (Variety) různorodost typů dat vzrůstá, například nestrukturované textové soubory, semi-strukturovaná data (XML), data o geografické poloze, data z logů, Rychlost (Velocity) rychlost s jakou data vznikají a potřeba jejich analýzy v reálném čase vzrůstá díky pokračující digitalizaci většiny transakcí, mobilním zařízením a vzrůstajícímu počtu internetových uživatelů. Řešení pro Big Data je dvojí: a) HW a navyšování zdrojů b) Distribuované řešení dat a jejich managementu APS EKO 09 Analýza a vizualizace dat 2

Prezentace a vizualizace dat Prezentační vrstva BI může být realizována například prostřednictvím Excelu (kontingenční tabulka) nebo podnikového portálu (např. SharePoint od Microsoftu, Alfresco, Google Cloud). V souvislosti s prezentací firemních informací se můžeme setkat také s termíny dashboard nebo scorecard. Dashboard zobrazování sumárních podnikových dat pomocí interaktivního GUI. Dashboard si můžeme představit jako palubní desku. Zatímco u automobilu nám dashboard dává přehled informací o řízení auta, firemní dashboard informuje manažera o stavu řízení a ekonomických výsledcích firmy. Scorecard ukazuje srovnání skutečnosti oproti plánu. Balanced Scorecard Jde o systém sledování a managementu podniku ve čtyřech oblastech: finanční hodnoty perspektiva zákazníka podnikové procesy inovace, učení se, flexibilita a růst Životní cyklus reportů se skládá z: návrh správa - doručení Grafy Kategorie grafů: Distribuce sloupcové, bodové grafy Kompozice - jak se rozkládá celek do dílů - koláčové, stromové, sloupcové Trendy spojnicové, plošné grafy Vztahy a srovnání bublinové, bullet grafy Schémata grafů: Sekvenční - seřazení hodnot od nízkých po vysoké Divergentní - existuje klíčový bod (např. průměr) Kategorická - rozdílné skupiny: kontrastní barva Typy grafů: Koláčový pro znázornění jak se celek rozpadá na části; při velkém počtu částí nepřehledný Spojnicový hodí se pro změny hodnot v čase a trendy; omezení velký počet řad brání rozlišení APS EKO 09 Analýza a vizualizace dat 3

Sloupcový vhodný pro srovnání hodnot u řady položek Bublinový graf hledání mezních hodnot, zobrazení extrémů Bullet graf sloupcový graf obsahující aktuální hodnotu a referenční (kam míříme) Paretův diagram kombinace sloupcového a čárového grafu; sloupce znázorňující četnost pro jednotlivé kategorie jsou seřazeny podle velikosti (nejvyšší vlevo) čára představuje kumulativní četnost; používá se pro znázornění důležitosti jednotlivých kategorií Trychtýřový graf (Funnel chart) Paprskový graf Prstencový graf Dendogram shluková analýza horizontální osa vyjadřuje vzdálenost mezi jednotlivými shluky Cladogram použití v biologii pro klasifikaci organismů Polární graf zaznamenávání dat, která vykazují určitou cykličnost, či se u nich zjišťuje směr Vodopádový graf (Waterfall/Bridge chart) Svícový graf (Candlestick chart) vhodný pro znázornění trendu, zobrazuje nejvyšší a nejnižší hodnotu (např. cenu) Histogram rozložení hodnot, znázornění distribuce dat; výška sloupců vyjadřuje četnost veličiny v daném intervalu Myšlenková mapa grafické uspořádání klíčových slov Průběhový diagram (Run chart) Regulační diagram (Control chart) - zobrazuje změny určité sledované veličiny v čase; typicky se používá pro sledování a analýzu procesů. Korelační diagram (Scatter diagram) znázorňuje statistickou závislost a vztah dvou naměřených hodnot (např. pro opakované srovnávání naměřených hodnot, spokojenost zákazníků, údaje o kvalitě výroby ) Obr. 9.2 Bullet chart APS EKO 09 Analýza a vizualizace dat 4

Obr. 9.3 Paretův diagram [Zdroj: Wikipedie] Obr. 9.4 Trychtýřový graf APS EKO 09 Analýza a vizualizace dat 5

Obr. 9.5 Candlestick chart (svícový graf) Obr. 9.6 Polární graf [Zdroj: http://office.lasakovi.com/excel/grafy/polarni-grafy-excel/] APS EKO 09 Analýza a vizualizace dat 6