BIG DATA. Nové úlohy pro nástroje v oblasti BI. 27. listopadu 2012

Podobné dokumenty
Big Data od velkých očekávání k praktickému využití. DSW, Praha,

Základy business intelligence. Jaroslav Šmarda

BIG DATA je oveľa viac ako Hadoop. Martin Pavlík

Datová věda (Data Science) akademický navazující magisterský program

v praxi Rizika a přínosy zavádění BI jako nástroje pro řízení podnikání

GIS jako důležitá součást BI. Jan Broulík, Petr Panec ARCDATA PRAHA, s.r.o.

Řešení ochrany databázových dat

Aktuální otázky provozu datových skladů PAVEL HNÍK

Business Intelligence

CPM/BI a jeho návaznost na podnikové informační systémy. Martin Závodný

Téma dizertační práce - Strategie ŠKODA AUTO pro čínský trh

Webová analytika v kostce. Pavel Jašek Marketing Monday 7. listopadu 2011

Datová kvalita základ úspěšného BI. RNDr. Ondřej Zýka, Profinit

Snadný a efektivní přístup k informacím

Jan Horák. Pilíře řešení

Petr Náhlovský, Servodata a.s. Michal Oškera, AUKRO s.r.o. IT PROJEKT ROKU 2017

Business Intelligence

Profitabilita klienta v kontextu Performance management

PostgreSQL jako platforma pro datové sklady

Datasheet SanDisk Řada PCIe-SSD Fusion iomemory PX600 Server

Centralizace aplikací ve VZP

Nabízíme řešení. v oblastech: integrací zdrojů dat:

Integrované řešení pro správu informací - Microsoft

Tovek Server. Tovek Server nabízí následující základní a servisní funkce: Bezpečnost Statistiky Locale

ARBES BI MODERNÍ ŘEŠENÍ pro podporu strategického, taktického a operativního řízení.

Základní informace o co se jedná a k čemu to slouží

Netezza. Martin Pavlík. 2. Února to pravé řešení pro analytický datový sklad

Benefity při práci se systémem konsolidovaných pacientských dat. Ing. Ladislav Pálka, MBA C SYSTEM CZ a.s.

Analýzou dat k efektivnějšímu rozhodování

QAD Business Intelligence

PRODUKTY Tovek Server 6

ARCHITEKTURA INFORMAČNÍCH SYSTÉMŮ PODLE ÚROVNĚ ŘÍZENÍ

Helios Easy. integrované řešení pro řízení

Aplikace moderních analytických a optimalizačních metod na data získaná z technologií Smart Metering

Servisně orientovaná architektura Základ budování NGII

Sjednotit, zjednodušit, posílit. posílit. Rackové servery Cisco UCS C-Series. Obchodní přehled

Obsah ČÁST I JAK SE UCHÁZET O ZÁKAZNÍKY NA WEBU KAPITOLA 1

PREZENTACE ŘEŠENÍ CSX

Regionální zdravotnické integrační projekty a co je ovlivňuje. Martin Zubek

Chytrá systémová architektura jako základ Smart Administration

Vývoj moderních technologií při vyhledávání. Patrik Plachý SEFIRA spol. s.r.o.

Datasheet Úložiště Fujitsu ETERNUS LT60 S2 Páskový systém

Role BI v e-business řešeních pohled do budoucnosti

Databázové systémy I. 1. přednáška

Konsolidace rezortních registrů. 4. dubna 2011

Konsolidace nemocničních informačních systémů v prostředí cloud infrastruktury

Elektronická podatelna a výpravna České správy sociálního zabezpečení v návaznosti na systém datových schránek

Projektové řízení jako základ řízení organizace

ECM. Jaroslava Klegová

Internet věcí & Cloud Systémy v Energetice Miroslav HLADÍK Toshiba Corp. Energy Systems & Solutions Company

Databázové systémy úvod

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

Obohacení dat o statistické výsledky a potenciál jejich využití

Moderní úřad v éře Smart Cities

Manažerský informační systém pro efektivní řízení zdravotnictví ve Středočeském kraji

Data nejsou odpad, data jsou zlato!

Big Data a oficiální statistika. Unicorn College Open 24. dubna 2015 Doc. Ing. Marie Bohatá, CSc.

RDF DSPS ROZVOJ PORTÁLU

Informace. v ceně života

Monitorování a audit databází v reálném čase. Ing. Jan Musil IBM Česká republika

Manažerský informační systém na MPSV. Mgr. Karel Lux, vedoucí oddělení koncepce informatiky MPSV

Petr Vaněk

SW pro správu a řízení bezpečnosti

Optimalizaci aplikací. Ing. Martin Pavlica

Řízení znalostí, týmová spolupráce a vyhledávání ve velkých a středních firmách

3. Očekávání a efektivnost aplikací

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

Zajištění bezpečného provozu aplikací. odpovídající současným požadavkům

Tovek Tools. Tovek Tools jsou standardně dodávány ve dvou variantách: Tovek Tools Search Pack Tovek Tools Analyst Pack. Připojené informační zdroje

Analýza nestrukturovaných dat pomocí Oracle Endeca Information Discovery

Simplify I.T. ve veřejném sektoru. Josef Švenda Country Leader, Oracle Czech

ICT - požehnání nebo prokletí

Inovace CRM systémů využitím internetových zdrojů dat pro malé a střední podniky. Ing. Jan Ministr, Ph.D.

Den pro partnery Masarykova universita - Fakulta informatiky

Digitalizace a oběh dokumentů VUMS LEGEND, spol. s.r.o.

Infor Performance management. Jakub Urbášek

powerful SAP-Solutions

IBM Content Manager Collaboration Edition ECM služby pro IBM Lotus Quickr

Připojte se ještě dnes

BPC On Hana embedded. Mibcon. Karel Vydra

Data Science projekty v telekomunikační společnosti

Geografické informační systémy ArcGIS Pavel Juška (jus011) 4. března 2010, Ostrava

Ondřej Bothe, Richard Dobiš

Rozšíření systému na sledování státní a veřejné podpory pro Ministerstvo financí

Systémy pro podporu. rozhodování. 2. Úvod do problematiky systémů pro podporu. rozhodování

Použití databází na Webu

České Budějovice. 2. dubna 2014

Analytické systémy nad Hadoopom. Lukáš Antalov, Vedoucí týmu vývoje

KAM SMĚŘUJE VYHLEDÁVÁNÍ. Pavel Kocourek SEARCH TECHNOLOGIES, formerly INCAD INFORUM

Moderní metody automatizace a hodnocení marketingových kampaní

Máte již dobře vyzbrojeného firemního SYNTETIKA?

PRODUKTY. Tovek Tools

DMS - řízená dokumentace, archiv a co dále? ICT ve zdravotnictví 2014

Integrace a komunikace IT ve zdravotnictví

icc Next Generation atlantis Copyright 2011, atlantis

Martin Šindlář Competence leader SAP Basis and Software Engineering. Connected manufacturing

Datasheet Úložiště Fujitsu ETERNUS LT20 S2 Páskový systém

Databáze Bc. Veronika Tomsová

SAP PROCUREMENT DAY SAP CLM (Contract Lifecycle Management) Správa životního cyklu kontraktů. smooth business flow

Využití mobilní technologie O2 pro dohledové systémy a sběr medicínských dat

Transkript:

BIG DATA Nové úlohy pro nástroje v oblasti BI 27. listopadu 2012

AGENDA 1. Úvod 2. Jaké jsou potřeby? 3. Možné řešení 2

Jaké jsou potřeby?

Dopady Analýza dat potřeba nového přístupu Jak na nestrukturovaná data Oblasti Tradiční přístup Nový přístup Škálovatelnost Ne Ano Velké objemy dat (všechna dostupná data) Ne Ano Vzorkování údajů Ano Ne Rozmanitost údajů (strukt./nestrukt.) Simultánní data a zpracování dotazů Rychlý přístup ke všem informacím Rychlá analýza dat při vysokém poměru (GB/sec) Přesnost analytických modelů Ne Ne Ne Ne Ne Ano Ano Ano Ano Ano Std. reporty Co je to nejlepší, co se může stát? Jak toho dosáhnout? Co se stane bude-li trend pokračovat? Proč se to stalo? Ad-hoc reporty Dotaz Drilldown Co se stalo? Upozornění Co se stane příště? Statistická analýza Jak hodně, jak často, kde? Předpovídání Co je nutné udělat? Máme příležitost nebo problém? Prediktivní analýza Optimalizace Stupeň inteligence 4

Evoluce pokročilých analytických nástrojů Kam směřuje vývoj Tradiční DW/BI Současný vývoj DW/BI Konvergovaná Big Data 5 Může být plně automatizované Dodržování přesných pravidel je nutnou podmínkou Omezena na typy dat Řízení transakcí (OLTP) Objemy dat (paměti GB > TB) Tradiční DW/BI Analytické nástroje jako součást DB Dávkové procesy nestrukturovaných dat Pokročilé analytické metody Zpoždění vs. Rychlost + komprese dat Vyžaduje zásah člověka Objem dat může být TB > PB Zlepšuje výkon systému tím, že dokáže škálovat výkon Statistické údaje - tvorba, vyhledávání a data mining Traditional DW/BI Analytické nástroje jako součást DB Pokročilé analytické metody Open source nástroje Nová pochopení všech multi-strukturovaných dat Analytické služby v reálném čase Vyšší rychlost s nízkou latencí Zpracovávat informace v paměti, v čase, na místě

Big Data hlavní atributy Objem dat, rychlost, rozmanitost a složitost jsou hlavní atributy Objem Rozmanitost Objem Rychlost Rozmanitost Složitost Rychlost Složitost 6

Změny architektury Big Data Atributy Objem Rychlost Rozmanitost Složitost Vliv na vývoj architektury Kapacita infrastruktury Škálovatelnost architektury Propustnost v reálném čase Komplexní zpracování událostí Rozsáhlý soubor datových typů Sociální kontext, multimedia, kancelářské dokumenty, maily Pokročilé analytické algoritmy Vyhledávání Možnosti Paralelní procesy SQL a sloupcové vyhledávání s kompresí Paralelní zpracování toku dat s minimalizací I/O DBMS s analytickými nástroji v reálném čase Vyhledávací a analytický engine Příprava metadat Specializované technologie Procesy řízené pravidly 7

Pět podstatných kroků Pro úspěšnou implementaci projektu Big Data 1. Identifikovat nové typy dat, zdrojů, skupin a komunit 2. Automatizovat sběr dat - strojem generované informace, protokoly webových stránek a aplikací, nastavení sond nebo celých sítí 3. Snížit zpoždění při zpracování dat, přejít k jejich vyhodnocování v téměř reálném čase 4. Změnit chování na základě historických dat nebo vygenerovat nové postupy rozhodování 5. Rozvíjet schopnost zachytit, ukládat, sdílet, analyzovat a využívat Big data informace, integrované s již existujícím řešením v oblasti Business Intelligence 8

Možné řešení

Informační platforma příští generace Informační platforma příští generace Kontextové zpracování Rychlé zpracování Zhodnocení zdrojových dat Autonomy + Vertica + Hadoop Sociální sítě Video Audio Email Texty Mobilní svět 10 Transakční data Dokumenty IT/OT Vyhledávací stroje Obrázky

Pokročilá analýza SQL Informační taxonomie Agregace NoSQL Nástroje pro pokročilé analýzy Hadoop Open source úložiště pro ukládání a analýzu velkého množství dat Zpracování na bázi významu Jednoduchost, nízké náklady nasazení Škálovatelný výkon Autonomy + IDOL IDOL 10 = Intelligent Data Operation Layer 10 Kontextová analýza Konektory do 400 různých druhů úložišť Kontextová metadata Úložiště provozních dat Teradata, Oracle, DB2 Úložiště analytických dat Vertica Hadoop Úložiště nestrukturovaných dat Strukturovaná Transakční data Nestrukturovaná uživatelská data Vertica Sloupcové zpracování, hluboká komprese Clustering a škálovatelnost Administrace za provozu Práce v reálném čase 11 Agregace (IDOL) Transformace informací Automatizace procesu transformace informací Systémová data

Děkuji za pozornost jiri.vacha@hp.com

Případové studie

Telekomunikace Případová studie Vertica Zabránit ztrátě obchodního podílu (zákazníků) - churn Konkurenční trh s kombinací vysoké a nízké marže Rostoucí objem dat versus možnosti starší infrastruktury Řešení Analyzovat portfolio služeb pro srovnání trendu ztráty zákazníků a jejich spokojenosti Upřednostňovat investice do infrastruktury s vysokou přidanou hodnotou, udržení vysoké marže na stávající telekomunikační infrastruktuře a aplikacích prostřednictvím empirických údajů Výhody Vyšší spokojenost zákazníků, udržení podílu trhu a ziskovost Dynamicky spravovat a rozšiřovat portfolio služeb aniž by dramaticky vzrůstaly nároky na nové investice a byla zajištěna kontinuita získávání podrobných informací o každém zákazníkovi a jeho chování 14

Internetové hry / Simulace Případová studie Vertica Pochopení uživatelského chování v rámci kampaně nebo aktivity Kvantifikace přínosů vylepšení nebo změny na základě uživatelské zkušenosti Maximalizace dopadu činnosti uživatele a s tím související hodnota značky Řešení Zachytit a analyzovat empirická data v průběhu kampaně nebo činnosti Úpravy uživatelského rozhraní za provozu prostřednictvím kontrolních skupin s na základě iterační analýzy pro měření výsledků Kontinuální měření spokojenosti uživatelů, povědomí o značce Výhody Dramaticky se zvýšil výkon v prováděných kampaních nebo činnostech Zvýšení uživatelské spokojenosti, ziskovosti i loajality uživatelů 15

Finanční segment Případová studie Vertica Dynamické trhy, kolísavé ocenění aktiv, nevyužité zdroje Objem dostupných dat ztěžuje analýzu Dodržování legislativních omezení a permutace datových modelů Řešení Komplexní analýza strukturovaných, částečně strukturovaných a nestrukturovaných dat Práce s daty získanými z aktuálně prováděné analýzy Simulace trhu, účinnost a legislativní shoda v jediné platformě Výhody Prediktivní náhled do zákaznických potřeb a sledování vývoje trhu Dramaticky zvýšení výkonu a hodnoty aktiv Prakticky neomezené portfolio simulací a modelů oceňování 16

Zdravotnictví Případová studie Vertica Pořizování obrovského množství dat lékařských dat o pacientovi na základě dostupné úrovně poskytované lékařské péče (diagnostika, laboratorní výsledky, medikace (preskripce) Řešení Identifikovat kritické zdravotnické faktory ovlivňující kvalitu poskytované péče, zabránit možným kolizním stavům vedoucí k poškození pacienta, Identifikovat ekonomické faktory při poskytování zdravotní péče, týkajících se zejména nákladů na pořizování zdravotnického materiálu a přístrojového vybavení, využití personálních zdrojů, vlastního poskytnutí výkonu zdravotní péče a zvýšení kvality plánování PŘÍNOSY Analyzovat různorodé zdravotní a farmaceutické údaje při vytváření komplexní diagnózy pacienta Výrazně zlepšit efektivitu zdravotních programů za současného snížení nákladů spojených s poskytováním zdravotní péče Optimalizovat řízení dostupné kapacity zdravotní péče Odhalovat negativní aktivity v procesu poskytování zdravotní péče, kde by mohlo dojít k finančním ztrátám nebo fraudu 17