BIG DATA je oveľa viac ako Hadoop. Martin Pavlík



Podobné dokumenty
Hadoop a HDFS. Bc. Milan Nikl

BIG DATA. Nové úlohy pro nástroje v oblasti BI. 27. listopadu 2012

Business Intelligence

Analytické systémy nad Hadoopom. Lukáš Antalov, Vedoucí týmu vývoje

Datová věda (Data Science) akademický navazující magisterský program

Business Intelligence nástroje a plánování

Big Data od velkých očekávání k praktickému využití. DSW, Praha,

Netezza. Martin Pavlík. 2. Února to pravé řešení pro analytický datový sklad

Jednorázová hesla pro zvýšení bezpečnosti vzdáleného přístupu mobilních uživatelů

PostgreSQL jako platforma pro datové sklady

TM1 vs Planning & Reporting

Přizpůsobení JSTL pro Google App Engine Datastore

MBI - technologická realizace modelu

Infor Performance management. Jakub Urbášek

Marketingová komunikace. 3. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK3PH (vm3bph)

ŠKOLENÍ PROGRAMOVACÍHO JAZYKA JAVA JAVA - ZÁKLADY

Moderní metody automatizace a hodnocení marketingových kampaní

Fyzické uložení dat a indexy

SEARCH & BIG DATA [ & ANALYTICS] INFORUM 2015, Pavel Kocourek

MetaCentrum. datové služby. Miroslav Ruda, Zdeněk Šustr

Vývoj moderních technologií při vyhledávání. Patrik Plachý SEFIRA spol. s.r.o.

Nová generace analytik mění zažité způsoby BI

Hadoop, Hive a Spark: Využití pro data mining. Václav Zeman, KIZI VŠE

<Insert Picture Here> Na co se můžete s Oracle BI těšit

Řešení ochrany databázových dat

Petr Náhlovský, Servodata a.s. Michal Oškera, AUKRO s.r.o. IT PROJEKT ROKU 2017

Aplikace moderních analytických a optimalizačních metod na data získaná z technologií Smart Metering

V čem nám pomáhá datový sklad. Ing. Dana Buřičová Odbor analýz a podpory řízení KrÚ Kraje Vysočina

Základy business intelligence. Jaroslav Šmarda

Business Intelligence Hlavní témata, která budou v roce 2015 určovat vývoj business intelligence řešení a služeb.

Publikujeme web. "Kam s ním?!"

Možnosti propojení Lotus Notes/Domino a jiných systémů. Ondřej Fuxa Your System spol. s r.o.

Ing. Jaroslav Kačmařík, Ing. Břetislav Nesvadba Využití GIS v oblasti železniční infrastruktury

UAI/612 - Cloudová Řešení. Technologie

IBM BigData Analytics

Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph)

Systémová administrace portálu Liferay

Analýzou dat k efektivnějšímu rozhodování

C# - Databáze úvod, ADO.NET. Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T.G. Masaryka, Kostelec nad Orlicí

Integrace prostředí pomocí TDI v praxi

Vnitřní integrace úřadu Středočeského kraje

Databázové a informační systémy

Vybraná zajímavá Lotus Notes řešení použitelná i ve vašich aplikacích. David Marko TCL DigiTrade

Možnosti aplikací Google pro analýzu (geo(

Současný svět Projekt č. CZ.2.17/3.1.00/32038, podpořený Evropským sociálním fondem v rámci Operačního programu Praha adaptabilita

Analýza nestrukturovaných dat pomocí Oracle Endeca Information Discovery

IBA CZ průmyslový partner FI MU

KAM SMĚŘUJE VYHLEDÁVÁNÍ. Pavel Kocourek SEARCH TECHNOLOGIES, formerly INCAD INFORUM

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

Platforma ArcGIS. Platforma ArcGIS se skládá ze čtyř komponent: dat, zdrojů, portálu a aplikací.

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

Wonderware Information Server 4.0 Co je nového

Jedním z technologických. Big Data: Business Intelligence budoucnosti má jméno Hadoop. Business Analytics. Big Data

O autorech 13 O odborném korektorovi 13. Poděkování 15 Úvod 17. Cílová skupina této knihy 17 Témata této knihy 17

Manažerský informační systém na MPSV. Mgr. Karel Lux, vedoucí oddělení koncepce informatiky MPSV

Korporátní identita - nejcennější aktivum

PŘÍPADOVÁ STUDIE ÚŘAD MĚSTSKÉ ČÁSTI PRAHA 3

Tvorba počítačových clusterů pomocí Linuxu. Vedoucí práce: Mgr. Jiří Pech, Ph.D. Katedra informatiky

Open Source projekty pro Big Data

Základy databází. O autorech 17 PRVNÍ ČÁST. KAPITOLA 1 Začínáme 19

Správa dat v podniku. MI-DSP 2013/14 RNDr. Ondřej Zýka, ondrej.zyka@profinit.eu

Tovek Server. Tovek Server nabízí následující základní a servisní funkce: Bezpečnost Statistiky Locale

Obsah ČÁST I JAK SE UCHÁZET O ZÁKAZNÍKY NA WEBU KAPITOLA 1

Dell Statistica V12.7 novinky ve verzi

Úvod. Klíčové vlastnosti. Jednoduchá obsluha

Sísyfos Systém evidence činností

Srovnání SQL serverů. Škálovatelnost a výkon. Express Workgroup Standard Enterprise Poznámky. Počet CPU bez limitu Obsahuje podporu

Architektura GIS KMA/AGI. Karel Jedlička

PROGRAMÁTOR ANALYTIK. Náplň práce:


ARBES BI MODERNÍ ŘEŠENÍ pro podporu strategického, taktického a operativního řízení.

Aktuální otázky provozu datových skladů PAVEL HNÍK

Specializace Návrhář software na základě analýzy vytváří návrh softwarových aplikací ve formě schémat a diagramů.

Microsoft Azure Workshop

Geografické informační systémy ArcGIS Pavel Juška (jus011) 4. března 2010, Ostrava

Registrační číslo projektu: CZ.1.07/1.5.00/ Elektronická podpora zkvalitnění výuky CZ.1.07 Vzděláním pro konkurenceschopnost

Obsah. Předmluva 13. O autorovi 15. Poděkování 16. O odborných korektorech 17. Úvod 19

Databázové a informační systémy Jana Šarmanová

GIS a nemapové služby

Systém detekce a pokročilé analýzy KBU napříč státní správou

LINUX - INSTALACE & KONFIGURACE

Bioadresář. Specifikace požadavků. Verze Datum Projektový tým Bc. Martin Ventruba Bc. Ondřej Veselý Bc. Stratos Zerdaloglu

Bezpečnost a BigData

Nové jazykové brány do Caché. Daniel Kutáč

Nová dimenze rozhodovacího procesu

ATS Global B.V. ATS Bus.

Cloud Slovník pojmů. J. Vrzal, verze 0.9

ízení softwarových aktiv bez starostí COMPAREX SoftCare Jaroslav Šabacký Senior Consultant SoftCare, COMPAREX CZ s.r.o.

Současné trendy v oblasti Business Intelligence

Microsoft SharePoint Portal Server Zvýšená týmová produktivita a úspora času při správě dokumentů ve společnosti Makro Cash & Carry ČR

Použití databází na Webu

Efektívne riadenie financií v ISS Facility Services Prípadová štúdia BI

Zkušenosti z nasazení a provozu systémů SIEM

Manuscriptorium jako základ pro virtuální badatelské prostředí

Integrace podnikových Open Source aplikací v praxi. RNDr. Petr Novák, Open Source Conference Praha, 19. duben 2011

NTK Discovery. Od katalogu k centralizovanému vyhledávání

Trendy v budování datových center v roce Praha,

CPM/BI a jeho návaznost na podnikové informační systémy. Martin Závodný

B0M33BDT Technologie pro velká data. Storage

IBA CZ průmyslový partner FI MU

Transkript:

BIG DATA je oveľa viac ako Hadoop Martin Pavlík

Analýza všech dostupných dat? Big data =? = Buzzword? = Hadoop? Hadoop Jen ke zpracování nestrukturovaných dat? Mentální posun něco za něco 2

Big data = 3 + 1 V Čtvrté V : VERACITY Důvěryhodnost Odstranění šumů, 3

1.) Konsolidovaný pohled na data Federativní vyhledávání Data zůstavají na místě Odlehčené MDM Rozhraní pro koncové uživatele připomínající PORTÁL Data Strukturovaná Nestrukturovaná Vnitrofiremní (i v Hadoopu) Externí Sociální sítě, diskuzní fóra, 4

2.) Analýza velkých surových dat Archaický obrázek Hadoop clusteru Hadoop Apache open source software framework Inspirován Googlem Google FS Google MapReduce HDFS Map/Reduce 5

2.) Analýza velkých surových dat HDFS <= Velké objemy dat Jak data v HDFS analyzovat? 1. Konverze do relační podoby 2. Využití speciálních technologií pracujících s HDFS 3. Použití standardních technologií + nová rozhraní Zejména pro strukturovaná relační data Střízlivé uvažování je ale na místě 6

2.) Analýza velkých surových dat Tradiční přístup Opakovatelné analýzy Business Ví přesně, co chce Big data přístup Iterativní přístup, zkoumání IT připraví platformu poskytující kreativní zkoumání možností IT připraví infrastrukturu, datové struktury,... Např.: Pravidelné měsíční reporty Zákaznické dotazníky, Business Zkoumá, co může být skutečně využito Definuje úlohy / zadání pro IT dle tradičního přístupu 7

2.) Analýza velkých surových dat Hadoop má mnoho distribucí a mnoho dalších Co je specifického na IBM distribuci? Odstínění koncových uživatelů od složitosti platformy HADOOP Pro business uživatele: Analytické nástroje pro prvotní zkoumání velkých surových dat Pro IT uživatele: Snadná instalace & správa systému, vylepšení open-source standardu, konektivita na běžné systémy, textová analytika, integrace Komfortní vývojové prostředí Nový programovací jazyk pro rychlý vývoj aplikací - JAQL 8

2.) Analýza velkých surových dat Standardní pozicování: Hadoop vs. datový sklad Big Data analytické aplikace Tradiční analytické aplikace Hadoop Filter Transform Aggregate Datový sklad 9

3.) Snížení nákladů díky Hadoopu Alternativní pozicování: Hadoop vs. datový sklad Big Data analytické aplikace Tradiční analytické aplikace $$$ Hadoop Filter Transform Aggregate Datový sklad 10

3.) Snížení nákladů díky Hadoopu Velmi blízká budoucnost Application SQL Language JDBC / ODBC Driver JDBC / ODBC Server SQL interface Engine Dnes: JDBC for Hive UDF Podpora SQL 92 Částečně i SQL 2011 Přístup ke všem relačním datům v Hadoop Data Sources HiveTables HBase tables CSV Files Hadoop system Podpora ODBC & JDBC 11

4.) Zjednodušení datových skladů Dnes jsou velmi složité Díky různým (často pochybným) požadavkům Použití standardních OLTP databázových technologií Neodpovídají současným analytickým potřebám Zásadní poždavek: Flexibilita a jednoduchost Dnes je realizace poždavků často v řádech měsíců Kompletně ve správě IT Big data do DWH => ještě větší složitost => Posun směrem k business uživatelům Analytik funguje často iterativně => Obrovský tlak na ad-hoc dotazy / analýzy 12

5.) Zpracování dat v pohybu Jedním z V z Big data problematiky je Velocity Dávkové zpracování dat nemusí stačit Vizualizace / odpovídající reakce na události Data Data v pohybu Plnění úložišť Analýza uložených (často historických) dat Obohacování dat Zpracování dat, on-line analýzy, skóring prediktivních modelů Adaptivní analytický model 13

IBM BIG DATA platforma Klíčové oblasti 1.) Konsolidovaný pohled na data 2.) Analýza velkých surových dat 3.) Snížení nákladů díky Hadoopu 4.) Zjednodušení datových skladů 5.) Zpracování dat v pohybu InfoSphere Data Explorer InfoSphere BigInsights PureData System for Analytics InfoSphere Streams Integrace Využitelnost předchozí práce 14

Ďakujeme za pozornosť 2010 Digit, s.r.o.