Netezza. Martin Pavlík. 2. Února 2011. to pravé řešení pro analytický datový sklad



Podobné dokumenty
CSPUG 2011-květen. GridSQL a pg-pool II. Vratislav Beneš benes@optisolutions.cz

PostgreSQL jako platforma pro datové sklady

IBM Cloud computing. Petr Leština Client IT Architect. Jak postavit enterprise cloud na klíč IBM Corporation

BIG DATA je oveľa viac ako Hadoop. Martin Pavlík

BIG DATA. Nové úlohy pro nástroje v oblasti BI. 27. listopadu 2012

Řešení ochrany databázových dat

Centralizace aplikací ve VZP

<Insert Picture Here> Software, Hardware, Complete

Databázové a informační systémy

České Budějovice. 2. dubna 2014

Databázové systémy úvod

Fujitsu Day Praha 2018

Databázové systémy. Doc.Ing.Miloš Koch,CSc.

Databázová řešení IBM

Chytrá systémová architektura jako základ Smart Administration

Bc. David Gešvindr MSP MCSA MCTS MCITP MCPD

QTD spol. s r.o. NetVault Backup 10

Infor ERP Baan / ERP LN. Návaznost podporovaných OS na implementované SP a FP. Zdeněk Špidla

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

SAP Business One Analytics powered by SAP HANA: Analytic Content and Enterprise Search

Microsoft SharePoint Portal Server Zvýšená týmová produktivita a úspora času při správě dokumentů ve společnosti Makro Cash & Carry ČR

Systémová administrace portálu Liferay

IBA CZ průmyslový partner FI MU

Oracle Exalogic: Ideální platforma pro Cloud Computing

Alcatel-Lucent VitalQIP DNS/DHCP & IP Management Software

Softwarově definované úložiště pod taktovkou EMC Lukáš Bělovský, konzultant Gapp System

Infor Performance management. Jakub Urbášek

Ukladanie a dostupnosť dát

Od klasického reportingu k SAP BO Design studio na BW power by HANA Pavel Strnad

Aktuální otázky provozu datových skladů PAVEL HNÍK

<Insert Picture Here> Na co se můžete s Oracle BI těšit

Business Intelligence

Manažerský reporting a finanční plánování Targetty

Nimbus Data All Flash Systems

Michal Hroch Server Product Manager Microsoft Česká republika

CEITEC a jeho IT požadavky. RNDr. Radka Svobodová Vařeková, Ph.D.

Paralelní dotazy v PostgreSQL 9.6 (a 10.0)

On line analytical processing (OLAP) databáze v praxi

IBM Tivoli Storage Manager 6.2 a IBM Tivoli Storage Manager FastBack 6.1.1

Brno. 30. května 2014

SAP PROCUREMENT DAY 2013

Představujeme KASPERSKY ENDPOINT SECURITY FOR BUSINESS

EFEKTIVNÍ INFRASTRUKTURA

Petr Vlk KPCS CZ. WUG Days října 2016

Tabulka Nabídková cena za předmět plnění *uchazeč vyplní cenu za celý kurz nebo cenu za 1 účastníka dle zadávací dokumentace a nabídky uchazeče


Korporátní identita - nejcennější aktivum

Statistica, kdo je kdo?

Aktuální přehled IBM Cloud Computingu

Přizpůsobení JSTL pro Google App Engine Datastore

Data Protection Delivery Center, s. r. o. JEDNODUCHOST, SPOLEHLIVOST a VÝKONNOST. DPDC Protection. zálohování dat

Datová věda (Data Science) akademický navazující magisterský program

TM1 vs Planning & Reporting

Projekt 7006/2014 SDAT - Sběr dat pro potřeby ČNB. Návrh realizace řešení

Databáze v praxi. RNDr. Ondřej Zýka Principal Consultant

IW3 MS SQL SERVER 2014

Přehled systému Microsoft SQL Server. Komu je kniha určena Struktura knihy Nejvhodnější výchozí bod pro čtení knihy Konvence a struktura knihy

SAP a SUSE - dokonalá symbióza s open source. Martin Zikmund Technical Account Manager

Jak efektivně ochránit Informix?

Internet věcí & Cloud Systémy v Energetice Miroslav HLADÍK Toshiba Corp. Energy Systems & Solutions Company

Optimalizace dotazů a databázové transakce v Oracle

Město Varnsdorf, nám. E. Beneše 470, Varnsdorf, Česká republika SPECIFIKACE

Sybase IQ: Honza Válek Anywhere s.r.o.

Spisová služba jako součást IBM ECM řešení

Technická specifikace HW pro rok 2012

WWW dotazovací služby pro prostorová data URM. Jiří Čtyroký Útvar rozvoje hl. m. Prahy

Reporting a Monitoring

Co je nového v NetWorkeru a Data Domain?

A5M33IZS Informační a znalostní systémy. O čem předmět bude? Úvod do problematiky databázových systémů

Vladimír

Marketingová komunikace. 3. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK3PH (vm3bph)

Inteligentní zpracování prostorových dat

Jan Váša TGB Sales Representative, Oracle Czech 10. června 2011 MRI Kladno

Sísyfos Systém evidence činností

<Insert Picture Here> Oracle Exadata Database Machine koncept úspěšně ověřen pokračujeme

Healtcheck. databáze ORCL běžící na serveru db.tomas-solar.com pro

Použití databází na Webu

Automatizace správy linuxové infrastruktury pomocí Katello a Puppet LinuxDays

HP-USS: IT tak, jak potřebujete Karel Kotrba ředitel Enterprise Services HP ČR

<Insert Picture Here> Zajištění vysoké dostupnosti a zabezpečení dat, novinky Oracle Database 11g. David Krch Technology Sales Consultant

PRODUKTY. Tovek Tools

Co by kdyby? Simulační prostředí pro BIG data v energetice. Filip Procházka, Masarykova Univerzita, Mycroft Mind, a.s. filip.prochazka@gmail.

Podpora chytrého řízení změn nejen v oblasti geoinformatiky. Hexagon Safety & Infrastructure Jan Vaisar

Telelogic Focal Point využití pro řízení a optimalizaci projektového portfolia Verze 1.0

FUJITSU PRIMEFLEX. Human Centric Innovation in Action. Integrované systémy pro Vaše řešení. 30. května 2017 Pavel Čáslavský. 0 Copyright 2017 FUJITSU

Projekt Digitální knihovna pro šedou literaturu po prvním roce řešení

Copyright 2012 EMC Corporation. All rights reserved.

IB M Databázové platform y

Databáze. datum jmeno prijmeni adresa_ulice adresa_mesto cislo_uctu platba zustatek

IBM TotalStorage Productivity Center Overview

Datová kvalita základ úspěšného BI. RNDr. Ondřej Zýka, Profinit

Operátory ROLLUP a CUBE

Případové studie a kulatý stůl. Dalibor Kačmář, Microsoft

Novinky v Microsoft SQL Serveru RNDr. David Gešvindr MVP: Data Platform MCSE: Data Platform MCSD: Windows Store MCT

O Apache Derby detailněji. Hynek Mlnařík

Vmware / XEN / Hyper-V. DR Lokalita. Full repliky. Snapshoty

Důvěryhodná výpočetní základna v prostředí rozsáhlých IS státní správy

Business Intelligence nástroje a plánování

3 zdroje dat. Relační databáze EIS OLAP

Jakým otázkám dnes čelí CIO? Otakar Školoud Chief Information Officer, ALTRON GROUP

Transkript:

Netezza to pravé řešení pro analytický datový sklad Martin Pavlík 2. Února 2011

Co je Netezza? Napříč odvětvími Retail Telekomunikace Co Netezza dodává Vysoce výkonné appliance Firma Špičková technologie pro oblast datových skladů Kde působí? Po celém světě Zejména však v severní Americe Digitální media Zdravotnictví Věda a výzkum Finanční instituce Veřejný sektor Energetika Řešení pro ukládání a dotazování nad PB dat Datové sklady a pokročilé analýzy Akvizice IBM 11.11.2010 Filozofie Jednoduchost po všech stránkách Zaměstnanci 500+ Zákazníci 500+ Reference 400+ Netezza se stává součástí portfolia produktů brandu Information Management 2

Rychlost Škálovatelnost Co Netezza dodává Vysoce výkonné appliance Co Netezza dodává Řešení Vysoce výkonné pro ukládání appliance a dotazování Jednoduchost se nad PB dat Řešení pro ukládání a dotazování se nad PB dat Datové sklady a pokročilé Datové sklady a pokročilé Chytrost analýzy analýzy 3

Co je to appliancev případěnetezzy?

Pročappliance? Aby to bylo komplikované Aby to bylo hooooodnědrahé A co vlastněmáefektivněfungovat? Vyhodnocování analytických / ad-hoc dotazů Aby to EFEKTIVNĚ FUNGOVALO

Co Netezza není? Není OLTP databázovým serverem Nenívhodnájako db pod ERP, CRM,... Kdy Netezza obvykle není rychlejší? Když jsou konvenční technologie maximálně vyladěné pro konkrétní dotazovací potřebu Kde Netezza fakticky nemá konkurenci? Analytické dotazy Ad-hoc dotazy

Typickábolest DATA MART App Servery DATA MART App Servery DATA MART App Servery Zdrojové systémy CRM ERP Staging EDW BI What-if Analýzy HR Datová integrace Billing External Sources

Potřeboval bych vyhodnotit závislost mezi platem a čerpáním kontokorentu OK. Musíme udělat řadu statistik, nastavit správně indexy a partitioning. 5 dní práce to spraví Analytik IT

Paráda. Mockrát děkuji. Hned to zkusím. Hotovo. Můžete spustit Váš analytický dotaz. Analytik IT

Výborně. Vidím tady pěkné závislosti. Teď bych se na to potřeboval podívat ještě jinak Neeee!!! Tady se nedápracovat! Ale ale, to jsou k nám hosti. No, tak to máme dalších 5 dní práce Analytik IT

A teďs Netezzou...

Potřeboval bych vyhodnotit závislost mezi platem a čerpáním kontokorentu. Pustím si dotaz nad Netezzou Analytik IT

Výborně. Vidím tady pěkné závislosti. Teď bych se na to potřeboval podívat ještě jinak. S Netezzou můžu dotaz zadat hned. Odpověď bude za stejnou dobu Analytik IT IT se můž ůže věnovat něč ěčemu jinému

Základníprincipy architektury Zpracování dat co nejblíže úložišti Vyvážená, masivní paralelní architektura Platforma pro pokročilé analýzy Jednoduchost Flexibilní konfigurace Obrovská škálovatelnost

Masivní paralelní architektura Rozděl a panuj MPP architektura Koncept Shared Nothing Rozdělení práce na několik menších úloh Velká úloha je rozdělena vertikálně do série menších úloh Menší úlohy běží paralelně/ naprosto nezávisle Pro každou menší úlohu je přiděleno stejné množství fyzických zdrojů Komunikace mezi jednotlivými úlohami je jen na začátku a konci Přínosy Obrovské úlohy jsou vykonány ve významně kratším čase Maximální využitelnost zdrojů Body k zamyšlení Složitost systému a náročnost na správu Úzká hrdla v komunikaci

SOLARIS AIX Netezza TwinFin Appliance Client TRU64 HP-UX WINDOWS LINUX ODBC 3.X JDBC Type 4 OLE-DB SQL/92 SQL Compiler 1 2 Query Plan Execution Engine 3 Source Systems ETL Server DBA CLI 3rd Party Apps High-Speed Loader/Unloader Optimize Admin Front End SMP Host Network Fabric 920 High-Performance Database Engine Streaming joins, aggregations, sorts Massively Parallel Intelligent Storage High Performance Loader

SOLARIS AIX Netezza TwinFin Appliance Client TRU64 HP-UX WINDOWS LINUX SQL SQL Compiler Snippets 1 2 3 1 2 1 2 3 1 2 3 Query Plan Execution Engine 3 1 2 3 Source Systems ETL Server DBA CLI 3rd Party Apps High-Speed Loader/Unloader Optimize Admin SQL Front End SMP Host Network Fabric 920 High-Performance Database Engine Streaming joins, aggregations, sorts 1 2 3 Massively Parallel Intelligent Storage High Performance Loader

Zpracování toku dat jednotkou Datová Cache Jádro (Core) FPGA Jádro CPU Dekomprese dat Projekce Selekce, Autorizace Komplexní Joiny, Aggr, atd. Select sex, age, count(*) From MultiBillionRowTable Where BirthDate < 01/01/1967 And PostCode like SW% Group by sex, age; Každý obsahuje 8 n-tic s vlastním: Diskem Datovou cache Jádrem FPGA jednotky Jádrem CPU

Asymmetric Massively Parallel Processing SOLARIS AIX Netezza TwinFin Appliance Client TRU64 HP-UX WINDOWS LINUX ODBC 3.X JDBC Type 4 OLE-DB SQL/92 SQL Compiler Consolidate 1 2 1 2 3 1 2 3 Query Plan Execution Engine 3 1 2 3 Source Systems ETL Server DBA CLI 3rd Party Apps High-Speed Loader/Unloader Optimize Admin Front End SMP Host Network Fabric 920 High-Performance Database Engine Streaming joins, aggregations, sorts, etc. 1 2 3 Massively Parallel Intelligent Storage High Performance Loader

The Netezza TwinFin Appliance Disky SMP Servery Jednotky (s databázovým akcelerátorem FPGA) 20 Každý disk je rozdělen na 3 oblasti: Uživatelská data Swap Mirror SQL Compiler Query Plan Optimalizátor Administrace

Produkty rodiny Netezza 21 Skimmer Většinou jako: systém pro vývoj systém pro testování TwinFin Datový sklad Náročné analytické úlohy 1 TB to 10 TB 1 TB to 1.5 PB

Základní přínosy řešení NETEZZA 22

Konkurenčnítechnologie majíobrovskémnožstvíparametrůa databázových objektů, které pomáhají výrazně zlepšovat výkonnost systémů. Musejí být tedy lepší. Netezza mácelou řadu z nich taky, ale jejich hodnoty si spravuje sama a Tak takhle nějak jsem se na to tvářil nezatěžuje tím uživatele. poprvé, podruhé,... a ještě mockrát,... Používá tedy vlastně jakési implicitní hodnoty parametrů Jenže v případě Netezzy platí: Těším se na Vaše dotazy Výkonnost systému s implicitními mi parametry je dostatečná Martin Pavlík +420 731 435 691 martin_pavlik@cz.ibm.com