IB M Databázové platform y Jan Musil Databázový IT specialista Community of practice CEE/MEA 2011 IBM Corporation
Agenda Hlavní zástupci databázových platforem IBM Vybraná řešení nad databázovými platformami IBM Proč si vybrat databázové technologie IBM? 2
Hlavní zástupci databázových platforem IBM Informix 11.7 DB2 9.7 SolidDB 6.5
Vybraná řešení nad databázovými platformami IBM Informix 11.7 Informix Warehouse Accelerator Informix Clustering a Flexible Grid Informix TimeSeries rozšíření DB2 9.7 DB2/SAP DB2 kompatibilita s Oracle
Informix Warehouse Accelerator Extrémní komprese dat na základě frekvenční analýzy výskytu dat (Huffmanův algoritmus pro kompresi dat do binárního tvaru) Fyzické ukládání dat po položkách (nikoliv po záznamech) Data jsou ukládána v paměťové databázi Paralelní zpracování a vyhodnocování analytických dotazů Zpracování se paralelně provádí na úrovni registrů jader procesorů (SIMD Single Instruction Multiple Data) Platforma: 64bit x86_64 Intel Linux RHEL 5 nebo SLES 11 Reálné výsledky Dotaz Klasická RDBMS IDS 11.7 IWA 1 22 minut 4 vteřiny 2 1 minuta 3 vteřiny 2 vteřiny 3 3 minuty 40 vteřin 2 vteřiny 4 30 minut a více 4 vteřiny 5 2 minty 2 vteřiny 6 30 minut 2 vteřiny 7 45 minut a více 2 vteřiny
Informix Clustering (vysoká dostupnost) MACH-11 Škálovatelnost bez poklesu výkonnosti Jednoduchá konfigurace a administrace Connection Manager a Connection Manager (Failover) Arbitrator Zapisovatelné sekundární uzly High Available Data Replication záložní server (HDR) (od 1994) Remote Standalone Server (RSS) Shared Disk Secondary (SDS) Continuous Logical Restore (CLR)
Přehled licencování HA v Informixu HDR/RSS pouze záloha Licence za technologii: NE Licence za sekundární (záložní server): NE HDR/RSS čtení a/nebo zápis Licence za technologii: NE Licence za sekundární (záložní server): ANO Může být použitá jiná metrika, než má primární server SDS Licence za technologii: NE Licence za sekundární (záložní server): ANO
Informix Flexible Grid Asynchronní replikace dat na úrovní tabulkových záznamů Lze definovat, zda se budou data replikovat nepřetržitě nebo ve stanoveném intervalu Nevyžaduje žádný specializovaný HW nebo specializovanou síťovou infrastrukturu Zajišťuje transakční konzistenci V případě nedoručení jsou zasílaná data trvale uložena pro pozdější zopakování pokusu Data jsou zasílána na základě záznamů v transakčních žurnálech Provádění detekce a řešení konfliktních situací Jednoduchá centralizovaná administrace Replikovat lze jak modifikace dat, tak vlastní SQL příkazy, které se aplikují až lokálně na cílovém serveru Connection Manager pro přepojení klientů k serveru s nejkvalitnějšími daty Kooexistence s MACH-11
Informix TimeSeries rozšíření Správa dat pořizovaných v pravidelných nebo nepravidelných časových řadách Specializovaný způsob ukládání dat a architektura s důrazem na vysokou výkonnost Poskytuje bohatou knihovnu funkcí pro provádění analýz zaznamenaných dat v časových řadách Podpora formou nativního datového typu TimeSeries s definicí libovolné struktury spravovaných dat Podpora JDBC a C API Technologie je zdarma součástí všech edicí Informix
Informix TimeSeries rozšíření výsledky Výsledky byly získány na základě měření US elektrárenské společnosti Čas potřebný pro load dat z 1,000,000 měřidel Informix 18 minut 7 hodin Konkurenční technologie Sestavy Od vteřin do 11 minut 2-7 hodin Diskový prostor pro data z 1,000,000 měřidel 350GB 1.3 TB
Výhody použití technologie IBM DB2 se SAPem Partnerství mezi IBM a SAP Optimalizace pro SAP Výkonnost Obchodní výhody
Partnerství mezi IBM a SAP Iniciativa optimalizace DB2 pro SAP začala v roce 2004 verzí DB2 8.2.2 Nová verze DB2 přímo optimalizovaná pro SAP je k dispozici každých 1 2 roky Významná část plánu vývoje DB2 je exklusivně věnována SAPu Společný vývoj SAP a DB2 ve všech fázích softwarového cyklu Povinné schvalování všech vlastností DB2 souvisejících s funkcionalitou SAP SAP provádí certifikaci každé verze a fixpacku DB2
Výhody DB2-SAP partnerství Poslední nové technologie DB2 jsou k dispozici SAP zákazníkům v rozmezí týdnů a nikoliv roků Méně produktových defektů, tedy i méně opravných záplat Průměrný počet záplat za měsíc DB2 v9: 0.29 Konkurenční db platformy: v rozmezí od 1.97 do 2.2 7 Nižší riziko implementace nových vlastností snižujících náklady Kratší doba nedostupnosti vyžadovaná údržbou databáze
Pro SAP je DB2 strategickou platformou DB2 je hlavní vývojovou platformou SAP Téměř každý hlavní SAP produkt je buď přímo vyvíjen nebo alespoň testován proti DB2 Sám SAP migroval své hlavní informační systémy na DB2 SAP systémy HR, ERP, CRM, BW všechny běží na DB2 SAP provozuje celkem 1200 systémů na DB2
Klíčové technologie DB2, které SAP používá SAP DBA Cockpit for DB6 SAP Database Performance Warehouse DB2_WORKLOAD=SAP DB2 Compression and Space Reclamation DB2 Integrated HA and DR DB2 Automatic Maintenance DB2 Workload Management DB2 Database Partitioning Feature DB2 Multidimensional Clustering SAP NetWeaver BW Nearline Storage Performance Leadership Mnoho technických inovací DB2 vzniklo na základě SAP-DB2 partnerství. Nevýhodou konkurence je, že se nemůže přímo zapojit do spolupráce se SAP a integrovat tak svůj vývoj s vývojem SAP.
Výkonnost SD Benchmark = Sales and Distribution Benchmark SAPS = SAP Application Performance Standard SAP SD 2-tier benchmark simuluje uživatelskou interakci v SD (sales and distribution) modulu uživatelská přihlášení vytvoření objednávky zákazníka vyplnění pěti řádek položek objednávky uložení objednávky vytvoření doručenky zobrazení objednávky a další Výsledky DB2 9.7 byla provozovaná na 256 jádrovém Power 795 systému a bylo dosaženo 126,063 SD uživatelů Oracle dosahl pouze 39,100 SD uživatelů na 256 jádrovém SUN SPARC M9000 serveru Oracle 11g s Oracle RAC dosahl 40,000 uživatelů na 4 uzlech Oracle SUN Fire X4470 klastru (32 jader/uzel)
Příklad cenového porovnání SAP/DB2 a konkurence Předpokládejme, že cena za průměrné řešení SAP (SAP Application Value) je 10 millionů dolarů Náklady na DB2 OEM: 8% z $10M = $800,000 Náklady na DB2 9.8 purescale OEM: 9% z $10M = $900,000 Náklady na konkurenční OEM db licence: 15% z $10M = $1,500,000 Náklady na konkurenční OEM licence HA: 18% z $10M = $1,800,000
Kompatibilita mezi DB2 a Oracle Od verze DB2 9.7 jsou implementované DB2 Oracle Database compatibility features Významně zjednodušuje migraci z Oracle na DB2 Nová funkcionalita kompatibility je implementovaná nativně na nejnižší úrovni architektury DB2 a nikoliv jako emulace Mód kompatibility s Oracle tedy nevede k poklesu výkonnosti DB2
Kompatibilita mezi DB2 a Oracle Konkurenční přístup Dřívější DB2 implementace Cursor Stability konkurečního přístupu Blokování přístupu k právě modifikovaným datům Nová kompatibilní implementace Implementace last committed na základě čtení potřebných údajů z transakčního logu (potřebná data jsou obvykle stále ještě ve vyrovnávací paměti) Právě modifikovaná data neblokují přístup Datové typy Podpora všech Oracle nestandardních základních datových typů (např. řetězcové, datumové nebo numerické datové typy) Podpora komplexních datových typů, používaných zejména v Oracle PL/SQL Implicitní casting Na rozdíl od Oracle, DB2 tradičně používá pravidlo silného typování Implicitní casting implementuje kompatibilitu s Oracle slabým typováním Dovoluje například porovnávání numerických hodnot a řetězců
Kompatibilita mezi DB2 a Oracle SQL standardy Implementace vlastních Oracle klíčových slov a sémantických konstrukcí mimo SQL standardy, jako například: rekurze CONNECT BY SQL operátor MINUS (+) join symbol SELECT INTO FOR UPDATE tabulka DUAL PUBLIC SYNONYM pseudo položky ROWNUM a ROWID CREATE TEMPORARY TABLE TRUNCATE TABLE PL/SQL Poskytuje kompatibilitu >95%
Kompatibilita mezi DB2 a Oracle Vestavěné balíčky Oracle funkcí DBMS_OUTPUT DBMS_LOB DBMS_SQL DBMS_UTILITY DBMS_ALERT UTL_FILE DBMS_PIPE UTL_MAIL DBMS_JOB UTL_SMTP JDBC rozšíření o nestandardní Oracle datové typy Podpora SQL*Plus DB2 kompatibilní nástroj CLPPLus
IBM Data Movement Tool
IBM Data Movement Tool
Výsledky provedených testů migrace na reálných aplikacích Byla provedena analýza 18 různých typů aplikací Aplikace měly od 2 000 do 185 000 SQL příkazů Celkem testováno 750 000 řádků Od 90% až 99% SQL příkazů bylo možné ihned použít v DB2
Proč si vybrat databázové technologie IBM? Jednoduchá instalace a konfigurace Škálovatelnost Databázové servery jsou objektově relační s možností rozšiřování funkcionality Zajištění trvalé konzistence dat Spolehlivý provoz s minimálním požadavkem na administrátorskou činnost Dynamická konfigurace, samoladicí a samoadminstrační nástroje Licencování na souběžné relace, autorizované uživatele a procesor value units Široká škála nasazení On-Line transakční zpracování Data Warehouse SAP Nepřetržitý 24x7 provoz Aplikace vyžadující moderní bezpečnostní standardy Všechny typy zařízení (od mobilních zařízení až po masivně paralelní architektury) Distribuce a konsolidace dat v libovolné geografické topologii Rychlý přístup k datům v reálném čase
Jan Musil jan_musil@cz.ibm.com