CSPUG 2011-květen. GridSQL a pg-pool II. Vratislav Beneš benes@optisolutions.cz



Podobné dokumenty
PostgreSQL jako platforma pro datové sklady

Netezza. Martin Pavlík. 2. Února to pravé řešení pro analytický datový sklad

Centralizace aplikací ve VZP

Databázové systémy. Doc.Ing.Miloš Koch,CSc.

Databáze s tisíci uložených procedur. Pavel Bláhovec, DiS pavel@blahovec.cz

FRED & PostgreSQL. CZ.NIC, z.s.p.o. Jaromír Talíř <jaromir.talir@nic.cz>

Databázové a informační systémy

Healtcheck. databáze ORCL běžící na serveru db.tomas-solar.com pro

Databázové systémy, MS Access. Autor: Ing. Jan Nožička SOŠ a SOU Česká Lípa VY_32_INOVACE_1130_Databázové systémy, MS Access_PWP

O Apache Derby detailněji. Hynek Mlnařík

Integrace podnikových Open Source aplikací v praxi. RNDr. Petr Novák, Open Source Conference Praha, 19. duben 2011

Použití databází na Webu

Databázové systémy. Cvičení 6: SQL

<Insert Picture Here> EXADATA extrémní infrastruktura pro datové sklady

SQL - trigger, Databázové modelování

Verzování a publikace dat na webu za pomoci PostgreSQL

METACENTRUM. Miroslav Ruda CESNET. Seminář MetaCentra, Praha

Databáze II. 1. přednáška. Helena Palovská

Jazyk SQL databáze SQLite. připravil ing. petr polách

Popis logování v aplikačním serveru

Operátory ROLLUP a CUBE

Případová studie: Adresářové řešení pro webhosting pomocí ApacheDS. Lukáš Jelínek

Zápisování dat do databáze

Tvorba počítačových clusterů pomocí Linuxu. Vedoucí práce: Mgr. Jiří Pech, Ph.D. Katedra informatiky


TimescaleDB. Pavel Stěhule 2018

Sada 1 - PHP. 14. Úvod do jazyka SQL

Enterprise funkce SQL Serveru 2016, které jsou od SP1 zdarma

Datové a procesní modely. A zpět k PEPOvi

Základy informatiky. 08 Databázové systémy. Daniela Szturcová

Úvod do databázových systémů

Návrh a tvorba WWW stránek 1/14. PHP a databáze

Michal Krátký, Miroslav Beneš

Modul. Univerzální tabulkový export

RNDr. Michal Kopecký, Ph.D. Department of Software Engineering, Faculty of Mathematics and Physics, Charles University in Prague

Srovnání SQL serverů. Škálovatelnost a výkon. Express Workgroup Standard Enterprise Poznámky. Počet CPU bez limitu Obsahuje podporu

FIREBIRD relační databázový systém. Tomáš Svoboda

Novinky v Microsoft SQL Serveru RNDr. David Gešvindr MVP: Data Platform MCSE: Data Platform MCSD: Windows Store MCT

Porovnání rychlosti mapového serveru GeoServer při přístupu k různým datovým skladům

Projekt Turris. Proč a jak? Ondřej Filip ondrej.filip@nic.cz Bedřich Košata bedrich.kosata@nic.cz / IT13.2

Struktura pamětí a procesů v DB Oracle. Radek Strnad

Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph)

Platforma Java. Petr Krajča. Katedra informatiky Univerzita Palackého v Olomouci. Petr Krajča (UP) KMI/PJA: Seminář V. 27. říjen, / 15

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

Migrace CIDUG. Ing. Pavel Krutina

Hadoop a HDFS. Bc. Milan Nikl

Aktuální otázky provozu datových skladů PAVEL HNÍK

Přehled systému Microsoft SQL Server. Komu je kniha určena Struktura knihy Nejvhodnější výchozí bod pro čtení knihy Konvence a struktura knihy

Paralelní dotazy v PostgreSQL 9.6 (a 10.0)

Klíčová slova: dynamické internetové stránky, HTML, CSS, PHP, SQL, MySQL,

Reportingová platforma v České spořitelně

Jan Váša TGB Sales Representative, Oracle Czech 10. června 2011 MRI Kladno

Instalace a konfigurace

Databázové systémy I. 1. přednáška

SQL injection jak ji možná neznáte Roman Kümmel

Databázové a informační systémy Jana Šarmanová

<Insert Picture Here> Software, Hardware, Complete

BigData. Marek Sušický

Databázové systémy. - SQL * definice dat * aktualizace * pohledy. Tomáš Skopal

Databázové systémy II. KIV/DB2 LS 2007/2008. Zadání semestrální práce

Stěhování aplikací. Michal Tomek, Sales Manager

Základy informatiky. 06 Databázové systémy. Kačmařík/Szturcová/Děrgel/Rapant

APS Administrator.ST

STARÁ DOBRÁ JAVA A PERSISTENCE S CACHÉ

KMI / TMA Tvorba mobilních aplikací. 6. seminář ZS 2016/2017 Středa 13:15-15:45

Bi-Direction Replication

Možnosti a podmínky využití prostorových dat Zeměměřického úřadu

Databáze 2011/2012 SQL DDL (CREATE/ALTER/DROP TABLE), DML (INSERT/UPDATE/DELETE) RNDr.David Hoksza, Ph.D.

Metody zabezpečeného přenosu souborů

Oracle XML DB. Tomáš Nykodým

NSS - Cache 5. LECTURE MARTIN TOMASEK

Marketingová komunikace. 3. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK3PH (vm3bph)

Databázové systémy úvod

MBI - technologická realizace modelu

On line analytical processing (OLAP) databáze v praxi

prostředí IDS 11.5 na Martin Mikuškovic, ICZ a. s

VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA STROJNÍ DATABÁZOVÉ SYSTÉMY ARCHITEKTURA DATABÁZOVÝCH SYSTÉMŮ. Ing. Lukáš OTTE, Ph.D.

Architektury Informačních systémů. Jaroslav Žáček

Bakalářská práce, FEL ČVUT Praha. Michal Turek. červenec 2007

Servery Incad, stav k

Optimalizace dotazů a databázové transakce v Oracle

Manažerský informační systém na MPSV. Mgr. Karel Lux, vedoucí oddělení koncepce informatiky MPSV

Obsah přednášky. Představení webu ASP.NET frameworky Relační databáze Objektově-relační mapování Entity framework

8.2 Používání a tvorba databází

Přizpůsobení JSTL pro Google App Engine Datastore

Dodatečné informace č. 7

Město Varnsdorf, nám. E. Beneše 470, Varnsdorf, Česká republika SPECIFIKACE

Business Intelligence. Adam Trčka

w w w. u l t i m u m t e c h n o l o g i e s. c z Infrastructure-as-a-Service na platformě OpenStack

Monitoring ArcGIS systémů Hromadné řízení ArcGIS serverů

Jak efektivně ochránit Informix?

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9

Petr Nevrlý

Jalapeño: pekelně ostrá Java persistence v Caché. Daniel Kutáč Senior Sales Engineer

Databázové systémy Cvičení 5.2

Load Balancer. RNDr. Václav Petříček. Lukáš Hlůže Václav Nidrle Přemysl Volf Stanislav Živný

MetaCentrum. Miroslav Ruda. listopad 2013 CESNET

4. lekce Přístup k databázi z vyššího programovacího jazyka

Databázové systémy a SQL

PROVÁZÁNÍ ECM/DMS DO INFORMAČNÍCH SYSTÉMŮ STÁTNÍ A VEŘEJNÉ SPRÁVY

Transkript:

GridSQL a pg-pool II Vratislav Beneš benes@optisolutions.cz

Agenda 1. Datové sklady a datová tržiště 2. pg-pool II 1. Infrastrukutra 2. Využití pro datové sklady 3. GridSQL 1. Infrastuktura 2. Vytvoření DB a tabulek 3. Nahrávání dat 4. Test výkonosti 5. Přednosti a slabiny 4. Závěrečné shrnutí

Datové sklady a datová tržiště systémy ERP CRM Docházka Banka Výzkumy trhu E T L DWH MKG SAL PRD mngm osobní planování controlling prodejní DM Požadavky na systém pro Data Warehouse Dostupnost Stabilita Výkonost Velké objemy dat Vysoký počet uživatelů Zpracování časově náročných úloh Speciální funkce (statistika, výpočty apd) Požadavky na systém pro Data Marts (DM) Vysoká výkonost odezvy v sekundách Stabilita Menší objemy dat než DWH Méně uživatelů než DWH

pg-pool II pg-pool II Middleware Open Source BSD License dblink PostgreSQL jako backend http://pgpool.projects.postgresql.org/ zdroj: pgpool.projects.postgresql.org

pg-pool II využití pro datové sklady Load balance + rozdělení zátěže při dotazování DWH + replikace => zvýšená dostupnost + odolnost proti výpadků n-1 nodů + nekomplikovaná správa (nevyžaduje servisní DB) - n násobný objem dat - nikterak neurychlý dotaz 1 uživatele (u menších oddělení/firem ne zcelan neobvyklá situace) Parallel query + rozdělení zátěže při dotazování DWH + urychlý dotaz i 1 uživatele - není odolný vůči výpadku nodu/nodů - komplikovaná správa (vyžaduje servisní DB s pravidly pro dělení dat) - problém u JDBC klientů (verze 2.x byla nepoužitelná) dotaz vrátil data pouze z jednoho nodu :-( stejný dotaz zadaný v psql vrátil správný výsledek

GridSQL GridSQL EnterpriseDB Open Source GNU GPL 2 Nic nesdílející cluster Paralelní zpracování dotazu Velké objemy dat Vysoký výkon PostgreSQL jako backend JDBC only http://sourceforge.net/projects/gridsql/ Požadavky Java SE PostgreSQL pro servisní DB 1 a více strojů s PostgreSQL pro nody Vícejádrové CPU nebo SMP server Dostatek RAM Rychlé diskové úložiště

GridSQL - vytvoření DB a tabulek Konfigurace config/gridsql.config Port gridu Servisní DB Počet nodů gridu Servery s nody (PostgreSQL) Vytvoření DB s metadaty: bin/gs-createmddb.sh u admin p password Start koordinátoru: bin/gs-server.sh Vytvoření DB Název DB Výběr nodů pro DB: gs-createdb.sh -d cspug -h 127.0.0.1 -s 6453 -u admin -p admin -n 1,2,3,4 Vlastník Strat DB: gs-dbstart.sh -u admin -p admin -d cspug Vytvoření tabulek PARTITIONED - faktové tabulky rozřezané do nodů podle klíče partitioning key REPLICATED obsah tabulky je na všech nodech stejný Stejná konstrukce jako pro PostgreSQL

GridSQL vytvoření DB - scripty Databáze gs-createdb.sh -d cspug -h 127.0.0.1 -s 6453 -u admin -p admin -n 1,2,3,4 Faktová tabulka rozdělená podle času (time_id) Atributová tabulka replikovaná na všechny nody

GridSQL narávání dat INSERT INSERT [INTO] table_name [(column_name,...)] VALUES ((expression),...) INSERT [INTO] table_name [(column_name,...)] SELECT... COPY COPY tablename [ ( column [,...] ) ] FROM { 'filename' STDIN } [ [ WITH ] [ DELIMITER [ AS ] 'delimiter' ] [ NULL [ AS ] 'null string' ] BULK INSERT gs-loader.sh d BIGDB u myuser p mypassword h localhost -i /home/extendb/mig/order_fact.tbl -t orders -f ' ' -k 100000,20,1 y /home/extendb/mig/bad

GridSQL přednosti a slabiny Přednosti Obrovský výkon SELECT dotazů Témeř lineární nárůst výkonosti spojený s dodatečným nodem Vysoká shoda SQL s PostgreSQL (datové typy, operátory, agr. fce...) PostgreSQL jako back-end Přímočará správa Možnost ladění výkonosti každého nodu Kombinace různého HW i platforem Slabiny resp. co autor prezentace neodhalil Malá výkonost u UPDATE, INSERT dotazů Neumožňuje práci se schématy Nemožnost měnit počet nodů bežící DB Neumožňuje vytvářet uživatelské funkce JDBC only Není odolný vůči výpadku nodu/ů Řešení ala Kutil Tim INSERT, UPDATE spouštět přímo na nodech => řádové zrychlení, ale koledujeme si o malér Lze využít uživatelských funkcí, které jsou vytvořeny přímo na nodech

Závěrečné shrnutí z pohledu využití pro DWH a DM pg-pool II + výborný nástroj pro Load Balance + vhodný pro Data Warehouse - ve spojení s JDBC se neosvědčilo Parellel Query (u verze 2.x) GridSQL + velmi výkonný datový zdroj pro reportovací systémy + vhodný pro Data Marts - spolupracuje pouze přes JDBC - není odolný vůči výpadku nodu/ů plánováno do dalších verzí

Otázky

Děkuji za pozornost