Teradata Basic. RNDr. Ondřej Zýka

Podobné dokumenty
Databáze v praxi. RNDr. Ondřej Zýka Principal Consultant

Teradata basic Profinit. All rights reserved.

Manažerský reporting a finanční plánování Targetty

01. Kdy se začala formovat koncept relačních databází (Vznik relačního modelu, první definice SQL)? a) 1950 b) 1960 c) 1970 d) 1980

Profilová část maturitní zkoušky 2013/2014

Zkušební test. Kdy se začala formovat koncept relačních databází (Vznik relačního modelu, první definice SQL)? a) 1950 b) 1960 c) 1970 d) 1980

Obsah Úvod 11 Jak být úspěšný Základy IT

Správa dat v podniku. MI-DSP 2013/14 RNDr. Ondřej Zýka, ondrej.zyka@profinit.eu

Datová kvalita základ úspěšného BI. RNDr. Ondřej Zýka, Profinit

Bc. David Gešvindr MSP MCSA MCTS MCITP MCPD

Relační databáze a povaha dat

Business Intelligence

Profilová část maturitní zkoušky 2017/2018

Srovnání SQL serverů. Škálovatelnost a výkon. Express Workgroup Standard Enterprise Poznámky. Počet CPU bez limitu Obsahuje podporu

Databázové patterny. MI-DSP 2013/14 RNDr. Ondřej Zýka,

Infor Performance management. Jakub Urbášek

Projekt IEEE 802, normy ISO 8802

Metadata. MI-DSP 2013/14 RNDr. Ondřej Zýka,

Přehled systému Microsoft SQL Server. Komu je kniha určena Struktura knihy Nejvhodnější výchozí bod pro čtení knihy Konvence a struktura knihy

Mgr. Jan Folbrecht Senior softwarový inženýr, softwarový architekt, manažer

Integrace dat. RNDr. Ondřej Zýka

Relační DB struktury sloužící k optimalizaci dotazů - indexy, clustery, indexem organizované tabulky

Moderní metody automatizace a hodnocení marketingových kampaní

Zajištění komplexních sluţeb pro provoz systémové infrastruktury OSMS ZADÁVACÍ DOKUMENTACE

Základy business intelligence. Jaroslav Šmarda

8.2 Používání a tvorba databází

S databázemi se v běžném životě setkáváme velmi často. Uvádíme běžné použití databází velkého rozsahu:

Databáze Bc. Veronika Tomsová

CSPUG 2011-květen. GridSQL a pg-pool II. Vratislav Beneš benes@optisolutions.cz

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

Acronis. Lukáš Valenta

Architektury Informačních systémů. Jaroslav Žáček

<Insert Picture Here> Hyperion a vazba na reportovací nástroje

Statistica, kdo je kdo?

EXTRAKT z technické normy CEN ISO

Databázové systémy trocha teorie

IBM Informix 11.7 Edice

Obsah přednášky. Databázové systémy RDBMS. Fáze návrhu RDBMS. Coddových 12 pravidel. Coddových 12 pravidel

Architektury Informačních systémů. Jaroslav Žáček

Řešení datové kvality prostřednictvím Master Data Managementu v prostředí České pošty s.p.

IW3 MS SQL SERVER 2014

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

Nové licencování databází Informix

Aplikace IS, outsourcing, systémová integrace. Jaroslav Žáček

Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph)

Aktuální otázky provozu datových skladů PAVEL HNÍK


Technická specifikace HW pro rok 2012

Modely datové. Další úrovní je logická úroveň Databázové modely Relační, Síťový, Hierarchický. Na fyzické úrovni se jedná o množinu souborů.

Integrace dat. RNDr. Ondřej Zýka

Distribuované systémy a výpočty

Databázové systémy. Doc.Ing.Miloš Koch,CSc.

Operační systémy. Jednoduché stránkování. Virtuální paměť. Příklad: jednoduché stránkování. Virtuální paměť se stránkování. Memory Management Unit

Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague

Přechod na virtuální infrastrukturu

Big Data od velkých očekávání k praktickému využití. DSW, Praha,

Architektura DBMS. RNDr. Ondřej Zýka

Střední průmyslová škola Zlín

Název Popis Lhůta. dne Odmítnuté platby Zobrazení, tisk a export seznamu odmítnutých plateb. Informace připraveny k vyzvednutí z bankovního

The following is intended to outline our general product direction. It is intended for information purposes only, and may not be incorporated into

Od klasického reportingu k SAP BO Design studio na BW power by HANA Pavel Strnad

Kapitola 1: Úvod. Systém pro správu databáze (Database Management Systém DBMS) Účel databázových systémů

B Organizace databáze na fyzické úrovni u serveru Oracle

Jak spustit provoz v DR lokalitě snadno a rychle

Dobývání znalostí z databází. Databáze. datum jmeno prijmeni adresa_ulice adresa_mesto cislo_uctu platba zustatek

SOA a Cloud Computing

Kapitola 13: Transakce. Koncept transakce. ACID vlastnosti

Fyzické uložení dat a indexy

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Kapitola 4. Úvod 11. Stručný úvod do relačních databází 13. Platforma 10g 23

Základy databází. O autorech 17 PRVNÍ ČÁST. KAPITOLA 1 Začínáme 19

KOMPETENČNÍ CENTRUM COLLABORATION SOLUTIONS

EXTRAKT z české technické normy

Základy počítačových sítí Model počítačové sítě, protokoly


Databáze 2013/2014. Konceptuální model DB. RNDr. David Hoksza, Ph.D.

Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague

Data Protection Delivery Center, s. r. o. JEDNODUCHOST, SPOLEHLIVOST a VÝKONNOST. DPDC Protection. zálohování dat

Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague

Kolaborativní aplikace

Aktivní prvky: brány a směrovače. směrovače

SÁM O SOBĚ DOKÁŽE POČÍTAČ DĚLAT JEN O MÁLO VÍC NEŽ TO, ŽE PO ZAPNUTÍ, PODOBNĚ JAKO KOJENEC PO PROBUZENÍ, CHCE JÍST.

Windows Server 2003 Active Directory

Informační systémy 2008/2009. Radim Farana. Obsah. Základní principy XML

SII - Informatika. 1. Atribut relace, jehož hodnota jednoznačně určuje prvek v jiné relaci, se nazývá:

Projekt 7006/2014 SDAT - Sběr dat pro potřeby ČNB. Návrh realizace řešení

BrightStor ARCserve Backup r Michal Opatřil - Consultant - michal.opatril@ca.com

O Apache Derby detailněji. Hynek Mlnařík

Návrh databázového modelu

Výuka integrovaných IS firem a institucí na vysokých školách (zkušenosti, nové příležitosti, omezení)

PostgreSQL jako platforma pro datové sklady

IT 3. Projekt centrálního zálohovacího systému v ČSOB Pojišťovně. Michal Mikulík. špička v každém směru

RadioBase 3 Databázový subsystém pro správu dat vysílačů plošného pokrytí

FIREBIRD relační databázový systém. Tomáš Svoboda

Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/ Vzdělávání v informačních a komunikačních technologií

Systém adresace paměti

Kurz Databáze. Obsah. Návrh databáze E-R model. Datová analýza, tabulky a vazby. Doc. Ing. Radim Farana, CSc.

Vladimír

PODNIKOVÁ INFORMATIKA

ELO Analytics Vaše obchodní metriky na jednom místě. Vaše obchodní metriky na jednom místě. Enterprise Content Management

Optimalizace dotazů a databázové transakce v Oracle

Transkript:

Teradata Basic RNDr. Ondřej Zýka 1

Něco z historie Založena v roce 1979 v garáži v Kalifornii (Brentwood). Původně součástí NCR Teradata symbolizuje schopnost spravovat extrémní množství dat. Primárně určena pro datové sklady a BI aplikace. Založena na shared nothing architektuře umožňující lineární škálovatelnost. V současnosti využívána v největších datových skladech Svět Wall-Mart DHL Bank of Amerika Coca Cola, V Česku KB, ČSOB,.. Česká pojišťovna, Česká pošta, TO2, Vodafone, 2 2

Komponenty AMP Access modul processor Virtuální procesor s vlastním diskem (jednotka Shared Nothing architektury) Zodpovědný za získání požadovaných dat ze svých diskových úložišť Realizuje fyzické zpracování dat (řazení, agregace, formát, konverze, ). Reaguje na instrukce zaslané od PE prostřednictvím BYNET. Parsing engine PE Virtuální procesor Parsuje a optimalizuje dotazy, předává požadavky jednotlivým AMPům Node (SMP uzel) Počítač s architekturou SMP, ne kterém běží jednotlivé Virtuální procesory 3 3

Komponenty BYNET Komunikační kanál (duplikovaný) pro předávání požadavků a výsledků Zpráva je směrována k určitému AMPu, který provede výpočet, a odezva (výsledek) je směřován zpět k PE prostřednictvím BYNET Broadcast zpráva je zaslána všem uzlům v systému a následně i všem AMPům. Point-to-point zpráva je zaslána specifickému uzlu v systému a jen jeho AMPům. Tolerance chyb dva paralelní BYNET (0,1) a každý z nich redundance. Load Balancing zátěž je rozkládána mezi BYNET0 a BYNET1. BYNET Driver Komunikační kanál mezi virtuálními procesory (AMP, PE) v rámci jednoho Node 4 4

Node (SMP uzel) SMP server (Unix, Windows) Channel Driver Teradata Gateway PE (virtual processor) PE (virtual processor) BYNET DRIVER AMP (virtual processor) AMP (virtual processor) AMP (virtual processor) AMP (virtual processor) vdisk vdisk vdisk vdisk 5 5

Architektura Shared nothing Parsing engine (PE) BYNET AMP 1 AMP 2 AMP 3 AMP 4 RAM RAM RAM RAM 6 6

Fyzická architektura BYNET Node 1 with AMPs Node 2 with AMPs Node 3 with AMPs Node 4 with AMPs 7 7

Diskové prostory Permanent space Limit na uživatele Data, indexy, fallback, Rovnoměrně distribuován na jednotlivé AMPy Spool space Globální limit na uživatele Diskový prostor pro mezivýsledky Všechen nepřidělený prostor Temp space Global temporary table 8 8

Uložení a přístup k datům Primární klíč Logický koncept z LDM. Teradata nevyžaduje jeho definici. Musí být unikátní. Jednoznačně identifikuje řádek. Neakceptuje NULL hodnoty. Neimplikuje přístup k datům. Primární index Fyzický mechanizmus pro přístup k datům. Každé tabulce musí být přiřazen. Může být unikátní, ale nemusí být. Obecně nejednoznačná identifikace. Akceptuje NULL hodnoty. Implikuje nejefektivnější přístup k datům. 9 9

Primární index a adresace Hashování hodnot primárního indexu Řádky všech tabulek jsou v Teradatě distribuovány dle hash. Proces adresace 1. Z hodnoty primárního indexu je vypočten hash 32-bit Row Hash. 2. Prvních 16 bitů se nazývá Destination Selection Word (DSW). 3. Řádek se svou Row Hash je poslán na komunikační vrstvu BYNET. 4. Na základě DSW je v BYNET Hash Map identifikován cílový AMP. 5. Celých 32 bitů Row Hash je cílovým AMPem použito k nalezení řádku. Identifikace řádků Dva různé PI řádku mohou vést ke stejnému row hash Hash Synonym. V případě NUPI mohou existovat v PI duplicitní řádky se stejným row hash. 10 10

Primární indexy - Hash mapa Hash mapa pro každé DSW asociuje AMP. K hash mapě v rámci adresace přistupuje BYNET. Na základě hash mapy je pro daný řádek osloven příslušný AMP. 11 11

Distribuce řádků tabulky 333 445 545 687 100 564 999 578 201 560 408 227 313 875 770 Ano Ano Ano Ano Ne Ne Ne Ne 12 12

Podpora výkonu databáze Indexy Sekundární indexy (unikátní a neunikátní) Covered Index Statistiky Partitioning Partition Primary Index Data jsou uložena na AMPu nejdříve podle partition, pak podle Hash value Join algoritmy Redistribuce a duplikace Merge join Exclusion join Hash join Nested join Product join Pravidla pro vytváření logického a fyzického modelu 13 13

Podpora dostupnost Transient Journal Řídí transakce a rollback. Na jenotlivých AMPech. Po ukončení transakce smazán. Fallback Zabezpečení proti výpadku jednoho AMPu, sekundární záznam (kopie) je uložen na jiném AMPu Permanent Journal Podpora obnovy databáze k určitému okamžiku PJ je periodicky odléván na externí médium; zálohovány jsou pouze inkrementy. Down AMP Journal Podpora zotavení AMPu při pádu 14 14

Fallback AMP 1 AMP 2 AMP 3 AMP 4 Fallback 15 15

Nástroje a služby Nástroje správy odpovídají stáří databáze. Systém primárně zaměřen na výkon. Nemá vlastní nástroje na prezentaci a analýzu dat spolupracuje se všemi velkými hráči na trhu Microstrategy, Cognos, Oracle BI, SAP BusinessObject, Microsoft Reporting services. 16 16

Industriální logické modely Teradata Communications Logical Data Model Teradata Financial Services Logical Data Model Teradata Healthcare Logical Data Model Teradata Insurance Logical Data Model Teradata Manufacturing Logical Data Model Teradata Media Logical Data Model Teradata Retail Logical Data Model Teradata Transportation and Logistics Logical Data Model Teradata Travel and Hospitality Industry Logical Data Model Teradata Utilities Logical Data Model 17 17

Aplikace podle obchodních požadavků Kumulovaná zkušenost ze stovek projektů datových skladů a projektů BI. Obsah jednotlivých modelů: Více úrovní pohledu Konceptuální pohled, Funkční oblasti (Kontrakt, Účet, Kanál, Událost, Kampaň, Party, Produkt, ), Detailní logický model. Podrobný popis jednotlivých entit včetně atributů a relací, jejich význam a použití. Textový popis i modely. 18 18

Aplikace podle obchodních požadavků Business Intelligence Data Mart Consolidation Master Data Management Tax and Revenue Management Customer Relationship Management Data Mining and Analytics Enterprise Risk Management SAP Integration Data Governance Data Warehouse Migration Financial Management 19 19

Co si zapamatovat Jakou architekturu používá systém Teradata Vysvětlete Popište hlavní komponenty systému Teradata Jaký je rozdíl mezi primárním klíčem a primárním indexem 20 20

Diskuse Otázky Poznámky Komentáře Připomínky 21