Integrace dat. RNDr. Ondřej Zýka

Podobné dokumenty
Integrace dat. RNDr. Ondřej Zýka

Integrace dat. MI-DSP 2013/14 RNDr. Ondřej Zýka,

Datová kvalita. RNDr. Ondřej Zýka

Integrace dat Profinit. All rights reserved.

Metadata. MI-DSP 2013/14 RNDr. Ondřej Zýka,

Aktuální otázky provozu datových skladů PAVEL HNÍK

Information and Data Management. RNDr. Ondřej Zýka

Řešení datové kvality prostřednictvím Master Data Managementu v prostředí České pošty s.p.

Datová kvalita. RNDr. Ondřej Zýka

Odbor informatiky a provozu informačních technologií

Datová kvalita základ úspěšného BI. RNDr. Ondřej Zýka, Profinit

TECHNICKÁ SPECIFIKACE VEŘEJNÉ ZAKÁZKY

Lekce 9 - Migrace dat

SOAP & REST služby. Rozdíly, architektury, použití

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

Databázové patterny. MI-DSP 2013/14 RNDr. Ondřej Zýka,

Sjednocení dohledových systémů a CMDB

DATA ULOŽENÁ NA VĚČNÉ ČASY. (ICZ DESA / Microsoft Azure) Mikulov Michal Matoušek (ICZ) / Václav Koudele (Microsoft)

Konsolidovaný reporting CZ/SK v Cognos případová studie sanofi-aventis

Metadata. RNDr. Ondřej Zýka

Primární klíč (Primary Key - PK) Je právě jedna množina atributů patřící jednomu z kandidátů primárního klíče.

Databázové patterny. RNDr. Ondřej Zýka

Zkušební test. Kdy se začala formovat koncept relačních databází (Vznik relačního modelu, první definice SQL)? a) 1950 b) 1960 c) 1970 d) 1980

Základní registry. Kvalita dat a jejich čištění v základních registrech veřejné správy. Připraveno pro konferenci ISSS. Ing.

Specifika bankovního prostředí při monitoringu a analýze bezpečnostních incidentů. RNDr. Ondřej Zýka Profinit

8.2 Používání a tvorba databází

Centralizace aplikací ve VZP

Databáze I. 5. přednáška. Helena Palovská

RDF DSPS ROZVOJ PORTÁLU

Správa dat v podniku. MI-DSP 2013/14 RNDr. Ondřej Zýka, ondrej.zyka@profinit.eu

Databázové systémy. Doc.Ing.Miloš Koch,CSc.

Kapitola 1: Úvod. Systém pro správu databáze (Database Management Systém DBMS) Účel databázových systémů

Obsah Úvod 11 Jak být úspěšný Základy IT

Architektura informačních systémů. - dílčí architektury - strategické řízení taktické řízení. operativní řízení a provozu. Globální architektura

Registr pojištěnců veřejného zdravotního pojištění. Ing. Radek Papp vedoucí projektu

Návrh datového skladu z hlediska zdrojů

Moderní metody automatizace a hodnocení marketingových kampaní

Replikace je proces kopírování a udržování databázových objektů, které tvoří distribuovaný databázový systém. Změny aplikované na jednu část jsou

Objektově orientované databáze. Miroslav Beneš

Národní registr poskytovatelů zdravotních služeb Aplikace NRPZS Stav změn a oprav

ORACLE ŘÍZENÍ FINANCÍ

Kurz Databáze. Obsah. Dotazy. Zpracování dat. Doc. Ing. Radim Farana, CSc.

Výtisk č.: Počet listů 9. Přílohy: 0 ÚZIS ČR

Michal Kolařík ISZR - Brána k základním registrům

Microsoft SharePoint Portal Server Zvýšená týmová produktivita a úspora času při správě dokumentů ve společnosti Makro Cash & Carry ČR

PŘÍLOHA C Požadavky na Dokumentaci

Příloha 1 Specifikace předmětu plnění

Chybová hlášení METODIKA MET-01/2014. SZR-56-1/OPICT-2013 počet stran 28 přílohy 0. Nahrazuje:

Historie a současnost datových skladů GE Money ČR

v praxi Rizika a přínosy zavádění BI jako nástroje pro řízení podnikání

Synchronizace číselníků

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9

Autorizovaná konverze dokumentů

Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph)

TM1 vs Planning & Reporting

KSRZIS. Postup kroků nutných pro napojení nemocničního informačního systému s registrem NSHNU v prostředí registrů resortu zdravotnictví

Návrh vyhlášky k zákonu o kybernetické bezpečnosti. Přemysl Pazderka NCKB

Jak vybrat správný firewall. Martin Šimek Západočeská univerzita

Jak spustit provoz v DR lokalitě snadno a rychle

Ondřej Bothe, Richard Dobiš

Zkušenosti z implementace GDPR. Tomáš Nielsen NIELSEN MEINL, advokátní kancelář, s.r.o.

Integrace informačních systémů ve Fakultní nemocnici Brno v rámci projektu ENIS II

DOKUMENTACE A MANUÁLY

Zhodnocení architektury podniku. Jiří Mach

STORK Secure Identity Across Borders Linked

1. Integrační koncept

Infor Performance management. Jakub Urbášek

Není cloud jako cloud, rozhodujte se podle bezpečnosti

OZNAČENÍ SLUŽBY ITSM/HELPDESK-PROVOZ TYP KL: PAUŠÁLNÍ. Služba zajištění obsluhy HelpDesku Objednatele

Business Intelligence

Každý písemný, obrazový, zvukový, elektronický nebo jiný záznam, ať již v podobě analogové či digitální, který vznikl z činnosti původce.

SAP SuccessFactors. Employee Central

Výsledek transformace dalších informačních zdrojů o kontaminovaných místech do NIKM (SEKM 3) Ing. Vladimír Hudec ARCDATA PRAHA, s.r.o.

Projekt Partner ČSOB Leasing. 02/12/2013 Jaromír Mayer Domain Process Manager Head of Department

Katalog egon služeb verze: 0.01

Marketingová komunikace. 3. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK3PH (vm3bph)

Integrace podnikových Open Source aplikací v praxi. RNDr. Petr Novák, Open Source Conference Praha, 19. duben 2011

Projekt zavedení elektronického registru dotací a finančních darů v podmínkách Krajského úřadu Jihočeského kraje

Databázové systémy úvod

DŮVĚRYHODNÁ ELEKTRONICKÁ ARCHIVACE. Petr Dolejší Senior Solution Consultant

Předmluva 11. Poděkování 11 O autorech 12 Úvodem 12 Komu je tato kniha určena 13 Jak byste měli tuto knihu číst 13 Web 14

Data v informačních systémech

Datové úložiště referenčních nemocnic (DÚ RN): Zajištění sběru dat v roce Petr Klika a kol., ÚZIS ČR

Požadavky pro výběrová řízení TerraBus ESB/G2x

Integrace datových služeb vědecko-výukové skupiny

Novell Identity Management. Jaromír Látal Datron, a.s.

Databázové systémy úvod

PRODEJ Prodej je pochopitelně základní funkcí pokladního systému. Systému MERCATOR umožňuje prodej realizovat ve 3 režimech:

Databáze II. 1. přednáška. Helena Palovská

Ludvík Klema / Karel Malík Projekty ve veřejné správě Trnitá cesta od myšlenky k realizaci aneb pražský strážník 21. století

Úvod 17 ČÁST 1. Kapitola 1: Principy návrhu doménové struktury služby Active Directory 21

QAD CRM. Vladimír Bartoš. konzultant

Nasazení jednotné správy identit a řízení přístupu na Masarykově univerzitě s využitím systému Perun. Slávek Licehammer

EKONOMICKÝ A LOGISTICKÝ SOFTWARE. Luhačovice

Chytrá systémová architektura jako základ Smart Administration

Příručka uživatele HELPDESK GEOVAP

Případové studie a kulatý stůl. Dalibor Kačmář, Microsoft

Řízení dodávky IT služeb v enterprise společnosti

Příloha č. 12. Systém společného přihlašování, tzv. Single Sign On, ochrana dat

IBM Analytics Professional Services

Transkript:

Integrace dat RNDr. Ondřej Zýka 1

Obsah Kategorizace integračních přístupů Kroky integrace a řešení problematických stavů Master Data Management 2 2

Datová integrace Synchronní Akceptovaný požadavek na primárním systému je akceptován na všech systémech. Primární systém nahlásí chybu, pokud nahlásí chybu kterýkoliv z integrovaných systémů. Všechny strany vidí najednou stejná data. Technicky nerealizovatelné Výkon odpovídá nejslabšímu článku systému Aby proběhla transakce, musí být celý systém funkční Realizováno nejčastěji jako Dvojfázový commit Asynchronní Akceptovaný požadavek se přenese na všechny systémy, tam není zaručena jeho akceptace. Může tam vyvolat chybu. Všechny strany dostanou všechny požadavky. Průchodnost jak infrastruktura dovolí. Výpadek cílového systému neovlivní schopnost zadat požadavky. Různé typy poštovních (messaging) systémů 3 3

Datová integrace ETL, ELT Replikace Extract-Transform-Load Extract-Load-Transform Dávkové zpracování Podpora složitých transformací Full load, přírůstkový load Primárně pro Datový sklad Replikace datových prostorů Replikace na úrovni transakcí Malé možnosti transformací Real-time integrace Vyžaduje vyspělejší databáze s transakčním logem Asynchronní integrace 4 4

Datová integrace Materializované úložiště Vzniká nové úložiště integrovaných dat Umožňuje výpočetně náročné algoritmy integrace Dotazy na integrovaná data jsou rychlé, zvládají velké množství dotazů Příklady DWH ODS Virtuální pohledy Pouze metadata o modelech, vazbách a transformacích Data se získávají a transformace se provádějí až při dotazu Není třeba udržovat integrovaná data (velikost, výpočtová náročnost, aktuálnost) Požadovaný výkon je daný počtem dotazů Pouze malý počet dotazů Příklady Dohled a provoz 5 5

Datová integrace Federation Mediation Systém umožňuje (vynucuje) aby požadavky vznikaly jeho prostřednictvím a sám se stará o veškerou komunikaci s jednotlivými systémy. Výsledky předává uživateli. Příklady MDM aplikace ESB Reaguje se na změny v jednotlivých systémech a ty se předávají ostatním systémům Příklady Messaging Replikace 6 6

Datová integrace Sender Receiver Zdroj zná své cíle Zdroj je schopen reagovat na zprávy od cíle Cíl je schopen informovat zdroj Chybná zpráva Žádost o opakování Žádost o synchronizaci (všechna data) Publisher Subscriber Zdroj se nezajímá o cíle, množství a typy cílů zdroj nijak neovlivňují Cíl může odebírat data bez znalosti zdroje Cíl nemá zaručeno, že má všechny data Cíl nemůže požádat o opětnou synchronizaci Subsriber A Publisher Sender Receiver Subscriber B 7 7

Datová integrace Point-to-point Přímá komunikace mezi systémy navzájem Každý systém má mnoho partnerů Hub and Spoke Každý systém komunikuje pouze s centrální systémem (Hub) Různé technologické úrovně řešení HUBu, materializované i virtuální data Příklady: ESB, MDM, ODS, Informatica Data Hub Systém A Systém E Systém B Systém A Systém B Hub systém Systém D Systém C 8 8

Datová integrace Short-live transaction Long-live transaction Rychlost transakcí závisí pouze na výkonu infrastruktury. Provedení maximálně v řádu sekund Výpadek infrastruktury transakci ukončí. Používá se rollback Například databázová transakce V rámci transakce je možná interakce uživatele Může trvat i jednotky dnů Transakce přežije výpadek infrastruktury Používá se opravný kód Například transakce v BPM systémech 9 9

Granularita integrace Full (business) object Data record Informace vždy o celém objektu Snadná inicializace Snadné řešení relačních vazeb a konzistencí Nutnost zpracovat celý objekt ve zdroji a cíli Vysoké nároky na přenosovou kapacitu Snadná identifikace změn Jednodušší způsob získávání stavu před a po změně Veliké množství malých zpráv - nároky na režii přenosů Vysoké nároky na ověření integrity na cílové straně 10 10

Kroky integračního mechanismu 11

Kroky integrace Identifikace změny Přenos nového záznamu Přenos změny záznamu Přenos zrušení záznamu Problematika více systémů Integrace na základě času Integrace na základě datové kvality Řešení nedostupnosti dat 12 12

Identifikace změny Indikace změn pomocí Času Změna Timestamp od posledního přenosu Není možná identifikace fyzického zrušení záznamu Fronty událostí Řešeno programátorsky (triggery zapisující změny) Zvyšuje zatížení databáze Aplikačně aplikace vytváří frontu změn Nemožnost zaznamenat změny vzniklé mimo aplikaci Technologicky replikace na základě transakčního logu Indikace rozsahu změn Logická úroveň - objekt/záznam Technologická úroveň - řádek, sloupec Shromažďovaná data o změně Identifikace změny Iniciátor změny Nové hodnoty dat Původní hodnoty dat 13 13

Přenos nového záznamu Nový záznam ve zdrojovém systému Výsledek v cílovém systému Akceptace Vznik neúplného záznamu Vznik nekonzistentního záznamu Vznik duplicitního záznamu Řešení Lepší analýza Odmítnutí záznamu Dočasný zápis Validační proces 14 14

Přenos změny záznamu Změna záznamu ve zdrojovém systému Nutno rozlišovat, zda systém data nedodal, nebo zda null je správná hodnota. Výsledek v cílovém systému Porušení konzistence záznamu Vytvoření duplicity Vytvoření neúplného záznamu Nerozpoznání měněného záznamu (ztráta informace o změně) Řešení Lepší analýza Odmítnutí záznamu Dočasný zápis Validační proces 15 15

Přenos zrušení záznamu Zrušení záznamu Mnoho typů zrušení záznamu neaktivní dokončený zrušený fyzický delete Výsledek Vznik nekonzistencí Řešení Lepší analýza Logické zrušení (více typů mapování na stavy zdrojových systémů) Fyzické zrušení 16 16

Problematika více systémů Při integraci více systémů, vznikají pro uživatele nové typy otázek: Který systém má pravdu? Proč má pravdu? Jaké jiné hodnoty jsou v některém systému zadány? Jaké hodnoty byly v kterém systému v minulosti? Na základě jakých příčin se měnily dat v jednotlivých systémech? Kde a kdy vznikly data, která používám? 17 17

Integrace na základě času Princip: Novější údaje jsou přesnější Co je čas údaje Zadání do primárního systému Doba přenesení do cílového systému Jak řešit současnou změnu dat ve více systémech najednou? Nutnost přesné synchronizace času mezi systémy Na co se vztahuje identifikace času Na celý záznam Na jednotlivé datové položky 18 18

Integrace na základě datové kvality Princip: Pro každou hodnotu je definována datová kvalita (jak důvěryhodná je) Definice kvality na úrovni systému Data z interního systému jsou důvěryhodnější než data z webu. Definice kvality na úrovni atributů To platí, ale pro hodnotu emilové adresy jsou data z webu důvěryhodnější. Definice kvality na úrovni typů dat Pro korporátní uživatele jsou data z interního systému důvěryhodnější, pro ostatní uživatele je tomu naopak. Definice kvality na základě času Data ze systémů vymáhání jsou nejkvalitnější, ale pouze v době vymáhání. 19 19

Příklad použití datové kvality Nižší hodnota kvalitnější data Complete user profile Scheduled Scheduled time time DQ DQReal time Real time DQ DQ Scheduled Scheduled aircraft aircraft type type DQ DQReal aircraft Real aircraft type type DQ DQ Sep 21 Sep 2004 21 2004 9:05PM 9:05PM 8 8Sep 21 Sep 2004 21 2004 8:59PM 8:58PM 6 9M84 M84 7 7M83 M83 5 5 Account information history SRC Scheduled time DQ Real time DQ Scheduled aircraft type DQ Real aircraft type DQ SC Sep 21 2004 9:05PM 30 99 M83 30 99 FO Sep 21 2004 9:05PM 20 99 M83 15 99 MD Sep 21 2004 9:05PM 10 99 M84 7 99 AG Sep 21 2004 9:05PM 8 Sep 21 2004 9:00PM 20 99 M83 20 RL 99 Sep 21 2004 9:00PM 12 99 99 SI 99 Sep 21 2004 8:58PM 9 99 M83 5 MR 99 Sep 21 2004 8:59PM 6 99 M83 6 Zrušení informace v primárním systému 20 20

Master Data Management Procesy a nástroje k přesné integraci nejdůležitějších entit pro podnik. Zákazníci Správa všech partnerů Role a vazby (Hausholding, rodinné vazby, ekonomicky spjaté subjekty, obohacení o externí informace, scoring, ) Správa produktů Jednotné řešení pro všechny oddělení a uživatele Dodavatelé, Marketing, Partneři, Interní systémy, Konsolidace produktů, Prodej, Finance Jednotné řešení pro všechny procesy Design, Nacenění, Náklady, Reporting, Obchod Správa centrálních číselníků Jednotné řízení všech číselníků podle kterých se reportuje ve všech odděleních (číselníky pro controling) Umožňuje: Historizace, plánování, různé verze pravdy, propagace do systémů 21 21

Dopady integrace systémů Integrací vzniká z jednotlivých systémů řešení nové kvality. Nutno zohlednit požadavky na dozor nutnost komunikace se správci jednotlivých systémů údržba jednotlivých systému vytvoření adekvátní organizační struktury řízení změn je nutné na úrovni všech integrovaných systémů!!!! Zásah do libovolného systému se může projevit jako závažný problém v ostatních systémech. 22 22

Rizika projektů integrace Testování Testování je složité a časově náročné Často nutnost míchání různá testovací a produkční prostředí Nutnost zapojení testerů (automatů) do všech systémů Nasazení Nemožnost paralelního běhu Provoz - nutnost přípravy na výskyt neočekávaných stavů nepředpokládané interakce smyčky v přenosu vzájemné ovlivňování systémů změna chování uživatelů Bezpečnost ztráta informací neautorizované modifikace právní odpovědnost pravdivost informací původ informací krádež služeb ztráta důvěry zákazníků příležitost pro fraud 23 23

Kategorizace integračních přístupů Co si zapamatovat Rozdíl mezi synchronní a asynchronní integrací Jaké techniky se používají při indikaci dat, které je nutno přenášet v rámci integrace Jaké jsou hlavní problémy při zrušení záznamu v integračním systému Jak se používá datová kvalita při integraci dat z více systémů Co to je Master Data Management (MDM) Jaká rizika integračních projektů znáte 24 24

Diskuse Otázky Poznámky Komentáře Připomínky 25