Integrace dat. RNDr. Ondřej Zýka

Podobné dokumenty
Integrace dat. RNDr. Ondřej Zýka

Integrace dat. MI-DSP 2013/14 RNDr. Ondřej Zýka,

Integrace dat Profinit. All rights reserved.

Datová kvalita. RNDr. Ondřej Zýka

Information and Data Management. RNDr. Ondřej Zýka

Metadata. MI-DSP 2013/14 RNDr. Ondřej Zýka,

Řešení datové kvality prostřednictvím Master Data Managementu v prostředí České pošty s.p.

Aktuální otázky provozu datových skladů PAVEL HNÍK

Odbor informatiky a provozu informačních technologií

Datová kvalita. RNDr. Ondřej Zýka

Datová kvalita základ úspěšného BI. RNDr. Ondřej Zýka, Profinit

8.2 Používání a tvorba databází

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

Databáze I. 5. přednáška. Helena Palovská

DATA ULOŽENÁ NA VĚČNÉ ČASY. (ICZ DESA / Microsoft Azure) Mikulov Michal Matoušek (ICZ) / Václav Koudele (Microsoft)

Zkušební test. Kdy se začala formovat koncept relačních databází (Vznik relačního modelu, první definice SQL)? a) 1950 b) 1960 c) 1970 d) 1980

Moderní metody automatizace a hodnocení marketingových kampaní

Databázové systémy. Doc.Ing.Miloš Koch,CSc.

Centralizace aplikací ve VZP

TECHNICKÁ SPECIFIKACE VEŘEJNÉ ZAKÁZKY

Registr pojištěnců veřejného zdravotního pojištění. Ing. Radek Papp vedoucí projektu

Specifika bankovního prostředí při monitoringu a analýze bezpečnostních incidentů. RNDr. Ondřej Zýka Profinit

Kurz Databáze. Obsah. Dotazy. Zpracování dat. Doc. Ing. Radim Farana, CSc.

Lekce 9 - Migrace dat

SOAP & REST služby. Rozdíly, architektury, použití

Replikace je proces kopírování a udržování databázových objektů, které tvoří distribuovaný databázový systém. Změny aplikované na jednu část jsou

Metadata. RNDr. Ondřej Zýka

Business Intelligence. Adam Trčka

RDF DSPS ROZVOJ PORTÁLU

Sjednocení dohledových systémů a CMDB

Obsah Úvod 11 Jak být úspěšný Základy IT

Správa dat v podniku. MI-DSP 2013/14 RNDr. Ondřej Zýka, ondrej.zyka@profinit.eu

Národní registr poskytovatelů zdravotních služeb Aplikace NRPZS Stav změn a oprav

Integrace informačních systémů ve Fakultní nemocnici Brno v rámci projektu ENIS II

Primární klíč (Primary Key - PK) Je právě jedna množina atributů patřící jednomu z kandidátů primárního klíče.

Kapitola 1: Úvod. Systém pro správu databáze (Database Management Systém DBMS) Účel databázových systémů

Konsolidovaný reporting CZ/SK v Cognos případová studie sanofi-aventis

Objektově orientované databáze. Miroslav Beneš

Základní registry. Kvalita dat a jejich čištění v základních registrech veřejné správy. Připraveno pro konferenci ISSS. Ing.

Chybová hlášení METODIKA MET-01/2014. SZR-56-1/OPICT-2013 počet stran 28 přílohy 0. Nahrazuje:

Roční periodická zpráva projektu

Výtisk č.: Počet listů 9. Přílohy: 0 ÚZIS ČR

Databázové patterny. MI-DSP 2013/14 RNDr. Ondřej Zýka,

Databázové patterny. RNDr. Ondřej Zýka

Synchronizace číselníků

Popis logování v aplikačním serveru

Návrh datového skladu z hlediska zdrojů

Zkušenosti z implementace GDPR. Tomáš Nielsen NIELSEN MEINL, advokátní kancelář, s.r.o.

Marketingová komunikace. 3. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK3PH (vm3bph)

GDPR co nastane po květnovém dni D? Martin Hladík 8. března 2018

Databáze II. 1. přednáška. Helena Palovská

Projekt zavedení elektronického registru dotací a finančních darů v podmínkách Krajského úřadu Jihočeského kraje

Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph)

Příloha č. 1 Verze IS esyco business

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9

ORACLE ŘÍZENÍ FINANCÍ

Zajištění komplexních sluţeb pro provoz systémové infrastruktury OSMS ZADÁVACÍ DOKUMENTACE

KSRZIS. Postup kroků nutných pro napojení nemocničního informačního systému s registrem NSHNU v prostředí registrů resortu zdravotnictví

Vhodnost nasazení jednotlivých webových architektur, sdílení dat, perzistence, webové služby a REST, asynchronnost, messaging

Datové úložiště referenčních nemocnic (DÚ RN): Zajištění sběru dat v roce Petr Klika a kol., ÚZIS ČR

UNICORN COLLEGE. Bakalářská práce

FRED & PostgreSQL. CZ.NIC, z.s.p.o. Jaromír Talíř <jaromir.talir@nic.cz>

Integrace podnikových Open Source aplikací v praxi. RNDr. Petr Novák, Open Source Conference Praha, 19. duben 2011

DŮVĚRYHODNÁ ELEKTRONICKÁ ARCHIVACE. Petr Dolejší Senior Solution Consultant

Historie a současnost datových skladů GE Money ČR

Microsoft Sync Framework. Jiří Činčura blog.cincura.net

TM1 vs Planning & Reporting

QAD CRM. Vladimír Bartoš. konzultant

Návrh vyhlášky k zákonu o kybernetické bezpečnosti. Přemysl Pazderka NCKB

Příručka uživatele HELPDESK GEOVAP

Datová věda (Data Science) akademický navazující magisterský program

Jan Váša TGB Sales Representative, Oracle Czech 10. června 2011 MRI Kladno

Základní registry ČR

Popis egon služby. E93 - roszapispravnistav. Název dokumentu: Popis egon služeb Verze: Datum aktualizace: Správa základních registrů

Kontrolně analytické centrum (KAC) Nástroj moderního řízení a organizace železniční dopravní cesty

Projekt Partner ČSOB Leasing. 02/12/2013 Jaromír Mayer Domain Process Manager Head of Department

Rezortní registry (ereg) a Jednotná technologická platforma rezortu zdravotnictví

CSPUG 2011-květen. GridSQL a pg-pool II. Vratislav Beneš benes@optisolutions.cz

Klientský formát POHLEDÁVKY platný od

Data v informačních systémech

Teradata Basic. RNDr. Ondřej Zýka

PRODEJ Prodej je pochopitelně základní funkcí pokladního systému. Systému MERCATOR umožňuje prodej realizovat ve 3 režimech:

GIS a Business Intelligence

Co nového ve spisové službě? Národní standard pro elektronické systémy spisové služby a jeho optimalizace

Případové studie a kulatý stůl. Dalibor Kačmář, Microsoft

Jednoznačná identifikace jako předpoklad funkčního e-health. Martin Pavlík

Proces vývoje HRIS Vema (Human Resources Information System) Jaroslav Šmarda

Michal Kolařík ISZR - Brána k základním registrům

<Insert Picture Here> Jak garantovat bezpečnost systémů ve státní správě

KIV/SI. Rozílová témata. Jan Valdman, Ph.D.

CPM/BI a jeho návaznost na podnikové informační systémy. Martin Závodný

Popis egon služeb. E94 - isknreklamujprvek. Název dokumentu: Popis egon služeb v rámci základních registrů. Datum aktualizace:

Procesy úřadu efektivně

4IT218 Databáze. 4IT218 Databáze

Jak spustit provoz v DR lokalitě snadno a rychle

EKONOMICKÝ A LOGISTICKÝ SOFTWARE. Luhačovice

Chytrá systémová architektura jako základ Smart Administration

Ondřej Bothe, Richard Dobiš

STORK Secure Identity Across Borders Linked

EIDAS, DIGITÁLNÍ DŮVĚRA A MODERNÍ PAPERLESS. Jan Tejchman Business Consultant

Transkript:

Integrace dat RNDr. Ondřej Zýka 1

Obsah Kategorizace integračních přístupů Kroky integrace a řešení problematických stavů Master Data Management 2 2

Datová integrace Synchronní Akceptovaný požadavek na primárním systému je akceptován na všech systémech. Všechny strany vidí najednou stejná data. Technicky nerealizovatelné Výkon odpovídá nejslabšímu článku systému Aby proběhla transakce, musí být celý systém funkční Dvojfázový commit Asynchronní Akceptovaný požadavek se přenese na všechny systémy, tam není zaručena jeho akceptace. Všechny strany dostanou všechny požadavky. Průchodnost jak infrastruktura dovolí. Výpadek cílového systému neovlivní schopnost zadat požadavky. Různé typy poštovních (messaging) systémů 3 3

Datová integrace Short-live transaction Long-live transaction Rychlost transakcí závisí pouze na výkonu infrastruktury. Provedení maximálně v řádu sekund Výpadek infrastruktury transakci ukončí. Používá se rollback Například databázová transakce V rámci transakce je možná interakce uživatele Může trvat i jednotky dnů Transakce přežije výpadek infrastruktury Používá se opravný kód Například transakce v BPM systémech 4 4

Datová integrace Materializované úložiště Vzniká nové úložiště integrovaných dat Umožňuje výpočetně náročné algoritmy integrace Dotazy na integrovaná data jsou rychlé, zvládají velké množství dotazů Příklady DWH ODS Virtuální pohledy Pouze metadata o modelech, vazbách a transformacích Data se získávají a transformace se provádějí až při dotazu Není třeba udržovat integrovaná data (velikost, výpočtová náročnost, aktuálnost) Požadovaný výkon je daný počtem dotazů Pouze malý počet dotazů Příklady Dohled a provoz 5 5

Datová integrace ETL, ELT Replikace Extract-Transform-Load Extract-Load-Transform Dávkové zpracování Podpora složitých transformací Full load, přírůstkový load Primárně pro Datový sklad Replikace datových prostorů Replikace na úrovni transakcí Malé možnosti transformací Real-time integrace Vyžaduje vyspělejší databáze s transakčním logem Asynchronní integrace 6 6

Datová integrace Federation Mediation Systém umožňuje (vynucuje) aby požadavky vznikaly jeho prostřednictvím a sám se stará o veškerou komunikaci s jednotlivými systémy. Výsledky předává uživateli. Příklady MDM aplikace ESB Reaguje se na změny v jednotlivých systémech a ty se předávají ostatním systémům Příklady Messaging Replikace 7 7

Datová integrace Sender Receiver Zdroj zná své cíle Zdroj je schopen reagovat na zprávy od cíle Cíl je schopen informovat zdroj Chybná zpráva Žádost o opakování Žádost o synchronizaci (všechna data) Publisher Subscriber Zdroj se nezajímá o cíle, množství a typy cílů zdroj nijak neovlivňují Cíl může odebírat data bez znalosti zdroje Cíl nemá zaručeno, že má všechny data Cíl nemůže požádat o opětnou synchronizaci Subsriber A Publisher Sender Receiver Subscriber B 8 8

Datová integrace Point-to-point Přímá komunikace mezi systémy navzájem Každý systém má mnoho partnerů Hub and Spoke Každý systém komunikuje pouze s centrální systémem (Hub) Různé technologické úrovně řešení HUBu, materializované i virtuální data Příklady: ESB, MDM, ODS, Informatica Data Hub Systém A Systém E Systém B Systém A Systém B Hub systém Systém D Systém C 9 9

Granularita integrace Full (business) object Data record Informace vždy o celém objektu Snadná inicializace Snadné řešení relačních vazeb a konzistencí Nutnost zpracovat celý objekt ve zdroji a cíli Vysoké nároky na přenosovou kapacitu Snadná identifikace změn Jednodušší způsob získávání stavu před a po změně Veliké množství malých zpráv - nároky na režii přenosů Vysoké nároky na ověření integrity na cílové straně 10 10

Kroky integračního mechanismu 11

Kroky integrace Identifikace změny Insert záznamu Update záznamu Delete záznamu Problematika více systémů Integrace na základě času Integrace na základě datové kvality Řešení nedostupnosti dat 12 12

Identifikace změny Indikace změn pomocí Timestamp Fronta událostí Technologicky (triggery) Aplikačně Technologicky - replikace Indikace rozsahu změn Logická úroveň - objekt/záznam Technologická úroveň - řádek, sloupec Data změny Identifikace změny Nová data Původní data 13 13

Insert Nový záznam Výsledek Neúplný záznam Nekonzistentní záznam Duplicitní záznam Řešení Odmítnutí Dočasný zápis Validační proces 14 14

Update Update záznamu Výsledek Porušení konzistence Vytvoření duplicity Vytvoření neúplného záznamu Nerozpoznání měněného záznamu (ztráta informace o změně) 15 15

Delete Delete záznamu Mnoho typů ukončení platnosti záznamu neaktivní dokončený zrušený fyzický delete Výsledek Vznik nekonzistencí Řešení Logické zrušení (více typů mapování na stavy zdrojových systémů) Fyzické zrušení 16 16

Problematika více systémů Nové typy otázek Který systém má pravdu Proč má pravdu Jaké jiné hodnoty jsou v některém systému zadány Jaké hodnoty byly v kterém systému v minulosti Na základě jakých příčin se měnily dat v jednotlivých systémech 17 17

Integrace na základě času Novější údaje jsou přesnější Definice času údaje Zadání do primárního systému Doba přenesení do cílového systému Jak řešit paralelní zadávání dat? Granularita identifikace času Pro celý záznam Pro jednotlivé datové položky 18 18

Příklad použití datové kvality Complete user profile Scheduled Scheduled time time DQ DQ Real time Real time DQ DQ Scheduled Scheduled aircraft aircraft type type DQ DQ Real aircraft Real aircraft type type DQ DQ Sep 21 Sep 2004 21 2004 9:05PM 9:05PM 8 8 Sep 21 Sep 2004 21 2004 8:59PM 8:58PM 6 9 M84 M84 7 7 M83 M83 5 5 Account information history SRC Scheduled time DQ Real time DQ Scheduled aircraft type DQ Real aircraft type DQ SC Sep 21 2004 9:05PM 30 99 M83 30 99 FO Sep 21 2004 9:05PM 20 99 M83 15 99 MD Sep 21 2004 9:05PM 10 99 M84 7 99 AG Sep 21 2004 9:05PM 8 Sep 21 2004 9:00PM 20 99 M83 20 RL 99 Sep 21 2004 9:00PM 12 99 99 SI 99 Sep 21 2004 8:58PM 9 99 M83 5 MR 99 Sep 21 2004 8:59PM 6 99 M83 6 Zrušení informace v primárním systému 19 19

Řešení nedostupnosti dat Definice Zdroj Kvalita dat Null hodnota Datawarehouse 70 Ne Systém 90 Ne Druhý systém 80 Ano Příchozí data Zdroj Jméno Výsledek Datawarehouse Systém Druhý systém Pavel Jirka Tomáš? Jirka Vyšší hodnota kvality dat má přednost 20 20

Řešení nedostupnosti dat Definice Zdroj Kvalita dat Null hodnota Datawarehouse 70 Ne Systém 90 Ne Druhý systém 80 Ano Příchozí data Zdroj Jméno Výsledek Datawarehouse Systém Druhý systém Pavel Tomáš? Tomáš Vyšší hodnota kvality dat má přednost 21 21

Řešení nedostupnosti dat Definice Zdroj Kvalita dat Null hodnota Datawarehouse 70 Ne Systém 90 Ne Druhý systém 80 Ano Příchozí data Zdroj Jméno Výsledek Datawarehouse Systém Druhý systém Pavel? null Vyšší hodnota kvality dat má přednost 22 22

Master Data Management Procesy a nástroje k přesné integraci nejdůležitějších entit pro podnik. Správa klientů PARTY Role a vazby (Hausholding, ekonomicky spjaté subjekty, externí informace, scoring, ) Správa produktů Dodavatelé, Obchodní proces, Design, Marketing, Nacenění, Partneři, Interní systémy, Náklady, Reporting, Konsolidace produktů Správa centrálních číselníků Historizace, plánování, různé verze pravdy, propagace do systémů Více architektonických přístupů Master Reference Data Master Systém of Records Master Registry Synchronizace 23 23

Master Reference Data Zdroj A Datová integrace Automatické dávkové nebo realtime zpracování. Čištění, integrace, Standardizace, Zdroj B Data Warehouse Exceptions Zdroj C Správa výjimek 24 24

Master System of Record Zdroj A Datová integrace Automatické dávkové nebo realtime zpracování. Čištění, integrace, Standardizace, Zdroj B Master Databáze Zdroj C Správa výjimek Nové aplikace 25 25

Master Registry Datová integrace Automatické dávkové nebo realtime zpracování. Čištění, integrace, Standardizace, Zdroj A Zdroj B Zdroj C Registr vazeb Správa výjimek Nové aplikace 26 26

Synchronization Zdroj A Datová integrace Automatické dávkové nebo realtime zpracování. Čištění, integrace, Standardizace, Zdroj B Zdroj C Správa výjimek 27 27

Integrace Integrací vzniká z jednotlivých systémů řešení nové kvality. Nutno uvažovat požadavky na dozor nutnost komunikace se správci jednotlivých systémů údržba jednotlivých systému vytvoření adekvátní organizační struktury řízení změn je nutné na úrovni všech integrovaných systémů!!!! Zásah do libovolného systému se může projevit jako závažný problém v ostatních systémech. 28 28

Integrace rizika projektů Testování Testování je složité a časově náročné Často nutnost míchání různá testovací a produkční prostředí Nutnost zapojení testerů (automatů) do všech systémů Nasazení Nemožnost paralelního běhu Provoz - nutnost přípravy na výskyt neočekávaných stavů nepředpokládané interakce smyčky v přenosu vzájemné ovlivňování systémů změna chování uživatelů 29 29

Integrace rizika projektů Bezpečnost ztráta informací neautorizované modifikace právní odpovědnost pravdivost informací původ informací krádež služeb ztráta důvěry zákazníků příležitost pro fraud 30 30

Kategorizace integračních přístupů Techniky indikace dat Co si zapamatovat Rozdíl mezi synchronní a asynchronní integrací Jaké techniky se používají při indikaci dat, které je nutno přenášet v rámci integrace Jaké jsou hlavní problémy při zrušení záznamu v integračním systému Jak se používá datová kvalita při integraci dat z více systémů Co to je Master Data Management (MDM) Jaká jsou hlavní rizika integračních projektů 31 31

Diskuse Otázky Poznámky Komentáře Připomínky 32