Datová kvalita. RNDr. Ondřej Zýka

Podobné dokumenty
Datová kvalita. RNDr. Ondřej Zýka

Datová kvalita základ úspěšného BI. RNDr. Ondřej Zýka, Profinit

Řešení datové kvality prostřednictvím Master Data Managementu v prostředí České pošty s.p.

Metadata. MI-DSP 2013/14 RNDr. Ondřej Zýka,

Datová kvalita Profinit. All rights reserved.

Základní registry. Kvalita dat a jejich čištění v základních registrech veřejné správy. Připraveno pro konferenci ISSS. Ing.

Information and Data Management. RNDr. Ondřej Zýka

Kvalita a správa dat Data Quality

Zhodnocení architektury podniku. Jiří Mach

Databázové patterny. MI-DSP 2013/14 RNDr. Ondřej Zýka,

ČÍM TO VŠECHNO ZAČÍNÁ NA DATECH ZÁLEŽÍ, ALE NEJSOU DATA JAKO DATA

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

RIZIKA IMPLEMENTACE SKORKOVSKÝ. Přednášející : ESF MU 1/209

Jak připravit podnikový controlling a ABC Multidimenzionální vyhodnocování ziskovosti

MANAGEMENT Procesní přístup k řízení organizace. Ing. Jaromír Pitaš, Ph.D.

Efektivita (nejen) veřejné správy

Podrobná analýza k aktivitě č. 3 - implementace procesního řízení do praxe úřadu

DMS - řízená dokumentace, archiv a co dále? ICT ve zdravotnictví 2014

Integrace dat. RNDr. Ondřej Zýka

Manažerský informační systém pro efektivní řízení zdravotnictví ve Středočeském kraji

Realizace koncepce BIM

CONTROLLING. Metodický list č. 1. Název tematického celku: FUNKCE CONTROLLINGU A ZÁKLADNÍ VZTAHY VE FINANČNÍM PLÁNU

Czech Republic. Datová synchronizace se blíží! Vytěžte z ní maximum.

Praha PROJECT INSTINCT

Každý písemný, obrazový, zvukový, elektronický nebo jiný záznam, ať již v podobě analogové či digitální, který vznikl z činnosti původce.

Metadata. RNDr. Ondřej Zýka

Vývoj informačních systémů. Obecně o IS

ANALÝZA NÁKUPNÍHO KOŠÍKU SEMINÁŘ

MANAŽER KVALITY PŘEHLED POŽADOVANÝCH ZNALOSTÍ K HODNOCENÍ ZPŮSOBILOSTI CO 4.4/2007

BI-TIS Případová studie

Informační strategie. Doc.Ing.Miloš Koch,CSc.

Konsolidovaný reporting CZ/SK v Cognos případová studie sanofi-aventis

KVALITA DAT POUŽITÁ APLIKACE. Správnost výsledku použití GIS ovlivňuje:

Návod k požadavkům ISO 9001:2015 na dokumentované informace

Komunikační strategie a plán rozvoje portálu portal.gov.cz

End User Experience Monitoring Měření kvality IT služeb , Brno Jiří Vozňák. information technology

2013 IBM Corporation

Téma II. Eva Sovjáková. Workshop WasserBLIcK - CENIA,

Big Data a oficiální statistika. Unicorn College Open 24. dubna 2015 Doc. Ing. Marie Bohatá, CSc.

EKONOMICKÝ A LOGISTICKÝ SOFTWARE. Luhačovice

GLOSÁŘ POJMŮ 1. Glosář pojmů_2.část Příručky

Specifika bankovního prostředí při monitoringu a analýze bezpečnostních incidentů. RNDr. Ondřej Zýka Profinit

Personální audit lze provádět z hlediska kontroly jako: Běžný, který vznikl na základě zjištěné odchylky.

KATALOG SLUŽEB NÁSLEDNÉ PODPORY

Systém managementu bezpečnosti informací (ISMS) podle ISO/IEC 27001:2005

CRM systém Fleet IS. pro farmaceutické firmy

Databázové patterny. RNDr. Ondřej Zýka

CobiT. Control Objectives for Information and related Technology. Teplá u Mariánských Lázní, 6. října 2004

Efektivnost informačních systémů. strategické řízení taktické řízení. operativní řízení a provozu

Příloha: Dodatečné informace, včetně přesného znění žádosti dodavatele o dodatečné informace

E-FAKTURACE Pojďme společně elektronizovat fakturaci

Procesní audit VIKMA

CPM/BI a jeho návaznost na podnikové informační systémy. Martin Závodný

Charta pro zveřejňování zdravotnických informací pro zvyšování kvality poskytování služeb

Výhody a rizika outsourcingu formou cloud computingu

Dopad legislativních změn v informační bezpečnosti na interní audit Tomáš Pluhařík

Setkání interních auditorů z finanční oblasti. Nové výzvy pro interní audit Big Data a socialní sítě

NEDOSTATEČNÝ A NEÚČINNÝ MARKETING CR V ORP Účinný marketing CR v ORP Chomutov. Roky Plán 1 1 Skutečnost 0 Popis měřítka:

Kvalitní data kvalitní agendy

Legislativní opora. č. 365/2000 Sb., o informačních systémech veřejné správy (ISVS), (dále jen zákon ) č. 81/2006 Sb. Zákon.

I. Fáze analýzy vzdělávacích potřeb úředníků ÚSC

Procesní řízení a normy ISO, ITIL, COBIT, HIPAA, SOX

13 let s Metodickým pokynem Kritéria znečištění zemin a podzemní vody. Petr Kozubek Enacon s.r.o.

Novell Identity Management. Jaromír Látal Datron, a.s.

WORKFLOW. Procesní přístup. Základ perspektivního úspěšného podnikového řízení. Funkčnířízení založené na dělbě práce

Školení vlastníků procesů aplikace Mapa procesů

TRANSFORMACE CALL CENTRA NA EFEKTIVNÍ ZÁKAZNICKÉ KONTAKTNÍ CENTRUM

Rizika na liberalizovaném trhu s elektřinou

Bezpečný digitální podpis v praxi.

Primární klíč (Primary Key - PK) Je právě jedna množina atributů patřící jednomu z kandidátů primárního klíče.

Informační a znalostní systémy jako podpora rozhodování

MBI - technologická realizace modelu

DŮVĚRYHODNÁ ELEKTRONICKÁ SPISOVNA

Co musí zahrnovat dokumentace systému managementu kvality? 1 / 5

Procesní modelování agend veřejné správy dosažené výsledky. Josef Beneš Ministerstvo vnitra

ODŮVODNĚNÍ. 1.2 Identifikace problému, cílů, kterých má být dosaženo, rizik spojených s nečinností

USRJ: Úvod do systému řízení jakosti ve zdravotnictví

TÜV SÜD Czech s.r.o. Systém energetického managementu dle ČSN EN 16001

Energetická témata pro IA. Jiří Mlynář 7 November 2014

IBM Analytics Professional Services

Validace souborů DS3

Procesy, procesní řízení organizace. Výklad procesů pro vedoucí odborů krajského úřadu Karlovarského kraje

Proces auditu. Health Research & Information Division, ESRI, Dublin, July 2008

Integrace dat. RNDr. Ondřej Zýka

Lekce 9 - Migrace dat

Performance Management What if?

Jakým způsobem lze zlepšit plnění smluv o úrovni poskytovaných služeb a současně snížit náklady?

Aktuální otázky provozu datových skladů PAVEL HNÍK

ENERGIE PRO BUDOUCNOST X. Efektivní výroba a využití energie. Efektivnost v energetice

Nasazení CA Role & Compliance Manager

Microsoft SharePoint Portal Server Zvýšená týmová produktivita a úspora času při správě dokumentů ve společnosti Makro Cash & Carry ČR

ADVANTA / Dokumentace: Přehled funkčních modulů

Dopady GDPR a jejich vazby

7. Pracovní postupy. Fakulta informačních technologií MI-NFA, zimní semestr 2011/2012 Jan Schmidt

MEZINÁRODNÍ NORMY A DIGITÁLNÍ KONTINUITA. Tomáš Bezouška Praha,

Ekonomické aspekty přechodu na. ochrana vašich investic

Měření výsledků výuky a vzdělávací standardy

zvyšování produktivity v automobilovém průmyslu Vladimír Bartoš ředitel podpory prodeje MINERVA ČR a.s.

Outsourcing v podmínkách Statutárního města Ostravy

Modely datové. Další úrovní je logická úroveň Databázové modely Relační, Síťový, Hierarchický. Na fyzické úrovni se jedná o množinu souborů.

Transkript:

Datová kvalita RNDr. Ondřej Zýka 1

Datová kvalita Jedna z kompetencí Data managementu Cíl: Zajistit uživatelům data v kvalitě potřebné k jejich činnosti Kvalita dat: Subjektivní pojem závislý na požadavcích a zkušenosti uživatelů, na způsobu použití dat Kvalita dat není dána jejich strukturou nebo uložením. 2 2

Dimenze datové kvality Dimenze Dostupnost Odpovídající velikost a granularita dat Věrohodnost Úplnost Výstižná reprezentace Konzistentní reprezentace Snadnost zpracování Bezchybnost Interpretovatelnost Objektivita Relevantnost Reputace Bezpečnost Včasnost Srozumitelnost Popis Zda jsou informace k dispozici nebo snadno získatelné Zda velikost dat a jejich granularita odpovídá vykonávaným úlohám Zda jsou informace pokládány za pravdivé a důvěryhodné Zda žádná data nechybí a zda jsou dostatečné rozsáhlá a detailní pro vykonávané úlohy Zda reprezentace dat má vhodnou strukturu Zda jsou data reprezentována vždy ve stejném formátu Zda jsou informace snadno zpracovatelné a použitelné pro rozdílné úlohy Zda jsou informace a data přesné a hodnověrné Zda je jasná definice informací, zda jsou v odpovídajícím jazyku, jednotkách a zda jsou označeny správnými symboly Zda jsou informace nestranné a nepředpojaté Zda jsou informace použitelné a užitečné pro vykonávané úlohy Zda jsou informace považovány za spolehlivé v souvislosti s jejich zdrojem nebo obsahem Zda omezení přístupu k datům a informacím odpovídá bezpečnostním pravidlům Zda jsou pro vykonávané úlohy informace k dispozici včas Zda jsou informace snadno pochopitelné a srozumitelné Přidaná hodnota Zda a která data a informace jsou přínosné a jaké jsou výhody jejich použití 3 3

Základní otázky datové kvality Kdy jsou data kvalitní? Kdy jsou data nekvalitní? Jak prokázat, že jsou data kvalitní? Jak zvýšit kvalitu dat? Pozorování Dodavatelé dat obecně nemají moc důvodů produkovat bezchybná data. Nekvalitní data vytváří nesmírnou frustraci uživatelů dat. Kvalita dat se nedá dosáhnout pouze prostředky IT. Příklady adresa@naznama.cz Rodné číslo 4 4

Kdy jsou data nekvalitní? Perspektiva dat Chyba v pravopisu Duplicitní záznam Nesprávná hodnota Zastaralá informace Nesprávný formát Chybějící záznam Perspektiva uživatele Informace není dostupná Informace je těžko agregovatelná Informace je nesprávná Na data se nelze spolehnout Data zachycují jen část celku Data obsahují logické nekonzistence Perspektiva společnosti Rozhodnutí učiněná na základě špatných informací Drahé a neúčinné marketingové kampaně Odliv zákazníků díky špatné kvalitě služeb Vysoká náročnost nalezení požadovaných informací Zpoždění projektů implementace nových systémů Problémy s compliance 5

Příznaky nekvality v datech? Reporty nejdou porovnat Pracovníci si vedou soukromé agendy Pracovníci si nechávají výsledky kontrolovat 6 6

Proč se zabývat datovou kvalitou Výskyt chyb v datové kvalitě Nespokojenost uživatelů Legislativní požadavky, požadavky regulátorů Solvency II Basel II, Basel III 7 7

Jak prokázat kvalitu dat? Co to je za číslo? Jak vzniklo? Kdo to kontroloval? Byla použita všechna data? Byla použita aktuální data?????? 8 8

Jsou nastaveny procesy a politiky Je definována politika datové kvality Je definována organizace DQ Role Job description Accountability and responsibility assignment Jsou vytvořeny a udržovány slovníky DQ Definice dat Popis dat a datových toků Stanovení metrik datové kvality pro jednotlivé prvky Jsou nastaveny procesy DQ Nastaveno měření a reporting datové kvality Nastaven proces řízení chyb v datové kvalitě Identifikace, odhad dopadů, definice nápravy, ohodnocení nápravy, oprava dat, dokumentace opravy Nastaven proces DQ operation 9 9

Slovníky datové kvality Definice na obchodní úrovni Definice na technické úrovni Místo a formát uložení Vlastník - Zodpovědná osoba Parametry důležitosti, bezpečnosti, aktuálnosti, 10 10

Metriky datové kvality Technické Data mají přípustné hodnoty, očekávaný formát, pohybují se v přípustném rozsahu, jsou jednoznačné pokud je to požadováno, existují odpovídající záznamy v jiných systémech Významové Hodnoty, počty a sumy jsou konzistentní v čase. Porovnání s historickými daty a benchmarky nevykazuje neodůvodněné odchylky. Existuje požadovaná konzistence mezi různými záznamy a hodnotami. Požadavek Kontrakt musí mít definován Politiku zajištění Metrika Procento kontraktů s vyplněným parametrem Politika zajištění Tresholds OK > 99% Failed < 95 % Baseline 96,2 % 11 11

Metriky DQ Počet not null hodnot Čísla Rozsah Histogram Přesnost Speciální hodnoty (0, 1, 100, 10,..) Řetězce Délka Vzory, hodnoty extrémních vzorů Minimum a maximum Vazby Počet nepoužitých cizích klíčů Histogram použití cizích klíčů Počet neexistujících cizích klíčů 12 12

Profiling měření DQ metrik Technický Uživatelský Speciální 13 13

Data Profiling 14 14

Popis datových toků Zdroje dat Datové úložiště Transformační procesy Zodpovědnosti (vlastnictví dat) Místa předání zodpovědností Ruční zásahy 15 15

DQ měření a reportování 16 16

Jak prokázat kvalitu dat? Udělal jsem všechno pro to, abych číslu mohl věřit. 17 17

Důvody nekvalitních dat Pouze dva zdroje znečištění dat Na vstupu Uživatelé Změna zvnějšku, kterou nereflektujeme ve svých systémech Nesprávně provedená migrace dat Špatně nastavená datová integrace Zastarávání dat Deset let starý telefonní seznam neobsahuje kvalitní data 18 18

Kdy data čistit? Vždy je možné zlepšit kvalitu dat Pokud si nikdo nestěžuje, nemá smysl investovat zvyšování kvality dat Pokud se objeví problém s datovou kvalitou, je třeba porovnávat přínosy a náklady na čištění Fin. ztráty způsobené nekvalitou dat Náklady na dodatečnou verifikaci dat Náklady na data re-entry Kompenzace Pokuty Náklady způsobené zhoršenou reputací Náklady způsobené špatným rozhodnutím Náklady na zlepšení datové kvality Náklady na školení Náklady na pravidelný monitoring Náklady na deploynment DQ Náklady na analýzu Náklady na plánování a implementaci opravy 19 19

Kdy a jak čistit data Vždy je možné zlepšit kvalitu dat Pokud si nikdo nestěžuje, nemá smysl investovat zvyšování kvality dat Pokud se objeví problém s datovou kvalitou, je nutné porovnávat přínosy a náklady čištění 20 20

Jak zvýšit kvalitu dat? Čištění dat Neexistuje jedno správné řešení Obecně data nejdou vyčistit Čtyři základní metody Nechat kvalitu dat na uživateli nečistit Jednorázové čištění Čistění příchozích dat Čištění používaných dat Nalezení a úprava znečišťovatele Vzdělávání uživatelů a původců dat Příklad (voda v jezeře) 21 21

Co si zapamatovat Co to je datová kvalita Jak se pozná, že jsou data kvalitní Kdo a jak pozná, že jsou data nekvalitní Jaké metody se používají pro čištění dat Kde a jak vzniká nekvalita dat Co to jsou dimenze datové kvality Co to je profiling dat Jak se dá prokázat, že jsou informace získaná z dat kvalitní 22 22

Diskuse Otázky Poznámky Komentáře Připomínky 23