Datová kvalita. RNDr. Ondřej Zýka

Podobné dokumenty
Datová kvalita. RNDr. Ondřej Zýka

Datová kvalita základ úspěšného BI. RNDr. Ondřej Zýka, Profinit

Datová kvalita Profinit. All rights reserved.

Řešení datové kvality prostřednictvím Master Data Managementu v prostředí České pošty s.p.

Kvalita a správa dat Data Quality

Základní registry. Kvalita dat a jejich čištění v základních registrech veřejné správy. Připraveno pro konferenci ISSS. Ing.

Zhodnocení architektury podniku. Jiří Mach

Metadata. MI-DSP 2013/14 RNDr. Ondřej Zýka,

Information and Data Management. RNDr. Ondřej Zýka

Databázové patterny. MI-DSP 2013/14 RNDr. Ondřej Zýka,

Jak připravit podnikový controlling a ABC Multidimenzionální vyhodnocování ziskovosti

EKONOMICKÝ A LOGISTICKÝ SOFTWARE. Luhačovice

ANALÝZA NÁKUPNÍHO KOŠÍKU SEMINÁŘ

MANAGEMENT Procesní přístup k řízení organizace. Ing. Jaromír Pitaš, Ph.D.

Integrace dat. RNDr. Ondřej Zýka

Návod k požadavkům ISO 9001:2015 na dokumentované informace

Efektivita (nejen) veřejné správy

ODŮVODNĚNÍ. 1.2 Identifikace problému, cílů, kterých má být dosaženo, rizik spojených s nečinností

Databázové patterny. RNDr. Ondřej Zýka

RIZIKA IMPLEMENTACE SKORKOVSKÝ. Přednášející : ESF MU 1/209

Leady & MERK Integrace Microsoft Dynamics CRM s aplikacemi Leady a MERK

ČÍM TO VŠECHNO ZAČÍNÁ NA DATECH ZÁLEŽÍ, ALE NEJSOU DATA JAKO DATA

Výukový materiál zpracovaný v rámci projektu Výuka moderně

CRM systém Fleet IS. pro farmaceutické firmy

Praha PROJECT INSTINCT

Podrobná analýza k aktivitě č. 3 - implementace procesního řízení do praxe úřadu

Czech Republic. Datová synchronizace se blíží! Vytěžte z ní maximum.

Každý písemný, obrazový, zvukový, elektronický nebo jiný záznam, ať již v podobě analogové či digitální, který vznikl z činnosti původce.

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

MANAŽER KVALITY PŘEHLED POŽADOVANÝCH ZNALOSTÍ K HODNOCENÍ ZPŮSOBILOSTI CO 4.4/2007

BI-TIS Případová studie

NEDOSTATEČNÝ A NEÚČINNÝ MARKETING CR V ORP Účinný marketing CR v ORP Chomutov. Roky Plán 1 1 Skutečnost 0 Popis měřítka:

USRJ: Úvod do systému řízení jakosti ve zdravotnictví

Kvalitní data kvalitní agendy

Setkání interních auditorů z finanční oblasti. Nové výzvy pro interní audit Big Data a socialní sítě

2013 IBM Corporation

HR controlling. Ing. Jan Duba HRDA

Metadata. RNDr. Ondřej Zýka

Legislativní opora. č. 365/2000 Sb., o informačních systémech veřejné správy (ISVS), (dále jen zákon ) č. 81/2006 Sb. Zákon.

KVALITA DAT POUŽITÁ APLIKACE. Správnost výsledku použití GIS ovlivňuje:

Školení vlastníků procesů aplikace Mapa procesů

13 let s Metodickým pokynem Kritéria znečištění zemin a podzemní vody. Petr Kozubek Enacon s.r.o.

GLOSÁŘ POJMŮ 1. Glosář pojmů_2.část Příručky

DMS - řízená dokumentace, archiv a co dále? ICT ve zdravotnictví 2014

Tato oblast zahrnuje zkoumání programového vybavení, jeho funkcí, snadnosti používání a ovládání.

Integrace dat. RNDr. Ondřej Zýka

STRATEGICKÉ ŘÍZENÍ LIDSKÝCH ZDROJŮ

I. Fáze analýzy vzdělávacích potřeb úředníků ÚSC

Řešení pro správu logů, shodu a bezpečnost ve státní správě a samosprávě. Ing. Martin Pavlica Corpus Solutions a.s. divize Security Expert

Big Data a oficiální statistika. Unicorn College Open 24. dubna 2015 Doc. Ing. Marie Bohatá, CSc.

EDURO Projektové vzdělávání I

Proces auditu. Health Research & Information Division, ESRI, Dublin, July 2008

Co musí zahrnovat dokumentace systému managementu kvality? 1 / 5

Zásady ochrany a zpracování osobních údajů

DŮVĚRYHODNÁ ELEKTRONICKÁ SPISOVNA

Validace souborů DS3

Vývoj informačních systémů. Obecně o IS

Performance Management What if?

Procesy, procesní řízení organizace. Výklad procesů pro vedoucí odborů krajského úřadu Karlovarského kraje

CobiT. Control Objectives for Information and related Technology. Teplá u Mariánských Lázní, 6. října 2004

Informační strategie. Doc.Ing.Miloš Koch,CSc.

Osnova studie proveditelnosti pro projekt zakládání a rozvoje klastrů

Personální audit lze provádět z hlediska kontroly jako: Běžný, který vznikl na základě zjištěné odchylky.

XXII. výzva. Žádosti o podporu v rámci prioritní osy 5 jsou přijímány od 16. srpna 2010 do 15. října 2010

SPECIFIKA CERTIFIKACE PODLE ČSN EN ISO 9001:2001 V ORGANIZACÍCH, KTERÉ SE ZABÝVAJÍ VÝVOJEM SOFTWARE

Výhody a rizika outsourcingu formou cloud computingu

Komunikační strategie a plán rozvoje portálu portal.gov.cz

Procesní audit VIKMA

Rezerva pojistného v režimu Solvency II (neživotní pojištění) Jaroslav Hůrka Seminář z aktuárských věd

Ing. Pavel Rosenlacher

Evidence požadavků uživatelů bytů a nebytových prostor

DOPLŇKOVÉ FUNKCE OSS PŘÍLOHA 1.5

Závazná osnova projektu. 1. Cíle, věcná náplň a náklady projektu Cíle projektu Věcná náplň projektu. 1.3.

Specifika bankovního prostředí při monitoringu a analýze bezpečnostních incidentů. RNDr. Ondřej Zýka Profinit

Konsolidovaný reporting CZ/SK v Cognos případová studie sanofi-aventis

Rizika na liberalizovaném trhu s elektřinou

Infor Performance management. Jakub Urbášek

Jak vytvořit správné Zadání IS

Propojování metod kvality

Realizace koncepce BIM

Zpracováno jako podkladový materiál pro tvorbu Komunitního plánu péče města - Děčín

Manažerský informační systém pro efektivní řízení zdravotnictví ve Středočeském kraji

Novell Identity Management. Jaromír Látal Datron, a.s.

Přednáška 6 B104KRM Krizový management. Ing. Roman Maroušek, Ph.D.

CPM/BI a jeho návaznost na podnikové informační systémy. Martin Závodný

ITIL pro malé a střední podniky

CONTROLLING. Metodický list č. 1. Název tematického celku: FUNKCE CONTROLLINGU A ZÁKLADNÍ VZTAHY VE FINANČNÍM PLÁNU

Charta pro zveřejňování zdravotnických informací pro zvyšování kvality poskytování služeb

OZNAČENÍ SLUŽBY ITSM/HELPDESK-PROVOZ TYP KL: PAUŠÁLNÍ. Služba zajištění obsluhy HelpDesku Objednatele

KATALOG SLUŽEB NÁSLEDNÉ PODPORY

ICT v hotelnictví a cestovním ruchu

PROPOJENÍ VĚDY, VÝZKUMU, VZDĚLÁVÁNÍ A PODNIKOVÉ PRAXE. PhDr. Dana Pokorná, Ph.D. Mgr. Jiřina Sojková, Státní zámek Sychrov,

STANDARDY PRO VÝKON INTERNÍHO AUDITU

Návrh datového skladu z hlediska zdrojů

INTERKOV CZ spol. s r.o.

Management kontrola, operativní management, management hodnotového řetězce, kontrola výkonnosti organizace. Ing. Jan Pivoňka

AUDITOR KVALITY PŘEHLED POŽADOVANÝCH ZNALOSTÍ K HODNOCENÍ ZPŮSOBILOSTI CO 4.5/2007

Dokumentace pro plánování a realizaci managementu jakosti dle požadavků

Příloha: Dodatečné informace, včetně přesného znění žádosti dodavatele o dodatečné informace

Jsou opravdu Finance a Logistika jiné světy? Markéta Tůmová Tomáš Seitl

Transkript:

Datová kvalita RNDr. Ondřej Zýka 1

Datová kvalita Jedna z kompetencí Data managementu Cíl: Zajistit uživatelům data v kvalitě potřebné k jejich činnosti Kvalita dat: Subjektivní pojem závislý na požadavcích a zkušenosti uživatelů, na způsobu použití dat Kvalita dat není dána jejich strukturou nebo uložením. 2 2

Dimenze datové kvality Dimenze Dostupnost Odpovídající velikost a granularita dat Věrohodnost Úplnost Výstižná reprezentace Konzistentní reprezentace Snadnost zpracování Bezchybnost Interpretovatelnost Objektivita Relevantnost Reputace Bezpečnost Včasnost Srozumitelnost Popis Zda jsou informace k dispozici nebo snadno získatelné Zda velikost dat a jejich granularita odpovídá vykonávaným úlohám Zda jsou informace pokládány za pravdivé a důvěryhodné Zda žádná data nechybí a zda jsou dostatečné rozsáhlá a detailní pro vykonávané úlohy Zda reprezentace dat má vhodnou strukturu Zda jsou data reprezentována vždy ve stejném formátu Zda jsou informace snadno zpracovatelné a použitelné pro rozdílné úlohy Zda jsou informace a data přesné a hodnověrné Zda je jasná definice informací, zda jsou v odpovídajícím jazyku, jednotkách a zda jsou označeny správnými symboly Zda jsou informace nestranné a nepředpojaté Zda jsou informace použitelné a užitečné pro vykonávané úlohy Zda jsou informace považovány za spolehlivé v souvislosti s jejich zdrojem nebo obsahem Zda omezení přístupu k datům a informacím odpovídá bezpečnostním pravidlům Zda jsou pro vykonávané úlohy informace k dispozici včas Zda jsou informace snadno pochopitelné a srozumitelné Přidaná hodnota Zda a která data a informace jsou přínosné a jaké jsou výhody jejich použití 3 3

Základní otázky datové kvality Kdy jsou data kvalitní? Kdy jsou data nekvalitní? Jak prokázat, že jsou data kvalitní? Jak zvýšit kvalitu dat? Pozorování Dodavatelé dat obecně nemají moc důvodů produkovat bezchybná data. Nekvalitní data vytváří nesmírnou frustraci uživatelů dat. Kvalita dat se nedá dosáhnout pouze prostředky IT. Příklady adresa@naznama.cz Rodné číslo 4 4

Kdy jsou data nekvalitní? Management a Finance Marketing Vlastníci systémů IT Nutnost udržovat velké finanční nebo technické rezervy Nepřesná segmentace zákazníků Duplicity v datech Vysoká náročnost nalezení požadovaných informací Nekonzistentní reporty napříč organizací Drahé a neúčinné kampaně Nekonzistence mezi systémy Nemožnost dohledání původu dat a zodpovědných pracovníků Reporty s nedůvěryhodnými daty Nízká kvalita služeb pro zákazníky Chybějící nebo nedohledatelné údaje Nespokojenost uživatelů s dodávanými informacemi Rozhodnutí učiněná na základě špatných informací Nepořádek v zákaznických datech Zastaralé informace Neschopnost řešit konzistentně vady v datech 5 5

Příznaky nekvality v datech? Reporty nejdou porovnat Pracovníci si vedou soukromé agendy Pracovníci si nechávají výsledky kontrolovat 6 6

Proč se zabývat datovou kvalitou Výskyt chyb v datové kvalitě Nespokojenost uživatelů Legislativní požadavky, požadavky regulátorů Solvency II Basel II, Basel III 7 7

Jak prokázat kvalitu dat? Co to je za číslo? Jak vzniklo? Kdo to kontroloval? Byla použita všechna data? Byla použita aktuální data?????? 8 8

Jsou nastaveny procesy a politiky Je definována politika datové kvality Je definována organizace DQ Role Job description Accountability and responsibility assignment Jsou vytvořeny a udržovány slovníky DQ Definice dat Popis dat a datových toků Stanovení metrik datové kvality pro jednotlivé prvky Jsou nastaveny procesy DQ Nastaveno měření a reporting datové kvality Nastaven proces řízení chyb v datové kvalitě Identifikace, odhad dopadů, definice nápravy, ohodnocení nápravy, oprava dat, dokumentace opravy Nastaven proces DQ operation 9 9

Slovníky datové kvality Definice na obchodní úrovni Definice na technické úrovni Místo a formát uložení Vlastník - Zodpovědná osoba Parametry důležitosti, bezpečnosti, aktuálnosti, 10 10

Metriky datové kvality Technické Data mají přípustné hodnoty, očekávaný formát, pohybují se v přípustném rozsahu, jsou jednoznačné pokud je to požadováno, existují odpovídající záznamy v jiných systémech Významové Hodnoty, počty a sumy jsou konzistentní v čase. Porovnání s historickými daty a benchmarky nevykazuje neodůvodněné odchylky. Existuje požadovaná konzistence mezi různými záznamy a hodnotami. Požadavek Kontrakt musí mít definován Politiku zajištění Metrika Procento kontraktů s vyplněným parametrem Politika zajištění Tresholds OK > 99% Failed < 95 % Baseline 96,2 % 11 11

Metriky DQ Počet not null hodnot Čísla Rozsah Histogram Přesnost Speciální hodnoty (0, 1, 100, 10,..) Řetězce Délka Vzory, hodnoty extrémních vzorů Minimum a maximum Vazby Počet nepoužitých cizích klíčů Histogram použití cizích klíčů Počet neexistujících cizích klíčů 12 12 12

Profiling měření DQ metrik Technický Uživatelský Speciální 13 13

Data Profiling 14 14

Popis datových toků Zdroje dat Datové úložiště Transformační procesy Zodpovědnosti (vlastnictví dat) Místa předání zodpovědností Ruční zásahy 15 15

DQ měření a reportování 16 16

Jak prokázat kvalitu dat? Udělal jsem všechno pro to, abych číslu mohl věřit. 17 17

Důvody nekvalitních dat Pouze dva zdroje znečištění dat Na vstupu Uživatelé Zdrojové systémy Zastarávání dat Deset let starý telefonní seznam neobsahuje kvalitní data 18 18

Kdy a jak čistit data Vždy je možné zlepšit kvalitu dat Pokud si nikdo nestěžuje, nemá smysl investovat zvyšování kvality dat Pokud se objeví problém s datovou kvalitou, je nutné porovnávat přínosy a náklady čištění 19 19

Jak zvýšit kvalitu dat? Čištění dat Neexistuje jedno správné řešení Obecně data nejdou vyčistit Čtyři základní metody Nechat kvalitu dat na uživateli nečistit Jednorázové čištění Čistění příchozích dat Čištění používaných dat Nalezení a úprava znečišťovatele Vzdělávání uživatelů a původců dat Příklad (voda v jezeře) 20 20

Co si zapamatovat Co to je datová kvalita Jak se pozná, že jsou data kvalitní Kdo a jak pozná, že jsou data nekvalitní Jaké metody se používají pro čištění dat Kde a jak vzniká nekvalita dat Co to jsou dimenze datové kvality Co to je profiling dat Jak se dá prokázat, že jsou informace získaná z dat kvalitní 21 21

Diskuse Otázky Poznámky Komentáře Připomínky 22