Základní registry. Kvalita dat a jejich čištění v základních registrech veřejné správy. Připraveno pro konferenci ISSS. Ing.

Podobné dokumenty
Kvalitní data kvalitní agendy

Registr Osob. zveřejněno podepsáno

Datová kvalita. RNDr. Ondřej Zýka

Datová kvalita. RNDr. Ondřej Zýka

Zhodnocení architektury podniku. Jiří Mach

Základní registr právnických osob, podnikajících fyzických osob a orgánů veřejné moci (ROS) na startu

podnikajících fyzických osob (ROS) na startu

Úpravy agendového informačního systému v návaznosti na základní registry

Návrh datového skladu z hlediska zdrojů

Základní přehled o implementaci RÚIAN

STRATEGIE A PROJEKTY ODBORU INFORMATIKY MHMP

Cena za inovaci v interním auditu. Dynamické řízení rizik skrze integrovaný systém kontrolního prostředí 1

Živnostenský rejstřík v návaznosti na základní registry VS. JUDr. Luděk Holubec Antonín Běhounek

Popis egon služ by. E210 - rppvypisseznamovmspuu. Název dokumentu: Popis egon služeb Verze: Datum aktualizace: Správa základních registrů

Michal Kolařík ISZR - Brána k základním registrům

Kvalita a správa dat Data Quality

VIZE INFORMATIKY V PRAZE

UniSPIS Oboustranné rozhraní RŽP na e-spis

Národní sada prostorových objektů z pohledu krajů. Mgr. Jiří Čtyroký IPR Praha

Popis služeb ROS. 205 Základní Registr osob - ROS Implementace informačního systému

KDS krajská digitální spisovna. Ing. Vítězslav Mach RNDr. Zdenka Bukvicová oddělení informatiky

CobiT. Control Objectives for Information and related Technology. Teplá u Mariánských Lázní, 6. října 2004

PŘÍLOHA C Požadavky na Dokumentaci

Představení projektu Metodika

VĚSTNÍK MINISTERSTVA ŽIVOTNÍHO PROSTŘEDÍ. OBSAH. Rozhodnutí ministra_kubíčková.pdf

Jednotný NIS Prezentace k zahájení projektu pro Radu kraje Vysočina. Projektový manažer - Ing. Ivan Sokolov, Ph.D.

POUŽITÍ DATABÁZÍ. Po ukončení tohoto kurzu budete schopni

PŘÍNOSY A DOPADY ZAHÁJENÍ PROVOZU ROS

Praktické zkušenosti s řízením projektů otevřených dat Dobrá / špatná praxe

Chybová hlášení METODIKA MET-01/2014. SZR-56-1/OPICT-2013 počet stran 28 přílohy 0. Nahrazuje:

Kritéria hodnocení praktické maturitní zkoušky z databázových systémů

Zkušenosti s budováním základního registru obyvatel

Souhrnná charakteristika Soustavy statistických registrů

[ 1 ] Ing. František Chuchma, CSc. Seminář SVP/SDP, Státní ústav kontrolu léčiv

ZPRÁVA O VALIDACI DAT. Referenční registr NRPZS. (v )

Rozvoj projektu PROXIO v roce 2009

Archivace Elektronických Dokumentů

Reklamace. Provázanost ISÚI a ISKN. Hana Gubániová

Správa VF XML DTM DMVS Datový model a ontologický popis

Digitální technická mapa ČR

Metodika certifikace zařízení OIS

Katalog egon služeb verze: 0.01

Lekce 9 - Migrace dat

Inovace CRM systémů využitím internetových zdrojů dat pro malé a střední podniky. Ing. Jan Ministr, Ph.D.

Úvod a teoretický vstup do procesního řízení. Procesy Jičín, Bloky B2 B4 / B5 B7

Aktuální stav implementace IS ROS

ČÍM TO VŠECHNO ZAČÍNÁ NA DATECH ZÁLEŽÍ, ALE NEJSOU DATA JAKO DATA

Využití Umělé Inteligence (AI) v prostředí NKÚ

Popis egon služ by. E228 rppvypisovmspuu2. Název dokumentu: Popis egon služeb Verze: Datum aktualizace: Správa základních registrů

Obsah ČÁST I JAK SE UCHÁZET O ZÁKAZNÍKY NA WEBU KAPITOLA 1

Informační systémy veřejné správy (ISVS)

Komentář k datovému standardu a automatizovaným kontrolám obsahu common.xsd

Registr územní identifikace, adres a nemovitostí (RÚIAN)

Garant karty projektového okruhu:

Buďte Společně vždy vpřed na stopě vozidlům a pohonným hmotám. pilotní řešení O 2 Car Control pro TNT Post ČR

Databázové systémy. Datová integrita + základy relační algebry. 4.přednáška

TNÍ POKLADNA. tní pokladny (IISSP) Hradec Králové 2. dubna 2012

Jak vytvořit správné Zadání IS

Kritéria hodnocení praktické maturitní zkoušky z databázových systémů

Výčet strategií a cílů, na jejichž plnění se projektový okruh podílí: Strategický rámec rozvoje veřejné správy České republiky pro období

Rozšíření systému na sledování státní a veřejné podpory pro Ministerstvo financí

Základní popis Toolboxu MPSV nástroje

ELEKTRONICKÝ ARCHIV ZDRAVOTNICKÉ DOKUMENTACE A VIDITELNÝ

ZÁKLADNÍ REGISTR PRÁVNICKÝCH OSOB, PODNIKAJÍCÍCH FYZICKÝCH OSOB A ORGÁNŮ VEŘEJNÉ MOCI

Příručka pro editaci kontaktů na eagri

ISPOP. Integrovaný systém plnění ohlašovacích povinností v oblasti životního prostředí. Ondřej Kupča

Ing. Pavel Tvrzník Vedoucí odboru informatiky KÚ Libereckého kraje

End-to-end testování. 26. dubna Bořek Zelinka

Popis egon služ by. E219 - rppctieditoraovmspuu. Název dokumentu: Popis egon služeb Verze: Datum aktualizace: Správa základních registrů

Legislativní opora. č. 365/2000 Sb., o informačních systémech veřejné správy (ISVS), (dále jen zákon ) č. 81/2006 Sb. Zákon.

MINISTERSTVO VNITRA ČR

Krajská digitální spisovna jako sdílená služba

Seznam kontrol elementů datových vět NEMPRI20, HZA (Hlášení zaměstnavatele při ukončení) a ZZV (Žádost o změnu výplaty)

l Kontakt s klientem SSP Popis automatizované komunikace s ÚP ČR v součinnosti a exekuci

RDF DSPS ROZVOJ PORTÁLU

Zdravotnické registry pro 21. století

Návrh databázového modelu

Nová koncepce elektronického zdravotnictví pro období ročník konference ISSS

Popis egon služ by. E218 - rppctizmenyovmspuu. Název dokumentu: Popis egon služeb Verze: Datum aktualizace: Správa základních registrů

Co nás čeká při skartačním řízení? Připravte se na změny balíčku SIP

Elektronické dokumenty v ČSSZ Document Management

Aplikace pro srovna ní cen povinne ho ruc ení

Popis egon služ by. E214 - rppvypisseznamkategoriiovmspuu. Název dokumentu: Popis egon služeb Verze: Datum aktualizace:

Otevřená data ve veřejné správě , Mikulov. Tomáš Kroupa, Ministerstvo vnitra - Odbor hlavního architekta egovernmentu

Datové úložiště referenčních nemocnic (DÚ RN): Zajištění sběru dat v roce Petr Klika a kol., ÚZIS ČR

Strategické cíle a jejich implementace

Digitalizace stavebního řízení a územního plánování a Digitální technická mapa České republiky (DTM ČR) jako jeden z jejích základních kamenů

Základní registry veřejné správy. Ing.Ondřej Felix, CSc., hlavní architekt egovernmentu MV ČR

RÚIAN REGISTR ÚZEMNÍ IDENTIFIKACE ADRES A NEMOVITOSTÍ

Návrh. VYHLÁŠKA ze dne 2016 o požadavcích na systém řízení

Zprovoznění vybraných částí systému PROXIO pro zefektivnění vnitřních procesů odboru dopravy ÚMČ Praha 8

Řešení datové kvality prostřednictvím Master Data Managementu v prostředí České pošty s.p.

Testování softwaru. 10. dubna Bořek Zelinka

DOPLNĚK. Projekt Informační systém základních registrů je spolufinancován Evropskou unií z Evropského fondu pro regionální rozvoj.

Výhody a rizika outsourcingu formou cloud computingu

Příjem žádostí a oznámení dle zákona o distribuci pojištění a zajištění prostřednictvím systému REGIS. 12. listopadu 2018 Česká národní banka

Validace souborů DS3

Rozšíření referenčních údajů a notifikací v ROB

Transkript:

Základní registry Kvalita dat a jejich čištění v základních registrech veřejné správy Připraveno pro konferenci ISSS Ing. Jiří Vácha Hradec Králové, 6.4.2009 Adastra Group

Agenda Základní teze datové kvality Řízení datové kvality Datová kvalita a základní registry Data a zprovoznění základních registrů Procesy datové kvality Plnění dat Rizika Doporučení Dotazy 2

3 Datová kvalita základní teze

Základní teze datové kvality V datech jsou chyby (a vždy v tam byly...) Velká míra nekvality dat představuje p riziko významného snížen ení jejich použitelnosti Zpracování nesprávných, nesmyslných a nadbytečných dat - neefektivní zajištění veřejné služby Nedostatečné fungování interních procesů - negativní hodnocení veřejné služby 4

Proč jsou data nekvalitní? Technika Mnoho autonomních agendových IS Různí dodavatelé v různém čase Různé aplikace a technologie Lidský faktor Překlepy Zápisy do jiných polí Lidová tvořivost Změna legislativy 5

Typické problémy s kvalitou dat Duplicity Neúplné záznamy Nestrukturovaný zápis údajů Implicitní hodnoty ( Neznámý ) Diakritika Přeslechnutí Přepsání Cizojazyčná jména Interpretace null hodnot (1.1.1900) 6

Příklad: zápis titulu Ing. Ing,. Engenheiro Ing. Ing. + Dipl.-Ing. ing iing. Ing., Ing. + Dipl.ing. ing. IIng. Ing.- Ing. Dipl.Ing. Ing. img Ing.. ingf Dipl.Ing.. dipl. ing img. ING Ing.,Ing. DIPL.ING. dipl. ing. in. ING. Ing.l Dypl.Inz. dipl. Ing. Inf íng Ing.1 ing. Dipl. ing. infg ing,. Inhg Ing Dipl. Ing.Ing. ing. Inng. Ing, Dipl. Ing. ing Ing, Inž. Ing,. Dipl. ING. ing, Ing. iong Ingdipl.ing ing- Ing. * Ing. Ing-. dipl.ing. ing. Ing.. ing Ing dipl.ing. ing., Ing Ing. Ing. 7

8 Řízení datové kvality

9 Data Governance

10 Cyklus řízení datové kvality

Měření datové kvality Přesnost Přesnost je definována jako shoda uvedené hodnotou (tj. jedná se o existující osobu). hodnoty se správnou Úplnost Konzistence Validita Úplnost je definována jako existence očekávaných hodnot na vstupu (daný subjekt např. musí vždy mít alespoň jednu adresu). Konzistence znamená vzájemnou konzistenci jednotlivých položek (druhů údajů) v rámci jedné entity i mezi entitami. Validita znamená, že data splňují kritéria doménové integrity, tzn. že odpovídají definovanému datovému typu a formátu. Pro test validity mohou být definována také další formální pravidla, například rozsah přípustných hodnot pro IČO, algoritmy pro kontrolní číslice, RČ obsahující na začátku kódované datum narození, atd. 11

Správné měření datové kvality Anonymizované Může být prováděno nezávisle na systému i vlastníkovi dat Automatizované Snižují se náklady a zvyšuje efektivita procesů Srozumitelné Zjištěné neshody jsou srozumitelně prezentovány Opakovatelné Umožňuje sledovat trendy a efektivitu nápravných opatření 12

Konsolidace dat Stěžejním prvkem registrů je konsolidace Konsolidace = čištění+unifikace Příklad: Matka s dcerou ve 2 různých systémech. Dcera dostudovala (titul Ing.), provdala se (Zapletalová má stejné RČ jako Štergeníková) a odstěhovala se do Hradce Králové (řádky 3 a 6) a b c d e f g h i j 1 B 796008xxxx 8.10.1979 F Jana Štergeníková 16000 Praha 6 Malá 3 2 A 796008xxxx 8.10.1979 F JANA STERGENIKOVA 16200 PRAHA 6 MALA 542/3 3 B 796008xxxx F IngJana Zapletalová 50003 Hrdec Králové Úzká 2 4 B 8.10.1979 F ŠTERGENÍKOVÁ Jana 16000 Praha 6 Malá 3/542 5 A 495722yyyy 22.07.1949 F JANA STERGENIKOVA 16000 PRHA MALA 3 6 B 8.10.1979 F Jana Zapltalová 50001 Hra Král Úzká 2 13

14 Reporty datové kvality (příklad 1.)

15 Reporty datové kvality (příklad 2.)

Datová kvalita a Základní registry 16

DQ v kontextu základních registrů 89 1/3 3 17

Data a zprovoznění ZR Rutinní provoz I. vlna II. vlna III. vlna Testovací provoz Pilotní provoz Validační procesy Jednoduchá, křížová, proti ostatním ZR Organizační procesy Metriky, odpovědnosti a postupy Technické procesy Technická příprava dat před načtením 18

Technické procesy datové kvality Rozdělení záznamu do datových položek Standardizace Rozpoznání obsahu datových položek (např. název obce, ulice) Převod dat na jednotný formát (např. malá na velká písmena) Obohacení Unifikace Doplnění chybějícího (např. doplnění PSČ, pokud je známo adresní místo) Seskupení podobných záznamů do jedné skupiny Deduplikace Identifikace Nahrazení skupiny podobných záznamů jedním nejlepším Nalezení již existujícího, unifikovaného subjektu v (etalonu) 19

Organizační procesy datové kvality Vlastnictví dat data (jednotlivé registry) mají jednoznačně určeného vlastníka, který zodpovídá za jejich strukturu, dostupnost, kvalitu a bezpečnost Správa dat tzv. data stewardship průběžné měření datové kvality, analýza příčin nekvality, návrh a realizace nápravných opatření Data Governance souhrnný koncept Data Governance (adaptovaný na podmínky výkonu státní správy) 20

Validační procesy Jednoduchá validace základní kontrola datových elementů (atributů) a jejich případné obohacení Křížová validace porovnání dat mezi agendami navzájem > prevence přepisu čistých dat špinavými Validace proti dalším registrům ověření celkové konzistence základních registrů 21

Plnění dat a provoz registrů RUTINNÍ PROVOZ plné spuštění TESTOVACÍ PROVOZ ověření celkové provázanosti, integrace a funkčnosti, ověření kvality dat a napojení agendových IS PILOTNÍ PROVOZ úspěšné naplnění jednotlivých vln průběžně ověřovat funkčnost řešení v omezeném rozsahu ROZDĚLENÍ NA VLNY z důvodu značné komplexnosti a počtu agendových systémů je účelné provádět plnění registrů v postupných vlnách 22

Možná rizika Chyby v datech agendových IS byly tam, jsou a budou, jde o to, znát výchozí stav Opravy dat agendové IS jsou zatíženy svou vlastní činností a mohou nastat kapacitní problémy Práce s agendami každá agenda má jiné poslání a z toho odvozené potřeby, je třeba získat jejich součinnost Napojení agendových IS úskalí integrace (různí dodavatelé, různé konvence, různé standardy...) Jednoznačná definice pravidel Složitost projektu je třeba počítat s velkým množstvím neshod vůči pravidlům a řešit je citlivě jednotlivé registry jsou samostatnými projekty, je třeba dobře koordinovat jejich postup 23

Doporučení Datová kvalita není cíl, ale prostředek k úspěšnému řešení základních registrů Nejde jen o systémy a data, ale o lidi a procesy Základní registry jsou strategickým projektem Datová kvalita je velmi specifická disciplína a vyžaduje specifické nástroje a zkušenosti 24

ADASTRA CZ Nile House Karolinská 654/2 186 00 Praha 8 www.adastragrp.com Tel.: +420 271 733 303 info@adastra.cz www.adastra.cz Děkujeme za pozornost ADASTRA GROUP North America 8500 Leslie St. Markham, Ontario, L3T 7M8 Canada Tel: +1 905 881 7946 info@adastragrp.com ADASTRA GROUP Europe Karolinska 654/2 186 00 Praha 8 Czech Republic Tel.: +420 271 733 303 info@adastragrp.com 25