Jak chytře čistit data

Podobné dokumenty
ČÍM TO VŠECHNO ZAČÍNÁ NA DATECH ZÁLEŽÍ, ALE NEJSOU DATA JAKO DATA

Řešení datové kvality prostřednictvím Master Data Managementu v prostředí České pošty s.p.

icc Next Generation atlantis Copyright 2011, atlantis

Vnitřní integrace úřadu Středočeského kraje

Proč studovat matematické programy na ÚMS PřF MU aneb co pak budu dělat

Business Intelligence Hlavní témata, která budou v roce 2015 určovat vývoj business intelligence řešení a služeb.

Koncept centrálního monitoringu a IP správy sítě

Jak navrhnout integrační platformu pro interoperabilní EHR?

Koncept. Centrálního monitoringu a IP správy sítě

Moderní metody automatizace a hodnocení marketingových kampaní

Transpozice směrnice IDD a zákon o distribuci pojištění

Efektivní komunikace díky inovativním hlasovým technologiím. Praha, Call centrum ve finančních službách

l Kontakt s klientem SSP Popis automatizované komunikace s ÚP ČR v součinnosti a exekuci

NABÍDKA MONITORINGU MÉDIÍ

GINIS na KrÚ Středočeského kraje

Tvorba informačních systémů

Space-timeInsight. 3. dubna Martin Tauer, ČEPS Libor Sluka, Unicorn Systems

Je právní systém opravdu pro právníky? Jan Kracík

Testing as a Service. Přístupné, flexibilní a cenově výhodné řešení pro ověření kvality softwaru. Kompletní portfolio služeb testování softwaru

Registr Osob. zveřejněno podepsáno

Registr pojištěnců veřejného zdravotního pojištění. Ing. Radek Papp vedoucí projektu

DIGITÁLNÍ ČESKO EVOLUCE NESTAČÍ. Michal Bláha Hlídač státu, z.ú.

Digitalizace. Co je to digitalizace Proč digitalizovat a přínosy digitalizace Popis procesu digitalizace Příklady digitalizačních projektů

Datové modelování II

Garant karty projektového okruhu:

Případová studie. Partners Financial Services a.s.

GORDIC + CA = vaše cesta ke zvýšení kvality a efektivity služeb

Analýzou dat k efektivnějšímu rozhodování

Chytře a bezpečně. Ing. Petr Žákovec, Smart City Business Development Manager Ing. Jiří Sedlák, ředitel Security Expert Center

Bc. Jiří Kotrbatý Proces akreditace v hematologické laboratoři, Sysmex Hotel Voroněž, Brno

Řízení SW projektů. Lekce 3. Projektové procesy a znalostní oblasti. přednáška pro studenty FJFI ČVUT. zimní semestr 2012

ISSS Přínosy GIS. GEPRO pro veřejnou správu v ČR. Vojtěch Zvěřina

Profitabilita klienta v kontextu Performance management

Zhodnocení architektury podniku. Jiří Mach

DMS - řízená dokumentace, archiv a co dále? ICT ve zdravotnictví 2014

Implementace řízení strategických a kybernetických rizik v Pražská teplárenské s podporou SW nástroje Risk management tool

Zajištění bezpečného provozu aplikací. odpovídající současným požadavkům

VÝZVA K PODÁNÍ NABÍDEK DO ZADÁVACÍHO ŘÍZENÍ ZADÁVACÍ PODMÍNKY

Základní registry. Kvalita dat a jejich čištění v základních registrech veřejné správy. Připraveno pro konferenci ISSS. Ing.

OSVĚDČENÉ PERIMETRICKÉ SYSTÉMY. NOVÁ JEDNOTNÁ INTEGRAČNÍ PLATFORMA.

Strategie rozvoje Digitální mapy veřejné správy Plzeňského kraje

Nové přínosy ve zkoumání mysli zákazníka

VÝKAZ PAP A ROZŠÍŘENÝ VÝKAZ PAP OD ROKU 2016

Rozšíření referenčních údajů a notifikací v ROB

Outsourcing v podmínkách Statutárního města Ostravy

Chytřejší Moravskoslezský kraj Strategie pro roky Akční plán pro roky

Výčet strategií a cílů, na jejichž plnění se projektový okruh podílí:

printing Profil firmy ExpressPrinting ExpressPrinting Projects spol. s r.o. Botanická 606/ Brno

FENOMÉN SOUHLAS TEHDY A TEĎ

eman s.r.o. Profil společnosti

KLÍČOVÉ PROMĚNNÉ OVLIVŇUJÍCÍ PLÁNOVÁNÍ TRASY: KONCEPT MAAS OČIMA UŽIVATELŮ

Přehlednost a funkčnost webových kalkulátorů pojišťoven. Výsledky skupinové diskuse

SAZEBNÍK SLUŽEB PSA FINANCE s.r.o.

SAZEBNÍK SLUŽEB PSA FINANCE s.r.o.

ové kampaně Byznys CRM s.r.o.

8.2 Používání a tvorba databází

Využívání prvků procesního řízení a zavedení standardů pro výkon prioritních agend veřejné správy

REFORMNÍ STRATEGIE V ČR A JEJÍ DOPAD NA SYSTÉM VEŘEJNÉHO ZDRAVOTNÍHO POJIŠTĚNÍ A POSTAVENÍ ZDRAVOTNÍCH POJIŠŤOVEN

Nástroj prevence a detekce neetického a nezákonného jednání. JOZEF HALÁDIK. MD, Haládik Consulting, s.r.o.

Informační systém ozdravných pobytů zdravotní pojišťovny

Projekt IS Statutárního města Ostrava. Kladno 10. června 2011

Databázové systémy. Doc.Ing.Miloš Koch,CSc.

3M Česko. Olga Svědínková. Building HR vision. Září 2011

Zkušenosti nejen z provozu Portálu občana. Jan Vlasák NAKIT Miroslav Vacula Jihomoravský kraj Václav Koudele - Microsoft

Sjednocení dohledových systémů a CMDB

eneschopenka technické řešení Pavel Borkovec ČSSZ, Křížová 25, Praha Architekt, Asseco Central Europe

PROCESY CO ZÍSKÁTE: Předpoklad pro certifikace ISO. Lean Six Sigma Fast Track

Co jsme si to postavili aneb Sdílené služby ve veřejné správě ČR. Ondřej Felix Hlavní architekt egovernmentu ČR

Sísyfos Systém evidence činností

administrativní systém, samostatný a přesný

Registr územní identifikace, adres a nemovitostí RÚIAN. Jiří Formánek. Český úřad zeměměřický a katastrální (ČÚZK)

PŘÍLOHA C Požadavky na Dokumentaci

Digitální Český Krumlov

Specifika a scénáře vykazování dat AnaCredit prostřednictvím systému MtS-ISL-SÚD-SDNS

VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA

RÚIAN základní registr veřejné správy ČR

Centralizace dat zákazníků s napojením na newsletterový systém OEMPRO. (Případová studie) Praha, 2014

IS VZP ČR jako základ podpory ehealth

ISZR a samospráva v roce 0

Marketingová komunikace. 2. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK1aPH/N9KMK1bPH (um1a1ph/um1b1ph)

Manažerské shrnutí projektu

Co je doma, to se počítá, aneb Jak ušetřit na komunikaci. Petr SOLNAŘ / Liberecká IS, a.s. Michal NOVÁK / SOITRON CZ, s.r.o

Důvěryhodná dlouhodobá a garantovaná archivace (požadavky z pohledu legislativy).

Lekce 9 - Migrace dat

LIDSKÉ ZDROJE A EFEKTIVNOST FUNGOVÁNÍ VEŘEJNÉ SPRÁVY

Živnostenský rejstřík v návaznosti na základní registry VS. JUDr. Luděk Holubec Antonín Běhounek

End-to-end testování. 26. dubna Bořek Zelinka

Trask Process Discovery Quick Scan

Úspory nákladů v ICT vs. technologický dluh

poskytovatele zdravotnických služeb Fares SHIMA Ministerstvo zdravotnictví Ředitel odboru informatiky

ÚVOD Představení Národního screeningového centra

Elektronické služby VZP ČR. Ing. Radek Papp vedoucí projektu

Semináˇr Java X J2EE Semináˇr Java X p.1/23

Vít Suchánek, Zbyněk Havelda Český úřad zeměměřický a katastrální

ZADÁVACÍ DOKUMENTACE

ELEKTRO - IT TECHNIK (vhodné i pro absolventy)

BRNĚNSKÉ HŘBITOVY ONLINE. Dana Glosová, Magistrát města Brna Kamila Klemešová, Magistrát města Brna

Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph)

Klientský formát POHLEDÁVKY platný od

Transkript:

Jak chytře čistit data Případová studie řešení v České pojišťovně Data Quality at a Glance 20.4.2010 vladimir.kyjonka@cze.sas.com

O co šlo Česká pojišťovna Hodně historických dat Data v historickém stavu Data v omezené datové struktuře V rámci předchozí studie identifikován masivní zdroj znečištění klientských dat Nejstarší systém s daty o životním pojištění - APO Historická platforma mainframe, data z děrných štítků Historická data Úkol: eliminovat zdroj nečištění

Situace V ČP existuje centrální databáze klientů Data z různých systémů ČP Konsolidovaná a vyčištěná Nedostatečná kvalita dat ze systému životního pojištění Znehodnocuje možnost využití centrální DB klientů Standardní používané postupy jsou na data krátké Znečištění je nestandardní a velké Paušální opravy jsou málo spolehlivé

Požadavky (1) Dát do pořádku velmi znečištěná data Aplikovat flexibilně nestandardní požadavky postupy, pravidla pro čištění dat Vysoce customisovaná pravidla šitá na míru Špeky Úmyslně zkrácená data Vynechávání přehlásek (př. MŰLLER M LLER ) Nestandadní zápisy (Novák Dan a Mar) Jinéúdaje v polích (RČ IČO)

Požadavky (2) Zajistit vysokou spolehlivost oprav Opravy promítány do primárních systémů! Zohlednit business význam dat, oprav a jejich dopadů Rozsáhlá diskuse co se může migrovat zpátky Každá oprava robustně označena a sledována Křížové opravy Využití vazeb mezi daty opravenými s různou spolehlivostí (pojistná smlkouva pojistná událost, skupiny záznamů klientů a adres)

Výběr řešení Využití specialisované technologie DataFlux: Otevřenost, flexibilita, transparennost, osvojitelnost, Služby konsultantů SAS Společný realisační team ČP + SAS Přístup k SASu k řešení Výběrové řízení Proof of Concept Zadavatel si nejdříve ověřil schopnosti týmu i nástroje Přesvědčivé výsledky Ekonomický faktor

Ekonomický rozměr nabídky Kromě standardních parametrů (cena práce, SW ) Orientace na nákladovou efektivitu procesu čištění Vstupní data: 24M záznamů Z toho 15000 organisací (0,03%), zbytek fysické osoby (lidi) 2 sady (přibližně stejně drahých) alogoritmů a pravidel pro 2 různé entity Možné priority Náklady vs. účinnost vs. efektivita Návrh: Vyčistit 99,93 % dat za téměř poloviční náklady Nabídnuto variantní řešení v různých kombinací priorit

Vlastní řešení - základní charakteristiky 24M záznamů vstupních dat k čištění Pojistné smlouvy pojistné události Velmi názká úroveň datové kvality Navíc 14M záznamů referenčních dat Data o klientech z jiných systémů Mají nebo mohou mít lepší kvalitu Společný realisační team ČP + SAS SAS: 2 techničtí konsultanti DQ, 1 DQ analytik (part time), PM ČP: Až 10 členú teamu: DQ manager, analytici, tech. specialisté, metodici Realisace projektu XII.2009 - III.2010 Kompletně na pracovišti ČP

Hlavní úkoly Identifikace dat osob a organisací Vyčištění a verifikace adres vůči adresnímu registru (UIR-ADR) Opravy jmen (parsing, diakritika, zkratky ) Kontroly RČ, IČ Standardisace hodnot (jména, příjmení, tituly, adresy ) Detekce pohlaví, opravy mužatek př.: Bartošová Václav Křížové opravy V rámci APO Mimo APO referenční data Speciality

Speciality Standardisace nestandardně hodně nestandardních dat Speciální požadavky ze strany zadavatele Nestandardní algoritmy oprav atd. Specifické metody konsolidace dat Orientace na vysokou spolehlivost Detekce nejednoznačnosti Ne opravy za každou cenu Trackování a indikace (skoring) na základě závažnosti business významu dat a dopadů jejich oprav

Výsledky Opravy u více než 90% záznamů Alespoň 1 oprava na záznam Výstupy vysoká kvalita Odhaleny dříve neviditelné business problémy, př.: Klienti s neplatným typem pojišťění Vhyba v RČ nesprávná indikace věkové skupiny nesprávná indexace (pro digitální archiv), sazba Data zpětně zašpiněna (odborně) Ale propojena na vyčištěná data pro budoucí potřebu Nástroj i metodika vlastnictvím ČP pro další využití Projekt ukončen úspěšným testování Deklarována vysoká spokojenost zákazníka

Hovoří DQ Manager České pojnišťovny Štěpán Čábelka oceňuje zejména: Flexibilní vývoj customisovaných postupů na míru Identifikace organisací, mužatky, dešifrování zkratek, velmi nestandardní zápisy, odborné zašpinění, Pečlivost a důslednost Nasazení teamu, maximální pokrytí pravidly Spojení chytrých technologií a know-how úplné řešení efektivní pokrytí výjimek To by s žádným jiným nástrojem nebylo možno udělat

Shrnutí - závěry Ekonomický rozměr Nestandardní postup nadstandardní přínos Princip spolehlivosti Flexibilita: nástroj, team, metodika

Jak chytře čistit data Případová studie řešení v České pojišťovně Data Quality at a Glance 20.4.2010 vladimir.kyjonka@cze.sas.com