Význam datových standardů pro automatizované sdílení dat

Podobné dokumenty
EXTRAKT z mezinárodní normy

Modely datové. Další úrovní je logická úroveň Databázové modely Relační, Síťový, Hierarchický. Na fyzické úrovni se jedná o množinu souborů.

ČESKÁ TECHNICKÁ NORMA

Metody tvorby ontologií a sémantický web. Martin Malčík, Rostislav Miarka

Ontologie. Otakar Trunda

Obsah přednášky. Databázové systémy RDBMS. Fáze návrhu RDBMS. Coddových 12 pravidel. Coddových 12 pravidel

Informační systémy 2008/2009. Radim Farana. Obsah. Nástroje business modelování. Business modelling, základní nástroje a metody business modelování.

6 Objektově-orientovaný vývoj programového vybavení

Analýza a modelování dat. Helena Palovská

Správa VF XML DTM DMVS Datový model a ontologický popis

Primární klíč (Primary Key - PK) Je právě jedna množina atributů patřící jednomu z kandidátů primárního klíče.

ČESKÁ TECHNICKÁ NORMA

Databázové systémy. Ing. Radek Holý

Objektově orientované databáze. Miroslav Beneš

8.2 Používání a tvorba databází

Relační databázový model. Vladimíra Zádová, KIN, EF, TUL- DBS

Logický datový model VF XML DTM DMVS

Teorie systémů TES 5. Znalostní systémy KMS

Obsah. Zpracoval:

Primární klíč, cizí klíč, referenční integrita, pravidla normalizace, relace

4IT218 Databáze. 4IT218 Databáze

Databáze 2013/2014. Konceptuální model DB. RNDr. David Hoksza, Ph.D.

Objektově relační databáze a ORACLE 8

POPIS STANDARDU CEN TC278/WG7. 1 z 5. draft prenv Geografická silniční databáze. Oblast: ZEMĚPISNÁ DATA V SILNIČNÍ DOPRAVĚ ( GRD)

UŽIVATELSKÁ PŘÍRUČKA K INTERNETOVÉ VERZI REGISTRU SČÍTACÍCH OBVODŮ A BUDOV (irso 4.x) VERZE 1.0

Databázové systémy BIK-DBS

Nastavení provozního prostředí webového prohlížeče pro aplikaci

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

Standard výměnného formátu XML Digitální technické mapy

Etapy tvorby lidského díla

Registr práv a povinností. Metodika pro definici údajů vedených v agendě

Co nového ve spisové službě? Národní standard pro elektronické systémy spisové služby a jeho optimalizace

Databázové systémy. Doc.Ing.Miloš Koch,CSc.

ČSN ISO/IEC OPRAVA 1

EXTRAKT z české technické normy

EXTRAKT z technické normy CEN ISO

EXTRAKT z české technické normy

Úvod do softwarového inženýrství IUS 2009/2010 p.1/30

Dnešní téma. Oblasti standardizace v ICT. Oblasti standardizace v ICT. Oblasti standardizace v ICT

Informační systémy 2008/2009. Radim Farana. Obsah. Obsah předmětu. Požadavky kreditového systému. Relační datový model, Architektury databází

Informační a znalostní systémy jako podpora rozhodování

EXTRAKT z české technické normy

Kolaborativní aplikace

Vývoj IS - strukturované paradigma II

2. přednáška z předmětu GIS1 Data a datové modely

EXTRAKT z mezinárodní normy

Architektury Informačních systémů. Jaroslav Žáček

Marketingová komunikace. 2. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK1aPH/N9KMK1bPH (um1a1ph/um1b1ph)

Databázové patterny. RNDr. Ondřej Zýka

Archivace relačních databází

Obsah přednášky. Databázové systémy. Normalizace relací. Normalizace relací. Normalizace relací. Normalizace relací

Smysl metodiky IS/IT. Koncentrovaná zkušenost Checklist na nic nezapomeneme

4 ARCHITEKTURA PODNIKOVÝCH PROCESŮ S ARISEM

Datový slovník. Datum vyhlášení :00:00. Platnost od data. Platnost do data. Název oblasti datových prvků. Umístění souboru schématu

ČESKÁ TECHNICKÁ NORMA

Lokační referenční metody a jejich interpretace ve standardech

Hierarchický databázový model

Modely a sémantika. Petr Šaloun VŠB-Technická univerzita Ostrava FEI, katedra informatiky

Geografické informační systémy p. 1

PŘÍLOHA C Požadavky na Dokumentaci

Architektury Informačních systémů. Jaroslav Žáček

Vývoj informačních systémů. Přehled témat a úkolů

Databázové systémy. Přednáška 1

RNDr. Jakub Lokoč, Ph.D. RNDr. Michal Kopecký, Ph.D. Katedra softwarového inženýrství Matematicko-Fyzikální fakulta Univerzita Karlova v Praze

Vytvoření portálu odboru strukturálních fondů Ministerstva vnitra a zajištění jeho hostingu na serveru dodavatele

Objekty, třídy, vazby 2006 UOMO 30

Architektura informačních systémů. - dílčí architektury - strategické řízení taktické řízení. operativní řízení a provozu. Globální architektura

DESKRIPCE A APLIKACE KOMUNIKAČNÍCH E-KANÁLŮ VYUŽITELNÝCH VE VZTAHU OBČANŮ A OBCÍ

Stanovit nezbytná pravidla pro tvorbu dokumentace vytvářenou ve SITRONICS centru využitelnou firmou SITRONICS TS.

Databázové modelování. Analýza Návrh konceptuálního schématu

Kudy k Národnímu architektonickému plánu

Úvod do databázových systémů 6. cvičení

SPŠS Č.Budějovice Obor Geodézie a Katastr nemovitostí 4.ročník. ArcGIS ONLINE PROJEKT SBĚR DAT

Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph)

TÉMATICKÝ OKRUH Softwarové inženýrství

DBS Konceptuální modelování

S M Ě R N I C E č. 6/2014 ministra financí

Modelování procesů s využitím MS Visio.

Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/ Vzdělávání v informačních a komunikačních technologií

Information and Data Management. RNDr. Ondřej Zýka

Informační média a služby

Národní standard pro elektronické systémy spisové služby

Vývoj informačních systémů. Přehled témat a úkolů

Výměnný formát XML DTM DMVS PK

Ruční návrh Připravíme si odpovědi na základní otázky Co chceme řešit (projektovat) a proč Komu to bude sloužit Jaký užitek z toho bude mít uživatel I

EXTRAKT z české technické normy

MODELOVÁNÍ DAT V INFORMAČNÍCH SYSTÉMECH. Jindřich Kaluža Ludmila Kalužová

geotym.geogr.muni.cz K čemu jsou datové specifikace Možnosti elektronického vzdělávání v oblasti směrnice INSPIRE II. Co Vás čeká dnes?

Mezinárodní standard pro obchod a logistiku

EXTRAKT z české technické normy

Data v informačních systémech

Znalostní systém nad ontologií ve formátu Topic Maps

Profilová část maturitní zkoušky 2017/2018

Transkript:

Význam datových standardů pro automatizované sdílení dat Data Standards eaning for the anagement of Shareable Data Jitka Štěpánová Katedra informačních technologií, PEF ČZU Praha 165 21 Praha 6 - Suchdol Anotace: Článek je uvedením do problematiky datových prvků a jejich standardizace. Zabývá se vysvětlením základních pojmů souvisejících s problematikou a konceptuálním modelováním obsahu registrů datových prvků. Vychází z platných nebo v současné době revidovaných standardů IS, případně ANSI. Summary: The IS/IE 11179, part 1-6 and ANSI X3.285 standards outline the information elements (attributes) associated with a data element concept that need to be available for determining the meaning of a data element to be shared between systems. Klíčová slova: data, metadata, koncept, datový prvek, sborník (registr) datových prvků, formy prezentace datových prvků, atributy datových prvků, hodnotová doména Key words: data, metadata, concept, data element, data element registry, data element representation, attributes, value domain Pochopení zmíněných pojmů je nezbytnou podmínkou vytypování a standardizace datových prvků používaných v komunikaci. Nedostatek standardizovaných datových prvků brzdí globální implementaci EDI (Electronic Data Interchange, elektronická výměna dat), kde datové prvky tvoří obsah tzv. EDI zpráv. Základní problémy, které je třeba v této oblasti řešit, jsou: jednotné směrnice pro identifikaci, definici a popis datových prvků (základem je šestidílná norma IS/IE 11179, Informační technologie - Specifikace a standardizace datových prvků, z níž článek vychází) jednoznačné globální identifikátory normalizovaných datových prvků, které dosud běžně neexistují 1

dokumentace charakteristik datových prvků, která by podporovala automatizované sdílení dat včetně jejich vyhledávání, výběru a výměny mechanismy umožňující globálně pořizovat a vyměňovat data, zejména data z různých aplikačních oblastí. Datové standardy Při elektronické výměně dat mají význam standardy, které zajišťují, aby se přenos mezi různými platformami vůbec mohl uskutečnit, a aby se obsah informace, její struktura a uspořádání na obou stranách přenosu správně interpretovaly. Standardy existují nejen pro hardware, software, komunikace, ale i pro data, tj. datové standardy. Datové standardy se definují ve formě sborníků (registrů), které obsahují popisy, definice a další atributy tzv. datových prvků (data elements), případně složených datových prvků, segmentů, zpráv. Tyto datové sborníky bývají specifické pro určité oblasti použití, nebo odvětví a jejich význam vzrůstá s globální výměnou dat a dokumentů prostřednictvím sítí. Standardy pro elektronickou výměnu obchodních dat souvisí s hierarchií obchodní dokumentace, kde různé úrovně, počínaje tou nejnižší, představují: datové prvky složené datové prvky (adresa) segmenty (popis zboží) zprávy (reprezentují obchodní dokument: faktura, objednávka, dopravní příkaz, celní deklarace) funkční skupiny (souhrn zpráv, např. objednávek). Datový sborník (registr) je místo, kde jsou uloženy charakteristiky (atributy) dat potřebné pro jasný popis, inventuru, analýzu a klasifikaci dat. Jednotky sdílených dat mají ve sborníku přesné identifikátory, významy, struktury a hodnoty. Sborník je nástroj pro správu sdílených dat. Neobsahuje data samotná, ale poskytuje informaci o definici, původu, zdroji a umístění dat. Popisy sdílených dat se nevztahují k žádné určité aplikaci, ani k aplikačnímu prostředí kde se datový prvek bude používat, k funkci datového prvku ani k úrovni abstrakce jeho významu. 2

Některé logické datové prvky jsou pokládány za generické. Jsou to prvky, které mají ustálenou, dobře definovanou hodnotovou doménu a mohou být sdílené více systémy. Jsou to např. datové prvky Název země a Kód země. Standard IS 3166 Kódy pro prezentaci názvů zemí, představuje takový sdílený referenční seznam názvů a kódů zemí. Představuje hned několik datových prvků a jejich hodnotových domén: krátký název země v angličtině oficiální název země v angličtině dvouznakový abecední kód tříznakový abecední kód tříznakový numerický kód krátký název země ve francouzštině oficiální název země ve francouzštině Atributy datových prvků podle standardu IS/IE 11179 Standard IS/IE 11179, Informační technologie - Specifikace a standardizace datových prvků, část 3 se soustřeďuje na základní atributy datových prvků, které by měly být shromážděny ve sborníku, viz následující tabulka. Přehled atributů datových prvků Kategorie atributu Název atributu Závaznost Identifikační atributy Definiční atributy Relační atributy Prezentační atributy Název Identifikátor Verze Registrační úřad Synonymum Kontext Definice Klasifikační schéma Klíčové slovo dkaz na související data Typ vztahu Kategorie prezentace Forma prezentace Datový typ hodnot datového prvku aximální délka hodnot datového prvku 3

inimální délka hodnot datového prvku Schéma prezentace Přípustné hodnoty datového prvku Administrativní atributy Pověřená organizace Registrační status Správce datového prvku Komentář Některé atributy jsou uváděné povinně u každého datového prvku ve sborníku ( - mandatory), jiné jsou volitelné ( - optional), jiné zase podmíněné ( - conditional) existencí jiného atributu, tj. povinné za jistých specifikovaných podmínek. Standard se většinou týká abstraktní úrovně a nikoliv aplikační úrovně datových prvků. Podle IS 11179 jsou datové prvky charakterizovány na nejvyšší úrovni, na níž se vyskytují: jako objektová třída, vlastnost a prezentace (representation). Každý datový prvek má hodnotovou doménu, která je též dokumentována. Hodnotová doména jsou přípustné hodnoty datového prvku. Poskytují prezentaci, ale nelze z nich vyvodit, s kterým datovým konceptem jsou hodnoty spojeny ani co znamenají. Dobře navržené datové prvky a jejich hodnotové domény (množiny přípustných hodnot) se zaznamenávají v datovém registru jako vzory pro potencionální znovupoužití. Avšak chceme-li vědět jak je datový prvek použit v aplikaci, jsou třeba ještě další atributy. Příklady některých potencionálních atributů konkretních datových prvků: Účel, pro který jsou data zaznamenávána, Statistická metodologie použitá v datovém souboru, apod. Další úroveň vývoje datového prvku je tedy aplikační úroveň. becný datový prvek bude např. přizpůsoben aplikaci zařazením jen určité části své hodnotové domény nebo zúžením příslušné definice (nebo obojím), aby se daly zahrnout pouze určité hodnoty, které bude daná aplikace používat. becný datový prvek Název země se týká všech zemí, ale datový prvek aplikace by se mohl jmenovat Název země obchodního partnera. Hodnotová doména by pak byla podmnožinou zemí uvedených v IS 3166. Termín pro tzv. kvalifikátor - obchodní partner -představuje sám o sobě objektovou třídu. Tyto vztahy by měly být vyjádřeny hierarchicky v datovém modelu. Poslední typ datového prvku je fyzický datový prvek. Jsou to prvky, které se skutečně objeví v záhlaví sloupce databázové tabulky, v popisu souboru, v uspořádání transakčního souboru EDI, atd. 4

Navrhovaná revize normy IS/IE 11179, část 3 modeluje datový prvek a s ním související koncept datového prvku. Datový prvek sestává z konceptu datového prvku a jeho prezentace. Datový koncept je definován jako vlastnost souboru objektů (třídy) popsaná nezávisle na jednotlivých prezentacích, např. barva objektu. Prezentace je definována minimálně jako kombinace hodnotové domény (všechny možné barvy objektu, které připadají v úvahu), datového typu (numerický, alfanumerický...) a, je-li třeba, měrné jednotky. Návrh datového prvku aplikace často vyžaduje dodatečnou kvalifikaci objektové třídy a (nebo) vlastnosti (např. původní barva objektu). Termín, který takto upřesňuje definici a pomáhá prokazovat jednoznačnost konceptu, se nazývá kvalifikátor. Rozlišení různých úrovní datového prvku, konceptu datového prvku a jejich vzájemných vztahů má pomáhat při tvorbě dobře navržených dat, která se dají sdílet. Je třeba specifikovat vztahy a dědičnost počínaje nejobecnějším datovým prvkem a konče konkretním aplikačním datovým prvkem. Při analýze v této oblasti se nyní uplatňuje objektově orientovaný přístup, zejména při sestavování hierarchie objektových tříd. Další problém, který doposud standardy neřešily, je znovupoužití datové hodnotové domény. etamodel podle standardu ANSI X3.285 Tento článek vychází též z ANSI X3.285 Standardu - etamodel pro správu sdílených dat, 1999, který specifikuje strukturu datového registru ve formě konceptuálního modelu a je doplňkem k šestidílnému standardu IS/IE 11179, Informační technologie - Specifikace a standardizace datových prvků. (ANSI - American National Standard Institution). odelování dat je založeno na teorii, že všechna data popisují vlastnosti (atributy) objektů v realitě. Základní jednotky dat jsou datové prvky. K vyjádření struktury datového sborníku se používají konceptuální (pojmové) datové modely. Popisují schéma registru, kde jsou uloženy zmíněné popisy sdílených dat, nazývané také metadata. Datový model metadat je potom metamodel. etamodel je nezbytný pro koordinaci datové reprezentace mezi různými softwarovými nástroji, jež ukládají data, manipulují s nimi a vyměňují si je. Datové sborníky vytvářené podle standardů mohou pak využívat informační manažeři, tvůrci archivů (repository) a ASE produktů, správci dat a ti, kteří jsou zodpovědní za sdílení dat. Konceptuální datový model (KD) zobrazuje, jak je relevantní informace strukturována v realitě, t.j. jak ji vnímáme, jak je člověk zvyklý na informaci pohlížet. KD představuje 5

o jednu úroveň vyšší abstrakci než logický datový model a je vhodný pro první fázi modelování dat. Je to také vhodná úroveň, na které lze integrovat různé datové modely. Logický datový model popisuje v podstatě táž data, ale jak už jsou stukturována v informačním systému (model informačního systému ). Logický datový model může být pak přímo použit pro návrh databáze. Jednotky složené z více prvků jsou složené datové prvky a mají odlišné vlastnosti než datové prvky. V registru je popis datového prvku dokumentován zároveň s každým složeným datovým prvkem, který jednotlivý prvek zahrnuje. Přístup k problematice datových prvků a jejich atributů ve sborníku je podle ANSI X3.285 Standardu - etamodel pro správu sdílených dat, 1999, obdobný, ale atributy jsou detailněji rozebrány zejména co se týče hodnotové domény. První věc, na kterou se klade důraz při registraci datového prvku, je úvaha, jakým způsobem bude prvek reprezentován, tedy jeho hodnotová doména a třída prezentace (forma vyjádření prvku). Seznam možných prezentačních tříd je zde oproti IS 11179 rozšířen a jednotlivé termíny vyjadřující prezentaci jsou součástí názvu prvku. Třídy prezentace: částka, kód, grafika, ikona, míra, název, číslo, množství, text Atributy datových prvků podle standardu ANSI X3.285 Prezentace datového prvku třída prezentace hodnotová doména identifikátor název domény definice datový typ (soubor znaků) typ domény extrémní hodnoty (délka) formát měrná jednotka přesnost zdroj Definice datového prvku s kontextem Název datového prvku s kontextem Identifikátor datového prvku a číslo verze Správní atributy registrační status předkládající organizace správce dat 6

Koncept datového prvku, název konceptu, definice, identifikátor Název a definice domény konceptu Přípustné hodnoty Příklad Referenční dokument (původ) K ilustraci použiji datový prvek ze Standardu IS 3166 - Kódy pro prezentaci názvů zemí - Krátký anglický název země. Atribut datového prvku: hodnota třída prezentace název název hodnotové domény Krátké názvy zemí v angličtině definice domény Všechny krátké anglické názvy zemí datový typ alfanumerický typ domény výčtová extrémní hodnoty (délka) minimálně 4 znaky (Peru) maximálně 44 znaků formát A(44), A=alfanumerický typ, 44 je přizpůsobeno nejdelšímu názvu zdroj IS 3166 definice datového prvku Krátký název země prezentovaný v anglickém jazyce. název datového prvku Krátký anglický název země (termíny krátký a anglický jsou kvalifikátory) koncept datového prvku - název Identifikátor země koncept datového prvku - definice Identifikátor pro primární geopolitickou entitu. doména konceptu - název Země světa doména konceptu - definice Primární geopolitické entity přípustné hodnoty Názvy uvedené v IS 3166 pod příslušným záhlavím. příklad Dánsko K registračnímu statutu prvku: datový prvek může být nekompletní, certifikovaný, standardní, vyřazený, apod. Tento standard nerozlišuje povinné, podmíněné nebo volitelné atributy. Z příkladu je patrné, jak je důležité názvosloví datových prvků a formulace definic. Přesná a jednoznačná definice datového prvku je nezbytná pro zajištění možnosti jeho sdílení. Tvorba názvů datových prvků a formulace definic je samostatná kapitola, částečně regulovaná standardem IS 11179, část 4 - Pravidla pro formulaci datových definic a část 5 - Názvoslovné a identifikační principy datových prvků. Literatura: 7

ČSN IS/IE 11179, Informační technologie - Specifikace a standardizace datových prvků, část 3 Základní atributy datových prvků, 1996, ČNI Praha IS/IE NWI xxx, Information Technology, Procedures for Achieving Data Registry ontent onsistency, Working paper Draft 2.1, 1999 8