Dnešní téma Identifikační metadata 1
Metadata jsou také dokumenty <meta name="dc.title" content="příliš hlučná samota"> <meta name="dc.creator" content="hrabal, Bohumil"> 2
Co standardizujeme v metadatech 1) obsah (sémantiku) CO budeme reprezentovat (popisovat) popisované atributy, příp. jejich hodnoty 2) formát (syntaxi) JAK a ČÍM budeme popisovat nástroje standardizace: schémata, modely pravidla seznamy povolených hodnot 3
Trendy v oblasti zpracování informací sbližování standardů a) pro publikování a zpracování dokumentů b) pro zpracování "klasických" a elektronických dokumentů snaha nahradit práci zpracovatele a) prací autora (autorská metadata) b) počítačem (automatizovaná tvorba metadat) tvorba metadat srozumitelných současně pro uživatele i pro počítačové programy přechod od lineárních metadatových struktur k hierarchickým (XML) a relačním (ERA) strukturám 4
Typy metadat identifikační popisná vyhledávací (selekční) 5
Identita totožnost ekvivalence shodnost, shoda, stejnost svébytnost 6
Rekapitulace Které věci jsou ekvivalentní? ty, které se skládají ze stejných částí ty, které mají stejnou sadu atributů ty, jejichž atributy mají stejné hodnoty ale i ty, které se stejně jmenují ty, které za ekvivalentní považujeme 7
Identifikační metadata primárně určena pro rozlišení informací mezi sebou typy identifikace: a) jménem / názvem P1, Petr, 777 564 891 b) adresou Na hřebenech II, Praha 4 Kavčí Hory G:\Bl\P1\soubor.htm c) znalostí např. PIN, heslo d) vlastnictvím (věci /vlastnosti atributu, hodnoty) 8
Problém identifikátorů: Plní svou funkci pouze v těch oblastech použití, pro něž byly určeny: obsah jakých objektů se týkají rozsah kolika objektů se týkají namespace jmenný prostor soubor jedinečných pojmenování, který se používá pro identifikaci objektů v rámci definované domény 9
Typy identifikátorů významové kromě identifikační funkce mají i funkci popisnou bezvýznamové Příklad: BIO bezvýznamový identifikátor občana 10
Typy identifikátorů přirozené odvozené z hodnoty některého z atributů entity umělé dodatečně doplněné k entitě za účelem její identifikace 11
Typy identifikátorů individuální skupinové muži ženy 12
Funkce identifikačních metadat v informačních systémech rozlišení, rozpoznání entity resolution, resolving, dereference přístup k dalším informacím o entitě řízení přístupu entity k systému traceability vysledovatelnost Identifikace produktu v logistickém řetězci 13
Shibboleth Kniha Soudců 12 1937 14
Rozklíčování dalších údajů pomocí identifikátoru Legitimace Jméno Příjmení Ročník 158 Aleš Novák E3 236 Jan Novák P1 237 Iva Pechová E2 242 Věra Rašková P1 243 Jan Soumar P1 15
Rozklíčování dalších údajů pomocí identifikátoru 16
Databázová tabulka = sloupce/atributy + řádky/entity 17
Identifikátor, primární atribut / klíč Atribut nebo kombinace atributů, jejichž hodnoty jednoznačně identifikují každý z výskytů entity je jednoznačný nesmí mít 2x stejný obsah je minimální žádný atribut z něj nelze vypustit musí vždy obsahovat hodnotu je perzistentní (trvalý) jeho hodnota se v průběhu života entity nemění 18
Navrhněte identifikátor pro seznam umělců Alternativní verze jména (např. v různých jazycích) Datum narození Muž / žena Národnost Pořadové číslo v seznamu Rodné jméno Rodné příjmení Umělecké jméno Umělecký obor Životopis 19
Vstupenky do divadla 20
Navrhněte identifikátor pro vstupenky do divadla Cena Název představení Řada Sedadlo Termín (datum a čas) Umístění (přízemí balkón galerie) 21
Systémy automatické identifikace technologie registrace dat bez použití kláves magnetické kódy čárové kódy (bar code) RFID tagy (radio frequency identification) biometrie 22
Čárový kód VOŠIS UIM 13 23
QR kód 24
RFID tag 25
Co identifikujeme v informačním managementu? 1) lidé, např. autoři (ISNI) 2) organizace (IČO, DIČ, ISIL) 3) kolekce a služby (ISCI) 4) díla a jejich vyjádření (DOI, ISTC, ISAN, ISWC) 5) provedení / manifestace děl (ISBN, ISSN) 6) části / složky / komponenty děl (SICI) 7) vyhledávací atributy (OID, URI) 26
Identifikace osob v ICT identifikace autentizace autorizace 27
Osobní jména antroponyma Identifikace autorů dokumentů personální a korporativní autority báze autorit NK ČR 28
Identifikace firem IČO identifikační číslo identifikace v rámci registru ekonomických subjektů ČR (RES) DIČ, VAT number GS1 identifikační číslo firmy (company prefix) sigla identifikace knihoven (např. Národní knihovna má siglu ABA001) 29
Identifikace zboží / firem Ochranné známky Slovní, obrazové, prostorové nebo kombinované označení, které je způsobilé odlišit výrobky nebo služby pocházející od různých producentů a je zapsáno do rejstříku ochranných známek 30
Identifikace zboží Systém GS1 (dříve EAN/UCC) Globální systém přidělování číselných identifikátorů výrobkům, používaný především v maloobchodě účel: jednoznačná celosvětová identifikace výrobku a jeho výrobce 31
Identifikační klíče systému GS1 GTIN globální číslo obchodní položky GLN globální lokalizační číslo čárové kódy EAN European Article Numbering (Evropa) UPC Uniform Product Code (Severní Amerika) RFID - Radio Frequency Identification EPC Electronic Product Code 32
Struktura EAN 13 prefix (2 3 číslice) země (označuje zemi, kde bylo číslo přiděleno nemusí se jednat o zemi výroby) identifikační číslo výrobce (4 6 číslic) identifikační číslo výrobku kontrolní číslice (1) 00 09 USA 977 seriály 400 440 Německo 978 knihy 49 Japonsko 979 hudebniny 858 Slovensko 859 Česká republika 33
Co identifikuje bibliografický popis? IFLA. Funkční požadavky na bibliografické záznamy: závěrečná zpráva. Přeložila Ludmila Celbová. Praha: Národní knihovna ČR, 2002. 117 s. ISBN 80-7050-400-5 Elektronická verze dostupná z: http://www.ifla.org/files/assets/catalogui ng/frbr/frbr-cs.pdf 34
FRBR Funkční požadavky na bibliografické záznamy konceptuální schéma (model) uživatelské potřeby požadavky na funkce mapování požadavků do entit a atributů ERA = entity + atributy + vztahy VOŠIS UIM 12 13 35
Funkční požadavky na bibliografické záznamy užití dat k: nalezení entit, jež odpovídají uživatelem stanoveným kritériím (např. nalezení publikací k určitému tématu) identifikování entity (např. odlišení dvou titulů se stejným autorem) výběru entity odpovídající požadavkům uživatele (např. nalezení dokumentu v jazyce, jemuž uživatel rozumí) získání entity nebo přístupu k ní (např. sestavení objednávky) navigaci mezi souvisejícími entitami 36
Entity FRBR Skupiny entit DÍLO 1) Produkty intelektuálního nebo uměleckého úsilí VYJÁDŘENÍ PROVEDENÍ 1) JEDNOTKA 2) Entity se vztahy zodpovědnosti OSOBA KORPORACE 2) POJEM 3) Entity, které slouží jako témata (předmět) děl OBJEKT AKCE MÍSTO 3) 37
Entity FRBR 38
Entity FRBR dílo divadelní hra (obsah abstraktní) vyjádření text představení provedení vydání textu DVD záznam jednotka určitý výtisk určitý disk 39
dílo vyjádření provedení jednotka Příklad Dášeňka Karla Čapka v Městské knihovně v Praze 40
2. Entity se vztahy zodpovědnosti 41
3. Entity, které slouží jako témata (předmět) děl DÍLO + VYJÁDŘENÍ PROVEDENÍ JEDNOTKA OSOBA KORPORACE 42
Identifikace knih HAŠEK, Jaroslav. Povídky. Praha: Fragment, 2009. 109 s. ISBN 978-80-253-0944-5 43
Identifikace knih ISBN International Standard Book Number předmět identifikace: konkrétní vydání díla skupina (země, jazyk) vydavatel titul kontrolní číslice Adresář nakladatelů v ČR BICI Book Item and Contribution Identifier 44
Identifikace seriálů ŠTĚPÁN, Josef. Bohumil Hrabal a regionální jazykové jevy. Naše řeč. 2007, roč. 90, č. 1, s. 20-29. ISSN 0027-8203 45
Identifikace seriálů ISSN International Standard Serial Number předmět identifikace: klíčový název seriálu SICI Serial Item and Contribution Identifier 46
Identifikace v Internetu ICANN Internet Corporation for Assigned Names and Numbers Internetová společnost pro určování jmen a čísel DNS domain name system IP adresy Identifikace protokolů TLD top-level domain name system 47
URI Uniform Resource Identifiers Systém identifikace členů adresního prostoru v Internetu (tj. informačních zdrojů, informačních služeb) URL Uniform Resource Locator účel: nalezení (lokace) zdroje URN Uniform Resource Name systém trvalých názvů objektů účel: identifikace zdroje (neobsahuje informace o umístění) 48
Struktura URL schéma doména objekt protokol:// host [:port] / cesta (path) http://purl.oclc.org/dc/about/element_set.htm telnet://database.carl.org ftp://ftp.faf.cuni.cz/wwwexpr/wwwexpr.txt news://news.vslib.cz mailto:listserv@ubvm.cc.buffalo.edu 49
Identifikace digitálních objektů DOI Digital Object Identifier slouží pro zajištění výkonu autorských práv u elektronických informací Příklad 1 Příklad 2 50