Metodika pro přidělování a správu životního cyklu unikátních perzistentních identifikátorů digitálních dokumentů podle standardu URN:NBN

Podobné dokumenty
Ředitel odboru archivní správy a spisové služby PhDr. Jiří ÚLOVEC v. r.

Digitální konkordance a Registr digitalizace v Manuscriptoriu,

Digitalizace a digitální knihovny v České republice

Certifikace Národní digitální knihovny podle ISO normy Jan Mottl AiP Safe s.r.o.

DŮVĚRYHODNÁ ELEKTRONICKÁ SPISOVNA

ProArc. open source řešení pro produkci a archivaci digitálních dokumentů. Martina NEZBEDOVÁ Knihovna AV ČR, v. v. i., Praha nezbedova@knav.

Stav implementace perzistentních identifikátorů v NK ČR a výhled do budoucna. Jan Hutař Marek Melichar Ladislav Cubr

Archivace digitálních dokumentů. Elektronická spisovna

Dlouhodobé a důvěryhodné uchovávání elektronických dokumentů

Tzv. životní cyklus dokumentů u původce (Tematický blok č. 4) 1. Správa podnikového obsahu 2. Spisová služba

Využití nástrojů z projektu Česká digitální knihovna při digitalizaci a zpřístupnění digitálních dokumentů

Národní digitální archiv

Lenka Maixnerová, Filip Kříž, Ondřej Horsák, Helena Bouzková

Česká digitální knihovna agregace digitálního obsahu českých knihoven

RD.CZ : EVIDENCE DIGITALIZOVANÝCH DOKUMENTŮ A SLEDOVÁNÍ PROCESU ZPRACOVÁNÍ

Digitalizace knihovních dokumentů. Jiří Polišenský

STATUT FORMÁTOVÉHO VÝBORU NÁRODNÍ DIGITÁLNÍ KNIHOVNY

České digitalizační projekty, jejich výsledky a agregace

Metodika budování sbírky Webarchivu

Digitální knihovny v České republice

Z papíru na web a ke čtenáři aneb Digitalizace není jen skenování. Mgr. Monika Oravová Moravskoslezská vědecká knihovna v Ostravě

Lenka Maixnerová, Filip Kříž, Ondřej Horsák, Helena Bouzková

Sluţba Karlovarského kraje pro ukládání dokumentů a dat na území kraje

Velká data v knihovnách Open source tools and their use in Czech libraries

Řešení oblasti LTP v projektu NDK aneb zúročení 20 let zkušeností

Příprava legislativy povinného výtisku elektronických publikací v České republice (e-depozit)

Každý písemný, obrazový, zvukový, elektronický nebo jiný záznam, ať již v podobě analogové či digitální, který vznikl z činnosti původce.

Silný portál. Jindřiška Pospíšilová. Pracovní skupina pro silný portál. Národní knihovna ČR

Požadavky na systém pro automatizaci muzejní knihovny

NÁRODNÍ DIGITÁLNÍ ARCHIV

Rosetta nástroj pro dlouhodobé uložení digitálních objektů

Zpřístupnění kulturního dědictví v digitální podobě v ČR prostřednictvím knihoven

MINISTERSTVO PRO MÍSTNÍ ROZVOJ Č.j. 7022/ R O Z H O D N U T Í č. 19/2016. ministryně pro místní rozvoj. ze dne

Zpráva ze zahraniční služební cesty

NOVÉ MOŽNOSTI PŘÍSTUPU K DIGITÁLNÍ ARCHIV NLK PLNOTEXTOVÝM INFORMACÍM : Filip Kříž, Lenka Maixnerová, Ondřej Horsák, Helena Bouzková

Národní digitální archiv a egovernment

Digitální knihovny v České republice

ZPŘÍSTUPNĚNÍ A ARCHIVACE PLNÝCH

Open Bibliography Data. ( Matouš Jobánek

Digitalizace a zveřejnění sbírkových fondů paměťových institucí Zlínského kraje

Národní digitální archiv

Strategie budování sbírky Webarchiv u

Lenka Maixnerová, Filip Kříž, Helena Bouzková, Ondřej Horsák, Adéla Jarolímková, Eva Lesenková

Odevzdávání a příjem e-publikací

Portál ebadatelna Zlínského kraje a zpřístupnění map. Prezentace historických map z fondu paměťových institucí Zlínského kraje

Řešení pro střednědobé a dlouhodobé ukládání dokumentů ve veřejné správě

XML jako prostředek pro citování informačních zdrojů

Koncepce Národní digitální knihovny a dlouhodobé ochrany digitálních dokumentů

Koncepce rozvoje knihoven ČR na léta Priorita 2: Trvalé uchování digitálních dokumentů

Projekt NAKI e-deposit

Seminář pro vedoucí knihoven asviústavů AV ČR ASEP

Systém mezinárodního standardního číslování ISBN, ISSN

DIGITÁLNÍ UNIVERZITNÍ REPOZITÁŘ. Andrea Fojtů Ústav výpočetní techniky UK v Praze

Zpracování dokumentů. PhDr. Libuše Machačová Vědecká knihovna v Olomouci

DATA ULOŽENÁ NA VĚČNÉ ČASY. (ICZ DESA / Microsoft Azure) Mikulov Michal Matoušek (ICZ) / Václav Koudele (Microsoft)

Seminář pro vedoucí knihoven a SVI ústavů AV ČR

X. mezinárodní konference o katastru nemovitostí, Karlovy Vary hotel Thermal

ICZ DESA střednědobé a dlouhodobé ukládání dokumentů

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE

Osobní archivy publikovaných odborných prací v medicíně jako součást Digitální knihovny NLK

Možnosti využití metodiky konsorcia NESTOR k certifikaci důvěryhodných digitálních archivů v paměťových institucích

CO JE KLÍČEM KE SPOKOJENOSTI UŽIVATELE?

Digitalizace v ČR a její podchycení v registru digitalizace. Helena Dvořáková Národní knihovna ČR

Digitalizace a Digitální archiv Státního oblastního archivu v Třeboni po čtyřech letech. Výsledky a perspektivy dalšího vývoje

Data management plan (DMP)

Otevřený přístup (Open Access) v Akademii věd ČR

Persistentní identifikátory pro NUŠL rozhodovací kritéria

Dlouhodobé uchování a zpřístupnění digitálních dokumentů v Evropě: výsledky dotazníkového průzkumu

Souborný katalog ČR pro veřejné knihovny Veřejné knihovny pro Souborný katalog ČR

K PROBLEMATICE SPISOVÉ SLUŽBY v elektronické podobě

Centrální portál knihoven a knihovní systémy. Petr Žabička, Moravská zemská knihovna v Brně

PROJEKT INTERPI V ROCE 2015

K PROBLEMATICE SPISOVÉ SLUŽBY v elektronické podobě

Dodatečné informace č. 2

Příloha: Dodatečné informace, včetně přesného znění žádosti dodavatele o dodatečné informace

Technologická centra krajů Digitalizace a ukládání

Projekt digitalizace a ukládání v regionech. Petr Pavlinec, KrÚ kraje Vysočina Březen 2010

Dlouhodobé a důvěryhodné ukládání elektronických dokumentů. Oskar Macek

Dlouhodobá ochrana digitální dokumentů. Mgr. Jaroslav Kvasnica

Práce s datovými úložišti (egon)

Federativní autentizace v portálu Knihovny.cz, mojeid, IdP sociálních služeb, požadované atributy u Knihovny.cz

S M Ě R N I C E č. 6/2014 ministra financí

Autorský zákon a knihovny - možnosti pro budoucnost. Vít Richter vit.richter@nkp.cz Praha, UISK, FFUK

Výchozí a cílový stav

e-pv_kalkulace nákladů pro NK - osobní náklady

Karel Škrle, ICZ a. s DOKUMENT Certifikace důvěryhodných úložišť

MANUSCRIPTORIUM Digitalizace rukopisů VKOL. Miloš Korhoň Vědecká knihovna v Olomouci

Elektronické publikace v NK ČR. Mgr. Martin Žížala Národní knihovna ČR

Digitální archiv: standardy, koncepce, postupy

Modul MWA - Publikace a články

Co nového ve spisové službě? Národní standard pro elektronické systémy spisové služby a jeho optimalizace

Seminář pro vedoucí knihoven a SVI ústavů AV ČR. Aleph

Projekt Digitalizace a ukládání ve Zlínském kraji zkušenosti, postřehy

Technologie digitálních knihoven

TECHNICKÁ SPECIFIKACE VEŘEJNÉ ZAKÁZKY

Výtisk č.: Počet listů 9. Přílohy: 0 ÚZIS ČR

RD.CZ EVIDENCE DIGITALIZOVANÝCH DOKUMENTŮ A SLEDOVÁNÍ PROCESU ZPRACOVÁNÍ

Příloha č. 1. Návrh aplikace pro správu a archivaci XML dokumentů Zpracoval: Ing. Jan Smolík, CSc

Transkript:

CZech IDentification and LOcazation tool / Český systém pro IDentifikaci a LOkalizaci digitálních dokumentů českého kulturního dědictví Metodika pro přidělování a správu životního cyklu unikátních perzistentních identifikátorů digitálních dokumentů podle standardu URN:NBN Zdeněk Vašek, Ladislav Cubr a kol. Realizováno v rámci institucionálního výzkumu Národní knihovny České republiky v části 2b Vývoj podpůrných/návazných aplikací pro dlouhodobou ochranu digitálních dat financovaného Ministerstvem kultury ČR v rámci Dlouhodobého koncepčního rozvoje výzkumné organizace Perzistentní identifikátor dokumentu: urn:nbn:cz:nk-0027gj

Obsah Seznam obrázků a tabulek... 4 1. ÚČEL METODIKY... 5 2. URČENÍ... 6 3. SOUVISEJÍCÍ NORMY A PŘEDPISY... 7 4. TERMINOLOGIE... 10 5. IDENTIFIKÁTORY... 15 5.1 Přehled stavu - identifikátory v praxi knihoven... 15 5.1.1 Identifikátory tištěných dokumentů... 15 5.1.2 Identifikátory a digitální dokumenty... 17 5.2 Identifikátor URN:NBN... 21 5.3 Východiska systému ČIDLO... 22 6. SYSTÉM ČIDLO... 25 6.1 Resolver... 25 7. PODMÍNKY ÚČASTI V SYSTÉMU ČIDLO... 27 8. MODEL ROLÍ A ODPOVĚDNOSTÍ V SYSTÉMU ČIDLO... 29 8.1 Návod pro zápis URN:NBN identifikátorů do elektronického katalogu... 31 9. PŘEDMĚT IDENTIFIKACE... 32 9.1 Model dokumentu v systému ČIDLO... 33 9.1.1 Intelektuální entita... 33 9.1.2 Digitální reprezentace/ dokument... 35 9.1.3 Digitální instance... 35 9.1.4 Vzájemné vztahy... 36 9.1.5 Datový model... 36 9.2 Vznik a struktura digitalizovaného dokumentu... 38 10. POSTUP PŘIDĚLOVÁNÍ IDENTIFIKÁTORŮ, PRAVIDLA SYSTÉMU ČIDLO... 40 10.1 Obecné povinnosti... 40

10.2 Povinnosti před přidělením URN:NBN identifikátoru (registrace registrátora)... 41 10.3 Uživatelské účty... 42 10.3.1 Možnosti operací při správě jmenného prostoru... 42 10.4 Postup ve fázi přidělení URN:NBN identifikátoru... 43 10.4.1 Příklady operací při registraci digitálního dokumentu... 44 10.5 Povinnosti z hlediska zpřístupňování dokumentu... 49 10.5.1 Příklad operace vložení digitální instance... 49 10.6 Chybové stavy... 51 11. TYPY DOKUMENTŮ... 53 11.1 Pokyny pro registrace jednotlivých typů dokumentů... 54 11.1.1 MONOGRAPH... 54 11.1.2 MONOGRAPH_VOLUME... 62 11.1.3 PERIODICAL_ISSUE... 64 11.1.4 PERIODICAL_VOLUME... 67 11.1.5 ANALYTICAL... 68 11.1.6 DIGITAL DOCUMENT... 69 11.2 Technická metadata zasílaná systému ČIDLO... 72 12. RESOLVOVACÍ FUNKCE SYSTÉMU ČIDLO... 75 13. HROMADNÉ SKLÍZENÍ POMOCÍ OAI-PMH... 77 13.1 OAI Adapter... 78 14. PRAVIDLA PRO ŽIVOTNÍ CYKLUS DOKUMENTU A IDENTIFIKÁTORU... 79 14.1 Návod na postupy při slučování a rozpojování dokumentů... 82 O AUTORECH... 84 DOPORUČENÁ LITERATURA... 84

Seznam obrázků a tabulek Obrázek 1: Příklad identifikátoru pro NLK (kapitola 5.2) Obrázek 2: Příklad identifikátoru pro NK (5.2) Obrázek 3: Popis vztahů mezi intelektuální entitou a digitální reprezentací (9.1.4) Obrázek 4: Koncepční model objektů v systému ČIDLO (9.1.5) Obrázek 5: Vztahy mezi tabulkami v databázi (9.1.5) Tabulka 1: Role v systému ČIDLO (kapitola 8) Tabulka 2: Přehled chybových kódů v Response (10.6) Tabulka 3: Doporučení na získání hodnoty číslo ČNB z metadat (11.1.1) Tabulka 4: Doporučení na získání hodnoty ISBN z metadat (11.1.1) Tabulka 5: Doporučení na získání hodnoty jiný identifikátor z metadat (11.1.1) Tabulka 6: Doporučení na získání hodnoty druh dokumentu z metadat (11.1.1) Tabulka 7: Doporučení na získání hodnoty hlavní název z metadat (11.1.1) Tabulka 8: Doporučení na získání hodnoty autor z metadat (11.1.1) Tabulka 9: Doporučení na získání hodnoty korporace z metadat (11.1.1) Tabulka 10: Doporučení na získání hodnoty akce z metadat (11.1.1) Tabulka 11: Doporučení na získání hodnoty další původce z metadat (11.1.1) Tabulka 12: Doporučení na získání hodnoty místo vydání z metadat (11.1.1) Tabulka 13: Doporučení na získání hodnoty název nakladatele z metadat (11.1.1) Tabulka 14: Doporučení na získání hodnoty rok vydání z metadat (11.1.1) Tabulka 15: Vzorové mapování metadat MODS na pole databáze ČIDLO (monografie) (11.1.1) Tabulka 16: Vzorové mapování metadat MODS na pole databáze ČIDLO (svazek monografie) (11.1.2) Tabulka 17: Doporučení na získání hodnoty druh dokumentu z metadat (číslo periodika) (11.1.3) Tabulka 18: Doporučení na získání hodnoty ISSN z metadat (číslo periodika) (11.1.3) Tabulka 19: Vzorové mapování metadat MODS na pole databáze ČIDLO (číslo periodika) (11.1.3) Tabulka 20: Vzorové mapování metadat MODS na pole databáze ČIDLO (článek) (11.1.5) Tabulka 21: Vzorové mapování metadat na pole databáze ČIDLO (digitální dokument) (11.1.6) Tabulka 22: Doporučené mapování z metadat ve standardu MIX (11.2)

1. ÚČEL METODIKY Metodika předkládá postup pro získání, správné použití a následné nakládání s unikátními perzistentními identifikátory digitálních dokumentů kulturní povahy ze sféry knihoven v České republice. Metodika se zabývá životním cyklem identifikátorů založených na standardu URN:NBN (Uniform Resource Name: National Bibliography Number standard RFC 3188 1 ). Definuje potřebné kroky k získání identifikátoru URN:NBN v českém prostředí (služba ČIDLO), pravidla pro jeho přidělování a zásady pro následné dlouhodobé uložení a zpřístupnění digitálního dokumentu, kterému byl identifikátor URN:NBN přidělen. Cílem metodiky je poskytnout návod producentům a správcům digitalizovaných dokumentů, jak správně získávat perzistentní identifikátory v systému ČIDLO a jak nakládat s identifikovanými dokumenty tak, aby byla dodržena pravidla standardu URN:NBN na národní i mezinárodní úrovni a zároveň bylo vyhověno požadavkům na autenticitu, dlouhodobé uložení, správu a také zpřístupnění digitálního dokumentu. Správné využití návodu této metodiky ve všech zmíněných oblastech (od přidělení po zpřístupnění) představuje též nutnou podmínku pro používání identifikátoru URN:NBN jako jednoho ze způsobů, jak citovat online dokumenty, což výrazně přispěje ke zvýšení důvěryhodnosti citování ve vědecké praxi, především v oblasti humanitních věd. Využití standardu URN:NBN podle předložené metodiky je také jedním ze způsobů zajištění autenticity dokumentů a zároveň slouží pro propojení při dlouhodobé správě digitálních dokumentů Pravidla a postupy metodiky byly ověřeny v letech 2012 2014 v rámci provozu Národní digitální knihovny a ve spolupráci s dalšími producenty digitálních dokumentů, především z programu VISK7 a tzv. krajských digitalizací. 1 https://www.ietf.org/rfc/rfc3188.txt Návrh podala Finská národní knihovna prostřednictvím Juhy Hakaly jako doporučení Internetové společnosti (The Internet Society) v roce 2001. Citováno [2014-09-22].

2. URČENÍ Metodika je určena všem uživatelům služby ČIDLO, kteří jsou v roli registrátora nebo archivátora, případně jsou touto rolí pověřeni, dále také správcům digitálních repozitářů a digitálních knihoven paměťových institucí. Potřeba jednoznačné a trvalé identifikace se ukazuje jako stále důležitější otázka. Globálnost, perzistence a standardizace (pravidla) identifikátoru zaručují jeho dlouhodobou užitečnost při správě a vyhledávání dokumentů. V běžné praxi by měli metodiku využívat externí producenti dat, pracovníci digitalizačních jednotek provozovaných paměťovými institucemi (především knihovnami) a další pracovníci spravující sbírky digitálních dokumentů za účelem archivace i zpřístupnění. Cílovou skupinou metodiky jsou knihovny všech úrovní nebo obdobné instituce (např. muzea bez registrované knihovny, ale s knihovní sbírkou) a externí producenti dat zajišťující digitalizaci. Základní vymezení uživatelské komunity: - krajské a ústřední knihovny, - knihovny vědeckých ústavů, - vysokoškolské knihovny, - producenti digitalizovaných dat kulturní povahy ve sféře knihoven. V širším vymezení má služba ČIDLO dva okruhy uživatelů. První tvoří ti, jimž je určena tato metodika, a druhý čtenáři, kteří službu ČIDLO mohou využívat jako cestu k zjištění aktuálního umístění identifikovaných dokumentů v internetové síti a jako možnost pro citování těchto dokumentů.

3. SOUVISEJÍCÍ NORMY A PŘEDPISY Samotná metodika není všeobjímajícím doporučením jak nakládat s digitálními dokumenty. Definuje pouze zacházení s identifikátorem URN:NBN a to, jaká omezení musí jeho uživatelé respektovat. Mezi ně patří i korektní využívání standardů a norem vztahujících se k samotnému identifikátoru, k archivaci dokumentů a k vytváření metadat a některých dalších předpisů. Tyto standardy, normy a předpisy je nutné používat, pokud mají být využity všechny možnosti a doporučení předkládané metodikou. 3.1 Standard URN:NBN Tento standard je základním předpisem pro syntax a užívání identifikátoru URN:NBN 2. Jeho pravidla jsou implementována do systému ČIDLO, dodržováním jeho pravidel je garantováno i plnění standardu pro URN:NBN. 3.2 Normy pro digitální repozitář Normy ISO 14721:2012 (Open archival information system Reference model; česká verze jako ČSN ISO 14721: Otevřený archivační informační systém Referenční model) a ISO 16363:2012 (Audit and certification of trustworthy digital repositories; česká verze jako ČSN ISO 16363: Audit a certifikace důvěryhodných digitálních úložišť) jsou dvě základní normy v oblasti dlouhodobého uchovávání digitálních dokumentů. Norma ISO 14721:2012 specifikuje požadavky na funkce archivačního systému (archiv OAIS) pro dlouhodobé uchovávání digitálních dokumentů. Jde o druhé vydání normy (první bylo v roce 2003). Norma ISO 16363:2012 specifikuje takové požadavky na audit a certifikaci archivu OAIS, aby mohl být označen za důvěryhodný. Obě normy vyšly v roce 2014 též v češtině. Jako oficiální české verze mezinárodních norem je vydal Úřad pro technickou normalizaci, metrologii a státní zkušebnictví (http://www.unmz.cz/urad/unmz). Archivní verze digitálních dokumentů s URN:NBN identifikátory mohou být uloženy i mimo systémy splňující normu OAIS, ovšem nelze tento postup dlouhodobě doporučit. 3.3 Metadata Object Description Schema (MODS) Metadatový standard MODS dostupný z http://www.loc.gov/standards/mods/ [citováno 2014-09-23] je výchozím standardem pro tvorbu popisných metadat, která jsou 2 Dostupný z https://www.ietf.org/rfc/rfc3188.txt [citováno 2014-09-23].

následně předávána podle pravidel metodiky. Metodika předpokládá, že pro tvorbu metadat, která budou předávána systému ČIDLO za účelem získání identifikátoru URN:NBN, budou využity verze standardu 3.2; 3.3; 3.4 a 3.5. Využití standardu je povinné, jiné než doporučené verze standardu je předem nutno konzultovat s kurátorem systému ČIDLO. 3.4 MIX (NISO Metadata for Images in XML) Technická metadata pro obrazová data definuje norma ANSI/NISO Z39.87-2006. Jejich zápis do XML stanovuje standard MIX. MIX slouží k podrobnějšímu popisu obrazových dat, používá se k popisu formátu digitálních obrazů, jejich rozlišení, reálné velikosti, barevného modelu atd. Zaznamená také údaje o hardware, který digitální obraz vytvořil. Metodika předpokládá využití verze 2.0 standardu MIX. Využití standardu je doporučené. Standard je dostupný z http://www.loc.gov/standards/mix// [citováno 2014-09- 23]. 3.5 Standardy digitalizace Národní digitální knihovny Metodika předpokládá, že digitální dokumenty identifikované pomocí URN:NBN identifikátoru budou vytvářeny nebo přetvářeny pomocí standardů digitalizace Národní digitální knihovny, a to v jakékoliv verzi standardů, přičemž se doporučuje využít vždy aktuálně platnou verzi dostupnou z webu NDK: http://www.ndk.cz/standardy-digitalizace. Použití Standardů digitalizace je touto metodikou doporučené, není povinné, pokud to nevyžadují jiné předpisy. Standardy digitalizace vydala Národní knihovna ČR. 3.6 REST (Representational State Transfer) Jde o architekturu rozhraní, navrženou pro distribuované prostředí, které využívá i software CZIDLO. Byla představena v roce 2000 v disertační práci Roye Fieldinga, jednoho ze spoluautorů protokolu HTTP. Rozhraní REST je použitelné pro jednotný a snadný přístup ke zdrojům (resources). Základní metodou pro přístup ke zdrojům je získání zdroje metoda GET. REST je architektura, která umožňuje přistupovat k datům na určitém místě pomocí standardních metod http. Definice je dostupná z http://www.ics.uci.edu/~fielding/pubs/dissertation/rest_arch_style.htm [citováno 2014-09-23].

Pro automatické přidělování identifikátorů URN:NBN podle této metodiky je používání protokolu REST nezbytné. Částečně jej lze nahradit manuálním přidělováním pomocí webového rozhraní. 3.7 The Open Archives Initiative Protocol for Metadata Harvesting (OAI PMH) Tento protokol slouží k hromadnému sklízení metadatových záznamů různých repozitářů, jako jsou katalogy, digitální knihovny apod. Jde o aplikační protokol nad HTTP. Podrobnosti k protokolu dostupné z http://www.openarchives.org/oai/openarchivesprotocol.html [citováno 2014-09-23]. Tato metodika předpokládá, že digitální knihovny, ve kterých budou zveřejňovány dokumenty identifikované pomocí identifikátoru URN:NBN, bude možno sklízet pomocí OAI PMH protokolu nebo budou mít záměr tuto možnost zavést. Pokud budou dokumenty zveřejňovány ve více knihovnách, pak je nutné, aby k tomu byla uzpůsobena alespoň jedna z těchto knihoven. 3.8 Dublin Core (DC) Metadatový standard Dublin Core dostupný z http://dublincore.org/ [citováno 2014-09-23] je standardem pro tvorbu popisných metadat. Tato metodika ho chápe jako doplňující, nicméně je vyžadován dalšími předpisy.

4. TERMINOLOGIE Zkratky a pojmy užívané v metodice Tyto zkratky a pojmy vycházejí z praxe knihoven v ČR (jedná se především o vžité zkratky), z ustáleného názvosloví užívaného v rámci systému ČIDLO a dále z odborné terminologie, kterou je nutné v metodice využít pro správný popis jednotlivých kroků. Pojmy z normy OAIS jsou uváděny podle české verze normy. ADR Adresář knihoven dostupný z http://www.nkp.cz/katalogy-a-db AIP Archivní informační balíček (archival information package) informační balíček, který je složen z informačního obsahu a přidružených informací o uchovávání a je uchováván v archivu OAIS Aktuální archivní dokument Archivní dokument, který je obsažen v nejnovější verzi balíčku AIP. Archivátor Instituce, která provozuje digitální repozitář. Archivní dokument Archivní kopie digitálního dokumentu uložená v digitálním repozitáři v balíčku AIP.. Bibliografická metadata Popisná bibliografická metadata ve standardu MODS. ČIDLO (Český systém pro IDentifikaci a LOkalizaci digitálních dokumentů českého kulturního dědictví) ČIDLO je systém pro trvalou identifikaci digitálních dokumentů českého kulturního dědictví.

Tento systém využívá standard URN:NBN a je řízen Národní knihovnou České republiky (NK ČR), která systém spravuje a koordinuje ve spolupráci s dalšími institucemi. Služby systému ČIDLO jsou dostupné na adrese https://resolver.nkp.cz. Služba ČIDLO je založena na softwaru CZIDLO. S uživateli automatizovaně komunikuje pomocí aplikačního rozhraní (Application Programming Interface API). Jedná se o RESTful webové API. Pro autentizaci je použita metoda Basic access authentication. Operace, které jsou autorizované, jsou dostupné jen přes HTTPS, čímž je zabráněno zachycení loginu a hesla, které jinak metoda posílá v otevřené formě. Digitální dokument Digitální (či přesněji vymezeno v rámci této metodiky digitalizovaný) dokument je komplexní pojem, který má v rámci metodiky a informační vědy dva významy. Primárně bude pojem používán ve smyslu obecného označení digitálního objektu vzniklého digitalizací (mimo tuto metodiku patří do definice i objekty vzniklé přímo v digitální podobě, tzv. digital born dokumenty nebo e-borny) nebo-li množiny počítačových souborů v určitém formátu, které jako celek, spolu se strukturálními metadaty, tvoří, při zobrazení v příslušné aplikaci (např. internetový prohlížeč), obraz celé tištěné předlohy včetně zachování posloupnosti stran. V rámci systému ČIDLO je digitální dokument definován jako statický digitální dokument. Dokumentu, jehož obsah se nadále nemění, lze přidělit trvalý identifikátor URN:NBN. Digitální dokument je to, co je předmětem identifikace. Digitální dokument digitálně reprezentuje jednu intelektuální entitu a je popsán týmiž technickými a bibliografickými metadaty (tato dědí po intelektuální entitě). Digitální dokument má zpravidla dvě verze archivní (pro archivaci v digitálním repozitáři) a uživatelskou (pro zpřístupňování v digitální knihovně), obě verze jsou považovány z hlediska autenticity za shodné a mají tentýž identifikátor URN:NBN. V přesně vymezených případech bude pojem používán jako přesněji vymezený, jako označení abstraktního modelu digitálního dokumentu skládajícího se ze tří vrstev: intelektuální entity, digitální reprezentace a digitální instance, přičemž pojem digitální reprezentace odpovídá popsanému obecnému vnímání digitálního dokumentu. V rámci systému ČIDLO odpovídá pojem digitální dokument digitální reprezentaci. Digitální instance Umístění uživatelské kopie dokumentu v digitální knihovně, ze kterého může uživatel získat přístup k celému uživatelskému dokumentu. Digitální instance je identifikována pomocí URL

adresy. Digitální instance je lokalizována na splash page, tedy na úvodní webové stránce k digitálnímu dokumentu, obsahuje odkazy na jednotlivé soubory tvořící digitální reprezentaci a jsou na ní uvedena metadata k digitálnímu dokumentu. Digitálních instancí jedné reprezentace může být více, pokud jeden vlastník zpřístupní digitální dokument skrze více digitálních knihoven. Digitální knihovna Systém, ve kterém jsou uživatelské kopie dokumentů zpřístupňovány uživatelům. Digitální repozitář (synonymum: digitální úložiště) Systém pro dlouhodobé uchovávání archivních kopií digitálních dokumentů. Tento systém musí splňovat požadavky archivu OAIS. Digitální reprezentace Digitální reprezentace je množina počítačových souborů, která vznikla digitalizací a která reprezentuje intelektuální entitu. Pokud z jedné intelektuální entity vytvoří (zdigitalizuje) více institucí digitální reprezentaci, pak se jedná o různé digitální reprezentace a každá získá jiný identifikátor. Podmínkou získání identifikátoru URN:NBN je tedy vlastnictví digitální reprezentace. Pokud je digitální reprezentace dostupná ve více formátech, stále se jedná o jednu digitální reprezentaci a všechny verze mají jeden společný URN:NBN identifikátor a jsou lokalizovány jako jedna digitální instance. K digitální reprezentaci se přiřazuje URN:NBN identifikátor. Digitální reprezentace terminologicky odpovídá digitálnímu dokumentu. DIP Výstupní informační balíček (dissemination information package) Informační balíček odvozený z jednoho nebo více balíčků AIP a zaslaný archivem OAIS koncovému uživateli jako odpověď na jeho požadavek vůči tomuto archivu FRBR Konceptuální model Functional Requirements for Bibliographic Records Funkční požadavky na bibliografické záznamy.

Identifikátor Znakový řetězec, který v rámci určitého kontextu jednoznačně označuje nějaký objekt. Identifikátorová metadata Metadata, která jsou uložena v databázi resolveru spolu s identifikátorem URN:NBN a která popisují původní archivní dokument. Intelektuální entita (IE) Intelektuální entita je ucelenou množinou informací z hlediska správy i popisu. Intelektuální entitou může být pro potřeby trvalé identifikace kniha, článek v periodiku, periodikum (seriál) jako číslo nebo jednotlivý ročník, kvalifikační práce, stať apod. K intelektuální entitě se přiřazují bibliografická metadata. Nástupnický archivní dokument Archivní dokument, který je potomkem původního archivního dokumentu první nebo vyšší generace. Nástupnický archivní dokument vzniká v digitálním repozitáři formátovou migrací předešlého archivního dokumentu a je obsažen v nové verzi balíčku AIP. Nestandardní dokument Digitální dokument, který nebyl vytvořen podle standardů digitalizace NDK. Může se jednat o dokument, který vznikl předtím, než vstoupily v platnosti standardy digitalizace NDK, nebo který vznikl v době platnosti standardů digitalizace NDK, ale podle jiných standardů. I tento dokument může za určitých okolností obdržet perzistentní identifikátor URN:NBN, ale funkčnost bude v rámci systému omezena. Především bude omezena schopnost resolvovat všechny dostupné digitální instance dokumentu, zpravidla bude odkazována jen kopie v digitální knihovně přímého vlastníka nebo pověřeného archivátora. OAIS otevřený archivační informační systém (open archival information system) Archiv, který tvoří uskupení lidí a systémů, jež přijalo odpovědnost za uchovávání informací a jejich zpřístupňování určené skupině, přičemž toto uskupení může být součástí většího celku.

Původní archivní dokument Archivní dokument, který byl uložen do digitálního repozitáře jako první verze balíčku AIP. Původní uživatelský dokument Uživatelský dokument ve formátu, ve kterém byl vytvořen při produkci, je tvořen uživatelskými kopiemi. Registrátor Instituce, která buď sama, nebo prostřednictvím zhotovitele získává identifikátory URN:NBN a zapisuje je do metadat vázajících se k archivním i uživatelským verzím dokumentů. SIP Submission information package Informační balíček, který dodává tvůrce do archivu OAIS tak, aby mohl být využit při sestavení nebo aktualizaci jednoho nebo více AIP a/nebo přidružených popisných informací. Standardy digitalizace NDK Standardy digitalizace, která zavedla NK ČR pro projekt Národní digitální knihovny. V současnosti jsou tvořeny DMF (definice metadatových formátů), standardy pro obrazová data, pravidly popisu a jsou určeny pro digitalizaci monografií a periodik. Jsou dostupné na webu Národní digitální knihovny: http://www.ndk.cz/standardy-digitalizace Technická metadata Metadata popisující technické vlastnosti obrazových souborů ve standardu MIX. Uživatelský dokument Uživatelská kopie digitálního dokumentu zpřístupňovaná uživatelům, obvykle v nižší obrazové kvalitě než archivní dokument.

5. IDENTIFIKÁTORY 5.1 Přehled stavu - identifikátory v praxi knihoven 5.1.1 Identifikátory tištěných dokumentů Identifikátory obecně slouží k jednoznačnému označení objektu v určitém prostředí. V prostředí knihoven a produkce a distribuce tištěných knih a periodik mají relativně dlouhou tradici identifikátory tištěných dokumentů, zejména identifikátory ISBN a ISSN. ISBN je tzv. perzistentní identifikátor, tj. takový, který je trvale užíván k identifikaci právě té publikace, které byl původně přidělen (tj. nesmí být přidělen znovu, a proto musí být trvale udržován v centrální databázi). Globální trvalé identifikátory mají standardizovanou syntax a jsou přidělovány na základě určitých pravidel, mezi která obvykle patří definice toho, čemu může být identifikátor přidělen. Například identifikátor ISBN může být přidělen pouze knize na úrovni vydání, nikoliv exempláři 3, tj. ISBN identifikuje dokument z hlediska jeho intelektuálního obsahu (a sekundárně též z hlediska specifických znaků vydání). Identifikátor ISBN slouží knihovnám zejména pro potřeby správy, popisu a uchovávání tištěných knih dokumentů nebo sdílení bibliografických záznamů; vydavatelům, distributorům a prodejcům knih zase poskytuje prostředek pro propagaci, distribuci nebo nabízení knih čtenářům. Uživatelům knihoven umožňuje identifikátor ISBN rychlé a přesné vyhledání záznamu požadované knihy v katalogu. Kupujícím umožňuje jednoznačnou identifikaci produktu, který si koupili nebo chtějí zakoupit či objednat. Z důvodů globalizace (nejen knižního) trhu i mezinárodní spolupráce knihoven ve 20. století a požadavků dlouhodobé využitelnosti identifikátorů jsou identifikátory ISBN a ISSN globální (jednoznačné v mezinárodním měřítku) a trvalé (identifikátor jednou přidělený určitému dokumentu nesmí být nikdy přidělen jinému). Globálnost, perzistence a standardizace (pravidla) identifikátoru zaručují jeho dlouhodobou užitečnost při správě a vyhledávání dokumentů. Úspěch obou zmíněných identifikátorů spočívá v tom, že jsou řízeny dobře fungujícími identifikačními systémy. Identifikátor sám, bez identifikačního systému, nemůže plnit potřebné funkce v širší komunitě uživatelů. Identifikátory ISBN a ISSN jsou přidělovány centralizovanými hierarchizovanými systémy (mezinárodní agentura a síť podřízených 3 Všechny exempláře téhož vydání mají totéž ISBN.

národních agentur). Tyto systémy vymezují pravidla užití identifikátorů a řídí a kontrolují jejich přidělování. Pravidla užití zahrnují definici datového modelu, tedy toho, co je předmětem identifikace. Například identifikátor ISBN je přidělován každému vydání (prvnímu, druhému atd.) knihy na úrovni titulu, tzn. všem exemplářům vydání knihy, které mají tentýž obsah. V rámci vydání se dále odlišuje jiná forma (vázané vydání, brožované vydání) a vydavatel. Každá jiná forma téhož vydání dostane jiný identifikátor ISBN. Pokud odlišní vydavatelé vydají tutéž knihu, dostane každá z nich jiné ISBN. Pravidla užití mj. vymezují, že identifikátor ISBN musí být vytištěn v knize samotné, je tedy trvale spojen s touto knihou, což usnadňuje identifikaci konkrétní knihy. Tento model byl navržen tak, aby vyhovoval potřebám těch, kteří budou identifikátory ISBN využívat. Různá vydání mohou obsahovat odlišné verze díla (např. přepracované vydání) nebo jinou typografickou úpravu. Totéž vydání může existovat v různých formách (např. vázané nebo brožované vydání). Model systému ISBN umožňuje zachytit tyto rozdíly, protože jeho původní funkcí je identifikace specifického sériového produktu, dnes nezbytná potřeba z hlediska distribuce a prodeje knih (to platí obecně o jakémkoliv hromadně prodávaném zboží - viz čárový kód zboží). Naproti tomu jednoznačnou identifikaci jednotlivého exempláře vydání knihy ISBN neumožňuje (totéž platí o čárovém kódu zboží), neboť takový způsob identifikace není potřebný pro prodej a distribuci. Ačkoliv motivace vzniku systému ISBN byla komerční, existence tohoto identifikátoru je výhodná i pro knihovny, například pro potřeby katalogizace nebo sdílení záznamů. Z tohoto důvodu jsou také některé národní agentury provozovány tamními národními knihovnami. V knihovnách se současně s ISBN užívá identifikátor exempláře, tj. signatura. Signatura slouží k určení lokace knihy podle signatury většinou nalezneme knihu ve volném výběru nebo v depozitáři. Signatura není globální identifikátor (signatura je jedinečná jen v rámci dané knihovny), ani perzistentní identifikátor (kniha může dostat novou signaturu), ani nepodléhá rozšířené standardizaci (každá knihovna si může zvolit vlastní syntax pro signatury).

5.1.2 Identifikátory a digitální dokumenty 1 V případě digitálních dokumentů se možnosti využití identifikátorů rozšiřují 4. Digitální dokumenty jsou často online, tj. přístupné prostřednictvím internetové sítě. Pro online dokumenty platí, že na základě identifikátoru digitálního dokumentu je možné vyhledat nejen bibliografické údaje popisující tento dokument, ale také k němu získat okamžitý přístup, ať již jeho prohlížením na dané webové stránce nebo stažením z ní do počítače uživatele. Nejčastější způsob identifikace digitálních dokumentů zpřístupňovaných v internetové síti je URL adresa webové stránky. V současné době většina uživatelů vyžaduje, aby byly digitální dokumenty přístupné na internetu, a převážná většina producentů digitálních dokumentů jim vychází vstříc. Požadavek, aby byl digitální dokument přístupný internetovou sítí, je současně požadavkem po tom, aby identifikátor digitálního dokumentu plnil funkci, kterou identifikátory tištěných dokumentů nikdy plnit nemohly - zprostředkovával okamžitý přístup k celému dokumentu. Způsob identifikace digitálního dokumentu prostřednictvím URL adresy však není stabilní, neboť dokumenty mohou být (a ve většině případů jsou) přesouvány na jinou webovou stránku či jinam v rámci dané stránky. Způsob identifikace dokumentu prostřednictvím URL adresy je de facto identifikací umístění dokumentu, nikoliv dokumentu samotného. Dokument je na dané internetové adrese dostupný z kteréhokoliv počítače na světě (s platnými legislativními, případně komerčními omezeními), a z tohoto důvodu se také stalo URL nejužívanějším digitálním identifikátorem současnosti. Zjednodušeně lze říci, že URL je jakási globální signatura, protože URL je identifikátor lokace. Tato globální signatura je sice na rozdíl od signatur knih vysoce standardizovaná, nicméně není perzistentní stejně jako knihovní signatura se může změnit i internetová lokace dokumentu. Pro trvalou využitelnost dokumentů v internetové síti je nutná existence systému trvalé identifikace, který je založen na globálním a perzistentním identifikátoru vlastního dokumentu (nikoliv jeho lokace). Svět digitálních dokumentů pracuje s celou řadou identifikátorů. Pouze některé jsou perzistentní, tedy trvalé, poskytující jednoznačnou, dlouhodobou identifikaci. Z výše naznačených důvodů jsou již od poloviny 90. let 20. století navrhovány a zaváděny 4 Jak bylo řečeno v části definující pojmy používané metodikou, jako digitální dokument je zde označovaný digitální objekt vzniklý digitalizací, který v abstraktním modelu digitálního dokumentu odpovídá rovině digitální reprezentace. V rámci dokumentace systému ČIDLO je digitální reprezentace označována jako digitální dokument.

nové systémy identifikace digitálních dokumentů, které se pokouší řešit tento problém a které nejsou založeny primárně na URL adrese. Jeden z těchto systémů, systém URN:NBN (Universal Resource Name: National Bibliography Number), byl vybrán pro identifikační systém ČIDLO, který je českou národní implementací systému URN:NBN. Mezi další rozšířené identifikační systémy patří Handle, DOI (Digital Object Identifier), PURL (Persistent Uniform Resource Locator), ARK (Archival Resource Key). Předem je třeba říci, že není nutné, aby všechny instituce využívaly stejný typ identifikátoru, protože se jejich charakter např. nehodí pro odlišné fondy. A na druhou stranu ničemu nebrání, pokud bude jeden dokument označen více identifikátory, pokud se tak bude dít vždy ve vymezeném kontextu. Široké mezinárodní užití má systém Handle (www.handle.net), který vyvinula a provozuje CNRI (Corporation for National Research Initiatives) jako součást obecné architektury pro jednoznačnou identifikaci digitálních objektů. Služeb tohoto systému může využívat jakákoliv instituce, která může využívat i další softwarové nástroje CNRI včetně databáze spravující poskytnuté identifikátory. Samotné využívání systému Handle je zpoplatněno, zatím mírnou taxou. Nevýhodou systému je především nemožnost na základě identifikátoru ihned identifikovat vlastníka, případně geografickou příslušnost. Velmi rozšířený, ale zároveň omezený, je systém DOI (http://www.doi.org/) založený na bázi Handle, který však poskytuje mnohem více funkcí a dokáže identifikovat různé typy digitálních objektů (obchodní smlouvy, patenty atd.). Systém vznikl pro identifikaci digitálních objektů pro potřeby komerčních vydavatelů. Syntax DOI byla specifikována normou ANSI/NISO Z39.84-2000. Identifikátor DOI je využíván především vydavateli vědeckých on-line publikací, přičemž dnes lze říci, že velká část vědeckých článků je identifikována právě tímto systémem (DOI identifikuje primárně samotný článek a ne titul). Pro získání identifikátoru je třeba odevzdávat poměrně značné množství metadat, řídit se komplexními pravidly (povinnost registrovat všechny přidělené identifikátory u agentury, která následně zajišťuje i směrování) a především, což vyplývá z faktu, že DOI je určen především pro podporu komerčního vydávání, je zpoplatněn za přidělení každého jednotlivého identifikátoru. Toto zpoplatnění, jakož i komplexnost procesu přidělování, vylučuje systém DOI z provozu běžných knihoven zabývajících se masovou digitalizací. Identifikátor PURL (http://purl.org) byl vyvinut Online Computer Library Center. Je založen na klasické URL, ale s pomocí softwaru resolveru je schopen automaticky přesměrovávat na aktuální umístění dokumentu. Funkčně celý proces probíhá tak, že

dokument dostane URL odkazující na službu PURL a teprve z ní je uživatel odkázán na aktuální umístění. Instituce mohou mít i vlastní resolver. Mezi užívané patří i identifikátor ARK, jenž je opět postaven na bázi URL. ARK umožňuje identifikovat různé typy nejen digitálních objektů. Může být využit pro označení různých intelektuálních entit, knih, ale i softwarů, databází apod. Jeho schéma je poměrně komplikované, vedle povinné obsahuje i volitelnou část umožňující směrování. 2 Dlouhodobé uchovávání a trvalé identifikátory Z hlediska dlouhodobého uchovávání digitálních dokumentů se objevily nové výzvy, které ve světě tištěných dokumentů neexistovaly. Forma tištěného dokumentu je tvořena materiálním objektem a uchovávání tištěné knihy nebo periodika znamená opatření, jak zachovat tento materiální objekt, mezi něž patří omezení přístupu k němu a zpomalení jeho degradace (která je nevyhnutelným fyzickým procesem). Digitální dokumenty jsou tvořeny bity, které jsou uložené na datovém nosiči. Datové nosiče jsou sice také materiální objekty (např. pevný disk), a tedy také degradují, ale bity uložené na těchto nosičích jsou na těchto nosičích nezávislé, a je tak možné kopírovat je na nové datové nosiče v případě, že původnímu datovému nosiči hrozí degradace nebo zastarání (konec podpory počítačovými systémy). Kopírování bitů na nové nosiče je základním opatřením dlouhodobého uchovávání digitálních dokumentů. Bity jsou zpravidla uloženy ve formě počítačových souborů, které jsou v určitém datovém formátu. Tyto datové formáty jsou ohroženy zejména zastaráním - zastaralost formátu znamená, že již neexistují programy, které by dokázaly soubory v těchto formátech otevřít a adekvátně zobrazit. Nyní je již obecně přijatou skutečností, že digitální dokumenty nebude možné v budoucnosti dále uchovávat ve stejných datových formátech, ve kterých byly původně vytvořeny nebo uloženy do digitálního úložiště. Předpokládá se, že formáty digitálních dokumentů bude nutné převádět do nových formátů, které umožní, aby digitální dokument bylo v novém počítačovém prostředí možno adekvátně zobrazit. V některých případech je tento požadavek aktuální již nyní. Některé knihovny, které v 90. letech digitalizovaly své tištěné dokumenty do formátu TIFF, zvažují převod do formátu JPEG2000, některé knihovny jej dokonce již uskutečňují. (Palmer, 2013) Převod do jiného formátu by měl z hlediska požadavků dlouhodobého uchovávání současně zachovat obsah dokumentu vč. zachování podstatných vlastností daného digitálního dokumentu.

Z hlediska identifikace tato skutečnost nastoluje následující problémy. Pokud se změní formát digitálního dokumentu a nová verze digitálního dokumentu dostane nový identifikátor, nebude moci uživatel na základě identifikátoru, přiděleného původnímu dokumentu, vyhledat novou verzi tohoto dokumentu. V případě ISBN, jak jsme viděli, je jedním z prvků datového modelu forma vydání. Datový model systému ISBN změnu formy knihy neřeší. Původní pravidla systému ISBN se vztahovala pouze na tištěné knihy a změna formy vydané tištěné knihy není možná - kniha zůstává stejným fyzickým objektem. Poté, co začali vydavatelé vydávat kromě tištěných knih také online publikace, systém ISBN rozšířil možnosti svého užití i na tento nový typ knihy. V případě, že jedno vydání je vydáno v různých formátech (např. epub nebo PDF), každý formát musí dostat nový identifikátor ISBN. To platí i v případě odlišných verzí téhož formátu (e-book ve formátu PDF s ochranou DRM dostane jiné ISBN než e-book v PDF bez ochrany DRM). Knihovny, které digitalizují své tištěné dokumenty, se do určité míry podobají klasickým vydavatelům - do té míry, že jsou producenty i vlastníky digitalizovaných dokumentů. Nemají však zpravidla, na rozdíl od klasických vydavatelů, práva copyrightu k tištěným předlohám, ani licenci na autorská práva k těmto předlohám. Cílem produkce navíc nebývá prodej digitalizovaných dokumentů, ale zejména lepší služby pro uživatele a ochrana tištěných dokumentů (např. omezení přístupu k tištěnému dokumentu tím, že je nabízena jeho digitální kopie). Z hlediska uživatelů je pak důležité, aby byl dokument zpřístupnitelný i v budoucnosti, což pravděpodobně bude znamenat změnu jeho formátu. 3 Digitalizace a trvalé identifikátory V digitalizační praxi velké části knihoven převládá přístup, ve kterém má výsledek digitalizace dvě podoby - archivní kopie a uživatelské kopie. Archivní a uživatelské kopie se zpravidla liší formátem nebo jeho verzí (např. JP2 v bezztrátové nebo ztrátové kompresi), nicméně jejich obsah zůstává stejný - je jím obraz tištěné předlohy. Vedle tohoto přístupu existuje druhé řešení, a sice generovat uživatelské kopie z archivních, většinou na vyžádání uživatele. Tato metodika popisuje řešení pro převládající postup, ale pokud by někdo zvolil minoritní postup, platí pro něj z hlediska perzistentních identifikátorů v zásadě stejná pravidla. Perzistentní identifikátor URN:NBN musí být při generování uživatelské kopie přebrán do metadat uživatelského dokumentu. U uživatelských kopií vyvstává tentýž problém, jako v případě dokumentu v původním formátu a následnickém dokumentu v jiném formátu, a sice zda tyto odlišné kopie

označit stejným, nebo odlišným identifikátorem, a pokud stejným, pak jakým způsobem přesně definovat předmět identifikace. Důvodem současné produkce archivní a uživatelských kopií je to, že jejich formáty jsou vybírány s ohledem na užití dokumentu. Formát archivní kopie je vybírán na základě vhodnosti pro dlouhodobé uchovávání. V odborné komunitě se za takový formát považuje formát, který splňuje řadu kritérií, například není proprietární (tj. jeho užití není omezeno právy duševního vlastnictví), je dobře zdokumentovaný a standardizovaný a bude z něj v budoucnosti snadnější provádět převody do jiných formátů. Naproti tomu formát uživatelské kopie se volí z hlediska potřeb uživatelů a možností digitální knihovny. Například soubory ve ztrátové kompresi jsou obvykle menší velikosti, a proto je uživatel může rychleji načíst, a podobně méně zatěžuje provoz digitální knihovny a její úložné kapacity. Formáty pro uživatele jsou také vybírány z hlediska toho, že jsou podporovány v běžně užívaných aplikacích (např. internetové prohlížeče) nebo na oblíbených zařízeních (např. tablety). 5.2 Identifikátor URN:NBN Identifikátor URN:NBN může být tvořen pouze alfanumerickými znaky anglické abecedy (0-9; a-z), dvojtečkou a spojovníkem. Pro systém ČIDLO je využita varianta se systémem podřízených jmenných prostorů (uvedená ve standardu URN:NBN). Syntax identifikátoru URN:NBN v systému ČIDLO lze schematicky vyjádřit jako: A:B-C Vždy platí, že: A = urn:nbn:cz (urn.nbn je obecný předpis; cz kód jmenného prostoru) B = kód registrátora (1-6 alfanumerických znaků). V případě knihovny se záznamem v ADR platí, že B = sigla (šestimístný alfanumerický znakový řetězec), kromě několika výjimek (Národní knihovna ČR = nk [pro digitalizaci od roku 2012], Moravská zemská knihovna = mzk, Vědecká knihovna v Olomouci = vkol). Kód registrátorů (část B) bez záznamu v ADR může obsahovat 1-5 alfanumerických znaků, jejich výběr je nutno konzultovat s kurátorem resolveru, který kód následně schvaluje a eviduje v databázi. Výsledný identifikátor v rámci této varianty tak může být tvořen 19-23

znaky. C = 6 alfanumerických znaků Metodika doporučuje zapisovat identifikátor malými písmeny. Z důvodu snadnější čitelnosti lidskými uživatelem. (Nulu 0 a písmeno O lze v některých znakových sadách snadno zaměnit). Výsledný identifikátor má pak vždy toto schéma a skládá se z 19 až 24 znaků (příklad pro Národní lékařskou knihovnu): A : B - C 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 u r n : n b n : c z : a b a 0 0 8-0 2 b 4 5 a Obrázek 1: Příklad identifikátoru pro NLK; urn:nbn:cz:aba008-02b45a Příklad pro Národní knihovnu ČR A : B - C 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 u r n : n b n : c z : n k - 0 0 1 4 t a Obrázek 2: Příklad identifikátoru pro NK V ČR zajišťuje přidělování a správu identifikátorů URN:NBN systém ČIDLO provozovaný Národní knihovnou ČR. 5.3 Východiska systému ČIDLO Systém ČIDLO je postaven na následujících předpokladech:

Knihovny, které digitalizují své tištěné předlohy, mají obvykle za cíl vytvořit odpovídající obraz tištěné předlohy, poskytnout jej uživatelům a zachovat jej pro budoucí uživatele. Obraz fyzické předlohy je obsahem digitalizovaného dokumentu, který není závislý na konkrétním grafickém formátu. Knihovny, které digitalizují své tištěné fondy, aby je následně dlouhodobě uchovávaly, nejsou v pozici klasických vydavatelů, kteří vydávají knihy v různých formátech z důvodu vytvoření širší nabídky produktů pro čtenáře. Volba formátů pro archivní a uživatelské dokumenty (a do budoucna pro nástupnické archivní dokumenty a nové verze uživatelských dokumentů) je motivována primárně technickými omezeními, nikoliv komerčním záměrem. Předmětem identifikace v systému ČIDLO z těchto důvodů proto není obsah a forma (formát) digitalizovaného dokumentu, ale pouze obsah, tj. obraz fyzické předlohy. Fyzickou předlohou se rozumí předloha na úrovni provedení podle FRBR. To znamená, že na obrazové odlišnosti mezi jednotlivými exempláři fyzické předlohy se nehledí (tyto odlišnosti mohou být způsobeny například různým fyzickým stavem různých exemplářů nebo dodatečně přidanými prvky, jako je například razítko knihovny). Tato volba zohledňuje v prvé řadě hledisko uživatele dokumentu. Uživatel má v tomto případě možnost získat přístup k témuž obsahu, bez ohledu na to, zda jde o původní archivní dokument nebo nástupnický archivní dokument, nebo různé verze uživatelského dokumentu. Taktéž uživatele nezajímají odlišnosti jednotlivých exemplářů, které jsou výsledkem degradace nebo zacházení s exemplářem v knihovně od doby jeho vytištění.. Tato volba je též výhodná pro správu dokumentů, protože umožňuje na základě identifikátoru URN:NBN propojit archivní a uživatelský dokument s tímtéž obsahem, nebo původní archivní dokument a nástupnické archivní dokumenty v digitálním repozitáři. Pro identifikaci různých verzí dokumentu lze využít jiné identifikátory (např. UUID). Tyto jiné identifikátory uživatele nezajímají, protože neidentifikují obsah. Nicméně tyto jiné identifikátory lze ve spojení s identifikátorem URN:NBN využít ke koordinaci správy dokumentů s tímtéž obsahem, které jsou uloženy v různých systémech. Stejnou tištěnou předlohu může zdigitalizovat více institucí. Ačkoliv obraz bude stejný, jeho vlastník bude odlišný. Pro uživatele znamená jiný vlastník jiná přístupová omezení a informaci o odpovědnosti za kvalitu digitalizace. Totéž platí v případě, že stejný vlastník zdigitalizuje tutéž entitu v rámci jiných projektů. V takovém případě sice bude obraz i vlastník stejný, ale digitalizace může probíhat podle jiných pravidel (např. podle budoucích

standardů digitalizace NDK), což může mít opět vliv na kvalitu obrazu. Je tedy užitečné tyto odlišnosti zaznamenat užitím jiného identifikátoru URN:NBN. Z praktického hlediska by navíc mohlo být velmi obtížné využít pro identifikaci již přidělený identifikátor - vyžadovalo by dohledávání původního identifikátoru, což by mohlo značně zdržovat produkci. Volba přidělit identifikátor již při produkci digitalizovaného dokumentu je nevyhnutelná - po produkci se různé verze téhož dokumentu odesílají do různých systémů a pozdější identifikace se tím stává prakticky vyloučenou. Identifikovaný dokument musí splňovat tyto požadavky: a) trvalá hodnota a význam dokumentu z hlediska digitálního kulturního dědictví, jde primárně o dokumenty textové povahy (po konzultaci s kurátorem resolveru), b) ucelenost dokumentu (smysluplný a samostatný informační celek) a. základní typy ucelených dokumentů: monografie, články / čísla / ročníky seriálu (ne tituly seriálů), mapy, hudebniny, vysokoškolské závěrečně práce, případné další typy pouze po konzultaci s kurátorem resolveru, c) existence samostatných bibliografických a technických metadat vztahujících se právě k tomuto dokumentu, d) přiměřenost rozsahu dokumentu (např. nikoliv celá sbírka dokumentů, nikoliv jedna stránka vícestránkové dokumentu apod.), e) neměnnost obsahu dokumentu (statický dokument).

6. SYSTÉM ČIDLO ČIDLO je systém pro trvalou identifikaci digitálních dokumentů českého kulturního dědictví, který využívá standard URN:NBN a je řízen Národní knihovnou ČR, která tento systém spravuje a koordinuje ve spolupráci s dalšími institucemi, přičemž tato spolupráce je nezbytnou podmínkou úspěšného fungování celého systému. ČIDLO slouží jednak knihovnám a dalším institucím z oblasti českého kulturního dědictví, a to pro jejich potřeby trvalé identifikace jejich digitálních dokumentů (procesy dlouhodobé správy, archivace a zpřístupňování digitálních dokumentů), jednak uživatelům, a to jako prostředek pro zajištění trvalého zpřístupňování digitálních dokumentů v internetové síti (řešení problému nestability a proměnlivosti URL adres tím, že resolver nabízí přesměrovávací služby) nebo jako prostředek pro zajištění důvěryhodnosti citační praxe (řešení problému ověřování autenticity citovaných dokumentů). ČIDLO se skládá z pravidel, technických podsystémů (zejména resolver, API, OAI- PMH data provider), zapojených institucí a jejich pověřených zaměstnanců, identifikátorů URN:NBN pro český jmenný prostor (tj. identifikátorů začínajících řetězcem urn:nbn:cz ) a k nim přidružených metadat. Roli centrální autority vykonává v souladu se standardem URN:NBN výlučně Národní knihovna ČR jakožto centrální autorita pro Českou republiku. Jádrem fungování systému ČIDLO je databáze obsahující identifikátory URN:NBN a identifikátorová metadata a resolver zajišťující přesměrování na aktuální umístění identifikovaného dokumentu. Problémem, který systémy trvalé identifikace řeší, je také skutečnost, že digitální dokumenty často přestanou být dostupné online. Pak již je obtížné ověřit, zda daný dokument někdy existoval, což může narušovat důvěryhodnost citační praxe. Právě v podpoře důvěryhodnosti citací digitálních dokumentů spočívá jedna z funkcí systému ČIDLO. I v případě smazání identifikovaného dokumentu z digitální knihovny, což by se teoreticky nemělo nikdy stát, ale stává se, zůstane záznam v systému a vždy tak budou dohledatelné informace o dokumentu (identifikátorová metadata), který byl citován. 6.1 Resolver Resolver je aplikace, která zajišťuje a) přidělování a správu jednoznačných unikátních perzistentních identifikátorů založených na standardu URN:NBN v českém prostředí,

b) trvalé udržování databáze identifikátorů, identifikátorových metadat a URL adres (metadata udržuje i v případě zaniknutí nebo on-line nedostupnosti vlastního identifikovaného dokumentu) c) poskytování a registrování metadat vázaných k identifikátorům, d) přesměrovávání na aktuální URL adresy digitálních dokumentů do digitálních knihoven odpovědných za zpřístupňování daných dokumentů, e) sklízení aktuálních URL adres z daných digitálních knihoven ve spolupráci s těmito knihovnami, f) komunikační rozhraní pro přidělování identifikátorů a získávání metadat k nim vázaných od registrátora (REST pro automatizované přidělování, webové rozhraní pro manuální přidělování) a sklízení aktuální URL adres dokumentů (OAI-PMH) v součinnosti s danou digitální knihovnou, g) správu uživatelských účtů (zpravidla jeden uživatel z dané instituce spravuje účet registrátora).

7. PODMÍNKY ÚČASTI V SYSTÉMU ČIDLO Registrátorem s právem spravovat svůj jmenný prostor a přidělovat svým digitálním dokumentům identifikátory URN:NBN se může stát každá knihovna registrovaná v ADR a dále každá další instituce spravující knižní fond nebo fond podobné povahy (kartografické dokumenty, hudebniny, šedá literatura). Registrátorem tedy může být každá instituce s patřičnými kompetencemi v oblasti správy a zpřístupňování digitálních dokumentů v rozsahu popsaných fondů. V případě, že je instituce digitalizující své fyzické předlohy vázána povinností ukládat své digitalizované dokumenty do LTP NK ČR, nebo má záměr je zde ukládat, pak pro ni platí povinnost řídit se standardy digitalizace NDK. Od verze standardů digitalizace NDK (verze 1.5 pro periodika a 1.1 pro monografie) je zavedena povinnost nechat si přidělit identifikátor URN:NBN, což znamená, že se automaticky stává způsobilou pro účast v systému ČIDLO. V tomto případě je instituce povinna dodržovat pravidla představená v této metodice. Každá další instituce se může stát registrátorem (i v případě, že není knihovnou) pokud ji nevylučují následující omezení. Skutečnosti, které vylučují možnost stát se registrátorem: - žadatel není vlastníkem digitalizovaného dokumentu, - žadatel není instituce z oblasti správy kulturního nebo vědeckého dědictví nebo podobné oblasti, - fyzická předloha digitalizovaného dokumentu není bohemikum (pro potřeby systému ČIDLO je bohemikum vymezeno jako takové knižní dílo nebo dílo ve správě knihoven, které má souvislost s českou kulturou a územím a to i kdyby se jednalo o souvislost vzniklou místem uložení; v případech pochybností rozhoduje kurátor), - digitalizovaný dokument nemá trvalou hodnotu a význam z hlediska českého národního dědictví (v případě nejasností ohledně určení tohoto kritéria rozhodují stanoviska kurátora služby ČIDLO), - obsah digitalizovaného dokumentu není určen k zpřístupňování široké veřejnosti (tajné materiály, průmyslová dokumentace atd.), - žadatel nemá záměr digitalizovaný dokument dlouhodobě uchovávat, - žadatel nemá záměr digitalizovaný dokument zpřístupňovat uživatelům na nekomerční bázi prostřednictvím internetové sítě.

Žadatel, kterého se výše uvedené skutečnosti netýkají, se může stát registrátorem, pokud se zaváže plnit následující podmínky: - bude vytvářet své digitalizované dokumenty na základě aktuální verze standardů digitalizace NDK nebo bude převádět své nestandardní dokumenty do podoby odpovídající schválené verzi standardů digitalizace NDK, - v případě, že své digitalizované dokumenty nebude vytvářet podle standardů digitalizace NDK, je zapojení i tak možné, pokud bude schopen odevzdávat minimálně požadovaný rozsah metadat. (Tato metodika primárně předpokládá, že digitalizované dokumenty budou vznikat podle standardů digitalizace NDK a pro tyto je také nastavena), - bude dodržovat postupy stanovené touto metodikou, - zajistí si technické a další prostředky pro komunikaci s resolverem, - bude své dokumenty zpřístupňovat pomocí digitální knihovny - digitální knihovna, ve které budou zpřístupňovány digitalizované dokumenty, bude disponovat protokolem OAI-PMH pro sklízení metadat, - zajistí uchování dokumentů, musí se zaručit, že identifikovaný dokument nesmaže. Podmínka vytvářet digitalizované dokumenty podle standardů digitalizace NDK znamená, že systém ČIDLO je určen primárně pro identifikaci nově vznikajících digitalizovaných dokumentů. Současně však je možné identifikovat nestandardní dokumenty, a to v procesu jejich převodu do podoby podle standardů digitalizace NDK nebo pokud jejich podoba bude odpovídat minimálním požadavkům této metodiky a dokumenty budou splňovat nároky na dlouhodobé uložení.

8. MODEL ROLÍ A ODPOVĚDNOSTÍ V SYSTÉMU ČIDLO Účastníky systému ČIDLO jsou registrátoři a centrální autorita. Centrální autorita je správcem systému ČIDLO a přiděluje identifikátory URN:NBN. Registrátor je instituce, která je vlastníkem digitalizovaného dokumentu. Centrální autorita přiděluje registrátorovi identifikátory URN:NBN. Centrální autoritu představuje Národní knihovna ČR. Jejím zástupcem je kurátor systému ČIDLO (dále jen kurátor). Registrátor může být zastupován digitalizační firmou či jinou institucí, pokud ji registrátor zmocní. Identifikátory URN:NBN jsou užívány v následujících systémech: resolver, digitalizační systém (systém pro produkci digitalizovaných dokumentů), katalog, digitální repozitář, digitální knihovna. Resolver je online aplikace, kterou provozuje centrální autorita. Hlavní úlohou resolveru je přidělování a správa identifikátorů URN:NBN a přesměrovávání z identifikátoru URN:NBN na aktuální URL adresu do digitální knihovny, ve které je identifikovaný dokument zpřístupňován. Pro účely testování poskytuje centrální autorita registrátorům možnost využít testovací resolver. Identifikátory URN:NBN, které lze užít k identifikaci dokumentů, však musejí být vždy přidělovány produkčním resolverem. Katalogem se rozumí elektronický, zpravidla online dostupný (OPAC) katalog registrátora, ve kterém mohou být odkazy na jeho digitalizované dokumenty (digitální instance). K odkazování na tyto dokumenty by měl být využit identifikátor URN:NBN. Metodika využití identifikátorů URN:NBN v katalogu nevyžaduje, pouze doporučuje. Registrátor musí své digitalizované dokumenty vlastními silami nebo prostřednictvím služby jiné instituce dlouhodobě uchovávat v digitálním repozitáři a zpřístupňovat v digitální knihovně, nebo mít alespoň záměr vykonávat tyto aktivity v budoucnosti. Registrátor může být sám provozovatelem digitálního repozitáře a digitální knihovny, pokud tomu tak není, musí mít dohodu s jinými institucemi, jejichž digitální repozitář a digitální knihovnu bude využívat k dlouhodobému uchovávání, resp. zpřístupňování svých digitalizovaných dokumentů. Registrátor musí dodržovat pravidla stanovená touto metodikou. (V případě, že má dohodu s jinými institucemi provozujícími digitální repozitář a digitální knihovnu, musí tyto instituce seznámit s pravidly metodiky a dohodnout s nimi jejich dodržování). Instituce, která ve svém repozitáři uchovává svěřené digitalizované dokumenty, vystupuje v systému ČIDLO v roli Archivátora.

Digitalizační systém může provozovat sám registrátor, nebo jeho zástupce (digitalizační firma). Digitalizační systém musí být schopen komunikace s resolverem. Produkční resolver přiděluje identifikátory URN:NBN digitalizačnímu systému a získává od něj identifikátorová metadata. Digitalizační systém vykonává tyto funkce: - navazuje komunikaci s resolverem za účelem získání identifikátoru URN:NBN, - dodává do resolveru identifikátorová metadata, - zajišťuje zápis přiděleného identifikátoru URN:NBN do metadat digitalizovaného dokumentu. Tabulka 1: Role v systému ČIDLO Registrátor Centrální autorita Kurátor ČIDLO Archivátor Provozovatel digitální knihovny Instituce (nebo její část), která je vlastníkem digitálního dokumentu, kterému nechala přidělit identifikátor URN:NBN, nebo která plánuje toto přidělení. Ve většině případů platí, že 1 instituce = 1 registrátor. Registrátor může současně zastávat funkci archivátora nebo provozovatele digitální knihovny. Centrální autoritou v systému ČIDLO je Národní knihovna ČR. Součástí centrální autority jsou zaměstnanci podílející se na jeho provozu, zejména kurátor resolveru a technický správce resolveru, softwarové řešení (resolver) a technické a organizační zajištění. Role zaměstnance centrální autority, který spravuje obsahovou část resolveru a zajišťuje koordinační knihovnické služby spojené se systémem ČIDLO. Mezi ně patří: rozhodnutí, jaké dokumenty spadají do českého kulturního dědictví, volba kódů pro registrátory, dohody s registrátory, dohody o účasti na systému ČIDLO, poskytování konzultací registrátorům, koordinace postupu registrace registrátorů, aktualizace a urgence údajů od účastníků systémů apod. Email: urnnbn@nkp.cz Provozovatel digitálního repozitáře, ve které jsou archivovány digitální dokumenty označené identifikátorem URN:NBN v systému ČIDLO. Archivátorem může být sám registrátor, nebo tuto roli může vykonávat jiná instituce na základě dohody s registrátorem. Role instituce v systému, která zajišťuje zpřístupňování dokumentů s identifikátorem URN:NBN. Katalog OPAC, katalog registrátora.

8.1 Návod pro zápis URN:NBN identifikátorů do elektronického katalogu V případě využití identifikátoru URN:NBN v elektronickém katalogu je třeba dodržovat jeden z doporučených zápisů podle pravidel AACR2, případně podle chronologicky mladších pravidel užívaných v ČR. Identifikátor URN:NBN by měl být zanesen do katalogu k bibliografickému záznamu předlohy digitálního dokumentu. Zápis identifikátoru se řídí katalogizačními pravidly AACR2 a je zapisován dle kódovníku MARC 21. Pro zápis identifikátoru URN:NBN jsou určena pole 024 a 856. Primární je pole 024. Pole 024 Nastavení indikátorů: První indikátor: lze nastavit indikátor 7, v případě nutnosti může být použit i indikátor 8. Druhý indikátor: typicky bude nastavena hodnota # V případě nastavení prvního indikátoru 7, musí následovat podpole 2 (odkaz na číselník s dalšími identifikátory včetně URN:NBN). Dále je třeba využít podpole a, do kterého se zapisuje vlastní kód či standardní číslo, nyní tedy URN:NBN. Př. 024 7# $a urn:nbn:cz:nk001-0004su $2 urn Pole 856 První indikátor: Standardně by měl být vyplněn ukazatel 4, případně je přípustný, byť neodpovídající, #. Druhý indikátor: Měl by být nastaven na hodnotu 1, případně je přípustný, byť opět neodpovídající, indikátor #. Podpole: lze užít jen podpole u. Př. 856 41 $u https://resolver.nkp.cz/urn:nbn:cz:nk-0004su Doporučení pro zápis do OPAC lze beze zbytku využít pro identifikaci digitalizovaných monografií a jejich svazků. Pokud by měl být využit i v případě seriálů, je nutné, aby konkrétní registrátoři konzultovali s kurátorem systému, jakou úroveň chtějí odkazovat. V takovém případě lze využít i šablonu PERIODICAL (viz kapitola 11).

9. PŘEDMĚT IDENTIFIKACE Systém ČIDLO je určen pro identifikaci digitalizovaných dokumentů. Digitalizovaný dokument je množina souborů v určitém formátu, která jako celek, spolu se strukturálními, administrativními a popisnými metadaty, tvoří při zobrazení v příslušné aplikaci (např. internetový prohlížeč) obraz celé tištěné předlohy včetně zachování posloupnosti stran. Tištěnou předlohou se rozumí předloha na úrovni provedení podle FRBR. To znamená, že na obrazové odlišnosti mezi jednotlivými exempláři téže tištěné předlohy (např. exempláři jednoho vydání knihy) se nehledí. Strukturální metadata popisují vztahy mezi jednotlivými soubory, z nichž se skládá digitalizovaný dokument, a vztah těchto souborů k jednotlivým částem tištěné předlohy. Digitalizovaný dokument vznikl jako konečný výstup skenování tištěné předlohy v rámci jednoho digitalizačního projektu (tj. skenování tištěných předloh a jejich zpracování podle konkrétní specifikace datových a metadatových formátů) a je vlastněn jedním vlastníkem (instituce, která je vlastníkem exempláře tištěné předlohy). Odlišují se dvě verze digitalizovaného dokumentu - archivní dokument a uživatelský dokument. Archivní i uživatelský dokument mají tentýž obsah (obraz tištěné předlohy), vlastníka a původ (vznikly v rámci téže produkce), mohou se lišit pouze konkrétním obrazovým formátem nebo např. použitým kompresním poměrem v rámci jednoho formátu. Archivní dokument je tvořen archivními kopiemi (tj. soubory v takovém konkrétním grafickém formátu, který je vhodný pro dlouhodobé uchování v digitálním úložišti) a odpovídajícími strukturálními metadaty. Uživatelský dokument je tvořen uživatelskými kopiemi (tj. soubory v takovém konkrétním grafickém formátu, který je vhodný pro zpřístupňování uživatelům v digitální knihovně). Archivní dokument ve formátu, ve kterém byl vytvořen při produkci, se nazývá původní archivní dokument. Tento původní archivní dokument je následně dodán do digitálního repozitáře, kde se posléze stává součástí první verze balíčku AIP. V budoucnosti dojde v digitálním úložišti k tomu, že za účelem dlouhodobého uchovávání bude původní archivní dokument převeden v rámci formátové migrace do nového formátu a uložen jako součást nové verze balíčku AIP. Takto vzniklý archivní dokument se nazývá nástupnický archivní dokument (první generace). Tento proces se může později opakovat a budou vznikat nové nástupnické archivní dokumenty mladších generací, uložené v dalších nových verzích balíčku AIP. Aktuálním archivním dokumentem se nazývá takový,

který je obsažen v současné nejnovější verzi balíčku AIP (může jím tedy být buď původní archivní dokument, nebo nástupnický archivní dokument jakékoliv generace). Uživatelský dokument ve formátu, ve kterém byl vytvořen při produkci, se nazývá původní uživatelský dokument. Původní uživatelský dokument je následně dodán do digitální knihovny, kde je uložen a zpřístupňován uživatelům. Konkrétní URL adresa, ze které může uživatel získat přístup k celému uživatelskému dokumentu, se nazývá digitální instance. Na této adrese jsou zpravidla uvedena bibliografická metadata popisující obsah uživatelského dokumentu a odkazy na jednotlivé části uživatelského dokumentu (obrázky), jejichž postupným prohlížením může uživatel získat obraz celé tištěné předlohy. V budoucnosti může dojít k tomu, že z důvodu změny uživatelských požadavků bude digitální úložiště požádáno, aby formátovou migrací vytvořilo novou verzi uživatelského dokumentu z aktuálního archivního dokumentu. Tato nová verze uživatelského dokumentu, odvozená formátovou migrací z aktuálního archivního dokumentu, se nazývá nástupnický uživatelský dokument. Digitální knihovna může navíc sama, podle svého uvážení, vytvářet další verze uživatelského dokumentu formátovou migrací z původního uživatelského dokumentu nebo z nástupnického uživatelského dokumentu. Všechny takové verze se souhrnně označují jako jiné verze uživatelského dokumentu. Tyto verze nejsou původním uživatelským dokumentem, protože nebyly vytvořeny při produkci, ani nástupnickým uživatelským dokumentem, protože nebyly vytvořeny formátovou migrací v digitálním úložišti. 9.1 Model dokumentu v systému ČIDLO Model identifikovaného dokumentu je založen na triadickém systému: intelektuální entita digitální reprezentace/dokument digitální instance. 9.1.1 Intelektuální entita Intelektuální entita je jednotka intelektuálního obsahu, která je jako jedna jednotka zpracovávána v informačních procesech (katalogizace, správa, zpřístupňování, archivace apod.). V případě digitalizovaných dokumentů je intelektuální entitou vždy tištěná předloha na úrovni provedení (nebo jeho části).

Závazná pravidla: registrátor musí být schopen k této jednotce intelektuálního obsahu dodat bibliografické informace, které popisují právě tuto jednotku (nikoliv jen její část, nikoliv jen celek, jehož je součástí) o tyto informace musí povinně obsahovat alespoň název intelektuální entita představuje smysluplný informační celek o vyloučeny jsou příliš malé (např. stránka knihy 5 ) nebo velké části (např. sbírka knih) o možností zpracování je kapitola či článek (analytikum) viz příspěvek ve sborníku takové části musejí být vždy samostatně popsány (bibliografický popis) a samostatně zpřístupňovány intelektuální entita představuje neměnný informační celek o vyloučeny jsou dynamické celky (jako např. webové stránky platí pro možné uplatnění v budoucnosti pro digitálně vzniklé dokumenty) intelektuální entita v případě digitalizovaných dokumentů je vždy takový obsah (braz tištěné předlohy), který je stejný na úrovni provedení (manifestation) podle modelu FRBR 6 o odlišnosti v rámci jednotlivých exemplářů (jednotek podle FRBR) se neberou v potaz výjimka specifický exemplář (např. opatřený textovým komentářem vlastníka exempláře vepsaným do knihy filozofická kniha opatřená poznámkami T. G. Masaryka), pokud je specificky popsán bibliografickými metadaty intelektuální entita musí představovat informační celek, který má trvalou hodnotu a význam ( lasting value and significance - definice digitálního dědictví podle organizace UNESCO 7 ) o vyloučeny jsou typy intelektuálních entit, které se podle obecného mínění nepovažují za kulturní dědictví (např. referáty na VŠ, učební pomůcky apod.) intelektuální entita má vždy samostatná bibliografická metadata. 5 Jiný případ samozřejmě je, pokud jedna stránka reprezentuje např. jednu povídku (viz např. Borgesovy povídky) 6 http://www.ifla.org/files/cataloguing/frbr/frbr_2008.pdf [citováno 2014-09-25] 7 http://unesdoc.unesco.org/images/0013/001331/133171e.pdf#page=80. Citováno [2017-09-25]

9.1.2 Digitální reprezentace/ dokument Digitální reprezentace je definována jako jeden nebo více počítačových souborů, které digitálně reprezentují jednu intelektuální entitu. Signifikantní vlastnosti digitálního dokumentu jsou: a) vlastník, b) existence samostatných technických metadat, c) původ (digitalizační projekt), d) dědění bibliografických metadat po intelektuální entitě. Primární verzí digitálního dokumentu je vždy jeho archivní verze, tedy archivní dokument. Všechny ostatní verze (verze vzniklé formátovou migrací, uživatelské dokumenty) se považují za autentické, pokud vizuálně reprezentují tentýž obraz tištěné předlohy, mají téhož vlastníka a tentýž původ (stejná digitalizace). Typicky bude existovat u jednoho registrátora právě jeden dig. dokument reprezentující IE. Každý digitální dokument má přiřazeno právě jedno URN:NBN. Je registrován právě jedním Registrátorem a archivován alespoň jedním Archivátorem. Digitální dokument je tím, co je identifikováno systémem ČIDLO, nikoli Intelektuální entita. Identifikátor musí být přidělen v závěrečné fázi vzniku digitálního dokumentu. 9.1.3 Digitální instance stránky. Digitální instance je lokalizace digitálního dokumentu prostřednictvím tzv. vstupní Signifikantní vlastnosti digitální instance jsou: 1. vstupní stránka, která se vyznačuje: a) jedním URL, na němž jsou: b) přístupná bibliografická, volitelně i technická metadata k uživatelskému dokumentu, c) přístupné odkazy na jeden nebo více verzí uživatelského dokumentu, 2. v rámci jedné digitální knihovny existuje pouze jedna vstupní stránka. K jedné digitální reprezentaci může existovat variabilní počet digitálních instancí. Pokud dojde k digitalizaci téže intelektuální entity dvěma či více institucemi, pak na základě rozpoznání vlastníka jako signifikantní hodnoty v popisu dokumentu vznikne více záznamů digitálních dokumentů. U každého dokumentu budou uvedeny všechny možné digitální instance, tzn. všechny lokace, na kterých bude daný dokument s daným identifikátorem dostupný.

Příklad: Pokud NK ČR zdigitalizuje určitý titul a na základě právní dohody ho poskytne Moravské zemské knihovně, aby ho zpřístupnila ve své digitální knihovně (bude tak i nadále označen pomocí URN:NBN identifikátoru s kódem nk), tak v resolveru budou dostupné dvě digitální instance připojené k jednomu záznamu dokumentu. Pokud však MZK a NK ČR zdigitalizují tentýž titul (tedy duplicitně), budou přiděleny dva URN:NBN identifikátory, záznam dokumentu bude v resolveru vložen dvakrát a ke každému bude připojena jedna digitální instance. 9.1.4 Vzájemné vztahy Jedna intelektuální entita může být reprezentována jak pouze jedním digitálním dokumentem, tak více digitálními dokumenty. Jeden digitální dokument musí být lokalizován prostřednictvím jedné nebo více digitálních instancí. Obrázek 3: Popis vztahů mezi intelektuální entitou a digitální reprezentací. 9.1.5 Datový model Z výše popsaného modelu dokumentu vychází i datový model systému ČIDLO, kdy jádrem celého systému je digitální reprezentace v rámci terminologie systému ČIDLO označovaná jako digitální dokument (digitaldocument). Digitální dokument je registrátorem registrován a je mu přidělen URN:NBN identifikátor. Ten označuje konkrétní množinu počítačových souborů. Identifikátor URN:NBN slouží k identifikaci digitálních dokumentů, nikoliv jejich analogových předloh. Pokud z jednoho titulu budou vytvořeny dva zdánlivě identické digitální dokumenty (stejná obrazová data), ale jejich producenty budou jiní vlastníci, jsou v tomto pojetí chápány jako dva odlišné dokumenty (mezi signifikantní vlastnosti patří vlastník, který je odvozen od vlastníka předlohy). Bibliografický popis tedy zůstává na úrovni intelektuální entity, zatímco technická

metadata, vlastní identifikátor a administrativní popis se vážou k digitální reprezentaci (dokumentu). Koncepční model vztahů mezi základními objekty je zobrazen na obrázku č. 4. Obrázek 4: Koncepční model objektů v systému ČIDLO..

Všechny databázové tabulky a vztahy mezi nimi zobrazuje fyzický model na obrázku č. 5. Obrázek 5: Vztahy mezi tabulkami v databázi. 9.2 Vznik a struktura digitalizovaného dokumentu Digitalizovaný dokument musí mít podobu, definovanou ve standardech digitalizace NDK. Zejména to znamená, že musí používat: a) zde definovanou metadatovou specifikaci (vybrané položky konkrétních metadatových formátů), b) doporučení pro datové formáty (specifikace formátu JP2 pro archivní a uživatelské kopie), c) strukturální metadata d) obsah digitalizovaných dokumentů musí odpovídat stanoveným základním intelektuálním entitám (monografie, periodikum apod.), resp. jejich povolené granularitě (vyšší / nižší intelektuální entita; např. článek periodika, kapitola monografie).