Persistentní identifikátory pro NUŠL rozhodovací kritéria



Podobné dokumenty
Persistentní identifikátory pro NUŠL rozhodovací kritéria

Persistentní identifikátory pro NUŠL rozhodovací kritéria

Stav implementace perzistentních identifikátorů v NK ČR a výhled do budoucna. Jan Hutař Marek Melichar Ladislav Cubr

Digitální konkordance a Registr digitalizace v Manuscriptoriu,

Jak na CrossRef, DOI, CrossCheck, OJS a další? Lenka Němečková Věra Pilecká Ústřední knihovna ČVUT

Autor. Potřeba aplikací sdílet a udržovat informace o službách, uživatelích nebo jiných objektech

TECHNICKÁ SPECIFIKACE VEŘEJNÉ ZAKÁZKY

The bridge to knowledge 28/05/09

RD.CZ : EVIDENCE DIGITALIZOVANÝCH DOKUMENTŮ A SLEDOVÁNÍ PROCESU ZPRACOVÁNÍ

Návod k požadavkům ISO 9001:2015 na dokumentované informace

Co nového ve spisové službě? Národní standard pro elektronické systémy spisové služby a jeho optimalizace

Seminář pro vedoucí knihoven asviústavů AV ČR ASEP

OpenGrey. Petra Pejšová, NTK, ČR Christiane Stock, INIST-CNRS, Francie

1. Integrační koncept

Centrální depozitář cenných papírů v roli lokálního operátora pro poskytování LEI Způsob poskytovaní služby

Zpráva o zhotoveném plnění

OpenGrey. Petra Pejšová, NTK, ČR Christiane Stock, INIST-CNRS, Francie. Digitálná knižnica 2012, dubna 2012 Jasná pod Chopkom

Příloha: Dodatečné informace, včetně přesného znění žádosti dodavatele o dodatečné informace

Podrobná analýza k aktivitě č. 3 - implementace procesního řízení do praxe úřadu

Obsah. Zpracoval:

PŘÍLOHA C Požadavky na Dokumentaci

Správa VF XML DTM DMVS Datový model a ontologický popis

Národní technické specifikace. služeb nad prostorovými daty a metadaty

Technická dokumentace

Ředitel odboru archivní správy a spisové služby PhDr. Jiří ÚLOVEC v. r.

(2) Zásady bezpečnostní politiky jsou rozpracovány v návrhu bezpečnosti informačního systému

Seminář pro vedoucí knihoven a SVI ústavů AV ČR

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

Virtuální depozitní knihovna Nástroj pro doplňování bohemikálních konzervačních sbírek. Tomáš Foltýn & Jiří Polišenský & Radek Nepraš

Logický datový model VF XML DTM DMVS

Technologická centra krajů a ORP

Katalog služeb a procesů města Sokolov A. Popis současné praxe práce s procesy B. Vytvoření a implementace Katalogu služeb a procesů města Sokolov

Vykazování dat o poskytovaných sociálních službách

Vykazování dat o poskytovaných sociálních službách

Semináˇr Java X J2EE Semináˇr Java X p.1/23

Úvod do informatiky 5)

2014 Dostupný z Licence Creative Commons Uveďte autora-zachovejte licenci 4.0 Mezinárodní

Základní informace: vysoce komfortnímu prostředí je možné se systémem CP Recorder efektivně pracovat prakticky okamžitě po krátké zaškolení.

XML jako prostředek pro citování informačních zdrojů

Standardy publikace a katalogizace otevřených dat. Dušan Chlapek David Hemala

Specifikace rozhraní. Oznamovací povinnost podle zákona č. 307/2013 Sb., ve znění pozdějších předpisů. Martin Falc, SW architekt.

Projekt Digitální knihovna pro šedou literaturu po prvním roce řešení

NOVINKY, NÁSTROJE A INFORMAČNÍ ZDROJE V APLIKACI CRIBIS

Digitální technická mapa ČR Architektura CAGI

Tieto Future Office. Přehled. Země: Česká republika. Odvětví: Samospráva

local content in a Europeana cloud

Průzkumník IS DP. Návod k obsluze informačního systému o datových prvcích (IS DP) vypracovala společnost ASD Software, s. r. o.

Máte to? Summon jako základní vyhledávací nástroj NTK

Integrovaná střední škola, Sokolnice 496

Digitální mapa veřejné správy

Novinky v ASEPu a zkušenosti s vkládáním plných textů

Automatizovatelná aktualizace Wikidata z veřejných databází. Jakub Klímek

Digitální mapa veřejné správy v kontextu nové politiky státu v oblasti prostorových dat

UŽIVATELSKÁ PŘÍRUČKA K INTERNETOVÉ VERZI REGISTRU SČÍTACÍCH OBVODŮ A BUDOV (irso 4.x) VERZE 1.0

Máte to? - Summon jako základní vyhledávací nástroj NTK

Primo Central. Martin Vojnar MULTIDATA Praha s.r.o.

Klíčem je mobilní smartphone

GS1 GDSN. Globální datová synchronizace

Dnešní téma. Identifikační metadata VOŠIS UIM 13 1

Přenos VŠKP pomocí protokolu OAI-PMH. 1. OAI-PMH The Open Archives Initiative Protocol for Metadata Harvesting

Principy fungování WWW serverů a browserů. Internetové publikování

Lenka Maixnerová, Filip Kříž, Ondřej Horsák, Helena Bouzková

Škola. Číslo projektu. Datum tvorby 12. září 2013

Personální evidence zaměstnanců

Po ukončení tohoto kurzu budete schopni:

Rada Evropské unie Brusel 19. září 2017 (OR. en) Č. předchozího dokumentu: 8419/17 Návrh závěrů Rady o identifikátoru evropské legislativy

CZ.1.07/1.5.00/

Projekt NUŠL a další projekty v ČR

Webové informační systémy Ing. Jiří Šilha, LANius s.r.o.

Nejčastější dotazy k Základním pravidlům pro zpracování archiválií, verze Dotazy na aplikaci Základních pravidel

SK01-KA O1 Analýza potřeb. Shrnutí. tým BCIME

VYHLÁŠKA. č. 18/2014 Sb., o stanovení podmínek postupu při elektronické dražbě. ze dne 24. ledna 2014

Aplikační software III. ročník. Archivace dat. Praha březen Zpracoval: Ing. Pavel Branšovský. pro potřebu VOŠ a SŠSE

FV systémy a jejich QM Základní dokument FV systému

MBI - technologická realizace modelu

Výtisk č.: Počet listů 19. Přílohy: 0 ÚZIS ČR. Role žadatel - postup

MANUÁL PRO KONTROLU NASTAVENÍ OPRÁVNĚNÍ PŘÍSTUPŮ K ÚDAJŮM ZÁKLADNÍCH REGISTRŮ

10 LET S ŠEDOU LITERATUROU NA UNIVERZITĚ TOMÁŠE BATI VE ZLÍNĚ

Klíčem je mobilní telefon

Digitální mapa veřejné správy. Portál DMVS a ÚKM

BISON. B udování a I mplementace S oftwarových O pen source N ástrojů, z. s.

Souhrn zásad dobré praxe pro aktéry v regionech

S M Ě R N I C E č. 6/2014 ministra financí

Nastavení provozního prostředí webového prohlížeče pro aplikaci

(Nelegislativní akty) NAŘÍZENÍ

EXTRAKT z mezinárodní normy

Pojmy internetu - test

Koncept řešení EOS EVIDENCE ORGANIZAČNÍ STRUKTURY

DATOVÁ ÚLOŽIŠTĚ. David Antoš CESNET

Registrační číslo projektu: CZ.1.07/1.5.00/ Elektronická podpora zkvalitnění výuky CZ.1.07 Vzděláním pro konkurenceschopnost

Příloha č. 1. Návrh aplikace pro správu a archivaci XML dokumentů Zpracoval: Ing. Jan Smolík, CSc

REGISTR CITES VE STÁTNÍ SPRÁVĚ. Duben 2009

Příprava IS na příchod GDPR se zaměřením na ISP. Jan Zahradníček AK Velíšek & Podpěra

Zásady ochrany osobních údajů

Přístupové body v systému DigiArchiv. Ing. Martin Hankovec, Státní oblastní archiv v Třeboni

Možnosti využití dat RÚIAN poskytovaných VDP pomocí webových služeb

Fyzická bezpečnost, organizační opatření. RNDr. Igor Čermák, CSc.

GIS Libereckého kraje

Transkript:

Persistentní identifikátory pro NUŠL rozhodovací kritéria Úvod Webové technologie otevřely obrovské možnosti v oblasti dostupnosti elektronických informací a způsobily tak revoluční změny ve způsobech, jak knihovny, archivy a jiní poskytovatelé informací mohou zpřístupňovat elektronické dokumenty různého druhu svým uživatelům. Digitální knihovny tak mohou poskytovat přístup k informacím v distribuovaném prostředí otevřené sítě, kde je v zásadě lhostejné, kde se informace nebo uživatel nacházejí, a to prostřednictvím relativně standardního software na straně poskytovatele i uživatele, kterému postačí webový prohlížeč. Distribuované digitální knihovny mají v tomto prostředí dva úkoly: - uchovávat a archivovat informace, - udržovat a pečovat o dostupnost těchto informací tak, aby je uživatelé nalezli, aby ukazatele či identifikátory směrovaly k dokumentům i po delší době. Úspěch digitální knihovny, zejména distribuované, je tak založen na dlouhodobě konzistentním propojení zdrojů a na trvanlivosti (persistenci) identifikátorů a směrníků, které tyto zdroje zpřístupňují. Tradičním ukazatelem, identifikátorem, směrníkem, linkem k informacím ve webovém prostředí je hyperlink URL (Uniform Resource Locator). Nicméně s časem se mnoho těchto linků přeruší, přestanou platit, nezpřístupňují původní zdroj. Důvody pro toto přerušené spojení mohou být: - informace, kterou link zpřístupňoval, byla z nejrůznějších důvodů odstraněna (pro vlastníka již nemá význam, nereflektuje současný stav věcí, není aktuální.) - soubor byl opět z různých důvodů přemístěn (reorganizace webu nebo souborové struktury, změna webové domény, změna vlastníka organizace ) Řešením těchto problémů jsou organizační opatření, minimalizující nebezpečí narušení ukazatelů, a zejména užití systému persistentních identifikátorů. Existuje několik takových systémů (Handle, URI, URN, DOI, OAI, PURL, NBN atd., viz dále). Je třeba podotknout, že systém persistentních identifikátorů sám o sobě nic nevyřeší, může být efektivní jen případě, že je udržován. Pokud je zdroj informací přemístěn, je třeba jeho nové umístění propojit s persistentním identifikátorem ve zvoleném systému, což obvykle zajišťuje databáze tzv. resolveru (úložiště persistentních identifikátorů, mapující je na aktuální úložiště informačních zdrojů). Organizace, která se rozhodne používat systém persistentních identifikátorů, se musí sama vnitřně rozhodnout takový systém plně podporovat, vytvořit pro něj organizační podmínky a na praktické úrovni si zodpovědět řadu otázek a vyřešit řadu úkolů. Hlavním úkolem je navrhnout samotný identifikátor, a jednou z hlavních otázek je, zda se organizace připojí k existující implementaci systému persistentních identifikátorů, nebo zda bude implementovat vlastní systém včetně resolveru. K návrhu identifikátoru a zodpovězení této otázky vede cesta přes řadu dílčích otázek, které tento dokument definuje. 1

Existuje několik vlastností, které musí splňovat systém pro perzistentní identifikátory, bez ohledu na druh materiálu. Jedinečnost Potřeba globální jedinečnosti bude zajištěna komponentou centrální autority přijatého systému.identifikátory musí být unikátní nejen v rámci digitálních zdrojů organizace, ale i celosvětově. Toho lze dosáhnout, když budou spojeny s názvem organizace nebo registrační centrální autority. Mnoho organizací používá hierarchických systémů pojmenování k dosažení jedinečnosti. Zajištění trvalosti = perzistence Organizace musí udržovat propojení aktuálního umístění zdroje na perzistentní identifikátor. Je důležité, aby zdroj identifikovaný perzistentním identifikátorem nebyl nikdy přesunut nebo odstraněn, aniž by došlo k aktualizaci informací o jeho umístění v registru perzistentních identifikátorů. Rozšiřitelnost Tento systém musí být rozšiřitelný a schopný zahrnout všechny zdroje, které požadují identifikátor. Flexibilita Identifikační systém bude mnohem efektivnější, pokud je schopen vyhovět specielním požadavkům pro různé typy materiálů nebo sbírek. Přístup jedna velikost pro všechny není vždy nejpraktičtější. Přiměřenou úroveň inteligence pro podporu procesů a systémů pro různá použití lze začlenit tam, kde je to užitečné, a vynechat ji v případě, kde to není účelné. Snadnost použití Přestože není absolutně nejdůležitější a nezbytná pro strojově generované perzistentní identifikátory, systém bude obecně úspěšnější, pokud je snadno pochopitelný a použitelný a pokud umožňuje snadné použití citací. Je tedy žádoucí pokud možno zabránit tvorbě dlouhých a nesrozumitelných identifikátorů, které lze tolerovat tehdy, pokud jsou určeny pouze pro interní potřebu nebo strojové zpracování. 2

Rozhodovací kritéria pro výběr perzistentního identifikátoru (PID) pro NUŠL Typ identifikátoru Perzistentní identifikátor může představovat buď náhodný výběr znaků bez jakýchkoliv souvislostí, které neobsahují žádné informace o objektu a určuje je náhodný řetězec znaků (anglicky dumb numer ). Nebo se může jednat o nějaký systém, který je vytvořen za účelem identifikace. Takovýto systém inteligentních identifikátorů může mít různou mírou složitosti a konkrétnosti. Obecně lze říci, že lidem se lépe pamatují a používají inteligentní identifikátory s vestavěnou mnemotechnikou než bezvýznamná posloupnost znaků, ale pro strojní zpracování je toto hledisko irelevantní. U inteligentních identifikátorů lze také snáze dosáhnout jedinečnosti, a to nejen mezi různými organizačními jednotkami, ale zejména globálně. Generování náhodných řetězců znaků musí být naopak pečlivě kontrolováno a sledováno v celé organizaci s cílem zajistit jedinečnost, kterou neřeší mimo organizaci. Inteligentní identifikátor může obsahovat relační informace, kdy menší komponenty jsou určeny odkazem na větší subjekty, nebo sbírky, kterých jsou součástí. Náhodný řetězec znaků ( dumb numer ) Inteligentní identifikátor Hierarchie Jedním z nejběžnějších použití inteligentních identifikátorů v knihovním světě je začlenění relačních informací, které zobrazují organizaci a hierarchie digitálních sbírek nebo agregátů. Menší složky, jako jsou digitální obrazy stránek nebo agregáty nižší úrovně, jsou identifikovány odkazem na větší sbírky nebo subjekty, ke kterým patří. Tato forma identifikace se hodí zejména pro digitální náhrady fyzických sbírek, i když se může také použít k zobrazení hierarchie digitální sbírky, jako jsou čísla časopisů a jejich články. Podporovat Nepodporovat Granularita (úroveň odkazu) Rozhodnutí o úrovni detailu odkazu, na které budou perzistentní identifikátory přidělovány, závisí na vnímání potřeb ukládaného materiálu. Granularita se bude lišit podle různých použití a materiálů. Pro mnohé potřeby vystačí citace prostřednictvím webové stránky nejvyšší úrovně, která slouží jako vstupní bod na sbírku webových souborů s vlastními odkazy, nebo odkazem na článek v časopise, či stránky nebo kapitoly v knize. Nicméně některá použití mohou vyžadovat jemnější úroveň detailů. Dokument Kapitoly Stránky 3

Verze Verze může být odlišná různými způsoby, může mít jiný obsah, jiný formát, nebo jiné rozlišení ve stejném formátu. Každá verze objektu, pokud sledujeme verze, vyžaduje samostatný perzistentní identifikátor. Vztah mezi verzemi může být vyjádřen v identifikátoru pomocí kódu verze nebo datováním verze nebo kódem typu verze nebo v metadatech. Je tedy nutné zvážit, zda a jak zaznamenávat vztahy mezi jednotlivými verzemi. Nesledovat verze Obsah Formát Rozlišení ve stejném formátu Zajišťující autorita Na zajišťující autoritě závisí nejdůležitější úkol pro úspěšný systém PID a to organizační zajištění. Zajišťující autorita garantuje perzistentnost identifikátoru, čímž na sebe bere zodpovědnost za jeho dlouhodobé přetrvání. Zajišťující autorita zajistí správu resolveru pro perzistentní identifikátory přidělování jedinečných PID a údržbu registru vztahů mezi PID a digitálními objekty a aktuálnost tohoto registru. Zajišťující autorita nemusí být specializovaná na šedou literaturu, ale musí být schopna zajistit vybrané schéma PID a jeho perzistentnost. Státní technická knihovna Národní knihovna České republiky Jiná Doporučení identifikátorů pro lokální úložiště Vzhledem k tomu, že cílem projektu jsou doporučení pro lokální úložiště šedé literatury, zahrnuli jsme tento cíl též do tohoto rozhodovacího dokumentu. Doporučení bude brát ohled na co nejjednodušší implementaci pro lokální úložiště ŠL a zajištění kompatibility s NUŠL. Sdílet identifikátory s NUŠL Vlastní jakékoliv identifikátory Vlastní identifikátory dle koncepce NUŠL Generování identifikátorů pro lokální úložiště Na doporučení identifikátorů pro lokální úložiště navazuje rozhodnutí o zajištění jejich generování, které bude vybráno v závislosti na zvoleném schématu a centrální autoritě. Dostane přidělen seznam Bude mít někde prostor pro generování Bude si muset nainstalovat SW pro generování 4

Dostupnost řešení Toto kritérium je důležité z hlediska harmonogramu projektu. Vybrané schéma perzistentního identifikátoru musí být dostupné včetně revolveru v závislosti na plánu implementace SW nejpozději do konce roku 2009. Ihned V průběhu roku 2009 Vyvíjené řešení.. Služby resolveru Hlavní funkcí resolveru je přidělování nových jedinečných PID a údržba registru vztahů mezi PID a digitálními objekty. Dále poskytuje resolver různé služby jako jsou vyhledání a dodání metadat nebo samotného dokumentu apod. Vyhledání platné url adresy Dodání metadat Dodání digitálního objektu Spolupráce s lokálními resolvery Finanční hledisko Z dlouhodobé perspektivy není možné ani opomenout finanční hledisko, které budeme zvažovat v rámci možností rozpočtu. Pořizovací náklady dále zdarma Pořizovací a udržovací náklady Pravidelné roční příspěvky Zdarma Finanční hledisko lokálních úložišť Pro lokální úložiště bude jistě finanční hledisko velmi důležité, proto jsme ho také zařadili do rozhodovacího dokumentu. Pořizovací náklady dále zdarma Pořizovací a udržovací náklady Pravidelné roční příspěvky Zdarma 5