INTEROPERABILITA TEI P5 / MARC 21 KATALOGIZACE HISTORICKÝCH DOKUMENTŮ Analýza projektu DRAFT 1.2 Autoři: Jaroslava Kašparová Tomáš Psohlavec Autoři dokumentu děkují za poskytnuté konzultace a cenné připomínky pracovnicím Národní knihovny Mgr. Editě Lichtenbergové a Mgr. Marii Balíkové. 1.12.2008-1/190 -
OBSAH 1 Úvod o dokumentu... 5 1.1 Účel... 5 1.2 Předpokládaný čtenář... 5 1.3 Termíny a konvence... 6 1.4 Zkratky... 12 1.5 Reference... 13 2 Knihovnické formáty a formáty XML... 14 2.1 Historické fondy a elektronická katalogizace ve světě... 14 2.1.1 Charakteristika knihovnických formátů a jejich vývoj... 14 2.2 TEI formát... 15 2.3 Historické fondy a elektronická katalogizace v ČR... 15 2.4 MARC21... 19 2.4.1 Vývoj MARCovských formátů (UNIMARC, MARC21)... 19 2.5 Formáty TEI... 21 2.5.1 TEI P4... 21 2.5.2 TEI P5... 21 3 Standardizace a interoperabilita katalogizace... 23 3.1 Koexistence, kompatibilita a konverze dat... 23 3.1.1 Konverze a převody dat v Evropě a ve světě... 23 3.1.2 Konverze a převody dat v ČR... 23 3.1.3 Konverze MARC TEI... 24 3.1.4 Konverze TEI MARC zkušenosti, příklady, problémy a úskalí... 24 3.2 Proč interoperabilita MARC21 a TEI P5?... 25 3.2.1 Přednosti katalogizačních postupů TEI a MARC21ve srovnání s jinými datovými formáty... 25 3.3 MANUSCRIPTORIUM digitální knihovna... 27 3.3.1 Vznik báze MANUSCRIPTORIUM jako souborné virtuální databáze historických fondů... 27 3.3.2 Standardy - MASTER a MASTERplus pro oblast rukopisů... 27 3.3.3 Zařazení dalších dokumentů do MANUSCRIPTORIA a rozšíření standardu TEI pro jiné dokumenty... 27 3.3.4 Současná koexistence dalších formátů v rámci interoperability MANUSCRIPTORIA... 28 3.4 Katalogizační praxe v oblasti historických fondů v ČR a ve světě... 28 3.4.1 Rukopisy... 28 3.4.2 Prvotisky... 29 3.4.3 Staré tisky 1501-1800... 30 3.4.4 Tisky 19. století a jiné kolekce vzácných tisků... 31 1.12.2008-2/190 -
3.4.5 Situace v Evropě a ve světě... 31 3.5 Výhody interoperability datových formátů z hlediska kooperace... 31 4 Analýza MARC formátů ve vztahu k TEI P5... 33 4.1 Hledisko druhů dokumentů... 33 4.1.1 Rukopisy... 33 4.1.2 Prvotisky... 40 4.1.3 Staré tisky 1501-1800... 48 4.1.4 Jiné tisky - kramářské písně, hudební libreta, školní dizertace... 67 4.2 Z hlediska způsobu popisu dokumentů... 69 4.2.1 Bibliografický a exemplářový popis dokumentů (MARC x TEI)... 69 4.3 Z hlediska formální povahy dokumentů... 69 4.3.1 Monografie... 69 4.3.2 Dokument o více svazcích a konvolut (špalíček)... 69 4.3.3 Časopisy, periodika... 72 4.3.4 Edice... 72 4.4 Autoritní databáze... 72 4.4.1 Soubor jmenných autorit... 72 4.4.2 Soubor autorit Autoři Knihopisu... 73 4.4.3 Soubor autoritních názvů starých měst (místo vydání)... 73 4.4.4 Soubor věcných autorit... 74 4.4.5 Bibliografická autoritní databáze (národní bibliografie, bibliografie tiskáren, autorů apod.)... 75 4.5 Správní systém... 76 4.5.1 Správní systém a MANUSCRIPTORUM... 77 4.5.2 Návrh zápisu správních a provozních informací v TEI P5 na základě interoperability s MARCovskými formáty... 77 5 Analýza interoperability TEI MARC21... 80 5.1 Přehled typu dat pro interoperabilitu... 81 5.2 Analýza průniku TEI MARC a návrh formuláře v TEI P5... 82 5.2.1 Druh dokumentu, Konspekt... 83 5.2.2 Jazyky... 84 5.2.3 Informace o vzniku... 86 5.2.4 Intelektuální a jiné odpovědnosti... 87 5.2.5 Názvové informace... 89 5.2.6 Rozsah a rozměry... 92 5.2.7 Vydání ( edition )... 93 5.2.8 Edice ( series )... 94 5.2.9 Přítisky... 95 5.2.10 Obsah bibliografické jednotky... 96 5.2.11 Způsob využívání msitems a mspart... 96 5.2.12 Typografický popis... 97 5.2.13 Výzdoba... 99 1.12.2008-3/190 -
5.2.14 Defektnost... 100 5.2.15 Citace literatury... 101 5.2.16 Věcné třídění... 101 5.2.17 Identifikace dokumentu... 104 5.2.18 Pozn.ámka k exempláři... 105 5.2.19 Vazba exempláře... 106 5.2.20 Historie exempláře... 107 5.2.21 Dostupnost, stav a historie pohybu exempláře... 108 5.2.22 Náhradní média... 109 5.2.23 Historie záznamu, status popisu, forma zpracování, zpracovatel... 110 6 Mapování vztahu TEI P5 a MARC21 a další perspektivy... 113 6.1 Průnik dat TEI a MARC21... 113 6.1.1 Editory pro katalogizaci historických dokumentů rukopisy a tisky.. 115 6.1.2 Výhledy mapování dalších druhů historických dokumentů... 115 6.2 Vztah metodiky řízené katalogizace (MARC21) a volné katalogizace TEI P5 116 Příloha 1: Knihovny ČR, ALEPH (verze 500)... 118 Příloha 2: Popisy rukopisů v MARC (ČR)... 119 Příloha 3: Popisy rukopisů MARC (svět)... 124 Příloha 4: Popisy prvotisků v MARC (ČR)... 136 Příloha 5: Popisy prvotisků v MARC (svět)... 144 Příloha 6: Popis starých tisků v MASTER a MARC (ČR)... 150 Příloha 7: Popisy starých tisků v MARC (svět)... 174 Příloha 8: Popisy tisků 19. století v MARC (ČR)... 177 Příloha 9: Popisy tisků 19. století v MARC (svět)... 181 Příloha 10: Příklady průniku TEI MARC (analýza)... 185 1.12.2008-4/190 -
1 Úvod o dokumentu 1.1 Účel Úkolem této analýzy je zjistit míru interoperability mezi klasickými knihovnickými systémy reprezentovanými formátem MARC21 a formáty XML zastoupenými formátem TEI v oblasti katalogizace historických a vzácných dokumentů (rukopisů, prvotisků, starých tisků, tisků 19. století a kramářských tisků). Bude se zabývat popisem a průnikem informací formátu TEI P5 a MARC21 a bude se snažit odpovědět na otázku, do jaké míry a za jakých podmínek je možné nad těmito formáty vybudovat společné vyhledávací a uživatelské prostředí digitální knihovny (digitálních knihoven). Cílem analýzy je vytipovat množinu dat evidenčních záznamů pro jednotlivé kolekce historických dokumentů, která bude společná oběma formátům a na základě níž bude možné tyto záznamy číst nejen v systémech, v nichž vznikly, ale také v systémech užívající odlišný formát. Výsledkem zajištění interoperability by neměla být jednosměrná ani obousměrná konverze formátů, ale zjištění jejich společného průniku a z toho vyplývající možnosti vzájemné interoperabilní koexistence, která umožní nejen konverze dat oběma směry, ale především koexistenci primárních datových struktur obou formátů v rámci jedné digitální knihovny. Jedním z hlavních výstupů analýzy je ujasnění metodiky popisu starých tisků ve formátu TEI, shromáždění konkrétního materiálu pro vytvoření M-Tool editorů (pro katalogizaci rukopisů a katalogizaci starých a vzácných tisků) za účelem vytvoření nové on-line aplikace M-Tool pro oblast historických fondů fungující na základě TEI P5. Přináší dokumentaci pro standardizovanou (normalizovanou) práci s formátem TEI P5 a návrh pracovního formuláře. M-Tool poslouží jednak jako nástroj přímé katalogizace v jazyce XML podle standardu TEI P5, jednak jako nástroj umožňující kooperaci MARC21 a TEI P5 v procesech sdílení, výměny datových záznamů, zejména v rámci virtuálního katalogu MANUSCRIPTORIUM. 1.2 Předpokládaný čtenář Tento dokument je určen zadavateli, dále pracovníkům AiP Beroun, kteří se budou podílet na konkrétní realizaci M-Tool určeného pro oblast historických fondů a také knihovnické veřejnosti v oblasti historických fondů, zejména v oblasti jejich katalogizace a zpřístupnění. 1.12.2008-5/190 -
1.3 Termíny a konvence atribut - (obecně) charakteristika objektu nebo entity. Pro oblast XML strukturální XML konstrukt. Sestává se z páru jméno hodnota, odděleného rovnítkem. Může se vyskytovat pouze uvnitř startovního tagu nebo prázdného tagu XML elementu. automatizovaný knihovní systém - aplikační software provozního (transakčního) typu, určený k automatizaci procesů realizovaných v knihovně bibliografická jednotka popisná jednotka. Dokument, jeho část nebo soubor dokumentů na jakémkoli médiu, který je objektem jednoho bibliografického záznamu. bibliografické entity - dílo, vyjádření, zhmotnění, jednotka; jmenné autoritní entity fyzická osoba, korporace; předmětové autoritní entity pojem, předmět, událost, místo bibliografický formát - výměnný formát pro zápis a přenos bibliografických dat. bibliografický popis - soubor popisných údajů zaznamenávajících a identifikujících zpracovávaný dokument; člení se na osm oblastí údajů. Z hlediska rozsahu údajů se v bibliografickém popisu rozlišují tři úrovně: zkrácený, základní a úplný popis. bibliografický záznam - soubor údajů o zpracovávaném dokumentu, vytvořený specifickými knihovnickými metodami. Umožňuje identifikaci dokumentu tím, že představuje v něm obsažené dílo, jeho vyjádření, jeho provedení a jeho fyzickou formu, dále umožňuje jeho vyhledání a získání přístupu k němu. data - základní nejnižší prvek informačního systému databáze - systém, způsob uspořádání dat, umožňuje jejich organizované ukládání, aktualizaci, vyhledávání podle daných kriterií datový prvek - základní jednotka identifikovatelných a definovatelných dat, která je obvykle je v rámci souboru strukturovaných dat určitým způsobem jednoznačně identifikována. digitalizace dokumentů - převod plného obsahu dokumentu do digitální podoby, (různé formáty pro obraz, zvuk, text apod. digitální data - data v elektronické podobě vztahující se nějakým způsobem k originálnímu fyzickému dokumentu jako např. digitální kopie dokumentu, zvukové záznamy související s dokumentem, transkripce, překlady, další díla v elektronické podobě vztahující se k fyzickému dokumentu. Přístup k digitálním datům zpravidla vyžaduje licenci. digitální knihovna - informační systém, který využívá moderní informační a komunikační technologie pro získávání, uchovávání, organizaci, vyhledávání, šíření a zpřístupňování digitálních materiálů uživatelům. Je to:spravovaná sbírka informací spolu s odpovídajícími službami, přičemž informace jsou uloženy v digitální podobě a jsou přístupné pomocí sítě (definice informatiků)organizace, které poskytují zdroje umožňující provádět výběr, strukturování a zpřístupnění sbírek digitálních prací, tyto práce dále distribuovat, udržovat jejich integritu a dlouhodobě uchovávat. Jejich cílem je zajistit uživateli jednotný přístup k digitálním informacím bez ohledu na jejich formu, formát, způsob a místo uložení (definice knihovníků). S tradiční knihovnou má tyto společné znaky: především systematicky budované sbírky sledování kvality zařazovaných dokumentů a dat sbírky metadatových struktur (katalogy, rejstříky, indexy), množinu služeb pro různé třídy uživatelů, tematické zaměření, dlouhodobé 1.12.2008-6/190 -
uchovávání sbírek. digitální kopie dokumentu - digitální kopie jednotlivých stran (všech nebo části) fyzického dokumentu spolu s metadaty (nyní prakticky ve struktuře MASTER+), tj. s evidenčním záznamem, technickými údaji o digitalizaci a pomocnými nformacemi pro navigaci. dílo (work) - intelektuální či umělecký výtvor jako abstraktní koncept (Homérova Iliada, Beethovena 5. symfonie, operační systém Unix apod.); dílo, vícesvazkové - dokument tvořený několika svazky nebo částmi, které tvoří z hlediska autorského nebo vydavatelského záměru jeden formálně a obsahově uzavřený celek. Obvykle jsou spojené společným názvem. dokument - informační pramen tvořený nosičem informací a množinou informací na něm fixovaných a sloužící k přenosu dat v čase a prostoru. Dokumenty se dělí podle řady kritérií, např. podle způsobu záznamu dat (písemné, obrazové, zvukové, audiovizuální, strojem čitelné - elektronické či digitální), podle odvozenosti obsahu (primární, sekundární a terciární), podle kontinuity (periodické a neperiodické), podle stupně zveřejnění (zveřejněné, nezveřejněné, interní). dokument fyzický - fyzicky existující originální dokument sestávající z jedné nebo více stran reprezentovaný jako celek jedním identifikačním znakem (zpravidla místo uložení + signatura). dokument historický písemný artefakt minulosti bez bližšího materiálového, tematického či oborového rozlišení, jakož i jeho kopie, replika či publikovaná forma. Může jím být jakýkoli text minulé, tzv. mrtvé kultury, jakékoli spojení textu a fyzického materiálu v záznam na nosiči nebo podklad pro analogové náhradní nosiče či digitální kopie a jimi přinášenou dodatečnou informaci, popř. vzácný dokument specifického historického významu bez ohledu na stáří a obor. V analýze dokument vzniklý před rokem 1800. dokument, vzácný - dokument specifického historického významu bez ohledu na stáří a obor. element - strukturální XML konstrukt. XML element se skládá ze startovního tagu, koncového tagu a informace, nesené mezi tagy neboli obsahu elementu. element dceřiný - element, hierarchicky vnořený do jiného (rodičovského) elementu. element lokální (atribut) - element či atribut, deklarovaný v XML schématu takovým způsobem, že není samostatně opakovaně použitelný v jiných schématech pomocí importu schématu, je však možno jej opakovaně použít v rámci rodičovského elementu. element rodičovský - element, nadřazený v hierarchii XML dokumentu sledované entitě (elementu, atributu apod.). entitu identifikovat - popsaná entita koresponduje s nalezenou entitou entitu najít - vyhledávací kritéria stanovená uživatelem entitu, vybrat - odpovídá uživatelským potřebám entity kvalifikované - takové entity uvnitř XML dokumentů (atributy, elementy či datové typy), které jsou označeny prefixem jmenného prostoru. evidenční záznam - textová data vztahující se jednoznačně k fyzickému dokumentu a mající ve vztahu k tomuto fyzickému dokumentu deskriptivní charakter. Viz 1.12.2008-7/190 -
katalogizační záznam exemplářové údaje - jedna ze základních strukturních částí katalogizačního záznamu, která informuje o počtu exemplářů daného dokumentu ve fondu knihovny (např. prostřednictvím přírůstkových čísel, číselného označení svazku, duplikátu apod.), o svazcích nebo ročnících vícedílných a seriálových dokumentů, jež knihovna vlastní, v online katalozích též uvádí status zpracování a aktuálního místa uložení. V rámci exemplářových údajů mohou být uváděny též údaje o individuálních zvláštnostech popisovaného exempláře (např. věnování autora, defektnost, číslo výtisku u bibliofilie apod.), u starých tisků o specifických znacích exempláře (popis vazby, vlastnická označení včetně supralibros a exlibris, rukopisné vpisky a komentáře aj.). exemplářový popis - viz exemplářové údaje formální popis složek (součástí) určitého dokumentu nebo třídy dokumentů. DTD pomocí formální syntaxe přesně popisuje, které elementy a entity se mohou v dokumentu vyskytovat a jaký je obsah a atributy těchto elementů. formát dat (datový formát) - vnitřní struktura dat, s níž pracuje příslušná aplikace a v níž jsou data ukládána na paměťové médium a načítána do operační paměti. formát dat textový- tvar, v němž jsou data ukládána v textových souborech v závislosti na použití příslušného počítačového programu formát dokumentu (layout) - celkový vzhled dokumentu týkající se jeho základních formálních charakteristik (např. formát papíru, velikost okrajů, odsazení, délka a výšku řádek, počet a rozmístění sloupců, rozměr záhlaví, zápatí apod.). formát komunikativní (výměnný formát) - struktura dat pro přenos datových zpráv. Standardizovaný formát struktury bibliografického/katalogizačního záznamu, autoritního záznamu, klasifikačních údajů, sloužící pro výměnu dat mezi jednotlivými informačními institucemi anebo systémy. Stanoví povinné údaje pro výměnu, pořadí údajů, jejich odpovídající kódová označení a pravidla použití. formát, národní varianty - MARC UKMARC, CANMARC, COMARC, IBERMARC, INTERMARC, UNIMARC (UnIversal MARC), USMARC atd. formátování automatické - funkce kancelářských nebo jiných programů (např. textových procesorů, tabulkových procesorů, DTP programů apod.) automaticky provádět formátování dokumentů podle zvoleného formátu. fyzická jednotka - svazek tištěného dokumentu a každý jiný fyzicky soudržný dokument včetně ochranného obalu, s nímž je možné samostatně nakládat vzhledem k ostatním fyzickým jednotkám. Soudržnost přitom může být zajištěna vazbou nebo pouzdrem. globální element (atribut) - element či atribut, deklarovaný v XML schématu takovým způsobem, že je opakovaně samostatně použitelný v jiných schématech pomocí importu schématu. holdings - zápis exemplářových údajů (data o vlastnících dokumentů a data lokační), informace o knihovních jednotkách. ideal copy - ideální exemplář z bibliografického pohledu impresum (nakladatelské údaje) - 1. údaje umožňující identifikaci vydavatele, popř. nositele práv k autorskému dílu apod. 2. jedna z oblastí bibliografického popisu, 1.12.2008-8/190 -
zahrnující místo vydání, jméno nakladatele, funkci distributora, příp. výrobce, datum vydání, popř. místo tisku, jméno tiskárny a datum tisku. interoperabilita - schopnost systémů vzájemně si poskytovat služby a efektivně spolupracovat s komunikačním protokolem jednotka (item) - jeden (z potenciálně mnoha) exemplářů daného projevu, kopie (např. jeden výtisk daného vydání knihy, konkrétní výtisk podepsaný autorem, kopie souboru, apod.) jmenné prvky a prvky věcné: předmětová hesla, klíčová slova, MDT kniha - rukopisný, tištěný nebo jakýmkoliv způsobem rozmnožený dokument, který je graficky a knihařsky zpracovaný do tvaru svazku a tvoří myšlenkový a výtvarný celek. kodex - v původním slova smyslu označuje svazek listů svázaných ve hřbetu Kompatibilita - vzájemná slučitelnost, snášenlivost, schopnost volného křížení komunikace - přenos informací (dat) mezi dvěma či více stranami. konverze dat - převod dat do strojem čitelné podoby, převod dat z jednoho datového formátu do jiného. Změna způsobu zápisu dat pomocí některého z konverzních programů. Kódy jednotlivých znaků jsou převedeny podle daných konverzních tabulek. Význam údajů zůstává zachován. konvolut - svazek vzniklý svázáním textů, které obvykle obsahově ani provenienčně nesouvisejí, ale jsou samostatnými bibliografickými jednotkami. MANUSCRIPTORIUM - informační systém shromažďující a zpřístupňující na internetu informace o historických knižních fondech, provázaný s digitální knihovnou digitalizovaných dokumentů. Jsou zde soustřeďovány informace poskytnuté spolupracujícími partnery, přispěvateli z knihoven, archivů a muzeí. Provoz MANUSCRIPTORIA je financován Národní knihovnou ČR, provozovatelem této služby je firma AiP Beroun s.r.o. MARC (Machine-Readable Catalogue alebo Cataloguing) - doslova strojem čitelný katalog nebo katalogizace, mezinárodní knihovnický komunikační výměnný formát (skládá se ze tří typů záznamů - bibliografický záznam, záznam pro holdings a autoritní záznam) metadata - strukturovaná data, která nesou informace o primárních datech., tj. data o datech metadata administrativní - metadata používaná pro řízení a správu informačních zdrojů, např. informace o umístění, údaje o době vzniku a poslední modifikaci, elektronický podpis aj. metadata popisná - slouží k obecnému popisu zdroje za účelem jeho vyhledání, identifikace a selekce) metadata strukturální - zachycují formát a strukturu zdroje za účelem jeho správného uložení a zobrazování metadata technická - metadata vytvořená pro počítačový systém nebo vyrobená počítačovým systémem, která uvádějí, jak se systém nebo jeho obsah chová nebo co požaduje, aby mohl být provozován. metadata, mapování - schéma nebo tabulka, která představuje sémantické mapování polí nebo datových prvků v jednom datovém standardu k polím nebo datovým prvkům ve druhém datovém standardu, který má podobnou funkci nebo význam. Mapuje 1.12.2008-9/190 -
vztahy a ekvivalence mezi dvěma nebo více metadatovými formáty. MIML - Manuscript Images Markup Language - standard pro popis iluminovaných rukopisů. viz http://raqoon.com/miml/index.html monografie - neseriálová publikace, která systematicky, všestranně a podrobně pojednává o jednom, zpravidla úzce vymezeném tématu. objekty informační, kategorizace - čtyři útovně: dílo, vyjádření, projev, jednotky parser - software, schopný načíst XML soubor a vystavit aplikační programové rozhraní pro práci nad tímto XML souborem. pole - datová struktura, která obsahuje údaje o jedné vlastnosti sledovaného objektu; obvykle představuje nejmenší jednotku dat, s níž pracuje aplikační program. V daném kontextu je jednoznačně identifikovaná svým jménem (tagem, návěštím) a určena datovým typem; může mít pevnou nebo proměnnou délku. Někdy se též označuje jako položka, údaj, datový prvek, atribut. popis, základní úroveň (core level record) - standard bibliografického záznamu v rámci FRBR portál - brána k informacím a službám na dosah www prohlížeče a mobilních zařízení. Webové sídlo, které poskytuje širokou škálu služeb a informací, často s možností jejich přizpůsobení uživateli podle osobních potřeb a zájmů. Nabídka zahrnuje především vyhledávání webových informačních zdrojů a dokumentů, freemailovou službu, denní zpravodajství, mapy, vyhledávání kontaktních informací na osoby i firmy, zábavu (hry, horoskopy, vtipy apod.), elektronické obchody, bezplatný prostor pro publikování webových stránek apod. Naprostá většina nabízených služeb je pro koncového uživatele bezplatná díky ziskům z reklamy. Široce (obecně) zaměřené portály se označují jako horizontální portály, na rozdíl od vertikálních portálů. procesor tabulkový - počítačový program, který pracuje se vstupními daty uloženými do jednotlivých buněk tabulky. Buňky jsou uspořádány do sloupců a řádků. Program umožňuje definovat různé funkce a operace s daty a jejich hodnoty automaticky zapisovat v závislosti na hodnotě vstupních dat. projev (manifestation) - fyzické ztělesnění nějakého vyjádření daného díla (např. text Iliady může být projeven v několika různých rukopisech nebo v různých knižních vydáních; určité provedení symfonie může být zaznamenáno na hudební CD nebo na videokazetě jako záznam televizního přenosu); přístup k entitě, získat koupě entity, půjčení, online přístup přítisk - obsahově uzavřené dílo, přitištěné v jedné tiskovině k jinému samostatnému dílu, ale nespojené s ním souborným názvem. Zvláštní název přítisků může být uveden na společné titulní stránce nebo na zvláštním titulním listu. - 2. Dodatečný tisk na hotové tiskoviny nebo výrobky rozmnožené jiným způsobem. přívazek (adligát) - samostatná bibliografická jednotka, rukopisná nebo tištěná, přivázaná k jinému, mnohdy obsahově odlišnému dílu, s nímž tvoří jeden svazek označovaný jako konvolut. schéma referenční - XML schéma, obsahující deklarace obecných XML struktur (elementů, atributů, složených a jednoduchých typů), popisující datové entity společné více problémovým doménám. struktura bibliografického záznamu - označení pro složky bibliografického záznamu, 1.12.2008-10/190 -
který zahrnuje: bibliografický popis, jmenné selekční údaje, věcné selekční údaje, obsahovou charakteristiku. strukturální interoperabilita - vyjadřuje strukturu metadat. Strukturální interoperability se dosáhne pomocí datového modelu pro specifikaci sémantických schémat, takže se mohou aplikovat společně. strukturovaná data - data, která jsou definována syntaktickými pravidly. Údaje logicky uspořádané ve struktuře jednotlivých datových položek podle určitého systému, který určuje, jak má být souhrn datových objektů strukturován. Obecné typy struktury dat zahrnují např. pole, soubor, záznam, tabulku, strom atd. Každá struktura dat určuje organizaci (ukládání) dat tak, aby vyhovovala určitému účelu, umožňovala k uloženým datům potřebný přístup, popř. další zpracování. tag (identifikátor) - řetězec znaků, který slouží pro identifikaci určitého strukturálního elementu v textu (např. záznamu nebo pole). Soubor polí obsahujících údaje o jednom objektu (entitě) tvoří záznam. TEI - Text Encoding Initiative: projekt, jehož cílem je vytvoření skupiny standardizovaných DTD vhodných pro uchovávání a výměnu knih. Iniciativa pro kódování textu, konsorcium vyvíjející standardy pro popis textů v elektronické podobě: http://www.tei-c.org. údaje selekční (prvky) - kriteria umožňující vyhledávání uživatel - osoba či instituce, která přistupuje k prezentační databázi a k digitálním datům s ní souvisejím za účelem vyhledání požadovaných informací. V antice svazek destiček s voskovou vrstvou ke psaní, později v období pozdní antiky již forma knihy, která vznikla v důsledku rozšíření pergamenu a na rozdíl od svitku se vyznačovala soudržností listů, složením vrstev psací látky, zpevněných vazbou nebo jinými prostředky. Také rukopisná kniha nebo literární rukopis s charakteristickými rysy. vícesvazková monografie - viz vícesvazkové dílo vícesvazkový dokument - viz vícesvazkové dílo vyjádření (expression) - konkrétní realizace, časoprostorová fixace daného díla (např. Illiada byla nejprve realizována ústním podáním, poté formou písemného zápisu; symfonie může být realizována jako zápis partitury nebo jako některé z mnoha jejich hudebních provedení); webový prohlížeč/rozhraní -aplikace pracující nad daty elektronického katalogu a umožňující přístup k nim prostřednictvím Internetu záznam katalogizační - druh bibliografického záznamu, obsahující kromě bibliografického popisu i lokační údaje (signaturu anebo siglu) a exemplářové údaje knihovny uchovávající katalogizovaný dokument. Původně byl chápán jako záznam pro katalog na rozdíl od bibliografického záznamu jakožto záznamu pro bibliografii. V současné praxi se rozdíly mezi bibliografickým a katalogizačním záznamem stírají, bibliografický záznam často obsahuje lokační údaje. záznam minimální - katalogizační záznam obsahující nezbytně nutné prvky bibliografického popisu, které představují minimální povinný rozsah záznamu pro konkrétní souborný katalog. 1.12.2008-11/190 -
1.4 Zkratky ALEPH (Automated Library Expandable Program) - knihovní systém, vyvinutý a rozvíjený izraelskou firmou ExLibris pro knihovny, archívy, muzea a informační centra. ARL (Advanced Rapid Library) - knihovní informační systém firmy Cosmotron Bohemia s.r.o. pracující s UNIMARC, MARC21 CASLIN - Czech and Slovak Library and Information Network CERL - Consortium of European Research Libraries CLAVIUS - knihovní systém firmy LANIUS vzniklý v r.1997. DC (Dublin CORE) - standardizované metadatové schéma pro popis informačních zdrojů, zejména elektronických a internetových. Dublin Core je tvořen souborem patnácti základních prvků (jednoduchý Dublin Core), které lze specifikovat kvalifikátorem (kvalifikovaný Dublin Core). Dublin Core nepředepisuje žádnou závaznou syntaxi (jedná se o sémantický standard), je základem řady dalších metadatových standardů. DTD (Document Type Definition) formát popisu struktury XML dokumentu. FRAD (Functional Requirements of Authority Records) -funkční požadavky na autoritní záznamy FRBR (Functional Requirements for Bibliographic Records) - Funkční požadavky na bibliografické záznamy - datový model pro práci s bibliografickými záznamy, definovaný pracovní skupinou při IFLA (International Federation of Library Associations and Institutions) v roce 1995. stanovující funkční požadavky na bibliografické záznamy. Funkční požadavky pro bibliografické záznamy jsou definovány ve vztahu k následujícím uživatelským zájmům podle základních způsobů využití dat: JIB - Jednotná informační brána KDD komplexní digitální dokument KpWinSQL - knihovní systém firmy KP-SYS spol. s r. o. pracující s MARC21. MARC formáty MARC21 - poslední verze formátu MARC, výsledek harmonizace formátu USMARC a CANMARC v roce1997. MASTER (TEI MASTER) - XML schéma, určené především pro popis rukopisů MASTER+ - XML schéma, které obsahuje kromě evidenčního záznamu též informace o procesu digitalizace a informace o jednotlivých digitalizovaných stranách dokumentu METS - Metadata Encoding and Transmission Standard - standard pro zachycení, kódování a přenos metadat v prostředí digitálních a digitalizovaných objektů. MODS - Metadata Object Description Scheme. - schéma pro popis objektu metadaty. Částečně přebírá prvky z formátu MARC21 OpenURL - standard pro předávání metadat jako součástí URL, adresa zdroje na internetu, např. www stránky ) Umožňuje například odeslání parametrů k vyhledávání prostřednictvím odkazu. RDF - (Resource Description Framework) - systém popisu zdrojů, specifikace formátu, podporující popis zdrojů webu pomocí abstraktního modelu metadat, implementovaná v jazyku XML. SDRUK - Sdružení knihoven ČR 1.12.2008-12/190 -
URL (Uniform Resource Locator) - adresa dokumentu. Doménová adresa serveru, umístění zdroje na serveru a protokol, kterým je možné zdroj zpřístupnit. W3C (World Wide Web Consortium) - mezinárodní konsorcium, jehož členové společně s veřejností vyvíjejí webové standardy pro World Wide Web (www) www, web (World Wide Web) aplikace internetového protokolu HTTP, tj. soustava propojených hypertextových dokumentů. ML (Extensible Markup Language) - značkovací jazyk. Patří do stejné skupiny jako HTML, je však zaměřen na popis struktury a obsahu dokumentu. XML dokument - dokument, obsahující data, značkovaná v souladu se standardem XML. XML formáty - metadatové formáty: Dublin Core, RDF, METS XML schéma - formát popisu XML dokumentu. Jedná se o popis struktury XML dokumentu v XML syntaxi. V současné době nejrozšířenější formát pro deklaraci tříd XML dokumentů. XMLMARC - převod struktury MARC do XML (XMLizace MARCu) XSL - Extensible Stylesheet Language. Standard popisuje zobrazení dokumentů psaných v XML. XSLT - XSL Transformations. Definuje převod mezi dvěma různými strukturami dokumentů popsaných v XML. Popis je realizován jako převod jedné struktury zdrojového dokumentu v XML do druhé cílové struktury dokumentu v XML. XSLT je rozšířením standardu XSL. 1.5 Reference V dokumentu bylo čerpáno z následující literatury: [1] Manuscriptorium v.2.0 analýza systému, AiP Beroun, prosinec 2004 [2] Manuscriptorium compatible základy a kompatibilita http://www.manuscriptorium.com/download/documentation/manuscriptorium_basics _and_compatibility_cze.pdf [3] Manuscriptorium compatible technická kompatibilita http://www.manuscriptorium.com/download/documentation/manuscriptorium_comp atibility_technical_cze.pdf [4] Manuscriptorium compatible výběr a popis dokumentů http://www.manuscriptorium.com/download/documentation/manuscriptorium_docu ment_description_cze.pdf [5] Manuscript Access through Standards for Electronic Records (MASTER) http://xml.coverpages.org/master.html [6] Reference Manual for the MASTER Document Type Definition, discussion draft http://www.tei-c.org.uk/master/reference/oldindex.html [7] MARC21 Format for Authorities Data http://www.loc.gov/marc/authority/ecadhome.html [8] Katalogizace starých tisků ve formátu UNIMARC a MARC21 http://digit.nkp.cz//katalogizace/marc/index.html 1.12.2008-13/190 -
2 Knihovnické formáty a formáty XML 2.1 Historické fondy a elektronická katalogizace ve světě 2.1.1 Charakteristika knihovnických formátů a jejich vývoj Elektronická katalogizace dokumentů se v zahraničních knihovnách rozběhla v šedesátých letech minulého století. Knihovnické formáty se postupně zdokonalovaly a vyvíjely. Formát MARC Formát MARC má své počátky v roce 1966, kdy začala Library of Congress <http://www.loc.gov> automatizovat svůj katalog a snažila se racionalizovat katalogizaci. Formát MARC byl původně vytvořen pro komunikaci dat na magnetické pásce. Tento formát byl vytvořen tak, aby byl nezávislý na operačním systému a mohl používat různé druhy abeced nebo různé druhy číslic. Byl vytvořen tak, podobně jako formát UNIMARC, aby umožňoval používat pole s pevnou a proměnnou délkou polí. Je to formát, který byl založen na anglo-amerických katalogizačních pravidlech. Postupně došlo k vývoji tohoto formátu a na jeho základě vznikla v roce 1972 norma ISO 2709 Komunikativní formát pro přenos dat na magnetické pásce. Tato norma je dnes základem řady bibliografických formátů především formátů skupiny MARC. Formáty typu MARC můžeme rozdělit do tří skupin: 1. skupina MARC anglo-saské konvence, kam patří UKMARC (britský), USMARC (americký), CANMARC (kanadský), IBERMARC (španělský) formát a také MARC21 2. skupina jsou formáty franko-italské konvence, kam řadíme formáty, které vychází z původního francouzského formátu MONOCLE; patří sem např. PICAMARC (holandský), INTERMARC (francouzský) a další 3. skupina je tvořena formátem UNIMARC. Program UNIMARC vznikl v roce 1977 a důvodem jeho vzniku byla snaha o vytvoření formátu, který by umožňoval bezproblémovou směnu záznamů mezi jednotlivými formáty typu MARC. Program MARC byl zaštiťován organizací IFLA <http://www.ifla.org/> v rámci programu pojmenovaného UBCIM (Univerzální bibliografická kontrola a program MARC; <http://www.ifla.org/vi/3/ubcim.htm>), který byl řízen do března 2003 Die Deutsche Bibliothek. A od roku 2003 má rozvoj formátu UNIMARC na starosti Portugalská národní knihovna, <http://www.ifla.org/vi/7/icabs.htm>. Problémem formátu UNIMARC je finanční stránka. Organizace IFLA může tento formát ze svých zdrojů podpořit jen omezeně. Finanční zdroje na všechny základní programy IFLA byly redukovány, některé zcela pozastaveny. Řada zemí tedy přešla na formát MARC21, a to především finančně silné země. Formát MARC21 vznikl v 90. létech 20. století. Původně mělo dojít ke spojení amerického, britského a kanadského formátu, ale pro rozpory mezi americkou a 1.12.2008-14/190 -
britskou stranou nakonec došlo ke sloučení pouze amerického a kanadského formátu, a tak vznikl formát MARC21. Kuriózní je, že i přes tuto skutečnost se britské knihovny v referendu rozhodly přejít na MARC21. 2.2 TEI formát Formát Iniciativy pro kódování textů (Text Encoding Initiative, TEI, http://www.tei-c.org/) TEI patří spolu s Dublin Core a EAD mezi dnes nejpoužívanější popisné metadatové formáty. Je jedním z nejstarších metadatových schémat. Práce na tomto formátu započaly v roce 1987 v rámci mezinárodního výzkumného projektu vedeného Asociací pro využití počítačů v humanitních vědách ACH (Association for Computers in Humanities), k níž se přidaly Asociace pro využití počítačů v literatuře a lingvistice ALLC (Association for Literary and Linguistic Computing) a Asociace pro počítačovu lingvistiku ACL (Association for Computational Linguistics) (MIT Libraries, 2004). V roce 2000 vzniklo mezinárodní neziskové konsorcium TEI, které nadále udržuje a rozvíjí formát TEI. Je to rozsáhlý formát pro popis všech typů textových i netextových objektů. Používá se především v oblastech literatury, lingvistiky a humanitních věd. První koncept formátu TEI byl zveřejněn v roce 1990. Od té doby byl formát již několikrát aktualizován. Původně vycházel ze SGML, nyní se již orientuje na standart XML, W3C Scheme a další. V letech 1999-2001 byl v rámci evropského grantového projektu MASTER (Manuscript Access through STandards for Electronic Records), v jehož čele stála Národní knihovna ČR a AiP Beroun jako technický partner, vypracován speciální modul pro popis rukopisů ve formátu TEI. 1 2.3 Historické fondy a elektronická katalogizace v ČR Zatímco ve světě se elektronické zpracovávání tištěných dokumentů rozvíjí již od druhé poloviny 60. let (koncem šedesátých let 20. století vznikají dokonce první elektronické souborné katalogy v USA a Nizozemí), vývoj v České republice, stejně jako v celé střední a východní Evropě je těmito aktivitami netknut. K postupnému zavádění výpočetní techniky do rutinních knihovnických činností (zpočátku byl používán hlavně volně dostupný CDS/ISIS) docházelo až v průběhu 80. let minulého století, především v knihovnách akademické sféry a v menších ústavních knihovnách. Od 1989 došlo v České republice k vytvoření jednotné informační sítě a jako výměnný komunikativní formát byl zvolen bibliografický formát UNIMARC, který v souladu s evropskými vývojovými trendy začal být od roku 2004 v řadě knihovnických institucí postupně nahrazován formátem MARC21. Zavedení těchto knihovnických 1 K zahájení a dokončení projektu MASTER viz Zdeněk Uhlíř, Projekt MASTER a standardizace v oblasti zpracování rukopisů, Národní knihovna, Knihovnická revue, 1999, č.3, s.109-113, dostupné z: <<http://knihovna.nkp.cz/nkkr9903/9903109.html>> a Zdeněk Uhlíř, Dokončení projektu MASTER, Národní knihovna, Knihovnická revue, 2002, č. 2, s. 84 101, dostupné z: <<http://knihovna.nkp.cz/nkkr0202/0202084.html>>. 1.12.2008-15/190 -
formátů znamenalo v knihovnické praxi skutečnou revoluci. Během několika málo let se elektronická katalogizace rozbíhá nebývalým tempem a řada institucí, na čele v Národní knihovnou ČR, buduje nejen svoje fondové katalogy, ale formou kooperace vytváří i sdružené a souborné katalogy. Česká republika brzy snižuje časový handicap v elektronickém zpracovávání dokumentů a v některých ohledech se stává dokonce průkopníkem nových zpracovatelských postupů např. v oblasti digitalizace historických dokumentů. Velkou výhodou knihovnických formátů UNIMARC a MARC21 je nejen jejich standardizace katalogizace a metodická podpora Národní knihovny ČR opírající se zahraniční knihovnické zkušenosti a možnosti efektivní výměny dat i vzájemná domácí i zahraniční kooperace. Výhodou je rovněž to, že tyto formáty lze bez problémů aplikovat do domácích knihovnických systémů, finančně dostupných i malým institucím. I když se ve světě se v knihovnické praxi užívají přes třicet let, jsou poměrně neznámé v jiných oblastech lidské činnosti, v jiných profesích, což představuje jisté omezení. Jsou to velice komplexní v mnoha ohledech velice dobře strukturované formáty, ale snad právě proto jsou v jiných oborech málo srozumitelné. Data zpracovaná v MARC-formátech měla potíže s integrací do www rozhraní internetových prohlížečů a také s integrací metadat týkajících se digitalizovaných dokumentů. Omezení MARC-formátů řeší jejich konverze do formátu XML (extensible Markup Language) nejčastěji XML-MARC. Konverze bibliografického záznamu z MARC formátu do XML tradiční záznam osvobozuje z prostředí OPAC-u a umožňuje vytvářet jeho kopii v informačních zdrojích na internetu, a tudíž jej vyhledávat prostřednictvím stejného rozhraní jako ostatní webové entity. Konverze MARC formátu do jazyka XML je určitě tím správným krokem k modernizaci tradičních knihovnických formátů. Představuje však svým způsobem jednostranné řešení jejich operabilitu dat v rámci webovského prostředí, nikoliv operabilitu dat vzniklých v jiném než MARCovském prostředí. Ukazuje se, že v mnoha případech vyvstává potřeba zpřístupnění dat, primárně vzniklých mimo MARCovské prostředí, také ve formátu MARC. Nutnost sladění a sblížení obou prostředí (XML a MARC) se tedy stává naléhavým požadavkem současnosti. Pracovní list pro popis starých tisků byl vypracován v Národní knihovně ČR nejprve ve formátu UNIMARC, po přechodu na MARC21 i v tomto formátu - a to dle standardů ISBD(A), DCRB. AACR2 a MARC21 2. Byla vypracována metodika popisu starých tisků zohledňující MARCovské formáty prostředí ALEPH. Ostatní systémy víceméně tuto metodiku s menšími úpravami přejaly nejdůsledněji systém CLAVIUS. 2 ISBD(A). Mezinárodní standardní bibliografický popis pro staré tisky a prvotisky. Druhé evidované vydání. Doporučeno Projektovou skupinou ISBD(A). Schváleno Stálým výborem Katalogizační sekce IFLA a Sekcí IFLA pro vzácné tisky a rukopisy. 1. české vydání. Praha : Národní knihovna, 1997. DCRB. Descriptive Cataloging of Rare Books. Second Edition. Washington, D.C.: Cataloging Distribution Service, Library of Congress, 1991. MARC21. Bibliografický formát. Network Development and MARC Standards Office Library of Congress. Standards and Support, National Library of Canada. 1. české vydání. [z anglického originálu do češtiny přeložily Ludmila Benešová et al.]. Praha : Národní knihovna České republiky, 2003. 2 sv. 1.12.2008-16/190 -
První pokusy konverzí dat z formátu UNIMARC a MARC21 do formátu TEI P4 (MASTER) realizované před několika lety ukázaly, že jistá kompatibilita dat je možná. Konverze opačným směrem již tak úspěšné nebyly. Odhalily nejen rozdíly ve filozofii katalogizace (důsledně exemplářový popis v TEI a víceméně bibliografický popis v MARC, absence standardizace zápisu dat v TEI pohybující se na samé hranici únosnosti a striktní standardizovaný popis v MARC), ale také rozdílné postupy při vytváření struktury popisných metadat. Potvrdilo se, že konverze dat z formátu do formátu není řešením neboť každá, sebelepší konverze je nějakým způsobem ztrátová a působuje nevratné změny. Navíc ji lze pojímat jen jedním směrem. Nabízí se tedy logické řešení: data ponechat v původních formátech a vytvořit pro jejich kompatibilitu vhodné nástroje, které by byly formátům nadřazené a umožňovaly společné zobrazování a uživatelské vyhledávání dat v nich zapsaných. Tedy nikoliv konverze, ale interoperabilní koexistence různých katalogizačních formátů a prostředí, to je současný trend. Systém ALEPH Systém ALEPH je moderní knihovní systém nadnárodní firmy Ex Libris, předního producenta pokročilých aplikací pro knihovny, informační centra a výzkumná pracoviště. 3 Verze ALEPH 500 je otevřený velice přizpůsobivý systém instalovaný ve více než 1250 knihovnách ve více než 51 zemích po celém světě. Flexibilita systému se rovněž odráží ve značném počtu podporovaných jazyků -- ALEPH 500 je dodáván s uživatelským rozhraním ve více než 20-ti jazycích. Katalogizačním a výměnným formátem je MARC21 s komunikačním protokolem Z39.50. Také v České republice jej používá stále větší počet institucí, které se sdružují v Sdružení uživatelů ALEPH - <<http://www.sualeph.cz/knihovny.htm>>. Příloha 1 - Přehled knihoven, které užívají systém ALEPH v ČR (verze 500) Systém CLAVIUS Veřejné knihovny začaly ve velké míře implementovat knihovnický systém LANius v roce 1992 (systém LANIUS). Systém CLAVIUS, který není přímým následníkem původního systému LANius, ale kvalitativně odlišným systémem, byl vyvinut v roce 1998 na základě osmiletých zkušeností firmy LANIUS s.r.o v oblasti automatizace knihovnických procesů. Systém ukládá data přímo ve formátu UNIMARC a podporuje uložení všech tagů s možností definice vlastních polí a podpolí nad rámec UNIMARC. Systém podporuje používání angloamerických katalogizačních pravidel AACR2 a zobrazení bibliografických výstupů podle norem ISBD(A). Autoritní záznamy včetně věcných hesel jsou ukládány v mezinárodním výměnném formátu UNIMARC/Autority. Existuje možnost připojení národních autorit z Národné knihovny ČR. Do systému může být připojen libovolný externí tezaurus, např. EUROVOC, který je převeden do formátu UNIMARC/Autority a systém Clavius je připraven s ním pracovat. Export a import ve formátu UNIMARC splňuje minimální záznam pro Souborný katalog tisků ČR. Komunikační standardy: Síťové protokoly: TCP/IP, IPX/SPX, 3 Více informací o Ex Libris naleznete na stránkách: <<www.exlibrisgroup.com>>. 1.12.2008-17/190 -
NETBEUI, Internet: IP, HTTP, HTML, Z39.50 server v. 2 a integrovaný klient v. 3. Exportní soubory: ISO 2709, HTML, XML. Základní část celého integrovaného systému tvoří modul katalogizace. Standardně je k dispozici řada režimů podle druhu dokumentu, včetně režimu pro staré tisky. Katalogizace je v souladu s poli UNIMARC a zejména s katalogizačními pravidly AACR2. Systém má zabudován převodník na formát MARC21, v němž lze záznamy zobrazovat. Pomocí režimu nastavení je však možné upravovat jednotlivé definice polí a podpolí, jejich nápovědu a dokonce i definovat vlastní nová pole a podpole nad rámec UNIMARC. Nově definovaná pole mohou být i takzvaného multimediálního typu ( obrázek, zvuk, video, HTTP odkaz na síti Internet apod.). Systém je značně rozšířen v menších knihovních institucích, zejm. muzejních, má jej však též několik významných knihoven církevních vlastnících historické fondy (Strahovská knihovna premonstrátů, Knihovna františkánského kláštera v Praze a Rajhradská klášterní knihovna benediktinů) a je také základem databáze Knihopis Digital. Systém ARL Systém ARL (Advanced Rapid Library) firmy Cosmotron má v oblasti historických fondů zastoupení především v knihovně Památníku národního písemnictví. I když je ARL schopen zobrazovat popisná data ve formátu MARC21, katalog této knihovny vzniká ve formátu UNIMARC (s velmi podrobně rozpracovanou metodikou pro katalogizaci starých a vzácných tisků (s poli pro kódované znaky starých tisků, bohatě využitými poznámkovými poli, propojovacími poli, s věcným tříděním, poli národního bloku 9 a písmenkovými poli). Systém Kp-Win SQL Systém Kp-Win SQL společnosti KP-Sys, který pracuje s MARCovskými formáty UNIMARC a MARC21, pro staré tisky používá Knihovna Národního muzea. Bohužel v současné době není katalog přístupný k nahlédnutí, takže nelze zjistit, jak pracovní list na staré tisky vypadá. MASTER Pro oblast zpracování rukopisů byl vypracován roku 2003 formát MASTER (Manuscript Access through Standards for Electronic Records), který se v dalších letech začal používat i pro popis prvotisků a starých tisků. Rozšířením formátu MASTER je MASTER+, formát, který je určen pro spojení katalogového záznamu a digitálních obrazových kopií. Výhodou tohoto formátu je totiž možnost integrace bibliografického záznamu, obrazových dat i plného textu v jednom XML souboru. Oddělení rukopisů a starých tisků Národní knihovny ČR v tomto formátu pořizuje také bibliografický popis rukopisů, prvotisků a starých tisků. MASTER vycházel z verze TEI 4, v současné době je integrální součástí nové verze TEI 5, která kromě rukopisů zohledňuje specifické požadavky popisu starých tisků. V českých institucích v oblasti rukopisů převládá vzhledem k digitalizaci dokumentů popis ve formátu TEI (MASTER a MASTER+). Pouze některé knihovny (Moravská zemská knihovna v Brně a Vědecká knihovna v Olomouci) udržují svoje data také sekundárně ve formátu MARC21. V oblasti starých tisků převažuje 1.12.2008-18/190 -
zpracování dat v knihovnických formátech MARC21 a UNIMARC, a to jak v systému ALEPH, tak např. i systému CLAVIUS, KP Win, ARL. 2.4 MARC21 2.4.1 Vývoj MARCovských formátů (UNIMARC, MARC21) Rukopisy, prvotisky, mapy Elektronická katalogizace rukopisů a prvotisků není v ČR ve formátu UNIMARC a MARC21 až na výjimky (shorttitlová rychlá katalogizace z důvodů evidenčních) realizována. Elektronický popis rukopisů byl od svého vzniku spjat s digitalizací rukopisných dokumentů a probíhá v prostředí jazyka. Národní knihovna. ČR stála v čele mezinárodního pracovního týmu (projekt MASTER), který popis rukopisů rozvíjel a rozvíjí ve formátu TEI (verze TEI 4 a standard MASTER). Metodika popisu rukopisů je pojímána odlišně od MARCovských standardů. V mnohém je jeho katalogizační struktura daleko propracovanější a sofistikovanější než struktura MARCovská, což je jeho nesporná přednost. Na druhé straně však má díky absenci některých běžně užívaných mezinárodních standardů a někdy až přílišné katalogizátorské volnosti také svoje zápory a limity. Prvotisky jsou rovněž zpracovávány v prostředí XML (Národní knihovna ČR, Knihovna Národního muzea Praha). Důvodem XML zpracování je jejich systematická digitalizace, převod tištěných klasických katalogů do internetové elektronické podoby a v neposlední řadě jejich celosvětové zpracovávání, které má vedle tištěných katalogů k dispozici i velice kvalitní a informačně dostačující internetové databáze on-line přístupné široké uživatelské veřejnosti. Oblast, kde došlo v poslední době k bouřlivému rozvoji využívajícímu nejmodernějších metod vědeckého zpracovávání a zpřístupňování formou digitálních dokumentů, je oblast map. Souvisí to nejen s uživatelských zájmem veřejnosti o geografii a kartografii obecně, ale také se zpracováním a zpřístupňováním historických map, které jsou ve své digitální podobě přístupny (a zároveň ochráněny) daleko lépe a efektivněji. MARCovské formáty jako formáty knihovnické jsou v této oblasti víceméně překonány. Spornou se rovněž jeví i popis kartografického materiálu v prostředí XML. Formát XML sice poskytuje pro katalogizaci map více prostoru, popis může být daleko propracovanější a strukturovanější, ovšem stále zůstává jen slovním doprovodem geografického obrazu, který tvoří jednoznačně dominantní složku. Práce s digitálním kartografickým dokumentem jako statickým zobrazením však také již uživatele neuspokojuje. Do popředí se dostává sofistifikovanější práce s mapou, která představuje spíše praktickou navigační pomůcku. V případě map historických je navíc uživatelsky žádané i takové virtuální zobrazování, kdy se historické zobrazení dané geografické reality prolíná s jeho dnešní kartografickou podobou. Knihovnický statický popis map tak zažívá svoji krizi a je třeba zvážit, který cestami se bude v budoucnu ubírat. Staré tisky Vedle systému CDS/ISIS rozvíjeného spolu s formátem MAKS, který představuje nejstarší způsob popisu starých tisků v ČR (uplatňoval se zejm. v 1.12.2008-19/190 -
Knihovně Akademie věd a některých menších státních institucích), byla od poloviny 90. let minulého století v Národní knihovně ČR systematicky rozvíjena metodika popisu starých tisků ve formátu UNIMARC a MARC21, a to v knihovnickém systému ALEPH. Pro popis tisků 1501-1800 (zkušebně i pro popis map) byl v Národní knihovně ČR zvolen samostatný katalogizační modul STT- Databáze starých tisků a map NK ČR (1501-1800), který je součástí elektronického katalogu Národní knihovny ČR. Ve svém pracovním listě vycházel tento modul jednak z tradičních katalogizačních pravidel, které ovšem přizpůsobil moderním požadavkům elektronické katalogizace a mezinárodním standardům AACR2, ISBD(A) apod. Pracovní list byl konfrontován s jinými pracovními listy pro popis starých tisků v zahraničí (Francie, Itálie apod.) a byl uveden do souladu s katalogizačními postupy Konsorcia evropských vědeckých knihoven (CERL), budujícího elektronický evropský katalog Hand Press Book Database (formou konzultací a testování). Pracovní list umož noval v rámci formátu UNIMARC a MARC21 propojení textových a obrazových dat. Báze STT 1501-1800 byla propojena se souborem Národních autorit, které nejen využívala, ale k jejichž tvorbě v oblasti historických fondů značně přispívala. Zkušenosti Národní knihovny ČR byly na platformě Pracovní skupiny pro katalogizaci tisků a tisků 16.-19. století přijímány i jinými republikovými knihovnami pracujícími s knihovnickými systémy na bázi UNIMARCu a MARCu. Pracovní skupina, která se soustředila na sjednocení metodiky popisu a zabývala se především vytvořením tzv. minimálního katalogizačního záznamu, který by se stal základem budování souborného katalogu starých tisků i základem pro sdílenou katalogizaci, pracovala v letech 2003-2005. Koncem roku 2005 byla její činnost v Národní knihovně ČR nečekaně ukončena a přenesena na půdu SDRUKu. Přesto se v relativně krátkém období její aktivity podařilo vypracovat řadu metodických standardů, na jejichž bázi elektronické katalogy starých tisků s formáty UNIMARC a MARC21 pracují dodnes. 4 4 Ke katalogizaci v UNIMARC a MARC21 a katalogizaci starých tisků obecně viz např. Jaroslava Kašparová, Katalogizace starých tisků 1501-1800 v Národní knihovně ČR : Báze STT 1501-1800 : (stav k roku 2000) / zpracovala Jaroslava Kašparová za spolupráce Dany Mrákotové, Praha : Národní knihovna České republiky, 2001; táž, Staré tisky - uložit, ochránit, zpracovat a zpřístupnit, Národní knihovna, 2003, r. 14, č. 3, s. 173-183; táž The Early Printed Books 1501-1800 Electronic Cataloguing in the National Library of the Czech Republic (http://www.konyvtar.elte.hu/hirek/rendezvenyek/2004/digit_konf/jk_ea.htm); táž, Le catalogue automatisé des livres anciens et recherches dans le domaine de l'histoire du livre: le cas de la République tchèque: conception du traitement, son état actuel, in: The scholar & the database: papers presented on 4 November 1999 at the CERL conference hosted by the Royal Library, Brussels. - Hellinga, Lotte (Ed.) perspectives d'avenir. London: Consortium of European Research Libraries, 2001, p. 43-48; táž Katalogizace starých tisků v rámci minimálního záznamu (http://www.knihovna.upm.cz/prezentace/stisky.ppt.) apod. 1.12.2008-20/190 -