AiP Beroun 10.11.2009



Podobné dokumenty
ENRICH. Eu r o p e a n Ne t w o r k in g Re s o u r ce s a n d In f o r m a t io n co n ce r n in g Cu lt u r a l H e r it a g e

Historické fondy MZK a. spolupráce. Jitka Machová Moravská zemská knihovna v Brně machova@mzk.cz

MANUSCRIPTORIUM Digitalizace rukopisů VKOL. Miloš Korhoň Vědecká knihovna v Olomouci

Knihovna váš partner. aneb Mr. Bean v knihovně

Digitální konkordance a Registr digitalizace v Manuscriptoriu,

Bibliografické a rešeršní služby

Digitalizace v ČR a její podchycení v registru digitalizace. Helena Dvořáková Národní knihovna ČR

Portál ebadatelna Zlínského kraje a zpřístupnění map. Prezentace historických map z fondu paměťových institucí Zlínského kraje

SLOHOVÁ VÝCHOVA Mgr. Soňa Bečičková

Autor: ing. Tomáš Psohlavec a kolektiv AiP Beroun s.r.o.

Digitalizace a zveřejnění sbírkových fondů paměťových institucí Zlínského kraje

Kooperační systém článkové bibliografie, báze ANL, báze ANL FULL budoucnost? NKČR 2011, únor. Ivana Anděrová, oddělení analytického zpracování

Použití polí 008, 007, Údaje pevné délky s xr- cze - d

Pilotní řešení. AiP Beroun, autor Mgr. Olga Čiperová

RD.CZ : EVIDENCE DIGITALIZOVANÝCH DOKUMENTŮ A SLEDOVÁNÍ PROCESU ZPRACOVÁNÍ

manuscriptorium Manuscriptorium v Evropě Manuscriptorium.com

Staré tisky digitalizované v rámci projektu Google Books zpřístupněné v Manuscriptoriu: výsledky, zkušenosti, plány

Digitalizace a digitální knihovny v České republice

Digitalizace a digitální archiv Státního oblastního archivu v Třeboni

DIGITALIZOVANÉ FONDY VĚDECKÉ KNIHOVNY V OLOMOUCI A KDE JE HLEDAT. Miloš Korhoň, Jan Houserek

Manuscriptorium - 10 let

Zpráva o zhotoveném plnění

INFORUM Špalíček digitální knihovna kramářských tisků (spalicek.net)

ebadatelna Zlínského kraje

Digitalizace a Digitální archiv Státního oblastního archivu v Třeboni po čtyřech letech. Výsledky a perspektivy dalšího vývoje

Knihovny typy a počty. Paměťové instituce 2. Muzejní knihovny. Galerijní knihovny

Zpracování dokumentů. PhDr. Libuše Machačová Vědecká knihovna v Olomouci

Bibliografické databáze umění vyhledávat v záplavě pramenů relevantní informace

Souhrnná zpráva o plnění cílů retrospektivní konverze katalogů českých knihoven realizované v roce 2013 v rámci programu VISK 5 RETROKON

FUNKCE A VYHLEDÁVÁNÍ NA PORTÁLE KNIHOVNY.CZ PhDr. Iva Zadražilová, Moravská zemská knihovna

Zpřístupnění kulturního dědictví v digitální podobě v ČR prostřednictvím knihoven

Informace, knihovny, katalogy... Přednáška kurzu Informační a databázové systémy v rostlinolékařství

Souhrnná zpráva o plnění cílů retrospektivní konverze katalogů českých knihoven realizované v roce 2014 v rámci programu VISK 5 RETROKON

Digitální knihovny v České republice

RETROBI Softwarová aplikace pro zpřístupnění digitalizované lístkové kartotéky Retrospektivní bibliografie české literatury

České digitalizační projekty, jejich výsledky a agregace

Požadavky na systém pro automatizaci muzejní knihovny

Virtuální národní fonotéka. Archivy, knihovny, muzea v digitálním světě 2013 Filip Šír a Petr Žabička

Stav digitalizace jednotlivých fondů Národní knihovny České republiky

Obohacování bibliografických záznamů o věcné selekční prvky postup NKČR

Kartotéky Augusta Sedláčka

Ředitel odboru archivní správy a spisové služby PhDr. Jiří ÚLOVEC v. r.

METODIKA VÝZKUMU KNIŽNÍCH PROVENIENCÍ

Souborný katalog ČR pro veřejné knihovny Veřejné knihovny pro Souborný katalog ČR

Střední odborná škola Luhačovice. Témata pro ústní maturitní zkoušku z odborných předmětů

Projekt Digitalizace a ukládání ve Zlínském kraji zkušenosti, postřehy

Systém pro správu metadat

RD.CZ EVIDENCE DIGITALIZOVANÝCH DOKUMENTŮ A SLEDOVÁNÍ PROCESU ZPRACOVÁNÍ

Lenka Maixnerová, Filip Kříž, Ondřej Horsák, Helena Bouzková

AiP Beroun, autor: Ing. Tomáš Psohlavec

Informační vzdělávání PdF

Sluţba Karlovarského kraje pro ukládání dokumentů a dat na území kraje

Vyhledávání v souborných katalozích

Informační výchova v knihovnách. Práce se středoškolskou mládeží

České internetové medicínské zdroje v Národní lékařské knihovně

Federativní autentizace v portálu Knihovny.cz, mojeid, IdP sociálních služeb, požadované atributy u Knihovny.cz

Knihovní fond, muzejní sbírka a archivní fond z pohledu české legislativy

Bibliografie českého archivnictví za rok 2005

Tvůrčí prostředí Pro koho, proč, jak? Tomáš Psohlavec, AiP Beroun s.r.o. Listopad 2014

Použití polí Údaje pevné délky s xr- cze - d

Hledám knihu, časopis

Pro malé i obří projekty

ZÍSKÁVÁNÍ INFORMACÍ I.

Od zpřístupnění rukopisů přes komerční archivy k LTP, aneb 20 let praxe s dlouhodobým uložením dat.

POKYNY PRO VYPRACOVÁNÍ BAKALÁŘSKÉ A DIPLOMOVÉ PRÁCE

Národní technické muzeum Archiv Národního technického muzea. Vetter Quido, prof.

Elektronické inf. zdroje

Seminář pro vedoucí knihoven asviústavů AV ČR ASEP

Obsah. MZK a fonotéka - východiska Co jsme doposud udělali Co je skryto za portálem Další kroky

Souhrnná zpráva o plnění cílů retrospektivní konverze katalogů českých knihoven realizované v roce 2015 v rámci programu VISK 5 RETROKON

NA CESTĚ K MANUSCRIPTORIU VAŠE DOKUMENTY V MODERNÍ DIGITÁL- NÍ KNIHOVNĚ

Obsah. MZK a fonotéka - východiska Co jsme doposud udělali Co se skrývá za branou portálu Budoucnost a další možné kroky

ProArc. open source řešení pro produkci a archivaci digitálních dokumentů. Martina NEZBEDOVÁ Knihovna AV ČR, v. v. i., Praha nezbedova@knav.

Digitalizace pramenů k moderním dějinám Slezska

Jan Pokorný MULTIDATA Praha PRIMO. od čtenářského OPAC ke čtenářskému portálu

Digitální knihovna MZK a mobilní aplikace Kramerius Královéhradecká knihovnická konference

ZKUŠENOSTI S GRANTY VISK 5 A 7. Štěpánka Běhalová Muzeum Jindřichohradecka

Knihovna jako systém

FUNKCE A VYHLEDÁVÁNÍ NA PORTÁLE KNIHOVNY.CZ. PhDr. Iva Zadražilová, Moravská zemská knihovna

ZPŘÍSTUPNĚNÍ A ARCHIVACE PLNÝCH

Česká (národní?) článková bibliografie přežitek, nebo moderní služba čtenářům?

Tomáš Klimek, Referát Manuscriptorium, NKČR Olga Čiperová, AiP Beroun s.r.o.

Novela vyhlášky č. 259/ 2012 Sb., o podrobnostech výkonu spisové služby. Metodické setkání uživatelů spisové služby GORDIC

KATALOG JIHOMORAVSKÝCH HISTORICKÝCH SBÍREK V MORAVSKÉ ZEMSKÉ KNIHOVNĚ V BRNĚ

ZPŘÍSTUPNĚNÍ KARTOGRAFICKÝCH MATERIÁLŮ A DALŠÍ VÝSLEDKY PROJEKTU TEMAP

Česká digitální matematická knihovna

Řešení oblasti LTP v projektu NDK aneb zúročení 20 let zkušeností

OPATŘENÍ DĚKANA č. 4/2013 k tvorbě publikací a evidenci výsledků vědy, výzkumu, inovací a další tvůrčí činnosti. Čl.

Manuscriptorium jako základ pro virtuální badatelské prostředí

Manuscriptorium v roce 2013

I. kategorie Publikace (Týká se drtivé většiny publikačních výstupů na FFÚ VŠE v Praze)

Mobilní aplikace pro prezentaci kulturního dědictví paměťových institucí

Digitalizace HF a jeho prezentace Dostupný z

Ústřední knihovna VŠB-TU Ostrava Zpráva o činnosti za rok 2009

RETROKONVERZE KATALOGU KNIHOVNY PEDAGOGICKÉ FAKULTY UNIVERZITY J. E. PURKYNĚ V ÚSTÍ NAD LABEM

Pracovní skupina pro věcné zpracování

Knihovna jako systém

CO JE KLÍČEM KE SPOKOJENOSTI UŽIVATELE?

Knihovna - definice. Paměťové instituce 2. Knihovny - typy. Knihovny - typy. (Legislativa)

Digitalizace historických dokumentů NK ČR v r / Národní knihovna ČR projekt úspěšně realizován

Transkript:

RESTRUKTURALIZACE MANUSCRIPTORIA Zpráva k Dodatku č. 7 ke Smlouvě o spolupráci ve výzkumu a vývoji Pro rok 2009 verze 1.0 10.11.2009 AiP Beroun

Obsah 1 Úvod o dokumentu...5 1.1 Účel...5 1.2 Předpokládaný čtenář...5 Termíny a konvence...5 1.3...5 Reference...5 1.4...5 2 Úvod...5 3 Členění podle druhu dokumentu...7 3.1 Obecně o kolekcích...7 4 Členění záznamů do kolekcí...8 4.1 Členění podle typu fyzického dokumentu...9 4.2 Členění podle provenience a jazyka dokumentu...9 4.3 Členění dokumentů podle dostupných informací...10 4.4 Aplikace kolekcí v Manuscriptoriu...10 5 Určení typů dokumentů z různých zdrojů...12 5.1 Katalogy...12 5.2 Knihopis...12 5.3 Národní knihovna České republiky...13 5.4 Pracoviště digitalizace AiP Beroun...14 5.5 Digitalizované mapy...14 5.6 Arabské rukopisy Národní knihovny...14 5.7 Moravská zemská knihovna Brno...15 5.8 Zámecká knihovna Kynžvart...16 5.9 Strahovský klášter...17 5.10 Klášter Teplá...17 5.11 Soubory se známým typem dokumentu...18 5.12 University Library Wroclaw...20 5.13 Zielona Góra University Library...20 5.14 Další zdroje záznamů bez rozlišení typu dokumentu...21 5.15 Další zdroje...21 5.16 Implementace členění v Manuscriptoriu...22

5.17 Katalogy a Knihopis...23 5.18 Národní knihovna České republiky...24 5.19 Pracoviště digitalizace AiP Beroun...24 5.20 Moravská zemská knihovna Brno...25 5.21 Klášter Teplá...26 5.22 Zielona Góra University Library...26 5.23 University Library Wroclaw...27 5.24 Další zdroje záznamů bez rozlišení typu dokumentu...28 5.25 Soubory záznamů se známým typem dokumentu...29 6 Závěr...29 7 Příloha 1 - Druhy dokumentů v Památníku národního písemnictví...30 8 Příloha 2 Typy digitalizovaných dokumentů ze Zámecké knihovny Kynžvart...32 9 Příloha 3 Výpis XSL transformace typu dokumentu z elementu <form>...44

Seznam obrázků Obr. 1 Příklad členění obsahu Manuscriptoria na kolekce...8 Obr. 2 Příklad kombinování kolekcí záznamů... 11 Tabulky Tabulka 1 Přehled druhů dokumentů, které se používaly v PNP...Chyba! Záložka není definována. Tabulka 2 Seznam obsahů elementů <form> s určením typu dokumentu... 13 Tabulka 3 Typy dokumentů v záznamech z digitalizačního pracoviště AiP Beroun... 14 Tabulka 4 Identifikace typu dokumentu v MZK... 15 Tabulka 5 Typy digitalizovaných dokumentů ze Zámecké knihovny Kynžvart... 16 Tabulka 6 Seznam zkratek organizací přispívajících do Manuscriptoria... 18 Tabulka 7 Zdroje metadat se známým typem dokumentu podle jendotlivých přispěvatelů... 19 Tabulka 8 Typy dokumenů z ULW... 20 Tabulka 9 Typy dokumentů ze ZGUL... 20 Tabulka 10 Označení typu dokumentu v TEI P5... 22 Tabulka 11 Podrobnější členění dokumentů... 23 Výpisy Výpis 1 Umístění, a struktura elementu <taxonomy>... 22 Výpis 2 XSL transformace typu dokumentu z elementu <form>...chyba! Záložka není definována. Výpis 3 Ukázka XSL transformace pro analýzu elementu <physdesc> v záznamech z digitalizačního pracoviště AiP Beroun... 24 Výpis 4 Ukázka XSL transformace pro analýzu elementu <physdesc> v záznamech MZK... 25 Výpis 5 Ukázka XSL transformace pro analýzu elementu <physdesc> v záznamech ULW... 27

1 Úvod o dokumentu AiP Beroun uzavřela s Národní knihovnou České republiky dne 2.8. 2004 Smlouvu o spolupráci ve výzkumu a vývoji za účelem optimalizace zpřístupnění rukopisů a dalších historických materiálů v programu Memoriae Mundi Series Bohemica. 4.6.2009 byl k této smlouvě uzavřen dodatek č. 7, který specifikuje práce na vývoji nástrojů podporujících snadné přispívání digitálními dokumenty ze strany dalších institucí včetně zahraničních do digitální knihovny Maniscriptorium se zvláštním zřetelem na možnost jejich samostatné strukturace a spoluvytváření s Manuscriptoriem kompatibilních distribuovaných úložišť datového obsahu. Tento dokument je součástí řešení bodu 3 tohoto dodatku Restrukturalizace Manuscriptoria. 1.1 Účel Tento dokument se zabývá zjištěním informací o způsobech identifikace dokumentů podle jejich typů u jednotlivých přispěvatelů do systému Manuscriptorium. Tyto informace následně zpracovává a vytváří metodiku pro řazení dokumentů v Manuscriptoriu. 1.2 Předpokládaný čtenář Tento dokument je určen pro zadavatele (NKČR) a pro odbornou veřejnost jako přehled principů a konvencí sloužících k identifikaci různých typů dokumentů. Tvůrci aplikacíi a vývojoví pracovníci mohou těchto informací využit při pracech souvisejících se správou dokumentů. Výsledky této práce posloužily ke stanovení obecné metodiky dělení dostupných dat do kolekcí, která bude využita ve prospěch uživatelů Manuscriptoria. ENRICH MnS 1.3 Termíny a konvence. Manuscriptorium 1.4 Reference V dokumentu se odkazujeme na následující literaturu: [1] Manuscriptorium v.2.0 analýza systému, AiP Beroun 2004 [2] Interoperabilita TEI P5 / MARC21, AiP Beroun 2008 [3] The Open Archives Initiative Protocol for Metadata Harvesting, version 2.0 of 2002-06-14, http://www.openarchives.org/oai/2.0/openarchivesprotocol.htm 2 Úvod

Dokumenty obsažené v Manuscriptoriu (dále jen MnS ) lze rozdělit podle jejich typu do několika základních skupin. Jsou to především rukopisy, prvotisky, staré tisky, historické mapy a jiné vzácné dokumenty. S rozšířením počtu zdrojů záznamů přicházejících do MnS, tedy s velkým nárůstem přispěvatelů především ze zahraničí v rámci evropského projektu ENRICH, přibývají i další typy dokumentů, jako např. listiny, historická periodika, grafiky apod. Dokumenty lze také členit podle mnoha jiných například kulturníchhledisek, kupříkladu podle jazyků a místa vzniku na dokumenty západní tradice, slovanské dokumenty, řecké, hebrejské, arabské, východoasijské. Skupiny dokumentů se společnými vlastnostmi (typ dokumentu, provenience apod.) nazýváme kolekce. Aby bylo možno vytvářet kolekce dokumentů, je potřeba nalézt v jejich katalogových záznamech takové informace, na základě kterých lze dokumenty do jednotlivých kolekcí rozčlenit. Dokumenty jsou v tuto chvíli zpřístupňovány všechny společně bez jakékoliv závislosti na jejich typu nebo jiných vlastnostech. Předmětem badatelského zájmu ale často bývají určité skupiny dokumentů s nějakými společnými vlastnostmi. Ukazuje se tedy, že je vhodné uživateli zpřístupnit dokumenty také samostatně ve skupinách podle jejich typů (kolekcích), což v rozsáhlém katalogu jistě významně usnadní orientaci. Jako nejzákladnější členění dokumentů v MnS se ukazuje jejich rozdělení podle typu dokumentu na rukopisy, prvotisky, staré a vzácné tisky, mapy, listiny, historická periodika, grafiky a ostatní nezařazené dokumenty. V tomto dokumentu se nejprve zabýváme shrnutím informací o typech dokumentů z jednotlivých zdrojů (přispěvatelů MnS). Následně pak je stanovena metodika, jak pro daný zdroj záznamů tyto informace využít ke stanovení typu dokumentu a vzniku metadat, použitelných pro tvorbu výše uvedených kolekcí.

3 Členění podle druhu dokumentu 3.1 Obecně o kolekcích Vzhledem k možnostem systému použitému musíme také uvažovat o tom, jakým způsobem toto členní promítnout do uživatelského prostředí. Boudou použitely dva způsoby tvorby/vyčlenění skupin/kolekcí nesoucích společné znaky. I když jsou tyto úvahy spíše technické je vhodné je zmínit, protože ovlivní a při správném začlenění do uživatelského prostředí zvýší uživatelský konfort. Z heldiska správy dat i jejich prohledávání jde o dva způsoby Fyzické rozdělení dat do samostatných řezů DB. Tento způsob přináší možnost práce se samostatnými indexy řezu, což příslušný index vyčistí od informací příslušejících vzdálenějším, do kolekce nepříslušejícím datům. Různé řezy le následně libovolně kombinovat, takže výběr řezů se uživateli jeví jako jediný zdroj, se kterým může pracovat a nad kterým může vyhledávat obvyklým způsobem včetně toho, že dostupné indexy jsou prolnutím zvolených řezů. Možnost vytvoření těchto kolekcí je podmíněna efektivní správou dat, informace co kam (nejspíš) patří musí vytvořit odborník nebo musí být přímo odvoditelné ze zdroje. Příslušnost do více kolekcí je nežádoucí (systémové duplicity). Zařazení do virnuálních kolekcí. Tento způsob ponechává data součástí databáze (jedno zda úplné, či složené z výše uvedených zvolených řezů). Kolekce vzniká aplikací předpřipraveného (pro uživatele neviditelného) dotazu. Toto základní vyhledání může být samozřejmě doplněno dotazem uživatele. Dokumenty mohou být součástí mnoha virtuálních kolekcí a přitom tento fakt negeneruje duplicity. Indexy takto vytvořených kolekcí však společné pro všechna data zahrnutá do takto tvořených kolekcí. Platí tedy princip něco za něco J. Je zřejmé, že obě metody mají rozdílné vlastnosti. Mohou se podle koncepce správy dat doplňovat, částečně překrývat, zastupovat. Způsob použití si bude volit uživatelpodle svých preferencí a potřeb. To je však předmětem samostatné analýzy. Typy dokumentů z pohledu knihovníka lze definovat velice jemně. Dokonce mnohem jemněji, než jak je možno rozlišit dokumenty pro technickou realizaci kolekcí v MnS ve smyslu výše uvedených řezů. Tabulka uvedená v Příloze 1 ukazuje přehled všech druhů dokumentů, tak jak se definují v Památníku národního písemnictví. Každému takovémuto typu dokumentu lze přiřadit speciální informaci, která vychází z Mezinárodního desetinného třídění, tzv. kód konspektu.

4 Členění záznamů do kolekcí Jak již bylo naznačeno v úvodu, MnS soustřeďuje informace o širokém spektru historických dokumentů různých typů, obsahů i proveniencí. V rámci celého obsahu Manuscriptoria lze data o historických dokumentech členit do logických celků podle různých hledisek. Tyto logické celky jsou nazývány kolekcemi. Kolekce mohou být tvořeny dokonce na různých principech, jak bylo výše naznačeno. Množství kolekcí tedy není v principu nikterak omezeno. Navíc, každá kolekce může být dále členěna do podkolekcí, pokud se to ukáže uživateli použitelné, přínosné a vítané. Každý dokument může být zároveň členem libovolného počtu virtuálních kolekcí (viz výše). Na Obr. 1 je uveden příklad možných členění obsahu podle různých kritérií do kolekcí a podkolekcí. Je však třeba opakovaně připomínat, že před aplikací technických prostředků předchází existence, rozpoznatelnost a případně i tvorba metadat. Při návrhu řazení dokumentů do kolekcí je potřeba si uvědomit, že pro různá kritéria členění bude existovat vždy určitá skupina dokumentů, kterou nelze do dané kolekce jednoznačně zařadit nebo které svým charakterem patří zároveň do více kolekcí (viz výše Obecně o kolekcích ). To zpravidla proto, že v daném okamžiku členění není z nějakého důvodu známo, do které kolekce v rámci daného členění dokument zařadit, nebo proto, že dokument spadá do kolekce, která v rámci daného členění nebyla vytvořena, případně aktuální popis dokumentu je příliš stručný nebo prostě odborně chudý. Kupříkladu rozčleníme-li dokumenty podle jejich typu do kolekcí: Rukopisy, Inkunábule, Staré tisky a Mapy, jistě se naleznou záznamy např. o listinách, historických periodikách či grafikách, které spolu se záznamy, u kterých nelze rozhodnout o typu dokumentu, prostě budou dočasně zařazeny do kolekce Ostatní. Pokud bude později vytvořena kolekce Listiny, přejdou odpovídající dokumenty do této kolekce z kolekce Ostatní. Obecně tento fenomén řeší virtuální kolekce (opět viz Obecně o kolekcích ). Znovu je nutno zdůraznit, že za těmito prostými slovy se skrývá množství individuální odborné práce. Obr. 1 Příklad členění obsahu na kolekce

4.1 Členění podle typu fyzického dokumentu Jedním ze základních kritérií, podle kterých lze fyzické dokumenty rozdělit, je typ dokumentu. Pak rozlišujeme tyto základní typy historických dokumentů: Rukopisy Inkunábule Staré tisky Mapy Ostatní Při realizaci evropského projektu ENRICH do MnS přibývají další typy dokumentů a tak lze skupinu tvořící kolekci Ostatní dále jemněji rozdělit na: Listiny Historická periodika Grafiky Ostatní Takovýto způsob členění není řešen přísně podle knihovnických pravidel, ale dokumenty jsou takto rozlišovány především podle způsobu údržby digitálních dat příslušejícím k fyzickým dokumentům. Kromě samotné údržby má členění vliv především jejich komfortnost zpřístupnění koncovým uživatelům.. Tento způsob členění obsahu do kolekcí podle typu dokumentu má řadu výhod. Mimo jiné také to, že ke každé kolekci dokumentů lze v uživatelském prostředí MnS přistupovat individuálně a to jak způsobem vyhledávání, tak i při prezentaci vyhledaných informací. 4.2 Členění podle provenience a jazyka dokumentu Častým předmětem zájmu badatelů jsou také skupiny dokumentů určitého místa vzniku nebo psané určitým jazykem. Z tohoto pohledu lze fyzické dokumenty rozdělit do kolekcí, které mohou soustřeďovat například tyto dokumenty: dokumenty západné provenience (západoevropské jazyky) slovanské dokumenty dokumenty psané latinsky řecké dokumenty arabika persika hebreika východoasijské dokumenty ostatní Vzhledem k tomu, že mezi těmito typy dokumentů nutně nastávají průniky, půjde zřetelně o oblast aplikace virtuálních kolekcí, kde jeden dokument může oprávněně patřit do více kolekcí.

4.3 Členění dokumentů podle dostupných informací Dokumenty můžeme rozdělit také podle množství a kvality informací, které jsou v elektronické podobě k jednotlivým fyzickým dokumentům dostupné. Do kolekcí tedy můžeme rozdělit dokumenty, ke kterým existuje či neexistuje digitální kopie, existují či neexistují plné texty, audio záznamy a další. Fyzické dokumenty o kterých existují záznamy lze samozřejmě členit i podle mnoha dalších kritérií a tato členění se mohou v MnS promítnout a ve virtuálních kolekcích i prolínat. Příkladem je členění na dokumenty z oblasti filosofie, teologie, medicíny, matematiky, přírodních věd, práva a ostatních oblastí. Zde je zřejmý přesah a nejednoznačnost zařazení do jediné kolekce a tedy plná oprávněnost existence kolekcí virtuálních a tedy možnost zařazení jediného dokumentu do více kolekcí. 4.4 Aplikace kolekcí v Manuscriptoriu Koncepce členění obsahu do kolekcí umožňuje poskytnutí celé řady nových služeb uživatelům. Především je to možnost postupné navigace uživatele v rozsáhlém katalogu až k množině dokumentů, které obsahují předmět zájmu uživatele. Pro tento účel je možné kolekce dále členit do tzv. podkolekcí (viz Obr. 1) a také při hledání dokumentů tyto kolekce mezi sebou kombinovat. Úkolem MnS je mimo jiné také poskytovat data z jeho katalogu evidenčních záznamů prostřednictvím univerzálních protokolů do partnerských systémů. Tento proces se děje automaticky na základě protokolu OIA-PMH (Open Archives Initiative Protocol for Metadata Harvesting. Jeho popis je uveden v [3]. S využitím tohoto rozhraní data repository (zařízení pro poskytování metadat) MnS poskytuje metadatové záznamy harvesterům, tedy externím zařízením pro sklízení dat, jejich zpracování a poskytování dalších služeb nad těmito daty. Jednou z vlastností rozhraní OAI-PMH je možnost nejen poskytovat/přebírat všechny záznamy z daného zdroje, ale také omezit množinu poskytovaných záznamů podle předem dohodnutých pravidel. Tuto vlastnost nazýváme selektivní harvesting. Takto lze např. předávat a přebírat záznamy pouze od určitého data uložení do databáze. Významnou vlastností z pohledu selektivního harvestingu je i možnost poskytování definovaných sad záznamů (sets). Data repositories mohou svoje záznamy organizovat do definovaných sad (kolekcí), které mohou být jednoduchým seznamem určitých záznamů, záznamy ale také mohou být organizovány hierarchicky. Celý mechanismus sad v rámci OAI-PMH je podrobně popsán v [3]. Z výše uvedného je zřejmé, že koncepce členění záznamů do kolekcí také umožňuje využití mechanismu selektivního harvestingu při poskytování metadat prostřednictvím protokolu OAI-PMH.

V následujícím příkladu si ukážeme možnosti postupné navigace uživatele či selektivního poskytování metadat. Předpokládejme, že je obsah katalogu rozčleněn do následujících kolekcí: dle typu dokumentu - rukopisy, staré tisky, ostatní dle provenience - evropské, arabské, perské, hebrejské, ostatní dle kvality dat - digitalizované, nedigitalizované Postupným průnikem těchto kolekcí při vyhledávání můžeme získat požadované množiny záznamů jako např. všechny hebrejské rukopisy, ke kterým existuje digitální kopie dokumentu, množinu z hlediska provenience nezařazených starých tisků, ke kterým existuje digitální kopie, nebo například ostatní typy dokumentů perských s digitální kopií atd. Princip postupné navigace je osvětlen na Obr. 2. Obr. 2 Příklad kombinování kolekcí záznamů

5 Určení typů dokumentů z různých zdrojů Základním úkolem při restrukturalizaci dat je rozčlenění jeho záznamů o fyzických dokumentech do sady kolekcí podle typu dokumentu. Tento na první pohled jednoduchý úkol v sobě ale nese řadu problémů. Do MnS přicházejí data (záznamy o jednotlivých historických dokumentech) z mnoha různých zdrojů prakticky jak z České republiky, tak z mnoha dalších evropských knihoven a institucí. Každá z těchto institucí přispívá svými záznamy o dokumentech jednoho či více typů. Vlastní záznamy (ať ve formátu MASTER, MARC či TEI P5 ) velmi často neobsahují informaci o typu dokumentu a pokud ano, každý formát ji uchovává v jiné podobě. Tak např. v MARC21 je druh dokumentu deklarován několikrát a různým způsobem. XML formát TEI 4 (MASTER) má pro tento údaj určený element <physdesc><form><p> </p></form></physdesc>, kam se informace zapisuje volně v textové podobě, přičemž jsou definovány tři možnosti: Rukopisy, Prvotisky, Staré tisky; další druh dokumentů lze dodefinovat podle vzoru MARCovského Konspektu. Volnost zápisu takto uchované informace o typu dokumentu ovšem velmi znesnadňuje automatizované zpracování dat. V XML formátu TEI P5 je k uchování typu dokumentu určen element <taxonomy>. Podrobnější informace o možnostech uložení informace o druhu dokumentu jsou uvedeny v [2]. Další formáty záznamů přicházejících z principu nemusí vůbec umožnit identifikaci dokumentu z hlediska jeho typu nebo tato informace není uváděna. To se týká především exportů záznamů z tabulek databázových systémů (Access apod.). Z výše uvedeného je zřejmé, že pro každý zdroj záznamů je potřeba najít speciální postup, jak z dostupných informací jednoznačně určit skutečný typ fyzického dokumentu, ke kterému je elektronický záznam přebírán. Dále je provedena analýza dostupných informací z jednotlivých zdrojů s ohledem na určení informace o typu fyzického dokumentu. 5.1 Katalogy Tam kde je to možné, lze informace o typu dokumentu zjistit s použitím záznamů z tištěných katalogů. V MnS jsou použity digitalizované záznamy z Bartošova katalogu rukopisů Národního Muzea v Praze, z Truhlářova katalogu českých rukopisů, z Truhlářova katalogu latinských rukopisů a z Dolchova katalogu (Německé středověké rukopisy, především z oddělení XVI.). Jak již lze vyčíst z názvů těchto katalogů, fyzické dokumenty, ke kterým existují záznamy z těchto katalogů, lze označit jako rukopisy. 5.2 Knihopis MnS také obsahuje ke starým tiskům digitalizované záznamy z Knihopisu. Knihopis je bibliografická databáze, kdežto katalog MnS je orientován exemplářově. Záznamy Knihopisu musely být proto pro účely použití v MnS převedeny do exemlářové podoby. To má za následek, že jeden záznam Knihopisu vytvořil v MnS jeden nebo více záznamů k fyzickým dokumentům. Dokumenty, ke kterým existují v MnS záznamy z Knihopisu, můžeme označit za staré tisky.

5.3 Národní knihovna České republiky Dokumenty (resp. záznamy k fyzickým dokumentům) v MnS, jejichž zdrojem je Národní knihovna České republiky lze rozčlenit do skupin podle typu dokumentu s využitím jejich signatury. Ta skrývá následující pravidla: Rukopis - signatura začíná římskou číslicí Inkunabule - signatura začíná arabskými číslicemi v rozsahu 39-44 Mapy - signatura začíná arabskými číslicemi 62 Tisky - všechny ostatní signatury V případě vstupních záznamů ve formátu MASTER (Master+) lze toto pravidlo využít v kombinaci s obsahem elementu <form>. Ten je uváděn při ručním popisu dokumentů ve formátu MASTER především v Národní knihovně ČR. Následující Tabulka 2 obsahuje všechny formy zápisu typu dokumentu v elementu <form> schématu MASTER+ v záznamech MnS. Již na první pohled je z této tabulky zřejmé, že vyjádření typu dokumentu je provedeno volnou textovou formou a proto strojově poměrně obtížně zpracovatelné. staré tisky 094 Tisk, normální 094 Tisk, Normální 094 Mapy 095 Mapa 095 mapa 095 prvotisky 093 rukopisy 090 Kniha grafické listy Vedut kniha tisk 094 Codex. Manuscript 090 Manuscript. 090 Codex, codex Fragment anuscript 090 Inkunábule 093 Inkunábule. 093 Rukopis 090 Manuscript 090 Rukopis, zlomek. 090 Rukopis 090 Rukopis. 090 Starý tisk 094 kramářské tisky 094 Hudebnina, tisk. 094 Hudebnina, rukopis. 090 Hudebnina, rukopis. 090 Starý tisk. 094 Mapa, starý tisk. 095 plánek rukopis 090 Plánek rukopis 090 Svitek rukopis 090 Palmové listy rukopis 090 Rukopis 090 Codex. Knyga Bifolium Sheet Kodex Kniha Kniha Book Booklet volnými listy volné složky Volné složky Ednolist Pohlednice Strojopis Tabulka 1 Seznam obsahů elementů <form> s určením typu dokumentu

5.4 Pracoviště digitalizace AiP Beroun Zde vznikají záznamy k dokumentům, které jsou na tomto pracovišti právě digitalizovány. Dokumenty pocházejí nejen z Národní knihovny České republiky, ale také od různých přispěvatelů v rámci projektu VISK6. Popisy těchto dokumentů se provádějí ve formátu MASTER+. Pouze u některých popisů je ale uváděn typ dokumentu, a to v elementu <form>, jako v předchozím případě. Digitalizace AIP Beroun (VISK 6) Rukopisy Staré tisky Inkunábule Mapy (tisky) Tabulka 2 Typy dokumentů v záznamech z digitalizačního pracoviště AiP Beroun 5.5 Digitalizované mapy Historické mapy, digitalizované na digitalizačném pracovišti AiP Beroun tvoří samostatný zdroj záznamů. U tohoto zdroje dat můžeme identifikovat typ dokumentu jako mapa. 5.6 Arabské rukopisy Národní knihovny Dalším samostatným zdrojem záznamů Manuscriptoria je balíček záznamů o nedigitalizovaných arabských rukopisech Národní knihovny České republiky. U tohoto zdroje identifikujeme typ dokumentu jako rukopis.

5.7 Moravská zemská knihovna Brno Signaturu pro identifikaci druhů dokumentů používá i Moravská zemská knihovna v Brně. Pravidla pro jejich určování jsou ale jiná než např. v Národní knihovně. V tabulce 4 jsou uvedeny počáteční znaky signatury (sloupeček Lokace ) pro různé typy dokumentů tak, jak jsou rozlišovány v Moravské zemské knihovně. Kmenový fond Staré tisky Lokace ST5 ST4 ST3 ST2 ST1 STS Ks Fr STPK Komenský Zednářská literatura Pedagogická knihovna Uzavřené historické celky Knihovna hrabat Khuen-Belasi Zámecká knihovna Kübecků von Kübau (torzo) MKK Zámecká knihovna Lysá nad Labem BKB (torzo) L Chirurgické grémium Jihlava JCH Knihovna 1. německého gymnázia v Brně G Zámecká knihovna hrabat Chorinských CH Knihovna kláštera kapucínů ve Znojmě ZK Knihovna piaristů v Mikulově MP Knihovna koleje redemptoristů ve Svitavách SR Muzejní knihovna z Uherského Brodu UB Grafické sbírky Mollova sbírka map Schramova sbírka vedut Schramova sbírka potrétů Moll Skř.1 Skř.2 Tabulka 3 Identifikace typu dokumentu v MZK Grafiky Staré mapy Prvotisky Prvotisky Skř.1 STMpa PT1 PT2 PT3 PT4 CHP ZKP MkP Rukopisy Rukopisy (kmenový fond) RKP Rukopisy (kmenový fond) RKP2 Rukopisy dietrichsteinské knihovny v Mikulově Mk Knihovna hrabat Khuen-Belasi BKB-RKP Zámecká knihovna Kübecků von Kübau (torzo) MKK-RKP Knihovna piaristů v Mikulově MP-RKP Zámecká knihovna hrabat Chorinských CH-RKP Mollova sbírka Moll-RKP Mikrofilmy rukopisů Skř.17, MF Deponáty Rukopisy kláštera benediktinů v Rajhradě R Rukopisy kláštera augustiniánů na Starém Brně A Rukopisy kláštera minoritů v Brně Mn

5.8 Zámecká knihovna Kynžvart Naprosto odlišná je situace v Zámecké knihovně Kynžvart. U dokumentů z tohoto zdroje záznamů není možné ze samotné signatury určit typ dokumentu. Signatura (historická, z poloviny 19. století) označuje přesnou lokaci v knihovně a inventární číslo (z poloviny 60. let 20. století) zase jen číselnou řadu. Proto byla řešiteli laskavě poskytnuta Tabulka 4, zachycující typ dokumentu, tedy zda se jedná o rukopis, prvotisk či tisk. pro jednotlivé signatury digitalizovaných dokumentů. Kompletní tabulka je uvedena v Příloze 2, zde je uveden jen jeí počátek. Poř.č. Signatura Nová rkp Čáda incun. tisk ev. Název popisu 1 2-D-4 835 1 1 - - Liber carminum bucolicorum 2 3-D-9 1432 - - - 1 Lucio Marineo Siculo: Obra Compuestta. 1533 3 3-D-22 1449 1 3 - - Sebastian Grüner: Uiber die ältesten Sitten und Gebräuche 1826 4 *5-B-3 2741 - - - 1 Giovanni Battista della Porta: Magia naturalis. Libri viginti, 1597 5 *5-D-1 2894 - - - 1 Olaus Magnus: Historia de gentibus septentrionalibus 1558 6 6-A-3 3416 - - - 1 Andreas Cellarius: Harmonia macrocosmica seu Atlas universalis et novus 1661 7 7-D-8 5093 - - - 1 Albrecht Dürer: Vnderweysung der messung 1525 přív. 7-D-8 přív. 5093 - - - x Albrecht Dürer: Etliche vnderricht zu befestigung der Stett, 1527 přív. 7-D-8 přív. 5093 - - - x Albrecht Dürer: Herinn... begriffen von menschlichen Proportion 1528 8 7-D-23 5110 - - - 1 Das distilierbuoch 9 8-C-11 5649 1 11 - - Pseudo-Alberti Magni,... Compendium theologicae atd. Tabulka 4 Typy digitalizovaných dokumentů ze Zámecké knihovny Kynžvart

5.9 Strahovský klášter Záznamy k dokumentům ze strahovského kláštera jsou rozlišovány následujícím způsobem: Rukopisy Prvotisky Tisky signatura začíná DA-DK a DS-DV signatura začíná DL-DR, dále signatury začínajícící S všechny ostatní signatury V signaturách D je ovšem řada vyjímek. DE III 18-24 a DT I 30 nejsou přísně vzato rukopisy, ale soubory kreseb; na signatuře DR pak jsou nejen prvotisky, ale i vzácné paleotypy a tisky (např. DR III 25, DR I 21) a tam je nutno rozlišovat kus od kusu. Zlomky, tj. vše značené Zl. + číslo jsou míchané fragmenty rukopisů, prvotisků a tisků. 5.10 Klášter Teplá Záznamy k dokumentům z kláštera v Teplé byly pořízeny přepisem původních tištěných katalogů s pomocí textového editoru MS Word do elektronické podoby a následně převedeny do XML formátu vhodného pro použití v katalogu Manuscriptoria (MASTER). Existují záznamy k dokumentům typu rukopis, inkunábule a starý tisk. Za současného stavu metadat však není možné rozhodnout, jaký typ dokumentu ten který metadatový záznam od tohoto přispěvatele popisuje.

5.11 Soubory se známým typem dokumentu Metadatové záznamy od některých přispěvatelů přicházejí do MnS jako více datových zdrojů, tzn. že od jednoho přispěvatele přicházejí metadata v několika samostatných balíčcích se záznamy k dokumentům stejného typu. Z jedné instituce tedy může přicházet několik datových zdrojů. Prakticky to znamená, že máme-li k dispozici od určitého přispěvatele datový zdroj se záznamy k listinám, můžeme při zpracování tohoto zdroje metadat do TEI P5 dokumentů doplnit do záznamů informaci o tom, že dokument, ke kterému záznam patří je typu listina. Tyto informace velmi usnadňují jednoznačné označení typu záznamu k danému dokumentu. Cestou předávání samostatných balíčků záznamů pro jednotlivé typy dokumentů šla většina zahraničních přispěvatelů dodávajících záznamy v rámci projektu ENRICH. Pro snadnější orientaci v následujících přehledech balíčků záznamů jsou uvedeny v následující tabulce jsou uvedene zkratky zahraničních organizací přispívajících svými záznamy do Manuscriptoria. BNCF Biblioteca Nazionale Centrale di Firenze Florence, Italy BNE Biblioteca Nacional de Espana Madrid, Spain BNL The National Library of Belarus Minsk, Belarus BUTE The Budapest University of Technology and Budapest, Hungary Economics DSP St. Pölten Diocese Archive St. Pölten, Austria HUL Heidelberg University Library Heidelberg, Germany IMI Institute of mathematics and informatics Vilnius, Lithuania KNM Knihovna Národního Muzea Prague, Czech Republic KU Københavns Universitet, Nordisk Copenhagen, Denmark Foskningsinstitut LUL Lund University Library Lund, Sweden MZK Moravian Library Brno, Czech Republic NKP Národní knihovna ČR Prague, Czech Republic NLR National Library of Romania Bucharest, Romania NPKK Národní pedagogická knihovna komenského Prague,. Czech Republic NULI The National and University Library of Iceland Reykjavík, Iceland PNES Patrimonio Nacional Palacio Real, Madrid, Spain SAM Stofnun Árna Magnússonar í íslenskum fræðum Reykjavík, Iceland TSL Holy Trinity-St. Sergius Lavra Sergiev Posad, Moscow district, Russia TUL Toruń University Library Toruń, Poland UCM Complutense University of Madrid Madrid, Spain ULIB University Library in Bratislava Bratislava, Slovakia ULW University Library Wroclaw Wroclaw, Poland UZK Computer Science for the Humanities - Cologne, Germany Universität zu Köln VUL University Library Vilnius Vilnius, Lithuania ZGUL Zielona Góra University Library Zielona Góra, Poland Tabulka 5 Seznam zkratek organizací přispívajících do Manuscriptoria

V následující tabulce je zachycen přehled přispěvatelů do Manuscriptoria a jejich zdrojů metadat se typem dokumentu. Tabulka 6 Přispěvatel VUL BNCF BNE BUTE DSP HUL IMI KU NULI SAM LUL NPKK Torun TSL UZK Zdroj metadat Grafiky Rukopisy Mapy (tisky) Rukopisy Mapy (rukopisy) Staré tisky Mapy (tisky) Inkunábule Grafiky Rukopisy Tisky Rukopisy Listiny Rukopisy Rukopisy Rukopisy Rukopisy Rukopisy Rukopisy Tisky Rukopisy Tisky Rukopisy Rukopisy Zdroje metadat se známým typem dokumentu podle jendotlivých přispěvatelů

5.12 University Library Wroclaw University Library Wroclaw přispívá do Manuscriptoria záznamy k typům dokumentům uvedeným v následující tabulce. Bohužel záznamy nejsou rozděleny v samostatných balíčcích podle typu dokumentu. Tisky z tohoto zdroje jsou rozlišovány ještě ve třech podtypech. ULW Tisky Tisky Tisky Grafiky Rukopisy Inkunábule Tabulka 7 Typy dokumenů z ULW Mapy Ostatní Musicalia 5.13 Zielona Góra University Library Stejně tak jako v ULW záznamy k dokumentům z Zielona Góra University Library nejsou předávány v oddělených balíčcích podle typu dokumentu. Typy dokumentů, jejichž záznamy jsou přebírány ze ZGUL, ukazuje Tabulka 8. ZGUL Tabulka 8 Typy dokumentů ze ZGUL Rukopisy Mapy (tisky) Tisky Grafika Listiny

5.14 Další zdroje záznamů bez rozlišení typu dokumentu V tomto odstavci jsou uvedeni přispěvatelé, dodávající záznamy ke svým dokumentům bez rozlišení typu. The National Library of Belarus (BNL) přispívá do MnS prvotisky a starými tisky. Tyto záznamy jsou dodávány bez identifikace, zda se jedná o inkunábule nebo starý tisk. Knihovna Národního Muzea (KNM) v době zpracování tohoto dokumentu předala do Manuscriptoria metadatové záznamy k nedigitalizovaným dokumentům. Všechny předané záznamy byly k dokumentům typu rukopis. National Library of Romania (NLR) předává záznamy k inkunábulím a ostatním starým tiskům. University Library in Bratislava (ULIB) přispívá do Manuscriptoria záznamy o rukopisech, inkunábulích i starých tiscích. Zámecká knihovna Kynžvart datový zdroj záznamů k nedigitalizovaným dokumentům obsahuje záznamy k různým typům dokumentů, rukopisům, inkunábulím a ostatním starým tiskům. 5.15 Další zdroje Gorkovo??? Narodni vedecka knihovna jmenem Gorkovo v Odesse Gromadzki??? ULW Madej??? ULW Tepla Rukopisy přesunuto Inkunábule tisky Kynzvart??? přesunuto - jen digitalizované Litva??? OSZK??? VKOL?????? - v době odevzdání dokumentu nebylo rozhodnuto a dořešeno

5.16 Implementace členění v Manuscriptoriu Podle typu dokumentu Interním formátem pro uchovávání evidenčních záznamů v Manuscriptoriu je XML formát TEI P5. Schéma TEI P5 využívá k uložení informace o typu dokumentu element <taxonomy>. Výpis 1 ukazuje umístění a strukturu tohoto elementu v rámci TEI P5. Z výpisu je patrný i způsob zápisu informace o typu dokumentu rukopis. Tabulka 9, převzatá z Analýzy interoperability [2] udává hodnoty pro označení některých typů fyzických dokumentů ve schématu TEI P5. <?xml version="1.0" encoding="utf-8"?> <TEI> <teiheader> <filedesc> <titlestmt><title/></titlestmt> <publicationstmt><p/></publicationstmt> <sourcedesc><p/></sourcedesc> </filedesc> <encodingdesc> <classdecl> <taxonomy xml:id="tax.mns"> <category xml:id="tax.mns.conspectus"> <catdesc>conspectus</catdesc> <category xml:id="tax.mns.conspectus.090"> <catdesc>manuscript</catdesc> </category> </category> </taxonomy> </classdecl> </encodingdesc> </teiheader> <facsimile> <graphic/> </facsimile> </TEI> Výpis 1 Umístění a struktura elementu <taxonomy> 09 Rukopisy, prvotisky, staré tisky. Vzácná a pozoruhodná díla Kodikologie se řadí do předmětové kategorie. Historie a pomocné historické vědy. Biografické studie pod 930 090 Manuscripts, rare books, other rare printed materials 093 Prvotisky 093 Incunabula 094 Staré tisky 094 Old prints 094.5 Tisky (19.stol.) 094.4 Prints (19th century) 095/096 Vzácná díla 095/097 Rare prints Tabulka 9 Označení typu dokumentu v TEI P5

Podle obsahu dokumentu Podle obsahu lze dále zjednodušeně rozdělit data takto: Druh dokumentu Kód Konspektu 1 druh dokumentu Kód Konspektu 2 obsah dokumentu Rukopisy 09 Rukopisy mapy 09 912 Rukopisy listiny 09 930.2 347.961.4 Tisky 093/096 Tisky inkunábule 093 Tisky staré tisky 094 Tisky vzácné tisky 095/096 Mapy 912 Tisky inkunábule mapy 093 912 Tisky staré tisky mapy 094 912 Grafika 76 Tisky inkunábule grafika 093 76 Tisky staré tisky grafika 094 76 Periodika 050 Bibliografie 011/016 Katalogy 017/019 Tabulka 10 Podrobnější členění dokumentů Díky potřebě efektivního a co možná nejjednoznačnějšího mechanismu pro členění dokumentů podle jejich typu jsou informace o typu dokumentu v rámci systému MnS uchovávány nejen v samotných evidenčních záznamech TEI P5, ale také vedle toho v datových strukturách správního systému MnS. Toto řešení umožňuje mnohem rychlejší a jednodušší vyhledání určitých typů dokumentů a zjednodušuje manipulaci s nimi jak ve správním systému, tak i při tvorbě prezentační vrstvy Manuscriptoria. 5.17 Katalogy a Knihopis Do Manuscriptoria byly vloženy mimo jiné také zdigitalizované záznamy z některých tištěných katalogů rukopisů, jak je uvedeno v 5.1. Při převodu záznamů z katalogů rukopisů lze do TEI P5 dokumentu vložit informaci o typu dokumentu rukopis. Dokumenty, ke kterým existují záznamy z digitalizovaného Knihopisu, můžeme označit jako starý tisk.

5.18 Národní knihovna České republiky Záznamy pořizované v Národní knihovně ČR jsou zpravidla opatřeny elementem <form>, který v sobě nese informaci o typu dokumentu (viz odstavec 5.3). Z této informace se vytvoří obsah TEI P5 elementu <taxonomy> XSL transformací. V Příloze 3 je uvedena část XSL transformace,vytvářející element <taxonomy> 5.19 Pracoviště digitalizace AiP Beroun Tam, kde není možné zjistit typ dokumentu ze signatury se obdobným způsobem, jako v předchozím případě u záznamů vzniklých na digitalizačním pracovišti AiP Beroun, zpracuje informace z elementu <form> a vytvoří se obsah elementu <taxonomy> ve vzniklém TEI P5 záznamu. U záznamů, které neobsahují informaci o typu dokumentu v elementu <form> se provede analýza elementu <physdesc> a tam, kde je to možné se určí typ dokumentu. Ukázka XSL transformace pro analýzu elementu <physdesc> je uvedena zde: <xsl:template match="/record/physdesc"> <xsl:variable name="doct"> <xsl:choose> <xsl:when test="descendant::*[contains(.,'nkunábule')]"> <xsl:text>093</xsl:text> <xsl:when test="descendant::*[contains(.,'tarý tisk')] [contains(.,'mapa') or contains(.,'mapa')]"> <xsl:text>095</xsl:text> <xsl:when test="descendant::*[contains(.,'tarý tisk')]"> <xsl:text>094</xsl:text> <xsl:when test="descendant::*[contains(.,'ukopis')]"> <xsl:text>090</xsl:text> </xsl:choose> </xsl:variable> <xsl:if test="string-length($doct)=0"> <xsl:for-each select="descendant::*/text()"> <xsl:text>elm: </xsl:text> <xsl:value-of select="."/> </xsl:for-each> <xsl:for-each select="descendant::*/@*"> <xsl:text>att: </xsl:text><xsl:value-of select="."/> </xsl:for-each> </xsl:if> </xsl:template> Výpis 2 Ukázka XSL transformace pro analýzu elementu <physdesc> v záznamech z digitalizačního pracoviště AiP Beroun

5.20 Moravská zemská knihovna Brno Moravská zemská knihovna v Brně důsledně rozlišuje typy dokumentů v signaturách (viz odstavec 5.7). Obsah elementu <taxonomy> lze generovat přímo podle signatury dokumentu. Tam, kde z nějakého důvodu selhává popsaný způsob získání informace o typu dokumentu, lze tuto informaci zjistit analýzou obsahu elementu <physdesc> tak, jak je ukázáno na příkladu XSL transformace: <xsl:template match="/record/physdesc"> <xsl:variable name="doct"> <xsl:choose> <xsl:when test="descendant::*[contains(.,'grafika, Tisk')]"> <xsl:text>gra</xsl:text> <xsl:when test="descendant::*[contains(.,'tisk, Normální')]"> <xsl:text>094</xsl:text> <xsl:when test="descendant::*[contains(.,'mapa, Mapa')]"> <xsl:text>095</xsl:text> <xsl:when test="descendant::*[contains(.,'staré tisky')]"> <xsl:text>094</xsl:text> <xsl:when test="descendant::*[contains(.,'grafické listy')]"> <xsl:text>gra</xsl:text> <xsl:when test="descendant::*[contains(.,'historické mapy')]"> <xsl:text>095</xsl:text> <xsl:when test="descendant::*[contains(.,'mapa, Jiné')]"> <xsl:text>095</xsl:text> <xsl:when test="descendant::*[contains(.,'prvotisky')]"> <xsl:text>093</xsl:text> <xsl:when test="descendant::*[contains(.,'fotografie')]"> <xsl:text>pht</xsl:text> <xsl:when test="descendant::*[contains(.,'rukopisy')]"> <xsl:text>090</xsl:text> </xsl:choose> </xsl:variable> <xsl:if test="string-length($doct)=0"> <xsl:text> soubor: </xsl:text> <xsl:value-of select="ancestor::record/@fname"/> <xsl:for-each select="descendant::*/text()"> <xsl:text> elm: </xsl:text> <xsl:value-of select="."/> </xsl:for-each> <xsl:for-each select="descendant::*/@*"> <xsl:text> att: </xsl:text> <xsl:value-of select="."/> </xsl:for-each> </xsl:if> </xsl:template> Výpis 3 Ukázka XSL transformace pro analýzu elementu <physdesc> v záznamech MZK

5.21 Klášter Teplá Záznamy k rukopisům, prvotiskům a ostatním starým tiskům z kláštera v Teplé jsou pořízeny jako retrokonverze tištěných katalogů přepisem do elektronické podoby v editoru MS Word. Informace o typu dokumentu zde odpovídá umístění signatury v dokumentu MS Word. V původní konverzi do XML nebyla tato informace pro identifikaci typu dokumentu použita. Pro určení typu dokumentu u těchto záznamů je proto nutné upravit a opakovat původní retrokonverzi. Ta bude na rozdíl od původní konverze do formátu MASTER provedena do v současné době používaného formátu TEI P5. 5.22 Zielona Góra University Library Stejně jako v předchozím případě poskytuje i Zielona Góra University Library záznamy do Manuscriptoria jako jeden datový zdroj bez rozlišení typu dokumentu. I pro tento případ byla vytvořena XSL transformace, která na základě analýzy obsahu elementu <physdesc> umožňuje určit typ dokumentu. Ilustrace tohoto postupu v případě ZGUL je uvedena ve Chyba! Nenalezen zdroj odkazů.. <xsl:template match="/record/physdesc"> <xsl:variable name="doct"> <xsl:choose> <xsl:when test="descendant::*[contains(.,'starodruk')]"> <xsl:text>094</xsl:text> <xsl:when test="descendant::*[contains(.,'rękopis') or contains(.,'r kopis')]"> <xsl:text>090</xsl:text> <xsl:when test="descendant::*[contains(.,'mapa') or contains(.,'mapy')]"> <xsl:text>095</xsl:text> <xsl:when test="descendant::*[contains(.,'grafika')]"> <xsl:text>gra</xsl:text> <xsl:when test="descendant::*[contains(.,'list')]"> <xsl:text>cht</xsl:text> </xsl:choose> </xsl:variable> <xsl:if test="string-length($doct)=0"> <xsl:for-each select="descendant::*/text()"> <xsl:text> elm: </xsl:text> <xsl:value-of select="."/> </xsl:for-each> <xsl:for-each select="descendant::*/@*"> <xsl:text> att: </xsl:text> <xsl:value-of select="."/> </xsl:for-each> </xsl:if> </xsl:template> Výpis 4 Ukázka XSL transformace pro analýzu elementu <physdesc> v záznamech ZGUL

5.23 University Library Wroclaw University Library Wroclaw poskytuje záznamy do Manuscriptoria jako jeden datový zdroj bez rozlišení typu dokumentu. Obdobně jako v předchozích případech je tedy potřeba tuto informaci zajistit analýzou elementu <physdesc>. Níže je uvedena ukázka XSL trasformace pro analýzu elementu <physdesc>. <xsl:template match="/record/physdesc"> <xsl:variable name="doct"> <xsl:choose> <xsl:when test="descendant::*[contains(.,'druk muzyczny')]"> <xsl:text>094</xsl:text> <xsl:when test="descendant::*[contains(.,'rycina')]"> <xsl:text>gra-eng</xsl:text> <xsl:when test="descendant::*[contains(.,'dokument graficzny')]"> <xsl:text>gra</xsl:text> <xsl:when test="descendant::*[contains(.,'widok')]"> <xsl:text>gra</xsl:text> <xsl:when test="descendant::*[contains(.,'rękopis')]"> <xsl:text>090</xsl:text> <xsl:when test="descendant::*[contains(.,'inkunabuł')]"> <xsl:text>093</xsl:text> <xsl:when test="descendant::*[contains(.,'druk ulotny')]"> <xsl:text>094</xsl:text> <xsl:when test="descendant::*[contains(.,'mapa') or contains(.,'plan') or contains(.,'atlas')]"> <xsl:text>095</xsl:text> <xsl:when test="descendant::*[contains(.,'stary druk')]"> <xsl:text>094</xsl:text> <xsl:when test="descendant::*[contains(.,'książka')]"> <xsl:text>094</xsl:text> </xsl:choose> </xsl:variable> <xsl:if test="string-length($doct)=0"> <xsl:for-each select="descendant::*/text()"> <xsl:text> elm: </xsl:text> <xsl:value-of select="."/> </xsl:for-each> <xsl:for-each select="descendant::*/@*"> <xsl:text> att: </xsl:text> <xsl:value-of select="."/> </xsl:for-each> </xsl:if> </xsl:template> Výpis 5 Ukázka XSL transformace pro analýzu elementu <physdesc> v záznamech ULW

5.24 Další zdroje záznamů bez rozlišení typu dokumentu Záznamy z The National Library of Belarus (BNL) v současné době popisují inkunábule a ostatní staré tisky. Jako rozpoznávací znak lze použít obsah elementu <mscontents><respstmt>, kde v attributu role je uvedeno pbl nebo prt. Případně v <history><origin> je použita poznámka note s imprint (nevyplněno) a bylo uvedeno placename nebo date (případně obojí). Inkunábule a ostatní tisky jsou podle uvedeného data do roku 1500 prvotisky, od roku 1501 tisky. Dále bylo zjištěno, že Knihovna Národního Muzea (KNM) v době zpracování tohoto dokumentu předala do MnS metadatové záznamy k nedigitalizovaným rukopisům. Na základě této analýzy byla do všech záznamů doplněno ainformace o typu dokumentu rukopis. National Library of Romania předává záznamy k inkunábulím a ostatním starým tiskům. Podobně jako v BNL je v obsahu elementu <mscontents><respstmt> jako resp uvedeno printer, případně publisher. Obdobně je třeba rozlišit prvotisky a tisky podle uvedeného data do roku 1500 prvotisky, od roku 1501 tisky. University Library in Bratislava (ULIB) přispívá do Manuscriptoria záznamy o rukopisech, inkunábulích i starých tiscích. Analýzou souboru záznamů od tohoto přispěvatele byla učiněna tato zjištění: Signatury začínající písmeny T nebo MS jsou rukopisy. Rukopisy lze ještě jinak identifikovat tak, že je v <head><note> uvedeno slovo rukopis nebo pisár nebo je v rámci <listbiubl> uvedeno opět rukopis případně Handschrift. U tisků je v <respstmt> uvedeno buď tlačiar nebo printer, kód role je prt, ale může být i pbl. Zámecká knihovna Kynžvart - datový zdroj záznamů k nedigitalizovaným dokumentům obsahuje záznamy k různým typům dokumentů, rukopisům, inkunábulím a ostatním starým tiskům.

5.25 Soubory záznamů se známým typem dokumentu U některých souborů záznamů katalogu MnS známe typy k nim příslušejících dokumentů. Jsou to např. soubor digitalizovaných map, soubor arabských rukopisů Národní knihovny ČR a datové zdroje od přispěvatelů uvedených v odstavci Chyba! Nenalezen zdroj odkazů.. V záznamech z těchto datových zdrojů se příslušná informace o typu dokumentu vloží do elementu <taxonomy>. 6 Závěr Smyslem restrukturalizace Manuscriptoria bylo umožnit koncovému uživateli snazší orientaci ve velmi rozsáhlém katalogu Manuscriptoria. Toho bylo dosaženo rozdělením dokumentů podle jejich typu do několika základních skupin jako jsou rukopisy, prvotisky, staré tisky, případně na další typy jako jsou mapy, listiny, historická periodika, či grafiky. Informace o typu dokumentu byly doplněny do stávajících metadatových záznamů. Nalezení mechanismů umožňujících z dostupných informací správně určit typ dokumentu bylo u některých datových zdrojů poměrně náročné. Zatímco někteří přispěvatelé poskytují záznamy do Manuscriptoria v odděleněných dávkách podle typu dokumentu, jiní poskytují tyto záznamy společně. Typy dokumentů lze v některých případech zjistit ze struktury signatury, kterou ten který poskytovatel používá, jinde je možné zjistit typ dokumentu pouze analýzou zdrojových metadat. Ta se provádí jednak zjišťováním obsahu elementu <form> pokud tento v elementu <physdesc> existuje, nebo analýzou celého elementu <physdesc> a hledáním patřičných klíčových slov jako např. rukopis, tisk, mapa apod. V některých případech pomohla také analýza elementu <respstmt> a zjišťování odpovědností typu písař nebo tiskař. Přes určitou snahu o standardizaci popisů se způsob zápisu těchto informací u jednotlivých přispěvatelů více či méně liší. Proto se nepodařilo stanovit univerzální algoritmy pro analýzu metadat za účelem automatizovaného zjištění typů dokumentů. Proto také bylo v mnoha případech zjišťování typů dokumentů komplikované a časově náročné a ne vždy stoprocentně úspěšné. I nadále tedy existuje skupina metadatových záznamů, které označujeme jako neurčené.

7 Příloha 1 - Druhy dokumentů v Památníku národního písemnictví Přehled druhů dokumentů, které se používaly v PNP rozpis sborníku a neperiodické literatury Periodika filosofie Periodika historie Periodika - humor a satira Periodika jazykověda Periodika kalendáře Periodika literatura Periodika noviny Periodika ostatní Periodika - rodinná (zábavná) Periodika umění Periodické bibliografie Periodické svazkové katalogy Periodika Periodika festivalová Periodika kunsthistorická Referátové časopisy Ročenky Separáty Seriály#Seriály#Serials separát osobnosti separát filmu separát k předmětu rozpis periodik recenze knih literární scénář v tištěné podobě technický scénář v tištěné podobě dialogová listina v tištěné podobě synopse v tištěné podobě montážní listina v tištěné podobě titulková listina v tištěné podobě filmová povídka v tištěné podobě literární scénář v rukopisu/strojopisu technický scénář v rukopisu/strojopisu dialogová listina v rukopisu/strojopisu synopse v rukopisu/strojopisu montážní listina v rukopisu/strojopisu titulková listina v rukopisu/strojopisu filmová povídka v rukopisu/strojopisu ostatní v tištěné podobě ostatní v rukopisu/strojopisu Adresáře Antologie Alba Básně Epigramy Písně filmové Písňové texty Říkanky Sbírky básní Aforismy Anekdoty Bajky Detektivky Črty Fejetony Glosy Novely Pohádky Povídky Romaneta Romány Satiry Science Fiction Beletrie filmová Bibliografie Autobiografie Biografie Deníky Korespondence Medailony Nekrology Rozhovory Vyprávění Vzpomínky Bibliofilie Brožury Besedy Beletrie zfilmovaná

Cestopisy Comics Knihy pro děti Divadelní hry Diskuse Dialogové listiny Dokumenty Díla na pokračování Encyklopedie biografické Encyklopedie filmové Encyklopedie specializované Encyklopedie všeobecné Filmografie Festivalové zprávy Historické prameny Jubilejní publikace Kalendáře Kunsthistorická literatura Kuchařky Leporela Literatura faktu Literární přepisy filmového díla Literární scénáře Montážní listiny Knihy Metodické příručky Obrazové publikace filmové Obrazové publikace Příručky Povídky filmové Pragensia Projevy Mapy Přednášky Literární přepisy televizního díla Průvodce Populárně vědecká díla Referáty Soupisy archiválií Sborníky Scénáře Souborná díla Seznamy Spisy Slovníky jazykové Skripta Učebnice Scénáře nerealizované Slovníky překladové Slovníky terminologické Slovníky překladové specializované Staré tisky Studie Slovníky výkladové Synopse Titulkové listiny Technické scénáře Vícesvazková díla Výbory textu Výroky Zpěvníky Kartografické materiály Diplomové práce Disertační práce Návody Propagační materiály Prospekty Dramaturgické plány Finanční plány Interní tisky Katalogy archivu Katalogy festivalové Katalogy Katalogy knihoven Katalogy výstav Programy kin Publikace korporací Rozbory činnosti Statistiky Výrobní plány Zprávy Hudebniny Kolektivní smlouvy Legislativní literatura Obchodní dohody Smlouvy Výpůjční řády Gramofonové desky Kazety Mikrofilm Mikrofiše Videokazety Cestovní zprávy Výzkumné zprávy Normy Patenty Rukopisy/Strojopisy Rukopisy nepublikované

8 Příloha 2 Typy digitalizovaných dokumentů ze Zámecké knihovny Kynžvart Poř.č. Signatura Nová rkp Čáda incun. tisk ev. Název popisu 1 2-D-4 835 1 1 - - Liber carminum bucolicorum 2 3-D-9 1432 - - - 1 Lucio Marineo Siculo: Obra Compuestta. 1533 3 3-D-22 1449 1 3 - - Sebastian Grüner: Uiber die ältesten Sitten und Gebräuche 1826 4 *5-B-3 2741 - - - 1 Giovanni Battista della Porta: Magia naturalis. Libri viginti, 1597 5 *5-D-1 2894 - - - 1 Olaus Magnus: Historia de gentibus septentrionalibus 1558 6 6-A-3 3416 - - - 1 Andreas Cellarius: Harmonia macrocosmica seu Atlas universalis et novus 1661 7 7-D-8 5093 - - - 1 Albrecht Dürer: Vnderweysung der messung 1525 přív. 7-D-8 přív. 5093 - - - x Albrecht Dürer: Etliche vnderricht zu befestigung der Stett, 1527 přív. 7-D-8 přív. 5093 - - - x Albrecht Dürer: Herinn... begriffen von menschlichen Proportion 1528 8 7-D-23 5110 - - - 1 Das distilierbuoch 9 8-C-11 5649 1 11 - - Pseudo-Alberti Magni,... Compendium theologicae 10 12-A-50 7855 1 22 - - Rituale monasticum 11 *13-B-2 8780 1 24 - - Laurentius Frisaeus: Kurtze undt ware Beschreibung des hochgefreyten löblichen Stiffts Würtzburg Ursprung. (Abschrift mit Miniaturen von Joh.Wolfg. Hägler./.../ bis aufs Jahr 1496). 12 13-C-4 8842 - - 1 - Schedel, Hartmann: Liber chronicarum, (germ.) 13 15-E-4 10342 - - - 1 Konrad Wolfhart (Lycosthenes): Prodigiorum et ostentorum 32 / 46

chronicon 1557 14 15-J-45 10612 - - - 1 Landts Ordnung der Fürstlichen Graffschafft Tirol. 1538 15 16-E-6 10941 - - - 1 Johann Ebser: Onus ecclesiae. 1531 16 17-B-16 11471 1 25 - - Les ordonances de l ordre de toison d or 17 17-E-24 11604 - - 1 - Pseudo-Cyrillus: Speculum sapientiae. (ca. 1477) přív. 17-E-24 přív. 11604 - - x - Hugo de Sancto Victor: Soliloquium in modum dialogi (post 1473) 18 18-C-1 12069 1 26 - - Vocabulariorum in versibus fragmenta duo přív. 18-C-1přív. 12069 x 26 - - Boethii Liber de consulatione philosophiae 19 19-C-25 12871 - - 1 - Pius II. (Aeneas): Epistolae familiares ad diversos... (ca. 1481) 20 *19-D-10 12980 - - - 1 Mirabilia Romae. (post 1501) 21 19-E-3 13026 - - 1 - Johannes de Capua: Directorium humanae vitae. (ca. 1489) 22 20-B-13 13723 1 30 - - Breviarium 23 20-B-17 13732 1 31 - - Breviarium (perg., tisk, rkp. přípisky). 24 20-B-37 13756 - - - 1 Hec est quedam rara (et) ideo chara Legenda de sancta Anna 1510 25 20-C-2 13865 1 33 - - Petri Lombardi Sententiarum libri IV prologo carentes 26 20-C-6 13869 - - 1 - Campanus, Johannes: Opera... Ed.: Michael Fernus. 27 20-C-8 13871 - - - 1 Hieronymus Natalis: Evangelicae historiae imagines 1593 28 20-C-28 13894 - - - 1 Georgius Agricola (Georg Bauer): Vom Bergwerck XII. Bücher 1557 29 20-D-1 13935 1 35 - - Discours historiques sur les fortunes et disgraces des quelques favoris depuis le regne de Francois I. (pap.) 30 20-D-2 13936 1 36 - - Extractus ex libro Pseudo- Ortholani Super lapidum philosophicum 33 / 46