Masarykova univerzita Fakulta informatiky. Kramerius PV070. Jan Holman

Podobné dokumenty
ProArc. open source řešení pro produkci a archivaci digitálních dokumentů. Martina NEZBEDOVÁ Knihovna AV ČR, v. v. i., Praha nezbedova@knav.

Využití nástrojů z projektu Česká digitální knihovna při digitalizaci a zpřístupnění digitálních dokumentů

Digitalizace a digitální knihovny v České republice

Česká digitální knihovna agregace digitálního obsahu českých knihoven

České digitalizační projekty, jejich výsledky a agregace

Digitální knihovny v České republice

Digitální knihovna MZK a mobilní aplikace Kramerius Královéhradecká knihovnická konference

Digitalizace a Digitální archiv Státního oblastního archivu v Třeboni po čtyřech letech. Výsledky a perspektivy dalšího vývoje

ebadatelna Zlínského kraje

DIGITALIZOVANÉ FONDY VĚDECKÉ KNIHOVNY V OLOMOUCI A KDE JE HLEDAT. Miloš Korhoň, Jan Houserek

Velká data v knihovnách Open source tools and their use in Czech libraries

Kramerius - zpřístupnění digitálních kopií v ČR

Digitalizace HF a jeho prezentace Dostupný z

Registrace Vyhledávání Výsledky vyhledávání

Lenka Maixnerová, Filip Kříž, Helena Bouzková, Ondřej Horsák, Adéla Jarolímková, Eva Lesenková

ProArc open source řešení pro produkci a archivaci digitálních dokumentů

RD.CZ : EVIDENCE DIGITALIZOVANÝCH DOKUMENTŮ A SLEDOVÁNÍ PROCESU ZPRACOVÁNÍ

Novinky v e-zdrojích NLK. Adéla Jarolímková, NLK

Zpřístupnění kulturního dědictví v digitální podobě v ČR prostřednictvím knihoven

Co je (staro)nového v DSpace

Digitální knihovna MZK: její vývoj, mobilní aplikace a uživatelé

2014 Dostupný z Licence Creative Commons Uveďte autora-zachovejte licenci 4.0 Mezinárodní

Mobilní aplikace pro digitální knihovnu Kramerius (Android a ios)

Nové rozhraní je optimalizované pro aktuální verze prohlížečů. Pro práci s tímto rozhraním není vhodný Internet Explorer.

Digitální knihovny v České republice

Máte to? Summon jako základní vyhledávací nástroj NTK

DIGITALIZACE MORAVSKÝCH KNIHOVNÍCH SBÍREK

Formy komunikace s knihovnami

ZPŘÍSTUPNĚNÍ A ARCHIVACE PLNÝCH

Olga Rudikova 2. ročník APIN

Lenka Maixnerová, Filip Kříž, Ondřej Horsák, Helena Bouzková

Portál ebadatelna Zlínského kraje a zpřístupnění map. Prezentace historických map z fondu paměťových institucí Zlínského kraje

ebadatelna Zlínského kraje portál pro zpřístupnění regionálního digitalizovaného kulturního dědictví

Systémy pro tvorbu digitálních knihoven

Tzv. životní cyklus dokumentů u původce (Tematický blok č. 4) 1. Správa podnikového obsahu 2. Spisová služba

Digitální konkordance a Registr digitalizace v Manuscriptoriu,

MBI - technologická realizace modelu

Digitalizace v ČR a její podchycení v registru digitalizace. Helena Dvořáková Národní knihovna ČR

Editor umožní tvorbu a editaci metadat digitálních objektů, včetně importů a exportů a práci s primárními daty.

Digitalizace knihovních dokumentů. Jiří Polišenský

Evropská digitální knihovna. < Prezentace k eseji pro předmět PV070 Digitální knihovny. Tomáš Drusa

Otevřený katastr (OK)

A DALŠÍ VÝSLEDKY PROJEKTU TEMAP. Petr Žabička, Moravská zemská knihovna v Brně

Digitalizace a zveřejnění sbírkových fondů paměťových institucí Zlínského kraje

Speciální digitální knihovny

Projekt HISPRA aneb Jak využít digitalizaci MKP v dalších knihovnách. 12. Května 2011, Jelení Hora

Digitalizace a digitální archiv Státního oblastního archivu v Třeboni

Lenka Maixnerová, Filip Kříž, Ondřej Horsák, Helena Bouzková

Příprava legislativy povinného výtisku elektronických publikací v České republice (e-depozit)

Z papíru na web a ke čtenáři aneb Digitalizace není jen skenování. Mgr. Monika Oravová Moravskoslezská vědecká knihovna v Ostravě

manuscriptorium Manuscriptorium v Evropě Manuscriptorium.com

IntraVUE Co je nového

Ukládání a archivace dat

Vyhledávání a georeferencování map

The bridge to knowledge 28/05/09

Open Journal Systems na ČVUT. Věra Pilecká (ÚK ČVUT)

RD.CZ EVIDENCE DIGITALIZOVANÝCH DOKUMENTŮ A SLEDOVÁNÍ PROCESU ZPRACOVÁNÍ

Národní úložiště šedé literatury v roce 2012

MANUSCRIPTORIUM Digitalizace rukopisů VKOL. Miloš Korhoň Vědecká knihovna v Olomouci

ANL+ a AMGK+ aneb malé indexy v obrazech. Martin Vojnar

webových zdrojů Mgr. Jan HUTAŘ Bc.. Lukáš JKA Mgr. Ludmila CELBOVÁ

Open source pro digitální knihovnu

PŘÍLOHA C Požadavky na Dokumentaci

NOVÉ MOŽNOSTI PŘÍSTUPU K DIGITÁLNÍ ARCHIV NLK PLNOTEXTOVÝM INFORMACÍM : Filip Kříž, Lenka Maixnerová, Ondřej Horsák, Helena Bouzková

Linked Heritage. Koordinace standardů a technologií za účelem obohacení Europeany. Alena Součková

lms moodle Focused on your needs

Osobní archivy publikovaných odborných prací v medicíně jako součást Digitální knihovny NLK


Digitalizace pražské židovské literatury v Městské knihovně v Praze

Specializovaná mapa s interpretací regionálních rozdílů v oblasti sociálního výzkumu

WORKWATCH ON-LINE EVIDENCE PRÁCE A ZAKÁZEK

GeoHosting. Martin Vlk. (vypusťte svoje data do světa) Help forest s.r.o. člen skupiny WirelessInfo 2008

Knihovny.cz - jak se zapojit

CO NOVÉHO V PROJEKTU OBÁLKYKNIH.CZ

Jakub Šesták. ESEJ DO PŘEDMĚTU DIGITÁLNÍ KNIHOVNY

Vybraná zajímavá Lotus Notes řešení použitelná i ve vašich aplikacích. David Marko TCL DigiTrade

Silný portál. Jindřiška Pospíšilová. Pracovní skupina pro silný portál. Národní knihovna ČR

Primo Central. Martin Vojnar MULTIDATA Praha s.r.o.

Vysokoškolské kvalifikační práce na AMU:

Národní digitální knihovna a digitalizace v muzeích a galeriích

GTL GENERATOR NÁSTROJ PRO GENEROVÁNÍ OBJEKTŮ OBJEKTY PRO INFORMATICA POWERCENTER. váš partner na cestě od dat k informacím

ANL+ Veronika Ševčíková Národní knihovna ČR

The Australian Research Repositories Online to the World

Federativní autentizace v portálu Knihovny.cz, mojeid, IdP sociálních služeb, požadované atributy u Knihovny.cz

Zpráva o zhotoveném plnění

FOTOARCHIV ČGS. Pavel Bokr Tamara Sidorinová.

Vývoj a využití plnotextových edic historických dokumentů v Manuscriptoriu

Technologická centra krajů a ORP

Lenka Maixnerová, Filip Kříž, Ondřej Horsák, Helena Bouzková

ZPŘÍSTUPNĚNÍ KARTOGRAFICKÝCH MATERIÁLŮ A DALŠÍ VÝSLEDKY PROJEKTU TEMAP

Krajská digitalizace ve Středočeském kraji aktuální stav

Nové nástroje pro staré mapy

Autor: ing. Tomáš Psohlavec a kolektiv AiP Beroun s.r.o.

Seminář pro vedoucí knihoven a SVI ústavů AV ČR. Aleph

Internetový obchod ES Pohoda Web Revolution

INFORUM Špalíček digitální knihovna kramářských tisků (spalicek.net)

INFORUM 2012: 18. konference o profesionálních informačních zdrojích

Virtuální národní fonotéka aneb zvuk chycen na jednom místě. Filip Šír - Národní muzeum

Webové rozhraní pro datové úložiště. Obhajoba bakalářské práce Radek Šipka, jaro 2009

Projekt Digitální knihovna pro šedou literaturu po prvním roce řešení

Transkript:

Masarykova univerzita Fakulta informatiky Ð Û Å«Æ ±²³ µ ¹º»¼½¾ Ý Kramerius PV070 Jan Holman 2. semestr (N-IN PSK) 5. 12. 2014

Název projektu, jeho nositel, URL Projekt Kramerius: https://github.com/moravianlibrary/kramerius Na projektu se podílejí: Národní knihovna ČR, Akademie věd ČR, společnost Incad Charakteristika projektu Kramerius je český open source projekt vyvíjený firmou Incad a financovaný z dotačních programů Akademie věd ČR a Ministerstva kultury ČR. Systém Kramerius je formou CMS 1 umožňující správu digitálních objektů a jejich zpřístupnění. Cíle a aktuální stav projektu Vývoj systému Kramerius iniciovala Národní knihovna po povodních v roce 2002, při kterých došlo k poškození přibližně 800 000 svazků a začaly se vážně řešit problémy spojené s degradací starých tiskovin mj. kvůli nekvalitnímu papíru periodik z 19. století. Bylo proto potřeba řešit otázky digitalizace, archivace, ale i zpřístupňování digitálního obsahu čtenářům. Systém Kramerius slouží právě ke zpřístupnění digitálních objektů prostřednictvím internetu. Umožňuje řízení dostupnosti dokumentů (dělí je na veřejné a neveřejné), jejich zobrazování a replikaci mezi jednotlivými institucemi, ať už formou exportu a importu, nebo sklízením metadat pomocí protokolu OAI-PMH 2. Kramerius je primárně určen pro digitalizované knihovní sbírky, periodika a monografie, je možné ho ale použít ke zpřístupnění řady jiných modelů například vícesvazkových monografií, map, hudebnin, starých rukopisů, případně článků, kapitol atp. Kramerius může obsahovat jak zdigitalizované dokumenty, tak tzv. born digital dokumenty, tedy ty, které už vznikly v digitální podobě. 1. Content Management System 2. Open Archives Initiative Protocol for Metadata Harvesting 1

Popis projektu a jeho výsledků Systému Kramerius vyvíjela od roku 2003 společnost QBizm 3, v roce 2009 ale vývoj převzala firma Incad 4 a systém prošel řadou změn, z nichž nejvýznamnější je pravděpodobně využití úložiště Fedora Commons 5. Výsledek je označován jako Kramerius 4 a v současnosti je na něm založeno přibližně 50 digitálních knihoven převážně v ČR, ale už i na Slovensku. Systém Kramerius ve své současné současné podobě se dá rozdělit na 3 vrstvy: První, datová vrstva, je složena z úložiště Fedora Commons a databáze postgresql, ve které se uchovávají vazby mezi objekty ve formě RDF 6 tripletů. Fedora obsahuje metadata digitálních objektů ve formátu FOXML 7 a libovolná další data například textový přepis obsahu oskenované stránky (OCR 8 ), popis umístění textu v obrázku ve formátu ALTO 9 XML, díky kterému je vyhledávaný text v obrázku zvýrazněn, nebo i vlastní digitální obsah, například naskenované strany periodik a monografií ve formátu DjVu, případně celé dokumenty v PDF. V praxi ale bývá digitální obsah uložen na externím úložišti a pouze provázán odkazy. Druhou, aplikační vrstvu, představuje samotná webová aplikace Kramerius. Ta je napsaná v jazyce Java a může běžet v aplikačním serveru Apache Tomcat 10. Pro účely zobrazování a vyhledávání jsou data uložena v úložišti Fedora Commons indexována pomocí systému Apache Solr 11. Import objektu do digitální knihovny proto zahrnuje proces vložení souborů do Fedory a jejich následnou indexaci v Solr. Kramerius umožňuje nejen zobrazování, ale i správu digitálních dokumentů: jejich import nebo export, replikaci do jiných digitálních knihoven, zpřístup- 3. http://www.qbizm.cz/ 4. http://www.incad.cz/ 5. http://fedorarepository.org/ 6. Resource Description Framework 7. Fedora Object XML 8. Optical Character Recognition 9. Analyzed Layout and Text Object 10. http://tomcat.apache.org/ 11. http://lucene.apache.org/solr/ 2

nění metadat prostřednictvím protokolu OAI-PMH. Umožňuje také spravovat dostupnost jednotlivých digitálních objektů pomocí příznaku public/private. Veřejné (public) objekty jsou přístupné volně přes internet, neveřejné (private) objekty může běžný uživatel pouze vyhledat a případně si zobrazit náhledy obrázků a metadata. Neveřejné dokumenty bývají zpravidla přístupné pouze z vyhrazených počítačů v budově dané instituce, odkud si uživatelé nemohou obsah stahovat a dále ho sdílet. Kramerius také umožňuje nastavit u dokumentů tzv. pohyblivou zeď. V takovém případě potom aplikace dokumenty zpřístupňuje průběžně v souladu s autorským zákonem. To je velmi praktické zejména v případě, že daná digitální knihovna obsahuje velké množství periodik není potom potřeba každý rok ručně zpřístupňovat jeden ročník z každého periodika. Uživatelé si také mohou veřejné dokumenty nechat vygenerovat ve formátu PDF a následně si je stáhnout, nebo si je nechat rovnou vytisknout. Poslední vrstvou je vrstva prezentační. Ta je od samotné webové aplikace oddělena nově od konce roku 2014, kdy vyšel Kramerius ve verzi 5. Nová verze, představená na letošním ročníku konference Archivy, knihovny, muzea v digitálním světě, se od té předchozí neliší nijak zásadně, obsahuje ale nové RESTové rozhraní, díky kterému lze prezentační vrstvu měnit a případně používat jinou, než výchozí. Této možnosti už využila Moravská zemská knihovna v Brně a vytvořila si pro systém Kramerius vlastní mobilní aplikaci. Ta je v současnosti dostupná v beta verzi na webu Google Play 12. MZK zároveň zakoupila několik tabletů, na kterých si budou čtenáři moci prohlížet neveřejné dokumenty, aniž by museli sedět u počítače. Společnost Incad zároveň připravuje nové rozhraní, které bude od příštího roku součástí aplikace a nahradí to stávající. Toto nové rozhraní je už teď nasazené například na (zatím testovacích) stránkách České digitální knihovny 13. Tato knihovna je navíc zajímavá tím, že nemá svůj vlastní obsah, ale sklízí data z ostatních digitálních knihoven založených na systému Kramerius po ČR. 12. https://play.google.com/store/apps/details?id=cz.mzk.kramerius.app 13. http://cdk-test.lib.cas.cz/client 3

Zhodnocení projektu a jeho přínosu Systém Kramerius je stále aktivně vyvíjený a vývojáři na stránkách projektu reagují a odpovídají na dotazy uživatelů (knihoven). Systém se mj. díky této aktivní podpoře poměrně snadno instaluje. Moravská zemská knihovna navíc připravila instalační balík pro platformu Docker 14, který instalaci výrazně zjednodušuje. Kramerius tak představuje velmi vhodný nástroj, pomocí kterého si i menší knihovny zvládnou samy poměrně snadno vytvořit vlastní digitální knihovnu a zpřístupnit tak svůj digitální obsah čtenářům. Velkou výhodou je také fakt, že vývoj Krameria probíhá pod licencí GNU GPL 15, takže jsou zdrojové kódy volně dostupné a pokud někomu nevyhovuje nebo chybí nějaká funkcionalita, může si aplikaci sám upravit. Aplikace také velmi dobře škáluje, jak je vidět na příkladu Národní digitální knihovny ČR, která je na systému Kramerius postavená a obsahuje už přes 25 milionů stránek, což znamená více než 30 TB obrázků a 1,6 TB textových metadat. Mezi nevýhody systému patří například ne příliš uživatelsky přívětivé rozhraní. To by se ovšem mělo v nejbližší době zlepšit s příchodem rozhraní nového. Další nevýhodou, která už je z velké části překonaná je formát DjVu 16, kvůli kterému je třeba mít v prohlížeči speciální plugin. Součástí Krameria je ale i prohlížečka OpenLayers 17, která podporuje propojení se obrázkovým serverem IIPImage 18. Ten dokáže mj. posílat obrázky ve formě dlaždic v tom rozlišení, jaké zrovna uživatel potřebuje. Díky tomu není potřeba žádný zvláštní plugin a aplikace je rychlejší, protože nepotřebuje obrázky nutně načítat v plné kvalitě. Stávající rozhraní aplikace Kramerius ovšem zatím neobsahuje prohlížečku pro formát PDF. Tyto dokumenty je proto třeba před vlastním prohlížením stáhnout. Další nevýhoda, kterou ale běžný uživatel nepocítí, vychází z použití úložiště 14. https://www.docker.com/ 15. GNU General Public License 16. http://djvu.org/ 17. http://openlayers.org/ 18. http://iipimage.sourceforge.net/ 4

Fedora Commons verze 3.5, která nepodporuje vratné transakce. Kvůli tomu může dojít k problémům ve chvíli, kdy dojde k přerušení procesu importu. Seznam zdrojů Github projektu Kramerius: https://github.com/moravianlibrary/kramerius Článek Kramerius 4 a Kramerius 5 : http://www.inflow.cz/kramerius-4-kramerius-5 Článek Role Systému Kramerius v oblasti tvorby a zpřístupňování digitálních dokumentů : http://kzv.kkvysociny.cz/archiv.aspx?id=391 Metadata v DC <link rel= schema.dc href= http://purl.org/dc/elements/1.1/ /> <meta name= DC.Title content= Kramerius /> <meta name= DC.Creator content= Jan Holman /> <meta name= DC.Subject content= Kramerius /> <meta name= DC.Subject content= digitální knihovna /> <meta name= DC.Date content= 2014-12-5 /> <meta name= DC.Description content= Esej popisující systém Kramerius, který slouží k tvorbě digitálních knihoven. /> <meta name="dc.format"scheme="imt"content="application/pdf"/> <meta name="dc.source"scheme="url"content="https://github.com/ceskaexpedice/kramerius» <meta name="dc.source"scheme="url"content="http://www.inflow.cz/kramerius- 4-kramerius-5» <meta name="dc.source"scheme="url"content="http://kzv.kkvysociny.cz/archiv.aspx?id=391» <meta name="dc.language"scheme="iso639-1"content="cs"/> 5