Digitalizace knihovních dokumentů. Jiří Polišenský



Podobné dokumenty
Z papíru na web a ke čtenáři aneb Digitalizace není jen skenování. Mgr. Monika Oravová Moravskoslezská vědecká knihovna v Ostravě

Účast NK ČR v projektu Norské fondy - digitalizace bohemikálních monografií ohrožených degradací papíru. Jiří Polišenský

Digitalizace a digitální knihovny v České republice

Česká digitální knihovna agregace digitálního obsahu českých knihoven

ProArc. open source řešení pro produkci a archivaci digitálních dokumentů. Martina NEZBEDOVÁ Knihovna AV ČR, v. v. i., Praha nezbedova@knav.

Tzv. životní cyklus dokumentů u původce (Tematický blok č. 4) 1. Správa podnikového obsahu 2. Spisová služba

Projekt CDArcha: kooperativní zpracování datových CD disků. Zdeněk Hruška, Petr Žabička Moravská zemská knihovna v Brně AKM 2018

Kramerius - zpřístupnění digitálních kopií v ČR

Lenka Maixnerová, Filip Kříž, Ondřej Horsák, Helena Bouzková

Využití nástrojů z projektu Česká digitální knihovna při digitalizaci a zpřístupnění digitálních dokumentů

Digitalizace v ČR a její podchycení v registru digitalizace. Helena Dvořáková Národní knihovna ČR

České digitalizační projekty, jejich výsledky a agregace

RD.CZ EVIDENCE DIGITALIZOVANÝCH DOKUMENTŮ A SLEDOVÁNÍ PROCESU ZPRACOVÁNÍ

ÚČAST NK ČR V PROJEKTU NORSKÉ FONDY DIGITALIZACE BOHEMIKÁLNÍCH MONOGRAFIÍ OHROŽENÝCH DEGRADACÍ PAPÍRU

DIGITALIZOVANÉ FONDY VĚDECKÉ KNIHOVNY V OLOMOUCI A KDE JE HLEDAT. Miloš Korhoň, Jan Houserek

Projekt Digitalizace a ukládání ve Zlínském kraji zkušenosti, postřehy

DIGITALIZAČNÍ PROJEKTY KRAJE VYSOČINA. Portál digitálního kulturního dědictví Kraje Vysočina. Listopad 2017

INFORUM 2012: 18. konference o profesionálních informačních zdrojích

DIGITALIZAČNÍ PROJEKTY KRAJE VYSOČINA. Únor 2015

Digitalizace pražské židovské literatury v Městské knihovně v Praze

EOD Elektronické knihy na objednávku. Rostislav Krušinský

Velká data v knihovnách Open source tools and their use in Czech libraries

asné trendy v digitalizaci novodobých dokumentů

Příloha č. 1. Návrh aplikace pro správu a archivaci XML dokumentů Zpracoval: Ing. Jan Smolík, CSc

Lenka Maixnerová, Filip Kříž, Helena Bouzková, Ondřej Horsák, Adéla Jarolímková, Eva Lesenková

Digitalizace a Digitální archiv Státního oblastního archivu v Třeboni po čtyřech letech. Výsledky a perspektivy dalšího vývoje

RD.CZ : EVIDENCE DIGITALIZOVANÝCH DOKUMENTŮ A SLEDOVÁNÍ PROCESU ZPRACOVÁNÍ

Lenka Maixnerová, Filip Kříž, Ondřej Horsák, Helena Bouzková

ProArc open source řešení pro produkci a archivaci digitálních dokumentů

RETROBI Softwarová aplikace pro zpřístupnění digitalizované lístkové kartotéky Retrospektivní bibliografie české literatury

Implementace formátu METS v Systému Kramerius

Národní digitální knihovna

On-line katalog On-line digitální knihovna

Národní digitální knihovna v cílové rovince

Projekt HISPRA aneb Jak využít digitalizaci MKP v dalších knihovnách. 12. Května 2011, Jelení Hora

Z papíru na web a ke čtenáři. Digitalizace regionální literatury v Moravskoslezském kraji.

Zadávací dokumentace

Porovnání obrazových souborů vzniklých digitalizací periodik a monografií

NÁRODNÍ DIGITÁLNÍ ARCHIV

90 let Mapové sbírky UK. Digitalizace mapových sbírek a archivů, Praha, 2010

Krajská digitalizace ve Středočeském kraji aktuální stav

ZPŘÍSTUPNĚNÍ A ARCHIVACE PLNÝCH

Dotační zdroje pro paměťové instituce Digitalizace , Praha

Ochranné reformátování. Miloš Korhoň

Od zpřístupnění rukopisů přes komerční archivy k LTP, aneb 20 let praxe s dlouhodobým uložením dat.

Zpřístupnění kulturního dědictví v digitální podobě v ČR prostřednictvím knihoven

ZPŘÍSTUPNĚNÍ OHROŽENÝCH FONDŮ POMOCÍ HYBRIDNÍ TECHNOLOGIE REFORMÁTOVÁNÍ

Editor umožní tvorbu a editaci metadat digitálních objektů, včetně importů a exportů a práci s primárními daty.

REFORMÁTOVÁNÍ, DIGITÁLNÍ KNIHOVNA, KRAMERIUS PRO VÁS A TROCHU JINAK

Petr Pavlinec, Kraj Vysočina Roman Kratochvíl, ICZ a. s. 2. dubna 2012 Konference ISSS 2012

NOVÉ MOŽNOSTI PŘÍSTUPU K DIGITÁLNÍ ARCHIV NLK PLNOTEXTOVÝM INFORMACÍM : Filip Kříž, Lenka Maixnerová, Ondřej Horsák, Helena Bouzková

Stav digitalizace jednotlivých fondů Národní knihovny České republiky

Zpráva ze zahraniční služební cesty

Digitalizační centrum včetně plnění databáze rastrových map uživateli

Ukládání a archivace dat

Z hlediska UKN zajímavé: stav digitalizace v G. Tabulce

Dlouhodobá ochrana digitální dokumentů. Mgr. Jaroslav Kvasnica

Jinonické informační pondělky. Filip Šír

SOUČASNÉ TRENDY V DIGITALIZACI NOVODOBÝCH DOKUMENTŮ

Národní digitální archiv a egovernment

DigiDepot: JPEG 2000 jako ukládací formát

Dodatečné informace č. 2

Doporučení pro pořizování datových souborů při digitalizaci analogových originálů

praktické zkušenosti z Kraje Vysočina


DIGITÁLNÍ UNIVERZITNÍ REPOZITÁŘ. Andrea Fojtů Ústav výpočetní techniky UK v Praze

SVĚTLA A STÍNY DIGITÁLNÍ FAKSIMILE

Projekt záchranné digitalizace Ad fontes v Archivu hlavního města Prahy

Digitalizace a digitální archiv Státního oblastního archivu v Třeboni

Dlouhodobá ochrana digitálních dat: co může vaše instituce udělat již dnes?

Digitalizace a vytěžování dat jako služba

Požadavky na systém pro automatizaci muzejní knihovny

INFORUM Špalíček digitální knihovna kramářských tisků (spalicek.net)

Digitální knihovny v České republice

Návrh opatření pro prodloužení životnosti obsahu CD a DVD disků ve sbírkách NK

Česká digitální matematická knihovna

ZPŘÍSTUPNĚNÍ KARTOGRAFICKÝCH MATERIÁLŮ A DALŠÍ VÝSLEDKY PROJEKTU TEMAP

ČESKÉ DĚJINY V PORTÁLU KRAMERIUS: DILEMATA VÝBĚRU A ZACHOVÁNÍ DOKUMENTŮ K DIGITALIZACI

ZKUŠENOSTI S GRANTY VISK 5 A 7. Štěpánka Běhalová Muzeum Jindřichohradecka

DIGITALIZACE DOKUMENTŮ

Nové nástroje pro staré mapy

Dlouhodobá ochrana digitálních dokumentů a projekt NDK

Seminář pro vedoucí knihoven a SVI ústavů AV ČR. Aleph

Masarykova univerzita Fakulta informatiky. Kramerius PV070. Jan Holman

Digitální konkordance a Registr digitalizace v Manuscriptoriu,

Digitální knihovna MZK a mobilní aplikace Kramerius Královéhradecká knihovnická konference

Portál ebadatelna Zlínského kraje a zpřístupnění map. Prezentace historických map z fondu paměťových institucí Zlínského kraje

DIGITALIZACE MORAVSKÝCH KNIHOVNÍCH SBÍREK

dodavatele rekonstrukce prostor záložního pracoviště NDA [2], tak nacházet by se mělo pravděpodobně v okolí Hluboké nad Vltavou.

METODY A POSTUPY DIGITALIZACE A ONLINE ZPŘÍSTUPNĚNÍ STARÝCH KARTOGRAFICKÝCH DĚL

Příprava legislativy povinného výtisku elektronických publikací v České republice (e-depozit)

EOD - Elektronické knihy na objednávku

Digitalizace a zveřejnění sbírkových fondů paměťových institucí Zlínského kraje

2014 Dostupný z Licence Creative Commons Uveďte autora-zachovejte licenci 4.0 Mezinárodní

PROJEKT HISPRA ZÁCHRANA HISTORICKÝCH PRAGENSIÍ Z FONDU MĚSTSKÉ KNIHOVNY V PRAZE (MKP) (PROJEKT DIGITALIZACE PODPOŘENÝ TZV.

Projekt digitalizace a ukládání v regionech. Petr Pavlinec, KrÚ kraje Vysočina Březen 2010

MODS a další metadatová schémata v oblasti digitalizace dokumentů. Pavla Švástová Moravská zemská knihovna

ebadatelna Zlínského kraje

POKYN ředitele Státního oblastního archivu v Praze č. 6 ze dne , kterým se stanoví

Transkript:

Digitalizace knihovních dokumentů Jiří Polišenský

Obsah prezentace Základní prvky digitalizace Formáty a standardy Skenery Digitalizační work flow Systémy pro prezentaci a evidenci digitalizovaných dokumentů Projekt Národní digitální knihovna

Základní prvky digitalizace Digitální objekty + metadata Digitální objekty Obrazové soubory Zvuk Video atd.

Funkce digitálních objektů Archival master archivní soubor Modified master modifikovaný soubor User copy uživatelská kopie

Obrazové soubory Základní bitmapa získaná skenováním Různé způsoby komprese podle použitých obrazových formátů Ztrátová a bezztrátová komprese Vlastnosti obrazových souborů Obrazový formát Rozlišovací schopnost v dpi Černobílé zobrazení, šedá škála, barva Velikost v bytech

Formáty obrazových souborů TIFF JPEG JP2 PNG DjVu neztrátový ztrátový neztrátový neztrátový ztrátový PDF

Metadata Popisná metadata Strukturální metadata Administrativní a technická metadata

Standardy Popisná metadata V současné době NK používá národní standard založený na UNIMARCu a DTD pro periodika a monografie, XML Další používané standardy: Dublin Core MARC XML MODS Administrativní a technická metadata PREMIS, MIX

Příprava dokumentů pro digitalizaci Selekce dokumentů stanovit selekční kriteria Kontrola stavu zpracování v elektronickém katalogu Čárový kód Fyzický stav Přílohy volné, rozkládací apod. Jazyk a písmo (OCR)

Skenery Skenery pro různé typy dokumentů: Knižní skenery Manuální Robotické Kombinované Hybridní kamery Skenery pro jiné typy dokumentů Průběžné Bubnové Mikrofilmové Atd.

Vlastnosti skenovacích zařízení Maximální velikost předlohy Způsob uložení knihy (bookcradle) Maximální dpi v celé ploše Rychlost skenování Přenos souborů

Zpracování obrazových souborů Separace jednotlivých stránek dokumentu Narovnání Manuální Poloautomatické Ořez Uvnitř stránky dokumentu Vně stránky dokumentu Zlepšení kvality Potlačení pozadí (průtisků) Odstranění šumu

OCR Optical Character Recognition Antikva Fraktura německá Fraktura česká Formáty TXT, PDF, PDF HT, METS ALTO, ALTO XML, PAGE XML Příčiny nízké úspěšnosti rozpoznávání Nízká kvalita předlohy Chyby v nastavení skenovacích parametrů (např. nízké dpi) Zastaralý typ písma Starší podoba jazyka

Struktura dokumentu Jednostránkové soubory / dvoustránkové / vícestránkové Jendosvazkové /vícesvazkové dokumenty Seriály a nepravá periodika Pravá periodika Noviny

Struktura dokumentu Složité struktury, např. noviny Titul Ročník metadata Výtisk Strana Reprezentace strany digitální objekt

Struktura dokumentu Struktura pro zpřístupnění archivaci: PSP, SIP Popisná metadata xml Složka JP2 Modified master (neztrátová komprese) Složka JP2 User copy (ztrátová komprese) Složka METS ALTO

Kontrola kvality Kontrola kvality obrazových souborů DPI, stupně šedé barvy, věrnost barevného podání podle obrazce, atd. Kontrola úspěšnosti OCR Na písmena (vícenásobné selhání u stejného písmene) Na slova Validace XML Konsistence struktury dokumentu

Nástroje pro digitalizaci Skenery Programové nástroje pro zpracování obrazu OCR Nástroje pro vytvoření struktury dokumentu Nástroje pro tvorbu metadat (XML editor) Kompletní work flow (DocWorks, Sirius, Goobi, atd.)

Automatizace procesu digitalizace Tvorba popisných metadat konverzí záznamu z elektronického katalogu Generování administrativních a technických metadat v průběhu digitalizace nebo archivace Automatizované operace s daty umožňuje využívání identifikátorů (čárový kód, číslo ČNB, ISSN, ISBN, atd.)

Prezentace digitalizovaných dokumentů Aplikace pro digitální knihovnu - Kramerius 3, Kramerius 4(open source): http://kramerius.nkp.cz/ Vyhledávání dokumentů podle metadat a fulltextu Jednotná informační brána Federované katalogy Europeana, TEL

Evidence digitalizovaných dokumentů Evidence digitalizovaných dokumentů, nebo vybraných pro digitalizaci, je důležitá pro: Eliminaci duplicitních neekonomických činností Zjišťování informací o digitalizovaných dokumentech http://sluzby.incad.cz/esp/rdcz/

Národní program Kramerius VISK 7 program zaměřený na mikrofilmování a digitalizaci dokumentů ohroženýchz degradací kyselého papíru Podporuje MK ČR hradí 70% nákladů Otevřený všem veřejným knihovnám registrovaným MK ČR Výzva k podávání projektů listopad 2010, uzávěrka leden 2011 Informace na webu NK ČR

Projekt Národní digitální knihovna Integrovaný operační program, Smart administration Trvání 2010 2014 Udržitelnost 2015 2019 Celkem digitalizace 26 mil. stran V rámci projektu budou vybudována dvě pracoviště digitalizace NK ČR a MZK Využití robotických skenerů Nové standardy a formáty (konverze a migrace dat)

Děkuji za pozornost Jiri.Polisensky@nkp.cz