Synergie archivních institucí a poskytovatelů služeb v přípravné fázi digitalizace fondů

Podobné dokumenty
Z papíru na web a ke čtenáři. Digitalizace regionální literatury v Moravskoslezském kraji.

Krajská digitalizace ve Středočeském kraji aktuální stav

Z papíru na web a ke čtenáři aneb Digitalizace není jen skenování. Mgr. Monika Oravová Moravskoslezská vědecká knihovna v Ostravě

Zkušenosti z knižní digitalizace aneb co nutno mít na zřeteli při zpracování knih a periodik.

Digitalizace knihovních dokumentů. Jiří Polišenský

Digitalizace pražské židovské literatury v Městské knihovně v Praze

ProArc. open source řešení pro produkci a archivaci digitálních dokumentů. Martina NEZBEDOVÁ Knihovna AV ČR, v. v. i., Praha nezbedova@knav.

DIGITALIZAČNÍ PROJEKTY KRAJE VYSOČINA. Únor 2015

České digitalizační projekty, jejich výsledky a agregace

Digitalizace a digitální knihovny v České republice

Národní digitální knihovna v cílové rovince

DIGITALIZOVANÉ FONDY VĚDECKÉ KNIHOVNY V OLOMOUCI A KDE JE HLEDAT. Miloš Korhoň, Jan Houserek

Datové centrum a Regionální SAN kraje Vysočina. Projekt digitalizace a. Petr Pavlinec, KrÚ kraje Vysočina. Září 2009

DIGITALIZAČNÍ PROJEKTY KRAJE VYSOČINA. Portál digitálního kulturního dědictví Kraje Vysočina. Listopad 2017

Projekt Digitalizace a ukládání ve Zlínském kraji zkušenosti, postřehy

DIGITALIZACE DOKUMENTŮ

Velká data v knihovnách Open source tools and their use in Czech libraries

praktické zkušenosti z Kraje Vysočina

INFORUM 2012: 18. konference o profesionálních informačních zdrojích

Petr Pavlinec, Kraj Vysočina Roman Kratochvíl, ICZ a. s. 2. dubna 2012 Konference ISSS 2012

Zpřístupnění kulturního dědictví v digitální podobě v ČR prostřednictvím knihoven

Národní digitální knihovna

Česká digitální knihovna agregace digitálního obsahu českých knihoven

Dodatečné informace č. 2

Projekt digitalizace a ukládání v regionech. Petr Pavlinec, KrÚ kraje Vysočina Březen 2010

Příloha č. 1. Návrh aplikace pro správu a archivaci XML dokumentů Zpracoval: Ing. Jan Smolík, CSc

Účast NK ČR v projektu Norské fondy - digitalizace bohemikálních monografií ohrožených degradací papíru. Jiří Polišenský

Digitalizace v ČR a její podchycení v registru digitalizace. Helena Dvořáková Národní knihovna ČR

ProArc open source řešení pro produkci a archivaci digitálních dokumentů

EOD Elektronické knihy na objednávku. Rostislav Krušinský

DIGITALIZACE KNIHOVNÍCH FONDŮ V KRÁLOVÉHRADECKÉM KRAJI

dodatečné informace k zadávacím podmínkám dle 49 zákona č. 137/2006 Sb., o veřejných zakázkách, ve znění pozd. předpisů

Digitalizace Zemských desk, železničních knih, pozemkových knih (1)

Digitalizace. Co je to digitalizace Proč digitalizovat a přínosy digitalizace Popis procesu digitalizace Příklady digitalizačních projektů

Digitalizace příchozích faktur

ebadatelna Zlínského kraje

Stav digitalizace jednotlivých fondů Národní knihovny České republiky

Zadávací dokumentace

Jak mohou moderní technologie usnadnit pracovní postupy. Dagmar Bosáková, I.CA Jiří Jelínek, Konica Minolta

SVĚTLA A STÍNY DIGITÁLNÍ FAKSIMILE

MANUSCRIPTORIUM Digitalizace rukopisů VKOL. Miloš Korhoň Vědecká knihovna v Olomouci

DIGITALIZUJEME, ZPŘÍSTUPŇUJEME, ALE VÍ O TOM NĚKDO?

Lenka Maixnerová, Filip Kříž, Helena Bouzková, Ondřej Horsák, Adéla Jarolímková, Eva Lesenková

O Národní digitální knihovně. Jan Mottl AiP Safe s.r.o.

asné trendy v digitalizaci novodobých dokumentů

RD.CZ : EVIDENCE DIGITALIZOVANÝCH DOKUMENTŮ A SLEDOVÁNÍ PROCESU ZPRACOVÁNÍ

Od zpřístupnění rukopisů přes komerční archivy k LTP, aneb 20 let praxe s dlouhodobým uložením dat.

Digitalizace a zveřejnění sbírkových fondů paměťových institucí Zlínského kraje

Projekt CDArcha: kooperativní zpracování datových CD disků. Zdeněk Hruška, Petr Žabička Moravská zemská knihovna v Brně AKM 2018

Digitalizační centrum včetně plnění databáze rastrových map uživateli

Technologie digitalizace a zpřístupnění starých map - pohled kartografa a uživatele

Portál ebadatelna Zlínského kraje a zpřístupnění map. Prezentace historických map z fondu paměťových institucí Zlínského kraje

Digitalizace a Digitální archiv Státního oblastního archivu v Třeboni po čtyřech letech. Výsledky a perspektivy dalšího vývoje

Porovnání obrazových souborů vzniklých digitalizací periodik a monografií

Kramerius - zpřístupnění digitálních kopií v ČR

Projekt Digitalizace a ukládání ve Zlínském kraji zkušenosti, postřehy

Lenka Maixnerová, Filip Kříž, Ondřej Horsák, Helena Bouzková

prof. Dr. Ing. Zdeněk Kůs, rektor TUL Tel: Mgr. Marie Křelinová, Budova IC 7.p tel.: zakazky@tul.

Dotační zdroje pro paměťové instituce Digitalizace , Praha

Projekt HISPRA aneb Jak využít digitalizaci MKP v dalších knihovnách. 12. Května 2011, Jelení Hora

Národní digitální knihovna a digitalizace v muzeích a galeriích

Výzva k podání nabídky a k prokázání splnění kvalifikace

ABBYY Automatizované zpracování dokumentů

Využití nástrojů z projektu Česká digitální knihovna při digitalizaci a zpřístupnění digitálních dokumentů

Manuál jak na CRM založení nového klienta předání všech dokumentů do analytického oddělení a následná komunikace s AO. verze 04 (16.6.

Tzv. životní cyklus dokumentů u původce (Tematický blok č. 4) 1. Správa podnikového obsahu 2. Spisová služba

TECHNICKÁ DOKUMENTACE

Jak upéct a nespálit grant v oblasti digitalizace v ČR?

ZPŘÍSTUPNĚNÍ A ARCHIVACE PLNÝCH

Návrh opatření pro prodloužení životnosti obsahu CD a DVD disků ve sbírkách NK

Společnost ICZ a.s. představuje řešení digitalizace dokumentů v prostředí IS RŽP. Dokument: Obchodní prezentace Důvěrnost: Veřejná

90 let Mapové sbírky UK. Digitalizace mapových sbírek a archivů, Praha, 2010

34. Celostátn. při i AMG. Vlastivědn. dné muzeum a galerie

DODATEČNÉ INFORMACE K ZADÁVACÍM PODMÍNKÁM Č. 1 ZE DNE

Koncepce trvalého uchování a zpřístupnění tradičních textových dokumentů. Tomáš Foltýn

POKYN ředitele Státního oblastního archivu v Praze č. 6 ze dne , kterým se stanoví

Digitalizace HF a jeho prezentace Dostupný z

Skartační řízení. Ing. Miroslav Kunt. Skartační řízení obecně a analogově

Řešení oblasti LTP v projektu NDK aneb zúročení 20 let zkušeností

Dotační program MK ČR VISK 3

Kontrola výkonu spisové služby u veřejnoprávních původců: několik postřehů z praxe Mgr. Martin Myšička, Státní okresní archiv Most

NÁCHOD. Ústecký kraj. Ing. Hana Frýdová Ing. Lenka Gallová

Digitalizace Tvorba e-knih v knihovně

Odůvodnění vymezení technických podmínek podle 156 odst. 1 písm. c) zákona č. 137/2006 Sb., o veřejných zakázkách

Sluţba Karlovarského kraje pro ukládání dokumentů a dat na území kraje

PROJEKT HISPRA ZÁCHRANA HISTORICKÝCH PRAGENSIÍ Z FONDU MĚSTSKÉ KNIHOVNY V PRAZE (MKP) (PROJEKT DIGITALIZACE PODPOŘENÝ TZV.

Co nového ve spisové službě? Národní standard pro elektronické systémy spisové služby a jeho optimalizace

Virtuální mapová sbírka Chartae-Antiquae.cz. důležitý výsledek projektu Kartografické zdroje jako kulturní dědictví

Registr digitalizace (RD)

DIGITÁLNÍ UNIVERZITNÍ REPOZITÁŘ. Andrea Fojtů Ústav výpočetní techniky UK v Praze

Historické fondy MZK a. spolupráce. Jitka Machová Moravská zemská knihovna v Brně machova@mzk.cz

Závazné pokyny pro přípravu dokumentů k hybridnímu snímkování jsou uvedeny v Příloze č. 5 Pravidla přípravy dokumentů pro hybridní snímkování.

Dlouhodobá ochrana digitálních dokumentů a projekt NDK

ÚČAST NK ČR V PROJEKTU NORSKÉ FONDY DIGITALIZACE BOHEMIKÁLNÍCH MONOGRAFIÍ OHROŽENÝCH DEGRADACÍ PAPÍRU

Metodický návod č. 1/2008

Dlouhodobá ochrana digitálních dat: co může vaše instituce udělat již dnes?

DigiDepot: JPEG 2000 jako ukládací formát

1. Účel a předmět smlouvy

Editor umožní tvorbu a editaci metadat digitálních objektů, včetně importů a exportů a práci s primárními daty.

Transkript:

DIGITALIZACE Synergie archivních institucí a poskytovatelů služeb v přípravné fázi digitalizace fondů Ústí nad Labem 4. září 2013 scanservice a.s. Náchodská 2397/23 193 00 Praha 9 ing. Miroslav Khodl technologický konzultant miroslav.khodl@scanservice.cz

Co lze očekávat od masivní digitalizace Kalkulovaný počet stran Maximální počet svazků: 120 180 stran / hodinu / os. velikost, stav -> skener (RKS, M) Průměrná skenovací rychlost pro bezproblémové svazky (1sken = 2 st.) 180 700 stran / hod Písmo Gotika : Latinka Ruční zpracování gotického OCR Hranice pro manuální zpracování: 70 % gotika, 30 % latinka (častý a nepředpokládaný mix) 5 28 min /stránku (cca 11 000 znaků A3+) od 10-20 % gotika od 5-10 % latinka Prioritizace M+P na úkor ostatních 2

IDEÁLY versus REALITA Zdigitalizujeme všechen uměnovědní fond Zeměkoule (Europeana apod.) Zdigitalizujeme veškeré písemnosti obývaného regionu a sem tam přidáme vybraný 3D objekt, hudbu Zkusíme zajistit financování pro ohrožené fondy a vzácnosti Abychom stihli využít prostředky, vybereme cokoliv snadno a rychle digitalizovatelného, protože čas a množství jsou měřenými jednotkami Nemusíme nic moc chystat, Zhotovitel je tu od toho psaný i sázený, hudební, fotografický, malířský, architektonický, sběratelský knihovny, muzea, galerie, archivy, soukromé sbírky a jejich kombinace příprava dle podmínek finančního donátora (IOP, granty, sponzoring, výhodné smlouvy ) Několik desítek ročníků seriálových titulů s velkým počtem stran, sebrané spisy, slovníky vydané koncem 20. století mnohdy fatální stav připravenosti, díla nevhodná pro průmyslové zpracování, typově neodpovídající zadání 3

IDEÁLY versus REALITA Všechny tituly chceme digitalizovat na nejméně 600 dpi (pokud se vyskytne obrázek) Máme napočítáno přesně 350 000 stránek, ale když na to příjde, můžeme jakékoli množství přidat nebo ubrat při zachování vysoutěžené ceny Podmínka účasti ve výběrovém řízení: dodávka pro vždy platných licencí na technologie (M$, Kakadu, ocr, db ) Další z podmínek: projekt musí plně odpovídat standardu NDK, ale navíc chceme (dodávku PS_tiff, pdf, aby se obrázky nedaly stáhnout z internetu ) workflow na zakázku umí zpravidla jednu hodnotu rozlišení, více průchodů je užíváné zejména kvůli typologii svazků dodavatelé zaměstnávají lidi, platí amortizace strojů a aby přežili, zpracovávají paralelně větší množství zakázek. Větší změna bývá špatně v každém případě klíčový používaný a osvědčený SW je zpravidla placen ročně nebo cpp, svobodný SW zatím pokulhává kombinace mnohdy technicky protichůdných požadavků, např. strojové OCR dle NDK a chybovost pod např. 5 % OCR 4

IDEÁLY versus REALITA Digitalizujte periodika a monografie, ale naceňte nám stránky podle A3, A2, A1 (ale nikoli dle PLOCHY těchto formátů) Další z podmínek: projekt musí plně odpovídat standardu NDK, ale dodáme vám sbírkové předměty nebohemikální provenience a evidované navíc nejlépe pouze jako sbírkový předmět Domněnka manažerů: Národní knihovna definuje bezchybné standardy pro každou digitalizaci který účastník běžně pracuje s novinami přesných A formátů nechť zvedne ruku, dokud si jej nevšimnu ;) užitečnější je zadání rozsahu skladby a Naskenovat lze prakticky vše včetně díry obklopené kovovým masivem, spojitost se standardy NDK ovšem očekáváme začátkem roku 3024 Zkušenost: NK definuje pro vnitřní systém digitalizace své de-facto podnikové standardy, navenek fungují jako doporučení. Závaznost plyne spíše ze záměru užití LTP. Každý reálná proces obsahuje chyby a jejich odstraňováním se vyvíjí. 5

IDEÁLY versus REALITA Se svazky nemusíme už nic dělat, jsou v technicky dobrém stavu. Když dodáme předlohy na kyselém papíře, zajístíte odkyselení. Nevíme ale, kolika stránek se to týká, nicméně cena je konečná a neměnná,poraďte si Cena za znovuvyvázání svazku je moc velká, ústav na ni nemá, raději nebudeme rozvolňovat těsná vazba ve hřbetu znamožní kvalitní celostránkový sken, sníží se kvalita OCR a chybí sloupce písmen v obraze pro LTP i K4/5 Součástí přípravy Zadavatele musí být posouzení vhodnosti rozvolnit. N.C. ;) Cílem digitalizace je krom úschovy a zpřístupnění právě odstavení originálu z procesu výpůjček, stačí tedy uložit do archivního boxu např. z produkce EMBy 6

Mántry řídících pracovníků KNIŽNÍ SKENOVÁNÍ Mántrou projektových pracovníků jsou harmonogramy, přičemž Zhotovitelům není prakticky nikdy dopředu znám stav příprav na straně Objednatele. Mnohdy ani ředitelé zúčastněných institucí nevědí nic o tom, že se počítá se zápůjčkou jejich fondu Harmonogam je pomůcka pro dynamické řízení projektu, nikoli konstanta. Aktualizujte beze strachu a podle vzájemné potřeby! Nevyžadujte vrácení fondu do 4-6 týdnů, není-li to zhola nezbytné. Díky chybám v číslování je fyzická předloha dobrou pomůckou a v případě poškození skenu nezbytností. Děje se to, kdyby ne, neexistovaly by procesy toto řešící! Platíme vám dost. (Všechny projekty IOP, VISK apod. jsou hrazeny po úplné akceptaci části nebo celého díla. Zhotovitel nese náklady ke své tíži i několik měsíců po finální předávce, zálohy neexistují.) 7

Mántry řídících pracovníků KNIŽNÍ SKENOVÁNÍ Lidí je všude dostatek, nákup technologií je důležitější. Neobydlený dům vlhne od základů, nepracující technologie je mrtvá už při nákupu. Tuto práci může dělat skoro každý. -> Odbornost a dostatečná kapacita budoucího personálu KDJ či osob zpřístupňujících statisíce PSP balíčků s jednotlivými výstupy monografií a periodik je podmínkou nutnou. Dokud byla produkce spíše testem možností, mohli být tyto práce vykonávány bokem. Údržba a správa rostoucí digitální knihovny je kvalifikovaná práce na pomezí knihovníka programátora pracovníka IT Digitalizace znamená naskenovat, nafotit, popsat a vrátit. -> Spektrum přípravných prací je mnohem širší. Je například nutné dohodnout pojištění děl, hranice odpovědností, závozy, počítat s průběžnou údržbou, s vymezením prostor na velmi dlouhou dobu (přestěhování technologie v podobě tunového skeneru je noční můra), s rozvolněním děl, očistou od prachu apod., s popisem děl po přejímce list po listu, popřípadě i s dobou pro nákup a vyzkoušení nových technologií (např. zpracování RTG snímků, skleněných desek s požadavkem na >10 tisíc dpi, letecké snímkování, prostorové 3D skeny apod.) 8

JAK LZE SPOLUPRACOVAT NA DÁLKU dynamika nestíhaných projektů 9

Knižní skenery 4DigitalBook co by měl vědět projekťák MINI-DL-i & Scan2Page - vytěžování strojů 2x A3 2 x A2+ 10

Knižní skenery 4DigitalBook KNIŽNÍ SKENOVÁNÍ Kniha založená v knižní kolébce mapy a volné nadrozměrné přílohy se skenují na průtahovém skeneru A0 leckdy prohlášeny za vhodné pro robotické zpracování i v případě složených leporel apod. přílohy 11

Řešení Scan4Book 6 bodů zapamatování Procesy pro digitalizaci monografií a periodik dle NDK 2012 Založení zakázky Safebook Zakázka = monografie nebo svazek periodik = čárový kód Protokoly, fyzický stav svazků Logování operací OCR ScanBus + Abbyy SDK Rozpoznání textu pomocí OCR Tvorba ALTO XML (boxing), TXT (fulltext) Výpočty úspěšnosti rozpoznání znaků a slov Pořízení obrazů Skenování pomocí aplikace pro obsluhu knižního skeneru Vložení naskenovaných obrazů do zakázky, přiřazení profilů s metadaty pomocí aplikace ScanPortal. MDE Safebook MDE: paginace, určení typu stran, rekatalogizace Doplnění popisných metadat Rozdělení svazku na intelektuální entity Přesun a mazání stran Začlenění obrázků po importu, sloučení Kontroly - prevalidace PT ScanBus Návrh a manuální korekce úprav obrazů Ořez, vyrovnání textu, snížení průsvitu PSP Safebook Získání URN:NBN z Resolveru Kompletace PSP dle NDK 2012 Verifikace validátorem NDK 12

Přehled svazků (knihovny, archivy) KNIŽNÍ SKENOVÁNÍ Hmotnost a velikost svazků obvyklé podmínky pro skenování: do 10 cm výšky hřbetu a 10 kg R E A L I T A 13

Příprava projektu: 2-3 roky, synergie ve fázi příprav Co předchází výběru svazků pro digitalizaci fyz. příprava a založení do RD vyhledání zdrojů v katalozích i fyzicky zjištění stavu a úplnosti knihovních, archivních a sbírkových fondů akviziční činnost pro kompletaci sbírek doplnění identifikátorů (ččnb, kde lze) prostřednictvím NK předání dat Registru digitalizace, příznak připravenosti vyjednání zápůjček od archivních institucí vyjednání zápůjček od mimoregionálních institucí fyzická příprava vybraných děl k určeným datům na místa svozu po spuštění pr. 14

Přehled svazků (knihovny, archivy) KNIŽNÍ SKENOVÁNÍ Svazek periodika s přílohou snadno opomenutelnou při robotickém skenování 15

Přehled svazků (knihovny, archivy) Svazky periodik: a. se všitou reklamou b. se dvěma deníky a občasnými přílohami KNIŽNÍ SKENOVÁNÍ a) reklama na šicí stroje (neřezáno) b) dvojí nepravidelně se střídající ččnb 16

Přehled svazků (knihovny, archivy) KNIŽNÍ SKENOVÁNÍ Vzhled některých stránek Tmavé oblasti na okrajích - průhledná páska 17

Přehled svazků (knihovny, archivy) KNIŽNÍ SKENOVÁNÍ Není Palcát jako Palcát aneb změna formátu během roku vhodné upozornit v poznámce o knize 18

Přehled svazků (knihovny, archivy) Monografie má smysl skenovat v barvě; (u periodik na denní bázi jde spíše o nejasné autoritativní kompetence ) 19

Přehled svazků (knihovny, archivy) Dlooouuuhéééé a šíroké stránky 20

Děkujeme za pozornost Ústí nad Labem 4. září. 2013 SYNERGIE = Ten umí to a ten zas tohle, a všichni dohromady uděláme moc 21