Současn asné trendy v digitalizaci novodobých dokumentů Jiří Polišenský
Obsah příspp spěvku Národní program Kramerius VISK 7 Norské fondy Tvorba fulltextu a OCR Národní digitáln lní knihovna a národnn rodní kulturní dědictví Replikace digitalizovaných dokumentů Technologie robotického skenování Projektový záměr z r IOP
Národní program Kramerius Vznikl jako součást st programu CASLIN Zaměř ěřen na záchranu z chranu dokumentů ohrožených degradací papíru reformátov továním Využívá technologii ochranného ho mikrofilmování a hybridní technologii Oživena 4 pracoviště mikrofilmování v České republice, 1 na Slovensku
VISK 7 Program MK ČR R na financování projektů reformátov tování ohrožených dokumentů Podpora pracovišť ochranného ho reformátov tování
Výsledky programu VISK 7 V letech 2001 aža 2007 bylo mikrofilmováno a digitalizováno téměřt 300 titulů poeriodik 35 institucí,, což představuje 3,5 mil. stran NK ČR R zajišťuje archivaci mikrofilmů a zálohování zdrojových i uživatelských u digitáln lních dat Digitalizované dokumenty se zpřístup stupňují prostřednictv ednictvím m médim dií (CD-R, DVD) nebo pomocí systému Kramerius
VISK 7 finace v l. 2001-2007 2007 2001 2002 2003 2004 2005 2006 2007 Požadov adováno KčK 4 522 370 3 079 507 2 498 060 4 896 204 4 881 205 5 004 000 8 061 353 Přiděleno KčK 2 919 000 1 400 000 415 000 2 482 000 2 116 000 2 200 000 7 351 000 % 64,55 45,46 16,61* 50,69 43,35 43,96 91,19
VISK 7 problémy Malý objem finančních prostředk edků v příp. p p. rozsáhlých titulů trvá reformátov tování neúnosn nosně dlouho Závislost na omezeném m počtu dodavatelských firem Rychlé zastarávání HW i SW prostředk edků Potřeba rozsáhl hlého ho vývoje a inovací Limitovaný prostor paměť ěťových prostředk edků pro zálohovz lohování (archivaci)
Projekt Norské fondy NK ČR Záchrana bohemikáln lních neperiodických dokumentů 19. stol., ohrožených degradací papíru V rámci r projektu bude reformátov továno hybridní metodou 2,4 mil. stran (více než 16.000 svazků) monografií Termín n realizace 6/2007 12/2009 Finanční objem 1 mil EUR dotace, 0,2 mil. EUR splufinancování Projekt je postaven na dodavatelských službách nezahrnuje investice
Projekt Norské fondy NK ČR V současn asné době je zpřístupn stupněno no v systému Kramerius více než 1 mil. stran monografií Dlouhé schvalovací období zkrátilo dobu na realizaci Základní harmonogram (Project Implementation Plan) rozdělen po čtvrtletích Možné úpravy harmonogramu a čerpání finančních prostředk edků Velké nároky na přípravu p pravu dokumentů pro reformátov tování, předávání a přejp ejímaní dávek dokumentů,, mikrofilmů a dat a jejich kontrola Informace o digitalizovaných dokumentech jsou dostupné na adrese: http://www.nkp nkp.cz/files/norske_fondy. _fondy.xls
Tvorba fulltextu pro vyhledávání a problematika OCR Digitalizace degradovaných dokumentů přináší podstatně zhoršen ené výsledky rozpoznávání technologií OCR Další snahy o vylepšov ování kvality obrazuových souborů nepřin ináší podstatné zlepšen ení NK ČR, KNAV a firma ELSYST realizují projekt na zlepšen ení kvality pomocí znalostních bázíb jazykových vrstev českého jazyka Pro potřeby projektu bylo třeba t zvolit 5 časových etap a 12 tématických t skupin NK ČR R se podílí na realizaci evropského projektu TEL+ zaměř ěřeného na OCR
Národní digitáln lní knihovna a národnn rodní kulturní dědictví Do NárodnN rodní digitáln lní knihovny by měly m být zařazov azovány následujn sledující typy dokumentů: obecně dokumenty v okamžiku, kdy nejsou k dispozici na knižním m trhu starší vrstvy novodobých dokumentů (např.. 19. stol.) v relativní úplnosti bez ohledu na tematické členění starší vědecká literatura z oblasti společenských enských a přírodnp rodních věd v d (před rokem 1989, novější by měla m být předmp edmětem archivace oborových repozitářů řů) starší literatura z oblasti technických oborů dokumenty z oblasti literatury, poezie a umění dokumenty z různých zájmových z a zábavnz bavních oblastí,, zpravodajství a publicistiky významné starší regionáln lní dokumenty (nejnovější regionáln lní dokumenty by měly m být archivovány prostřednictv ednictvím m lokáln lních repozitářů řů) Některé speciáln lní dokumenty jako mapy, kalendáře, e, plakáty, grafika apod. další dokumenty z různých zných oblastí,, jejichž význam je dán d n individuáln lními rysy.
Národní digitáln lní knihovna a národnn rodní kulturní dědictví Národní digitáln lní knihovna nebude uchovávat: vat: současn asné učebnice včetnv etně vysokoškolských, kolských, současn asné kvalifikační vysokoškolsk kolské práce, sborníky z vědeckých a odborných seminářů a konferencí, účelové publikace ústavů, úřadů,, obcí, škol, firem apod. Pokud budou tyto typy dokumentů do NárodnN rodní digitáln lní knihovny zařazov azovány, tak pouze výběrov rově a s delší ším časovým zpožděním.
Národní digitáln lní knihovna a národnn rodní kulturní dědictví Archivace digitáln lních dokumentů pro jiné aktivity kromě VISK 7 bude možná až po zprovoznění spolehlivého ho repozitáře a rozší šíření datového úložiště
Replikace digitalizovaných dokumentů Digitáln lní kopie by měly m v maximáln lní míře nahradit degradované dokumenty Nejsnadnější způsob zhotovení digitáln lní kopie je její replikace V případp padě replikací může e být poskytující knihovna ve dvojí roli: Jako výrobce digitáln lní kopie (replikací) Jako poskytovatel práv v k vlastní kopii V prvém m případp padě poskytující knihovna nemůž ůže nijak limitovat způsob využit ití digitáln lní kopie u druhé instituce, ve druhém m případp padě tak můžm ůže učinit (např.. omezit na nekomerční využit ití)
Technologie robotnického skenování Využívá přístroje, které maximáln lně automatizují proces skenování vázaných dokumentů bez jejich rozvazby Přístroje dosahují výkony od 300 do 3000 stran za hodinu podle typu dokumentu a nastavení skenovacích ch parametrů Proces skenování je nejen rychlý, ale i šetrný vůčv ůči dokumentům Těmito přístroji p lze podle zkušenost eností skenovat 60 aža 80% dokumentů knihovny Přístroje nelze použít t pro dokumenty s poškozenou vazbou, rozkládac dací přílohy, volné listy apod.
Technologie robotnického skenování V současn asné době existují na trhu 4 robotické skenery: 4DigitalBooks Treventus Kirtas Qidenus Přístroje se od sebe liší způsobem sobem snímkov mkování, upnutím m předlohy p při p i skenování,, mechanismem obracení stránek
4DigitalBooks
4DigitalBooks MOV01412.MPG MOV01401.MPG
Treventus http://www.treventus.com/buchscanner_s canrobot_fotos.html http://www.youtube.com/watch?v=y16rn qnxj0u
Kirtas http://www.kirtas.com/products.html http://www.youtube youtube.com/watch?v=nvir8 HHUsIg
Qidenus
Qidenus MOV01443.MPG
Qidenus http://images images.google..google.cz/imgres?imgurl=ht tp%3a%2f%2fwww.qidenus qidenus.com%2fqis can%2fimages%2fprodukt_img img_pro. _pro.jpg&i mgrefurl=http%3a%2f%2fwww. =http%3a%2f%2fwww.qidenus. com%2fqiscan%2fenglish%2fprodukte. %2FQiScan%2Fenglish%2Fprodukte.p hp&hl hl=cs&tbnh=110& =110&tbnw=112
Záměr r IOP Společný projektový záměr z r NK ČR R a MZK Cílem je vybudování dvou pracovišť hromadné digitalizace a pracoviště dlouhodobé archivace digitáln lních dokumentů Pracoviště digitalizace budou schopna digitalizovat bohemikáln lní produkci 19. a 20. stol. během hem 20ti let (1,1 mil. svazků,, cca 300 mil. stran) V rámci r projektu (2010 aža 2014) se předpoklp edpokládá digitalizace cca 320 tis. sv., 80 mil. str.
Záměr r IOP Pracoviště digitalizace NK ČR R bude vybaveno 8 robotickými skenery a 2 manuáln lními Sestává ze třít částí: Příprava dokumentů Skenování Úpravy dat a tvorba metadat Na pracovišti NK ČR R bude 39 pracovníků
Záměr r IOP Pro realizace projektu se předpoklp edpokládá přizpůsobení stávaj vajících ch programových nástrojn strojů Kramerius a Relief a pořízen zení nových nástrojn strojů (4DB, CCS) Pro automatickou tvorbu metadat bude třeba t přejp ejít t na standard MARC XML a METS ALTO Systém Relief (Registr digitalizace CZ) bude poskytovat potřebn ebné údaje uživatelu ivatelům m a knihovníkům m o digitalizovaných dokumentech a knihovním m systémům pro propojení elektronických katalogů NKC, MZK a SKC s digitáln lní knihovnou
Děkuji za pozornost Jiri.Polisensky Polisensky@nkp.cz