Z papíru na web a ke čtenáři. Digitalizace regionální literatury v Moravskoslezském kraji. Praha 16.05. 2013 Prezentace projektu Digitalizace knihovního fondu Moravskoslezského kraje Reg.č.: CZ.1.06/2.1.00/08.07383
Představení projektu Moravskoslezského kraje, realizační období 1.10.12 30.9.13 Zadávací dokumentace Veřejná zakázka na služby Digitalizace knihovního fondu zadávaná v otevřeném řízení podle 27 a násl. zákona v rámci projektu reg. č. CZ.1.06/2.1.00/08.07383 spolufinancovaného z prostředků Evropské unie, Evropského fondu pro regionální rozvoj, prostřednictvím ZADAVATEL: Moravskoslezský kraj Sídlem 28. října 117, Ostrava Moravská Ostrava, PSČ 702 18 IČ: 70890692 Klasifikace: Kód CPV: 79999100-4, název Skenování Kód CPV: 72310000-1, název Zpracování dat Kód CPV: 72311100-9, název Konverze dat 2
Představení projektu Moravskoslezského kraje, realizační období 1.10.12 30.9.13 Zúčastněné paměťové instituce Knihovny Muzea Archivy Moravskoslezská vědecká knihovna v Ostravě (Ing. Lea Prchalová, Mgr. Monika Oravová, Mgr. Aleš Drahotušský) Muzeum v Bruntále (Mgr. Hana Garncarzová, Jana Nováková) Muzeum Novojičínska (PhDr. Sylva Dvořáčková, Irena Jašíková) Muzeum Těšínska (PaedDr. Zbyšek Ondřeka, Mgr. Helena Macurová) Muzeum Beskyd Frýdek-Místek (PhDr. Zuzana Břízová, Radmila Matěnová) Slezské zemské muzeum (Mgr. Antonín Šimčík, Mgr. Jitka Štěrbová) Ostravské muzeum (RNDr. Jiřina Kábrtová, Mgr. Jitka Šmehlíková) Archiv města Ostravy (PhDr. Blažena Przybylová, Mgr. Jozef Šerka) Externí doplnění fondů Moravská zemská knihovna Brno Moravský zemský archiv Brno Vědecká knihovna v Olomouci 3
Odborný garant - Moravskoslezská vědecká knihovna v Ostravě, příspěvková organizace MSVK je krajskou knihovnou byla založena v roce 1951 její roční návštěvnost činí téměř 170 000 osob a virtuální návštěvnost téměř 500 000 osob vlastní více než 1,1 mil. knihovních jednotek, poskytuje cca 540 000 výpůjček ročně realizuje celoživotní vzdělávání knihovníků e-learningem i klasickými kurzy a semináři systematicky retrospektivně stopuje regionální literaturu s vazbou na Moravskoslezský kraj a vytváří bibliografické databáze od roku 2005 buduje Digitální knihovnu Moravskoslezského kraje, kde jsou kromě fondů MSVK i dokumenty z dalších paměťových institucí kraje (knihovny, archivy, muzea) 4
Představení projektu Moravskoslezského kraje; realizační období 1.10.12 30.9.13 Cíle projektu digitalizace 306 000 stran knihovního fondu paměťových institucí MSK příprava dokumentů k digitalizaci (kontrola úplnosti, sepsání chybějících a poškozených částí dokumentu, sepsání anotace, základní očištění dokumentu) skenování dokumentů v RGB (standard: TIFF, 300DPI nebo vyšší ) úprava obrazových souborů (ořez vně okraje dokumentu, vyrovnání řádků textu, potlačení pozadí a průtisků, vymazání stínů, korekce zakřivení stran) konverze obrazových souborů TIFF -> JPEG2000 archivní a zpřístupňující (LTP, Kramerius 4) vytěžení textové informace pomocí OCR do formátu ALTO XML a TXT doplnění katalogizačních údajů (tiskař, rozměry, anotace, DTD, vnitřní části, chyby paginace aj.) vybrané tituly seriálů zpracovat též na analytické úrovni (vnitřní části) poskytnutí veškerých souvisejících služeb, činností a plnění zajištění dopravy, skladování (6 svozů) kompletace dodávky PSP (balíčků) na DVD nebo HD nosičích zajištění publicity a účasti na reprezentativních domácích výstavách či konferencích, 5
Dodavatelská struktura projektu Objednatel: Objednatel: Moravskoslezský kraj Moravskoslezský kraj Odborný garant: Moravskoslezská vědecká knihovna Archivní instituce Dodavatel: Konica Minolta Business Solutions Czech, spol. s r.o. Zhotovitel: scanservice a.s. 6
Bibliografické požadavky na zhotovitele Popis M /P požadavky na kontrolu / doplnění => de facto REKATALOGIZACE: 1. Identifikátory (dle aktuálních požadavků systémů Kramerius, registru digitalizace (RD) apod.) 2. Autor - v případě, že kniha je tvořena příspěvky více autorů, uvést všechny autory (rozpor s RD ;) 3. Role autora - např. autor, překladatel, ilustrátor,... 4. Název, příp. podnázev, souběžný název 5. Druh dokumentu 6. Vydavatelské údaje vydavatel, místo a datum vydání, Tiskařské údaje tiskař, místo a datum tisku 7. Fyzický popis - rozměry, počet stran, technika, materiál (Aleph obvykle neobsahuje nebo neúplné) 8. Jazyk - např. cze, ger 9. Klíčové slovo - používat hesla MSVK, předmětová hesla dle Národní knihovny ČR či klíčová slova z katalogizačního záznamu instituce vlastnící dokument (max. 10 klíčových slov) 10. MDT - pokud ho lze dohledat v katalogu instituce, které patří dokument, nebo v Souborném katalogu ČR 11. Edice 12. Anotace - stručný popis obsahu knihy, poznámka - zajímavé informace o knize (např. fotografie) 13. Signatura, sigla MSVK 14. Dostupnost (vlastník dokumentu, možnost prezenční/absenční výpůjčky) 15. Stav z hlediska ochrany fondu (např. chybějící strany, nekvalitní předloha) 7
Datová struktura - přehled Kalkulovaný počet stran 306 000 Počet svazků monografií 210 Počet svazků periodik 649 Průměrná skenovací rychlost 240 stran / hod Písmo Gotika : Latinka Ruční zpracování gotického OCR Hranice pro manuální zpracování: Obvyklý poměr automat / operátor 70 % gotika, 30 % latinka (častý a nepředpokládaný mix) 5 28 min /stránku (cca 11 000 znaků A3+) od 10 % gotika od 5 % latinka Monografie cca 20:1 (pět ze sta) Periodika cca 5:1 (20 ze sta) 8
Datová struktura ukázka seznamu digitalizovaných děl - periodika 9
Datová struktura ukázka seznamu digitalizovaných děl - monografie 10
Zabezpečení skladu a pracovišť o Kamerový systém Řízené povolení vstupu Karty - vstupní dveře budovy chodby jednotlivá burreau sklady 11
Knižní skenery 4DigitalBook použité v projektu MSK MINI-DL-i & Scan2Page 2x A3 2 x A2+ 12
Knižní skenery 4DigitalBook použité v projektu MSK Kniha založená v knižní kolébce mapy a volné nadrozměrné přílohy se skenují na průtahovém skeneru A0 přílohy 13
Knižní skenery 4DigitalBook použité v projektu MSK Skenery řídí SW CopiNet + HMI 14
Řešení Scan4Book Vlastní vývoj zhotovitele scanservice a.s. Procesy pro digitalizaci monografií a periodik dle NDK 2012 Založení zakázky Safebook Zakázka = monografie nebo svazek periodik = čárový kód Protokoly Logování operací OCR ScanBus + Abbyy SDK Rozpoznání latinkou psaného textu Tvorba ALTO XML, TXT Výpočet úspěšnosti rozpoznání pro každou stránku Pořízení obrazů Skenování pomocí aplikace pro obsluhu robotického knižního skeneru CopiNet+HMI. Vložení naskenovaných obrazů do zakázky, přiřazení profilů s metadaty pomocí aplikace ScanPortal. MDE Safebook MDE: paginace, určení typu stran, rekatalogizace Rozdělení svazku na intelektuální entity Přesun stran Smazání stran Začlenění obrázků po importu, sloučení Kontroly Doplnění popisných metadat PT ScanBus Návrh a manuální korekce úprav obrazů Ořez, vyrovnání textu, snížení průsvitu PSP Safebook Získání URN:NBN z Resolveru Kompletace PSP dle NDK 2012 Verifikace validátorem 15
Řešení Scan4Book Moderní windows aplikace umožňující uživateli přehledné a efektivní vkládání naskenovaných obrazů do zakázky a případně i opravu již vložených obrazů. Hlavní charakteristika řešení: Drag & Drop Barevné rozlišení stavu Možnost volby PT a MDE Volba profilu skeneru ke každému skenu Operace probíhají na serveru Využití čárových kódů Další implementace řešení v rámci projektu Technologického centra Ústeckého kraje jeho Krajské digitalizační jednotky 16
Řešení Scan4Book 17
Řešení Scan4Book MetaEditor přizpůsobený požadavkům MSK 18
Přehled svazků (knihovny, archivy) Hmotnost a velikost svazků obvyklé podmínky pro skenování: do 10 cm výšky hřbetu a 10 kg R E A L I T A 19
Příprava projektu: 2-3 roky Co předchází výběru svazků pro digitalizaci vyhledání zdrojů v katalozích i fyzicky zjištění stavu a úplnosti knihovních, archivních a sbírkových fondů akviziční činnost pro kompletaci sbírek doplnění identifikátorů (ččnb, kde lze) prostřednictvím NK předání dat Registru digitalizace, příznak připravenosti vyjednání zápůjček od archivních institucí MSK vyjednání zápůjček od mimoregionálních institucí fyzická příprava vybraných děl k určeným datům na místa svozu 20
Ukázky svazků (knihovny, archivy) 21
Přehled svazků (knihovny, archivy) 22
Přehled svazků (knihovny, archivy) Svazek periodika s přílohou snadno opomenutelnou při robotickém skenování 23
Přehled svazků (knihovny, archivy) Svazky periodik: a. se všitou reklamou b. se dvěma deníky a občasnými přílohami a) reklama na šicí stroje (neřezáno) b) dvojí nepravidelně se střídající ččnb 24
Přehled svazků (knihovny, archivy) Vzhled některých stránek Tmavé oblasti na okrajích - průhledná páska 25
Přehled svazků (knihovny, archivy) Není Palcát jako Palcát aneb změna formátu během roku 26
Přehled svazků (knihovny, archivy) Monografie má smysl skenovat v barvě; (u periodik jde spíše o nejasné autoritativní kompetence ) 27
Předpokládaná dostupnost svazků v systémech Kramerius 4 Výsledky projektu budou zpřístupněny ve formě technologií známých pod souhrnným označením Kramerius 4 v průběhu prvního pololetí 2014 v rámci Koncepce rozvoje VKIS v Moravskoslezském kraji na léta 2013-2016 volná díla bez omezení díla chráněná budou k dispozici v interních prostorách knihovny a studovnách zúčastněných institucí, z nichž většina modernizuje počítačové vybavení co do kvality i počtů tak, aby uspokojily narůstající zájem čtenářů 28
Děkujeme za pozornost Praha 16. 05. 2013 Zrušení monopolu na informace = vzdělání + naděje pro budoucnost 29