České digitalizační projekty, jejich výsledky a agregace Ing. Martin Lhoták Knihovna AV ČR, v. v. i. Konference Knihovny současnosti 10. 9. 2015, Olomouc
Obsah Digitalizační projekty Výsledky průzkumu mezi knihovnami Česká digitální knihovna - agregace
Digitalizační projekty Národní digitální knihovna (IOP) 110 000 svazků / 30 000 000 stran Kramerius 3 v NK 12 200 svazků / 8 700 000 stran Krajská digitalizace (IOP) 60 000 svazků / 11 000 000 stran VISK 7 novodobé dokumenty 1 500 svazků / 450 000 stran ročně (data předávána do NK) VISK 6 Manuscriptorium rukopisy a staré tisky 13 750 000 stran Google books v NK ČR 110 000 svazků / 11 000 000 stran + další individuální projekty knihoven např. KNAV, MKP, NLK
Digitalizace - průzkum Počet digitalizovaných stran novodobých dokumentů Počet kompletně zpracovaných stran novodobých dok. Používaný SW pro digitální knihovnu a jeho verze Zdroje financování Plánované digitalizační projekty a počet stran do roku 2016 Dotaz na používání Registru digitalizace Stejné dotazy týkající se rukopisů a starých tisků Průzkum probíhal v období červenec srpen 2015 Odpověď poskytlo 22 knihoven
Počet zdigitalizovaných stran novodobých dokumentů (cca od 1801) Národní knihovna ČR 37 941 254 Moravská zemská knihovna 30 800 000 Knihovna Akademie věd ČR 5 400 000 Vědecká knihovna v Olomouci 1 544 502 Jihočeská vědecká knihovna 1 530 000 Národní lékařská knihovna 1 050 000 Studijní a vědecká knihovna v Hradci Králové 998 000 Městská knihovna v Praze 960 000 Knihovna Vojenského historického ústavu 800 000 SVI Fakulty sociálních věd Univerzity Karlovy 676 308 Moravskoslezská vědecká knihovna v Ostravě 537 706 Knihovna Ústavu pro českou literaturu AV ČR 370 000 Studijní a vědecká knihovna Plzeňského kraje 366 664 Krajská knihovna Františka Bartoše ve Zlíně 344 774 Knihovna Národního filmového archivu 325 000 Severočeská vědecká knihovna v Ústí nad Labem 323 000 Národní technická knihovna 306 328 Muzeum východních Čech v Hradci Králové 300 000 Středočeská vědecká knihovna v Kladně 271 783 Knihovna Divadelního ústavu 190 000 Krajská knihovna Karlovy Vary 179 146 Městská knihovna Česká Třebová 12 000 CELKEM 85 226 465
Počet zdigitalizovaných stran novodobých dokumentů (cca od 1801) včetně metadat Celkem 81 215 274 stran rozdíl pouze 4 000 000 stran
Financování jednotlivé projekty a programy NDK IOP 300 000 000 Kč Krajská digitalizace z OP cca 150 000 000 Kč (odhad) VISK 7 3 800 000 Kč v roce 2015 VISK 6 8 300 000 Kč v roce 2015 Google Books NK ČR 4 000 000 Kč ročně + dalších 80% hrazeno Googlem (16 000 000 Kč) PRALIT 6 850 000 Kč
Plánovaný přírůstek do konce roku 2016 Novodobé dokumenty 5 636 587 stran cca 6,5 % nárůst (+ NDK NK) Rukopisy a staré tisky 12 695 000 stran cca 60 % nárůst
Hlavní charakteristika Zastřešení českých digitálních knihoven Sklízení metadat Jedno vyhledávání nad všemi digitalizovanými daty Jedno rozhraní pro doručení plných textů Dynamické nahrávání plných textů Nejedná se pouze o index Agregátor pro projekt Europeana Výstupy projektu volně dostupné pod licencí GNU GPL
Tři podcíle - systém pro zpřístupnění digitálních dokumentů - systém pro sledování digitalizačního workflow - produkční a archivační systém http://www.czechdigitallibrary.cz
http://cdk-test.lib.cas.cz/client/index.vm
http://cdk-test.lib.cas.cz/client
Systém pro sledování digitalizačního workflow Vychází z Registru digitalizice CZ Propojení s produkčním systémem ProArc umožní automatizované zaznamenávání jednotlivých digitalizačních kroků Automatická aktualizace dat v Registru digitalizace Provedeny analýzy a návrhy obrazovek Funkční verze plánována na podzim 2015
Produkční a archivační systém Produkce digitálních dokumentů Dodržování standardů NK ČR - kompletní PSP balíček NDK (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) Přebírání dat z externích systémů (Aleph, Registrdigitalizace.cz) Kompatibilita se systémem Kramerius Podpora identifikátorů URN:NBN, UUID Dlouhodobá archivace digitálních dokumentů LTP (ve vývoji) Dodržovaní standardů pro LTP - OAIS, ISO Propojení s Archivematicou Dlouhodobě využíván v KNAV, SVKHK, MKP +??? Open source založený na Fedora Commons repository
Vytváření popisných metadat
Možnosti exportu
Testovací provoz ČDK v Knihovně AV ČR 25 mil. stran KNAV, NK, MZK, NTK Přesun do Národní knihovny a zahájení ostrého provozu Nutno zajistit finanční zdroje pro stabilní provoz Smluvní ošetření mezi KNAV a NK Smlouvy s knihovnami o spolupráci Poskytnutí metadat, náhledů a OCR textů Zajištění trvalých odkazů Spolupráce s TEL a Europeanou
Děkuji Martin Lhoták Lhotak@knav.cz http://www.knav.cz