Biblioteca Digital Hispanica (BDH) - návštěva NK Španělska Jan Hutař

Podobné dokumenty
Digitalizace knihovních dokumentů. Jiří Polišenský

Digitalizace a digitální knihovny v České republice

Z papíru na web a ke čtenáři aneb Digitalizace není jen skenování. Mgr. Monika Oravová Moravskoslezská vědecká knihovna v Ostravě

Zpráva ze služební cesty

České digitalizační projekty, jejich výsledky a agregace

DIGITÁLNÍ UNIVERZITNÍ REPOZITÁŘ. Andrea Fojtů Ústav výpočetní techniky UK v Praze

90 let Mapové sbírky UK. Digitalizace mapových sbírek a archivů, Praha, 2010

Digitalizace a Digitální archiv Státního oblastního archivu v Třeboni po čtyřech letech. Výsledky a perspektivy dalšího vývoje

Česká digitální knihovna agregace digitálního obsahu českých knihoven

Zpřístupnění kulturního dědictví v digitální podobě v ČR prostřednictvím knihoven

ProArc. open source řešení pro produkci a archivaci digitálních dokumentů. Martina NEZBEDOVÁ Knihovna AV ČR, v. v. i., Praha nezbedova@knav.

Lenka Maixnerová, Filip Kříž, Ondřej Horsák, Helena Bouzková

The bridge to knowledge 28/05/09

Digitalizace a vytěžování dat jako služba

Využití nástrojů z projektu Česká digitální knihovna při digitalizaci a zpřístupnění digitálních dokumentů

Projekt HISPRA aneb Jak využít digitalizaci MKP v dalších knihovnách. 12. Května 2011, Jelení Hora

Editor umožní tvorbu a editaci metadat digitálních objektů, včetně importů a exportů a práci s primárními daty.

EOD Elektronické knihy na objednávku. Rostislav Krušinský

Krajská digitalizace ve Středočeském kraji aktuální stav

RD.CZ EVIDENCE DIGITALIZOVANÝCH DOKUMENTŮ A SLEDOVÁNÍ PROCESU ZPRACOVÁNÍ

Velká data v knihovnách Open source tools and their use in Czech libraries

Lenka Maixnerová, Filip Kříž, Helena Bouzková, Ondřej Horsák, Adéla Jarolímková, Eva Lesenková

Kramerius - zpřístupnění digitálních kopií v ČR

Od zpřístupnění rukopisů přes komerční archivy k LTP, aneb 20 let praxe s dlouhodobým uložením dat.

Dlouhodobá ochrana digitálních dokumentů a projekt NDK

Digitalizace v ČR a její podchycení v registru digitalizace. Helena Dvořáková Národní knihovna ČR

Digitalizace pražské židovské literatury v Městské knihovně v Praze

Národní digitální knihovna

DIGITALIZAČNÍ PROJEKTY KRAJE VYSOČINA. Únor 2015

Seminář pro vedoucí knihoven asviústavů AV ČR ASEP

Zpráva ze zahraniční služební cesty

DŮVĚRYHODNÁ ELEKTRONICKÁ SPISOVNA

E-knihy Nakladatelství Karolinum. Mgr. BcA. Vít Krobot

Dlouhodobá ochrana digitálních dat: co může vaše instituce udělat již dnes?

Linked Heritage. Koordinace standardů a technologií za účelem obohacení Europeany. Alena Součková

Národní digitální knihovna v cílové rovince

Dlouhodobé uchování a zpřístupnění digitálních dokumentů v Evropě: výsledky dotazníkového průzkumu

RD.CZ : EVIDENCE DIGITALIZOVANÝCH DOKUMENTŮ A SLEDOVÁNÍ PROCESU ZPRACOVÁNÍ

Projekt CDArcha: kooperativní zpracování datových CD disků. Zdeněk Hruška, Petr Žabička Moravská zemská knihovna v Brně AKM 2018

OpenGrey. Petra Pejšová, NTK, ČR Christiane Stock, INIST-CNRS, Francie

Tzv. životní cyklus dokumentů u původce (Tematický blok č. 4) 1. Správa podnikového obsahu 2. Spisová služba

INFORUM Špalíček digitální knihovna kramářských tisků (spalicek.net)

Zpráva ze služební cesty

EOD - Elektronické knihy na objednávku

Novinky v e-zdrojích NLK. Adéla Jarolímková, NLK

Digitalizace Tvorba e-knih v knihovně

Ukládání a archivace dat

Představení digitalizačních projektů Národní technické knihovny a spolupráce v rámci ebooks on Demand

Lenka Maixnerová, Filip Kříž, Ondřej Horsák, Helena Bouzková

Digitalizace a digitální archiv Státního oblastního archivu v Třeboni

Evropská digitální knihovna. < Prezentace k eseji pro předmět PV070 Digitální knihovny. Tomáš Drusa

Nové služby veřejných knihoven v digitálním prostředí (zpřístupnění děl nedostupných na trhu) Knihovny současnosti 2017 Olomouc

NOVÉ MOŽNOSTI PŘÍSTUPU K DIGITÁLNÍ ARCHIV NLK PLNOTEXTOVÝM INFORMACÍM : Filip Kříž, Lenka Maixnerová, Ondřej Horsák, Helena Bouzková

Zpráva ze zahraniční služební cesty

Digitální konkordance a Registr digitalizace v Manuscriptoriu,

Dlouhodobá ochrana digitální dokumentů. Mgr. Jaroslav Kvasnica

Portál ebadatelna Zlínského kraje a zpřístupnění map. Prezentace historických map z fondu paměťových institucí Zlínského kraje

Digitalizace HF a jeho prezentace Dostupný z

DIGITALIZOVANÉ FONDY VĚDECKÉ KNIHOVNY V OLOMOUCI A KDE JE HLEDAT. Miloš Korhoň, Jan Houserek

kreativní marketingová agentura

Vývoj a využití plnotextových edic historických dokumentů v Manuscriptoriu

E-knihy v knihovnách. Zuzana Hájková Jihočeská vědecká knihovna v Českých Budějovicích hajkova@cbvk.cz

Technologie digitálních knihoven

Archivace digitálních dokumentů. Elektronická spisovna

Přidružené publikace v České republice

Economists Online: nový portál pro ekonomické vědy

Systémy pro tvorbu digitálních knihoven

Návrh opatření pro prodloužení životnosti obsahu CD a DVD disků ve sbírkách NK

Digitální knihovny v České republice

Účast NK ČR v projektu Norské fondy - digitalizace bohemikálních monografií ohrožených degradací papíru. Jiří Polišenský

Zpráva ze služební cesty

OpenGrey. Petra Pejšová, NTK, ČR Christiane Stock, INIST-CNRS, Francie. Digitálná knižnica 2012, dubna 2012 Jasná pod Chopkom

METODY A POSTUPY DIGITALIZACE A ONLINE ZPŘÍSTUPNĚNÍ STARÝCH KARTOGRAFICKÝCH DĚL

Repositář audiovizuálních dokumentů Akademie múzických umění v Praze..

Zpráva ze zahraniční služební cesty

e-pv_kalkulace nákladů pro NK - osobní náklady

ZPŘÍSTUPNĚNÍ A ARCHIVACE PLNÝCH

Digitální nabídka veřejných knihoven. Frank Daniel Městská knihovna Kolín Praha,

manuscriptorium Manuscriptorium v Evropě Manuscriptorium.com

Zpřístupnění děl nedostupných na trhu v digitální podobě

Digitalizační centrum včetně plnění databáze rastrových map uživateli

Projekt Digitalizace a ukládání ve Zlínském kraji zkušenosti, postřehy

Rosetta nástroj pro dlouhodobé uložení digitálních objektů

INFORUM 2012: 18. konference o profesionálních informačních zdrojích

Seminář pro vedoucí knihoven a SVI ústavů AV ČR. Aleph

Online přístupné odborné knihy neztrácejí na půvabu

Zpráva ze zahraniční služební cesty

Příloha č. 1. Návrh aplikace pro správu a archivaci XML dokumentů Zpracoval: Ing. Jan Smolík, CSc

Virtuální depozitní knihovna Nástroj pro doplňování bohemikálních konzervačních sbírek. Tomáš Foltýn & Jiří Polišenský & Radek Nepraš

Souborný katalog ČR pro veřejné knihovny Veřejné knihovny pro Souborný katalog ČR

Zpřístupnění děl nedostupných na trhu v digitální podobě

Koncepce rozvoje knihoven ČR na léta Priorita 2: Trvalé uchování digitálních dokumentů

Digitalizace Zemských desk, železničních knih, pozemkových knih (1)

ebadatelna Zlínského kraje

DigiDepot: JPEG 2000 jako ukládací formát

Projekt NUŠL a další projekty v ČR

Digitalizace a zveřejnění sbírkových fondů paměťových institucí Zlínského kraje

Vyhledávání a georeferencování map

Zpráva ze zahraniční služební cesty

Transkript:

Zpráva ze zahraniční služební cesty Jméno účastníka cesty Jan Hutař Pracoviště instituce, adresa ODO Pracoviště zařazení 1.6 Důvod cesty návštěva NK Španělska studium procesů digitalizace a dlouhodobého uložení dig. dat Místo město Madrid Místo země Španělsko Datum (od-do) 31.8.-2.9.2010 Podrobný časový 31.8.2010 let Praha- Madrid harmonogram 1.9.2010 celodenní jednání v NK Španělska 2.9.2010 jednání a odlet do Prahy Spolucestující z NK PhDr. Bedřich Vychodil, Mgr. Tomáš Foltýn, PhDr. Jiří Polišenský Finanční zajištění IOP-NKP Cíle cesty viz důvod cesty Plnění cílů cesty splněno Program a další podrobnější viz níže informace Přivezené materiály Tištěné přílohy a elektronické dokumenty Datum předložení zprávy 10.9.2010 Podpis předkladatele zprávy Biblioteca Digital Hispanica (BDH) - návštěva NK Španělska 1-2.9.2010 Jan Hutař - Biblioteca Nacional (dále BN) má 9mil. knih ve fondu, 60% z nich je mimo hlavní budovu ve skladu - mají také 1 mil. fotografií a 100.000 videí - v digitální knihovně BDH mají 32.000 dokumentů rozdělených do sbírek - NK neřeší žádné otázky koordinace zaměřuje se jen na své věci, otázky koordinace na národní úrovni řeší Ministerstvo kultury, někdy ve spolupráci s NK Digitalizace - rozpočet na vybudování BDH je od firmy Telefonica 10 mil. Euro na 5 let do r. 2012 (cílem je zdigitalizovat 200.000 děl, 25 milionů stran) - digitalizace hist. novin 6 mil. stran nejsou v digitoolu, ale v proprietárním systému Pandora jako vícestránkové PDF, chtějí to dostat do DigiToolu - v rámci PDF mají kapitoly (bookmarks) nebo články, strukturální metadata nemají/nepotřebují - během zavádění digitalizace se ukázalo, že jedním z hlavních problémů byly organizační změny

- Po skenovaní se materiál běžně nepůjčuje /pouze na speciální vyžádání)i, v budoucnu budou upravovat a zpřísňovat možnost výpůjček originálního materiálu/ - propracovaný systém výběru dokumentů k digitalizaci odborní knihovníci z různých oddělení (hudební, rukopisy apod.) navrhují dokumenty + na základě UDC a dotazníků - výběr dokumentů pro digitalizaci probíhá ze všech dostupných kopií v NK - na základě desetinného třídění z katalog. záznamu vytvářejí sbírky v digitální knihovně - cílem není zdigitalizovat moderní dokumenty, ale staré a jedinečné, moderní věci musí udělat jiné knihovny, např. městská (do NK si přeci nikdo nechodí půjčovat poslední bestsellery, tak proč je digitalizovat) - www.bdn.bne.es Workflow - současná rychlost je 12000 stránek za den - Chtějí zvýšit produkci - údaj o tom, že byl dokument zdigitalizován se ukládá do záznamu v katalogu do pole 899 MARCu digitalizaci zajišťuje externí firma, NK jí předá dokumenty a přebere výsledek, nemusí tedy řešit workflow digitalizace, ale jen manipulaci s fyz. dokumenty - výpůjčka dokumentu je provedena na umělého uživatele, což je digitalizační firma není tam informace o osobě, co digitalizuje, ale pouze o firmě, která digitalizuje\ - výpůjčka je na 50? dní - firma drží MC 2 roky po předání NK, pak je maže, za uložení předaných dat je zodpovědná NK samozřejmě - Naskenuji obě stránky najednou a pak rozdělí na dvě - používají viditelný watermark na spodní častí scanu, pracné, vkládá se ručně ve Photoshopu výstup z digitalizace - MC - UC jde do digitoolu - XML jde do digitoolu jen základní bibliografický popis - DC pro europeanu (OAI-PMH) - PREMIS object na naší úrovni uloženo s MC - OCR nenabízí uživateli, je jen součástí PDF a pro vyhledávání nemají žádný identifikátor typu URN:NBN, nemají ani NBN

pro noviny mají METS záznam, ovšem jen pro strukturu, IE = titul (1x METS) nebo ročník (1x METS) uvádějí, že je to příliš velké a nedá se s tím pracovat Quality control - Na obrazových datech - Firma kontroluje zaměstnanci očima, žádný SW. Kontroluji se MC jeden po druhém! - Na obrazových datech - V knihovně se kontrolují namátkově očima v případě poškození se kontaktuje firma, která dodá preskenovane nebo uložené nepoškozené soubory. Firma skladuje 1 rok nebo dva data. - Kontrola na popisnych metadatech UNICON \kontrola duplicit v ramci knihovny\ - Xml Standards and Formats MC TIFF UC - JPEG a PDF s OCR - dříve omezení PDFka na 20MB, dnes 50 MB max. pak se dělí na dvě nebo vice PDF Neimplementovali UC JP2 on demand /zadny image server/ - Využívají JP2 pouze jako UC na stáhnutí z webu \podle jich slov se JP@ neosvědčil, nechtějí využívat plug-ins, používají pouze jako UC\ - Maji pdf streaming software pro zpřístupnění, jinak jsou PDFka obrovská a z toho důvodu nedělají nic v barvě snad kromě rukopisů Mají více paralelních projektů. Každý projekt produkuje různé MC, různé nastaveni, různá kvalita. Digitool system - používají DigiTool se search enginem Autonomy (Velká Británie) - Digitool není propojen na katalog, což považují za hlavní problém - v digitoolu míchají staré i moderní dokumenty - vytvořili na DT svoje vyhledávání personalised field mapping, search analytics, indexují to přes OAI-PMH - oracle v něm mají metadata Legal Deposit - Čekají na nový deposit legal act asi příští rok, bude zahrnovat i elektronické online dokumenty, zatím jen fyzické nosiče - Producenti budou povinni poslat produkci v digitální formě pres internet. Bez jakéhokoli hesla nebo klice - Poslali draft, návrh, jak by to melo vypadat na MK Archivace webu mají nově smlouvu s Internet Archive ten pro ně dělá sklizně domény.es

- IA jim pak data dodává, NK je archivuje - přístup z NK - IA data nebude nabízet přes své rozhraní - vlastníkem dat je NK LTP systém a ochrana dat spolupracují s NK Francie, chtějí od nich získat open source LTP systém SPARC, který je již hotov od 2009 - zatím ukládají ve file systému mastery, podobně jako my mají databázi kde co je a co je to za titul, včetně technických metadat (omezeně) - Některé MC jsou uloženy na externích HDD, na serverech - Jméno souboru MC reprezentuji call numbers tj. systémové číslo, problém je, že se může měnit > tj. vytvořili databázi, kde každému filu dají item ID a hotovo (v dtb je systém. číslo, bibl. záznam, tech. metadata a item ID a místo uložení) - Nemají pořádné identifikátory mezi MC a bibliografickými metadaty. Skladuji zde pouze technická metadata. - Neplánují geograficky oddělené úložiště na komerční systém nemají a asi nebudou mít prostředky, tj. hledají řešení open source - při masové digitalizaci nedělají mikrofilmy LTP debaty a uložení dat se účastní 3 oddělení - preservation dept. - Digital library services - IT Ostatní služby digitální knihovny Interactive books - interaktivní prezentace nejvýznamnějších děl NK - prohlížení, linky na reálie, seznam všech edic, historie knihy, období, social networks, hudba, manuální přepis textu apod. - Nejde o OCR jde o prepis textu - Technologie jako google,tiles, pyramidova struktura JPEGs - Daji nam link na demo Don Quijote de la Mancha Print on demand - http://bne.bubok.com - založeno na pdf - smlouva s firmou bubok hlavní cíl je být konkurencí pro komerční firmy v době elektr. čteček apod. - Zkoušeli par firem na knihy, ale mají špatné zkušenosti, špatná kvalita, celkem drahé, trvá 14 dni od zadosti. Amazon

- Vidí potenciál v reprodukcích map a plakátů. Tisknou z PDF. Vypadají velmi pěkně. Tisknuto na jakoby papírovou folii, která je odolnější než papír. Books under copyright - lze najit a procházet par stran, pak se dá zakoupit, musí být na trhu, prodávají elektronickou verzi Dopňující poznámky Vychodil Využití grafických formátů v Biblioteca Digital Hispanica Digital library: - MC - TIFF - UC - JPEG - UC - PDF s využitím OCR Historical press \v budoucnu plánuje spojení s Digital Library dnes se jedna o oddělenou aplikaci\ Drive omezeni 20MB, dnes 50 MB max pak se dělí na dvě nebo vice PDF - Jakou verzi PDF využívají? /neví přesně/ - Využívají vodotisk SW - DigiTool software Tisk na přání (Print on Demand) - Books under copyright \dá se najit a procházet par stran, pak se dá zakoupit, musí být již na trhu, prodávají elektronickou verzi\ - Zkoušeli par firem na knihy, ale mají špatné zkušenosti, špatná kvalita, celkem drahé, trvá 14 dni od žádosti. - Amazon - Atd. - Vidí potenciál v reprodukcích map a plakátu. - Tisknou z PDF. Vypadají velmi pěkně. Tisknuto na jakoby papírovou folii, která je odolnější než papír. Prezentace - Youtube Květen 2009 - Facebook od roku 2008, 67000 fanoušku - ebooks Digitalizace - Po skenovaní se materiál běžně nepůjčuje /pouze na speciální vyžádání, v budoucnu budou upravovat a zpřísňovat možnost vypůjčování originálního materiálu/ National Library of Latin American Library Workflow

- Skenují okolo 12000 stránek\den - Plánují navýšení produkce - Naskenuji obě stránky najednou a pak rozdělí na dvě - Využívají vodotisk (viditelný na spodní častí skenu, pracné, vkládá se ručně v Photoshopu) Kontrola kvality (Quality control) - Na obrazových datech - Firma kontroluje zaměstnanci očima, žádný SW. Kontroluji se MC! - Na obrazových datech - V knihovně se kontroluji namátkově očima v případě poškození se kontaktuje firma, která dodá preskenované nebo uložené nepoškozené soubory. Firma skladuje 1 rok nebo dva data. - Kontrola na popisných metadatech UNICON \kontrola duplicit v rámci knihovny\ - Xml Co skladuji: MC, UC, XML, Doblin Core, PREMIS /object entity/ UC a bibliographic metadata v XML jdou do Digitoolu Ingest PDF do Digitool 800 titulů / 2 weeks (report z posledního týdne) Při digitalizaci se kniha půjči tomu kdo digitalizuje \není tam informace o osobě, co digitalizuje, ale pouze o firmě, která digitalizuje\ - Landing book \50 dnu na půjčeni\ - 40 až 80 knih na den Standardy a formáty obsahuje tabulku v prezentaci Neimplementovali UC JP2 on demand /žádný image server/ - Využívají JP2 pouze jako UC na stáhnutí z webu \podle jich slov se JP2 neosvědčil, nechtějí využívat pluginy, používají pouze jako UC\ - Maji pdf streaming software pro zpřístupnění www.bdn.bne.es Interaktivní knihy (Interactive books) - Nejde o OCR jde o přepis textu - Technologie jako google,tiles, pyramidova struktura JPEGs - Dají nám link na demo Don Quijote de la Mancha Digitool system Maji vice paralelních projektu. Kazdy projekt produkuje různé MC, různé nastaveni, různá kvalita. - Preservation Depatment \zde jsou všechny MC uloženy\

- Mass Digitization - Historic Press Některé MC jsou uloženy na externích HDD, na serverech. Jméno souboru MC reprezentuji call numbers Nemají poradně identifikátory mezi MC a bibiliografickymi metadaty. Skladuji zde pouze technická metadata. Neplánuji geograficky oddělené úložiště Legal Deposit - Zálohuji pouze.es - Čekají na novy deposit legal act asi příští rok - Producenti budou povinni poslat produkci v digitální formě pres internet. Bez jakéhokoli hesla nebo klice - Poslali draft, návrh, jak by to mělo vypadat.