ZPŘÍSTUPNĚNÍ A ARCHIVACE PLNÝCH TEXTŮ ČESKÝCH LÉKAŘSKÝCH A ZDRAVOTNICKÝCH ČASOPISŮ Konference Knihovny současnosti 2010 Lenka Maixnerová, Filip Kříž, Ondřej Horsák
Úvod V roce 2004 zapojení do programu VISK 6 Manuscriptorium a v roce 2OO8 do programu VISK 7 Kramerius V roce 2008 zprovozněn Digitální archiv NLK v systému Kramerius http://www.medvik.cz/kramerius Systém Kramerius je propojen se systémem Medvik včetně databáze BMČ
Zdroje dokumentů Digital-born 29% Replikováno 10% Replikace - plánováno 2% VISK 1% Vlastní digitalizace 33% VISK Konverze z Manuscriptoria Vlastní digitalizace Vlastní digitalizace - plánováno Digital-born Vlastní digitalizace plánováno 24% Replikováno Replikace - plánováno
Obsah DA NLK Disertace / kvalifikační práce 12% Granty / výzkumné zprávy 9% Drobné tisky 5% Staré tisky / muzejní sbírky 33% CD/DVD 2% Knihy / monografie 32% Časopisy / periodika 7% digitalizovaná tištěná periodika a monografie Knihy / monografie digitalizované staré tisky Časopisy / periodika Staré tisky / muzejní sbírky Granty / výzkumné zprávy Disertace / kvalifikační práce Drobné tisky elektronické časopisy závěrečné grantové zprávy (IGA MZ ČR), atestační práce IPVZ konferenční materiály digital-born dokumenty K 2.9.2010: 41 titulů periodik, 576 monografií ; další ve zpracování celkem cca 900 dokumentů
Podmínky zpřístupnění - licence Creative Commons 7% Lic. NLK volně přístupné 9% Lic. NLK pouze pro reg. 1% Pouze ze sítě NLK dle AZ 53% Volně přístupné dle AZ 30% Volně přístupné dle AZ Pouze ze sítě NLK dle AZ Creative Commons Lic. NLK volně přístupné Lic. NLK pouze pro reg.
BMČ Bibliographia medica Čechoslovaca Národní bibliografická databáze z biomedicínských oborů V NLK budována od roku 1947 Články v odborných časopisech a sbornících české (do roku 2000 i slovenské) provenience + bohemika V elektronické podobě přístupná v portálu Medvik a na DVD Bibliomedica (ročníky 1953-56, 1967 až současnost) celkem cca 600.000 záznamů Indexace dle tezauru MeSH
BMČ a plné texty Požadavky uživatelů odborné literatury: snadný a rychlý přístup k plným textům Od roku 2007 je součástí záznamu BMČ i URL odkaz (pokud existuje) na plný text článku cca 18 000 článků Problémy: volně přístupné texty jsou k dispozici cca 3-24 měsíců po tištěném vydání, intervaly se často mění, po 3letém provozu cca 60 % nefunkčních
Archivace elektronických verzí periodik v DA NLK V roce 2009 zahájena spolupráce s českými nakladateli odborných biomedicínských periodik Podmínkou archivace je uzavření smlouvy o poskytování elektronických online zdrojů Podepsání smlouvy značně problematické, nakladatelé často nemají ošetřená práva ohledně zpřístupnění článků volně přes Internet, někdy není jasné, kdo má smlouvu podepsat (nakladatel, vydavatel, provozovatel elektronických verzí apod.)
Uzavřené licenční smlouvy Medica Healthworld, Institut rodinné terapie a psychosomatické medicíny v Liberci, Solen, Česká akupunkturistická společnost ČLS JEP, Státní ústav pro kontrolu léčiv, Ambulantní centrum pro vady pohybového aparátu, Remedia, Sdružení SCAN, Česká společnost HPB chirurgie, Česká lékařská společnost Jana Evangelisty Purkyně, Aprofema, Rekesh Comp. Smluvně ošetřeno 53 titulů periodik, u 5 titulů časové embargo, u 4 titulů přístup pouze pro registrované uživatele Konferenční materiály zatím se nepodařilo realizovat
Doporučení Vydavatelé ošetření vztahů s autory dosažení win-win situace - vyvážený stav výhodný pro všechny zainteresované strany dodržování základních W3C standardů PDF s korektním kódováním Autoři využívat CreativeCommons licencí vyhnout se restriktivním vydav. podmínkám, bránícím self-archivaci Hlavně - nebát se podepsat licenční smlouvu s NLK!
Získávání dat CD-ROM, mail, ftp Webová stránka časopisu využíváme software WebHarvest umožňuje stáhnout data dle vytvořeného profilu Pokud jsou stránky pouze v HTML, provedeme kompletaci článků s obrazovými soubory a konverzi do formátu PDF Chyby v HTML upozorníme nakladatele, pokud není schopen chyby opravit, upravíme my Někdy nelze soubory s plnými texty nalézt
Zpracování dat Výsledkem jsou PDF soubory celých čísel nebo jednotlivých článků pojmenovaných dle definovaného schématu + XML soubor se staženými metadaty Porovnání metadat se záznamy BMČ, v případě shody jsou metadata obohacena o identifikátor článku BMČ Kontrola úplnosti, zda ke každému článku existuje záznam v BMČ a obráceně Chybějící články zhotovení vlastní el. kopie, chybějící záznamy dopíšeme, chyby opravíme
Import dat Připojení PDF souborů pomocí speciálního modulu Medvik-Dawinci k bibliografickému záznamu časopisu Vygenerování XML souboru podle DTD Kramerius pro periodika, pokud jsou PDF soubory na úrovni článků, je XML soubor obohacen o základní metadata článků (PeriodicalInternalComponentPart) Validace a import do archivu
Propojení s portálem Medvik U monografií je URL odkaz ukládán ručně U článků to není možné 100-1000 článků pro jednotlivé tituly
Propojení u článků Vytvořen linkovací mechanismus, který umožňuje dynamické zobrazování u záznamů článků BMČ v portálu Medvik URL odkazy do Krameria Java, ODBC konektor Výsledkem je zobrazení odkazů na všechny úrovně metadat článek, číslo, ročník, časopis Řešení umožňuje propojení nejenom na digitalborn dokumenty, ale i na digitalizované dokumenty Propojeno 15.500 článků
Zdroje Autoři Vydavatelé Digitalizace fondů a sbírek NLK Licence Licenční smlouvy s NLK Archivace Získávání a zpracování dat Trvalá archivace metadata Přístup Kramerius Portál Medvik KIS MEDVIK katalogy, BMČ Uživatelé Digitální archiv NLK - schéma informačních toků
Portál Medvik > Odkaz na digitální knihovnu Kramerius plný text Odkazy z portálu Medvik do Krameria monografie, IGA zprávy
Propojení na článek
Propojení na číslo časopisu
Bohmische Curorte
Elektronické časopisy
Konferenční materiály
Závěr rozšiřování spolupráce s vydavateli & autory, další zdroje pro archiv nová verze portálu Medvik - integrované vyhledávání ve všech NLK databázích, OpenURL, web API nová verze Krameria - podpora více typů objektů, OAIS kompatibilní formalizace procesů DA, řízení&plánování, audit, národní identifikátory do budoucna možnost self-archivace přímo autory v prostředí DA získání finanční podpory MK ČR řeší kulturní dědictví, ne vědecké informace partnerství