Knihovny současnosti 2018 CO NOVÉHO V PROJEKTU OBÁLKYKNIH.CZ Jiří Nechvátal Jihočeská vědecká knihovna v Českých Budějovicích info@obalkyknih.cz www.obalkyknih.cz
O projektu obalkyknih.cz Agreguje různé zdroje informací o dokumentech a poskytuje je knihovním a jiným systémům : Obálky knih a periodik (uložit obálku je však možno i u speciálních dokumentů map, hudebnin, CD, DVD aj.) Obsahy knih a periodik (naskenované obsahy zpřístupněné v podobě PDF souborů) Plné texty obsahů (převedené obsahy na text pomocí technologie OCR a zpřístupněné pro indexaci knihovním systémem) Anotace (autorské, nakladatelské, ale i uživatelské popisy dokumentů pro snadnější výběr čtenáři) Komentáře a hodnocení (možnost stažení dostupných komentářů a zároveň i možnost exportu komentářů z jiných systémů na Obálkyknih.cz a tím zpřístupnění ostatním knihovnám) Autority (obrazové a jiné materiály napojené na ID autority, např. fotografie osob, GPS souřadnice míst, www odkazy aj.) Citace (citace podle normy ISO 690 generované z ověřených zdrojů či generované z vlastních dat knihoven) To všechno v podobě jedné snadno použitelné služby.
O projektu obalkyknih.cz databáze aktuálně obsahuje 1 780 000 obálek (nárůst o 220 000) 428 000 obsahů (nárůst o 110 000) 447 000 anotací (nárůst o 20 000) 175 000 hodnocených titulů (nárůst o 15 000) 10 000 komentářů 51 000 fotografií autorit (nárůst o 1 500) 1 500 000 vygenerovaných citací 1 300 volných e-knih 115 000 odkazů na plné dokumenty
O projektu Historie počtu dostupných obálek 03. 06. 2011 497.000 15. 09. 2011 601.986 12. 12. 2012 731.880 17. 11. 2013 766.195 29. 10. 2014 902.217 29.09. 2015 1.000.000 19.09. 2016 1.260.000 07.10. 2017 1.539.111 10.09. 2018 1.786.097
NOVINKY
Import e-knih z báze MLP.cz a jejich propojení na klasické tituly
Cílem úkolu je stažení báze e-knih z vlastní produkce Městské knihovny v Praze a e-knih z Krameria (sběr URL na fulltexty v rámci Kramerius API - ve formátu PDF) a jejich napojení na záznamy projektu obalkyknih.cz. V metadatovém kontejneru titulu je obsažena informace o dostupnosti elektronické verze titulu (bez ohledu na konkrétní vydání) s možností propojení v knihovních systémech a nabídnutí čtenáři ke stažení elektronické verze knihy. Záznamy se ukládají do existující DB tabulky book s příznakem identifikujícím e- knihu. Došlo k vytvoření relační tabulky typu M:N pro svázání e-knihy s monografiemi. Jednu e-knihu je možné svázat s vícero monografiemi. Jedna monografie zároveň může obsahovat relaci s více e-knihami. Zároveň existuje tabulka parametrů e-knihy (URL ve formátu epub, pdb, pdf, a jiné). Seznam parametrů nebude omezený, tj. bude možné přidat do budoucna i nové formáty e-knih. K metadatovému kontejneru je připojeno pole svázaných e-knihy (i více) a u e-knihy jsou vypsány všechny dostupné formáty. Zároveň vzniklo administrativní rozhraní, kterým je schopen správce OKCZ svazovat monografie a e-knihy. Protože neexistuje zdroj relací e-kniha - monografie, budou se automaticky vytvářet návrhy na párování (zdroj návrhů je databáze SKC-UTF). Skript se pokusí vyhledat podobné záznamy s totožnými identifikátory, případně titulem + autory. Administrátor OKCZ musí rozhodnout, jestli daná vazba je správná, nebo ne. Schválením návrhu se vazba vytvoří a je ihned dostupná v metadatovém kontejneru.
https://www.obalkyknih.cz/view?book_id=127833341
Dotaz na metadatový kontejner konkrétního titulu klasické knihy: http://cache.obalkyknih.cz/api/books?multi=[{%2 2isbn%22:%228590236083226%22}]&sigla=CB A001&pretty=1 http://cache2.obalkyknih.cz/api/books?multi=[{% 22isbn%22:%228590236083226%22}]&sigla=C BA001&pretty=1
Skenování periodik
rozšíření titulů kontroly skenování opravy problémů
Skenování periodik - obálky, obsahy
Skenování periodik - obálky, obsahy
Skenování periodik - obálky, obsahy 1012 periodik se skenuje celkem/52 000 stran 200 - Severočeská vědecká knihovna v Ústí nad Labem 175 - Jihočeská vědecká knihovna v Českých Budějovicích 154 - Národní knihovna ČR 95 - Knihovna Ústavního soudu 94 - Právnická fakulta Masarykova univerzita 92 Krajská knihovna Karlovy Vary 44 - Krajská vědecká knihovna Liberec 39 - Moravskoslezská vědecká knihovna v Ostravě 35 - Univerzita Palackého v Olomouci 26 - Moravská zemská knihovna 24 - Studijní a vědecká knihovna v Hradci Králové 11 - Univerzita Tomáše Bati ve Zlíně 6 - Pedagogická fakulta Masarykova univerzita 4 - Univerzitní centrum Telč Masarykova univerzita 4 - Teologická fakulta Jihočeské univerzity 3 - Archeologický ústav AV ČR 3 - Moravská galerie 2 - Přírodovědecká fakulta Masarykova univerzita 2 - JABOK - Vyšší odborná škola sociálně ped. a teol.
Anotace, komentáře a hodnocení
Komentáře a hodnocení
Komentáře a hodnocení
Fotografie autorit
Fotografie autorit
Kramerius
Automatizované sklízení obsahů a obálek ze systému Kramerius
http://cache.obalkyknih.cz/api/books?multi=[{%22nbn%22:%22cnb000392240%22
http://cache.obalkyknih.cz/api/books?multi=[{%22nbn%22:%22cnb000495695%22}]
20 195 volných děl 94 913 autorsky chráněných děl!!! Synchronizace čísel ČNB!!!
Uživatelské výstupy
seznamy dle identifikátorů seznam vlastních identifikátorů pro konkrétní knihovnu nová periodika aktuální čísla seznam obsahů pro import do DB seznam anotací pro import do DB seznamy autorit s fotografií
Vlastní skenování Skenovací klient http://obalkyknih.cz/obalkyknih-scanner/
Vkládání obálek a obsahů z vlastních PDF souborů
Umožnění skenování všech autorit titulu
Porovnání AKS implementované funkce projektu Obálkyknih.cz
ARL
ALEPH
EVERGREEN
CLAVIUS-TRITIUS
KOHA
KPSYS
Vývoj do budoucna
Seznam použité literatury Projekt obalkyknih.cz bude poskytovat seznam použité literatury u odborných publikací. Úkol vychází z požadavku NK ČR a univerzitních knihoven, které tyto informace potřebují pro své čtenáře (studenty). Technicky je nutno upravit aplikaci skenovacího klienta o možnost skenování jedné nebo více stránek se seznamem literatury, jako dalšího typu stránky. Dále se bude po technické stránce jednat o rozšíření vkládacího API mezi aplikací skenovacího klienta a backend vrstvou, o rozšíření datového modelu a o obohacení metadatového kontejneru dotazovacího API o odkaz na dokument se seznamem použité literatury. Úprava se dotkne všech vrstev projektu obalkyknih.cz. Ukládání stránek se seznamem použité literatury na server obalkyknih.cz bude vyžadovat navýšení diskového prostoru. Součástí procesu bude zajištění převodu naskenovaných stránek do PDF formátu, rozpoznání textu OCR technologií a zpřístupnění PDF a OCR obsahu v metadatovém kontejneru a na webových stránkách projektu.
Citace speciálních druhů dokumentů Úprava citačního systému projektu za účelem poskytování citací speciálních druhů dokumentů dle normy ČSN ISO 690. Jedná se zejména o citace patentů, norem, zákonů, elektronických zdrojů, aj. Úkol bude řešen ve spolupráci s Centrálním portálem knihoven. Po technické stránce se bude jednat o úpravu skriptů frontend vrstvy projektu obalkyknih.cz, zajišťující generování citací pro knižní katalogy v reálném čase adhoc a předlohou jsou přímo bibliografické záznamy knihoven. Protože se jedná o širokou cílovou skupinu, bude nutné dolaďování specifik bibliografických záznamů.
Zobrazování ročníků periodik na webu obalkyknih.cz Stávající zobrazení periodik na webovém portálu obalkyknih.cz není se vzrůstajícím počtem naskenovaných obálek jednotlivých čísel příliš přehledné. Například časopis 100+1 zahraničních zajímavostí obsahuje aktuálně přes 1240 obálek jednotlivých čísel (tento titul je kompletně naskenován všechna čísla - obálka a obsah). Na stránce titulu (https://www.obalkyknih.cz/view?isbn=9770322962003) se zobrazuje výpis posledních čísel a při snaze zobrazit starší čísla je nutné opakovaně načítat další a další výpis stránky. Aktuálně se v knihovnách obálka a obsah každého čísla skenuje u cca. 1000 časopisů (seznam na adrese https://docs.google.com/spreadsheets/d/1btyn2a7onraiw42fwbdtko_x2bfdztvzhzqd strba2m). Většina knihovních systémů bohužel neumí zobrazit jednotlivá čísla periodik, která si čtenář vyhledá v knihovním katalogu a odkazuje pouze na základní stránku titulu. Následné listování čtenářem je zdlouhavé a komplikované. Technicky bude vyřešeno výpisem roku/ročníku a v nich dále rozpadem na jednotlivá čísla. Čísla jsou i tzv. speciály. Úkolem bude i případná oprava už skenovaných čísel a normalizaci dat o ročníku a čísle, kdy se stává, že ne všechny čísla jednoho periodika jsou zapisována stejně. Nejednotnosti jsou způsobeny změnou označení na obálce periodika, nebo zápisem bibliografického záznamu, případně zadáváním obsluhou aplikace skenovacího klienta napříč knihovnami.
Další vydání titulu Vytvoření vazby typu další vydání téhož", resp. "další svazky této série na jednotlivá vydání stejného titulu nebo navazující série titulů. Úkol bude řešen ve spolupráci s Centrálním portálem knihoven. Cílem úkolu bude v první řadě tvorba uživatelského rozhraní pro nalezení vazeb (automatické doporučování vazeb), uživatelského rozhraní pro správu vazeb administrátory projektu obalkyknih.cz a v neposlední řadě o prezentaci vazeb obohacením metadatového kontejneru poskytovaného všem knihovnám zapojeným do projektu a prezentace na stránkách projektu.
Doporučování literatury Obalkyknih.cz jako celorepublikový projekt uvažuje o implementaci funkce pro doporučování literatury. Čtenářské priority pro výběr knih zjistíme na základě historie výpůjček množiny čtenářů ze spolupracujících knihoven. Veškerá čtenářská data budou anonymizována tak, že pro projekt nebude možné zpětně zjistit, o jakého čtenáře se jedná. Bude vytvořen algoritmus pro analýzu výpůjček čtenářů, jejich porovnání s množinou čtenářů s obdobnými prioritami a navržen seznam knih doporučených k dalšímu studiu/četbě. V úloze se předpokládá úzká spolupráce s vybranými velkými knihovnami a CPK. V roce 2018 předpokládáme vytvoření algoritmu pro doporučování, naprogramování rozhraní pro automatizovaný sběr, ukládání a zpracování anonymizovaných výpůjček ze spolupracujících knihoven. Cílovým stavem bude: poskytování doporučené četby ke konkrétnímu titulu přidáním informace stávajícího metadatového kontejneru. poskytování doporučené četby ke konkrétnímu anonymizovanému čtenáři na základě historie jeho výpůjček. Knihovna využívající tuto službu zašle přes API seznam výpůjček čtenáře a obdrží zpětně seznam doporučených titulů dle jeho profilu.
Obnova HW projektu Aktuální HW nároky na provoz projektu obalkyknih.cz v JVK: 2 ostré servery (hlavní server - www.obalkyknih.cz a cache1.obalkyknih.cz) + 1 interní testovací 2 TB diskového prostoru na rychlých diskových polích (s redundantním uložením dat v dvou lokalitách s ohledem na bezpečnost dat při havárii) 60% výpočetního výkonu procesorů z celkového výkonu tří serverů používaných v JVK 1 Gbitová linka do Cesnetu (projekt generuje datovou zátěž 20 Mbit/s což představuje cca 85 % síťové provozu celé knihovny) 9TB dat statických záloh na síťovém úložišti sdružení Cesnet
Statistiky skenování
Skenovací klient statistiky 2018
Webové rozhraní obalkyknih.cz statistiky 2018
Dotazy
Knihovny současnosti 2018 CO NOVÉHO V PROJEKTU OBÁLKYKNIH.CZ Jiří Nechvátal Jihočeská vědecká knihovna v Českých Budějovicích info@obalkyknih.cz www.obalkyknih.cz