RETROBI Softwarová aplikace pro zpřístupnění digitalizované lístkové kartotéky Retrospektivní bibliografie české literatury

Podobné dokumenty
Digitální knihovny v České republice

Digitalizace knihovních dokumentů. Jiří Polišenský

Příloha č. 1. Návrh aplikace pro správu a archivaci XML dokumentů Zpracoval: Ing. Jan Smolík, CSc

Digitální knihovny v České republice

ProArc. open source řešení pro produkci a archivaci digitálních dokumentů. Martina NEZBEDOVÁ Knihovna AV ČR, v. v. i., Praha nezbedova@knav.

Seminář pro vedoucí knihoven asviústavů AV ČR ASEP

Seminář pro vedoucí knihoven a SVI ústavů AV ČR. Aleph

Městská knihovna v Praze

Dobrý SHOP Popis produktu a jeho rozšíření

ANL+ Veronika Ševčíková Národní knihovna ČR

Digitalizace a Digitální archiv Státního oblastního archivu v Třeboni po čtyřech letech. Výsledky a perspektivy dalšího vývoje

Databáze na webu Národní knihovny v Praze

Představení systému. rev (únor 2014)

Databáze na webu Národní knihovny v Praze

Jak pomáháme našim klientům

Osnovy kurzů. pilotního projektu v rámci I. Etapy realizace SIPVZ. Systém dalšího vzdělávání veřejnosti. počítačová gramotnost

manuscriptorium Manuscriptorium v Evropě Manuscriptorium.com

Česká (národní?) článková bibliografie přežitek, nebo moderní služba čtenářům?

Projekt Czechiana. Aleš Vokál Ministerstvo kultury České republiky. Praha, 19. dubna 2017

Představení systému. rev (duben 2015)

Ukládání a archivace dat

Popis programu EnicomD

FUNKCE A VYHLEDÁVÁNÍ NA PORTÁLE KNIHOVNY.CZ PhDr. Iva Zadražilová, Moravská zemská knihovna

MANAŽER ČASOPISU. Obr. 1 Hlavní stránka manažera časopisu

Edu-learning pro školy

MODUL MUNI ASPI, a. s muni_manual.indd :57:23

Seminář pro vedoucí knihoven a SVI ústavů AV ČR

PHOTO-ON Profesionální on-line správa fotografií

Citační manager - Zotero. Mgr. Ilona Trtíková

Webinář GEOBIBLINE. Mgr. Michaela Alijonov Hametová Knihovna geografie PřF UK

Vyhledávání v elektronickém katalogu knihovny Knihovní fond je zpracován v automatizovaném knihovním systému Clavius REKS.

Digitalizace v ČR a její podchycení v registru digitalizace. Helena Dvořáková Národní knihovna ČR

POUŽITÍ DATABÁZÍ. Po ukončení tohoto kurzu budete schopni

NOVINKY VERZE

Nápověda 360 Search. Co je 360 Search? Tipy pro vyhledávání

3. Software Bakaláři Kompletní školení

Informační vzdělávání PdF

Přizpůsobení Layoutu aplikace. Základní moduly a funkčnost aplikace

Nové rozhraní je optimalizované pro aktuální verze prohlížečů. Pro práci s tímto rozhraním není vhodný Internet Explorer.

Prezentace CRMplus. Téma: CRMplus jako nástroj pro kontrolu a vyhodnocení rozpracovanosti dílů na zakázkách

Ceník platný od Ceny jsou konečné, nejsme plátci DPH.

MODUL BIBLIOGRAFIE ASPI, a. s. 2006

Produktový list Zboží.cz. PPC reklama Internetová reklama placená za proklik

Digitalizace a zveřejnění sbírkových fondů paměťových institucí Zlínského kraje

Novinky v e-zdrojích NLK. Adéla Jarolímková, NLK

Inovace a zkvalitnění výuky prostřednictvím ICT Databázové systémy MS Access generování složitějších sestav Ing. Kotásek Jaroslav

Databáze na webu Národní knihovny v Praze

Modul Kontakt s klientem SSP. OKcentrum. Uživatelská příručka. Poskytování součinnosti ÚP ČR

Digitální kartotéky jako badatelské prostředí

Vlastnosti a funkce docházkového/přístupového programu JOB ABACUS PRO 4.xx

ZŠ ÚnO, Bratří Čapků 1332

Popis služby MiniNET.cz. Výhody našeho řešení. Zadávání zakázky a průběh. Balíčky služeb

Produktové Dokumenty (Datum ) Srovnání verzí: pcon.planner 7.0 Rozdíly mezi verzemi Standard-, ME a PRO

Vyhledávání v citační databázi Web of Science (WOS)

Vzdělávací obsah předmětu

Portál ebadatelna Zlínského kraje a zpřístupnění map. Prezentace historických map z fondu paměťových institucí Zlínského kraje

Obsah. Úvod 11. Poděkování 9. Použité konvence 12. KAPITOLA 1 Poznáváme Zoner Photo Studio 13

Dobrý FOTO Popis produktu a jeho rozšíření

Informace k e-learningu

Tovek Tools. Tovek Tools jsou standardně dodávány ve dvou variantách: Tovek Tools Search Pack Tovek Tools Analyst Pack. Připojené informační zdroje

Základní principy vyhledávání firem

Autor: JUDr. Lukáš Bohuslav Redakce: JUDr. Petr Flášar

OBSAH. Word. První spuštění a hlavní obrazovka Wordu 3 Základní nastavení Wordu 6 Kontrola pravopisu a mluvnice 8 Nastavení ukládání dokumentu 12

INFORUM Špalíček digitální knihovna kramářských tisků (spalicek.net)

Verze 1.x 2.x 3.x 4.x 5.x. X X X X uživatelům (správcům) systému Řazení dat v přehledech podle jednotlivých sloupců

PRODUKTY. Tovek Tools

JAK PRACOVAT S INFORMACEMI TAK, ABY ONY PRACOVALY PRO NÁS? Přednáška kurzu Informační a databázové systémy v rostlinolékařství

ebadatelna Zlínského kraje

Modulární monitorovací systém Gradient Digitální systém pro záznam, archivaci a vyhodnocení telefonie.

Administrační systém ústředen MD-110

PALSTAT s.r.o. systémy řízení jakosti PALSTAT CAQ verze Kontakty 08/ Obsah

Z papíru na web a ke čtenáři aneb Digitalizace není jen skenování. Mgr. Monika Oravová Moravskoslezská vědecká knihovna v Ostravě

2014 Dostupný z Licence Creative Commons Uveďte autora-zachovejte licenci 4.0 Mezinárodní

Tvorba vlastního obsahu v Manuscriptoriu. Olga Čiperová, AiP Beroun s.r.o

VYHLEDÁVÁNÍ V NOVÉM PROSTŘEDÍ MEDVIK : ZÁKLADNÍ HLEDÁNÍ. Adéla Jarolímková Národní lékařská knihovna, referát metodiky a vzdělávání

Návod - katalog. ANTEE s.r.o. - tel.: , fax: , helpdesk: ,

HYDROEKOLOGICKÝ INFORMAČNÍ SYSTÉM VÚV TGM, v.v.i. Evidence úkolů řešených ve VÚV TGM, v.v.i. a jejich výstupů. Dokumentace evidence

Obsah. při vyšetření pacienta. GDT souboru do programu COSMED Omnia GDT souboru z programu COSMED Omnia a zobrazení výsledků měření v programu MEDICUS

ZŠ ÚnO, Bratří Čapků 1332

Kurz pro studenty oboru Informační studia a knihovnictví 5. Informační architektura

Kooperační systém článkové bibliografie, báze ANL, báze ANL FULL budoucnost? NKČR 2011, únor. Ivana Anděrová, oddělení analytického zpracování

FUNKCE A VYHLEDÁVÁNÍ NA PORTÁLE KNIHOVNY.CZ. PhDr. Iva Zadražilová, Moravská zemská knihovna

Databáze MS-Access. Obsah. Co je to databáze? Doc. Ing. Radim Farana, CSc. Ing. Jolana Škutová

VLASTNOSTI A FUNKCE JOB ABACUS PRO 3.XX

ADS DOCHÁZKOVÝ SOFTWARE

Gymnázium Jiřího Ortena, Kutná Hora

Osnova kurzu OBSLUHA PC ZÁKLADNÍ ZNALOSTI. pilotního projektu v rámci I. Etapy realizace SIPVZ

Obohacování bibliografických záznamů o věcné selekční prvky postup NKČR

Registrace Vyhledávání Výsledky vyhledávání

Projekt Czechiana. Ing. Josef Praks Ministerstvo kultury České republiky. Praha, 4. listopadu 2016

Vyhledávání v souborných katalozích

Editor dat povodňového plánu

2. Technické požadavky k úpravě materiálů pro umístění ve 2GIS

nástroj pro jednoduchou správu a vedení agendy studentských počítačových sítí na kolejích SU OPF Karviná Ing.

Zlín, 26. května 2015

Pro malé i obří projekty

Veřejný dálkový přístup (VDP) Podpora editorům RÚIAN. Dana Pohanková

EBSCO. Poklikneme na možnost EBSCOhost Web. Vybereme (poklepeme, zaškrtneme) databázi, s kterou chceme pracovat.

Inovace a zkvalitnění výuky prostřednictvím ICT Databázové systémy MS Access formuláře a sestavy - vytváření Ing. Kotásek Jaroslav

Transkript:

RETROBI Softwarová aplikace pro zpřístupnění digitalizované lístkové kartotéky Retrospektivní bibliografie české literatury 1775-1945 Vojtěch Malínek, Ústav pro českou literaturu AV ČR, v. v. i.

RETROSPEKTIVNÍ BIBLIOGRAFIE ČESKÉ LITERATURY 1775-1945 lístková kartotéka zpracovávána od 30. let cca 525 zpracovaných titulů novin a časopisů vycházejících na území českých zemí v češtině i němčině cca 1,65 mil. excerpt primární i sekundární článková bibliografie (tj. včetně beletrie a překladů + neliterární texty českých literátů; široké přesahy do příbuzných oborů: divadlo, žurnalistika, historie...) promyšlené řazení, dodnes živá autorská, odkazová, předmětová, dešifrační a dešifrátová část; ikonické katalogy; odkaz na týž článek může být v kartotéce opakovaně (různá kritéria)

http://retrobi.ucl.cas.cz/retrobi/katalog/listek/08f52d88327df54ab8aff94c85717200.wicket-5

SYSTÉM RETROBI grantový projekt: Digitalizace lístkového katalogu Retrospektivní bibliografie české literatury 1775-1945 poskytovatel dotace: MŠMT doba řešení: 10/2009-12/2011 cíl: digitalizace kartotéky + vývoj vhodného software pro její prezentaci http://retrobi.ucl.cas.cz/

SYSTÉM RETROBI Problémy při zpracování dat 1) různorodá kvalita (strojopis, rukopis, barevný inkoust, průklepy, různé druhy a tloušťky papíru...) 2) oboustranné a vícelístkové lístky a jejich spárování 3) mechanická příprava a kontrola lístků 4) detekce prázdných stran 5) napojení na OCR přepisy a databázové struktury 6) volba grafického formátu vhodného pro OCR rekognoskaci, webovou aplikaci a archivaci 7) volba skeneru 8) nastavení Fine Readeru 9) kontrola integrity dat Formát výstupu: Objem zpracovávaných dat: oboustranný barevný TIFF, 600 dpi (26 MB) cca 90 TB, záloha cca 20 TB (tif), 1 TB (png)

SYSTÉM RETROBI Nástroj 1 detekce prázdných stran spárování víceobrázkových lístků přejmenování souboru na tvar zkratka části katalogu-název skupiny-pořadové číslo lístkupořadové číslo obrázku, tj. např. 0234582.tif O-Čapek, Karel 1930-224-2.tif automatizovaná kontrola vstupních a výstupních dat ruční kontroly sudých stran (otáčení lístků, makulatury)

SYSTÉM RETROBI Nástroj 2 spojení lístků s jejich OCR textovým přepisem v jednu databázovou položku (jedno- i vícelístkové lístky) konverze tiffů na záložní png (z 26 MB na 1 MB) a prohlížecí png na web (do 50 kb) export dat do webové aplikace separována stromová struktura jako členicí kostra možnost uploadu tiffů i png kontrola integrity dat (obrázky bez txt atp.) kontrolní log

SYSTÉM RETROBI Webová aplikace 1) Prohlížení oskenovaných obrázků 2) Fulltextové vyhledávání 3) Uživatelské nástroje 4) Nástroje pro uživatelskou editaci 5) Nástroje pro administrátorskou editaci 6) Administrátorské rozhraní pro správu dat a uživatelských účtů

SYSTÉM RETROBI Prohlížení oskenovaných obrázků průchod katalogem zobrazení variantních podob lístku zobrazení OCR přepisů zobrazení vyplněných datových struktur (OCR přepis, jeho korekce, segmentace, položkový rozpis) http://retrobi.ucl.cas.cz/retrobi/rejstrik

SYSTÉM RETROBI Fulltextové vyhledávání vyhledávací engine Lucene vyhledává fráze či řetězce možnost využití divokých karet hledání abecedního / číselného intervalu jednoduchý i kombinovaný dotaz s logickými operátory omezení na část/i katalogu omezení dle kvality textového přepisu, popř. na konkrétní položku omezení na schránku možnost rozlišovat velká a malá písmena připraveny algoritmy pro položkové vyhledávání

SYSTÉM RETROBI Nástroje pro uživatelskou editaci možnost editace OCR textů možnost segmentace OCR textů zkvalitnění vyhledávání generován text ve formátu normovaného bibliografického zápisu

SYSTÉM RETROBI Uživatelské nástroje možnost vytváření vlastních rešerší (schránka) možnost ukládat vlastní schránky (na vlastní PC i v rámci aplikace) možnost přidat vlastní komentář systém uživatelských hlášení

SYSTÉM RETROBI Nástroje pro administrátorskou editaci funkce pro uživatele s oprávněním editor možnost položkového rozpisu možnost hromadné editace dat možnost změny statutu lístku možnost generovat krycí lístek možnost měnit obrazové soubory u lístku

SYSTÉM RETROBI Administrátorský modul evidence a správa uživatelských hlášení (včetně automatických hlášek o přepisu) evidence a správa uživatelských účtů evidence a správa doprovodných textů (nápovědy, legendy atp.) možnost vytvořit rejstříky pro jednotlivá pole kontrolní csv logy

SYSTÉM RETROBI Statistiky a zkušenosti spuštěn na jaře 2012 200 registrovaných uživatelů cca 700 unikátních uživatelů/měsíc cca 50 návštěv/den cca 10 000 přepsaných lístků projekt bibliografie Arne Nováka http://knihovna.phil.muni.cz/arne-novak modifikace pro jiné kartotéky

RETROSPEKTIVNÍ BIBLIOGRAFIE ČESKÉ LITERATURY 1775-1945 Počet excerpčních lístků v Retrospektivní bibliografii Počet stránek lístku AUT ODK PT DE IA IO IAn. ID IP Celkem 1 640442 667129 62800 101906 6155 27930 353 33 426 1507174 2 31671 19525 3568 2848 106 411 1 0 5 58135 3 666 338 28 2 0 0 0 0 1 1035 4 168 249 12 3 0 0 0 0 0 432 5 13 1 0 0 0 0 0 0 0 14 6 17 0 1 1 0 0 0 0 0 19 7 a více 9 17 0 0 0 0 0 0 0 26 Celkem 672986 687259 66409 104760 6261 28341 354 33 432 1566835

RETROSPEKTIVNÍ BIBLIOGRAFIE ČESKÉ LITERATURY 1775-1945 Statistiky Rok Počet záznamů 1830 130 1848 13 526 1900 8 321 1920 17 986 1930 44 159 1945 3 753 Osoba Karel Hynek Mácha Božena Němcová Karel Čapek Počet záznamů 2727 2931 4946

DEN S RETROSPEKTIVNÍ BIBLIOGRAFIÍ ČESKÉ LITERATURY 11. prosince 2012 Ústav pro českou literaturu AV ČR, v. v. i. Na Florenci 3/1420, Praha 1 představení systému odborný seminář kulatý stůl http://www.ucl.cas.cz/

SYSTÉM RETROBI Děkuji za pozornost. Web: Email: http://retrobi.ucl.cas.cz/ retrobi@ucl.cas.cz Kontakty: Ústav pro českou literaturu AV ČR Středisko literárněvědných informací