Digitální knihovny. Úvod. Miroslav Bartošek MU Brno, Ústav výpočetní techniky, C212.

Podobné dokumenty
Digitální knihovny. Přístup k problematice DL. Témata předmětu DL. Obsah přednášky. Co jsou to Digitální knihovny. Úvod

Digitální knihovny. Miroslav Bartošek. Ústav výpočetní techniky MU Knihovnicko informační centrum MU

Technologie digitálních knihoven

Digitální knihovny: principy a problémy Jaroslav Pokorný MFF UK Katedra softwarového inženýrství Praha

Systémy pro tvorbu digitálních knihoven

Vydavatelská činnost - nová kompetence univerzitních knihoven

Šedá literatura case study v ČR

Grey Literature ve světě

- otevřený přístup k výsledkům vědy. Mgr. Zdeňka Firstová a Mgr. Anna Vyčítalová Univerzitní knihovna ZČU v Plzni

Univerzální vyhledávací portál jako integrační řešení pro digitální knihovny

Odstíny a nuance Open Access

Virtuáln. lní knihovny přístup k dokumentům a službám kdykoliv a odkudkoliv

CO DĚLAT, ABY BYLA DATA V DOKTORSKÝCH DISERTACÍCH ZNOVU VYUŽITELNÁ PRO VÝZKUM? Joachim Schöpfel Hélène Prost Cécile Malleret

Sémantický web 10 let poté


Okruhy ke SZZK nmgr. studium knihovnické zaměření

Digitalizace a digitální knihovny v České republice

Projekt Digitální knihovna pro šedou literaturu po prvním roce řešení

Seminář pro vedoucí knihoven asviústavů AV ČR ASEP

Online přístupné odborné knihy neztrácejí na půvabu

Knihovna jako systém

DIGITÁLNÍ UNIVERZITNÍ REPOZITÁŘ. Andrea Fojtů Ústav výpočetní techniky UK v Praze

Potřebujeme specializované knihovny?

local content in a Europeana cloud

NOVÉ MOŽNOSTI PŘÍSTUPU K DIGITÁLNÍ ARCHIV NLK PLNOTEXTOVÝM INFORMACÍM : Filip Kříž, Lenka Maixnerová, Ondřej Horsák, Helena Bouzková

Velká data v knihovnách Open source tools and their use in Czech libraries

Právní aspekty šedé literatury

OPEN ACCESS WEEK k výsledkům vědy a výzkumu probíhá na Mendelově univerzitě v Brně od 21. do 27. října 2013 REDEFINING IMPACT

Zpřístupnění kulturního dědictví v digitální podobě v ČR prostřednictvím knihoven

Představení digitalizačních projektů Národní technické knihovny a spolupráce v rámci ebooks on Demand

2010 Dostupný z

Dlouhodobá ochrana digitální dokumentů. Mgr. Jaroslav Kvasnica

Aktuální hlediska a trendy v přístupu k vědeckým informacím a datům. David Novák Archeologický ústav AV ČR, Praha, v. v. i.

Digitální knihovny. Miroslav Bartošek. Ústav výpočetní techniky, Masarykova universita Botanická 68a, Brno

local content in a Europeana cloud

Kde hledat odborné články?

KNIHOVNY A INFORMAČNÍ PRAMENY. Mgr. Anna Vitásková Vědecká knihovna v Olomouci

EIZ ve společenských. enských vědách

Lenka Němečková Věra Pilecká Helena Kováříková. Ústřední knihovna ČVUT v Praze

Role akademické knihovny v šíření šedé literatury případová studie: Adam Mickiewicz University Repository

OpenAIRE Advance v České republice

Knihovna jako systém

Knihovny současnosti: Discovery Jan Luprich / EBSCO Information Services

Zdroje pro vědu jako nezbytná součást jednotného vyhledávaní. Martin Vojnar. CVTI v Bratislavě, 9. listopadu vojnar@multidata.

KNIHOVNY A INTERNET Ing. Stanislava Ivanovová 1

Linked Heritage. Koordinace standardů a technologií za účelem obohacení Europeany. Alena Součková

CESNET, GRIDy a přenosy dat

Česká národní strategie otevřeného přístupu k vědeckým informacím

ECM. Enterprise Content Management. čt 9:15 Petr Bouška (xboup00) Zbyněk Hostaš Lukáš Maršíček Martin Nikl (xnikm00)

Informační predátoři, aneb, jak se účinně bránit. PhDr. Jindra Planková, Ph.D. Ústav informatiky, FPF Slezská univerzita v Opavě

Anotace. Klíčová slova. 1. Úvod

Máte to? Summon jako základní vyhledávací nástroj NTK

The bridge to knowledge 28/05/09

Digitální knihovny - včera, dnes a zítra

PhDr.Helena BOUZKOVÁ PhDr.Eva LESENKOVÁ NÁRODNÍ LÉKAŘSKÁ KNIHOVNA, PRAHA. ČLS JEP Společnost sociálního lékařství a řízení péče o zdraví

Infrastruktura pro OA k výsledkům evropského výzkumu a vývoje

Elektronické zdroje Národní technické knihovny

Vyhledávání a orientace ve vědeckých informacích z pohledu citační analýzy

galerie Hana Vyčítalová Národní technická knihovna Praha

Ex Libris strategie a směr vývoje Olomouc, 19 června Christian Motovsky, Senior Account Manager Ex Libris Group

Zpráva ze služební cesty

Aktuální oblasti výzkumu digitálních knihoven

Národní digitální knihovna

Karel Koucký. Státní oblastní archiv v Praze Národní archiv AKM 2013,

Open Journal Systems na ČVUT. Věra Pilecká (ÚK ČVUT)

ICOLC 13 th Fall Meeting

Nové služby veřejných knihoven v digitálním prostředí (zpřístupnění děl nedostupných na trhu) Knihovny současnosti 2017 Olomouc

Seminář pro vedoucí knihoven a SVI ústavů AV ČR

Jak vypadá opravdová discovery služba

Česká (národní?) článková bibliografie přežitek, nebo moderní služba čtenářům?

Národní úložiště šedé literatury Zdroj informací o obtížně dostupných dokumentech

Přidružené publikace v České republice

DDS a on-line digitální knihovny

Veřejné a vysokoškolské knihovny v symbióze

Akademické publikování a autorské právo. Lucie Straková Martin Loučka Konference OpenAlt

EBSCO Discovery Service Jan Luprich / EBSCO Information Services

Koncepce rozvoje knihoven ČR na léta Priorita 2: Trvalé uchování digitálních dokumentů

Témata k závěrečným bakalářským zkouškám 2019

Název projektu: Zvýšení adaptability zaměstnanců organizací působících v sekci kultura Název kurzu: Seminář pro knihovníky a informační pracovníky

Principy otevřené vědy

DIGITÁLNÍ KNIHOVNY TEORIE A PRAXE

Projekt NUŠL a další projekty v ČR

Certifikace Národní digitální knihovny podle ISO normy Jan Mottl AiP Safe s.r.o.

Knihovna váš partner. aneb Mr. Bean v knihovně

Metody zpracování informací - 2

Digitální knihovny v České republice


Jiří DOSTÁL Univerzita Palackého v Olomouci, Pedagogická fakulta, KTEIV. Interaktivní tabule ve vzdělávání

Knihovna jako systém

Mezin{rodní trendy OA"

Jak na CrossRef, DOI, CrossCheck, OJS a další? Lenka Němečková Věra Pilecká Ústřední knihovna ČVUT

The Australian Research Repositories Online to the World

PhDr. E. Lesenková, Ph.D. Mgr. A. Jarolímková, Ph.D. PhDr. H. Bouzková

Web of Science. Bibliotheca Academica

OpenGrey. Petra Pejšová, NTK, ČR Christiane Stock, INIST-CNRS, Francie

X. mezinárodní konference o katastru nemovitostí, Karlovy Vary hotel Thermal

Výroční zpráva za rok 2006

ebadatelna Zlínského kraje

Co je (staro)nového v DSpace

Výroční zpráva za rok 2005

Transkript:

Digitální knihovny Úvod Miroslav Bartošek MU Brno, Ústav výpočetní techniky, C212 bartosek@ics.muni.cz

2 Přístup k problematice DL DL = velmi široké téma! technický přístup (standardy, formáty, digitalizace) informační věda ( knihovnicko- sociální pohled) zoologie projektů (project-centric přístup) obecný popis hlavních oblastí ve výzkumu a praxi DL (z pohledu počítačníků) charakteristika základních přístupů příklady praktických řešení (zákl.kameny) přístup shora-dolů

3 Témata předmětu DL Co jsou to Digitální knihovny Obecný rámec a architektura Jména a identifikátory Metadata Interoperabilita Globální vyhledávání zdrojů Ekonomika a legislativa (IPR) Problém dlouhodobého uchovávání Zajímavé programy a projekty

budování sbírek 4 digitalizace born digital harvesting obecný rámec a architektura DL intelektuální vlastnictví & ekonomika vícejazyčný přístup k informacím metadata interoperabilita globální vyhledávání zdrojů zobecněný model dokumenu dlouhodobé uchovávání digitální informace

1. přednáška Co jsou to Digitální knihovny

6 Obsah přednášky 1. definice DL 2. DL versus WEB 3. DL versus knihovny 4. Krátce z historie DL 5. Literatura - zdroje informací o DL 6. DL a vědecké publikování

7 1.1 Co je to DL? (DL = Digital Library) Problém vymezení: pojem se vyvíjí spolu s inf. technologiemi (knihovna beze zdí, elektronická knihovna, virtuální knihovna, digitální knihovna) rozdílná profesní chápání databázista: IS-pracovník: knihovník DL = systém federativních databází DL = aplikace nad webem DL = další vývojová etapa knihoven jiné významy (knihovny procedur, systémy na správu dokumentů, )

8 1.2 Definice DL (1) počítačnický pohled: Digitální knihovna je spravovaná sbírka informací spolu s odpovídajícími službami, přičemž informace jsou uloženy v digitální podobě a jsou dostupné prostřednictvím sítě. W.Y.Arms, 2000 - udržovaná, spravovaná dig. sbírka (maintained) - služby - vzdálený přístup Focused collection of digital objects, including text, video, and audio, along with methods for access and retrieval, and for selection, organization, and maintenance. I.W.Witten, 2002 - digitální obsah (text, video, audio, 3D, simulace, dynam.vizualizace..) - uživatel (access and retrieval) - knihovník (selection, organization, and maintenance)

9 1.2 Definice DL (2) knihovnický pohled: Digitální knihovny jsou organizace, které poskytují zdroje (včetně specializovaného personálu) umožňující provádět výběr, strukturování a zpřístupnění sbírek digitálních prací, tyto práce dále distribuovat, udržovat jejich integritu a dlouhodobě uchovávat a to vše s ohledem na snadné a ekonomické využití určitou komunitou nebo množinou komunit uživatelů. US Digital Library Federation, 1997 - DL jako instituce (např. knihovna) - důraz na systematickou organizaci a služby - cílenost DL (využívání určitou komunitou)

10 1.3 Obecné znaky DLs klíčová je organizace digitální sbírky DL není jedna uzavřená entita (DLs) inf.zdroje: heterogenní, dynamické a multimediální technologie pro propojení autonomních inf. celků transparentní propojení koherentní přístup bez ohledu na formu, formát, způsob a místo uložení informací

DL x Web

12 2.1 DL x Web Proč DL? Máme přece Web a tam je vše! Je Web digitální knihovnou?

13 2.2 Web není DL WEB = DL? ne! (1995) Although the Internet provides access to an enormous amount of information, the current state-of-the-art falls far short of what is commonly viewed as a library service that is, relatively easy navigation of and access to a set of documents that are part of a collection. The notion of a collection is important in that it implies that the set of documents was not selected haphazardly, but by some trusted intermediary. Current users of the Internet confront an information space where the quality of documents is far from reliable, facilities for locating documents are primitive, and access to a specific document frequently means wading through a Tower of Babel of architecture dependencies and file formats. Carl Lagoze, Cornell University Dienst: Implementation Ref.Manual, 1995

14 2.3 Web se blíží DL, ale WEB = DL? možná, ale (2002) obrovské množství informací, snadný přístup společná technologie pokroky v oblasti vyhledávání (Google) (přesnost vs odezva) autor sám sobě nakladatelem harvested DL (WebBase) Ale: rights management preservation authenticity quality?

15 2.4 Rozdíly DL x Web základním rozdílem je organizace (web jako celek není organizován) Inet vyhledávače většinou spoléhají na jednoduché fulltextové vyhledávaní (podle klíčových slov) další důležitý rozdíl řízení vstupu dat do systému (DL pevnější řízení, kontrola vstupu) Web není cílen na konkrétní komunitu uživatelů krátký poločas rozpadu dokumentů na Webu povrchový a skrytý hluboký Web (deep web)

DL x knihovny

17 3.1 DL x knihovny společné rysy Mnohé společné rysy: systematicky budovaná sbírka datových objektů sbírky metadatových struktur (katalogy, rejstříky, indexy) množina služeb (přístup pro různé třídy uživatelů, IPR mananagement, správa, vyhodnocování, SDI) tématické zaměření sledování kvality (nezařazuje se cokoliv) dlouhodobé uchovávání (v knihovnách - staletí! )

18 3.2 Knihovny východisko DL knihovny = inspirace a východisko DL (postupy a přístupy) tradiční knihovny (zaměřené na fyzické objekty) hybridní knihovny (současně fyzické i digitální sbírky) digitální knihovny (plně digitalizované) výhody z odstranění fyzické podstaty a bariér (viz dále) nevýhody -dtto- DL = plně digitalizovaná knihovna + glob.interoperabilita (obecně ale DL <> digitalizovaná knihovna) řada dalších výchovných a sociálních rolí tradičních knihoven

19 3.3 Knihovny - přednosti staletá tradice v organizaci/správě/zpřístupňování informací (evropský versus americký přístup) jednotné standardy a doporučení (MARC, AACR2, ) propracovaný a fungující systém knihoven (hierarchický národní systém, různé typy knih., systém služeb - MVS, katalog.) legislativa, ustálené vzorce chování (postavení knihoven ve společnosti, povinný výtisk, fair-use) vybalancovaný systém autoři-nakladatelé-knihovnyčtenáři

20 3.4 Knihovny přínosy digitalizace a) zlepšení klasických knihovních služeb vzdálený, nepřetržitý přístup efektivnější vyhledávání lepší využití fondu sdílení informací lepší ochrana (bity, ne atomy) prostorové úspory b) nové možnosti globální integrace nové formy/formáty informací zcela nové typy služeb a modely šíření informace (viz STI)

21 3.5 Knihovny v digit. prostředí Proč je to tak složité o několik řádů vyšší problém sdílení (globální infrastruktura) velmi různorodá povaha digitálních objektů (variabilita typů a formátů) text (nestrukturovaný, strukturovaný, hypertext, ) image (kresba, obrázek, foto, mapa, RTG-snímek, ) audio (hlas, hudba, zvuky) video (klip, film, video, animace) 3D objekty, dynamické dokumenty, multimédia, datasety, správa VELMI velkých sbírek (tera-tb a peta-pb = 10*15) LoC: 23 mil svazků = 20 TB CERN-LHC (2005): x-tb/den : přenést/uložit/zpracovat/zpřístupnit nepřipravené sociálně-společenské prostředí chybějící legislativa a postupy nová ekonomika procesů nové možnosti x hrozba destabilizace zavedeného systému

22 3.5 Knihovny v digit. prostředí Proč je to tak složité? Paper libraries would disappear by 1984. Arthur Samuel (1964, The Banishment of the Paperwork.) Some say that had books been invented after computers were, they would have been hailed as a great advance. Ian H.Witten (2002, How to Build a Digital Library.)

Historie a současnost DL

24 4.1 Krátce z historie 1945: Vannevar Bush ( As We May Think, Memex) 1965: J.C.R. Licklieder ( Libraries of the Future ) 60. léta: MARC, OPAC (LoC, OCLC) 80. léta: fulltexty poč. 90: Computing + Communications + Contents (nízká cena, vysoký výkon, široká dostupnost) 1994: Digital Library Initiative, www nyní: od experimentování k budování infrastruktury

25 4.2 Současný stav teorie: velmi široký obecný výzkum, mapování klíčových problémů, návrhy prvků obecné infrastruktury praxe: digitalizace sbírek, izolované DL (tisíce projektů), pokusy o ustanovení obecných infrastrukturních prvků žádné jednotné řešení, ale již zřetelný posun od experimentování (90.léta) k budování globální infrastruktury: řada usazených základních kamenů (XML, RDF, DC, OAI-PHM, ) budování přízemí (METS, OpenURL, OpenDL, OAI, ) překryvy s výzkumy v oblasti E-commerce (interoperabilita, bezpečnost, IPR) několik komerčních řešení (IBM DL -> Content Manager) řada open-source řešení (Greenstone, OAI, FEDORA, ) národní programy rozvoje DL (DLI-1,2, )

Literatura, zdroje info

27 5.1 Literatura monografie Witten I.H.: How to Build a Digital Library. (Morgan Kaufmann Publishers, July 2002) Arms W.Y.: Digital Libraries. (MIT Press, 2000) Lesk M.: Practical Digital Libraries. (Morgan Kaufmann Publishers, 1997) články M.Bartošek: Digitální knihovny. In sborník konference DATAKON 2001 (též na http://www.ics.muni.cz/mba/dl-datakon01.pdf) povinná literatura zadaná v rámci jednotlivých přednášek

28 5.2 Další zdroje info (1) časopisy D-Lib http://www.dlib.org spec.čísla CACM 95/4, 98/4, 01/5 RLG DigiNews http://www.rlg.org/preserv/diginews/ ICSTI forum http://www.icsti.org/forum/index.html projekty na Inetu obrovské množství info (musím ale vědět, co hledám)

29 5.2 Další zdroje info (2) Konference (sborníky viz LNCS-online) Advances in DLs (IEEE) 1996-2000 ACM Conference on DLs 1996-2000 Joint Conference on DLs od 2001 European Conference on Research and Advanced Technologies for DLs od 1997

30 5.2 Další zdroje info (3) courseware Fox E.: DL - Virginia Tech Courseware Nelson M.L.: Intro to DLs, Uni. N.Carolina http://buckets.dsi.internet2.edu/classes/inls110/ a mnohé další

DL a vědecké publikování

32 6. DL a oblast STI STI = Scientific & Technical Information Internet z potřeby efektivnějšího šíření STI DL další krok v tomto směru STI experimentální oblast nových technologií a přístupů z oblasti DL, předvoj hlavním hnacím motorem pro aplikace DL v STI není ekonomika (ve smyslu generovat profit) následné ekonomické zhodnocení motor pro široké komerční nasazení STI je jen malý výsek současných aplikací DL (ale velmi důležitý)

33 6.1 Vědecké publikování a) dříve b) nyní čtenář web knihovna nakladatel autor čtenář autor repozitář

34 6.2 Co je to STI? soubor informačních materiálů (bez ohledu na jejich formu a formát) pro potřeby vědy, výzkumu a vývoje (zprávy, datasety, obrázky, videa, software, ) zahrnuje: bílou literaturu (knihy, časopisy, důležité sborníky) autor a vydavatel jsou obvykle různé subjekty obvyklé je posuzování kvality předcházející publikování šedou literaturu : typ publikací nedostupných běžnými prodejními kanály, produkovaný často v omezeném množství, s nízkou či žádnou inzercí a s omezeným využitím (disertace, výzkumné zprávy, články na Inetu) el.publikování velký impuls pro tento druh informací

35 6.3 Proč se starat o Grey bílá literatura vysoký stupeň důvěryhodnosti snadno dostupná dlouhý čas mezi napsáním a publikováním často jen výtah z podstatně většího materiálu některé technologie mohou zastarat dříve, než informace o nich pronikne z literatury šedé do literatury bílé

36 6.4 Pyramida STI Journal Articles time Conference Papers Technical Reports software raw data notes video / images Figure 2: Pyramid of Publications Rests on Unpublished STI

37 6.5 Řešení dle disciplin fyzika matematika computer science chemie preprinty (arxiv.org) preprinty technické zprávy sborníky konferencí stále časopisy, ale zásadně review

38 6.6 Ekonomika STI 20.000 vědeckých časopisů celosvětově počet vědeckých publikací se zdvojnásobuje každých 10-15 let (adekvátně roste i počet časopisů) velikost čtenářské obce konstantní, specializace rostoucí cena vědeckých časopisů (Chemical Abstract: desítky USD v 1950, 17.400 USD dnes) stagnující či klesající rozpočty knihoven pokud jeden zruší předplatné, cena pro ostatní stoupne 2017 knihovny nebudou moci nic nakupovat časopisy jen zlomek STI informací

39 6.7 Jak z toho ven? potřeba nových modelů pro šíření STI nové ekonomické modely šance a motivace i pro DL

Literatura k přednášce

41 Povinná literatura Vannevar Bush. As We May Think. Atlantic Monthly, July 1945 http://www.isg.sfu.ca/~duchier/misc/vbush/vbush-all.shtml Bush je prvním průkopníkem v oblasti DL a to co se odehrává v této oblasti v dnešní době není v zásadě nic jiného, než praktická implementace vizí, které Bush vyslovil před více jak 50 lety Sandra Esler, Michael Nelson. Evolution of Scientific and Technical Information Distribution. JASIS 49(1), 1998. http://techreports.larc.nasa.gov/ltrs/pdf/1998/jp/nasa-98-jasis-sle.pdf Úvodní přehledový článek o digitálních knihovnách z oblasti šíření vědeckých a technických informací. Oblast STI bývá jednou z prvních experimentálních oblastí pro ověřování nových technologií a přístupů DL

42 Povinná literatura Jaroslav Pokorný. Digitální knihovny: principy a problémy. In: Automatizace knihovnických procesů (8), duben 2001. http://knihovny.cvut.cz/akp/clanky/03.pdf Miroslav Bartošek. Digitální knihovny. In Proc. Datakon 2001. Též na http://www.ics.muni.cz/mba/dl-datakon01.pdf