VÝPOČETNÍ TECHNIKA A SPECIALIZOVANÉ PROGRAMY PRO PODPORU VAV ČINNOSTÍ I



Podobné dokumenty
Impaktované časopisy. Citační index

Ústřední knihovna VŠB-TU Ostrava Zpráva o činnosti za rok 2016

Web of Science. Přednáška kurzu informační a databázové systémy v rostlinolékařství

Ústřední knihovna VŠB-TU Ostrava Zpráva o činnosti za rok 2015

Kde hledat odborné články?

Bibliografické databáze umění vyhledávat v záplavě pramenů relevantní informace

Bibliografické a rešeršní služby

Mezin{rodní trendy OA"

Elektronické inf. zdroje

- otevřený přístup k výsledkům vědy. Mgr. Zdeňka Firstová a Mgr. Anna Vyčítalová Univerzitní knihovna ZČU v Plzni

SCOPUS a WEB OF SCIENCE

Ústřední knihovna VŠB-TU Ostrava Zpráva o činnosti za rok 2009

Elektronické informační zdroje na MENDELU pro oblast práva

Úvod do elektronických informačních zdrojů

Ústřední knihovna VŠB-TU Ostrava Zpráva o činnosti za rok 2013

Ústřední knihovna VŠB-TU Ostrava Zpráva o činnosti za rok 2012

Elektronické informační zdroje. Dřevařství a příbuzné obory

Digitální knihovny v České republice

Otevřený přístup (Open Access) v Akademii věd ČR

Online informační zdroje na FHS UTB ve Zlíně

VYUŽÍVÁNÍ ELEKTRONICKÝCH INFORMAČNÍCH ZDROJŮ Mgr. Olga Halamová

b) počet realizovaných přístupů/výpůjček plných textů (ročně/ na uživatele dle standardizovaných statistik) /*

Vyhledávání v citační databázi Web of Science (WOS)

Elektronické zdroje Národní technické knihovny

Informační zdroje na Univerzitě Palackého. Seminář Knihovny UP Podzim 2010

Inovace bakalářského studijního oboru Aplikovaná chemie

Informační zdroje pro studenty edních a vysokých škol

SLOHOVÁ VÝCHOVA Mgr. Soňa Bečičková

Lenka Němečková Věra Pilecká Helena Kováříková. Ústřední knihovna ČVUT v Praze

Informační zabezpečení studia na Zahradnické fakultě MENDELU. Elektronické informační zdroje

Nástroje pro hodnocení vědy a výzkumu od Thomson Reuters. Ing. David Horký Country Manager Central & Eastern Europe david.horky@thomsonreuters.

Seminář pro vedoucí knihoven asviústavů AV ČR ASEP

ÚSTŘEDNÍ KNIHOVNA UTB KNIHOVNA VE SVĚTĚ INFORMAČNÍCH TECHNOLOGIÍ

Knihovna váš partner. aneb Mr. Bean v knihovně

České internetové medicínské zdroje v Národní lékařské knihovně

Indikátor g) Databáze Academic Search Complete + Business Source Complete R (2011) REGISTROVANÍ ČTENÁŘI/STUDENTI

Virtuáln. lní knihovny přístup k dokumentům a službám kdykoliv a odkudkoliv

KDE A JAK HLEDAT KONKRÉTNÍ DOKUMENT

ISI WEB OF SCIENCE - manuál

AKADEMICKÁ KNIHOVNA JIHOČESKÉ UNIVERZITY

Ústřední knihovna VŠB-TU Ostrava Zpráva o činnosti za rok 2014

Ústřední knihovna VŠB-TU Ostrava Zpráva o činnosti za rok 2009

Ústřední knihovna VŠB-TU Ostrava Zpráva o činnosti za rok 2011

Vědecká literatura a database

Podpora otevřeného přístupu na ČVUT role ÚK v podpoře OA

Chemická informatika. terciální. výzkumné zprávy, patenty, normy, firemní a šedá literaura.

Osobní archivy publikovaných odborných prací v medicíně jako součást Digitální knihovny NLK

Elektronické informační zdroje v AV ČR

Informační výchova v knihovnách. Práce se středoškolskou mládeží

Témata k závěrečným bakalářským zkouškám 2019

Strategie budování sbírky Webarchiv u

Ústřední knihovna ČVUT. Mgr. Lenka Němečková PhDr. Marta Machytková Mgr. Věra Pilecká Mgr. Ilona Trtíková

XML jako prostředek pro citování informačních zdrojů

BIBLIOMETRIE PRO MĚŘENÍ KVALITY INFORMACÍ

Elektronické informační zdroje pro pedagogiku, vzdělávání a příbuzné obory. 9. června 2019


Elektronické informační zdroje pro chemické obory. Seminář Agronomická fakulta, MENDELU Ústav chemie a biochemie

Novinky v e-zdrojích NLK. Adéla Jarolímková, NLK

Speciální digitální knihovny

Informace, knihovny, katalogy... Přednáška kurzu Informační a databázové systémy v rostlinolékařství

INFORMAČNÍ ZDROJE NEMEDICÍNSKÉHO PŮVODU RELEVANTNÍ PRO ŘEŠENÍ MEDICÍNSKÝCH INFORMAČNÍCH POTŘEB Richard Papík, Martin Souček

Metodika budování sbírky Webarchivu

Podpora využívání elektronických informačních zdrojů na ČVUT Ilona TRTÍKOVÁ

Nástroje pro správu bibliografických citací

PŘÍRUČKA K PRÁCI S DATABÁZÍ CAB REVIEWS

EBSCO. EBSCOhost Web. Databáze je přístupná na adrese Poté se můžete buď přihlásit, nebo vstoupit jako host.

23. Splnitelnost a platnost výrokových formulí, dedukce ve výrokové logice

FUNKCE A VYHLEDÁVÁNÍ NA PORTÁLE KNIHOVNY.CZ PhDr. Iva Zadražilová, Moravská zemská knihovna

Vyhledávání a orientace ve vědeckých informacích z pohledu citační analýzy

EBSCO. Poklikneme na možnost EBSCOhost Web. Vybereme (poklepeme, zaškrtneme) databázi, s kterou chceme pracovat.

Zahraniční zdroje šedé literatury 3. PhDr. Martina Machátová Moravská zemská knihovna v Brně Tel.:

Seminář pro vedoucí knihoven a SVI ústavů AV ČR

Knihovna jako systém

EBSCO Information Services a více než 60ti letá tradice. Ostrava, Vysoká škola báňská, TU

Jak otevřít přístup k Open Access? Iva Burešová Knihovna AV ČR, v. v. i., Praha buresova@knav.cz

Digitální knihovny v České republice

210 mm. Národní technická knihovna podporuje...

CSA Library School Program RefWorks v ČR. Eva Marvanová Národní knihovna ČR

Další zdroje šedé literatury. PhDr. Martina Machátová Moravská zemská knihovna v Brně Tel.:

NÁVOD PRO VYHLEDÁVÁNÍ V DATABÁZI C.E.E.O.L. (CENTRAL AND EASTERN EUROPEAN ONLINE LIBRARY) / /

Grey Literature ve světě

AMPHORA - NÁSTROJ PRO INDEXOVÁNÍ WEBOVÝCH STRÁNEK.

Národní úložiště šedé literatury Mgr. Iveta Fürstová

Katalog kurzů ICT vzdělávání

Práce mladého vědce aneb krátká přednáška o metodologii vědy v podmínkách České republiky. Tadeusz Sikora

ZJEDNODUŠTE SI VAŠI VaV ČINNOST

Elektronické informační zdroje (VIKBA25)

INFORMAČNÍ INSTITUCE, REPOZITÁŘE A ARCHIVY, ŠEDÁ LITERATURA

Akademické publikování a autorské právo. Lucie Straková Martin Loučka Konference OpenAlt

Informační predátoři, aneb, jak se účinně bránit. PhDr. Jindra Planková, Ph.D. Ústav informatiky, FPF Slezská univerzita v Opavě

SourceOECD - manuál. SourceOECD se dělí do těchto základních částí: Jak vyhledávat v databázi SourceOECD? Jednoduché vyhledávání:

Přebírání ohlasů z WoS a Scopus. Josef Klimeš

ICOLC 13 th Fall Meeting

WORK-LIFE BALANCE Jak na bakalářskou či diplomovou práci (III) - kvalita zdrojů, vyhledávání literatury

VYHLEDÁVÁNÍ V DATABÁZI WEB OF SCIENCE. Helena Landová Akademická knihovna JU

Silný portál. Jindřiška Pospíšilová. Pracovní skupina pro silný portál. Národní knihovna ČR

Akademická příručka. Martin, Slovensko: Vyd. Osveta Martin, Slovensko: Vyd. Osveta OBSAH

Informační zdroje. SPSOA_ICT_2_NSD Vypracoval Petr Novosad. Vytvořeno z projektu EU Peníze středním školám

Elektronické informační zdroje v AV ČR

METODIKA ODBORNÉ PŘÍPRAVY Vysoká škola technická a ekonomická v Českých Budějovicích. Institute of Technology And Business In České Budějovice

Transkript:

VÝPOČETNÍ TECHNIKA A SPECIALIZOVANÉ PROGRAMY PRO PODPORU VAV ČINNOSTÍ I Květoslav Bártek Moravská vysoká škola Olomouc, o. p. s. Olomouc 2010

Projekt Aplikovatelný systém dalšího vzdělávání ve VaV (dále jen APSYS) OP VK č. CZ.1.07/2.3.00/09.0134 je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Text neprošel jazykovou úpravou. Moravská vysoká škola Olomouc, o. p. s. Autor: Recenzovali: Mgr. Květoslav BÁRTEK, Ph.D. prof. Dr. Ing. Miroslav POKORNÝ prof. Dr. Zdeněk SOUČEK, DrSc. Mgr. Antonín SEDLÁČEK Olomouc 2010 ISBN 978-80-87240-31-1

Obsah Úvod... 5 1 Vyhledávání informací, e-zdroje, zdroje pro VaV... 6 Cíl... 6 1.1 Zdroje informací pro vědu a výzkum... 6 1.2 Rozdělení informačních zdrojů... 7 1.3 Elektronické informační zdroje EIZ... 9 1.4 Metadata... 10 Shrnutí kapitoly... 12 Literatura ke kapitole... 13 2 Informační databáze pro VaV... 15 Cíl... 15 2.1 Databáze... 15 2.2 Knihovny... 17 2.3 Elektronické informační zdroje... 18 2.4 Digitální knihovny... 23 2.5 Informační zdroje/databáze s otevřeným přístupem... 26 2.6 Citační rejstříky... 30 Shrnutí kapitoly... 35 Literatura ke kapitole... 36 3 Základní principy vyhledávání informací v databázích a na World Wide Web... 38 Cíl... 38 3.1 Vyhledávání dokumentů... 38 3.2 Popis dokumentu... 39 3.3 Dialogové vyhledávání, operátory a Booleovský model... 42 3.4 Základní metody vyhledávání v Internetu... 43 3.5 Hodnocení výsledků vyhledávání... 44 3.6 Internetový vyhledávač Google... 46 3.7 Další typy... 48 Shrnutí kapitoly... 48 Literatura ke kapitole... 49 4 Pokročilé způsoby vyhledávání informací v Internetu... 51 Cíl... 51 4.1 Vyhodnocování výsledků... 51 4.2 Pokročilé techniky vyhledávání... 52 4.3 Zvyšování přesnosti a úplnosti vyhledávání... 55 4.4 Použití metavyhledávačů... 55

4.5 Prohledávání hlubokého webu... 59 Shrnutí kapitoly... 60 Literatura ke kapitole... 61 Literatura... 63 Seznam obrázků... 65 Seznam tabulek... 66

Úvod Význam informací stále roste, ať se již pohybujeme ve světě vědy, businessu či v soukromém životě. Stejně tak roste i význam svobodného a snadného přístupu k nim. Dostupnost relevantních informací se stává každodenní nutností a samozřejmostí. Tento "informační hlad" se projevuje i rostoucím množstvím informačních zdrojů. Pryč jsou doby, kdy v celé republice vycházely tři deníky a vysílala jedna televize. Nabídka dříve "klasických" informačních zdrojů se rozšířila na tisíce. Relativně novým typem informačního zdroje je prostředí Internetu a další elektronické informační zdroje. Jedná se o dynamicky se rozvíjející systémy, např. rozsáhlost internetu se odhaduje na systém čítající podle některých odhadů až 20 miliard webových stránek 1, výstižnější pohled je optikovou datové velikosti Internetu. Podle jedné z nejnovějších studií 2 provedené firmou IDC se dnes množství dat na internetu pohybuje kolem 487 miliard gigabajtů informací. Pokud bychom všechna data z internetu vytiskli a svázali do knih, vytvořily by pás desetkrát delší než vzdálenost Pluta od Země. Podle studie společnosti Cisco bude provoz na internetu ke konci roku 2013 dosahovat hodnoty 56 exabajtů za měsíc. To přibližně odpovídá obsahu 10 miliard DVD 3. Pro dokreslení situace - počet uživatelů Internetu čítá zhruba 1,75 miliardy lidí 4. Vyhledat v této záplavě informací ty správné se může zdát být (a někdy také je) velmi obtížné, stejně tak jako využití potenciálu, který nabízejí dnešní moderní technologie a dostupný software. Studijní text je rozdělen do dvou tematických celků. Cílem první části textu je seznámit čtenáře se základními pojmy, základními i pokročilými principy vyhledávání a získávání informací z různých typů informačních zdrojů a tím přispět ke zkvalitnění jeho vědecko-výzkumné práce. Čtenář se seznamuje s rozdílnými přístupy vyhledávacích aplikací k prohledávání databází a internetu. Ve druhé části se budeme zabývat specializovanými aplikacemi využitelnými ve vědeckovýzkumné práci. Připomeneme základní principy práce s textovými editory, představíme aplikace pro práci s grafickým materiálem a možnosti jejich použití při vytváření odborných textů. Budeme se také věnovat statistickému software, který sehrává ve výzkumné praxi klíčovou a nezastupitelnou roli. Ohromná dynamika s jakou se Internet vyvíjí i jeho hypertextová struktura klade na uživatele obrovské nároky jak po straně technologické, tak i po stránce řekněme osobnostní. Dokumenty, které jsou dnes dostupné na určité URL, tam již zítra být nemusí. Pro ilustraci, za dobu potřebnou k sepsání tohoto textu se jistý článek přemístil v rámci jednoho serveru minimálně třikrát. A vyhledat jej následně v novém, aktuálním umístění již vyžadovalo určitou míru trpělivosti, nemluvě o udržení aktuálnosti všech odkazů použitých v textu. Ale trpělivý čtenář po prostudování textu jistě nebude mít problém takto "ztracený" dokument dohledat. Proto také text obsahuje minimální množství úkolů, neboť předpokládáme, že si všechny pro Vás zajímavé odkazy projdete. Nezbývá nám než všem čtenářům popřát mnoho trpělivosti a ať se nenechají pohltit informační lavinou, již Internet představuje. 1 The size of the World Wide Web [on line]. [cit. 2009-12-01]. Dostupný z WWW: <www.worldwidewebsize.com/>. 2 3 Internet data heads for 500bn gigabytes [on line]. [cit. 2009-12-01]. Dostupný z WWW: <www.guardian.co.uk/business/2009/may/18/digital-content-expansion>. Deset překvapivých čísel o internetu [on line]. [cit. 2009-12-01]. Dostupný z WWW: <www.chip.cz/clanky/trendy/2009/12/deset-prekvapivych-cisel-o-internetu>. 4 Internet usage statistics [on line]. [cit. 2009-12-01]. Dostupný z WWW: <www.internetworldstats.com/stats.htm>. - 5 -

1 Vyhledávání informací, e-zdroje, zdroje pro VaV CÍL Po prostudování kapitoly budete schopni: definovat pojmy informační zdroje, Open Access, metadata rozlišit jednotlivé typy informačních zdrojů, vyjmenovat charakteristiky hodnotící informační zdroje. KLÍČOVÁ SLOVA Informační zdroj, primární a sekundární informační zdroje, e-zdroje, Open Access, metadata, klíčová slova, fulltext, indexování. 1.1 Zdroje informací pro vědu a výzkum Vědecká práce a její kvalita je do značné míry závislá na kvalitě informací, s nimiž pracujeme. Běžně jsme zvyklí pracovat s klasickými tištěnými textovými dokumenty. Textovými dokumenty většinou nazýváme knihy, časopisy, články, diplomové práce, disertace, zákony, rozsudky ad. S rostoucím vlivem výpočetní techniky však roste i nabídka a vliv elektronických dokumentů a dalších informačních zdrojů. Nejen že roste nabídka, ale mnoho dokumentů se díky výpočetní technice stává mnohem dostupnější širší vědecké komunitě a práce s nimi se jeví být rychlejší a pohodlnější. 1.1.1 Informační zdroje Informačním zdrojem (pramenem) rozumíme systém, který je reálným nebo potencionálním nositelem, zprostředkovatelem nebo šiřitelem informací. Tomuto vymezení vyhovují knihovny, databázová centra, informační střediska, televize, rozhlas apod. - 6 -

1.2 Rozdělení informačních zdrojů 1.2.1 Primární a sekundární informační zdroje (prameny) Místo běžně používaného termínu dokument se často setkáváme s termíny informační pramen (information resource) - primární informační pramen. Označení dokument se většinou používá ve zúženém významu hmotného nosiče informací 5. Popis informačního pramene se pak nazývá sekundární informační pramen. Terciární informační prameny podávají informaci o existenci sekundárních informačních pramenů 6. Druhy primárních informačních pramenů 7 : knihy o o o o o o monografie (publikace pojednávající o jednom tématu) sborník příručky (podávají základní a přehledně zpracovaný obraz o stavu poznání určitého oboru) učebnice encyklopedie (abecedně nebo systematicky uspořádaný výklad termínů) slovníky (jazykové, výkladové) periodika o noviny (obsahují aktuální informace, jejich periodicita je 1 den až 1 týden) o časopisy (vychází s periodicitou 1 týden až půl roku) o ročenky (vychází jednou za rok) speciální literatura o normy o patenty o firemní literatura (materiály, které vydávají podniky, obchodní organizace a společnosti, aby informovaly veřejnost o svých výrobcích, službách nebo činnosti) šedá literatura (dokumenty, které nelze získat v běžné distribuci) o diplomové, disertační a habilitační práce (odborné a vědecké práce, které jsou podkladem pro udělení akademické, vědecké a pedagogické hodnosti) o výzkumné zprávy (prezentují výsledky řešení výzkumného úkolu) Primární informační prameny 5 Kde hledat informace [on line]. [cit. 2009-12-08]. Dostupný z WWW: <is.muni.cz/elportal/estud/ff/js07/informace/materialy/pages/kde-hledat_opora.pdf>. 6 tamtéž 7 Informační prameny [on line]. [cit. 2009-12-18]. Dostupný z WWW: <knihovny.cvut.cz/vychova/vychova1/inf_pram/pri_i_pr.html>. - 7 -

Sekundární informační prameny 8 : katalogy knihoven bibliografie o soupisy literatury o určitém tématu referátové časopisy o záznamy o primárních dokumentech zpracované v tištěné formě (předchůdci bibliografických databází) bibliografické (dokumentografické) databáze o záznamy o primárních dokumentech (případně doplněné abstrakty) zpracované v elektronické formě Current Contents o informují o obsazích jednotlivých čísel vybraných časopisů nakladatelské katalogy Sekundární informační prameny 1.2.2 Informační zdroje dle dostupnosti přímo dostupné zdroje mají veřejný charakter, přístup nebývá přímo zpoplatněn (může se jednat o zaplacení členského poplatku v knihovně a v rámci knihovnou nabízených služeb je umožněn přístup k placeným informačním zdrojům nebo se jedná o plně bezplatné služby). K přístupu k těmto službám je možno využít různých elektronických vyhledávacích nástrojů. dostupné zprostředkovaně komerční a profesionální databázová centra, přístupná většinou přes internet, kdy internet slouží pouze jako metoda přístupu k databázi. Termín otevřený přístup (Open Access) 9 v sobě zahrnuje význam trvalého a bezplatného online přístupu k dokumentům, zejména k úplným textům, pro všechny uživatele. Otevřený přístup se vyznačuje dvěma podstatnými rysy: dokumenty jsou dostupné bezplatně, když nemusejí být bezplatně vytvářeny, a vlastník copyrightu dává jednoznačně svolení k jejich neomezenému čtení, stahování, kopírování, sdílení, ukládání, tištění, vyhledávání a hypertextovému propojování. (Hardy in Bratková) Při hodnocení informačního zdroje je vhodné brát v úvahu zejména následující charakteristiky: Typ informací udává, zda se jedná o informaci bibliografickou nebo o úplný text dokumentu (sekundární nebo primární informace), zda jde o informaci faktografickou, obrazovou, zvukovou, multimediální atd. 8 Informační prameny [on line]. [cit. 2009-12-18]. Dostupný z WWW: <knihovny.cvut.cz/vychova/vychova1/inf_pram/sek_i_pr.html>. 9 BRATKOVÁ, E. Otevřený přístup, digitální knihovny a citační služby, s. 1-21. - 8 -

Vhodnost určité informace závisí na informační potřebě. Rozsah zdroje říká, kolik záznamů nebo jiných jednotek zdroj obsahuje. Cena informací ze zdroje zpravidla přímo závisí na jeho rozsahu. Úplnost zdroje určuje, kolik ze všech dostupných informací, jimiž se zdroj zabývá, je ve zdroji uloženo. Je velmi podstatná např. pro patentové nebo právní informace. Retrospektiva zdroje udává, jak daleko do minulosti uchovávané informace sahají. Má význam např. u časových řad. Perioda aktualizace - ukazuje, jak často jsou do zdroje ukládány nové informace. Producent spoluurčuje důvěryhodnost zdroje, je významný např. u databází. Čím renomovanější producent, tím vyšší cena. Dostupnost zdroje udává, zda je zdroj dostupný volně (popř. jen za mírný poplatek) nebo zda se jedná o komerční zdroj. K této charakteristice patří také, zda rešerši provádí provozovatel a za jak dlouho jsou informace dodány, nebo zda rešerši provádí zájemce o informace sám. Cena informací získaných ze zdroje se určuje různými způsoby. V případě dialogově přístupné databáze může být účtováno za každý poskytnutý záznam nebo za dobu pobytu v databázi, jindy to může být paušální platba. 1.3 Elektronické informační zdroje EIZ S rozvojem informačních a komunikačních technologií (ICT) se rozvíjejí i informační zdroje dostupné prostřednictvím ICT. Boldiš 10 uvádí následující důvody pro narůstající oblibu a vliv elektronických informačních zdrojů: 1) elektronické informace jsou snadno přenositelné elektronické formáty umožňují snadnější manipulaci, kopírování a další šíření, 2) EIZ zrychlují komunikační cyklus vědy je urychlen a zlevněn tradiční publikační proces od autora přes vydavatele až po tiskárnu, 3) v EIZ dochází ke komprimaci a zhodnocování informací databáze umožňují vědcům přístup k množství článků, které jsou již do značné míry utříděny, 4) ekonomická výhodnost publikování dokumentů v elektronické podobě je násobně levnější jak na straně výroby, distribuce, ale i snadnějšího přístupu ke značně vysokému počtu relevantních informací. 10 BOLDIŠ, P. Úvod do problematiky elektronických informačních zdrojů, - 9 -

1.3.1 Typy elektronických informačních zdrojů a) Informační databáze (bibliografické a nebibliografické databáze) více ve 2. kapitole, b) Elektronické časopisy jedná se buď o digitalizované časopisy, nebo o časopisy vzniklé přímo jako elektronická média. Obrovskou výhodou elektronických časopisů jsou nízké náklady, rychlost (vydání i distribuce) a distribuce samotná 11, c) Sborníky a preprinty sborníky jsou velmi rozšířeným zdrojem odborných informací, většinou přinášející výsledky výzkumů dříve než jsou publikovány v odborných časopisech. Preprinty jsou dokumenty, které ještě většinou neprošly recenzním řízením, jsou ale určitou formou zpřístupněny a teprve budou publikovány v časopise či ve sborníku. Příkladem může být např. arxiv.org 12, který provozuje knihovna Cornell University. Obsahuje preprinty zaměřené na přírodní vědy i ekonomické oblasti. Podrobněji se problematikou elektronických informačních zdrojů zabýváme v následující kapitole. 1.4 Metadata Metadaty jsou nazývána data o datech, data sdružená s objekty, která zbavují jejich potenciální uživatele nutnosti předběžné znalosti existence či charakteristik těchto objektů. To jinými slovy znamená, že standardní bibliografické záznamy, zkrácené výtahy, abstrakty nebo jakékoliv jiné zástupné formy představují metadata. V knihovnách jsou příkladem metadat katalogizační záznamy, ať již v klasické lístkové nebo elektronické podobě. 13 Pojem metadat je v současnosti používán především v souvislosti s elektronickými zdroji (ačkoliv by to tak být nemělo) a vztahuje se k datům v nejširším slova smyslu datové soubory, textové informace, grafika, hudba, čili cokoliv vyjádřitelné v digitální formě. Většina vyhledávacích strojů je založena na práci s textem, dokáží z něj vyhledat jednotlivá slova, provést s nimi popř. nějaké manipulace, zařadit je do indexu (tzv. indexování) a pak s jeho pomocí vyhodnocovat dotazy. Pokud tedy existuje zájem na tom, aby byly dokumenty (soubory) vyhledatelné, je důležité přidávat textový popis k objektům, které mají jak textovou tak i netextovou povahu. Metadata mohou sloužit k více účelům. V prvé řadě mají popisnou funkci, musí charakterizovat původní objekt dostatečně přesně, aby uživatel byl schopen porozumět jeho obsahu, stejně tak účelu, zdroji a specifickým podmínkám 11 The Scientist [on line]. [cit. 2010-01-06]. Dostupný z WWW: <www.the-scientist.com>. 12 ArXiv [on line]. [cit. 2010-01-10]. Dostupný z WWW: <arxiv.org>. 13 BARTOŠEK, M. Vyhledávání v Internetu a DUBLIN CORE, s. 1-4. - 10 -

pro užívání. Funkce metadat: shrnutí sumarizace obsahu vyhledávání prohledávání metadat s cílem vyšší přesnosti výsledků doporučení umožňuje uživateli určit, která data potřebuje vybírání pomoc při rozhodování, kterou z instancí zdroje vybrat pro načtení (např. je-li k dispozici ve více formátech) přístup zajištění přístupu k datům (uvedení jejich přesné lokace) omezení zamezení přístupu pro některé uživatele (digitální podpisy, autentizace, copyright ) 1.4.1 Vyhledávání a metadata Metadata nepředstavují nic nového obzvlášť pro informační pracovníky zabývající se vyhledáváním. Ti již dlouhá léta pro přesné vyhledávání používají řízené slovníky, omezují vyhledávání pomocí deskriptorů (viz dále), autorů, názvů apod. V prostředí booleovského vyhledávání umožňují metadata nalézat informace, aniž by byly výsledky znehodnocovány množstvím nerelevantních objektů. Pro fulltextové vyhledávací stroje jsou typické komplexní algoritmy, které přiřazují váhu - ve smyslu relativní významnosti - jednotlivým slovům. Váhy jsou založeny na takových elementech, jako je unikátnost slova v rámci souboru dokumentů, četnost termínu v dokumentu, jeho pozice (např. za významnější jsou považována slova v názvu nebo blíže počátku dokumentu). Tyto faktory vstupují do výpočtu relevance dokumentu vůči zadanému dotazu. Metadata tento proces významně ovlivňují a modifikují. Metadata, která popisují obsah dokumentu, by měla charakterizovat hlavní téma, a proto také odpovídající slova mají vyšší váhu než táž slova v běžném textu. Tím by mělo být zajištěno, že ve výsledcích vyhledávání se na prvních místech objeví dokumenty, které obsahují dotazované termíny jako součást svých metadat. Navíc je možno díky metadatům rozvíjet nové přístupy, pomocí nichž lze např. při vyhodnocování dotazu shlukovat (klastrovat) dokumenty, které spolu nějak souvisí. Souvislost může být obsahová, dokumenty mohou na sebe vzájemně odkazovat apod. Tyto shlukové přístupy se objevují u různých strojů s různou mírou úspěchu (více ve 4. kapitole). Metapopis objektu, zdroje, atd. se skládá z určitého počtu předdefinovaných elementů, které reprezentují specifické vlastnosti popisovaného objektu, přičemž každý element nabývá jedné nebo více hodnot. - 11 -

Základní elementy a hodnoty Tabulka 1.1 Element Title Creator Publisher Identifier Format Relation hodnota název dokumentu jméno a příjmení1, jméno a příjmení2, vydavatel www stránka txt/doc/odt/rtf/pdf identifikace sekundárního zdroje a specifikace jeho vztahu k danému zdroji 1.4.2 Klíčová slova Pro naše účely se podrobněji zmíníme o specifických metadatech klíčových slovech. Klíčová slova 14 jsou jednotlivá slova nebo slovní spojení, která charakterizují daný dokument, přesněji jeho obsahovou stránku. Stanovení vhodných klíčových slov probíhá na základě analýzy dokumentu. U odborného textu je vhodné volit klíčová slova z názvu dokumentu, kapitol, odstavců apod. Často se pro stanovení klíčových slov využívá i abstraktu, úvodu nebo závěru daného dokumentu. Problematika stanovení správných a vhodných klíčových slov úzce souvisí s mírou relevantních výsledků následně provedeného vyhledávání. Užití správných klíčových slov na straně autora textu (resp. katalogizátora) a formulace dotazu na straně vyhledávače je komplikováno výskytem synonymních výrazů. Při vlastním vyhledávání tak mohou pomáhat tzv. řízené slovníky (slovníky podléhajícím určitým pravidlům) jehož příkladem může být např. tezaurus (použití tezauru se věnujeme v dalších kapitolách). Tezaurus je založen na výběru jednoho z možných synonym, kterým budou ostatní synonyma nahrazována. Takováto klíčová slova se nazývají deskriptory, zbývající synonyma jsou nedeskriptory. Tezaurus je slovník, který obsahuje deskriptory i nedeskriptory. Dále jsou v tezauru zachyceny i vztahy mezi deskriptory. Jsou to hierarchické vztahy podřízenosti a nadřazenosti pojmů a rovněž vztahy vzájemné asociace. SHRNUTÍ KAPITOLY Informačním zdrojem (pramenem) rozumíme systém, který je reálným nebo potencionálním nositelem, zprostředkovatelem nebo šiřitelem informací. Tomuto vymezení vyhovují knihovny, databázová centra, informační střediska, televize, rozhlas apod. Informační pramen je pojem mnohem širší než běžně používaný pojem dokument, který se užívá v souvislosti s hmotným zdrojem. Rozlišujeme primární, sekundární a terciální informační prameny, podle dostupnosti pak přímo dostupné a dostupné zprostředkovaně. Termín otevřený přístup (Open Access) v sobě zahrnuje význam trvalého a bezplatného online 14 SKLENÁK, V. Data, informace, znalosti a Internet, s. 34. - 12 -

přístupu k dokumentům, zejména k úplným textům, pro všechny uživatele. Elektronické informační zdroje (EIZ) jsou informační prameny dostupné prostřednictvím informačních a komunikačních technologií. Mezi základní typy EIZ řadíme informační databáze, elektronické časopisy a sborníky a preprinty. Metadata jsou data o datech, popisují informační zdroj. Velkou roli sehrávají při vyhledávání, jedná se o specifická metadata tzv. klíčová slova. Klíčová slova jsou slovní spojení či slova, která charakterizují určitý dokument. Stanovení klíčových slov probíhá na základě analýzy dokumentu je vhodné je volit z názvu dokumentu, z jeho abstraktu nebo slova a slovní spojení často se vyskytující v analyzovaném textu. LITERATURA KE KAPITOLE Základní literatura: [1] BARTOŠEK, M. Vyhledávání v Internetu a DUBLIN CORE. Brno: Zpravodaj ÚVT MU, 1999, roč. IX, č. 4, s. 1-4. ISSN 1212-0901 [2] BOLDIŠ, P. Úvod do problematiky elektronických informačních zdrojů [on line]. 18. 4 2003. [cit. 2009-11-23]. Dostupné z WWW: <http://www.veda.cz/article.do?articleld=6069>. [3] BRATKOVÁ, E. Otevřený přístup, digitální knihovny a citační služby. In: INFORUM 2006 : 12. ročník konference o profesionálních informačních zdrojích, Vysoká škola ekonomická, Praha, 23.-25. května 2006. 1. vyd. elektronické vyd. 2006, Praha: Albertina icome Praha; s. 1-21. ISBN 1801-2213. [4] HOŘÍNKOVÁ KOUŘILOVÁ, L., PAZDERSKÝ, M. ŠKYŘÍK, P. Vyhledávací nástroje na internetu I. [on line]. [cit. 2009-11-23]. Dostupné z WWW: <http://is.muni.cz/elportal/estud/ff/js07/informace/materialy/pages/internet_op ora.pdf>. [5] SKLENÁK, V. a kol. Data, informace, znalosti a Internet. 1. vyd. Praha: C.H. Beck, 2001. 507 s. ISBN 80-7179-409-0. [6] Věda.cz [on line]. [cit. cit. 2010-01-06]. Dostupný z WWW: www.veda.cz. [7] ArXiv [on line]. [cit. 2010-01-10]. Dostupný z WWW: <arxiv.org>. [8] Kurz práce s informacemi [on line]. [cit. 2010-01-07]. Dostupný z WWW: <is.muni.cz/elportal/estud/ff/js07/informace/materialy/kurz_prace_s_informac emi.html#02>. [9] Kde hledat informace I [on line]. [cit. 2010-01-08]. Dostupný z WWW. <is.muni.cz/elportal/estud/ff/js07/informace/materialy/pages/kdehledat_opora.pdf>. [10] Informační prameny [on line]. [cit. 2010-01-18]. Dostupný z WWW: <knihovny.cvut.cz/vychova/vychova1/inf_pram/pri_i_pr.html>. - 13 -

[11] Informační prameny [on line]. [cit. 2010-01-18]. Dostupný z WWW: <knihovny.cvut.cz/vychova/vychova1/inf_pram/sek_i_pr.html>. - 14 -

2 Informační databáze pro VaV CÍL Po prostudování kapitoly budete schopni: definovat pojmy bibliografické databáze, fulltextové databáze, digitální knihovna, citační rejstřík, impact factor, rozlišit mezi pojmem digitální knihovna a citační rejstřík, vyjmenovat několik databází pro ekonomii, společenské vědy a technické vědy. KLÍČOVÁ SLOVA Bibliografické databáze, fulltextové databáze, faktografické databáze, digitální knihovny, repozitáře, elektronické časopisy, preprinty, citační rejstříky,impact faktor. 2.1 Databáze Pod označením databáze se pro vědu a výzkum jsou míněny elektronické informační zdroje, které zpřístupňují informace o tzv. primárních zdrojích 15. Tak jako v klasických (kamenných) informačních katalozích můžeme rozlišovat systémy pro vyhledávání informací do dvou skupin. a) bibliografické systémy, b) fulltextové systémy vyhledávání slov, frází a jejich kombinací vytvořené pomocí operátorů Booleovské algebry. Informace, dokumenty a objekty, které jsou uchovávány v profesionálních databázích, jsou placeným zbožím. Roční přístup do profesionálních databází pro organizace se může pohybovat i v milionech korun. Klient však získává ověřenou kvalitu a celosvětově jednotný, relevantní obsah. 2.1.1 Typy databází a) Bibliografická databáze (dokumentografické) přináší základní informace o primárních dokumentech v podobě bibliografického záznamu (autor, název článku, časopis, rok apod.) a v současnosti většinou doplněné abstraktem. Bibliografická databáze nejčastěji 15 KOHOUTOVÁ, S. BOLDIŠ, P. Základy práce s informačními databázemi. - 15 -

sleduje odborné časopisy a její záběr je v řádu stovek až tisíců titulů. Rešerše v takovéto databázi může přinést přehled o problematice a je podkladem pro získání plných textů článků. b) Databáze s plnými texty, fulltextové databáze (EBSCOhost, ProQuest ad.) poskytuje bibliografické záznamy a také některé plné texty. Tyto databáze zdarma uveřejňují pouze některé plné texty, u mnoha zajímavých článků je z důvodu licenční politiky vydavatele k dispozici pouze abstrakt. Dalším omezením může být tzv. embargo smluvní zpožďování aktuálních čísel časopisů a to i o více než půl roku. Plnotextové databáze navíc mohou být orientovány všeobecně (výše uvedené) nebo oborově specializované (JSTOR, Patria Plus, IEEE Computer Society Digital Library). Plný přístup do těchto databází bývá většinou možný pouze přes univerzitní nebo vědecké knihovny. c) Existují i databáze různých odborných publikací (např. placený zdroj informací pro inženýry, zaměřený na průmysl a inovace Knovel http://why.knovel.com) nebo databáze časopisů, zveřejňovaná přímo jejich vydavatelem (např. Springer LINK), kde výše uvedená omezení být nemusí. d) Faktografická databáze shromažďuje statistiky a další data, která jsou využitelná pro výzkum. Často jde o chemické databáze (např. přehled sloučenin) nebo o databáze ekonomické (ekonomické ukazatele, statistiky EUROSTAT apod.). e) druhově specializované patentové f) katalogy, rejstříky, adresáře Poslední tři kategorie se někdy označují jako databáze parametrické. Rozdělení elektronických zdrojů, vazby a souvislosti mezi jednotlivými pojmy ukazuje následující myšlenková mapa. - 16 -

Informační zdroje a vazby mezi nimi Obrázek 2.1 2.2 Knihovny Postupem času vzniklo mnoho velkých a významných knihoven např. Britská knihovna 16 nebo Kongresová knihovna 17 ve Washingtonu. Největší knihovnou v ČR je Národní knihovna 18. Velké a významné knihovny vznikají při univerzitách či vysokých školách. Známé je také Centrum inovačních a komunikačních služeb VŠE 19. Pro usnadnění přístupu zpočátku pouze k vzácným dokumentům začaly při těchto i dalších knihovnách vznikat tzv. digitální knihovny. Největší digitální knihovnou světa je World Digital Library 20. Jedná se o mezinárodní projekt, do nějž jsou zapojeny knihovny po celém světě, které tvoří virtuální knihovnu. Zastoupení v projektu má i Česká republika s pěti významnými historickými dokumenty 21. Další obdobné projekty zahrnující velké množství dokumentů je Google Book Search (7 milionů digitálních knih) a Projekt Guttenberg (nejstarší projekt 1971). Evropskou Unií podporovaný projekt Europeana zpřístupňuje přes 4,5 milionu knih. 16 The British Library [on line]. [cit. 2010-02-05]. Dostupný z WWW: <www.bl.uk>. 17 Library of Congress [on line]. [cit. 2010-02-05]. Dostupný z WWW: <www.loc.gov/>. 18 Národní knihovna České republiky [on line]. [cit. 2010-02-05]. Dostupný z WWW: <www.nkp.cz>. 19 Centrum informačních a knihovnických služeb VŠE [on line]. 2010 [cit. 2010-02-05]. Dostupný z WWW: <ciks.vse.cz>. 20 World Digital Library [on line]. [cit. 2010-02-05]. Dostupný z WWW: <www.wdl.org>. 21 Pět významných historických dokumentů ČR [on line]. [cit. 2010-02-05]. Dostupný z WWW: <www.wdl.org/en/search/gallery?ql=en&a=-8000&b=2009&c=cz&r=europe>. - 17 -

2.3 Elektronické informační zdroje Ucelený přehled vybraných, oborově rozdělených EIZ je možno nalézt na např. na http://193.84.33.165/eiz/. Nás samozřejmě zajímají vědy přírodní a technické, sociální a ekonomické, proto se podívejme, co jednotlivé kategorie nabízejí. 2.3.1 Přírodní a technické vědy Zde nalezneme celkem 13 databází, z nichž jmenujme aspoň některé: EIS Digests of Environmental Impact Statements (vydavatel je ProQuest) Charakteristika databáze: databáze sledující ekologické dopady konstatované vládou USA. V této databázi jsou sledovány pozitivní i negativní vlivy projektů. Informace jsou přebírány z Federal Environmental Impact Statements. Plné texty k záznamům lze obdržet tištěné nebo na mikrofiších. Retrospektiva je od roku 1985, současný počet záznamů je přes 5000, ročně jich přibývá přes 500. Safari 22 Charakteristika a zaměření databáze: Safari je kolekce elektronických knih, které zahrnují oblast informačních technologií a aplikovaných věd. Obsah databáze: 3250 titulů elektronických knih, knihy v elektronickém formátu, plné texty. IEEE Digital Library 23 Charakteristika a zaměření databáze: IEEE Digital Library je plnotextový informační zdroj pro technické obory zahrnující oblast informačních technologií a počítačové vědy. Obsah databáze: 22 titulů výzkumných a technických časopisů IEEE (Magazines, Transactions), více než 1500 vybraných sborníků z nejvýznamnějších počítačově orientovaných konferencí IEEE Časové vymezení: časopisy od r.1988 až do současnosti, sborníky od r.1995 do současnosti. ACM Digital Library 24 Charakteristika a zaměření databáze: ACM Digital Library je plnotextová databáze pro technické obory zahrnující oblast informačních technologií a počítačové 22 23 Safari Books Online [on line]. [cit. 2010-02-14]. Dostupný z WWW: <my.safaribooksonline.com/?portal=informit>. CS Digital Library [on line]. [cit. 2010-02-15]. Dostupný z WWW: <www.computer.org/portal/web/csdl/home>. 24 The ACM Digital Library [on line]. [cit. 2010-02-15]. Dostupný z WWW: <portal.acm.org/dl.cfm>. - 18 -

vědy. Rozsáhlá webová knihovna plných textů dokumentů a publikací vydávaných Association for Computing Machinery (sborníky z konferencí, časopisy - Journals, Magazines, Transactions). Časové vymezení: časopisy od r.1950 až do současnosti (závisí na konkrétním titulu). Lecture Notes in Computer Science 25 (vydavatel je- Springer) Charakteristika a zaměření databáze: Lecture Notes in Computer Science je plnotextová databáze pro technické obory zahrnující oblast informačních technologií, umělé inteligence, bioinformatiky a jejich aplikací. Lecture Notes in Computer Science (LNCS) zahrnuje i LNAI (Lecture Notes in Artificial Intelligence) a Lecture Notes in Bioinformatics (LNBI). Jádrem jsou publikované odborné příspěvky z konferencí. Časové vymezení: retrospektiva od roku 1973. 2.3.2 Ekonomické databáze Zde nalézáme 13 databází zaměřených na ekonomii, obchod, finance a nalézáme zde i publikace orientované na domácí ekonomiku, následuje přehled vybraných databází s popisem a zaměřením: DSI Full Campus Solution 26 Zaměření databáze: ekonomie, obchod Charakteristika databáze: jedna z nejobsáhlejších statistických databázových kolekcí na světě. Obsahuje základní statistické údaje o ekonomikách jednotlivých států (OECD, EU aj.), makroekonomické informace (daně, HDP, ceny, příjmy, populace, zaměstnanost apod.), OECD s International Trade Statistics, Eurostat Statistics a další Obsah databáze: statistické ročenky, informace veřejné správy a soukromých organizací. DSI Full Campus Solution EconLit 27 EconLit Zaměření databáze: ekonomika, historie ekonomiky, ekonomické teorie, 25 26 27 Springers [on line]. [cit. 2010-02-20]. Dostupný z WWW: <www.springer.com/computer/lncs?sgwid=0-164-0-0-0>. Campus Solutions [on line]. 2010 [cit. 2010-02-25]. Dostupný z WWW: <www.statistischedaten.de/dsishop/en/the-great-statistical-collections/campus-solution/96>. Journals Indexed in EconLit [on line]. [cit. 2010-02-38]. Dostupný z WWW: <www.aeaweb.org/econlit/journal_list.php>. - 19 -

finance Charakteristika databáze: EconLIT odpovídá publikacím Journal of Economic Literature a Index of Economic Articles a pokrývá časopisecké články, kapitoly knih a přednášky z konferencí o historii ekonomiky, ekonomických teoriích, mezinárodní, regionální a městské ekonomice a souvisejících oborech. Roční přírůstek 27 000 záznamů. Obsah databáze: více než 521 000 záznamů a vybraných abstraktů ze světové ekonomické literatury od roku 1969. Finlit 28 Zaměření databáze: podnikový management, podniková ekonomika, mikroekonomika Finlit Charakteristika databáze: databáze produkovaná Ministerstvem financí ČR, obsahující anotované záznamy článků ze světových i domácích ekonomických periodik. Obsah databáze: bibliografické záznamy s anotacemi Časové vymezení: od roku 1991 Firemní monitor II - Monitor tisku ČR 29 Zaměření databáze: firmy v ČR, podnikání Firemní monitor II Charakteristika databáze: jedna z nejrozsáhlejších databází monitorujících tiskové zprávy zaměřené na firmy v ČR. Sleduje více než 150 titulů novin a časopisů a přináší zprávy týkající se aktivit firem, podnikání a ekonomiky v retrospektivě od 1. 1. 1993. Obsahuje všechny zprávy, které se vztahují k aktivitě konkrétních podnikatelských subjektů. Zajišťuje i vazbu na originální pramen formou přesné citace a je vybavena i dalšími údaji usnadňujícími vyhledávání. Zprávy ve formě abstraktů nebo plných textů jsou doplněny věcnými i formálními údaji pro snazší orientaci v rozsáhlém souboru dat. Obsah databáze: faktografické informace, plné texty Market Research 30 Zaměření databáze: ekonomika, průzkum trhu, demografie, obchod, Market Research 28 Pouze pro registrované uživatele CIKS VŠE. Databáze FinLit je součástí rozhraní Souborného 29 30 katalogu VŠE. Albertina: Firemní monitor [on line]. 2005 [cit. 2010-03-02]. Dostupný z WWW: <www.albertina.cz/czech/index.html>. Market Research Monitor [on line]. 2010 [cit. 2010-03-02]. Dostupný z WWW: <www.euromonitor.com/market_research_monitor.aspx>. - 20 -

marketing, lidské zdroje Charakteristika databáze: světový adresář marketingových zpráv, studií a přehledů. Umožňuje vyhledat relevantní výzkumné zprávy pro specifické trhy, najít zdroje o spotřebitelských trendech na nových trzích, a také identifikovat společnosti provádějící průzkum trhu, které mají zkušenosti s danou geografickou oblastí nebo odvětvím. Obsah databáze: cca 40 000 abstraktů zpráv od 850 světových vydavatelů Časové vymezení: od roku 1984 OVEL - Obchodní věstník 31 Zaměření databáze: politika, ekonomie, finance, obchod OVEl Charakteristika databáze: Obchodní věstník v elektronické podobě publikuje informace o zápisech a změnách v obchodním rejstříku, o konkurzech, likvidacích podniků, účetních závěrkách, obchodních veřejných soutěžích, svoláních valných hromad apod. Obsah databáze: faktografické informace 2.3.3 Společenské vědy Information Science and Technology Abstracts (ISTA) 32 ISTA Zaměření databáze: informační věda, informační technologie, knihovnictví Charakteristika databáze: záznamy o mezinárodní literatuře v oblasti knihovnictví a informatiky z více než 450 periodik a s více než 255 000 záznamy. Zpracovávaná témata zahrnují problematiku vytváření abstraktů a indexů, klasifikace, informační management, vyhledávání informací online, vedení knihoven, telekomunikace apod. Časové vymezení: retrospektiva do roku 1966 Zaměření databáze: vzdělávání ERIC 33 ERIC Charakteristika databáze: ERIC je databází produkovanou U.S. Department of Education, ERIC - Education Resources Information Center, OCLC Public Affairs 31 Obchodní věstník [on line]. [cit. 2010-03-13]. Dostupný z WWW: <ov.ihned.cz/index.php?p=305700>. 32 Information Science & Technology Abstracts [on line]. [cit. 2010-03-18]. Dostupný z WWW: <www.ebscohost.com/thistopic.php?topicid=91&marketid=1>. 33 ERIC [on line]. [cit. 2010-03-18]. Dostupný z WWW: <www.eric.ed.gov/>. - 21 -

Information Service. Zahrnuje abstrakty článků ze 775 časopisů a z tisíců výzkumných zpráv. Pokrývá široké spektrum aspektů vzdělávání, jako např. vzdělávání dospělých, odborné školství, poradenství, řízení vzdělávání, výuka jazyků, čtení a komunikační schopnosti, osnovy pro nadané nebo postižené děti, metody hodnocení. Kompletní soubor obsahuje 1 091 000 záznamů s ročním přírůstkem 31 000, k dispozici je rovněž tezaurus. Časové pokrytí: retrospektiva od roku 1966. 2.3.4 Elektronické informační zdroje dostupné v Knihovně Univerzity Palackého (KUP) Počet EIZ v této knihovně překračuje sto, přístup k nim je buď přímo z knihovny, nebo přes webové rozhraní počítače v univerzitní síti. Jako většina knihoven nabízí KUP vzdálený přístup (VPN). Pro oblast ekonomiky a financí je to 6 databází: Accounting & Tax specializovaná databáze na daňovou politiku a činnost firem, Banking Information Source specializovaná databáze pro bankovnictví a ekonomiku, Business Source Complete vědecká obchodní databáze, Science Direct plné texty přírodovědných (částečně i společenskovědních) časopisů, Sociological Abstracts bibliografická databáze pro sociology, Springer Link plné texty přírodovědných (částečně i společenskovědních) časopisů. Ekonomiky a finance Pro oblast výpočetní techniky a informačních věd je zahrnuto 6 databází: Knovel faktografická databáze z oboru přírodních věd, techniky, zdraví a hygieny, farmacie a potravinářství, Library, Information Science & Technology Abstracts (LISTA) bibliografická databáze pro knihovnictví, ProQuest Computing specializovaná databáze pro informační technologie, ProQuest Telecommunications specializovaná databáze pro informační technologie, Science Direct plné texty přírodovědných (částečně i společenskovědních) časopisů, Springer Link plné texty přírodovědných (částečně i společenskovědních) časopisů. Výpočetní technika a informační vědy - 22 -

Pro humanitní vědy je dostupný následující výběr databází: Academic Research Library specializovaná databáze pro společenskovědní a humanitní obory, Career and Technical Education specializovaná databáze pro vzdělávání, C.E.E.O.L. plné texty společenskovědních a humanitních časopisů ERIC - Educational Resource Information Centre databáze pro pedagogiku, JSTOR archiv plných textů vědeckých časopisů, Periodicals Archive Online (PAO) plné texty společenských a humanitních časopisů, Periodicals Index Online (PIO) bibliografie odborných časopisů společenských a humanitních oborů, ProQuest Social Science Journals databází pro společenskovědní a humanitní obory, Science Direct plné texty přírodovědných (částečně i společenskovědních) časopisů, Social Services Abstracts bibliografická databáze zaměřená na oblast sociální práce, SocINDEX with Full Text plnotextová databáze pro sociologii, Sociological Abstracts bibliografická databáze pro sociology, Springer Link plné texty přírodovědných (částečně i společenskovědních) časopisů. Humanitní vědy TAMTAM (Anopress) plné texty mediálních zdrojů ČR 2.4 Digitální knihovny Jedná se o službu, která zpřístupňuje organizovanou sbírku elektronických objektů, umožňuje vyhledávání, identifikaci, zpracování digitálních objektů dále zajišťuje uložení, údržbu a ochranu objektů v digitalizovaných skladištích 34. Nejedná se tedy o webový přístup do knihovního fondu dané knihovny, ale o přístup k digitálním dokumentům (obecně objektům). Pro digitální knihovny bývá typické zejména 35 : systematická správa, popis, vyhledávání z jednoho místa v různorodých zdrojích (texty, zvuky, obrázky, 3D objekty, videa ). zaměření na kvalitu, systematické budování určité kolekce, sbírky velké výhody oproti tradiční knihovně - nonstop přístup ke sbírkám, efektivní vyhledávání, sdílení dat. 34 HORÁLEK, J. Informace a Internet, [on line]. 2010 [cit. 2010-03-29]. Dostupný z WWWW. <http://www.horalek.org/clanky/internet.pdf> 35 ŠEDINOVÁ, P., KŘIVÁNEK, P., ŠKYŘÍK, P. Elektronické informační zdroje II, s. 1-4. - 23 -

Digitálním (elektronickým) objektem je myšlena datová struktura tvořená dvěma základními částmi: obsahem a klíčovými metadaty. Úložiště digitálních objektů se nazývají repozitáře. Objekty ukládané v digitálních knihovnách mohou být 36 : a) tzv. born digital objekty, které jako digitální již vznikly b) digitalizované objekty, které byly převedeny do elektronické podoby (skenováním, přepisem) V další části textu si představíme vybrané digitální knihovny. Digitální knihovna Univerzity Tomáše Bati ve Zlíně 37 poskytuje přístup k plným textům více než 1000 digitalizovaných knih vydavatelství Springer 38, Wiley, Elsevier ad. Knihy jsou děleny do tematických kolekcí. Jednou z digitálních knihoven zaměřených čistě na ekonomii a její historii v zemích českých je Zlatý fond českého ekonomického myšlení 39. Zde jsou shromážděna díla vztahující se k historickému vývoji českého ekonomického myšlení do roku 1933 (stav v roce 2009). Národní knihovna ČR 40 Elektronické informační zdroje přístupné přes NKP Obrázek 2.2 Prostřednictvím NKP mají uživatelé přístup k Elektronické knihovně časopisů, 36 PAPIK, R., SOUČEK, M. Zpřístupňování textových informací z profesionálních zdrojů. Databázová centra, databáze a digitální knihovny, [on line]. Naposledy změněno 12.5.2006 [cit. 2010-03-25]. Dostupný z WWW: <http://www.veda.cz/article.do?articleid=9213/>. 37 Digitální knihovna Univerzity Tomáše Bati ve Zlíně [on line]. 2008 [cit. 2010-03-25]. Dostupný z WWW: <www.knihovna.utb.cz/digital/>. 38 SpringerLink [on line]. [cit. 2010-03-25]. Dostupný z WWW: <www.springerlink.com>. 39 Zlatý fond českého ekonomického myšlení [on line]. [cit. 2010-03-25]. Dostupný z WWW: <www.econlib.cz/zlatyfond/>. 40 Elektronické informační zdroje ve Studovně periodik [on line]. 2010 [cit. 2010-03-29]. Dostupný z WWWW. <www.nkp.cz/pages/page.php3?page=peri_dtb.htm>. - 24 -

spravované Národní knihovnou ČR 41. EZB nabízí přístup ke všem plnotextovým odborným elektronickým časopisům, které má knihovna k dispozici v rámci předplatného nebo které jsou volně dostupné na internetu. Časopisy jsou rozděleny do 4 kategorií podle dostupnosti. Databáze obsahuje více než 44 000 časopisů, z nichž je téměř 22 000 volně dostupných. Volně dostupné zdroje jsou k dispozici v adresáři Directory of Free Access Journals. Plnotextové databáze časopisů v NKP: české: Anopress TAM TAM (viz výše) zahraniční: EBSCO, GeoScienceWorld, Literature Online, Science Direct, Springer Link, Wiley EBSCO je zdroj obrovského množství vědeckých informací pro společenské a humanitní obory. Zahrnuje dvě základní databáze: Academic Search Complete Jedna z největších vědeckých multidisciplinárních plnotextových databází vytvořených speciálně pro akademické instituce. Obsahuje řadu recenzovaných časopisů, které nejsou dostupné v jiné podobné databázi. Počet plnotextových zdrojů přesahuje 5000. K této databázi mohou přistoupit i aktivní uživatelé vybraných knihovních institucí (např. Vědecká knihovna v Olomouci, nebo je možný přístup z vnitřní sítě Univerzity Palackého). Business Source Complete Vědecká obchodní databáze zpřístupňující bibliografické a plnotextové informace. Kromě odborných časopisů zahrnuje řadu dalších informačních pramenů (knihy, případové studie, konferenční materiály, finanční data, průmyslové zprávy, investiční zprávy atd.). Obsahuje více než 3000 plnotextových časopisů, z nichž více než 1600 je recenzováno. V prostředí EBSCOhost jsou zpřístupněny další databáze společnosti EBSCO. WebArchiv 42 je digitální archiv českých webových zdrojů, které jsou zde shromažďovány za účelem jejich dlouhodobého uchování. Na provozu se mj. podílí právě i NK ČR. Typy zdrojů umístěné ve WebArchivu: digitální dokumenty volně dostupné prostřednictvím sítě Internet, publikace odborného, uměleckého a zpravodajsko-publicistického zaměření, periodika, monografie, konferenční příspěvky, výzkumné a jiné zprávy, 41 Elektronická knihovna časopisů [on line]. 2010 [cit. 2010-03-28]. Dostupný z WWW: <ezb.nkp.cz>. 42 WEB archiv archiv českého webu [on line]. 2010 [cit. 2010-04-02]. Dostupný z WWW: <www.webarchiv.cz>. - 25 -

akademické práce. Textové a do jisté míry také obrazové a zvukové dokumenty existující pouze v digitální podobě. 2.4.1 Specializované firmy 43 Jednou z prvních specializovaných firem zabývajících se poskytováním informací byla The Mercantile Agency. Agentura se zabývá pořizováním a prodejem zpráv o hospodářské situaci firem. Dnes známá jako Dun&Bradstreet Corporation 4445. Jejím nejznámějším produktem je dnes International Bussines Information Reports (BIR). Celkový počet firem v databázích D&B je více než 155 milionů, z toho celých 101 milionů firem je aktivních. Z tohoto počtu je skoro celých 48 milionů firem evropských a necelých 24,5 milionu firem tvoří firmy ze Severní Ameriky. Databáze poskytují tři nejdůležitější hodnocení - D&B Rating (udává rizikový faktor a finanční sílu firmy), D&B Failure Score (skóre úpadku podnikatelských subjektů) a D&B Paydex (sledující platební morálku subjektů) 46. Mezi velmi významné instituce patří různá databázová centra, která dnes poskytují své služby přes Internet. Velmi významnou firmou je Dialog Information Service 47. Produkty této firmy nabízejí precizní vyhledávácí nástroje a přístup do jedinečných a relevantních databází obsahujících více než 1,4 miliardy klíčových údajů určených pro koncové uživatele z oblasti obchodu, vědy, z řad akademiků i vládních organizací. 48 2.5 Informační zdroje/databáze s otevřeným přístupem 49 Volně dostupné online časopisy, které mohou zachovávat tradiční charakteristiky klasických časopisů, jsou určeny k bezplatnému využívání koncovými uživateli. Někteří vydavatelé zajišťují volný přístup ke všem článkům (např. Public Library of Science - PLoS 50 ). PLoS obsahuje články převážně medicínského 43 SKLENÁK, V. Data, informace, znalosti a Internet, s.22-29.. 44 D&B [on line]. 2010 [cit. 2010-03-28]. Dostupný z WWW: <www.dnb.com>. 45 D&B Česká republika a Slovenská republika [on line]. 2010 [cit. 2010-03-28]. Dostupný z WWW. <dbczech.dnb.com/czech/default.htm>. 46 D&B Česká republika a Slovenská republika [on line]. 2010 [cit. 2010-03-28]. Dostupný z WWW. <dbczech.dnb.com/czech/default.htm>. 47 Dialog [on line]. [cit. 2010-04-05]. Dostupný z WWW: <www.dialog.com>. 48 Dialog and the invention of online information services [on line]. [cit. 2010-04-05]. Dostupný z WWW: <www.dialog.com/about>. 49 BRATKOVÁ, E. Otevřený přístup, digitální knihovny a citační služby, s. 1-21. 50 Public Library of Science [on line]. [cit. 2010-04-05]. Dostupný z WWW: <www.plos.org>. - 26 -

zaměření v kombinaci s dalšími vědními disciplínami (matematická statistika, genetika, biologie ad.). Další systém - DOAJ 51 (Directory of Open Access Journals) zajišťuje registraci online volně dostupných časopisů. V sekci Business and Management je možno nalézt 101 časopisů a v sekci Economics nalezneme 92 časopisů. Sekce Law obsahuje 77 záznamů a Political Science celých 123 titulů. K nejdůležitějším typům informačních zdrojů s otevřeným přístupem patří: a) Předmětově profilované a institucionální repozitáře b) Online časopisy s otevřeným přístupem c) Povrchový web d) Předmětově profilovaným archivem pro kognitivní vědy je např. CogPrints, pro knihovní a informační vědy pak E-LIS. Zvláštním typem archivů jsou institucionální repozitáře (Institutional repositories, IR). Seznam IR dokládá jejich světový registr ROAR 52 (Register of Open Access Repositories). V tomto registru nalezneme zatím (rok 2009) pouze 4 české repozitáře. Digitální knihovna Univerzity Pardubice je primárně určena k ukládání a zpřístupňování bakalářských, diplomových a disertačních prací zpracovaných v rámci akreditovaných studijních programů na Univerzitě Pardubice. Digitální knihovna obsahuje: bibliografické záznamy (u některých je připojen plný text práce) závěrečných prací z let 1992 2007 uložené v kolekci Vysokoškolské kvalifikační práce plné texty závěrečných prací obhájených po roce 2008 uložené v kolekcích jednotlivých kateder a zároveň v kolekci Vysokoškolské kvalifikační práce články publikované v Scientific papers of the University of Pardubice DML- CZ je fulltextová digitální knihovna zaměřená na oblast matematiky, v budoucnu by měla být součástí plánované světové digitální matematické knihovny (World Digital Mathematics Library WDML). 51 Directory of Open Access Journals [on line]. 2010 [cit. 2010-04-05]. Dostupný z WWW: <www.doaj.org>. 52 Registry of Open Access Repositories [on line]. 2010 [cit. 2010-04-11]. Dostupný z WWW. <archives.eprints.org/>. - 27 -

Úvodní stránka Časopisu pro pěstování matematiky Obrázek 2.3 Do DML- CZ jsou zařazovány materiály tří různých forem 53 : a) Tištěné dokumenty: časopisy, monografie a sborníky vydané před rokem 1990 a existující pouze v tištěné podobě. Tyto dokumenty jsou skenovány, obrazy stránek jsou dále zpracovávány. b) Retro - born digital dokumenty: materiály od roku 1990. Tyto dokumenty již existují v digitální podobě. c) Digitální dokumenty přebírané on-line: jde především o přebírání aktuálně vydávaných časopisů. dknav knihovna Akademie věd České Republiky 54 Nabídka této digitální knihovny je opravdu velmi široká a postihuje mnoho vědeckých oblastí. Za zmínku stojí především: AUCO Czech Economic Review (3 ročníky, 47 článků) Data a výzkum SDA Info (1 ročník, 6 článků) Journal of Hydrology and Hydromechanics - (1 ročník, 6 článků) 53 BARTOŠEK, M. Česká digitální matematická knihovna, [on line]. [cit. 2010-04-11]. Dostupný z WWW: <http://www.inforum.cz/pdf/2008/bartosek-miroslav-cze.pdf >, s. 1-11. 54 Knihovna Akademie věd ČR [on line]. [cit. 2010-04-11]. Dostupný z WWW. <dlib.lib.cas.cz/view/subjects/>. - 28 -

Stránka s nabídkou možností k vybranému článku Obrázek 2.4 Ke každému článku dostaneme na kartě Summary souhrnné informace abstrakt příspěvku, bibliografické údaje. Odtud je také možné článek uložit na harddisk. Na kartě Details jsou k dispozici bibliografické záznamy. Užitečnou možností je také vygenerování bibliografické citace na kartě Export a to do mnoha různých formátů (od TEXu, přes HTML, XML, až po ASCII). VŠB Technická Univerzita v Ostravě 55 VŠB TUO V současné době obsahuje bibliografické záznamy publikačních výstupů členů jednotlivých kateder. Pro registrované členy je zpřístupněna také kolekce závěrečných prací studentů. Úvodní stránka digitální knihovny VŠB Obrázek 2.5 Tyto elektronické archivy jsou softwarově zabezpečeny prostřednictvím volně dostupných programů DSpace nebo Eprints.org. 55 DSpace VŠB TUO [on line]. 2007 [cit. 2010-04-11]. Dostupný z WWW: <dspace.vsb.cz/>. - 29 -

2.6 Citační rejstříky Pojem citační rejstřík 56 představuje specializovaný bibliografický soupis článků z různých vědních oborů, jejichž účelem je mapování vývoje vědeckého poznání zachycováním citačních vazeb mezi jednotlivými vědeckými články. Citační rejstříky resp. citační indexy a impakt faktor patří mezi nástroje nauky nazývané scientometrie, která se zabývá studiem vývoje vědy. 2.6.1 Základní východiska vytváření citačních rejstříků 57 Každý autor používá při vzniku článku, příspěvku do sborníku aj. obvykle řadu pramenů. Může na ně navazovat, používat jako argumenty pro podporu svých výsledků apod. Předpokládá se, že je-li práce některého autora citována jiným autorem, znamená to, že je v určité oblasti přínosná a že její autor má tudíž jisté odborné renomé. Také se předpokládá, že je-li citován článek z některého časopisu, má tento časopis určitou odbornou úroveň. Citační rejstříky zaznamenávají rozkvět v 70. letech minulého století a od té doby vzniklo mnoho různě oborově zaměřených citačních rejstříků. Vydáváním citačních rejstříků se zabývá společnost ISI. Jedním z prvních citačních rejstříků byl Science Citation Index SCI, zaměřený na přírodní vědy a techniky. Indexuje cca 6000 časopisů, což představuje 17 mil. záznamů s retrospektivou do roku 1973. Do oblasti sociálních věd (především ekonomie, sociologie, filozofie a práva) směřuje specializovaný rejstřík Social Science Citation Index (SSCI)". Obsahuje přes 3 mil. záznamů a indexuje přes 1700 časopisů. 2.6.2 Model vytváření citačních rejstříků Na základě výběrových kritérií, stanovených společností ISI jsou sledovány nejvýznamnější oborové časopisy. Z nich jsou zpracovávány záznamy článků a v nich citované literatury. Tyto záznamy (vlastního článku - citující i citované) dohromady mezi sebou vytvoří síť odkazů. Na základě citačních analýz článků z těchto časopisů se sestavuje zvláštní index - tzv. Impact Factor. Na základě takovéto "citační sítě" je možné sledovat: 56 WEB of Science a JCR [on line]. 2004 [cit. 2010-04-11]. Dostupný z WWW: <www.veda.cz/article.do?articleid=8886>. 57 Co je impakt faktor a citační index? [on line]. 2008 [cit. 2010-04-11]. Dostupný z WWW: <www.vse.cz/obecne/impactfk.php3>. - 30 -

a) inovační krok ve výzkumu a současné vývojové tendence (které téma je nejvíce rozvíjeno, kam směřuje výzkum) b) nejvýznamnější autority (databáze odpovídá na otázku: Kdo je nejvýznamnějším- tj. nejcitovanějším odborníkem na XY?) c) vliv jednotlivých článků na současný výzkum v oboru (podle počtu odkazů je možné nalézt články, které nejvíce ovlivnily další vědce). d) citovanost jednotlivých autorů/institucí Citační rejstříky jsou tak jedinečným nástrojem pro sledování stavu poznání a výzkumu ve světě. V každém záznamu je přesně popsán zdroj článku, počet článků, které v něm jsou citovány a také počet článků, které citovaly tento článek. Součástí většiny záznamů bývá i anglicky psaný (často autorský) abstrakt. Jedním z nejdůležitějších údajů v záznamu je přesná adresa pracoviště autorů tzv. afilace, na jejímž základě je možné autory kontaktovat. 2.6.3 Citační rejstříky ISI v České republice V České republice jsou v rámci služby Web of Science (WoS) přístupné tři hlavní citační rejstříky - Science Citation Index Expanded, Social Sciences Citation Index a Arts & Humanities Citation Index (A&HCI). Přístup v rámci tzv. "národní licence" je možný díky grantu, jehož nositelem je Akademie věd ČR. Přestože je licence na přístup do Web of Science označován jako "celonárodní", přístup k němu mají pouze členové (spoluřešitelé) konsorcia. Z nich jmenujme alespoň několik vybraných: Akademie věd ČR Moravská zemská knihovna Národní knihovna ČR, Praha Státní technická knihovna, Praha Státní vědecká knihovna v Olomouci (SVKOL) Univerzita Palackého v Olomouci (KUP) Vysoká škola ekonomická v Praze WoS lze využívat dvěma způsoby. Buď jako běžnou databází dokumentů, v níž lze vyhledávat dle autora příspěvku, názvu, tematického zaměření, roku vydaní a dalších parametrů, nebo podle četnosti citovanosti příspěvku, citujícího. 2.6.4 Použití WoS Přístup do Web of Science je, jak již bylo řečeno, prostřednictvím KUP nebo SVKOL. V hlavním menu (viz obrázek 2.6) je umožněno zejména: Search - základní vyhledávání, je umožněno ve třech (v základním zobrazení, další pole lze přidat) vyhledávacích polích zároveň. Dotaz lze jednak specifikovat pomocí booleovských operátorů (následující - 31 -

kapitola) vkládaných mezi jednotlivá vyhledávací pole a dále každému vyhledávacímu poli můžeme nastavit parametr oblast, ve které bude vyhledávání probíhat (téma, autor, název publikace, rok vydání, editor, autorský kolektiv, konference, jazyk, formát dokumentu, poskytovatel dotace a číslo grantu). Cited Reference Search - slouží k hledání autorů a jejich prací, které citují konkrétní práci nebo jiného autora. Je možné zjišťovat i citace vlastních článků (obr. 2.7, 2.8 a 2.9). Advanced Search - pokročilé vyhledávání, je umožněno editovat dotaz pomocí operátorů a polí. Obojí lze vkládat z výběru na pravé straně okna (obr. 2.10) Search History historie vyhledávání, Marked List seznam označených záznamů. Ve spodní části okna pak nastavujeme omezení vyhledávání z hlediska času a prohledávaných oborů databází. Okno základního rozhraní Obrázek 2.6-32 -

Výpis výsledků zadaného dotazu s vybraným záznamem Obrázek 2.7 Detail záznamu (dostupný odkazem View Record viz obr. 2.7) Obrázek 2.8 Na stránce (obr. 2.8) jsou zobrazeny detaily vyhledaného záznamu obsahující autory a spoluatory dokumentu, abstrakt, jazyk, klíčová slova, kontaktní adresy, oborové kategorie a identifikační čísla dokumentu. Zajímavou možností je vytvoření citační mapy grafický výstup zobrazující citující, citované dokumenty (obr. 2.9). Položka Cited by uvádí počet a stručný výpis sledovaných dokumentů, ve kterých je vyhledaný dokument citován (zde 8 citujících.autorů). Položka References odkazuje na bibliografii vztahující se k dokumentu (zde 14 citovaných zdrojů). - 33 -

Vytvořená citační mapa Obrázek 2.9 Okno pokročilého vyhledávání Obrázek 2.10 Výsledky vyhledávání Zde je k dispozici možnost jednotlivé vyhledané záznamy označovat. Označené záznamy se ukládají na stránku Marked List. Z něj je možno (obr. 2.12) záznamy odeslat na mail vytisknout, nebo zpracovat pomocí aplikace ProCite 58, EdNote 59 nebo RefMan 60. 58 ProCite [on line]. [cit. 2010-04-11]. Dostupný z WWW: <www.procite.com/>. 59 Announcing: EndNote X for Windows & Mac OS X Intel Core TM [on line]. [cit. 2010-04-11]. Dostupný z WWW: <www.endnote.com/enxinfo.asp>. 60 Reference Manager [on line]. [cit. 2010-04-11]. Dostupný z WWW: <www.refman.com/>. - 34 -

Výpis výsledků vyhledávání Obrázek 2.11 Výsledky ve výpisu, obzvlášť pokud jich je větší množství, je možno zpřesňovat či třídit. V levém sloupci (obr. 2.11) vybíráme z položek ty vhodné a stisknutím tlačítka Refine upravíme výsledky vyhledávání. Zpracování označených záznamů Obrázek 2.12 SHRNUTÍ KAPITOLY Pod označením databáze se pro vědu a výzkum jsou míněny elektronické informační zdroje, které zpřístupňují informace o tzv. primárních zdrojích. Databáze rozdělujeme na Bibliografická databáze (dokumentografické) přináší základní informace o primárních dokumentech v podobě bibliografického záznamu (autor, název článku, časopis, rok apod.). Databáze s plnými texty, fulltextové databáze poskytují bibliografické záznamy a také některé plné texty. Dále databáze různých odborných - 35 -