Věcné zpracování a zpřístupnění informačních zdrojů Marie Balíková Národní knihovna ČR



Podobné dokumenty
Pracovní skupina pro věcné zpracování

víceslovná lexikální jednotka, jejíž základ tvoří substantivum, a to

12. konference Archivy, knihovny, muzea v digitálním světě

Věcné zpracování. Souborný katalog - staré tisky, duben

Pracovní skupina pro věcné zpracování

Workshop k terminologickým otázkám organizace znalostí Motivace a hypotézy projektu. Cíl projektu NAKI DF13P01OVV013

Obohacování bibliografických záznamů o věcné selekční prvky postup NKČR

PROJEKT INTERPI INFORUM Marie Balíková, Miroslav Kunt, Jana Šubová, Nadežda Andrejčíková

Oborové a obecné termíny v univerzálních a oborových databázích

Věcné zpracování, věcné autority

Metody tvorby ontologií a sémantický web. Martin Malčík, Rostislav Miarka

Znalostní báze pro obor organizace informací a znalostí

Ontologie. Otakar Trunda

ZPRÁVA O ČINNOSTI NÁRODNÍ KNIHOVNY V PROJEKTU INTERPI ZA ROK 2014

Znalostní báze pro obor organizace informací a znalostí

Projekt INTERPI. Archivy, knihovny, muzea v digitálním světě Your contact information

2 Lexikální jednotka. 2.1 Obecné kategorie

Výměnný formát XML DTM DMVS PK

Projekt INTERPI. Jana Šubová Cosmotron Bohemia, s.r.o. Marie Balíková Národní knihovna ČR

Jan Pokorný MULTIDATA Praha PRIMO. od čtenářského OPAC ke čtenářskému portálu

K sofistikovaným možnostem využívání starých map digitálními metodami

ZPRÁVA O ČINNOSTI NÁRODNÍ KNIHOVNY V PROJEKTU INTERPI ZA ROK 2013

Vyhledávání na portálu Knihovny.cz

Knihovny typy a počty. Paměťové instituce 2. Muzejní knihovny. Galerijní knihovny

Národní autority a. jejich úloha v současném (nejen)knihovnickém světě. National Authority Files/ Names. Konference Rodiny. Rody.

Národní autority v prostředí muzeí a galerií

Portál ebadatelna Zlínského kraje a zpřístupnění map. Prezentace historických map z fondu paměťových institucí Zlínského kraje

Virtuální mapová sbírka Chartae-Antiquae.cz. důležitý výsledek projektu Kartografické zdroje jako kulturní dědictví

České internetové medicínské zdroje v Národní lékařské knihovně

Věcné zpracování dokumentů Předmětové pořádání informací. Rekvalifikační kurz Školitel: Marcela Mátlová Tel.:

Přístupové body v systému DigiArchiv. Ing. Martin Hankovec, Státní oblastní archiv v Třeboni

Kurz pro studenty oboru Informační studia a knihovnictví 5. Informační architektura

Rešerše....hledáme dokumenty a informace. Martin Krčál

Knihovna váš partner. aneb Mr. Bean v knihovně

Elektronické inf. zdroje

Informační fondy II. předmětové pořádání. Předmětové selekční jazyky

PROJEKT INTERPI V ROCE 2015

Význam konceptuálních modelů pro zpřístupnění kulturního, přírodního a industriálního dědictví. Marie Balíková, Nadežda Andrejčíková, Jana Šubová

Bibliografické databáze umění vyhledávat v záplavě pramenů relevantní informace

Popis a zpřístupnění záznamů performativního umění - výzvy a možná řešení. Bohuš Získal, CESNET / NFA

Pro malé i obří projekty

Mapování archeologické terminologie : archeologií a knihovnictvím

Jednání pracovní skupiny pro věcné zpracování. Prosinec 2013

VIZE INFORMATIKY V PRAZE

Seminář pro vedoucí knihoven a SVI ústavů AV ČR. Aleph

Národní autority v prostředí muzeí a galerií interoperabilita s NK ČR

Tezaurus Medical Subject Headings

Digitalizace a zveřejnění sbírkových fondů paměťových institucí Zlínského kraje

Předmětové pořádání informací

Vyhledávání v souborných katalozích

Souborný katalog ČR pro veřejné knihovny Veřejné knihovny pro Souborný katalog ČR

ROZHRANÍ PRO ZPŘÍSTUPNĚNÍ A PREZENTACI ZNALOSTNÍ DATABÁZE INTERPI UŽIVATELSKÁ PŘÍRUČKA

Silný portál. Jindřiška Pospíšilová. Pracovní skupina pro silný portál. Národní knihovna ČR

Jazyk, slovo, slovní zásoba a slovníky. Tomáš Káňa Masarykova univerzita v Brně Katedra německého jazyka a literatury

Internet zdroj informací

6 Organizační aspekty vypracování tezauru (s přihlédnutím k tomu, jak jsem postupoval já)

Novinky ve věcném zpracování Seminář paměťových knihoven

ZPRÁVA O ČINNOSTI NÁRODNÍ KNIHOVNY V PROJEKTU INTERPI ZA ROK 2015

Od Integrovaného informačního systému památkové péče k Europeaně. Ing. Alena Šťovíčková Národní památkový ústav

Střední odborná škola Luhačovice. Témata pro ústní maturitní zkoušku z odborných předmětů

METODIKA MAPOVÁNÍ A HARMONIZACE REJSTŘÍKŮ, ČÍSELNÍKŮ A ŘÍZENÝCH SLOVNÍKŮ APLIKOVANÝCH V PAMĚŤOVÝCH INSTITUCÍCH CERTIFIKOVANÁ METODIKA

Příloha č. 1. Podklady pro aktualizace Konspektového schématu 2016

PERSONÁLNÍ AUTORITY UŽITEČNÁ POMŮCKA NEJEN PRO KNIHOVNÍKY David Piňos, Lenka Maixnerová, Michal Záviška

PROJEKT INTERPI V ROCE 2014

Koncepce rozvoje knihoven a muzejní knihovny

Nové geovědní informační služby:

ZPRÁVA O VÝSLEDCÍCH ŘEŠENÍ PROJEKTU V ROCE 2013

Nové nástroje pro staré mapy

Informační zdroje v síti ČVUT

Digitální knihovny v České republice

Okruhy ke SZZK nmgr. studium knihovnické zaměření

local content in a Europeana cloud

Kartotéky Augusta Sedláčka

Zásady pro vytváření Polytematického strukturovaného hesláře (PSH)

Management informačních fondů

Bibliografické a rešeršní služby

ZPŘÍSTUPNĚNÍ A ARCHIVACE PLNÝCH

Dotační zdroje pro paměťové instituce Digitalizace , Praha

Témata k závěrečným bakalářským zkouškám 2019

Primo Central. Martin Vojnar MULTIDATA Praha s.r.o.

HARMONIZACE VĚCNÉ KATALOGIZACE V ČESKU: REALITA

The bridge to knowledge 28/05/09

Aplikace s odvozováním nad ontologiemi

Požadavky na systém pro automatizaci muzejní knihovny

PhDr.Helena BOUZKOVÁ PhDr.Eva LESENKOVÁ NÁRODNÍ LÉKAŘSKÁ KNIHOVNA, PRAHA. ČLS JEP Společnost sociálního lékařství a řízení péče o zdraví

VY_32_INOVACE_IKTO2_0260 PCH

VĚCNÝ POPIS DOKUMENTŮ (VĚCNÁ KATALOGIZACE) Mgr. Dagmar Smékalová

Praktický průvodce Informačním systémem Úřadu vlády České republiky,

Soubory národních jmenných autorit

Pravidla pro správu a aktualizaci Polytematického strukturovaného hesláře (PSH)

ANL+ Veronika Ševčíková Národní knihovna ČR

Regionální funkce knihoven Mgr. Adéla Dilhofová

Podpora zkvalitnění vyhledávání informací. SeminářInformačnívzděláváníuživatelůve veřejných knihovnách Hradec Králové

PRAKTICKÉ VYUŽITÍ METODY KONSPEKTU

Jak pracuje internetový vyhledávač

Tam, kde anglické příklady neodpovídají českému jazykovému systému, se český překlad neuvádí.

NTK Discovery. Od katalogu k centralizovanému vyhledávání

Knihovní fond, muzejní sbírka a archivní fond z pohledu české legislativy

Dokumentační služba projektu MediGrid

Logika pro sémantický web

Transkript:

Věcné zpracování a zpřístupnění informačních zdrojů Marie Balíková Národní knihovna ČR 1

Obsah Úvodní informace Věcné zpřístupnění Charakteristika Potřeby uživatelů Kvalitní popis Efektivní zpřístupnění Nástroje věcného zpřístupnění Řízené slovníky Soubor věcných autorit» Systém MDT Konspektové schéma Aplikace nástrojů věcného zpřístupnění Tematická mapa fondů NK ČR JIB + Oborové brány KIV, MUS, TECH, ART Tematické autority online Soubor věcných autorit - paměťové instituce, sémantický web Projekt INTERPI 2

Úvod Faktory ovlivňující věcné zpřístupnění v muzejních a galerijních knihovnách Pozice v mateřské instituci Samostatné oddělení Součást jiných útvarů podpůrný charakter Složení fondů Odborná literatura Regionální literatura Vzácné fondy - historické dokumenty Dostupnost, otevřenost Uživatelé Badatelé Běžní uživatelé Standardy 50% - vytváří údaje podle pravidel AACR a řídí se národními autoritami 3

Uživatelské potřeby Sledování potřeb jednotlivých komunit uživatelů Autorů publikujících na webu, čtenářů veřejných knihoven, vysokoškolské obce, nakladatelů a vydavatelů, informačních pracovníků, katalogizátorů, badatelů, uživatelů paměťových institucí Otevřenost vůči novým trendům Schopnost reagovat a nabídnout nová řešení v problematických oblastech, např. Volba vhodných termínů soustavné doplňování variantních forem a jejich plná integrace do procesu vyhledávání Obohacení BIB záznamů o náhledy obálek - čtenáři veřejných knihoven sekundární obsahy studenti, badatelé 4

Cíl: kvalitní popis a zpřístupnění informačních zdrojů Efektivní a kvalitní zpřístupnění informačních zdrojů, jejich částí a jednotlivých informací v nich obsažených standardním způsobem Důraz na zpřístupnění informací prostřednictvím obsahových charakteristik Úspěšné vyhledávání jednoznačnost selekčních termínů Obohacení knihovních katalogů/bib záznamů o další informace - informace v souvislostech Obálky Obsahy Ukázka 5

Efektivní vyhledávání Úspěšné vyhledávání jednoznačnost selekčních termínů Respektování požadavků uživatele FRBR Vyhledání/nalezení entity odpovídajícím požadavkům uživatele Identifikace entity odlišení dvou stejně pojmenovaných entit Výběr entity odpovídající požadavkům uživatele Získání entity přístup k ní Navigace BIB AUT záznam Rešeršní strategie (strategie hledání) Metoda vyhledávání Metoda prohlížení 6

Co požadujeme od uživatele Rešeršní strategie efektivní způsob, jak získat informace o relevantních dokumentech dokumenty samotné přesná formulace dotazu analýza tématu znalost vyhledávacích služeb 7

Co požaduje uživatel Prostředí, ve kterém vyhledává na www Intuitivní, jednoduché, interaktivní prostředí a vyhledávání Zápis dotazu v jedné řádce bez určení druhu údaje Prohledávání informačních zdrojů bez ohledu na typ dokumentu Řazení výsledků podle relevance Fasetovou navigaci umožňující další specifikaci dotazu 8

Řešení Kvalitní popis Obsahová analýza dokumentu!!! (ne popis podle názvu, je velmi zavádějící) Řízená indexace výběr indexačních termínů z řízených slovníků/souborů Rozšíření informací publikovaných v AUT záznamech Propojení informací s kvalitními referenčními zdroji, jejich zapojení do procesu vyhledávání Databáze autorit, oborové řízené slovníky Konspektové schéma Wikipedie občas problematické 9

Integrace variantních forem do procesu vyhledávání 10

Ošidnost vyhledávání založeného na porovnání textu 11

Změna koncepce věcného zpracování (1998) Respektování formy a celistvosti termínu odstranění priority substantiva, tj. substantivní inverze, nerozkládání víceslovných lexikálních jednotek na jednotlivé komponenty Zavedení minimální syntaxe v doposud používaných rozsáhlých řetězcích předmětových hesel Zahájení tvorby souboru věcných autorit (zpřístupněn v r. 2000) Součástí souboru autorit jsou jednotlivé termíny, ne řetězce předmětových hesel Podpora kooperace s knihovnami se specializovaným fondem, které preferují používání izolovaných lexikálních jednotek - deskriptorů 12

Soubor věcných autorit 22003 1682 Téma Geo Forma 34902 řízený a měnitelný abecedně uspořádaný soubor věcných selekčních údajů lexikálních jednotek, mezi nimiž jsou vyjádřeny základní sémantické vztahy (ekvivalence, hierarchie, asociace) a který je určen ke zpracování a vyhledávání dokumentů a informací v nich obsažených 13

Struktura záznamu věcné autority 14

Funkce MDT 15

Tvar lexikálních jednotek substantivní tvar Příklady jednoslovné substantivum víceslovná lexikální jednotka, jejíž základ tvoří substantivum adjektivní spojení předložková vazba komplexní termín strojově orientované jazyky střední odborné školy rizikový management ženy v politice rodiče a děti malíři a řezbáři -nelze považovat za obecně platný komplexní termín, řeší pouze problém zpřístupnění konkrétního dokumentu 16

Tvar lexikálních jednotek dodržuje se přirozený slovosled dodržuje se pravopisná norma transliterace se řídí platnými normami singulár a plurál počitatelná v plurálu, např. prezidenti, knihy, řeky. abstrakta, počitatelná použitá jako abstrakta, názvy vědních oborů v singuláru, např. láska, průmysl, fyzika, malířství cizojazyčné termíny se uvádějí neexistuje-li adekvátní překlad, např. benchmarking je-li termín běžně používán v daném vědním oboru, např. paleobotanika zkratky preference rozepsané formy zkratka se odkáže 17

Používat správnou pravopisnou formu Nespisovná forma deskriptoru/selekčního termínu 18

Význam lexikálních jednotek Problémové okruhy, které je nutné řešit Synonymie jev, že v jazyce různá slova mají stejný nebo podobný význam, synonymita Synonyma (slova souznačná), jsou slova nebo slovní spojení se vzájemně stejným nebo podobným významem, která lze za určitých okolností zaměňovat Homonymie druh mnohovýznamovosti jazykových jednotek; vztah založený na totožnosti formy Homonyma- slovo nebo jiná jazyková jednotka, popř. její tvar (morfém, gramatický tvar, slovo, slovní spojení, věta), znějící nebo psaná stejně, ale různého významu 19

Význam lexikálních jednotek Problém synonymie se řeší uvedením variantní formy jako odkaz viz, např. preferovaný termín zvolíme terapie pohádkou a termín pohádkoterapie odkážeme homonymie, polysémie různé významy homonym se důsledně rozlišují specifikací termínu, např. operace binární operace, bankovní operace, bojové operace, operace srdce uvedením kvalifikátoru (relátoru) v závorce, který je součástí deskriptoru, např. morfologie morfologie (biologie) morfologie (lingvistika) 20

Výběr lexikálních jednotek v univerzálním systému jednoznačnost soulad mezi obsahem pojmu, obsahem termínu a obsahem lexikální jednotky formální rozklad termínu raději nepoužívat psychologie osobnosti//osobnost+psychologie Proč? získání dokumentů, které neodpovídají dotazu uživatele v univerzálním souboru se vyskytují častěji univerzálnost, rozsáhlost problematiky výrazy obecného významu hodnotící adjektiva 21

Významové vztahy lexikálních jednotek ekvivalence synonymie hierarchie mezi jednotkami téhož sémantického okruhu podřazenost nadřazenost asociace podnikání NT drobné podnikání antivirové systémy RT počítačové viry 22

Je potřeba věnovat pozornost Zachovávat jednotný postup důsledně dodržovat přirozený pořádek slov (ne substantivní inverze ano i ne) Nepoužívat nejednoznačné termíny Nepoužívat lokální termíny Počítat s ošidností propojení na volně dostupné info zdroje Zapisovat selekční termíny do příslušných polí 23

Substantivní inverze: není dodržen jednotný postup 24

Nejednoznačné termíny 25

Jednoznačně identifikovat termíny 26

Lokální termín 27

Kvalifikátor u GEO termínu Ostrava 28

Propojení na veřejně dostupné zdroje 29

Propojení na veřejně dostupné zdroje 30

Relevantní informace? 31

Zápis selekčních termínů do příslušných polí 32

Ukázka věcného popisu 1 33

Ukázka věcného popisu 2 34

Ukázka věcného popisu 3 35

Ukázka věcného popisu 4 36

Ukázka věcného popisu 5 37

Konspektové schéma Původní účel Struktura tematického popisu knihovních fondů aplikace při popisu tištěných dokumentů Selekční jazyk aplikace při zpřístupnění heterogenních zdrojů Tematický rozcestník JIB, oborové brány Tematická mapa fondů Vyhledávání 38

39

Tematická mapa fondů - ukázka aplikace 1 40

Tematická mapa fondů - ukázka aplikace 2 41

Tematická mapa fondů - ukázka aplikace 3 http://toc.nkp.cz/nkc/200705/contents/nkc20071711337_1.pdf 42

43

Schéma Konspektu - tematický rozcestník: Jednotná informační brána oborové brány KIV, MUS 44

Druhá úroveň Konspektového schématu - prohlížení KIV PK 12 - Knihovnictví, informatika, všeobecné, referenční literatura 45

Druhá úroveň Konspektového schématu - prohlížení MUS PK 9 Hudba 46

Portál určený katalogizátorům - informace o autoritních termínech používaných ve zvolené doméně 47

Autoritní termíny používané v doménách psychologie, sociologie 48

Věcné autority v paměťových institucích Je potřeba Rozšířit informace uváděné v AUT záznamech Propojit jednotlivé typy informací Důsledně aplikovat autority při zpřístupnění informačních zdrojů v paměťových institucích 49

Geografické autority integrace potřebných informací 50

Obohacení geografických termínů o souřadnice, zobrazení dané lokality na mapě http://aleph.nkp.cz/f/?func=direct&doc_number=000130872&local_base=aut 51

Propojení GEO autorit s tematickými a online zdroji 52

Muzea ukázka popisu a zpřístupnění Podsbírka: Militária Vlastník: Pardubický kraj Správce: RML Území: Litomyšl, Čechy. Období: převážně 19.-20. stol. Předměty: popis, volný text **************************** Popis individuálního objektu Předmět: puška lovecká Datace: 2. čtvrtina 19. stol. Autor: Suchy Franz Místo vzniku: Benátky nad Jizerou Inv.č.: 168-45 53

Popis a zpřístupnění archivní kulturní památky 54

Věcné autority a sémantický web cíl sémantického webu: informace interpretovatelné a zpracovatelné softwarovými agenty základ sémantického webu: ontologie -"explicitní specifikace konceptualizace tj. specifikace systému pojmů modelující určitou část světa ontologie: podpora porozumění mezi lidmi, komunikace mezi počítačovými systémy a tvorby znalostně orientovaných systémů využití existujících zdrojů při tvorbě ontologií tezaury, řízené slovníky (mnohdy nekonzistentní, úprava nutná) společný rys ontologií a tezaurů : pokrytí určité předmětné oblasti a definování vztahů v případě ontologií mezi koncepty, v případě tezaurů mezi jednotlivými termíny 55

Tezaury, ontologie Tezaury ústřední role termínů, které již nejsou dále (formálně) definovány vztahy v tezaurech: taxonomický charakter (vymezení vztahu obecnějšího a speciálnějšího termínu) vyjádřena synonymie, meronymie (vztah termínů označujících celek a jeho část) a další vztahy obecného charakteru Ontologie koncepty reprezentovány ve formě nezávislé na termínech přirozeného jazyka vztahy - vyjádřeny explicitně termíny přirozeného jazyka používány k pojmenování konceptů ontologie musí zahrnovat mapování mezi termíny a koncepty. rozdíl je patrný především v procesu vyhledávání 56

Ontologie obsahuje strojově interpretovatelnou definici konceptu podporuje terminologické odvozování dotaz je analyzován z hlediska významu použitých termínů přesnější mapování vzhledem k informačním zdrojům pomocí ontologie lze např. odvodit, že jeden koncept je speciálním případem jiného, a to díky porovnání jejich logických definic je-li koncept B speciálním případem konceptu A, pak může být automaticky klasifikován jako podřízený konceptu A. To dává širší možnosti pro zpracování dotazu a vyhledávání Sklenák, Svátek 57

Soubor věcných autorit platforma pro tvorbu ontologie mezi tematickými termíny - lze definovat apriorní (paradigmatické) vztahy příbuznost mezi tematickými termíny je implicitní a vyplývá z určitého společného a obecně sdíleného referenčního rámce vztahy jsou obecně uznávány, jsou nezávislé na dokumentu a mohou být ověřeny ve standardních příručkách, např. slovnících a encyklopediích z pohledu potenciálního strojového zpracování dat jsou autoritní termíny a vztahy mezi nimi nejednoznačné jejich sémantika je implicitní, případně explicitní, ale není automaticky zpracovatelná (není možné ji označit za formální sémantiku pro strojové zpracování) sémantika termínů a stávajících paradigmatických vztahů musí být upravena do podoby zpracovatelné softwarovými agenty 58

Interoperabilita v paměťových institucích (INTERPI) Program aplikovaného výzkumu a vývoje národní a kulturní identity (NAKI) konsorciální pětiletý projekt Národní knihovny ČR a Národního archivu digitalizované fondy a sbírky paměťových institucí (archivů, galerií, knihoven, muzeí, památkových ústavů a dalších) tvoří jádro národního kulturního, industriálního a přírodního dědictví zásadním úkolem, který je nutné řešit nyní v období mohutné digitalizace fondů a sbírek paměťových institucí, je uživatelsky vlídné zpřístupnění jednotlivých informačních objektů obsažených v těchto fondech a sbírkách i celých jejich souborů 59

Industriální památky 60 [STOKLASOVÁ]

Cíl projektu připravit vědeckou a technologickou infrastrukturu pro podporu zpracování, sdílení a využívání kulturního obsahu ve formě metadatových informací o informačních objektech zpřístupňovaných v paměťových institucích základním předpokladem identifikace informačních objektů jsou věcné i jmenné autority v rozsahu vymezeném pro potřeby knihoven funkce autorit jako unifikovaných selekčních prvků bude však doplněna o související informační objekty a jejich informační a dokumentační hodnota rozšířena tak, aby splňovaly nejenom požadavky na ně kladené z pohledu jednotlivých typů paměťových institucí, ale aby vytvářely mnohem širší základ pro sémantickou interoperabilitu kulturního obsahu všech paměťových institucí 61

Závěr Kvalitně koncipované soubory autoritních termínů jsou přínosné i v současném informačním prostředí Lze je po nezbytných úpravách využít i v rámci sémantického webu Mohou sehrát významnou roli při tvorbě nástrojů pro uživatelsky vstřícné zpřístupnění národního kulturního dědictví V příspěvku jsou zveřejněny informace o projektu MK ČR DF11P01OVV023 Interoperabilita v paměťových institucích (INTERPI), který byl schválen v rámci Programu aplikovaného výzkumu a vývoje národní a kulturní identity (NAKI) 62

Děkuji za pozornost