VYHLEDÁVÁNÍ INFORMACÍ obecné a specifické otázky Mgr. Věra Pilecká Rešeršní strategie a vyspělé metody inf. podpory vědy konzultace kombinovaného studia 10.11.2006 Mgr. Věra Pilecká doktorandské studium na ÚISK FF UK zaměření: vyhledávání informací, kognitivní aspekty informační vědy, komunikace člověk-počítač (HCI) kontakty: tel.: +420 251 080 380, +420 605 733 813 e-mail: Vera.Pilecka@ff.cuni.cz 10.11.2006 Rešeršní strategie 2
Témata Obecná charakteristika procesu vyhledávání anglická terminologie, důležité otázky IR, přístupy k problematice, chování uživatele Specifické otázky IR analytické vyhledávání x browsing, komerční vyhledávací prostředky x vyhledávání na internetu, koncový a konečný uživatel, vyhledávací strategie 10.11.2006 Rešeršní strategie 3 Vyhledávání informací definice VAŠE NÁVRHY? činnost, jejímž cílem je identifikace relevantních dokumentů nebo informací v informačních zdrojích (např. plnotextové nebo bibliografické databáze); vyhledávání informací probíhá obvykle na základě konkrétního požadavku uživatele za pomoci dotazovacích a selekčních jazyků [TDKIV] procesy, metody a postupy, používané k selektivnímu vyhledání informací ze souboru dat [ODLIS] 10.11.2006 Rešeršní strategie 4
Fáze vyhledávacího procesu Informační zájem Informační potřeba Informační požadavek Informační dotaz Hodnocení výsledků 10.11.2006 Rešeršní strategie 5 Obecné schéma vyhledávání informací [Sklenák, 2001, s. 9] 10.11.2006 Rešeršní strategie 6
Požadavky na ideální informační systém minimalizace doby odezvy mezi zadáním dotazu uživatele a odpovědí systému uchovávání užitečných údajů účelné uživatelské rozhraní souběžná práce více uživatelů s týmiž daty (resp. dokumenty) trvalost uchovávání a minimalizace redundance dat dotazovací jazyk blízký přirozenému jazyku možnost zabezpečeného přístupu co nejjednodušší vyhledávání s minimálními nároky na učení uživatele efektivní přidávání, rušení a aktualizace dat (resp. dokumentů) trvalá dostupnost bez jakýchkoliv časových omezení [Sklenák, 2001] 10.11.2006 Rešeršní strategie 7 Požadavky uživatelů na vyhledávání informací zpětná vazba relevance extrahování informací multimediální vyhledávání efektivní vyhledávání filtrování informací jazyková magie flexibilní a efektivní indexování distribuované vyhledávání [Sklenák, 2001] 10.11.2006 Rešeršní strategie 8
Faktory, ovlivňující IR jedinec, který informace hledá (information seeker) úloha (task) vyhledávací systém obor (domain) nastavení/uspořádání (setting) výsledky vyhledávání (search outcomes) [Marchionini, 1998] 10.11.2006 Rešeršní strategie 9 Složky vyhledávacího systému [Marchionini, 1998, s. 39] 10.11.2006 Rešeršní strategie 10
Anglická terminologie information seeking = hledání informací; zahrnuje analytické vyhledávání (analytical strategy) a intuitivní vyhledávání (browsing strategy) information searching = hledání informací; ekvivalent předchozího termínu information retrieval = vyhledávání informací; je součástí hledání informací online retrieval, online searching, online hunting, information gathering, browsing information seeking and information retrieval (zkr. IS&R) [Ingwersen, Järvelin, 2004] [Papík, 2000] 10.11.2006 Rešeršní strategie 11 Vztahy mezi klíčovými procesy vyhledávání [Marchionini, 1998] 10.11.2006 Rešeršní strategie 12
Důležité otázky IR pojem potenciální informace informace potenciální hodnoty pro příjemce relevance a pertinence relevance = vlastnost vztahu mezi dotazem uživatele a jednotlivým dok. jako prvkem množiny všech nalezených dok.; systémová relevance pertinence = subjektivní kategorie přesnost a úplnost přesnost = jak velká část nalezených dok. je relevantní úplnost = jak velká část relevantních dok. byla vyhledána Jsou navzájem protichůdné 10.11.2006 Rešeršní strategie 13 Přesnost a úplnost ideální poměr mezi P a R reálný funkční vztah mezi P a R [Kowalski, 1997, cit. dle Papík, 2001] 10.11.2006 Rešeršní strategie 14
Chování uživatele při vyhledávání informací informační chování lidské chování ve vztahu ke zdrojům a kanálům informací chování při hledání informací účelné hledání informací, vzniká jako následek potřeby splnit určitý úkol chování při vyhledávání informací mikroúroveň chování zapojená U při interakci s inf. systémy všech druhů chování při využití informací začleňování nalezené informace do poznatkového fondu (znalostní báze) [Wilson, 2000] 10.11.2006 Rešeršní strategie 15 Hierarchie způsobů chování při inf. aktivitách dle Wilsona [Škrna, 2002] 10.11.2006 Rešeršní strategie 16
SPECIFICKÉ OTÁZKY IR základní strategie vyhledávání [Marchionini, 1998] analytické vyhledávání browsing použité vyhledávací prostředky komerční služby vyhledávací služby na internetu generace vyhledávání (dávkové, interaktivní dialogové, dynamické) dostupnost inf. zdroje (přímo veřejný charakter, zprostředkovaně internet jako metoda přístupu, komerční) 10.11.2006 Rešeršní strategie 17 Analytické strategie systematické strategie, zaměřené na cíl strategie a taktiky profesionálních zprostředkovatelů smyslem maximalizovat efektivitu vyhl. a minimalizovat náklady na online vyhledávání důkladné poznání systému a jeho možností (dotazovacího jazyka, ceny za jednotl. služby, ovládání pokročilých možností) 10.11.2006 Rešeršní strategie 18
Browsing (intuitivní vyhledávání) neformální strategie přizpůsobivá, závislá na inf. prostředí přirozený a efektivní přístup (koordinuje fyzické, emocionální, a kognitivní zdroje člověka) zahrnuje prohlížení, pozorování, navigování a monitorování 10.11.2006 Rešeršní strategie 19 Komerční vyhledávací služby práce s profesionálními informačními zdroji DBC práce se zdroji shromážděnými do jednoho místa (el. prostoru) nutné navázat smluvní vztahy, platby za služby (předplatné, pay-as-you-go) nyní i pro neprofesionály (web rozhraní), bez znalosti dotaz. jazyka základní, pokročilé vyhledávání různé druhy DB dle druhu dokumentu dle druhu obsažených údajů 10.11.2006 Rešeršní strategie 20
Koncový x konečný uživatel koncový uživatel pracuje se systémem samostatně, bez zprostředkovatele získané informace dále zpracovává a využívá pro své výzkumy nebo jiné činnosti inf. specialista, který pracuje se systémem za účelem obsluhy konečného U konečný (finální) uživatel formuluje informační požadavek nezatěžuje se problematikou inf. systému a způsobu vedení dialogu zpracování požadavku provádí inf. pracovník samostatně (konečný U může a nemusí být přítomen) 10.11.2006 Rešeršní strategie 21 Vyhledávání na internetu vyhledávací služby startovní body pro většinu U patří mezi nejnavštěvovanější servery internetu kategorie vyhledávání browsing (listování stránkami www) starting points (startovní body) search engines (vyhledávací nástroje) základní skupiny vyhledávací stroje předmětové katalogy pracovní cyklus formulace dotazu; realizace vyhledávání; obdržení seznamu výsledků; prohlédnutí výsledků, výběr dokumentu pro download; download dokumentu; hodnocení dokumentu [Sklenák a kol.,2001] 10.11.2006 Rešeršní strategie 22
Vyhledávací služby vyhledávací stroje (search engines) např. Altavista indexují slova nebo termíny, které se vyskytují v dokumentech na www problém: velké množství vrácených výsledků předmětové katalogy např. Yahoo klasifikují dokumenty i celé servery podle předem dané taxonomie nebo předmětové klasifikace vhodné použít při vyhl. dobře klasifikovatelných inf. problémy: zda je kategorie vytvořena, malá úroveň pokrytí rozdíly mizí vytváření portálů -> integrace, usnadnění přístupu U k základním informačním službám internetu 10.11.2006 Rešeršní strategie 23 Vyhledávací strategie obecné vyhledávání - pokud ví uživatel o tématu velmi málo specifické vyhledávání uživatel naopak zná téma velmi dobře inkrementální vyhledávání vyhledávání po krocích řetězcové vyhledávání spočívá v nalezení více klíčových slov najednou vyhledej-a-skoč rychlá dvoukroková vyhledávací technika kategoriální vyhledávání konvenční prohlížení (browsing) k tematické oblasti vyhledej-a-seřaď metoda nalezení nejvhodnějšího nejdříve kombinace různých metod vyhledávání [Sklenák a kol., 2001] 10.11.2006 Rešeršní strategie 24
Srovnání vyhledávacích strategií 10.11.2006 Rešeršní strategie 25 [Sklenák a kol., 2001, s. 314] Doporučená literatura k prostudování MAKULOVÁ, Soňa. Vyhĺadávanie informácií v internete : Problémy, východiská, postupy. 1. vyd. Bratislava : EL&T, 2002.376 s. ISBN 80-88812-16-X. PAPÍK, Richard. Vyhledávání informací I. Umění či věda? Národní knihovna. 2001, roč. 12, č. 1, s. 18-25. ISSN 1214-0678. PAPÍK, Richard. Vyhledávání informací II. Uživatelské rozhraní a vlivy oboru human-computer interaction. Národní knihovna. 2001, roč. 12, č. 2, s. 81-90. ISSN 1214-0678. PAPÍK, Richard. Vyhledávání informací III. Dialogové služby světových databázových center. Národní knihovna. 2002, roč. 13, č. 1, s. 20-30. ISSN 1214-0678. 10.11.2006 Rešeršní strategie 26
Doporučená literatura k prostudování PILECKÁ, Věra. Kognitivní aspekty procesu vyhledávání informací. Ikaros [online]. 2006, roč. 10, č. 9 [cit. 2006-11-08]. Dostupný na World Wide Web: <http://www.ikaros.cz/node/3592>. URN-NBN:cz-ik3592. ISSN 1212-5075. (popř. diplomová práce uložená v ISDP) SKLENÁK, Vilém a kol. Data, informace, znalosti a Internet. Vyd. 1. V Praze : C.H. Beck, 2001. xvii, 507 s. (C.H. Beck pro praxi). ISBN 80-7179-409-0. 10.11.2006 Rešeršní strategie 27 Použité zdroje (1) INGWERSEN, Peter. Information Retrieval Interaction. London : Taylor Graham, 1992. x, 246 s. ISBN 0-947568-54-9. Dostupné také z WWW: <http://www.db.dkipi/iri/>. INGWERSEN, Peter; JÄRVELIN, Kalervo. Information Retrieval in Context. In Information Retrieval in Context, SIGIR 2004 IRiX Workshop, 29th July 2004, Sheffield, UK [online]. c2004 [cit. 2005-10- 18]. Dostupné z www: <http://ir.dcs.gla.ac.uk/context>. MAKULOVÁ, Soňa. Vyhĺadávanie informácií v internete : Problémy, východiská, postupy. 1. vyd. Bratislava : EL&T, 2002.376 s. ISBN 80-88812-16-X. MARCHIONINI, Gary. Information seeking in electronic environments. New York, Cambridge : University Press. 1998, xi, 224 s. ISBN 0-521-58674-7. 10.11.2006 Rešeršní strategie 28
Použité zdroje (2) PAPÍK, Richard. Dialogové vyhledávání a služby v kontextu člověk počítač. Praha, 2000. 117 s. + 2 příl. Dizertační práce. Univerzita Karlova v Praze, Filozofická fakulta, Ústav informačních studií a knihovnictví 2000. Školitel Marie Königová, oponenti Vladimír Smetáček, Rudolf Vlasák. PAPÍK, Richard. Vyhledávání informací I. Umění či věda? Národní knihovna. 2001, roč. 12, č. 1, s. 18-25. ISSN 1214-0678. REITZ, Joan M. ODLIS : Online Dictionary of Library and Information Science. Westport (CT) : Libraries Unlimited, 2004-04-30 [cit. 2005-11-06]. 800 s. Dostupný také online z WWW: <http://lu.com/odlis/>. ISBN 1591580757. SKLENÁK, Vilém. Vyhledávání informací v internetu. In Informační studia a knihovnictví v elektronických textech I. : Interaktivní modulární výukový systém na podporu informačního a knihovnického vzdělávání [CD-ROM]. 1. vyd. Praha : Ústav informačních studií a knihovnictví FF UK, 2001 [cit. 2006-03-12]. 10.11.2006 Rešeršní strategie 29 Použité zdroje (3) SKLENÁK, Vilém a kol. Data, informace, znalosti a Internet. Vyd. 1. V Praze : C.H. Beck, 2001. xvii, 507 s. (C.H. Beck pro praxi). ISBN 80-7179-409-0. ŠKRNA, Jindřich. Interaktivní vyhledávání informací. Národní knihovna, 2002, roč. 13, č. 1, s. 7 19. ISSN 1214-0678. TDKIV -Česká terminologická databáze z oblasti knihovnictví a informační vědy (báze KTD) [online]. Praha : Národní knihovna České republiky, Odbor knihovnictví, c2002- [cit. 2005-11-06]. Dostupné z WWW: <http://www.nkp.cz/o_knihovnach/slovnik/index.htm>. WILSON, T. D. Human information behavior. Informing science, 2000, vol. 3, no. 2, s. 49-55. Special Issue on Information Science Research. Dostupný také z WWW: <http://inform.nu/article/vol3/v3n2p49-56.pdf>. ISSN 1547-9684. 10.11.2006 Rešeršní strategie 30