DATA, INFORMACE, ZNALOSTI A INTERNET

Rozměr: px
Začít zobrazení ze stránky:

Download "DATA, INFORMACE, ZNALOSTI A INTERNET"

Transkript

1 SKLENÁK Vilém DATA, INFORMACE, ZNALOSTI A INTERNET Obsah O autorech... V Předmluva... VII 1. Data, informace, znalosti? Co jsou data, informace a znalosti Data Informace Znalosti Informační gramotnost Z historie Informační přehlcení? Formy informací Informace a komunikace Gramotnost a informační gramotnost Informační gramotnost a Internet Kolik je informací?...10 Literatura ke kapitole I. Práce s informacemi Informační proces Základní pojmy Informační zdroje Typy a charakteristiky informačních zdrojů Knihovny Specializované firmy Vyhledávání dokumentů Popis dokumentů Charakteristika obsahu dokumentů Automatická charakteristika obsahu Boolovský model Princip boolovského modelu Úplnost a přesnost v boolovském modelu Š

2 2.7.3 Zvyšování přesnosti a úpinosti Invertovaný soubor Další přístupy k vyhledávání textových dokumentů Rozšiřování boolovského modelu Topic...54 Literatura ke kapitole Zpracování specifických jevů přirozeného jazyka v automatizovaných informačních systémech Automatizace indexování a vyhledávání textových informací Překonání jazykových bariér Standardizace textů Komunikace s počítačem v přirozeném jazyce...77 Literatura ke kapitole II. Práce se znalostmi Práce se znalostmi Expertní systémy, znalostní systémy Zrození znalostního inženýrství...93 DENDRAL Charakteristické rysy Struktura Typy expertních úloh Diagnostické úlohy Generativní úlohy Některé slavné systémy Mycin TEIRESIAS PROSPECTOR R1/XCON Volba aplikační oblasti Znalosti a jejich reprezentace Pravidla Odvozování OPS Odvozování v diagnostických expertních systémech první generace Zpětné řetězení Přímé řetězení š

3 4.3.3 Agenda AM Tabule Hearsay Práce s neurčitostí Algebraické pojetí Získávání znalostí od experta Problém získávání znalostí Spolupráce s expertem a příprava na ni Verbální techniky elicitace znalostí Neverbální techniky elicitace znalostí Modelování znalostí Od transferu znalostí k modelování Modely řešení problémů Znalostní ontologie Literatura ke kapitole Od dat ke znalostem Základní rysy KDD Metody získávání znalostí Symbolické metody GUHA KEX...1G Případové usuzování CBR Express Neuronové sítě Automatické získávání znalostí z textů Základní problémy Literatura ke kapitole III. Informace a Internet Internet!? Historické ohlédnutí Co je tedy Internet? Informační služby Internetu Telnet Gopher /Š

4 6.4 Z historie vyhledávání informací v prostředí Internetu Literatura ke kapitole World Wide Web základ přístupu k informacím v Internetu Základní charakteristika Z historie Klient/server Možnosti využití Stavební kameny Hypertext Jazyk HTML Základní princip HTML a SGML Další vývoj URL (Uniform Resource Locator) URL pro FTP URL pro Telnet URL pro URL pro Gopher URL pro HTTP URL pro Usenet News Protokol HTTP Klienti služby Klienti Klient WWW jako hypertextový prohlížeč Grafické prohlížeče Záložky Účel a princip Záložky nebo kopie? Organizování záložek Zastarávání záložek Tvorba dokumentů pro službu Literatura ke kapitole Informace a Internet Úspěšnost vyhledávání aneb co jsou relevance, přesnost a úplnost Internet jako zdroj informací Internet jako seskupení počítačů Š

5 8.2.2 Internet jako soubor programů Internet jako soubor zdrojů Internet jako knihovna Co je správné? Je Internet ideálním prostředím pro vyhledávání informací? Literatura ke kapitole Vyhledávání informací v Internetu jako problém Některá hledání jsou neúspěšná Vyhledávání v Internetu jako umění svého druhu Velikost Internetu Velikost prostoru Jak lze určit velikost prostoru Charakteristika typického uživatele WWW dokumenty a vyhledávání Velikost WWW prostoru? Interpretace Poznámky k veřejné indexovatelnosti v odhadech Poznámky k časové platnosti odhadů Poznámky k odhadování, přesnosti a nepřesnosti Má to smysl? Základní metody vyhledávání v Internetu a příčiny problémů Status Internetu a zklamání uživatele při vyhledávání Vyhledávací stroje a předmětové katalogy Jak se vyhledává a co zabírá čas při vyhledávání Vyhledávací služby versus tradiční on-line služby Literatura ke kapitole Předmětové katalogy Principy fungování Hledisko uživatele Hledisko údržby katalogu Výhody a nevýhody předmětových katalogů Vývoj a trendy předmětových katalogů Vyhledávání Portály Příklady předmětových katalogů Literatura ke kapitole Š

6 11. Vyhledávací stroje Jde o hity Principy fungování Robot Strategie procházení Problémy robotů Odmítnutí robota Index Vyhledávací stroj Problém aktuálnosti Jednoduché dotazy jsou rychlé a hloupé Volba klíčových slov je základ úspěchu Základem je přemýšlet Podstatná jsou podstatná jména a objekty Zkracování slov a užívání zástupných znaků Nalezení správné úrovně Synonyma Fráze Jak se vyhodnocují jednoduché dotazy? Jednoduché dotazy a default operátor Pokročilé dotazy Logické základy Přehled boolovských prvků Operátor AND Operátor OR Pokročilejší operátory Operátor NEAR Operátory BEFORE a AFTER Operátor AND NOT Jak formulovat pokročilejší dotaz Používání závorek Kombinace konceptů pro pokročilé dotazy Interpunkce a velikost písmen Zpřesňování dotazu Dotazovacích jazyků je mnoho Použití filtrů Filtr uzlu Filtr data Jiné druhy filtrů a voleb vyhledávání Jak řadí vyhledávací stroje dokumenty Proč jsou výsledky řazeny Nevýhody automatického řazení Š

7 Obvyklá kritéria pro stanovení relevance Řazení a spamming Jiné faktory relevance Vyvarovat se zbytečných chyb Překlepy Zbytečné termíny Ignorovaná slova a speciální znaky Alternativní pravopis Příliš mnoho termínů, synonym Nevhodně sestavené nebo komplikované dotazy Vyhledávací strategie aneb jak hledat efektivně Obecné vyhledávání Specifické vyhledávání Kombinace obecného a specifického vyhledávání Inkrement ální vyhledávání Řetězcové vyhledávání Vyhledej-a-skoč Obecné přednosti funkce Find Kategoriální vyhledávání Vyhledej-a-seřad' Souhrn Poznání používaného vyhledávacího systému Drobné varování dynamický vývoj vyhledávacích služeb Překrytí, pokrytí a pružnost Boolovské dotazy ano nebo ne? Některé zajímavé rysy chování Problémy s počty Mýtus milionových výsledků Problémy při zpracování Příklady vyhledávacích strojů Literatura ke kapitole Metavyhledávací stroje Výhody a nevýhody Principy fungování Metavyhledávání - řešení typu klient Metavyhledávání - řešení typu server Základní charakteristika Pohled z hlediska uživatele Příklady metavyhledávacích systémů Literatura ke kapitole Š

8 13. Metadata Meta-úvod Co jsou metadata? Potřeba metadat Vyhledávání a metadata Problémy a překážky Standardizace metadat Schéma metadat Standardy Metadatové systémy Dublin Core Vznik a vývoj Základní charakteristika Dublin Core Základní prvky Dublin Core Jiné projekty Kódování metadat SGML Text Encoding Initiative (TEI) HTML Warwick Framework XML RDF Praktické problémy s metadaty Výběr elementů, subelementů a schématu Vytvoření a uložení metadat Řízená terminologie Identifikace zdrojů Požadované vlastnosti Uniform Resource Locator (URL) Uniform Resource Identifier (URI) Uniform Resource Name (URN) Persistent Uniform Resource Locator (PURL) Digital Object Identifier (DOI) Budoucnost metadat Literatura ke kapitole Hodnocení informací získávaných z Internetu Proč hodnotit? Kvalita informací Služby zaměřené na recenzování a hodnocení Subject gateways, virtuální knihovny Kritéria hodnocení Š

9 Účel zdroje, cílová skupina uživatelů Obsah Odkazy na jiné zdroje Zrcadla Povaha obsahu Kvalita psaného jazyka Autorita Přesnost Aktuálnost, správa zdroje Dostupnost zdroje Rychlost přístupu Softwarová omezení Jiná omezení přístupu Náklady Copyright Spolehlivost přístupu, snadnost nalezení zdroje Zabezpečení přístupu Prezentace a uspořádání informací Pomoc při nalezení informace v rámci zdroje Obrázky, rámy, Java Design Snadnost použití Služby podpory uživatelů Srovnání s jinými zdroji Celková kvalita Seznam kontrolních otázek Literatura ke kapitole Etika v prostředí Internetu Etika Informační etika, počítačová etika, etika v počítačových sítích Faktory, které podporují neetické chování uživatelů Některé etické problémy Soukromí Vlastnictví Svoboda Hacking, cracking Technologie agentů Informační nerovnost Informační obsah Všeobecné principy etiky v Internetu Etika a právo Profesní kodexy Š

10 Soubory norem organizací, firem Zásady práce v prostředí Internetu Obecná pravidla Specifická pravidla, netiketa Budoucnost informační etiky? Literatura ke kapitole Inteligentní systémy na Internetu Popis prostředí Podpora brouzdání Metavyhledávání Podpora obchodování Literatura ke kapitole Trendy vyhledávání v prostředí Evoluce - pestřejší budoucnost pro uživatele Integrace vyhledávacích funkcí do prohlížečů Portály Partnerství, slučování, akvizice Služby hybridního typu Zvláštní služby v rámci vyhledávacích strojů Trend k jednoduchosti Přibližování - všudypřítomný Web Nedostatek informací - výzva pro vyhledávací stroje Síla člověka Personalizace vyhledávání Vyhledávání nezávislé na prohlížeči Dotazy podle dokumentů Techniky pojmového vyhledávání Expanzivnější indexování Specializace vyhledávacích strojů Proč používat specializované vyhledávací služby Regionální vyhledávací služby Věcně specializované vyhledávací služby Multimediální vyhledávací služby Kde hledat specializované vyhledávací služby Neviditelný Web Jak zviditelnit neviditelné Budoucnost neviditelného Webu Nová generace vyhledávacích služeb? ,Š

11 Zpracování přirozeného jazyka Inteligentní agenti Filtrování Vizualizace Literatura ke kapitole IV. Přílohy A Slovník pojmů B Slovník pojmů z oblasti vyhledávacích nástrojů Š