O a u to r e c h... V P ř e d m l u v a...vii 1 D a ta, in fo rm a c e, z n a l o s t i?... 1 1.1 Co jsou d ata, inform ace a z n a lo s ti... 1 1.1.1 D a t a... 2 1.1.2 In fo rm a c e... 2 1.2 Znalosti... 4 1.3 Inform ační g r a m o tn o s t... 4 1.3.1 Z h i s t o r i e... 4 1.3.2 Inform ační přehlcení?... 5 1.3.3 Formy in f o r m a c í... 6 1.3.4 Inform ace a k o m u n ik a c e... 7 1.3.5 G ram otnost a inform ační g ra m o tn o st... 7 1.3.6 Inform ační gram otnost a I n te r n e t... 9 1.4 Kolik je in f o r m a c í?... 10 L iteratura ke kapitole 1... 14 1 P r á c e s i n f o r m a c e m i... 17 2 In fo rm a č n í p r o c e s... 19 2.1 Základní p o j m y... 19 2.2 Inform ační z d r o j e...22 2.2.1 Typy a charakteristiky inform ačních z d r o j ů... 22 2.2.2 K n ih o v n y... 24 2.2.3 Specializované f i r m y...26 2.3 V yhledávám d o k u m e n tů... 26 2.4 Popis d o k u m e n tů...30 2.5 C harakteristika obsahu d o k u m e n tů... 32 2.6 A utom atická charakteristika o b s a h u... 35 IX
2.7 Boolovský model... 39 2.7.1 P rincip boolovského m o d e lu...39 2.7.2 Ú plnost a přesnost v boolovském modelu... 40 2.7.3 Zvyšování přesnosti a ú p ln o sti...44 2.8 Invertovaný s o u b o r...46 2.9 Další přístupy к vyhledávání textových d o k u m e n tů...49 2.9.1 Rozšiřování boolovského m odelu...51 2.9.2 Topíc...54 L iteratu ra ke kapitole 2...56 3 Z p ra c o v á n í sp e c ific k ý c h je v ů p ř iro z e n é h o ja z y k a v a u to m a tiz o v a n ý c h in fo rm a č n íc h s y s t é m e c h...58 3.1 A utom atizace indexování a vyhledávání textových inform ací.... 58 3.2 Překonání jazykových b a r i é r...66 3.3 S tandardizace t e x t ů...73 3.4 K om unikace s počítačem v přirozeném jazyce... 77 L iteratu ra ke kapitole 3...88 I I P r á c e s e z n a l o s t m i...91 4 P r á c e se z n a l o s t m i...93 4.1 E xpertní systém y, znalostní sy sté m y...93 4.1.1 Zrození znalostního in ž e n ý r s tv í...93 D E N D R A L...93 4.1.2 C harakteristické r y s y...94 4.1.3 S t r u k t u r a...96 4.1.4 T ypy expertních úloh...97 4.1.5 Diagnostické ú l o h y...99 4.1.6 G enerativní úlohy...101 4.1.7 N ěkteré slavné systém y... 102 M y c i n... 102 T E IR E S IA S...104 P R O S P E C T O R...105 R l/x C O N... 105 4.1.8 Volba aplikační o b la s ti...106 4.2 Z nalosti a jejich re p re z en ta c e... 107 4.2.1 P r a v id la... 109 4.3 O dvozování...112 O PS5... 114 O dvozování v diagnostických expertních systém ech první generace...115 4.3.1 Z pétné ř e tě z e n í... 118 4.3.2 P řím é řetězení... 119 4.3.3 A g e n d a...120 AM...120 4.3.4 T a b u le...121 H e a r s a y...121 X
4.4 P ráce s n e u rč ito stí...121 4.4.1 Algebraické pojetí... 122 4.5 Získávání znalostí od e x p e rta... 124 4.5.1 Problém získávání z n a lo s tí...124 4.5.2 Spolupráce s expertem a příprava n a n i...126 4.5.3 Verbální techniky elicitace z n a l o s t í... 128 4.5.4 Neverbální techniky elicitace z n a lo s tí...130 4.6 M odelování z n a lo s tí... 133 4.6.1 O d transferu znalostí к m o d e lo v á n í... 133 4.6.2 M odely řešení p r o b lé m ů... 137 4.6.3 Znalostní o n to lo g ie...142 L iteratu ra ke kapitole 4...147 5 O d d a t ke z n a l o s t e m... 151 5.1 Základní rysy K D D... 151 5.2 M etody získávám znalostí... 155 5.2.1 Symbolické m e to d y...156 G U H A...160 K E X...161 5.2.2 Případové u s u z o v á n í... 164 C B R E x p r e s s...165 5.2.3 Neuronové s í t ě...166 5.3 A utom atické získávání znalostí z t e x t ů... 172 5.3.1 Základní p r o b lé m y...172 L iteratu ra ke kapitole 5... 176 I I I In fo rm a c e a I n t e r n e t...179 6 I n t e r n e t!?...181 6.1 Historické o h lé d n u tí... 181 6.2 Co je tedy In te rn e t?...183 6.3 Inform ační služby I n t e r n e t u...184 6.3.1 T e l n e t... 184 6.3.2 G opher...185 6.4 Z historie vyhledávání inform ací v prostředí In te rn e tu...186 L iteratu ra ke kapitole 6... 186 7 W o rld W id e W e b z á k la d p ř ís tu p u к in fo rm a c ím v I n te r n e tu.. 188 7.1 Základní c h a r a k te ris tik a...188 7.2 Z h is to rie... 188 7.3 K lie n t/se rv e r...189 7.4 M ožnosti využití W W W... 191 7.5 Stavební kam eny... 192 7.5.1 H y p e r te x t... 192 7.5.2 Jazyk H T M L...194 Základní p r i n c i p...194 HTM L a SGML...195 XI
D alší v ý v o j...196 7.5.3 U RL (U niform Resource L o c a to r)... 198 U RL pro F T P...200 U RL pro T e ln e t...201 U RL pro e - m a il...201 U RL pro G o p h e r...202 U RL pro H T T P...202 U RL pro U senet N e w s...203 7.5.4 P rotokol H T T P...203 7.6 K lienti služby W W W... 204 7.6.1 K lienti W W W... 204 7.6.2 K lient W W W jako hypertextový p ro h líž e č... 205 7.6.3 Grafické p ro h líž e č e... 206 7.7 Z á lo ž k y... 207 7.7.1 Účel a p rin c ip...207 7.7.2 Záložky nebo k o p i e?...207 7.7.3 O rganizování z á lo ž e k... 209 7.7.4 Z astarávám zálo žek... 209 7.8 T vorba dokum entů pro službu W W W...211 L ite ra tu ra ke kapitole 7...212 8 In fo rm a c e a I n t e r n e t...214 8.1 Ú spěšnost vyhledávání aneb co jsou relevance, přesnost a úplnost. 215 8.2 In tern et jako zdroj in fo rm a c í...217 8.2.1 In tern et jako seskupení p o č í t a č ů...218 8.2.2 In tern et jako soubor p r o g r a m ů...220 8.2.3 In tern et jako soubor z d r o j ů...220 8.2.4 In tern et jako k n ih o v n a...222 8.3 Co je sp rá v n é?... 224 8.4 Je Intern et ideálním prostředím pro vyhledávání informací?.... 225 L ite ra tu ra ke kapitole 8...227 9 V y h le d á v á n í in fo rm a c í v I n te r n e tu ja k o p r o b l é m... 229 9.1 N ěkterá hledání jso u n e ú s p ě š n á... 230 9.2 V yhledávání v In tern etu jako um ění svého druhu...232 9.3 Velikost I n te r n e tu...232 9.3.1 Velikost prostoru W W W...233 Jak lze určit velikost prostoru W W W...... 233 9.3.2 C harakteristika typického u ž iv a te le...234 9.3.3 W W W dokum enty a v y h le d á v á m... 235 9.4 Velikost W W W prostoru?...236 9.4.1 In te rp re ta c e...237 Poznám ky к veřejné indexovatelnosti v o d h a d e c h... 237 Poznám ky к časové platnosti o d h a d ů... 240 Poznám ky к odhadování, přesnosti a n e p ř e s n o s ti...240 9.4.2 M á to s m y s l?... 241 9.5 Základní m etody vyhledávání v Internetu a příčiny problém ů.... 242 9.5.3 S ta tu s In tern etu a zklam ání uživatele při vyhledávání.. 242
9.5.4 Vyhledávací stroje a předm ětové k a ta lo g y...243 9.5.5 Ja k se vyhledává a co zabírá čas při v y h le d á v á n í... 245 9.6 Vyhledávací služby versus tradiční on-line s l u ž b y...247 L iteratu ra ke kapitole 9...250 10 P ře d m ě to v é k a t a l o g y...252 10.1 Principy fungování... 252 10.1.1 Hledisko uživatele...252 10.1.2 Hledisko údržby k a t a l o g u...253 10.2 V ýhody a nevýhody předm ětových k a t a l o g ů... 254 10.3 Vývoj a tren d y předm ětových k a ta lo g ů... 256 10.3.1 V y h led áv án í... 256 10.3.2 P ortály... 256 10.4 Příklady předm ětových k a ta lo g ů...257 L iteratu ra ke kapitole 1 0...258 11 V y h le d á v a c í s t r o j e...259 11.1 Jd e o h i t y...259 11.2 Principy fungování... 260 11.2.1 R o b o t... 261 Strategie p ro c h á z e n í...262 Problém y r o b o t ů... 264 O dm ítnutí ro b o ta... 265 11.2.2 Index... 266 11.2.3 Vyhledávací s t r o j... 267 11.2.4 Problém a k tu á ln o s ti... 268 11.3 Jednoduché dotazy jsou rychlé a hloupé... 269 11.4 Volba klíčových slov je základ ú s p ě c h u...270 11.4.1 Základem je p ře m ý š le t... 270 11.4.2 P o d sta tn á jso u p o d statn á jm én a a o b je k ty... 271 11.4.3 Zkracování slov a užívání zástupných z n a k ů...272 11.4.4 Nalezení správné ú r o v n ě...273 11.4.5 S y n o n y m a... 275 11.4.6 F rá z e...275 11.5 Jak se vyhodnocují jednoduché d o ta z y?... 276 11.6 Jednoduché dotazy a default o p e r á to r... 276 11.7 Pokročilé d o ta z y... 277 11.7.1 Logické z á k la d y...278 P řehled boolovských p r v k ů...278 O perátor A N D... 279 O perátor O R... 281 11.7.2 Pokročilejší o p e r á t o r y...282 O perátor N E A R...282 O perátory B E F O R E a A F T E R...283 O perátor AND N O T...283 11.7.3 Jak form ulovat pokročilejší d o t a z...284 Používání závorek...285 K om binace konceptů pro pokročilé d o ta z y...287 XIII
Interpunkce a velikost p ís m e n...287 Zpřesňování d o ta z u...288 11.8 Dotazovacích jazyků je m n o lio... 288 11.9 P oužití f i l t r ů...290 11.9.1 F iltr u z l u... 292 11.9.2 F iltr d a t a... 293 11.9.3 Jiné druhy filtrů a voleb v y h le d á v á n í... 294 11.10 Jak řadí vyhledávací stro je d o k u m e n ty...294 11.10.1 P ro č jsou výsledky ř a z e n y...294 11.10.2 N evýhody autom atického řazení... 295 11.10.3 O bvyklá k ritéria pro stanovení re le v a n c e... 296 11.10.4 Ř azení a sp am m in g...298 11.10.5 Jiné faktory r e le v a n c e...299 11.11 V yvarovat se zbytečných c h y b... 301 11.11.1 P ře k le p y...301 11.11.2 Zbytečné te r m ín y... 302 11.11.3 Ignorovaná slova a speciální z n a k y...302 11.11.4 A lternativní p ra v o p is... 302 11.11.5 Příliš m noho term ínů, sy n o n y m...303 11.11.6 N evhodně sestavené nebo komplikované d o t a z y...303 11.12 Vyhledávací strategie aneb ja k hledat e f e k t i v n ě... 306 11.12.1 O becné v y h le d á v á n í... 306 11.12.2 Specifické v y h le d á v á n í...307 11.12.3 K om binace obecného a specifického vyhledávání...307 11.12.4 Inkrem entální vyhled áv ám...308 11.12.5 Řetězcové v y h le d á v á n í...310 11.12.6 V yhledej-a-skoč...310 11.12.7 O becné přednosti funkce F i n d...311 11.12.8 K ategoriální v y h led áv án í... 312 11.12.9 V y h le d e j-a -se řa ď...312 11.12.10 S o u h rn... 313 11.13 Poznání používaného vyhledávacího s y s té m u... 313 11.13.1 D robné varování - dynam ický vývoj vyhledávacích služeb 313 11.13.2 P řekrytí, pokrytí a p ru ž n o s t...315 11.13.3 Boolovské dotazy - ano nebo n e?...317 11.13.4 N ěkteré zajím avé rysy chování...317 Problém y s p o č t y... 318 M ýtus milionových v ý sle d k ů... 319 Problém y při z p ra c o v á n í... 320 11.14 Příklady vyhledávacích s t r o j ů... 320 L iteratu ra ke kapitole 1 1...321 12 M e ta v y h le d á v a c í s t r o j e... 323 12.1 V ýhody a n e v ý h o d y...323 12.2 Principy fungování...325 12.3 M etavyhledávání - řešení ty p u k l i e n t... 327 12.4 M etavyhledávání - řešení ty p u s e r v e r... 328 XIV
12.4.1 Základní c h a ra k te ris tik a... 328 12.4.2 Pohled z hlediska uživatele... 328 12.5 Příklady m etavyhledávacích s y s t é m ů...330 L iteratu ra ke kapitole 1 2...330 13 M e ta d a ta... 331 13.1 M e ta -ú v o d...331 13.2 Co jsou m etadata?... 333 13.3 P otřeba m etadat...335 13.4 V yhledávání a m e t a d a t a...336 13.5 Problém y a p ř e k á ž k y...339 13.6 Standardizace m e t a d a t...340 13.6.1 Schém a m e t a d a t...340 13.6.2 S ta n d a rd y...341 13.6.3 M etadatové s y s té m y... 342 13.6.4 D ublin C o r e... 343 V znik a v ý v o j... 343 Základní charakteristika D ublin C o re... 344 Základní prvky D ublin C o r e...345 13.6.5 Jiné p r o j e k t y...346 13.6.6 Kódování m e t a d a t...347 S G M L... 348 Text Encoding Initiative ( T E I )...348 H T M L... 349 W arwick F ra m e w o rk...352 X M L...352 R D F...353 13.7 Praktické problém y s m etad aty...358 13.7.1 V ýběr elem entů, subelem entů a s c h é m a tu...358 13.7.2 V ytvoření a uložení m etad at...359 13.7.3 Ř ízená term inologie... 360 13.7.4 Identifikace z d r o j ů...361 Požadované v l a s tn o s ti... 361 Uniform Resource L ocator (U R L )... 363 Uniform Resource Identifier ( U R I )...363 Uniform Resource N am e (URN)... 364 Persistent Uniform Resource Locator ( P U R L )...365 D igital O bject Identifier ( D O I )...366 13.8 B udoucnost m e t a d a t... 367 L iteratu ra ke kapitole 1 3...368 14 H o d n o c e n í in fo rm a c í z ísk á v a n ý c h z I n t e r n e t u... 370 14.1 Proč hodnotit?... 370 14.2 K valita in f o r m a c í...374 14.3 Služby zam ěřené na recenzování a h o d n o c e n í...375 14.4 Subject gateways, virtuální k n ih o v n y...377 14.5 K ritéria hodnoceni... 379 14.5.1 Účel zdroje, cílová skupina u ž iv a te lů...381 XV
14.5.2 O b s a h... 381 O dkazy n a jiné z d r o j e... 382 Z r c a d l a...382 P ovaha o b s a h u...383 K valita psaného jazyka... 383 14.5.3 A u to r ita...383 14.5.4 P ř e s n o s t...384 14.5.5 A ktuálnost, správa z d r o j e... 385 14.5.6 D ostupnost z d r o j e... 387 R ychlost p řís tu p u...387 Softw arová omezení...387 J in á omezení p ř í s t u p u...388 N á k la d y... 389 C o p y r ig h t...389 Spolehlivost přístupu, snadnost nalezení z d r o j e... 390 Zabezpečení p řís tu p u...390 14.5.7 P rezentace a uspořádání in f o r m a c í... 390 Pom oc při nalezení inform ace v rám ci z d r o j e...390 Obrázky, rámy, J a v a...392 D e s ig n...393 14.5.8 Snadnost p o u ž i t í...395 Služby podpory u ž i v a t e l ů...395 14.5.9 Srovnání s jiným i z d r o j i...395 14.5.10 Celková k v a l i t a...396 14.5.11 Seznam kontrolních o tá z e k... 397 L iteratu ra ke kapitole 1 4...400 15 E tik a v p r o s tř e d í I n t e r n e t u...403 15.1 E t i k a...403 15.2 Inform ační etika, počítačová etika, etik a v počítačových sítích... 404 15.3 Faktory, které podporují neetické chovám u ž iv a te lů...407 15.4 N ěkteré etické p r o b l é m y...408 15.4.1 S o u k r o m í...408 15.4.2 V lastnictví... 410 15.4.3 S v o b o d a... 413 15.4.4 Hacking, cra c k in g...413 15.4.5 Technologie a g e n t ů... 414 15.4.6 Inform ační n e ro v n o st...415 15.4.7 Inform ační o b s a h...415 15.5 Všeobecné principy etiky v I n t e r n e t u... 417 15.5.1 E tik a a p r á v o...417 15.5.2 Profesní k o d e x y... 418 15.5.3 Soubory norem organizací, f i r e m...420 15.5.4 Zásady práce v prostředí I n t e r n e t u...420 O becná p r a v i d l a... 420 Specifická pravidla, n e tik e ta...423 15.6 B udoucnost inform ační e t i k y?... 423 XVI
L iteratu ra ke kapitole 1 5...424 16 In te lig e n tn í s y s té m y n a I n t e r n e t u...426 16.1 Popis prostředí W W W... 426 16.2 P odpora brouzdání...427 16.3 M etavyhledávání... 429 16.4 P odpora o b ch o d o v án í...430 L iteratu ra ke kapitole 1 6...433 17 T re n d y v y h le d á v á n í v p r o s tř e d í W W W... 435 17.1 Evoluce - pestřejší budoucnost pro u ž iv a te le...436 17.1.1 Integrace vyhledávacích funkcí do prohlížečů... 436 17.1.2 P ortály... 436 17.1.3 P artn erstv í, slučování, a k v iz ic e...437 17.1.4 Služby hybridního t y p u... 438 17.1.5 Zvláštní služby v rám ci vyhledávacích stro jů...438 17.1.6 Trend к je d n o d u c h o s ti... 440 17.2 Přibližování - všudypřítom ný W eb...441 17.3 N edostatek inform ací - výzva pro vyhledávací s t r o j e... 441 17.4 Síla člověka...442 17.5 Personalizace v y h le d á v á n í... 444 17.6 V yhledávání nezávislé na p ro h líž e č i...444 17.7 D otazy podle d o k u m e n tů... 446 17.8 Techniky pojm ového v y h le d á v á m... 446 17.9 Expanzivnější in d e x o v á n í... 448 17.10 Specializace vyhledávacích s t r o j ů... 450 17.10.1 Proč používat specializované vyhledávací služby...451 17.10.2 R egionální vyhledávací s lu ž b y...451 17.10.3 Věcně specializované vyhledávací s l u ž b y...452 17.10.4 M ultim ediální vyhledávací s lu ž b y...452 17.10.5 K de hledat specializované vyhledávací s l u ž b y... 452 17.11 Neviditelný W e b... 453 17.11.1 Ja k zviditelnit n e v id ite ln é... 455 17.11.2 Budoucnost neviditelného W ebu...456 17.12 Nová generace vyhledávacích s l u ž e b?...456 17.12.1 Zpracování přirozeného jazyka... 457 17.12.2 Inteligentní agenti... 459 17.12.3 F iltr o v á n í...459 17.12.4 V iz u a liz a c e... 460 L iteratu ra ke kapitole 1 7...460 IV P ř í l o h y... 463 A S lo v n ík p o j m ů...465 В S lo v n ík p o jm ů z o b la s ti v y h le d á v a c íc h n á s t r o j ů...497 XVII