C3 T1 Vybrané kapitoly počíta tačových s sítí Vyhledávání na Internetu 1. Vyhledáva vače 2. Katalogy 3. Vyhledávac vací centrály 4. Metavyhledáva vače
2 Cíle cvičen ení C3 Vyhledávání na Internetu 1. Vysvětlit princip a podstatu fungování jednotlivých způsob sobů vyhledávání na Internetu. 2. Charakterizovat internetové vyhledáva vače. 3. Zdůraznit zvyšuj ující se význam vyhledáva vačů při i hledání odpovídaj dajících ch informací na Internetu.
3 Vyhledáva vače Vyhledáva vače Využívaj vají metodu plného textu (fulltext). Technologie vyhledáva vače e zahrnuje tři i stupně: 1. Vyhledávac vací robot prochází sítí po hypertextových odkazech a navštěvuje vuje webové stránky. Na dříve d navštíven vené stránky se vrací v určitých itých intervalech, nebo pracuje nepřetr etržitě.
4 Vyhledáva vače 2. Všechno, co robot najde, je uloženo v databázi (indexu). Index obsahuje každé slovo z navštívených vených stránek a informace o jeho výskytu na stránce (frekvence, umíst stění a další údaje) daje). Při i změně webové stránky je index po další návštěvě robota na stránce aktualizován.
5 Vyhledáva vače 3. Vyhledáva vač (vyhledávac vací program) po zadání dotazu prochází index, aby našel slova shodná s klíčovými slovy uvedenými v dotazu. Po jejich nalezení předloží uživateli soupis webových stránek obsahujících ch požadovan adovaná klíčov ová slova.
6 Vyhledávac vací robot Vyhledáva vače Program opakovaně vykonávaj vající nějakou jakou rutinní činnost na Internetu. Obvykle sbírá data, odesílá a zpracovává požadavky na služby. Každý vyhledáva vač má vlastního robota. Usnadňuje orientaci v množstv ství informací nacházej zejících ch se na Internetu. Umožň žňuje velmi podstatné zkrácen cení doby vyhledání odpovědi di na dotaz. Označuje se také spider, crawler nebo bot.
7 Vyhledáva vače Vyhledáva vače Všechny hlavní vyhledáva vače e pracují na stejném m principu (rozd a jejich vyladění). (rozdíly jsou v jednotlivostech Zpravidla pracují s jedním m indexem. Poskytují dva způsoby soby prohlížen ení indexu: základní vyhledávání (vyu postupy), pokročil ilé vyhled uživatele) ivatele). (využívá některé zautomatizované vyhledávání (postupy jsou plně pod kontrolou Nejznámější vyhledáva vače Atlas, Centrum, Jyxo, Morfeo,, Seznam, Alta Vista, Bing, Google, Yahoo!,
8 Princip vyhledávání Vyhledáva vače uživatel dotaz dotazovaný server WWW vyhledáva vač odpověď databáze vyhledávac vací robot
9 Katalogy Katalogy Adresy webových dokumentů jsou uspořádány do kategorií. Tematicky setříděné seznamy s hierarchickou strukturou. Nejvyšší úroveň představují obecné kategorie (Kultura, Internetové obchody, Počíta tače, Zdraví, ). Podkategorie druhé úrovně jsou méněm obecné a vedou od nich odkazy na další nižší úrovně. Hledání průchod kategoriemi od nejvyšší úrovně,, dokud neobjevíme stránku vyhovující naší informační potřeb ebě. Kvalita katalogů rozhodují administráto toři (vytvářej ejí strukturu katalogu, zařazuj azují do nich webové stránky přihlašované jejich původci) p vodci).
10 Výhody a nevýhody Katalogy Výhody Díky hierarchické struktuře e se můžm ůže e uživatel, u který přesnp esně neví,, co chce nalézt, poměrn rně snadno dopracovat k výsledku. Nevýhody Kvůli značnému podílu ruční práce je velikost značně omezena. Každý katalog mám jinak strukturované skupiny odkazů. Časová náročnost. Platnost/neplatnost odkazů (lze zčásti z odstranit jejich automatizovanou kontrolou).
11 Nejznámější katalogy Katalogy Zahraniční Galaxy, Google adresář, Open Directory Project, Yahoo! Directory, České Seznam, Centrum, Atlas, caramba!,
12 Vyhledávac vací centrála Vyhledávac vací centrály Umožň žňují použit ití konkrétn tní vyhledávac vací služby podle výběru uživatele. Samostatná služba, nebo součást st jiné služby. Příklady Alenka (www.alenka alenka.cz), Odskok (www.odskok.cz cz/sluzby/robot. /robot.php).
13 Metavyhledáva vače Metavyhledáva vače Využívaj vají většího počtu vyhledáva vačů a katalogů zapojených do synchronního ho vyhledávání. Podstata činnosti Uživatelův v dotaz převedou p do podoby, které vybrané nástroje rozumějí. Přeložený ený dotaz odešlou předem p vybraným nástrojn strojům, ty porovnají své databáze s dotazem a výsledky hledání odešlou zpět metavyhledáva vači. Metavyhledáva vač vyřad adí duplicity a zbývající záznamy znamy uspořádá do soupisu podle volitelných kritéri rií,, zpravidla podle relevance nebo podle jednotlivých použitých vyhledávac vacích ch nástrojn strojů.
14 Princip vyhledávání Metavyhledáva vače uživatel dotaz rozesílac lací mechanismus metavyhledáva vač agent rozhraní A B C Z vyhledáva vače WWW výsledky agent rozhraní zobrazovací mechanismus výsledky verifikace výsledků
15 Příklady Metavyhledáva vače www.metacrawler metacrawler.comcom www.mamma mamma.com www.webcrawler webcrawler.comcom info.com
16 Úkoly do samostudia C3 Vyhledávání na Internetu 1. Objasněte princip vyhledávání informací na Internetu. 2. Charakterizujte vyhledáva vače. 3. Vysvětlete rozdíl l mezi katalogovým a fulltextovým vyhledáváním informací. 4. Charakterizujte metavyhledáva vače.