PEER-TO-PEER PŘÍSTUP K VYHLEDÁVÁNÍ NA INTERNETU

Podobné dokumenty
Distribuované systémy a výpočty

11. Tabu prohledávání

VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA STROJNÍ DATABÁZOVÉ SYSTÉMY ARCHITEKTURA DATABÁZOVÝCH SYSTÉMŮ. Ing. Lukáš OTTE, Ph.D.

10. Samoorganizující se sítě (P2P a ad-hoc sítě)

10. Samoorganizující se sítě (P2P a ad-hoc sítě)

jednoduchá heuristika asymetrické okolí stavový prostor, kde nelze zabloudit připustit zhoršují cí tahy Pokročilé heuristiky

Bakalářská práce. Simulace vybrané metody DHT

3.15 Topologie počítačových sítí

Internet a zdroje. (ARP, routing) Mgr. Petr Jakubec. Katedra fyzikální chemie Univerzita Palackého v Olomouci Tř. 17. listopadu

3.13 Úvod do počítačových sítí

Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/ Vzdělávání v informačních a komunikačních technologií

Příprava na zk. z KIV/DS

Kapitola třináctá. Datové sítě. Učební text. Mgr. Radek Hoszowski

Peer-to-Peer sítě. Mgr. Miroslav Novotný. Katedra Softwarového inženýrství

IntraVUE Co je nového

PDV /2018 Detekce selhání

Routování směrovač. směrovač

Distribuované Hashovací Tabulky. Jaroslav Bárta

Telekomunikační sítě Úvod do telekomunikačních sítí

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA PODNIKATELSKÁ Přijímací řízení 2017 Bakalářský studijní program: Systémové inženýrství a informatika

1. Směrovače směrového protokolu směrovací tabulku 1.1 TTL

Počítačové síťě (computer network) Realizují propojení mezi PC z důvodu sdílení SW (informací, programů) a HW(disky, tiskárny..)

TOPOLOGIE DATOVÝCH SÍTÍ

INFORMAČNÍ SYSTÉM VIDIUM A VYUŽITÍ MODERNÍCH TECHNOLOGIÍ

InternetovéTechnologie

Počítačové sítě. Miloš Hrdý. 21. října 2007

Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Databázové systémy úvod

Cloudová Řešení UAI/612

MPLS Penultimate Hop Popping

Zdroje pro vědu jako nezbytná součást jednotného vyhledávaní. Martin Vojnar. CVTI v Bratislavě, 9. listopadu vojnar@multidata.

Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/ Vzdělávání v informačních a komunikačních technologií

12. Virtuální sítě (VLAN) VLAN. Počítačové sítě I. 1 (7) KST/IPS1. Studijní cíl. Základní seznámení se sítěmi VLAN. Doba nutná k nastudování

Integrovaná střední škola, Sokolnice 496

Telekomunikační sítě LAN sítě

SOU Valašské Klobouky. VY_32_INOVACE_02_18 IKT DNS domény. Radomír Soural. III/2 Inovace a zkvalitnění výuky prostřednictvím ICT

Identifikátor materiálu: ICT-3-01

Strukturované a nestrukturované P2P sítě, DHT

IBM TotalStorage Productivity Center Overview

Xerox Váš partner pro tvorbu, digitalizaci a správu dokumentů.

Distribuované algoritmy - přehled. Přednášky z Distribuovaných systémů Ing. Jiří Ledvina, CSc.

Databázové systémy úvod

Load Balancer. RNDr. Václav Petříček. Lukáš Hlůže Václav Nidrle Přemysl Volf Stanislav Živný

VY_32_INOVACE_IKTO2_1260 PCH

Identifikátor materiálu: ICT-2-06

Moderní privátní cloud pro město na platformě OpenStack a Kubernetes

Příloha č. 3 zadávací dokumentace

K čemu slouží počítačové sítě

24 Uživatelské výběry

Počítačové sítě. Další informace naleznete na :

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta informačních technologií

Střední odborná škola stavební Karlovy Vary Sabinovo náměstí 16, Karlovy Vary Autor: Ing. Hana Šmídová Název materiálu:

Formální konceptuální analýza

bin arn ı vyhled av an ı a bst Karel Hor ak, Petr Ryˇsav y 23. bˇrezna 2016 Katedra poˇ c ıtaˇ c u, FEL, ˇ CVUT

AMPHORA - NÁSTROJ PRO INDEXOVÁNÍ WEBOVÝCH STRÁNEK.

Virtuální sítě 2.část VLAN

Microsoft Office. Excel vyhledávací funkce

Manuál pro práci s modulem Otázky a odpovědi

3.17 Využívané síťové protokoly

Paralelní programování

Web 2.0, Search 2.0 jak se to rýmuje?

Architektura klient-server

Navrženy v 60. letech jako experimentální optimalizační metoda. Velice rychlá s dobrou podporou teorie

Kruhová topologie v bezdrátových sítích. Cesta ke zvýšení dostupnosti služeb

UAI/612 - Cloudová Řešení. Technologie

Vývoj moderních technologií při vyhledávání. Patrik Plachý SEFIRA spol. s.r.o.

Databázové systémy BIK-DBS

Počítačové sítě. Další informace naleznete na :

Přidělování paměti II Mgr. Josef Horálek

Metodický list s komponentou ICT

Počítačová síť je spojení dvou a více počítačů kabelem, telefonní linkou,

InternetovéTechnologie

Bakalářský stupeň studia V odborném studiu lze na Přírodovědecké fakultě JU studovat několik biologicky zaměřených oborů, které mají mnohaletou

CCNA I. 3. Connecting to the Network. CCNA I.: 3. Connecting to the network

Metodika výuky IT. Odborné učiliště pro žáky s více vadami s.r.o. Ing. Martin Kocman. Praha & EU: Investujeme do Vaší budoucnosti

Znalostní systém nad ontologií ve formátu Topic Maps

Co je počítačová síť?

Projektování distribuovaných systémů Lekce 2 Ing. Jiří ledvina, CSc

Reranking založený na metadatech

Portál sociální sítě informatiků a jeho strukturované profily znalostí

Elektronické informační zdroje v oblasti přírodních věd z projektu 1N04186

Route reflektory protokolu BGP

Dvoupásmový přístupový bod pro venkovní použití Návod k obsluze - EC-WA6202 (EC-WA6202M)

Web 2.0 vs. sémantický web

Testová ní už ivátelske ho rožhrání Fácebook.com

Optické sítě. Počítačové sítě a systémy. _ 3. a 4. ročník SŠ technické. Ing. Fales Alexandr Software: SMART Notebook

Copyright 2001, COM PLUS CZ a.s., Praha

Windows Server 2003 Active Directory

Komunikační strategie a plán rozvoje portálu portal.gov.cz

Lokální počítačové sítě

bfs, dfs, fronta, zásobník, prioritní fronta, halda

INFORMAČNÍ A KOMUNIKAČNÍ TECHNOLOGIE. Ing. Jaroslav Adamus. Gymnázium, SOŠ a VOŠ Ledeč nad Sázavou

Digitální knihovna MZK a mobilní aplikace Kramerius Královéhradecká knihovnická konference

Analýza aplikačních protokolů

IntraVUE Co je nového

Projekt zaměřený na vybudování sociální sítě informatiků (ve smyslu sociálního webu) ve všech regionech ČR jako základny pro partnerství a spolupráci.

ZPĚTNOVAZEBNÍ ŘÍZENÍ, POŽADAVKY NA REGULACI

PROJEKT ŘEMESLO - TRADICE A BUDOUCNOST Číslo projektu: CZ.1.07/1.1.38/ PŘEDMĚT PRÁCE S POČÍTAČEM

Aktivní prvky: brány a směrovače. směrovače

Vzájemné vyloučení procesů

Transkript:

PEER-TO-PEER PŘÍSTUP K VYHLEDÁVÁNÍ NA INTERNETU Adam Morávek Ivan Jelínek Katedra počítačů, FEL, ČVUT České vysoké učení technické v Praze, Karlovo Náměstí 13, 121 35 Praha 2, morava3@fel.cvut.cz, jelinek@fel.cvut.cz Abstrakt Příspěvek se zabývá jednou z možností efektivního vyhledávání na Internetu. Popisuje výhody modelu Peer-to-Peer (P2P) nad modelem Client/Server a nastiňuje možnost použití kruhové topologie logické P2P sítě jako možnou a vhodnou topologii pro efektivní a spolehlivé vyhledávání. Dále je diskutován způsob propojení jednotlivých uzlů v kruhu a vzájemné propojení jednotlivých kruhů. Popisovaná metoda propojení uzlů v kruhu si klade za cíl minimalizovat dobu vyhledávání paralelizací propagace dotazu. Tento přístup je porovnán s přístupem systému Gnutella, který je nejrozšířenějším používaným systémem pro sdílení a vyhledávání dat. 1. Úvod Problém vyhledávání v P2P sítích je v současné době více a více aktuální zejména z důvodu nedostatků současných centralizovaných vyhledávačů [1]. Výhody P2P sítí [2] tkví v jednotném pohledu na uzly, kdy každý uzel poskytuje (resp. je serverem) i získává (resp. je klientem) zároveň. Výhodou P2P sítě je, že mohou mít obecně libovolnou topologii, která se může dynamicky měnit. Volba vhodné topologie je základem efektivního vyhledávání. V současné době existuje několik fungujících P2P systémů pro vyhledávání sdílených dat. Jsou to zejména Gnutella [3], FreeNet [4], Napster [5], CAN [6] či Chord [7]. Topologie používaná těmito systémy je různá distribuovaná (Gnutella), hybridní (Napster kombinace centralizované a decentralizované topologie) či kruhová (Chord). Ovšem všechny tyto systémy mají některé podstatné nevýhody: Gnutella využívá k propagaci dotazů na vyhledání objektu tzv. flooding [8], což je obdoba broadcastu, který velmi zatěžuje síť [9]. U Napsteru (jelikož používá hybridní topologii) se do jisté míry objevuje centralizace, což je problém z hlediska stability výpadek centrálního uzlu zapříčiní odpojení mnoha závislých uzlů. Systém Chord byl vytvořen pro implementaci myšlenek distribuovaného systému souborů s využitím DHT (distribuované hash-tabulky [10]). Ovšem nepředpokládá, že se v síti objeví více stejných objektů. Možné řešení těchto nevýhod je nastíněno v dalším textu. 2. Vytyčené cíle výzkumu Tento příspěvek si klade za cíl představit takovou P2P topologii a takový systém směrování dotazů, který by řešil výše uvedené problémy a zároveň umožnil efektivní vyhledávání v P2P síti. Volba topologie P2P sítě je jednou ze stěžejních úloh při návrhu každého systému pro sdílení dat. Zásadními problémy jsou zejména přidávání a odebírání uzlů ze sítě, obsluha výpadku uzlu a propagace dotazu. 187

3. Vhodná P2P topologie Vhodným řešením problémů při návrhu topologie sítě se jako vhodná, jeví topologie kruhová [8], protože: snadno řeší problémy přidávání a odebírání uzlů, je možno rozdělit zátěž, veškerá data obsažená v uzlech kruhu lze prohledat, je odolná proti výpadkům uzlů, lze snadno spravovat komunity (kruh = komunita). Každý uzel v kruhu uchovává vazby na dva bezprostřední uzly ve směru a dva bezprostřední uzly v protisměru hodinových ručiček. Tento způsob propojení zaručuje, že je možné ošetřit výpadek uzlu, který má oba funkční sousedy. Tak je tedy možné najednou ošetřit výpadek až (N div 2) - 1 uzlů najednou, kde N je počet uzlů u kruhu (viz obr. 1). 3.1 Přidávání a odebírání uzlů Obr. 1: Ošetření výpadků mezilehlých uzlů Kruhová topologie sítě umožňuje snadné přidání uzlu do sítě, a to pomocí vazeb na sousední uzly. Uzel, který chce být zařazen do kruhu, zašle zprávu jakémukoliv uzlu sítě, který jej zařadí jako svého bezprostředního souseda (viz obr. 2). 3.2 Obsluha výpadků uzlů Obr. 2: Přidání uzlu do kruhu Jak již bylo napsáno výše, je možné zachovat kruh při výpadku uzlů, které mají fungující sousedy slouží k tomu vazby na sousední uzly. Pomocí těchto odkazů lze vytvořit bypass přes nefungující uzel. Problém nastane, když selžou dva nebo více bezprostředně sousedních uzlů. Pokud tedy uzel A zjistí, že nemá v některém směru dva a více sousedů, vyšle po dostupné části kruhu zprávu obsahující vazbu na bezprostředního souseda uzlu A. Pokud zprávu zachytí uzel, který rovněž nemá bezprostředního souseda a nemá možnost provést 188

bypass, odpoví uzlu A a předá mu rovněž vazbu na svého bezprostředního souseda. Tím je dodán dostatek informací pro znovusestavení kruhu (viz obr. 3). Problém nastane, pokud se kruh přeruší na více místech najednou a nelze ho opravit pomocí odkazů na oba sousední uzly. V tom případě vznikne N kruhů, kde N je počet přerušených míst. A zpráva odpověď Obr. 3: Znovusestavení kruhu 3.2 Propagace dotazu V kruhové topologii je propagace dotazu velmi jednoduchá a je zaručeno, že skončí po konečném počtu kroků dotazující uzel pošle dotaz v obou směrech po kruhu. Dotaz tedy projde celým kruhem, tj. N uzly. Aby se zpracování dotazu urychlilo, každý uzel si ke každému hledanému výrazu uchová seznam uzlů, které na hledaný výraz odpověděly. Při příštím hledání stejného výrazu se dotaz propaguje jak od hledajícího uzlu po kruhu, tak i přímo na uzly z tabulky, které pak propagují dotaz dále. Tak se hledání do jisté míry paralelizuje (viz obr. 4). Obr. 4: Částečně paralelizovaná propagace dotazu Tímto způsobem se prohledá každý uzel v kruhu. Ovšem každý uzel může obsahovat i vazby na uzly v jiných kruzích. Tyto uzly jsou při každém hledání kontaktovány a hledání se tím pádem dostává i do jejich kruhů. Je zřejmé, že takto může dotaz procházet různými kruhy donekonečna nebo se např. vrátit do kruhu, ze kterého byl propagován jiným uzlem. Proto je s každým dotazem spjat jedinečný identifikátor, pomocí kterého uzel pozná, že jím již byl zpracován každý uzel si vytváří tabulku identifikátorů jím zpracovaných dotazů. Dotaz je tak propagován neustále do míst, kde ještě nebyl zpracován a pokračuje, dokud má kam. V situaci, kdy jsou uzly v kruhu přetíženy, příchozí dotaz mohou odmítnout, čímž jeho propagaci násilně ukončí. Celý proces propagace je ilustrován na obr. 5. (pozn.: uzel A již má v tabulce předem nastaven uzel E). 189

Tabulka uzlů uzlu A výraz uzly pokus E, C, L, M E F D A C B K L Uzel A hledá dokument obsahující slovo pokus Q R J G I H P M O N 4. Porovnání se systémem Gnutella Obr. 5: Propagace dotazu Každý uzel systému Gnutella obsahuje vazby na několik dalších uzlů, čímž jsou při propagaci dotazu znevýhodněny uzly s větším počtem vazeb (shluky) neboť jej propagují pomocí všech jejich vazeb. V případě kruhové topologie je zátěž uzlů při propagaci téměř rovnoměrná. Nahradíme-li shluky v Gnutelle kruhy, maximální hodnota zatížení uzlů se radikálně zlepší (viz obr 6): Gnutella Nahrazení shluků kruhy Obr. 6.: Možné vylepšení zatížení uzlů v Gnutelle Po nahrazení se ovšem sníží rychlost propagace dotazu neboť ten se musí propagovat po kruhu a ne přímo k uzlům. To se ovšem týká situace před natrénováním kruhu, kdy každý uzel obsahuje pouze vazby na sousedy. Po natrénování uzlů se rychlost propagace zvýší. Pro zjištění přesných výsledků je ovšem třeba vyvinout simulátor celého procesu. 190

4. Závěr V současné době probíhá implementace simulátoru celého systému a v době prezentace tohoto příspěvku budou k dispozici první výsledky experimentální simulační verze navrhovaného systému. Očekává se, že popsaný přístup bude efektivnější zejména z hlediska zatížení uzlů a důmyslnější z hlediska tvorby komunit. Další výzkum bude zaměřen na hledání efektivního způsobu směrování dotazů pro urychlení jejich propagace. Lliteratura: 1. Andrzej Goscinski, Wanlei Zhou. The Client-Server Model and Systems. Wiley Encyclopedia of Electrical and Electronics Engineering, Volume 3. Ed. J. G. Webster, John Wiley & Sons, Inc., New York, pp. 431-451, 1999 2. Manoj Parameswaran, Anjana Susarla, Andrew B. Whinston. P2P Networking: An Information-Sharing Alternative. IEEE Computer 34(7): 31-38 (2001) 3. gnutella.com. http://www.gnutella.com/ 4. The Free Network Project. http://freenet.sourceforge.net/ 5. Napster. http://www.napster.com/ 6. Ratnasamy, P. Francis, M. Handley, R. Karp, and S. Shenker. A Scalable and Content- Adressable Network. Proceedings of ACM SIGCOMM, San Diego, CA, USA, Aug. 2001 7. Chord. http://www.pdos.lcs.mit.edu/chord/ 8. Yunhao Liu, Zhenyun Zhuang, Li Xiao and Lionel M.Ni. AOTO: Adaptive Overlay Topology Optimization in Unstructured P2P Systems, Proceedings of IEEE Globecom 2003 9. Doval, D., O'Mahony, D. Overlay Networks: A Scalable Alternative for P2P, IEEE Internet Computing, Vol. 7, N0. 3, June/July 2003, pp 2-5 10. Ion Stoica, et. al, Chord: A scalable Peer-To-Peer lookup service for internet applications, Proceedings of the 2001 ACM SIGCOMM Conferrence pages 149 160, 2001 191