Rozsáhlé distribuované systémy v reálném světě

Podobné dokumenty

SUPERPOČÍTAČOVÉ CENTRUM

Objektově orientované databáze

Datová centra z pohledu univerzity. David Antoš Ústav výpočetní techniky Masarykova univerzita antos@ics.muni.cz

Praktické úlohy- zaměření specializace

-1- N á v r h ČÁST PRVNÍ OBECNÁ USTANOVENÍ. 1 Předmět úpravy

účetních informací státu při přenosu účetního záznamu,

VYHLÁŠKA ze dne. června 2009 o stanovení podrobností užívání a provozování informačního systému datových schránek

Národní e-infrastruktura v ČR

DATOVÉ SCHRÁNKY. Seminární práce z předmětu Information and communication policy

Obecně závazná vyhláška města Žlutice č. 2/2011 Požární řád obce

veřejná zakázka na stavební prace s názvem: Sdružená kanalizační přípojka - Město Lázně Bělohrad

Návrh individuálního národního projektu. Podpora procesů uznávání UNIV 2 systém

Nastavení telefonu Samsung I9195 Galaxy S4 mini

Zákon o elektronickém podpisu

DODATEK Č. 2 KE SMLOUVĚ O DÍLO MKDS STŘÍBRO Č. 20/HIO/2011

4. Počítačová síť. Co je to počítačová síť

Data v počítači EIS MIS TPS. Informační systémy 2. Spojení: jan.skrbek@tul.cz tel.: Konzultace: úterý

Konzistence databáze v nekonzistentním světě

Vzdělávací program pro obchodní partnery společnosti ROCKWOOL průvodce školením

Integrita dat, hash, autenticita, šifrovací algoritmus a klíč

3.6 Elektronizace odvětví: sociální služby, pojištění, dávky, sociálně- právní ochrana dětí

Cvičení 1,2 Osnova studie strategie ICT

MetaCentrum. datové služby. Miroslav Ruda, Zdeněk Šustr

Výběrové řízení zakázka na dodávku ZADÁVACÍ DOKUMENTACE

Knihovní řád. Středisko vědeckých informací Vysoké školy zdravotnické, o. p. s. Duškova 7, Praha 5

Pravidla pro využívání lokální počítačové sítě Slovanského gymnázia v Olomouci. Preambule

13. Sítě WAN. Rozlehlé sítě WAN. Počítačové sítě I. 1 (6) KST/IPS1. Studijní cíl. Představíme rozlehlé sítě typu WAN. Doba nutná k nastudování

KDirSign / KDirVerify, podrobny ná vod

Tekla Structures Multi-user Mode

ZPRÁVA O PRŮBĚHU ŘEŠENÍ PROJEKTU

ZADÁVACÍ DOKUMENTACE

Nastavení telefonu Samsung S6500 Galaxy Mini 2

POŘÍZENÍ NÍZKOEMISNÍHO ZDROJE A ZATEPLENÍ KULTURNĚ SPOLEČENSKÉ BUDOVY DŘEŠÍNEK

Předmětem dražby jsou nemovité věci ve vlastnictví povinného, a to:

Město Mariánské Lázně

Oprava střechy a drenáže, zhotovení a instalace kované mříže kostel Sv. Václava Lažany

Obec Nová Ves I. Výzva k podání nabídky

eidas ... aneb co nám přináší nařízení EU č. 910/2014 ze dne Ing.Robert Piffl Poradce náměstka ministra

MOBILNÍ KOMUNIKACE STRUKTURA GSM SÍTĚ

1. TECHNICKÉ POŽADAVKY PRODUKTŮ VEMA Klasifikace konfigurací z hlediska podpory... 7

227/2000 Sb. ZÁKON ČÁST PRVNÍ ELEKTRONICKÝ PODPIS

Manuál uživatele čipové karty s certifikátem

112 LINKA TÍSŇOVÝCH VOLÁNÍ

Věc: VEŘEJNÁ ZAKÁZKA MALÉHO ROZSAHU NA STAVEBNÍ PRÁCE PRO AKCI: dodavatele k předložení nejvhodnější nabídky na výše uvedenou zakázku.

RECTE.CZ, s.r.o., Matiční 730/3, Ostrava Moravská Ostrava

Výzva zájemcům k podání nabídky a Zadávací dokumentace

PŘÍLOHA 5 SMLOUVY O PŘÍSTUPU KE KONCOVÝM ÚSEKŮM. Bezpečnost, ochrana majetku a osob

Tisíce uživatelů v bance pracují lépe díky využití okamžitých informací o stavu kritických systémů

MAGIS ve strojírenské firmě Strojírna Vehovský s.r.o.

PŘIJÍMACÍ ŘÍZENÍ. Strana

INFORMATIKA V CHOVECH PRASAT

ZADÁVACÍ DOKUMENTACE. Pořízení a provoz konsolidované IT infrastruktury

ZADÁVACÍ DOKUMENTACE

KVALIFIKAČNÍ DOKUMENTACE k veřejné zakázce zadávané podle zákona č. 137/2006 Sb., o veřejných zakázkách, ve znění pozdějších předpisů

KVALIFIKAČNÍ DOKUMENTACE k veřejné zakázce zadávané podle zákona č. 137/2006 Sb., o veřejných zakázkách, ve znění pozdějších předpisů

Projekt: Inovace oboru Mechatronik pro Zlínský kraj Registrační číslo: CZ.1.07/1.1.08/

Server. Software serveru. Služby serveru

2/18. 1 ) Číslovací plán síťových směrovacích čísel, uveřejněný v částce 9/2003 Telekomunikačního věstníku.

Výzva k podání nabídek (zadávací dokumentace)

Pokyny k instalaci FRIATRACE Verze 5.3

Všeobecné požadavky na systém analýzy nebezpe í a stanovení kritických kontrolních bod (HACCP) a podmínky pro jeho certifikaci

Město Týnec nad Sázavou K Náklí 404, Týnec nad Sázavou

ODŮVODNĚNÍ VEŘEJNÉ ZAKÁZKY

Pokyn D Sdělení Ministerstva financí k rozsahu dokumentace způsobu tvorby cen mezi spojenými osobami

Manažerské shrnutí ex-ante evaluace OP Zaměstnanost

VŠEOBECNÉ PODMÍNKY PRO POSKYTOVÁNÍ VEŘEJNĚ DOSTUPNÝCH SLUŽEB ELEKTRONICKÝCH KOMUNIKACÍ PROSTŘEDNICTVÍM VEŘEJNÝCH TELEFONNÍCH AUTOMATŮ

U S N E S E N Í. I. Elektronické dražební jednání se koná dne v 09:00:00 hodin, prostřednictvím elektronického systému dražeb na adrese:

MEZINÁRODNÍ AUDITORSKÝ STANDARD ISA 505 EXTERNÍ KONFIRMACE OBSAH

Obsah Celex č. Ustanovení 32013L0055

Zadávací dokumentace k veřejné zakázce zadané podle zákona č. 137/2006 Sb., o veřejných zakázkách, ve znění pozdějších předpisů

Regenerace zahrady MŠ Neděliště

Zadávací dokumentace

V Černošicích dne Výzva k podání nabídky na veřejnou zakázku malého rozsahu s názvem: Nákup a pokládka koberců OŽÚ.

Ministerstvo školství, mládeže a tělovýchovy

Název zakázky: E. Beneše 1747 výměna 5 ks stoupacího potrubí vody a splaškové kanalizace - II. etapa

Nastavení telefonu LG GD510 Pop

ZADÁVACÍ DOKUMENTACE

MĚSTO BENEŠOV. Rada města Benešov. Vnitřní předpis č. 16/2016. Směrnice k zadávání veřejných zakázek malého rozsahu. Čl. 1. Předmět úpravy a působnost

ZADÁVACÍ DOKUMENTACE

KOMISE EVROPSKÝCH SPOLEČENSTVÍ

ZŘÍZENÍ SAMOSTATNÉ METEOROLOGICKÉ STANICE

URBACT Věstník Listopad 2010 #10

OBEC HORNÍ MĚSTO Spisový řád

FWA (Fixed Wireless Access) Pevná rádiová přípojka

499/2004 Sb. ZÁKON ČÁST PRVNÍ ARCHIVNICTVÍ A SPISOVÁ SLUŽBA

ROZKLIKÁVACÍ ROZPOČET - ONLINE ZVEŘEJŇOVÁNÍ EKONOMICKÝCH DAT ÚŘADU

2. CÍL A SOUVISLOSTI VÝBĚROVÉ ŘÍZENÍ 1. NÁZEV

Zabezpečení cloudové infrastruktury

statutární město Děčín podlimitní veřejná zakázka na služby: Tlumočení a překlady dokumentů

Inovované řešení VDT/VT

Nastavení telefonu LG KB770

Všeobecné podmínky firmy Libor Vajgl Rywa Software pro poskytování telekomunikačních služeb

Operace nad celými tabulkami

Výzva k podání nabídek

Podmínky užití webového rozhraní

Ministerstvo vnitra České republiky vyhlašuje Výzvu k předkládání žádostí o finanční podporu v rámci. IOP Integrovaný operační program

O b s a h : 12. Úřední sdělení České národní banky ze dne 1. října 2001 k využívání outsourcingu bankami

S_5_Spisový a skartační řád

PALETOVÉ REGÁLY SUPERBUILD NÁVOD NA MONTÁŽ

Transkript:

Rozsáhlé distribuované systémy v reálném světě LuděkMatyska Kolokviálníprofesorská přednáška Fakulta informatiky, Masarykova univerzita

Motto Much ofthepresentinterestin parallel processingstems from a nowwell documentedtechnologicaltrend the decliningcostofprocessing, storage, and communications. 7. října 2008 Distribuované systémy 2

Motto Much ofthepresentinterestin parallel processingstems from a nowwell documentedtechnologicaltrend the decliningcostofprocessing, storage, and communications. W. A. Kornfeld, C. E. Hewitt, IEEE Transactions on Systems, Man, and Cybernetics, 11(1), January 1981 7. října 2008 Distribuované systémy 3

Internet jako distribuovaný systém Vlastní přenosový systém Trasy a aktivní prvky Vysoká míra homogenity Malý počet jednoduchých služeb Zapojení koncových stanic Heterogenita Prakticky nekonečné množství služeb Přímé zapojení koncových uživatelů 7. října 2008 Distribuované systémy 4

Vlastnosti Postupné stírání rozdílu mezi úzce propojenými paralelními a volně propojenými distribuovanými systémy Významný vliv kvality sítě Relativně vzhledem k parametrům paralelních (super)počítačů >100 milionů propojených uzlů Spíše teoretická veličina Peer to peer sítě i jednotky milionů Silně koordinované systémy podstatně menší 7. října 2008 Distribuované systémy 5

Naše motivace Postavit a provozovat rozsáhlou výpočetní a úložnou infrastrukturu Primární přístup prostřednictvím úloh Tvořeny jedním či více procesy Pracují s nějakými daty Dávkové nebo interaktivní Pokročilé použití: virtuální clustery Manipulace, zpřístupnění, 7. října 2008 Distribuované systémy 6

Rozsáhlá infrastruktura Grid Stovky propojených míst Desítky až stovky tisíc zapojených uzlů Koordinované využití Koordinace na technologické i organizační úrovni Různorodé požadavky na bezpečnost dat i zabezpečení infrastruktury Výrazně vyšší míra kontroly než peerto peersítě Cenou ztráta flexibility a části autonomie uzlů Dependable computing: je možné se spolehnout 7. října 2008 Distribuované systémy 7

Funkční požadavky na prostředí Jednoznačně identifikovat úlohu A to i za předpokladu více nezávislých vstupů úloh do infrastruktury Naplánovat úlohu Nezbytná znalost stavu infrastruktury Data a jejich rozložení Sledovat chování úlohy Průchod komponentami Správa dat Ukládání, transport, replikace Zajistit bezpečnost celého systému Zdroje, procesy i data 7. října 2008 Distribuované systémy 8

Globální identifikace úlohy Není možná centralizovaná služba Výkonnost i spolehlivost Statisticky jedinečný identifikátor URL místa vstupu úlohy plus hashdalších parametrů včetně času https://tigerman.cnaf.infn.it:9000/ec8depe696avu55 7gvHWg Monitorování na uvedeném URL Aplikováno v projektech EU EGEE 7. října 2008 Distribuované systémy 9

Naplánování úlohy Centrální (meta) plánovač Předpokládá kompletní znalost stavu infrastruktury Úzké místo Škálovatelnost: milion úloh denně znamená 12 úloh za sekundu Kooperující plánovače Latence rozhodování Soupeřící plánovače Fibich, Matyska, Rudová: Model of Grid Scheduling Problem, Exploring Planning and Scheduling for Web Services, Grids and Autonomic Computing, AAAI Press, 2005 7. října 2008 Distribuované systémy 10

Sledování stavu infrastruktury Nezbytný předpoklad pro plánovač Senzory nasazené na jednotlivé komponenty Infrastruktura sběru a agregace informací Capability Based Grid Monitoring Architecture (C-GMA) A. Ceccanti et al: Towards Scalable and Interoperable Grid Monitoring Infrastructure, 1st CoreGID Integration Workshop, 2005 Sitera et al: Capability and Attribute Based Grid Monitoring Architecture. Proc. CGW04, 2005 Aplikačně orientované sledování L. Matyska et al: Non-centralizedGrid Infrastructure Monitoring, Dagstuhl Seminar, 2004 Holub et al: Grid infrastructure monitoring as reliable information service. LNCS 3165, 2004 7. října 2008 Distribuované systémy 11

Sledování úloh Průchod řadou komponent Pouze lokální informace Služba Logging and Bookkeeping Události plynou od komponent Stavový automat s korekcí chyb G. Avellino et al: The DataGrid Workload Management Systém: Challenges and Results, J. GridComputing2(4) 2005 Kouřil et al: Distributed Tracking, Storage, andre-use of Job State Information on the Grid, CHEP 2004 Job Provenance Trvalé úložiště informací o stavu úloh Dvořák et al: glite Job Provenance. IPAW 2006, LNCS 4145, 2006 7. října 2008 Distribuované systémy 12

Bezpečnost Identifikace uživatele Používá zdroje, které nikdy neviděl, poskytované institucemi, s nimiž nemá žádný bezprostřední formální vztah Kouřil, Procházka, Matyska: Experience with PKI in a Large-scale Distributed Environment, EUNIS07, 2007 Oprávnění přístupu Granularita příliš mnoho uživatelů i komponent (služeb) 7. října 2008 Distribuované systémy 13

Utkvělé představy o vlastnostech Komponenty distribuovaného systému jsou spolehlivé Topologie sítě/distribuovaného systému se nemění Síť/Distribuovaný systém je homogenní Distribuovaný systém má jednoho správce Cena přenosu dat je nulová Zpoždění je nulové Propustnost je nekonečná Síť je bezpečná Čas na prvcích je synchronizován 7. října 2008 Distribuované systémy 14

Sledování stavu infrastruktury Senzory na komponentách Spolehlivost senzorů Potřebujeme sběrnou/agregační infrastrukturu Kdo hlídá hlídače? C-GMA pro agregaci různorodých infrastruktur Aplikačně orientované sledování Místo senzoru malá aplikace Ověří všechny komponenty systému Výsledkem data o stavu Sbírána a vyhodnocena nezávisle na aplikaci Nestačí jeden systém, nutná křížová kontrola 7. října 2008 Distribuované systémy 15

Plánování úloh problémy Rychlost přijetí úloh systémem 5000 úloh trvá 7 minut při propustnosti milion úloh denně Rychlost zpracování plánovačem Vylučuje jednoduché nasazení složitého plánování Triviální plánovače versus nepoužitelné Neaktuálnost informací o infrastruktuře Neexistence globálního stavu (rychlost světla) Chyby senzorů i konfigurací Černé díry 7. října 2008 Distribuované systémy 16

Plánování úloh MatchMaking Párování požadavků úloh (např. paměť, počet procesorů, ) a parametrů zdrojů Zpravidla First fit Sémantika parametrů Ad hoc Globální dohoda Glue Schema Velmi závislé na kvalitě informací o úlohách i zdrojích V podstatě velmi primitivní plánovač Žádné pokročilé schopnosti, např. dodržení požadavku na čas dokončení úlohy 7. října 2008 Distribuované systémy 17

Pilotní úlohy Snaha odstranit nedostatky spolehlivosti Plánuje se obálka, tj. prázdná úloha Pokud se obálka skutečně spustí (tj. nezasekne se ani se neztratí), pak si ověří prostředí, v němž byla spuštěna a šáhne si na skutečnou úlohu V podstatě implementace konceptu aplikačněorientovaného sledování infrastruktury Obálka úlohy je sama testem Ztracené obálky se nepočítají Umožňuje implementovat velmi důmyslné algoritmy plánování na straně uživatele Ovšem v realitě se tato možnost zatím nevyužívá 7. října 2008 Distribuované systémy 18

Událostmi řízené plánovaní Různé typy událostí: Příchod nové úlohy Úspěšné ukončení úlohy Zhroucení úlohy či uzlu Ztráta/zmizení úlohy Událost způsobí pře-plánování Stavíme skutečný plán úloh Možnost průběžné optimalizace plánu Běží mezi příchodem událostí Rychlá reakce po příchodu události Umí pracovat i v nekooperativním módu Klusáček, Rudová, Matyska: Local Search for Deadline Driven Grid Scheduling, MEMICS 2007 Klusáček, Matyska, Rudová: Alea Grid Scheduling SimulationEnivronment, LNCS 4967, 2007 7. října 2008 Distribuované systémy 19

Logging andbookkeeping(lb) Koncept a služba vyvinutá v rámci projektů EU Pracuje rovněž s konceptem událostí Lokální změny stavu úlohy Předání úlohy mezi komponentami Události sbírá centralizovaná komponenta Bookkeeping server Počítá s nespolehlivostí distribuovaného prostředí Nesynchronizovaný čas Události mohou přijít v libovolném pořadí Události se mohou ztratit (i přes zabezpečení komunikační protokoly) 7. října 2008 Distribuované systémy 20

Sběr dat 7. října 2008 Distribuované systémy 21

Zpřístupnění dat 7. října 2008 Distribuované systémy 22

Job Provenance LB drží data jen pokud je úloha aktivní JP reaguje na potřeba dlouhodobého ukládání informací o skončených úlohách Dvě komponenty JP Primary Server optimalizován pro ukládání Rozšířená kopie záznamuz LB JP Index Server optimalizován pro dotazy Index k jedné či více JPPS Zpřístupnění dat s měnícími se formáty Koncept plug-inů, zpracovávají přicházející data Umožňuje rozšiřování sémantiky ukládaných dat Uživatelské anotace Možné přidávat i po skončení úlohy 7. října 2008 Distribuované systémy 23

JP Primary Server 7. října 2008 Distribuované systémy 24

JP Index Server 7. října 2008 Distribuované systémy 25

Nasazení LB a JP LB v produkčním provozu na desítkách míst po Evropě i mimo ni JP v experimentálním nasazení Účast na ProvenanceChallenges V rámci EU projektu Provenances Integrace se systémy zpřístupnění a manipulace s uloženými údaji Charon (ČR) DashBoard (EU) 7. října 2008 Distribuované systémy 26

Bezpečnost identifikace uživatele Centralizovaná řešení (Kerberos) Špatná škálovatelnost Složité přes několik administrativních domén Distribuovaná řešení Systém veřejných klíčů, Public Key Infrastructure (PKI) Role Certifikačních Autorit (CA) Organizace, která potvrdí spojení konkrétní osoby a jejího veřejného klíče Udržuje seznam již neplatných (revokovaných) klíčů Akceptujeme-li CA, nepotřebujeme sami identifikovat uživatele Musí existovat způsob certifikace CA EUGridPMA, IGTF 7. října 2008 Distribuované systémy 27

Problémy PKI Poměrně složité získání certifikátu Jednoduchost by ale znamenala riziko ztráty důvěryhodnosti Ochrana soukromého klíče Binární data, uložená na disku riziko zkopírování Ochrana heslem Uložení na hardwarovém tokenu (chipová karta, USB klíč) Klíč nutný k identifikaci osoby, která zadala úlohu Ovšem úloha může velmi dlouho čekat ve frontě, jak zajistit bezpečnost v tomto případě Proxy certifikáty Vygenerované krátkodobé klíče, potvrzené majitelem dlouhodobého klíče Problém obnovení proxy certifikátu 7. října 2008 Distribuované systémy 28

Tokeny Nemusí dlouhodobý klíč vůbec zpřístupnit Přímo provádějí nezbytné operace Praktické problémy Koncept původně vyvinut pro webové služby, kde stačila jednorázová identifikace Přístup k Internetovému bankovnictví Nevhodné pro častou opakovanou autentizaci Např. s každou úlohou Proxy certifikát nepomůže jak automaticky obnovovat? Důsledek: USB klíč trvale zapojen do stolního počítače s přístupem přes síť Kompletní popření výhod tokenů Zkušenosti z národního projektu poskytování tokenů uživatelům 7. října 2008 Distribuované systémy 29

Federace Místo jednotného autentizačního mechanismu jejich kooperace Využití spolehlivých autentizačních mechanismů domovských institucí uživatelů Při autentizaci uživatele vůči konkrétní službě se požadavek přesměruje na domovskou organizaci Identity Provider (IdP) Ta ověří a vydá verdikt Součástí odpovědi mohou být i atributy uživatele Částečná anonymizace, IdP sdělí např. zda se jedná o studenta či učitele, ale nesdělí totožnost» Identitu lze dohledat Navázání na PKI on-line certifikační autorita Stále problém s obnovením krátkodobého certifikátu Procházka et al: Transaprent Security for Collaborative Envirnments. 3rd Collaborative Computing, 2007 7. října 2008 Distribuované systémy 30

Složité úlohy plánování Advancedreservation Potřebujeme úlohu spustit v určitém čase v budoucnosti Nezbytné rovněž pro férovou podporu distribuovaných úloh Souběžné spuštění na více strojích Známé přístupy vedou k velkému plýtvání zdroji Řešeno blokací strojů, případně násilným ukončením úloh, které by ohrozily rezervaci Interaktivní úlohy Potřeba okamžitého neplánovaného uvolnění zdrojů 7. října 2008 Distribuované systémy 31

Řešení pomocí virtualizace Stejný přístup pro advanced rezervace i pro interaktivní úlohy Využití preempce Pozastavíme právě vykonávanou úlohu a zdroje poskytneme rezervované nebo interaktivní úloze Virtualizace poskytuje nezbytné zapouzdření a ochranu Je možné rovněž využít migraci Úloha potřebuje uzel s konkrétní vlastností, na kterém běží jiná úloha, kterou je možno přesunout na jiný generický uzel Další využití Scavenger (nízkoprioritní) úlohy 7. října 2008 Distribuované systémy 32

Virtualizované plánování Systém Magrathea Rozšíření standardních plánovačů o koncept virtuálních strojů Nové stavy Přepínání mezi virtuálními počítači na jednom uzlu Denemark, Ruda, Matyska: Magrathea Grid Management Using Virtual Machine, CGW06, 2007 Ruda, Denemark, Matyska: Scheduling Virtual Grids: the Magrathea Systém. Int. Workshop on Virtualization Technology in Distributed Computing, ACM DL, 2007 7. října 2008 Distribuované systémy 33

Bezpečnost versus jednoduchost použití Bezpečnostní požadavky někdy v rozporu s potřebami uživatelů Bezpečnostní záplaty mohou měnit chování systému (numerická stabilita) Starší aplikace nemusí být kompatibilní s moderními autentizačními metodami Vyladění/konfigurace systému pro konkrétní aplikaci vyžaduje administrátorské oprávnění Komplikace při stavění MPI a podobných paralelních úloh Timetout při autentizaci může zhroutit celý výpočet 7. října 2008 Distribuované systémy 34

Virtualizované řešení Úlohu zapouzdříme do virtuálního počítače Tomu omezíme přístup do sítě Uživatel ani s administrátorským oprávněním nemůže tato omezení překonat Virtuální počítač může spouštět i zastaralé (nezáplatované) verze operačních systémů a aplikací V případě interaktivního přístupu vytvoříme chráněnou bránu,která propustí provoz mezi počítačem uživatele a virtuálním počítačem Je možné definovat celé virtuální clustery a uživateli zajistit chráněný přístup Clustery mohou běžet vlastní/vyladěné verze operačního systému uživatele 7. října 2008 Distribuované systémy 35

Virtualizace sítě Podpora vysokorychlostní komunikace mezi virtuálními počítači na rozlehlé sítí Nezbytné např. pro MPI úlohy Virtualizace na tzv. Level 2 (v podstatě virtuální Ethernet) Umožňuje spouštět současně virtuální clustery se stejnými IP adresami Vhodné zejména pro starší aplikace, které nemají podporu dynamické změny IP adres Podporuje stejně IPv4 i IPv6 Řízené plánovačem Po počátečním nastavení není třeba zásah síťových administrátorů Aktuálně na páteři CESNET2 mezi Brnem, Prahou a Plzní Antos et al: VirtCloud: Virtualising Network for Grid Environments, AINA 2009, submitted 7. října 2008 Distribuované systémy 36

Distribuované výpočetní infrastruktury hlavní reprezentanti Evropa EGEE EnablingGridsfor E-sciencE USA TeraGrid OSG OpenScience Grid Asie Japonsko: Naregi Čína: ChinaGrid(IPv6) 7. října 2008 Distribuované systémy 37

EGEE Série dvouletých EU projektů Aktuálně EGEE III Průměrný rozpočet cca 50 MEuro, příspěvek Unie kolem 35 MEuro Zajištění provozu Podpora uživatelů a aplikací Pomoc při gridifikaci Součástí vlastní vývoj middleware glite V podstatě kompletní řešení výpočetní a úložné infrastruktury LB a JP služby výsledkem našeho zapojení Instalovány na desítkách míst v produkční infrastruktuře 7. října 2008 Distribuované systémy 38

TERAGRID OSG EGEE Infrastructure Country Baltic Grid participating in EGEE DEISA EUMedGrid See-Grid EUChinaGrid EUIndiaGrid NAREGI EUAsiaGrid EELA > 250 sites in 40 countries > 40 000 CPUs > 15 PB storage > 150k jobs/day > 250 Virtual Organizations 7. října 2008 Distribuované systémy 39

EGEE organizace Hlavní koordinátor: CERN V EGEE II více jak 90 partnerů, EGEE II stále cca 50 partnerů V EGEE III z každé země jen jeden akademický partner Realizováno mechanismem JRU (Joint Research Units) Za ČR sdružení CESNET Regionálně sdruženo do federací ČR součástí Středoevropské federace (Rakousko, Polsko, Slovensko, Maďarsko, Slovinsko, Chorvatsko) Zastupuji federaci v rámci Project Management Board 7. října 2008 Distribuované systémy 40

EGI DS European Grid Initiative Design Study Projekt zaměření na nalezení vhodného organizačního i finančního modelu dlouhodobě udržitelné celoevropské gridové infrastruktury V podstatě na zakázku Evropské komise Definovat prostředí a funkce na národní i EU úrovni, navrhnout postupy a připravit vlastní realizaci (včetně doporučení grantovým agenturám i EU ohledně financování) Pouze 9 partnerů, ale ustaven Policy Board, v němž jsou zástupci všech členských států EU (i dalších zemí) Postaven na konceptu Národních gridových iniciativ/infrastruktur Analogie NREN (National Research and Educational Network operator) Zahájen 1. srpna 2007 Od 1. července 2008 jsem koordinátorem projektu 7. října 2008 Distribuované systémy 41

Česká republika projekt MetaCentrum Součást výzkumného záměru sdružení CESNET Tři hlavní uzly Plzeň, Praha, Brno Přes 1300 jader a téměř 100 TB úložné kapacity Plus 2*200 TB v páskových knihovnách Široké spektrum aplikací Převažuje výpočetní chemie a obecně univerzitně orientované výpočetní vědy Přes 150 uživatelů 7. října 2008 Distribuované systémy 42

Shrnutí Distribuované systémy představují budoucnost prostředí, které dnes nazýváme Internet Sdílení a vzdálený přístup ke zdrojům, sdílení a zpřístupnění dat, informací i znalostí, stále se rozšiřující nabídka nových služeb, podpora spolupráce, E-Infrastruktura je ve stále větší míře akceptována jako nezbytná základ výzkumného prostoru bez ohledu na konkrétní vědu a její orientaci Konstrukce reálně použitelných distribuovaných systémů je stále velmi složitý problém Peer to peer sítě sice spojují miliony uzlů, ale jejich efektivita je příliš nízká, případně nejsou jasné bezpečnostní důsledky (např. skype) Rozsáhlé systémy příliš složité pro jednoduché analytické zpracování Neexistence globálního stavu Analogie se systémy v živé přírodě Problém reprodukovatelnosti experimentálních výsledků 7. října 2008 Distribuované systémy 43

Vlastní práce Kombinace návrhu, budování a provozu rozsáhlých distribuovaných systémů Nejrůznější aspekty tohoto prostředí Sítě, plánování, middleware, bezpečnost, uživatelé, aplikace Distribuovaný systém jako základ prostředí pro spolupráci Fokus různorodých výzkumných aktivit Od základních konceptů architektur až po reálnou produkční implementaci Rychlý přenos výsledků do praxe na národní i mezinárodní úrovni Výzkum v této oblasti znamená kombinaci teoretických i experimentálních přístupů a simulací Jedná se již dlouhodobě o jednu z největších výzev Informatiky 7. října 2008 Distribuované systémy 44

Děkuji za pozornost Dotazy?