Superpočítání a gridové počítání



Podobné dokumenty
Superpočítání a gridové počítání

Distribuované výpočty a GRID: prostředky a. Martin Petř ek, Petr Kulhánek Jan Kmuníč ek

Charon Extension Layer (CEL)

SCB Superpočítačové centrum Brno

C2115 Praktický úvod do superpočítání

C2115 Praktický úvod do superpočítání

Obsah. Motivace gridu Projekty distrib. počítání. OGSA, OGSI, Globus Toolkit EGEE Grid Metacentrum

Výběr zdrojů, zadávání a správa úloh v MetaCentru

Výběr zdrojů, zadávání a správa úloh

MetaCentrum - Virtualizace a její použití

User manual SŘHV Online WEB interface for CUSTOMERS June 2017 version 14 VÍTKOVICE STEEL, a.s. vitkovicesteel.com

Paralelní výpočty na clusteru KMD

Dagmar Adamová, Jiří Chudoba Jednalo se o Monte Carlo simulace případů srážek p+p a Pb+Pb. Fungování

Národní centrum pro výzkum biomolekul & MetaCentrum

aktivita CESNETu společně MU, UK a ZČU sdružuje výpočetní prostředky

apt-get install freeradius

Novinky z vývoje v MetaCentru

Kurz Databáze. Přechod na SQL server. Obsah. Vytvoření databáze. Lektor: Doc. Ing. Radim Farana, CSc.

Vytvoření pokročilé Fotogalerie v Drupalu - Views

Vytvoření účtu pro studenty na webových stránkách Student Community

SUPERPOČÍTAČE DANIEL LANGR ČVUT FIT / VZLÚ

Úvod do Operačních Systémů

Jak importovat profily do Cura (Windows a

GUIDELINES FOR CONNECTION TO FTP SERVER TO TRANSFER PRINTING DATA

Project EGEE-II / VOCE

uzly. Výpočetní uzel (Working node) výkonná jednotka clusteru.

Aktuální stav. Martin Kuba CESNET a ÚVT MU

C2115 Praktický úvod do superpočítání

Výpočetní zdroje v MetaCentru a jejich využití

METACentrum zastřešení českých gridových aktivit

Návod ke cvičení předmětu BPGA ControlLogix

READERS OF MAGAZINE DOMA DNES

Informace o produktu Instalace programu MMS 3910 W. Konfigurační sada. Datum Platí pro Konfiguarční program MMS 3910W Version 2.01 f.f.

METACentrum Český národní gridovýprojekt. Projekt METACentrum. Jan Kmuníček ÚVT MU & CESNET. meta.cesnet.cz

Úvod, jednoduché příkazy

EU EGEE Presentace projektu

Uživatelský modul. Modem Bonding

Nastavení připojení k internetu prostřednictvím terminálu Axesstel TX210LF platí pro Windows 98 SE (Second Edition) a Windows ME (Millenium Edition)

MetaCentrum. Martin Kuba CESNET

READERS OF MAGAZINE DOMA DNES

READERS OF MAGAZINE DOMA DNES

Připojení k bezdrátové síti eduroam na VFU Brno s mobilním telefonem se systémem Android

Návod ke cvičení předmětu BPGA SLC 500

Studium enzymatické reakce metodami výpočetní chemie

eduroam.cz správa a deployment pomocí Ansible

2N LiftIP. IO Extender. Communicator for Lifts. Version

Datová úložiště v MetaCentru a okolí II. David Antoš Oddělení datových úložišť

Převod prostorových dat katastru nemovitostí do formátu shapefile

WL-5480USB. Quick Setup Guide

Úvod do Operačních Systémů

Instalace RouterOS pomocí programu NetInstall

ZOS CV1 Základy operačních systémů

Registrační číslo projektu: CZ.1.07/1.5.00/ Elektronická podpora zkvalitnění výuky CZ.1.07 Vzděláním pro konkurenceschopnost

DŮLEŽITÉ INFORMACE, PROSÍM ČTĚTE!

MetaCentrum. Tomáš Rebok MetaCentrum NGI, CESNET z.s.p.o. CERIT-SC, Masarykova Univerzita Olomouc,

IP telefon Linksys SPA-921 (SIP) Stručný průvodce instalací a konfigurací

NÁVOD K POUŽITÍ. IP kamerový systém.

The installation documentation will help guide you through the process of installing these prerequisites and setting up VuFind.

USER'S MANUAL FAN MOTOR DRIVER FMD-02

Avaya IP Office R8.0 - Jak ji nakonfigurovat s 2N Helios IP

Postup instalace UMTS modemu Huawei K3765 od Vodafone (SalixOS, ZenWalk, Slackware)

2. Entity, Architecture, Process

Čipové karty Lekařská informatika

Úvod do Unixu. man: příkaz pro zobrazení nápovědy k danému příkazu, programu (pokud je k dispozici), např. man cp. pwd: vypíše cestu k aktuální pozici

Firemní strategie pro správu mobilních zařízení, bezpečný přístup a ochranu informací. Praha 15. dubna 2015

108Mbps Wlireless 11G+ PCI-Card. Instalační manuál P/N:

Microsoft Lync WEB meeting

Petr Vlk KPCS CZ. WUG Days října 2016

LOGBOOK. Blahopřejeme, našli jste to! Nezapomeňte. Prosím vyvarujte se downtrade

CAL (CAN Application Layer) a CANopen

Gridy v České republice. Luděk Matyska Masarykova univerzita v Brně CESNET, z.s.p.o.

Skripty - úvod. Linux - skripty 2

BEZPEČNOST SLUŽEB NA INTERNETU

1. Maple - verze. 2. Maple - prostredi. Document Mode vs. Worksheet Mode

POČÍTAČOVÉ SÍTĚ A KOMUNIKACE

Jméno autora: Mgr. Alena Chrastinová Datum vytvoření: Číslo DUMu: VY_32_INOVACE_O7_AJ

MAXGUARD GT gelcoat na výrobu forem AME 6000 T-35 bariérová pryskyřice AROPOL XO pryskyřice na výrobu forem

NWA Příručka k rychlé instalaci. Dvoupásmový bezdrátový přístupový bod N třídy business

Hunk: analýza surových dat do 60 minut

2N Voice Alarm Station

1, Žáci dostanou 5 klíčových slov a snaží se na jejich základě odhadnout, o čem bude následující cvičení.

produktů. produkty: AutoCAD Mechanical Showcase Autodesk Autodesk Designer SketchBook Autodesk Mudbox Vault Autodesk Ultimate Intel Xeon Intel Core

Utilita L32 LogSync v

SQL a XML jako alternativa ke klasickým unixovým nástrojům

Datová úložiště v MetaCentru a okolí. David Antoš

Dávkový rendering prostřednictvím sítě

2.2 Acronis True Image 19

2N LiftIP. Voice Alarm Station. Communicator for Lifts. Version

Úvod. unx-predn_01-uvod.odt :13:43 1

Informační systém webhostingu

Výběr informačních prostředků a technologií

Internet Information Services (IIS) 6.0

7.VY_32_INOVACE_AJ_UMB7, Tázací dovětky.notebook. September 08, 2013

Nastavení DCOM. Uživatelský manuál

READERS OF MAGAZINE DOMA DNES

DETERMINATION OF MECHANICAL AND ELASTO-PLASTIC PROPERTIES OF MATERIALS BY NANOINDENTATION METHODS

EMBARCADERO DATASNAP. OBSAH Úvod... 2 DataSnap a DBExpress... 2 Serverová část... 2 VCL Klient... 6 Nasazení... 7

Embedded SQL v C/C++ úvod. Administrace Oracle Kateřina Opočenská

Výukový materiál zpracovaný v rámci operačního programu Vzdělávání pro konkurenceschopnost

Uživatelský modul. wm-bus Concentrator

Transkript:

Superpočítáníagridovépočítání MartinPetřek,1,2PetrKulhánek,1,2 JanKmuníček1,3 petrek@chemi.muni.cz,kulhanek@chemi.muni.cz,kmunicek@ics.muni.cz 1)CESNETz.s.p.o.,Zikova4,CZ 16000Praha,Českárepublika 2)Národnícentrumprovýzkumbiomolekul,PřírodovědeckáFakulta,Masarykovauniverzita, Kotlářská2,61137Brno,Českárepublika 3)Ústavvýpočetnítechniky,Masarykovauniverzita,Botanická68a, 60200Brno,Českárepublika Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

Obsah 1.Náročnévýpočtyaaplikace Výpočetníchemie,částicováfyzika,zpracovánídat 2.Gridovésystémyaprácevnich METACentrum,EGEE2 3.Softwareprořazeníasprávuúloh PBS,gLite/LCG ukázkaspouštěníjobů 4.SystémCHARON Koncepcesystému Použitínaklastruavgridu Správaaplikací Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

Náročnévýpočtyaaplikace Cojsounáročnévýpočty? relativnípojemvzhledemkprudkémuvývojvýpočetní techniky jednotkavýkonu FLOPS(FloatingPointOperationsPerSecond) jednotkadat BYTE dnešnípentium4,1gbram,2ghz výkonněkolikgflops donáročnýchvýpočtůřadímeaplikacevyžadující výkonvřádech>=tflopsvyšší prácesdatyvřádech>=gb aplikaceběžícínasuperpočítačíchneborozsálých výpočetníchsystémech(gridy) dobaběhunadomácímpcbytrvalatýdny,měsíce,roky,... Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

Náročnévýpočtyaaplikace Typyaplikací: Matematicko Fyzikálníaplikace: modelypředpovědipočasí(systémaladin) simulaceexperimentůzoblasičásticovéfyziky(hep) úlohyzoblastipružnosti pevnosti,termo elasticita(fem) simulaceprouděníkapalin(cfd) materiálovéinženýrsví,nanotechnologie simulacezemetřesení NP těžkéúlohy(tsp),optimalizačníúlohy úlohyzlineárníhoresp.matematickéhoprogramování lámáníšifer(des,enigma[m4project]) hledáníprvočísel(gimps),... Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

Náročnévýpočtyaaplikace Typyaplikací: Chemické biologickéaplikace: simulacechováníbiologickýchsystémů(molekulovádynamika) návrhyléčiv(studiuminterakceenzymxléčivo) molekulovédokováníakonformačníanalýzamolekul zkoumáníreakčníchmechanizmů(tranzitnístavy,odhady energetickýchrozdílůproreakčnícestu, výpočty'volnéenergie') proteinfolding simulacechováníorganismůvprostředí šířeníepidemiívprostředí Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

Náročnévýpočtyaaplikace Typyaplikací: Zpracovánídat: lékařsví(ct snímky,nmr,příznakovérozpoznávání) zpracovánírozsáhlýchstatistik analýzaarozpoznáváníobrazu HEP částicovéexperimenty(atlas,cms,alice,lhcb) tvorbaexpertníchsystémů(ai) Visualizacedat renderovánínáročnýchscén Ostatní simulacesociálníchaekonomickýchjevů...aspoustadalších... Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

Náročnévýpočtyaaplikace Příkladzvýpočetníchemie výpočetvolnéenergie hlavníúloha(dobaběhu~15h) generujemnohopodúloh(stovky) podúloha(dobaběhu~ 25h)(2CPU) získáme profil (graf) volné energie v intervalu (a,b) nadomácímpc(1cpu) byúlohatrvala~7měsíců (24hdenně) vmetacentru~za3dny mámevýsledky Reakční koordináta a b Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

Náročnévýpočtyaaplikace Příkladzvýpočetníchemie výpočetvibračníchmodůmolekuly výpočetmatice2.derivacíenergiepodlesouřadnic(tzv.hessian) 3*N*2nezávislýchvýpočtůgradientuenergie(Quant.Mech.) N ~ 100 atomů => 600 úloh 1 úloha ~ 1 hodina na domácím PC ( 25 dní ) v METACentru ~ 1hodina Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

Gridovésystémyaprácevnich Computercluster několikpočítačůspojenýchpomocísítě(lan) lzesnimipracovatodděleněnebosemůžounavenek(při vzdálenémpřipojení)jevitjakojedenpočítač uvnitřsítěselzesvobodněpohybovat (jednotlivépočítačesinavzájem věří ) lzepoměrnělevněpostavitzběžnědostupnýchpcasíťových komponent většinoustejnétypystrojů(homogenníclusterxheterogennícluster) Gridovýsystém rozsáhlýcodopočtuvýpočetníchstrojů,ukládacíchkapacit,... chápánspíšjakovýpočetnínástrojnežjakojedenpočítač spojeníněkolika clusterů,různéarchitektury,heterogennístroje velkýdůraznabezpečnost(dílčíclusterymohoubýtrůzněposvětě) Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

Gridovésystémyaprácevnich Společnéznakyvětšinyklastrů: cn4 operačnísystémytypuunix(unix,linux,freebsd,netbsd,...) sdílenísouborůvklustru(souborovésystémynfs,afs,...) systémsprávyaplikačníhosoftwaru(systémtzv.modulů) autentizačnísystémvrámciklastru(kerberos) aspoňjedencentrálníuzelpropřístupzvenčí(ssh,certifikáty,...) softwareprořazeníúlohdofronty(pbs+varianty,nqe,lsf,...) uživatelmáúčet,domovskýadresářpřímovsystému zcentrálníhouzluselzelogovatnajednotlivéstrojebezhesla cn5 cn6 cn0 Firewall cn1 cn2 cn3 internet Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

Gridovésystémyaprácevnich příkladhpc(high performancecluster): http://meta.cesnet.cz(sdruženícesnet) Distribuovanývýpočetnísystém SuperpočítačovécentrumBrnoMU (http://scb.ics.muni.cz/static) SuperpočítačovécentrumUK (http://supercomp.cuni.cz) SuperpočítačovécentrumZČU (http://zsc.zcu.cz) Techinfo: 218uzlů,463CPU SMPstroje(sharedmemory),klastry(1 2procesorovéPC) 1Gb/s(GE,GigabitEthernet)nebo2.5Gb/s(Myrinet) Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

Gridovésystémyaprácevnich příkladhpc(high performancecluster): Programovéprostředky: distribuovanýsouborovýsystémafs autentizačnísystémkerberos(kinit,kauth,sshprotokol) systémsprávyaplikačníhosoftware(meta)moduly přístupnacentrálníuzelpomocíssh přístuppomocíhardwarovýchklíčů(tokenscertifikátem) Softwareprořazeníúloh(dávkovésystémy): PBSPro PortableBatchSystem,dávkovýsystémproPCklastr PBSPro Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

Gridovésystémyaprácevnich SpecifikaGridů: výpočetnízdrojenejsouspravoványcentrálně administrativnírozdělenígriduna virtuálníorganizace(vo) speciálníuzlyproukládánídat stroje,kterézajišťujíslužbypro prácisesoubory(storageelements) službypromonitorovánístavugridu službyproplánováníúloh(computingelements) vlastnívýpočetníkapacity(workernodes) kpropojenívoslouží grid middle ware otevřenéstandardy kpřihlášenídogridusloužíněkolikpočítačů(user Interface) autentizacepomocícertifikátů(silnéelektronickéšifrování) uživatelpatřídovo,nemápřímýpřístupkezdrojům,aleke službám Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

Gridovésystémyaprácevnich příkladgridu:enablinggridfore science(egee2) http://egee.cesnet.cz(informaceoprojektu) mezinárodníprojektevropskéunie(cesnetzačr VOCE) celoevropskágridováinfrastrukturaprovědeckou komunituiprůmysl(>30zemí,100organizací) pilotníaplikace: HEP(HighEnergyPhysics) zpracováníaanalýzadatzexperimentů částicovéfyziky(atlas,cms,alice,lhcb,...) výpočetně chemickésimulacebiologickýchsystémů biomedicínskégridy zpracováníbioinformatikýchalékařskýchdat Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

Gridovésystémyaprácevnich příkladgridu:enablinggridfore science(egee2) Techinfo: přes20000cpu(7x24h),5pb(5miliónůgb),1.5gb/s Programovéprostředky: grid middle ware:glite/lcg,edg,genius bezpečnost: GSI(GridSecurityInfrastructure) X.509certifikátyvydávanénárodnímicertifikačnímiautoritami(CA) monitorovánístavugridu:lcg2realtimemonitor databázovéslužby(mysql,oracle,...) webovéslužby Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

Gridovésystémyaprácevnich Ukázkatypicképrácenaklastru: 1)připojenízdomácíhostrojenacentrálníuzelklastru 2)přípravaúlohyaspouštěcíhoskriptu 3)odesláníúlohydofronty 4)monitorováníúlohy 5)obdrženívýsledků i)zastaveníresp.restartúlohy ii)přeplánováníúlohy,zrušenínaplánovanéúlohy iii)specifikacezdrojů,kdemáúlohaběžet iv)monitoringstavuklastru(volnéstroje,výpadkyklastru) víceuživatelůgenerujespoustuúloh,kapacitazdrojůomezená =>systémproplánování,řazeníasprávuúloh Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

Softwareprořazeníasprávuúloh PBS PortableBatchSystem(dávkovýsystémproklastry) úlohyseřadídotzv.front fronty: Jméno fronty Max. doba běhu Maximum úloh Maximum/Uživatel short normal long ncbr cpmd 2 hodiny 24 hodin 720 hodin 720 hodin 720 hodin 8 12 32 32 16 12 24 96 120 120 strojůmlzepřiřadittzv.vlastnosti(využitívheterogenníchclusterech) Vlastnosti (meta): linux praha brno plzen iti Vlastnosti (ncbr): lcc ibp cpmd Vlastnosti (obecné): p3 xeon athlon Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

Softwareprořazeníasprávuúloh PBS PortableBatchSystem(dávkovýsystémproklastry) Příkazyprozákladníprácisúlohami: zasláníúlohydofronty(qsub) vymazáníještěnespuštěnéúlohyzfronty(qdel) informaceoběžícíchúlohách(qstat) standardní a Informaceouzlech(pbsnodes,xpbs) chybový výstup vpraxitovypadápřibližnětakto: odesláníúlohydofronty: [petrek@skirit test]$ qsub -r -e -q -v 142606.skirit.ics.muni.cz [petrek@skirit test]$ Identifikátor úlohy proměnné prostředí n -m abe -j oe -o test.out \ test.err -N "Test cislo 1" \ normal -l "node=1:brno:xeon" \ "BACKUPDIR" test fronta a vlastnosti vlastní skript Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

Softwareprořazeníasprávuúloh PBS PortableBatchSystem(dávkovýsystémproklastry) vlastnískript [petrek@skirit petrek]$ cat test #!/bin/bash #PBS -W stagein=/scratch/petrek/xxx.com@skirit:test/xxx.com #PBS -W stageout=/scratch/petrek/xxx.log@skirit:test/xxx.log # Inicializace modulu a pridani modulu g98:. /packages/run/modules-2.0/init/sh module add g98 # zmena pracovniho adresare cd /scratch/petrek # Spusteni ulohy: g98 xxx.com Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

Softwareprořazeníasprávuúloh PBS PortableBatchSystem(dávkovýsystémproklastry) Informaceoúlohách [petrek@skirit petrek]$ qstat Job id Name User ---------------- ---------- --------138034.skirit-f tri_2fsm zeleny 138035.skirit-f tri_3fsm zeleny 138036.skirit-f tri_4fsm zeleny 138195.skirit-f opt1 jsebera 139206.skirit-f jedu sponer 139731.skirit-f a2:=24 hornak 140366.skirit-f 24t5p.run vrbka 142457.skirit-f S011 petrek 142562.skirit-f m2sr soliman 142606.skirit-f test petrek Time Use -------68:49:00 188:01:0 99:39:18 107:21:3 621:11:3 531:31:2 1109:53: 05:22:49 28:24:05 0 S Q Q Q Q R R R C R Q Queue ----long long long long ncbr iti parallel cpmd cpmd normal režimyúlohy:q(naplánovaná)=>r(running)=>e(end)=>c(completed) smazánízfrontyvestavuq: [petrek@skirit petrek]$ qdel 142606 Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

Softwareprořazeníasprávuúloh PBS PortableBatchSystem(dávkovýsystémproklastry) Monitoringúloh:xpbs Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

Softwareprořazeníasprávuúloh PBS PortableBatchSystem(dávkovýsystémproklastry) přehledvytíženístrojů: http://meta.cesnet.cz/pbsmon/nodes.do Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

Softwareprořazeníasprávuúloh Nevýhodypříméhopoužitídávkovýchsystémů: nutnáznalostfront,vlastností uživatelmusíznátpoměrnědostinformacíosystému kopírovánívstupníchdatnavýpočetníuzelastaženívýsledku musízajistitvášskript: ( paralelníúlohy speciálnívolbyvespouštěcímskriptuohledně architektury(shmem,p4,mpich gm) nastavenícestksoftware uživatelmusíopětznát,cojekde nainstalováno,jakouarchitekturupoužít =>různéskriptyprorůznéarchitektury: ( informaceoúlozesvázanésidentifikačním číslemjobu =>přivelkémmnožstvíúlohneúnosné Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

Softwareprořazeníasprávuúloh Službyvgridovýchsystémech:middlewaregLite/LCG Certifikáty:(beznichnelzenagriduexistovat) souborsinformacemiovašíidentitě;máomezenouplatnost,údaje šifrované příkazypropráciscert.: prodlouhodobějšíúlohy=>myproxycertifikát příkazyprooperacisesoubory: lcg cp,... příkazyproprácisúlohou: edg job submit,... příkazyproslužbusvoms(virtualorganizationmembershipservice): edg voms proxy info Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

Softwareprořazeníasprávuúloh Službyvgridovýchsystémech:middlewaregLite/LCG prácenagridu: 1)připojenízdomácíhostrojenaUserInterface(gsissh) 2)Inicializacecertifikátů(myproxy init sc,myproxy get delegation) 3)Nahrátívstupníchdatnastorageelement(lcg cp) službavrátíidentifikátorsouborunase 4)Sestavenípopisovacíhoskriptuproúlohu(*.JDL) 5)Vlastníodesláníúlohydogridu(edg job submit) službavrátíidentifikátorjobu 6)Sledovánístavuúlohy(edg job status) 7)Stáhnutívýsledkuzestorageelementu(lcg cr) Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

Softwareprořazeníasprávuúloh Službyvgridovýchsystémech:middlewaregLite/LCG 4)Sestavenípopisovacíhoskriptuproúlohu(*.JDL) # JDL Test.jdl Type = "Job"; JobType = "Normal"; Executable = "Test"; předává se s StdOutput = "Test.stdout"; spolu s úlohou StdError = "Test.stderr"; InputSandbox = {"in1.xml","in2.xml"}; OutputSandbox = {"out1.xml", out2.xml }; Environment = { "AMBERPATH=/var/amber", "BIGFILE1=guid:645c2af0-498e-4657-8154-8295380b349e" }; identifikátor Arguments = ""; souboru na SE RetryCount = 1; 5)Vlastníodesláníúlohydogridu(edg job submit) $exportvoconfig=edg_wl_ui.conf $edg job submit config vo$voconfig ojidtest.jdl Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

Softwareprořazeníasprávuúloh NevýhodypříméhopoužitíAPIgridu: JDLjazyk Správaidentifikátoruprosoubor kopírovánívstupníchdatzsenavýpočetníuzel(wn)anahrátí výsledkůnasemusízajistitvášskript: ( speciálnívolbyvpopisovacímjdlskriptuohledněpar.architektury, délkyjobu software jetřebakopírovatsúlohounebopředávatinformace, odkudlzespouštět(neníznáméobecněnagridu) informaceoúlozesvázanésidentifikačnímčíslemjobu,místo souborůidentifikátorynase =>přivelkémmnožstvíúlohopětneúnosné Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

Softwareprořazeníasprávuúloh Kdositohleobjednal? I.I.Rabi(1946 1947) Naštěstíexistujínádstavby nadpřímýmpoužitímdávkovýchsystémů systémcharon => (dalšímožnosti:unicore,geniusportál,...) Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

SystémCHARON CojeCHARON? komplexnínadstavbanadávkovými/gridovýmisystémy, zajišťujícísjednocenýpřístupkvyužívánívýpočetníchzdrojů nástrojprosprávuaúdržbuaplikacívtěchtosystémech nástrojprosjednocenéodesíláníasledováníúloh PročCHARON? složitostdávkovýchagridovýchmiddle warepřesahuje uživatelskyúnostnoumez vtétooblasticharonnabízímaximálnízjednodušenípráce způsobprácenagridu,resp.naklastrechjeprouživatele jednotný(přenositelnostúloh) Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

SystémCHARON koncepcesystému CEL uživatel Charon - systém správy úloh app1 app2 app3... Softwarový repositář systém module správa software dávkovýsystém/gridovýmiddleware správaaplikací spouštěníúlohprovíceprocesorů(paralelníúlohy)beznutnosti modifikacehlavníhoskriptuúlohy správaúloh Jednoduchéodesláníjobu,monitoringaobdrženívýsledků příkazovýřádek(commandlineinterface) Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

SystémCharon použitínaklastru 1)připojenínacentrálníuzelklastru(SSH,Putty) [petrek@joplin ~]$ hostname joplin.chemi.muni.cz [petrek@joplin ~]$ ssh test1@wolf.chemi.muni.cz test1@wolf.chemi.muni.cz's password: Last login: Wed Aug 23 14:30:31 2006 from joplin.chemi.muni.cz *** Welcome to WOLF cluster *** =========================================================== You are logged on host : wolf.chemi.muni.cz Its architecture is : i786 --------------------------------------------------------- Charon Extension Layer (CEL) is enabled. If you have any problem with this system you should contact authors. (More information at WWW portal.) *** http://troll.chemi.muni.cz/whitezone/development/charon --------------------------------------------------------- [test1@wolf ~]$ Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

SystémCharon použitínaklastru 2)vytvořeníadresářesúlohou(nakopírovánípřesSCP) [test1@wolf ~]$ scp -r petrek@wolf:job1. petrek@wolf's password: ****** job1.run 100% 49 0.1KB/s input1.pov 100% 3347 3.3KB/s 00:00 00:00 3)vytvořeníspouštěcíhoskriptuproúlohu [test1@wolf ~]$ cd GridComputing/01.simple/job1 [test1@wolf job1]$ ls input1.pov job1.run* [test@wolf job1]$ cat job1.run #!/bin/bash # activate povray package module add povray # render scene povray -W800 -H600 input1.pov Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

SystémCharon použitínaklastru 4)odesláníúlohy [test1@wolf ~]$ psubmit long job1.run Job name : job1.run Job title : job1.run (Job type: generic) Job directory : wolf.chemi.muni.cz:/home/test1/gridcomputing/01.simple/job1 Job project : -nonecluster name : WOLF (Driver: pbs) ======================================================== Alias : -nonequeue : long Profile : wolf ---------------------------------------NCPU : 1 Resources : nodes=1:ppn=1:node Sync mode : sync ---------------------------------------Start after : -not defined======================================================== Do you want to submit job with pbs driver (YES/NO)? > YES Job was successfully submitted to PBS queue system. Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

SystémCharon použitínaklastru 5)vzniklékontrolnísoubory [test1@wolf job1]$ ls input1.pov job1.run* job1.run.ces* job1.run.info 6)stavúlohy [test1@wolf job1]$ pqstatl wolf.chemi.muni.cz: Job ID Username ------- ------700.wol test1 Req'd Req'd Elap Queue Jobname SessID NDS TSK Memory Time S Time ------ ------ ------ --- --- ------ ---- -- ---long job1.run 9873 1 --168:0 R 0:0 7)výslednésoubory [test1@wolf job1]$ ls input1.png input1.pov job1.run* job1.run.ces* job1.run.info job1.run.stdout Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

SystémCharon použitínaklastru 8)výsledek(input1.png) Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

SystémCharon použitínaklastru ParalelníúlohyvsystémuCHARONnaklastru [test1@wolf job1]$ cd ~/GridComputing/02.parallel/job1 [test1@wolf job1]$ ls hello* job1.run* [test1@wolf job1]$ cat job1.run #!/bin/bash module add mpichrun mpirun -np $CH_NCPU hello [test1@wolf job1]$ psubmit long job1.run 4 [test1@wolf job1]$ pinfo : -----------------------------------NCPU : 4 Resources : nodes=4:ppn=1:node Properties : -nonesync mode : sync : Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

SystémCharon použitínagridu stejnépříkazyizpůsobpráce(přenositelnostúlohmeziklastryagridy) potřebacertifikátu 2příkazynavíc (inicializacegridovéhomodulu,inicializacecertifikátu) /C=IT/O=GILDA/OU=PersonalCertificate/L=MasarykUniversity/CN=ncbrtester/Email=ncbr@atlas.cz cd ~/GridComputing/04.gilda/job1 module add gilda-wolf voms-proxy-init --voms gilda voms-proxy-info --all psubmit gilda job_script pinfo psync úlohy:~/gridcomputing/04.gilda/job1 Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

SystémCharon správaaplikací Příkazy systému Modulů příkaz'module h' module [akce] [modul1 [modul2] ] hlavní příkaz systemu modulů akce: add (nahrátí), remove (odpojení) avail, list*, active, exported, versions, realizations disp, isactive * výchozí akce modconfig konfigurace systému modulů (visualizace, výchozí moduly,...) příklad: module realizations amber Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

SystémCharon správaaplikací systémmodulů příkaz'module h' aplikacejsouřazenydohierarchickéstruktury jméno_programu:verze:architektura:paralelní_mod realizace systémautomatickydoplňujemožnosti(tabulator) nastavenívýchozírealizace(defaultrealization) amber amber:8.1:auto:auto amber:8.1:ipn3:single abinit-mp * abinit-mp:04.12.14 + abinit-mp:04.12.14:i686:node + abinit-mp:04.12.14:i686:p4 amber * amber:9.0 + amber:9.0:noarch:none + amber:9.0:pn3:single * amber:8.1 + amber:8.1:noarch:none + amber:8.1:pn3:single okonkrétnírealizaciserozhodujeaž kdyžjeúlohaspušťěnánavýpočetním uzlu systémsesnažívybratoptimální realizaci,pakpostupujehierarchicky Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

SystémCharon správaaplikací dvamodely úložištěaplikací ModelI:METACentrum,vetšinaklastrů vklastru(resp.gridu)existujesdílenýdiskspolečnývšemvýpočetnímuzlům CE UI Legenda: UI - přístupový počítač CE - výpočetní element SE - úložiš tě dat WN - výpočetní uzel app - aplikace CE WN WN... WN WN... app1 app2 app3 app4 app5... ModelII:EGEE2GRID sdílenýdiskneexistuje,aplikacesekopírujíjednouzačaszespolečnéhose UI app1 app2... CE CE app3 app7... WN WN app2 app1... WN WN...... SE Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

Poděkování LuděkMatyska(CESNET,ICS) JaroslavKoča(NCBR) Evropskákomise EGEEII(číslokontraktuRI 031688) EGEE(číslokontraktuIST 2003 508833) MŠMT(MSM0021622413) GAČR(204/03/H016) Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006

Prostorprodotazy Superpočítáníagridovépočítání,Strukturaafunkcebiomolekul Letníškola,NCBR,Brno,3 8září,2006