Novinky z vývoje v MetaCentru

Podobné dokumenty
MetaCentrum. Tomáš Rebok MetaCentrum NGI, CESNET z.s.p.o. CERIT-SC, Masarykova Univerzita Olomouc,

Výpočetní zdroje v MetaCentru a jejich využití

MetaCentrum - Virtualizace a její použití

Cloudy a gridy v národní einfrastruktuře

Plánování úloh otázky a odpovědi

Výběr zdrojů, zadávání a správa úloh v MetaCentru

MetaCentrum. Miroslav Ruda. Skalský Dvůr, Miroslav Ruda (MetaCentrum) MetaCentrum Skalský Dvůr, / 11

MetaCentrum. Miroslav Ruda. březen 2017, Brno CESNET

Hardware - minulý rok

MetaCentrum. Martin Kuba CESNET

MetaCentrum. Miroslav Ruda. listopad 2013 CESNET

Výběr zdrojů, zadávání a správa úloh

Aktuální stav. Martin Kuba CESNET a ÚVT MU

Datová úložiště v MetaCentru a okolí. David Antoš

MetaCentrum a náro (nejen matematické) výpočty

METACENTRUM. Miroslav Ruda CESNET. Seminář MetaCentra, Praha

Datová úložiště v MetaCentru a okolí II. David Antoš Oddělení datových úložišť

aktivita CESNETu společně MU, UK a ZČU sdružuje výpočetní prostředky

METACentrum Český národní gridovýprojekt. Projekt METACentrum. Jan Kmuníček ÚVT MU & CESNET. meta.cesnet.cz

MetaCentrum. Martin Kuba CESNET

METACentrum zastřešení českých gridových aktivit

CERIT-SC. Luděk Matyska, David Antoš, Aleš Křenek

Souborové systémy a práce s daty David Antoš

Virtualizace MetaCentra

METACENTRUM. Miroslav Ruda CESNET. Konference CESNET, Praha

MetaCentrum. Miroslav Ruda CESNET

CERIT SCIENTIFIC CLOUD. Centrum CERIT-SC. Luděk Matyska. Praha, Seminář MetaCentra,

SUPERPOČÍTAČE DANIEL LANGR ČVUT FIT / VZLÚ

Výpočetní clustery v METACentru

uzly. Výpočetní uzel (Working node) výkonná jednotka clusteru.

Aktuality a plány virtuální organizace

MetaCentrum Aplikace a jejich další podpora

SUPERPOČÍTAČOVÉ CENTRUM. Luděk Matyska

Paralelní výpočty na clusteru KMD

Aktuální stav MetaCentra, novinky

Konsolidace zálohování a archivace dat

MetaCentrum. datové služby. Miroslav Ruda, Zdeněk Šustr

Datová úložiště CESNET

C2115 Praktický úvod do superpočítání

Služby ÚVT pro VaV & IT pro CEITEC. David Antoš

Provozní statistiky centra CERIT-SC

Martin Kuba, Daniel Kouřil seminář řešitelů, Žďár n.s. 1

DATOVÁ ÚLOŽIŠTĚ CESNET

Novinky NGI & 10 způsobů, jak "sejmout" MetaCentrum

Gridy v České republice. Luděk Matyska Masarykova univerzita v Brně CESNET, z.s.p.o.

Windows Server Novinky. Petr Špetlík Cloud & Server PTA

Datová úložiště CESNET. David Antoš

Centrum CERIT-SC Tomáš Rebok

Registrační číslo projektu: CZ.1.07/1.5.00/ Elektronická podpora zkvalitnění výuky CZ.1.07 Vzděláním pro konkurenceschopnost

Paralelní výpočty ve finančnictví

CESNET - Datová úložiště

Virtualizace síťových prvků

Střední úložiště. Uživatelská dokumentace Zřízení přístupu

NÁSTROJE PRO VIRTUALIZACI POČÍTAČE

TECHNICKÁ PODPORA. Systémové požadavky Instalace Licencování a aktivace Náplň technické podpory Formy předplatného Kontakty

C2115 Praktický úvod do superpočítání

Efektivní vyuºívání programových nástroj Ansys na infrastrukturách MetaCentra / CERIT-SC

Datová úložiště CESNET. David Antoš

Bezpečnost v Gridech. Daniel Kouřil EGEE kurz 12. prosince Enabling Grids for E-sciencE.

Přechod na virtuální infrastrukturu

Příloha č. 1 zadávací dokumentace. Technická dokumentace, specifikace požadovaného plnění a popis hodnocení

Jakub Šesták. ESEJ DO PŘEDMĚTU DIGITÁLNÍ KNIHOVNY

Konsolidace PACS a e-health v souladu s legislativou ve FNB

POZVÁNKA NA KURZY. Literatura Ke všem kurzům jsou poskytovány metodické příručky pro školství v elektronické podobě.

LINUX - INSTALACE & KONFIGURACE

w w w. u l t i m u m t e c h n o l o g i e s. c z Infrastructure-as-a-Service na platformě OpenStack

Ukazka knihy z internetoveho knihkupectvi

Vysvětlení zadávací dokumentace č. 3

Praha, Martin Beran

HPC Users' Access Workshop: nový superpočítač Salomon

Sdílení uživatelských identit. Petr Žabička, Václav Rosecký Moravská zemská knihovna v Brně

Czech National e-infrastructure. Projekt MetaCentrum. Jan Kmuníček CESNET. meta.cesnet.cz

Výzva na podání nabídek na veřejnou zakázku malého rozsahu

MetaCentrum. Aktuální stav anové služby

Způsoby využití datových úložišť CESNET. David Antoš

Obsah. Úvod 13. Věnování 11 Poděkování 11

Virtuální učebna: VMware VDI zefektivňuje výuku, zjednodušuje správu a snižuje náklady

Datová úložiště CESNET. David Antoš

V METACENTRU. aneb Singularity. Miroslav Ruda CESNET. Seminář MetaCentra, Praha

Příloha č.2 - Technická specifikace předmětu veřejné zakázky

Czech National e-infrastructure. Projekt MetaCentrum. Jan Kmuníček CESNET. meta.cesnet.cz

Způsoby využití datových úložišť CESNET

VirtualizaceKlatovské nemocnice a.s.

Digitální konkordance a Registr digitalizace v Manuscriptoriu,

Stavba operačního systému

Perun. provoz v Meta, novinky, plány na Slávek Licehammer. 18. b ezna MetaCentrum

Virtualizace jako nástroj snížení nákladů. Periodické opakování nákladů nové verze Licence na pevný počet klientů

TSM for Virtual Environments Data Protection for VMware v6.3. Ondřej Bláha CEE+R Tivoli Storage Team Leader. TSM architektura IBM Corporation

Přechod na síťovou verzi programu

KIV/ZI Základy informatiky

Způsoby využití datových úložišť CESNET. Petr Benedikt

Národní e-infrastruktura a její služby

ČÁST 1 ÚVOD. Instalace operačního systému 21 Aktualizace operačního systému 57 Příkazový řádek 77 Windows Script Host 103 ČÁST 2 ŘEŠENÍ

Versiondog 4.0 Co je nového

Zadávací dokumentace na veřejnou zakázku malého rozsahu s názvem Obměna informačních technologií

Radim Dolák Gymnázium a Obchodní akademie Orlová

Minimální požadavky na systém Linux a Windows na jednom disku Zrušení instalace Mandriva Linuxu... 23

CESNET, GRIDy a přenosy dat

Transkript:

Novinky z vývoje v MetaCentru Miroslav Ruda miroslav.ruda@cesnet.cz CESNET Brno, 2011

Novinky z vývoje MetaCentra otázky a odpovědi, čím více otázek, tím lépe přechod na plánovací systém Torque úpravy priorit a fairshare virtualizace v PBS a cloudové rozhraní diskové prostory začlenění CUDA clusteru FAQ M. Ruda (CESNET) Technické novinky Brno, 2011 2 / 15

Plánovací systém Torque I. Přešli jsme z plánovacího systému PBSPro na Torque Vývoj volně dostupná implementace, rozumná kompatibilita je možno instalovat na všechny připojené clustery reimplementovány nejzajímavější vlastnosti plánování, stabilita přenesena všechna naše rozšíření plánovač, virtualizace další vývoj viditelný i v distribuci Torque více spolupracujících serverů virtualizace více samostatných serverů = odolnost proti výpadkům průběžné odstraňování chyb nové vlastnosti M. Ruda (CESNET) Technické novinky Brno, 2011 3 / 15

Plánovací systém Torque II. Více serverů samostatné instalace Torque spravující jeden velký cluster/město odstranění problémů s výpadky sítě mezi městy škálovatelností rychlostí odezvy plánovače vidí i další servery, mohou úlohy přesouvat podle potřeb bude nasazeno pro cluster CERITu, postupně v každém městě M. Ruda (CESNET) Technické novinky Brno, 2011 4 / 15

Plánovací systém Torque III. Nové vlastnosti požadavek na kompletní obsazení uzlu qsub -l nodes=2:nodecpus2#excl negativní vlastnosti qsub -l nodes=1:cl_skirit:^i386 v přípravě node packing qsub -l nodes=12:ppn=1#pack M. Ruda (CESNET) Technické novinky Brno, 2011 5 / 15

Priorita uživatelů fairshare = třídění podle propočítaného času za poslední období třídění ve frontě, priorita front je silnější prioritní fronty vlastníků clusteru aktuální plán promítnout počty publikací do fairshare každá zaregistrovaná publikace snižuje propočítaný čas o X procent/zvětšuje využitelný podíl zdrojů MetaCentra publikace platné jen rok/dva publikace impactované, v RIVu apod. následně zrušit frontu privileged připravujeme nový registrační formulář snadnější zadávání, import z ISu možnost definovat rozpočítání mezi autory M. Ruda (CESNET) Technické novinky Brno, 2011 6 / 15

Virtualizace Pokračuje vývoj v podpoře v Torque pomocí virtualizace provozujeme obrazy debian5 a debian6 současně přepínání podle aktuálních požadavků uživatelů v plánu je i obraz SL5 (hlavně pro EGI) pomocí přepínání virtuálních strojů řešíme i priority pro vlastníky clusterů pozastavení backfill úlohy umíme i obraz s MS Windows, pilotní provoz pro Laboratoř bezpečnostních technologií MU poskytujeme čistý obraz s MS Windows uživatelé doinstalují vlastní aplikace pak je možné pustit více kopií uzavřená sít, DHCP, VPN testujeme i využití pro výuku v přípravě jednorázové postavení uzlu pro výpočet M. Ruda (CESNET) Technické novinky Brno, 2011 7 / 15

Virtualizace cloud rozhraní Společně s CERIT-SC pracujeme i na cloud rozhraní ještě tento rok zpřístupníme pilotní instalaci kompatibilita s Amazon EC2 další rozhraní (OCCI) a GUI pro snadnější použití obrazy virtuálních strojů uživatelské originální MetaCentrové, možnost si je změnit v další fázi speciálně zaměřené na některé aplikace (map-reduce) možnost vyladit si obraz a přenést ho zpět do MetaCentra podpora pro aplikace, kterým gridový přístup nevyhovuje další vývoj na integraci/překrytí obou přístupů M. Ruda (CESNET) Technické novinky Brno, 2011 8 / 15

Diskové prostory NFSv4 jako základ, postupně v každém městě plus na dalších připojených clusterech (např. CERIT) rozumná rychlost pro vzdálený přístup, standard, Kerberos všechny svazky viditelné ve /storage/město nejbližší svazek použitý jako /home stejné pro celý cluster hierarchie /afs, /home a /scratch zůstává v plánu je i sdílený Lustre scratch spolupráce s datovými úložišti CESNETu, plán: opět automaticky viditelné NFSv4 svazky zálohování domovských adresářů migrace dat do archivu klientské programy pro další služby M. Ruda (CESNET) Technické novinky Brno, 2011 9 / 15

Cluster s CUDA kartami vlastník Katedra matematiky a Katedra kybernetiky FAV ZČU podrobnosti o vybavení v další přednášce priorita přístupu pro vlastníka, ale cluster je k dispozici i dalším uživatelům plánovací systém Torque plánuje i grafické karty uživatel si pomocí -lcuda=x říká o karty systém spustí úlohu jen na uzlu s volnou kartou karta je zpřístupněna jen vlastníkovi úlohy pracujeme i na virtualizovaném řešení HVM virtualizace M. Ruda (CESNET) Technické novinky Brno, 2011 10 / 15

FAQ - proč úloha neběží úlohy z fronty s vyšší prioritou (vlastníci, privileged) v jedné frontě se úlohy řadí podle fairshare "strádající úlohy" si rezervují zdroje stroj je rezervován nebo je ve frontě "maintenance" nemám na stroji účet špatná kombinace vlastností zdroje není jen CPU, ale i pamět, scratch, software na některé stroje nemohou multi-node úlohy webové rozhraní v "osobním pohledu" pomůže M. Ruda (CESNET) Technické novinky Brno, 2011 11 / 15

FAQ - proč úloha běží pomalu příliš krátké úlohy = režie převažuje zabalit do skriptu obsahujícího více úloh najednou přístup přes "pilotní úlohy" - Diane úloha z fronty backfill může být pozastavena příliš vzdálené uzly pro paralelní úlohu špatně zadané požadavky na pamět špatné použití filesystémů (scratch a home) M. Ruda (CESNET) Technické novinky Brno, 2011 12 / 15

FAQ MPI I Torque MPI nesmí spouštět pod-úlohy přes ssh, musí použít knihovny Torque aby systém uměl zastavit/hlídat všechny pod-úlohy liší se protokol PBSPro a Torque je nutno programy překompilovat moduly openmpi, lam, mpich2 jsou předělané pozor na vlastní kompilace, MPI obsazené v aplikacích Testovací příklad pro openmpi pro test je dobré použít cpi.c automaticky se používá Infiniband M. Ruda (CESNET) Technické novinky Brno, 2011 13 / 15

FAQ MPI II ~$ qsub -I -lnodes=2:debian50:x86_64:plzen:infiniband qsub: waiting for job 424352.arien.ics.muni.cz to start qsub: job 424352.arien.ics.muni.cz ready nympha1-1$ module add openmpi nympha1-1$ mpicc /software/mpich-1.2.7/amd64_linux26/ ch_p4/examples/cpi.c -o cpi.openmpi nympha1$ mpirun./cpi.openmpi Process 0 on nympha1-1.zcu.cz Process 1 on nympha4-1.zcu.cz pi is approximately 3.1416009869231241, Error is 0.0000 nympha1-1$ nympha1-1$ mpirun --mca btl tcp,self./cpi.openmpi M. Ruda (CESNET) Technické novinky Brno, 2011 14 / 15

Díky za pozornost! M. Ruda (CESNET) Technické novinky Brno, 2011 15 / 15