Výběr zdrojů, zadávání a správa úloh v MetaCentru

Podobné dokumenty
Výběr zdrojů, zadávání a správa úloh

Aktuální stav. Martin Kuba CESNET a ÚVT MU

Výpočetní zdroje v MetaCentru a jejich využití

MetaCentrum - Virtualizace a její použití

aktivita CESNETu společně MU, UK a ZČU sdružuje výpočetní prostředky

Novinky z vývoje v MetaCentru

MetaCentrum. Martin Kuba CESNET

Výpočetní clustery v METACentru

Datová úložiště v MetaCentru a okolí. David Antoš

MetaCentrum. Miroslav Ruda. listopad 2013 CESNET

METACentrum Český národní gridovýprojekt. Projekt METACentrum. Jan Kmuníček ÚVT MU & CESNET. meta.cesnet.cz

Datová úložiště v MetaCentru a okolí II. David Antoš Oddělení datových úložišť

Souborové systémy a práce s daty David Antoš

METACentrum zastřešení českých gridových aktivit

MetaCentrum. Martin Kuba CESNET

Virtualizace MetaCentra

Cloudy a gridy v národní einfrastruktuře

MetaCentrum. Tomáš Rebok MetaCentrum NGI, CESNET z.s.p.o. CERIT-SC, Masarykova Univerzita Olomouc,

Czech National e-infrastructure. Projekt MetaCentrum. Jan Kmuníček CESNET. meta.cesnet.cz

CERIT SCIENTIFIC CLOUD. Centrum CERIT-SC. Luděk Matyska. Praha, Seminář MetaCentra,

METACENTRUM. Miroslav Ruda CESNET. Seminář MetaCentra, Praha

C2115 Praktický úvod do superpočítání

Czech National e-infrastructure. Projekt MetaCentrum. Jan Kmuníček CESNET. meta.cesnet.cz

Gridy v České republice. Luděk Matyska Masarykova univerzita v Brně CESNET, z.s.p.o.

SUPERPOČÍTAČE DANIEL LANGR ČVUT FIT / VZLÚ

MetaCentrum. Aktuální stav anové služby

Paralelní výpočty na clusteru KMD

MetaCentrum. Miroslav Ruda. Skalský Dvůr, Miroslav Ruda (MetaCentrum) MetaCentrum Skalský Dvůr, / 11

uzly. Výpočetní uzel (Working node) výkonná jednotka clusteru.

Příloha č. 1 zadávací dokumentace. Technická dokumentace, specifikace požadovaného plnění a popis hodnocení

Provozní statistiky centra CERIT-SC

Martin Kuba, Daniel Kouřil seminář řešitelů, Žďár n.s. 1

MetaCentrum a náro (nejen matematické) výpočty

CESNET - Datová úložiště

Paralelní výpočty ve finančnictví

C2115 Praktický úvod do superpočítání

Operační systémy. Cvičení 1: Seznámení s prostředím

Programové vybavení počítačů operační systémy

TECHNICKÁ PODPORA. Systémové požadavky Instalace Licencování a aktivace Náplň technické podpory Formy předplatného Kontakty

CERIT-SC. Luděk Matyska, David Antoš, Aleš Křenek

Příloha č. 2A Zadávací dokumentace k Veřejné zakázce Dodávka technologického řešení pro Geoportál

Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague

Efektivní vyuºívání programových nástroj Ansys na infrastrukturách MetaCentra / CERIT-SC

Server je v informatice obecné označení pro počítač, který poskytuje nějaké služby nebo počítačový program, který tyto služby realizuje.

MetaCentrum Aplikace a jejich další podpora

MetaCentrum. Miroslav Ruda. březen 2017, Brno CESNET

VÝUKOVÝ MATERIÁL. 3. ročník učebního oboru Elektrikář Přílohy. bez příloh. Identifikační údaje školy

Definice OS. Operační systém je základní programové vybavení počítače, nezbytné pro jeho provoz.

C2115 Praktický úvod do superpočítání

Principy operačních systémů. Lekce 1: Úvod

Plánování úloh otázky a odpovědi

Dagmar Adamová, Jiří Chudoba Jednalo se o Monte Carlo simulace případů srážek p+p a Pb+Pb. Fungování

Novinky NGI & 10 způsobů, jak "sejmout" MetaCentrum

MetaCentrum. Miroslav Ruda CESNET

Příloha č.2 - Technická specifikace předmětu veřejné zakázky

MetaCentrum. datové služby. Miroslav Ruda, Zdeněk Šustr

Řešení pro audit činnosti administrátorů UNIX/Linux serverů

C2110 Operační systém UNIX a základy programování

C2115 Praktický úvod do superpočítání

Hardware - minulý rok

METACENTRUM. Miroslav Ruda CESNET. Konference CESNET, Praha

C2110 Operační systém UNIX a základy programování

Činnost počítače po zapnutí

PRINCIPY OPERAČNÍCH SYSTÉMŮ

Národní centrum pro výzkum biomolekul & MetaCentrum

Aktuality a plány virtuální organizace

Operační systémy: funkce

Kontrolní seznam projektu a systémové požadavky Xesar 3.0

Projekt EGEE / EGI. Jan Kmuníček CESNET. Enabling Grids for E-sciencE. EGEE-III INFSO-RI

Přechod na virtuální infrastrukturu

Porovnání instalací linuxových distribucí Fedora x Debian Administrace počítačových sítí (2010/2011)

1. Informace a informatika

TSM for Virtual Environments Data Protection for VMware v6.3. Ondřej Bláha CEE+R Tivoli Storage Team Leader. TSM architektura IBM Corporation

IT ESS II. 1. Operating Systém Fundamentals

Datová úložiště CESNET. David Antoš

OPERAČNÍ SYSTÉMY. Operační systém je prostředník mezi hardwarem (technickým vybavením počítače) a určitým programem, který uživatel používá.

Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague

Aktuální stav MetaCentra, novinky

SSH: dálková správa serveru

Superpočítání a gridové počítání

Datová úložiště CESNET. David Antoš

Služby ÚVT pro VaV & IT pro CEITEC. David Antoš

SUPERPOČÍTAČOVÉ CENTRUM. Luděk Matyska

VirtualBox desktopová virtualizace. Zdeněk Merta

TGMmini. začínáme. komplexní dodávky a zprovoznění servopohonů dodávky řídicích systémů

Střední úložiště. Uživatelská dokumentace Zřízení přístupu

Superpočítání a gridové počítání

Stavba operačního systému

Distribuované výpočty a GRID: prostředky a. Martin Petř ek, Petr Kulhánek Jan Kmuníč ek

Úvod do Linuxu. SŠSI Tábor 1

Datová úložiště CESNET. David Antoš

Dílčí projekt: Systém projektování textilních struktur 1.etapa: tvorba systému projektování vlákno - příze - tkanina

Technická specifikace HW pro rok 2012

HPC Users' Access Workshop: nový superpočítač Salomon

Efektivní ochrana dat ve virtualizovaném prostředí. Marek Bradáč

VirtualizaceKlatovské nemocnice a.s.

Real Time programování v LabView. Ing. Martin Bušek, Ph.D.

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

Základní informace. Operační systém (OS)

Acronis. Lukáš Valenta

Transkript:

Výběr zdrojů, zadávání a správa úloh v MetaCentru Martin Kuba CESNET 31.5.2010 1

O superpočítání MetaCentrum jsou spojená výpočetní a superpočítačová centra MU, UK, ZČU, PřF JU, FEKT VUT místo superpočítačů se sdílenou pamětí se používají clustery clustery PC-kompatibilních rackmounted strojů (1U,2U,4U) s OS typu UNIX (Linux,IRIX,SunOS) klimatizované sály, zálohování napájení UPS/motorgenerátory, redundantní zdroje, hotswap, disková pole, zálohování dat na pásky, 1Gb/s Ethernet, 20Gb/s Infiniband, 10Gb/s spojení na páteř CESNETu 31.5.2010 2

O rychlosti a výkonu Když jeden dělník vymaluje místnost za 1 hodinu, za jak dlouho to udělá 360 dělníků? sekání lánu obilí versus oprava hodinek clustery a superpočítače nabízejí více dělníků, ale je umění jim rozdělit práci Amdahlův zákon říká, o kolik lze maximálně zrychlit práci paralelním zpracováním lineární nárůst je nedostižný ideál 31.5.2010 3

Plánovací systém zdroje procesory (počet, typ) místo na lokálním disku stroje s určitými vlastnostmi (síť,os, město,...) paměť licence software uživatelé účty na clusterech a strojích účast ve skupinách (příslušnost k organizaci) efektivní přidělování zdrojů lze zajistit jen s plánovacím systémem přidělování zdrojů ve formě úloh (jobs) interaktivní dávkové 31.5.2010 4

Úloha (Job) životní cyklus: vytvořena (požadavek na určité zdroje) čeká ve frontě spuštěna (zdroje jsou přiděleny) ukončena (zdroje jsou uvolněny) interaktivní úloha uživatel aktivně pracuje, obvykle s nějakým grafickým rozhraním, rozhoduje o ukončení úlohy dávková úloha uživatel se věnuje něčemu jinému, úloha běží sama bez dozoru, vhodné při velkém množství úloh 31.5.2010 5

Fronty úloh priorita je řízena pomocí front úloh (queue) tři běžné fronty short úlohy do 2 hodin normal úlohy do 24 hodin long úlohy do 30 dnů prioritní fronty ncbr, jcu, iti, zsc, lsd, quark pro vlastníky strojů privileged pro uživatele s alespoň 3 publikacemi s poděkováním označující maintenance stroje v údržbě nebo opravě reserved vyhrazeny speciální pro administrátorské účely a pokusné pro účely tohoto kurzu je speciální fronta qckurs@arien 31.5.2010 6

31.5.2010 7

31.5.2010 8

Produkční a testovací prostředí dilema stabilita versus inovace řešením jsou dvě prostředí produkční stabilita PBS server skirit-f testovací inovace PBS server arien testovací prostředí nový hardware novější verze OS Linux vylepšení prostředí 31.5.2010 9

Požadavek na zdroje úlohy se zadávají příkazem qsub třeba qsub q qckurs l mem=3gb -I parametry fronta -q normal počet strojů a CPU l nodes=1:ppn=4 velikost paměti l mem=2gb vlastnosti strojů (viz dále) interaktivní úloha -I dokumentace na http://meta.cesnet.cz/ sestavovač příkazu qsub na portálu 31.5.2010 10

31.5.2010 11

31.5.2010 12

31.5.2010 13

Vlastnosti strojů geografické umístění vliv na latenci sítě brno, plzen, praha, budejovice, feec typ a počet CPU i386, amd64, emt64t, x86_64, x86, ia64, xeon, opteron nodecpus1, nodecpus2,..., nodecpus32 operační systém linux, debian, debian40, debian50, sarge, lenny, suse, redhat síťové karty myrinet2000, infiniband, infiniband2 pro frontu není nutné zadávat orca, q_normal, q_short, q_preemptible, forprivileged, ncbr, globus, jcu ostatní nfs4, per, per2 až per5, ibp, lcc, data-kky, loslab 31.5.2010 14

31.5.2010 15

Činnost plánovače plánovač setřídí úlohy podle priority fronty fair share CPU čas (pokud není uveden, je nastaven podle fronty) fair share uživatel s méně propočítaným časem má přednost má informace o tom, kde má uživatel účet a do kterých patří skupin 31.5.2010 16

Práce s daty na každém stroji jsou dostupné 4 druhy diskového prostoru rychlý nesdílený lokální disk ve /scratch adresář sdílený NFSv3 přes jeden cluster v /home adresář sdílený NFSv4 přes všechny stroje v /storage adresář sdílený AFS přes všechny stroje v /afs předinstalovaný software je na AFS data uživatelů na NFSv3 a NFSv4 data v době výpočtu na lokálním disku 31.5.2010 17

Přenos dat do/z MetaCentra pomocí WinScp, scp, sftp, NFSv4 uložit do /storage na NFSv4 na začátku úlohy přenést na lokální disk nejlépe lokálním kopírováním cp -r /storage/home/$user/data /scratch/$user/ nebo pomocí stagein/stageout, to zajistí i smazání dat po skončení úlohy 31.5.2010 18

Časté chyby uživatelů žádost o konkrétní stroj nesplnitelná kombinace nejsou vůbec takové stroje (např. ia64:brno) jsou takové stroje, ale nemají na nich účet přímé přihlášení na stroj bez úlohy (Viktor Čistič) používají více CPU než rezervovali data pro výpočet jsou v $HOME, ale požadavek splňují i stroje mimo cluster nerezervují si licenci pro software pro dočasná data nepoužívají scratch pracují na frontendu místo použití jednouzlové interaktivní úlohy 31.5.2010 19

Tento kurs vyhražená fronta qckurs@arien přihlásit se na frontend ssh QC01@skirit.ics.muni.cz spustit interaktivní úlohu qsub q qckurs@arien l nodes=1:ppn=4 l mem=3gb I dostanete shell na jednom ze strojů cd /scratch/$user 31.5.2010 20

Virtualizace a preempce všechny fyzické stroje s dostatečnou pamětí jsou virtualizovány obvykle dva virtuální stroje -1 a -2 využito na clusterech orca a skirit č.49-81 fronty orca a preempt@arien posílají úlohy do virt. strojů -2 a tím pozastavují -1 31.5.2010 21

Doporučený postup zjistit přes Sestavovač qsub v Osobním pohledu na portálu, zda jsou dostupné vhodné zdroje požádat o účty na všech dostupných strojích použít aplikaci z modulů nebo mít vlastní na AFS zadat úlohu s co nejméně omezujícími požadavky po skončení úlohy jsou stdout a stderr nakopírovány do adresáře na stroji, odkud byla úloha zadána. Vhodné je použít adresář ve /storage kvůli místu a dostupnosti. velké objemy výstupů zapisovat do /scratch vstupní a výstupní data kopírovat přes staging do a z /scratch 31.5.2010 22

Dotazy? Děkuji za pozornost 31.5.2010 23