CERIT-SC, MetaCentrum

Podobné dokumenty
Efektivní vyuºívání programových nástroj Ansys na infrastrukturách MetaCentra / CERIT-SC

BOZP - akcepta ní testy

Datová centra, virtualizace a cloud computing

Seminá e. Ing. Michal Valenta PhD. Databázové systémy BI-DBS ZS 2010/11, sem. 1-13

Transak ní zpracování I

Novinky ze sv ta grid

Novinky z vývoje v MetaCentru

Datová úloºi²t CESNET

e²ení systém lineárních rovnic pomocí s ítací, dosazovací a srovnávací metody

Vektor náhodných veli in - práce s více prom nnými

C2115 Praktický úvod do superpočítání

IP kamerový systém Catr - uºivatelský návod k obsluze

Obsah. I Zakázka na dodávku audiovizuální techniky v etn montáºe, zapojení a pro²kolení 1. II Technická specikace zakázky 2. III Kontaktní osoba 7

Pravd podobnost a statistika - cvi ení. Simona Domesová místnost: RA310 (budova CPIT) web:

Uºivatelská p íru ka Octopus

Pr b h funkce I. Obsah. Maxima a minima funkce

Prohlá²ení. V Praze dne 18. dubna

T i hlavní v ty pravd podobnosti

Uºivatelská p íru ka k programu SlaFoR verze 1.0

Skalární sou in. Úvod. Denice skalárního sou inu

Limity funkcí v nevlastních bodech. Obsah

Úvod, terminologie. Ing. Michal Valenta PhD. Databázové systémy BI-DBS ZS 2010/11, P edn. 1

Dálkové p enosy ze za ízení aktivní protikorozní ochrany Severomoravské plynárenské, a.s.

P íklad 1 (Náhodná veli ina)

Výběr zdrojů, zadávání a správa úloh v MetaCentru

Zp soby vyuºití datových úloºi² CESNET. Michal Strnad

Prezentace. Ing. Petr V elák 6. b ezna 2009

Jak ti v dci po ítají

na za átku se denuje náhodná veli ina

DeepBurner (testování UI)

Sazba zdrojových kód. Jakub Kadl ík

IPCorder KNR-100 Instala ní p íru ka

Návrh va kových prol - CamEdit Uºivatelská p íru ka

Specifikace systému ESHOP

Tomá² H ebejk Obousm rné heuristické vyhledávání BAKALÁ SKÁ PRÁCE. Univerzita Karlova v Praze. Matematicko-fyzikální fakulta

C2115 Praktický úvod do superpočítání

IPCorder Uºivatelský manuál

Jevy, nezávislost, Bayesova v ta

Souborové systémy a práce s daty David Antoš

MetaCentrum. Tomáš Rebok MetaCentrum NGI, CESNET z.s.p.o. CERIT-SC, Masarykova Univerzita Olomouc,

Práce s daty. 2. února Do tohoto adresá e stáhn te ze stránek soubory data.dat a Nacti_data.sci.

MetaCentrum. Martin Kuba CESNET

P íklady k prvnímu testu - Pravd podobnost

MATLB: p edná²ka 1. Prom nné, indexování a operátory. TECHNICKÁ UNIVERZITA V LIBERCI Fakulta mechatroniky, informatiky a mezioborových studií

Základní praktikum laserové techniky

Magnetohydrodynamický pohon

Integrování jako opak derivování

Modelování v elektrotechnice

Novinky NGI & 10 způsobů, jak "sejmout" MetaCentrum

Aktuální stav. Martin Kuba CESNET a ÚVT MU

MetaCentrum - Virtualizace a její použití

1. (18 bod ) Náhodná veli ina X je po et rub p i 400 nezávislých hodech mincí. a) Pomocí ƒeby²evovy nerovnosti odhadn te pravd podobnost

Podklady pro zadávací řízení

Konceptuální modelování

2. Ur íme sudost/lichost funkce a pr se íky s osami. 6. Na záv r na rtneme graf vy²et ované funkce. 8x. x 2 +4

Výběr zdrojů, zadávání a správa úloh

k informacím, ve znění pozdějších předpisů.

Odpověď na dotaz dodavatele

Kapitola 1. Teorie portfolia. 1.1 Výnos a riziko akcie

Odpov di na dotazy uchaze k ve ejné zakázce. 20/ Rámcová smlouva o vývoji a údržb aplika ního programového vybavení EDS, EXK a DAP

Fakulta aplikovaných v d KIV/UUR Dokumentace k semestrální práci GUI k senzorické sítí ZigBee

MĚSTO NOVÁ BYSTŘICE SMĚRNICE PRO ZADÁVÁNÍ A EVIDENCI VEŘEJNÝCH ZAKÁZEK MALÉHO ROZSAHU (VZMR)

Binární operace. Úvod. Pomocný text

Neuronová síť. x 2 x 3. σ j. x 4. x 5. Menu: QCExpert Prediktivní metody

Pokyny k instalaci FRIATRACE Verze 5.3

Praktické úlohy- zaměření specializace

Výuka matematiky v 21. století na S technického typu Metodika - bude upravena po dokon ení testování modul v p ímé výuce

MobChar. Uºivatelská p íru ka pro balí ek pro Pána jeskyn. Mat j Shán l

3 D leºitá rozd lení náhodné veli iny

VYÚ TOVÁNÍ. dan z p íjm fyzických osob ze závislé innosti a z funk ních požitk (dále jen da ) za zda ovací období od. Prahu

Aplikace ENVIS pro energetickou ú innost dle ƒsn EN 16001:2010

Mapa kamer mobilní aplikace pro Android

2C Tisk-ePROJEKTY

Vzorové e²ení 4. série

Senátní opat ení Návrh evropské zadávací sm rnice

Online komunikace a videokonference

Datová centra z pohledu univerzity. David Antoš Ústav výpočetní techniky Masarykova univerzita antos@ics.muni.cz

Kelvin v kapkový generátor

Automatizovaná aktualizace struktury a dat rela ní databáze dle doménového modelu podnikové aplikace

Krajská hospodářská komora Střední Čechy. Pravidla soutěže. Poznáváme firmy ve středních Čechách. 1. Pořadatel soutěže. 2. Termín konání soutěže

ízení Tvorba kritéria 2. prosince 2014

Plánování výroby elekt iny a ízení rizik na liberalizovaném trhu

uzly. Výpočetní uzel (Working node) výkonná jednotka clusteru.

Fakulta elektrotechnická

Team Engineering. New in V13. TIA Portal news. Restricted / Siemens AG All Rights Reserved.

MetaCentrum. Miroslav Ruda. listopad 2013 CESNET

Školní kolo soutěže Mladý programátor 2016, kategorie A, B

Návrh reengineeringu vybraných procesů společnosti NeXA

ST2 - Cvi ení 1 STATISTICKÁ INDUKCE

Odpov di na dotazy uchaze k ve ejné zakázce. 25/

Testování p ístupnosti stránek státní správy ƒeské republiky. Václav Trpák

Pravidla pro využívání lokální počítačové sítě Slovanského gymnázia v Olomouci. Preambule

Bezpe nost mobilní komunikace

Odpov di na dotazy uchaze k ve ejné zakázce. 20/ Rámcová smlouva o vývoji a údržb aplika ního programového vybavení EDS, EXK a DAP

117D613 Euroklí Zásady podprogramu pro poskytování dotací v roce 2013 (dále jen Zásady podprogramu )

PARADIGMATA PROGRAMOVÁNÍ 2A MAKRA I

Elektronizace ve ejných zakázek

e²ení 1. série Úvodní gulá² autor: Kolektiv org

simphoto verze Manuál k aplikaci Autor: Datum:

Výuka matematiky v 21. století na S technického typu

Transkript:

CERIT-SC, MetaCentrum Rozvrhový plánova v CERIT-SC Václav Chlumský, Dalibor Klusá ek CESNET, z. s. p. o. 2. 12. 2014

Úvod MetaCentrum a CERIT-SC mj. poskytují rozsáhlé výpo etní zdroje efektivní spou²t ní úloh na t chto zdrojích vysoké vyuºití zdroj férovost v i uºivatel m zdroje jsou více homogení v CERIT-SC nový plánova v CERIT-SC výzkum a vývoj okolo plánova e n kolik let vychazí z dizertace D. Klusá ka (2011) praktický vývoj v TORQUE sou ástí diplomové práce (2012) dal²í vývoj pod CESNETem a GAƒR projektem P202/12/0306 vytvá í plán budoucího spu²t ní úloh optimalizace plánu nasazen v ervenci 2014

P edchozí p ístup k plánování úlohy jsou uloºeny ve frontách rozhodnutí o spu²t ní úlohy aº v poslední okamºik p ed spu²t ním obtíºn p edvídatelné a t ºko plánovatelné je t ºké optimalizovat n kolik kritérií sou asn

Nový p ístup k plánování fronty se ignorují (s vyjimkou prioritních front) vytvá í se budoucí plán spu²t ní úloh umoº uje p edvídat kde a kdy bude úloha spu²t na plán spu²t ní je moºné ohodnotit a vylep²it jeho kvalitu kaºdý cluster má sv j plán plán se neustále aktualizuje a komprimuje

Novinky: backlling plánova ví, kde je kolik nevyuºitých zdroj, tzv. díry umoº uje zaplnit tyto díry aniº by byl ohroºen plán spu²t ní d íve naplanované úlohy pro novou úlohu plánova hledá nejd ív j²í vhodnou díru

Novinky: kdy a kde qstat http://metavo.metacentrum.cz/schedule-overview/

Novinky: optimalizace existující plán je moºné ohodnotit z dvou r zných plánu lze rozhodnout, který je podle zvolených kriterií lep²í optimalizovaná kritéria pr m rná doba ekání pr m rné zpomalení úlohy jak dlouho je úloha v systému zpomalení úlohy = doba výpo tu férovost v i uºivateli v rozvrhu má desetkát v t²í váhu sledované kritérium: pr m rný as odezvy (jak dlouho je úloha v systému) zm ny v rozvrhu jsou náhodné na základ p edcházejících experiment p ijímají se pouze zlep²ující zm ny

Novinky: optimalizace 5% 0% 5% 10% 15% 20% 21.10. 26.10. 31.10. 5.11. 10.11. 15.11. 20.11. doba čekání 5% 0% 5% 10% 15% 20% 21.10. 26.10. 31.10. 5.11. 10.11. 15.11. 20.11. zpomalení 5% 0% 5% 10% 15% 20% 21.10. 26.10. 31.10. 5.11. 10.11. 15.11. 20.11. férovost 5% 0% 5% 10% 15% 20% 21.10. 26.10. 31.10. 5.11. 10.11. 15.11. 20.11. doba odezvy (nulová váha)

Hezké vlastnosti plánova e víme kdy a kde bude úloha spu²t na, uºivatel m ºe lépe organizovat svoji práci iniciáln naplánovaný as spu²t ní úlohy má tendenci se sniºovat lze vylep²ovat plán podle r zných kriterií sou asn, s r znou váhou na jednotlivá kriteria správce systému m ºe v mnoha p ípadech detekovat potíº pouhým pohledem na plán

Nepodporované vlastnosti sloºité poºadavky na uzly, nap : nodes=1:ppn=1+2:ppn=4 konkrétní uzel zavislá úloha je p idána do plánu aº kdyº je závislot spln na synchronizované úlohy

Nový vs. p edchozí plánova sledujeme a analyzujeme co se po nasazení d je pr b ºne ladíme plánova a jeho konguraci data v následujících grafech jsou za tato období p edchozí plánova : leden erven 2014 nový plánova : ervenec listopad 2014

Nový vs. p edchozí plánova prům. spotřebované CPU hodiny za den [CPUh] 100000 80000 60000 40000 20000 25 20 15 10 5 prům. doba čekání úloh [h] 0 předchozí plánovač nový plánovač 0 předchozí plánovač nový plánovač

Nový vs. p edchozí plánova 100% prům. vytížení clusterů 80% 60% 40% 20% 0% předchozí plánovač nový plánovač ungu zegox zigur zewura zapat

Nový vs. p edchozí plánova 200 150 prům. doba čekání [h] podle plánované doby běhu předchozí plánovač nový plánovač 100 50 0 >30 d 14 30 d 7 14 d 4 7 d 2 4 d 1 2 d 4 24 h 2 4 h 1 2 h <1h

Nový vs. p edchozí plánova prům. doba čekání [h] podle požadovaných počtu CPU 70 60 50 40 30 20 10 0 >96 CPUs 65 96 CPUs 33 64 CPUs 17 32 CPUs 9 16 CPUs 5 8 CPUs 3 4 CPUs 2 CPUs 1 CPU předchozí plánovač nový plánovač

CERIT-SC, MetaCentrum Tipy pro zadávání úloh

Tipy pro zadávání úloh pro asté a pohodlné p ihla²ování na elní uzel je vhodné nainstalovat na svoje PC Kerberos e²í opakované zadávání hesla Linux i Windows p íkaz pro zadávání úloh qsub [-q @server] -l resource_string skript

Výb r serveru specikace serveru (paramer -q) @arien.ics.muni.cz (vychozí pro: skirit, tarkil, nympha, hermes, minos, perian) @wagap.cerit-sc.cz (vychozí pro: zuphux) NEspecikovat frontu v MetaCentru ani v CERIT-SC s výjimkou prioritních front

Doba b hu úlohy poºadovaná doba b hu (parametr -l) -l walltime=[[dny:[hodiny:]]minuty:]sekundy[.milisekundy] -l walltime=10:00 úloha bude trvat nejvý²e 10 minut -l walltime=3:00:00 úloha bude trvat nejvý²e 3 hodiny -l walltime=[1w][1d][1h][1m][1s] -l walltime=1d1h úloha bude trvat nejvý²e 25 hodin -l walltime=4w úloha bude trvat nejvý²e 4 týdny, tj. 28 dn lze doporu it nadhodnocení 20%30% ím p esn j²í jsou odhady doby b hu úloh, tím p esn j²í je plán v CERIT-SC

Uzly a procesory poºadavky na uzly a po ty procesor (parametr -l) -l nodes=1:ppn=1 jeden procesor na jednom stroji -l nodes=1:ppn=16 jeden stroj s 16 procesory -l nodes=20:ppn=2 dvacet dvouprocesorových stroj -l nodes=1:ppn=4#excl exkluzivní p i azení uzlu s minimáln ty mi procesory exkluzivitu si lze p edstavit jako "nafouknutí" úlohy na celý uzel -l nodes=1:ppn=3:cl_zapat#excl -l nodes=1:ppn=16:cl_zapat konkrétní uzel/y (nelze v CERIT-SC) -l nodes=doom2.metacentrum.cz+doom9.metacentrum.cz

Vlastnosti a vyhraditelné zdroje vlastnosti uzly mají r zné vlastnosti brno, praha, cl_doom, inniband,... vylou ení uzl s vlastností: ĉl_doom vyhraditelné zdroje -l zdroj=hodnota p íklady zdroj : city, cluster, home, inniband, room,... nap.: -l city=plzen -l place=zdroj stejný zdroj, nezáleºí na hodnot nap.: -l place=cluster pouºití vlastnosti inniband vynutí -l place=inniband

Scratch lokální úloºi²t do asných dat na výpo etních uzlech -l scratch=1 úloha vyºaduje 1 KiB místa -l scratch=1gb úloha vyºaduje 1 GiB místa -l scratch=10gb:ssd úloha vyºaduje 10 GiB místa na SSD disku -l scratch=20gb:local úloha vyºaduje 20 GiB místa na lokálním HDD -l scratch=100gb:shared úloha vyºaduje 100 GiB sdíleného místa na sí ovém disku -l scratch=500gb:rst úloha vyºaduje 500 GiB místa na hlavním výpo etním uzlu (na ostatních nebude scratch alokován)

Scratch a jeho úklid #!/bin/bash #PBS -N poradkumilovnyjob #PBS -l nodes=1:ppn=1 #PBS -l mem=500mb #PBS -l scratch=1gb trap 'clean_scratch' TERM EXIT DATADIR="/storage/brno2/home/$LOGNAME/" cp $DATADIR/vstup.txt $SCRATCHDIR exit 1 cd $SCRATCHDIR exit 2 #... vlastní výpo et... cp vystup.txt $DATADIR export CLEAN_SCRATCH=false

Dal²í tipy notikace o stavu úlohy e-mailem (parametr -m) n neposílat ºádný e-mail a notikace o zru²ení úlohy systémem b notikace o spu²t ní úlohy e notikace o dokon ení úlohy qsub [-q @server] -l resource_string -m abe skript -M e-mail1,e-mail2 p edání prom nných úloze (parametr -v) qsub [-q @server] -l resource_string -v a=1,i=$j skript

Sledování stavu úlohy b hem výpo tu je moºné úlohu sledovat kdyº se n co neda í, ne ekat je moºné logovat, ºe se n co (ne)poda ilo na konkrétním uzlu: /var/spool/torque/spool/ 1234.arien.ics.muni.cz.OU standardní výstup 1234.arien.ics.muni.cz.ER standardní chybový výstup volba -j pro qsub n implicitní nastavení oe chybový výstup do standardního eo standardní výstup do chybového omezeno na 1GB

Co kdyº se úloha nespou²tí? p eklep v poºadovaných vlastnostech qsub nekontroluje, ºe poºadovaná vlastnost existuje nap.: cl_capat kontrola správného mnoºství poºadované pam ti p eklep v ádech/jednotkách plánovaný výpadek nap. nelze naplánovat m sí ní úlohu, pokud má být poºadovaný cluster za 14 dní odstaven kv li udrºb

Jak urychlit spu²t ní úlohy? nejsnadn ji se spustí úzká a krátká úloha zbyte n nenadhodnocovat poºadavky p esn j²í odhad doby b hu poºadovat pouze skute n pot ebné vlastnosti pokud je to moºné, pouºít -l place=zdroj v CERIT-SC je snaº²í spustit nodes=2:ppn=1 neº nodes=1:ppn=2 ale pozor