HPC Users' Access Workshop: nový superpočítač Salomon

Podobné dokumenty
MetaCentrum. Miroslav Ruda. listopad 2013 CESNET

C2115 Praktický úvod do superpočítání

Příloha č.2 - Technická specifikace předmětu veřejné zakázky

Datová úložiště v MetaCentru a okolí II. David Antoš Oddělení datových úložišť

Výpočetní zdroje v MetaCentru a jejich využití

Datová úložiště v MetaCentru a okolí. David Antoš

MetaCentrum. Martin Kuba CESNET

Souborové systémy a práce s daty David Antoš

Výběr zdrojů, zadávání a správa úloh v MetaCentru

Grid jako superpočítač

Dagmar Adamová, Jiří Chudoba Jednalo se o Monte Carlo simulace případů srážek p+p a Pb+Pb. Fungování

Základní jednotka procvičování

SUPERPOČÍTAČE DANIEL LANGR ČVUT FIT / VZLÚ

Zálohovací zařízení pro repozitář jazykových dat a digitálního materiálu pro jazykový výzkum

Povídání na téma SUPERPOČÍTAČE DNES A ZÍTRA

ANO technologie nabízí výměnu HW komponent za chodu.

Novinky z vývoje v MetaCentru

IT4Innovations centrum excelence. Vít Vondrák & Filip Staněk VŠB-Technická univerzita v Ostravě

CENÍK SLUŽEB FIREMNÍHO ŘEŠENÍ

METACentrum Český národní gridovýprojekt. Projekt METACentrum. Jan Kmuníček ÚVT MU & CESNET. meta.cesnet.cz

Příloha č. 1 zadávací dokumentace. Technická dokumentace, specifikace požadovaného plnění a popis hodnocení

MetaCentrum. Martin Kuba CESNET

METACENTRUM. Miroslav Ruda CESNET. Seminář MetaCentra, Praha

Povídání na téma. SUPERPOČÍTAČE DNES A ZÍTRA (aneb krátký náhled na SC) Filip Staněk

METACentrum zastřešení českých gridových aktivit

Zřízení technologického centra ORP Dobruška

SERVERY A STORAGE ABACUS Jan Petrák jp@abacus.cz

Aktuality a plány virtuální organizace

ReDefine Midrange Storage VNX/VNXe. Václav Šindelář, EMC

TECHNICKÁ SPECIFIKACE

MetaCentrum. Miroslav Ruda. březen 2017, Brno CESNET

AKČNÍ NABÍDKA BAREVNÝCH NOTEBOOKŮ - 15,6"

» STORAGE A SERVERY ABACUS Jan Petrák jp@abacus.cz

CERIT-SC reloaded. už se všichni těšíme. Seminář gridového počítání,

Provozní statistiky centra CERIT-SC

Fujitsu Siemens Lifebook S752

Copyright 2012 EMC Corporation. All rights reserved.

Hyperkonvergovaná řešení jako základní stavební blok moderního IT

Zálohování a rychlá obnova dat Konsolidace serverů a diskových polí Archivace elektronické pošty

Hlavní využití počítačů

Co je nového v NetWorkeru a Data Domain?

AKČNÍ NABÍDKA BAREVNÝCH NOTEBOOKŮ

Aktuální stav. Martin Kuba CESNET a ÚVT MU

CERIT SCIENTIFIC CLOUD. Centrum CERIT-SC. Luděk Matyska. Praha, Seminář MetaCentra,

Služby datového centra

Technická specifikace ČÁST 1. Místo plnění: PČR Kriminalistický ústav Praha, Bartolomějská 10, Praha 1

DataDomain pod drobnohledem

HP EliteBook 8440p. Záruka: 12 měsíců Cena: 5 690,- kč s DPH

Forenzní analytická jednotka - technická specifikace (9 ks)

Služby datového centra

Výpočetní klastr pro molekulové modelování

FUJITSU PRIMEFLEX. Human Centric Innovation in Action. Integrované systémy pro Vaše řešení. 30. května 2017 Pavel Čáslavský. 0 Copyright 2017 FUJITSU

Virtualizace koncových stanic Položka Požadováno Nabídka, konkrétní hodnota

MetaCentrum. datové služby. Miroslav Ruda, Zdeněk Šustr

Server je v informatice obecné označení pro počítač, který poskytuje nějaké služby nebo počítačový program, který tyto služby realizuje.

Příloha č. 2A Zadávací dokumentace k Veřejné zakázce Dodávka technologického řešení pro Geoportál

CHARAKTERISTIKA VEŘEJNÉ ZAKÁZKY

Mini PC HAL3000 NUC Passive Kč s DPH

V Poličce dne 7. července 2014 Věc: Dodatečná informace k zadávacím podmínkám č. 1

Specifikace předmětu veřejné zakázky

TECHNICKÁ SPECIFIKACE

2.1 Obecné parametry Obecné parametry Rack serveru

Cloudy a gridy v národní einfrastruktuře

Zadávací dokumentace na veřejnou zakázku malého rozsahu s názvem Obměna informačních technologií

aktivita CESNETu společně MU, UK a ZČU sdružuje výpočetní prostředky

MetaCentrum. Tomáš Rebok MetaCentrum NGI, CESNET z.s.p.o. CERIT-SC, Masarykova Univerzita Olomouc,

Volitelný počet jader

HW Diskové pole - 1KS

ZÁKLADNÍ DESKA ASUS PRIME X370-PRO ZÁKLADNÍ DESKA, AMD X370, AM4, 4X DIMM DDR4, 1X M.2, ATX

NMS. Linux na Strahově. Radim Roška & Moris Bangoura InstallFest Silicon Hill

Výběr zdrojů, zadávání a správa úloh

Softwarově definovaná úložiště a jejich využití

Příloha č. 1 Specifikace předmětu plnění

Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115

zadávaná v otevřeném řízení v souladu s ust. 27 zákona č. 137/2006 Sb., o veřejných zakázkách, ve znění pozdějších předpisů

Specifikace předmětu veřejné zakázky

1x server pro distanční vzdělávání (výpočtový server)

Windows Server Novinky. Petr Špetlík Cloud & Server PTA

Praha, Martin Beran

Agora Brno - 3.červen FUJITSU PRIMEFLEX Cluster-in-a-box. Radek Procházka Server presales FTS PUBLIC. Copyright 2014 FUJITSU

Vlastnosti produktu. Neutuchající pracovní nasazení s HAL3000 EliteWork

Zakázka malého rozsahu mimo zákon č. 137/2006 Sb. o veřejných zakázkách

Příloha č. 1 k Č.j.: OOP/10039/ Specifikace zařízení

METACENTRUM. Miroslav Ruda CESNET. Konference CESNET, Praha

STORAGE školení. 15. a Copyright 2015 FUJITSU

Vlastnosti produktu. Neutuchající pracovní nasazení s HAL3000 EliteWork

Herní PC HAL3000 Artemis výkonný lovec pro nekončící zábavu

Datasheet Server FUJITSU PRIMERGY CX272 S1 Dvoupaticový serverový uzel pro klastrový server PRIMERGY CX420

tímto vyzývá zájemce k podání nabídky na veřejnou zakázku

Město Varnsdorf, nám. E. Beneše 470, Varnsdorf, Česká republika SPECIFIKACE

architektura mostů severní / jižní most (angl. north / south bridge) 1. Čipové sady s architekturou severního / jižního mostu

Specifikace předmětu veřejné zakázky

CESNET - Datová úložiště

HAL3000 Niké II moderní síla pro náročné hraní her i práci

České Budějovice. 2. dubna 2014

Hardware - minulý rok

Jaké zvolit Softwarově definované datové úložiště?

Datová úložiště CESNET

SMB a Enterprise řešení

Datasheet Fujitsu PRIMERGY CX2570 M2 Cloud servery PRIMERGY

Transkript:

HPC Users' Access Workshop: nový superpočítač Salomon Salomon: co je nového pro uživatele Anselmu Roman Slíva, SCS, IT4Innovations Ostrava 18.9 2015

Agenda Úvod Porovnání systémů Anselm a Salomon Datová úložiště Plánovač/PBS SGI UV2000 Identity management Webová prezentace systémů

Salomon TOP500 #40

Salomon Více výpočetních zdrojů Nové příležitosti Nové výzvy Větší komplexita Zejména pro administrátory systému

Porovnání výpočetní výkon Salomon Velký cluster Rpeak CPU Rpeak GPU Anselm Anselm Rpeak MIC 0 200 400 600 800 1000 1200 1400 1600 1800 2000 TFLOPS

Porovnání výpočetní uzly souhrn I Anselm Salomon nárůst Počet uzlů 209 1009 4.8x Počet CPU jader 3344 24304 7.2x Operační paměť 15 136 GB 132 352 GB 8.7x Akcelerační karty 27 864 32x

Porovnání výpočetní uzly souhrn II

Porovnání výpočetní uzly souhrn III Anselm Salomon nárůst Počet uzlů bez akcelerace 180 576 3.2 Počet uzlů s akcelerací 27 432 16 Počet tlustých uzlů 2 1 0.5 Počet uzlů s GPU akcelerací 23 0 - Počet uzlů s MIC akcelerací 4 432 108

Porovnání výpočetní uzly I Homogenní Výpočetní uzly bez akcelerace - CPU Výpočetní uzly s akcelerací - CPU Anselm 2x Intel Sandy Bridge, Intel Xeon E5-2665, 8-core, 2.4GHz 2x Intel Sandy Bridge, Intel Xeon E5-2470, 8-core, 2.3GHz Salomon Instruction Set Extensions AVX AVX 2.0 Výpočetní uzly bez akcelerace paměť Výpočetní uzly s akcelerací paměť 64GB, 4GB/core 96GB, 6GB/core 2x Intel Haswell, Intel Xeon E5-2680v3, 12 core, 2.5GHz 2x Intel Haswell, Intel Xeon E5-2680v3, 12 core, 2.5GHz 128GB, 5.33GB/core 128GB, 5.33GB/core

Porovnání výpočetní uzly II Výpočetní uzly s akcelerací počet akcelerátorů na uzel Chlazení výpočetních uzlů Anselm 1 2 Studenou vodou chlazené zadní dveře racků Salomon Mcell- přímé chlazení teplou vodou Perrin - Studenou vodou chlazené zadní dveře racků

Porovnání akcelerátory Anselm GPU akcelerátor NVIDIA Tesla Kepler K20 - Počet 23 0 MIC akcelerátor Intel Xeon Phi 5110P 60 cores, 8GB Počet 4 864 Salomon Intel Xeon Phi 7120P 61 cores, 16GB

Porovnání výpočetní síť Anselm Salomon Technologie Infiniband QDR 40Gb/s Infiniband FDR 56Gb/s Topologie fully non-blocking fat-tree 7D Enhanced Hypercube

Porovnání datová úložiště Výpočetní uzly lokální disk Anselm 500GB Salomon HOME 320 TiB 454 TiB SCRATCH 146 TiB 1538 TiB ne

Salomon - diskless výpočetní uzly Lokální file-systémy vše v paměti RAM /, /tmp, /lscratch, /ramdisk - tmpfs Úlohy využívající extenzivně /tmp a/nebo /lscratch mohou selhat pro nedostatek paměti. Sdílené file-systémy /home, /scratch, /apps

Datové úložiště HOME - souhrn Anselm Salomon Mounpoint /home /home Kapacita 320 TiB 454 TiB Technologie Lustre CXFS/DMF/NFS Rychlost 2GiB/s 6GB/s Design 2 MDS, 2 OSS 1 diskové pole pro OST 22 OSTs 227 2TB NL-SAS 7.2krpm disks 22 groups of 10 disks in RAID6 (8+2) 7 hot-spare disks Komplexní HSM řešení tiered storage 6 serverů 3 disková pole 370 disků pásková knihovna

Datové úložiště HOME - pojmy XFS - high-performance 64-bit journaling file system created by Silicon Graphics (SGI) in 1993 CXFS - Clustered XFS - proprietary shared disk file system designed by Silicon Graphics (SGI) DMF - Data Migration Facility, Hierarchical storage management by SGI NFS - Need for Speed Network File System

Datové úložiště HOME tiery Tier 1, 100TB 2 výkonná disková pole Tier 2 kopie 1 400TB 1 kapacitní diskové pole Tier 2 kopie 2 >600TB Pásková knihovna

Datové úložiště HOME uživatelský pohled I $ df -h /home/ Filesystem Size Used Avail Use% Mounted on home-nfs-ib.salomon.it4i.cz:/home 96T 9,1T 87T 10% /home

Datové úložiště HOME uživatelský pohled II $ ls -alh total 4,1G drwxrwxr-x 2 karel karel 90 zář 17 08:25. drwx------ 15 karel karel 4,0K zář 16 11:00.. -rw-rw-r-- 1 karel karel 20G zář 11 10:02 testfile1 -rw-rw-r-- 1 karel karel 20G zář 11 10:13 testfile2 -rw-rw-r-- 1 karel karel 2,0G zář 14 15:00 testfile3 -rw-rw-r-- 1 karel karel 2,0G zář 17 08:17 testfile4

Datové úložiště HOME uživatelský pohled III $ du -h * 0 testfile1 0 testfile2 2,0G testfile3 2,0G testfile4 $ du -h. 4,0G.

Datové úložiště HOME uživatelský pohled IV $ du -h --apparent-size * 20G testfile1 20G testfile2 2,0G testfile3 2,0G testfile4 $ du -h --apparent-size. 44G.

Datové úložiště HOME DMF pohled I $ dmls -lah total 4.0G drwxrwxr-x 2 6666 6666 90 2015-09-16 13:35 (REG). drwx------ 15 6666 6666 4.0K 2015-09-16 11:00 (REG).. -rw-rw-r-- 1 6666 6666 20G 2015-09-11 10:02 (OFL) testfile1 -rw-rw-r-- 1 6666 6666 20G 2015-09-11 10:13 (OFL) testfile2 -rw-rw-r-- 1 6666 6666 2.0G 2015-09-14 15:00 (DUL) testfile3 -rw-rw-r-- 1 6666 6666 2.0G 2015-09-16 13:33 (REG) testfile4

Datové úložiště HOME DMF pohled II $ dmdu -h * 20G testfile1 20G testfile2 2.0G testfile3 2.0G testfile4 $ dmdu -h. 44G.

Datové úložiště HOME NFS Výpočetní cluster Výpočetní uzly - NFS klienti Login uzly NFS klienti NFS server NFS server NFS server CXFS cluster/dmf

Datové úložiště HOME NFS II NFS klient NFS klient NFS server NFS server CXFS cluster/dmf

Datové úložiště HOME doporučení Nepoužívejte HOME pro data úloh Používejte SCRATCH Je rychlejší, výkonnější Je transparentnější

Datové úložiště SCRATCH- souhrn Anselm Salomon Mounpoint /scratch /scratch Kapacita 146TiB 1538 TiB Technologie Lustre Lustre Rychlost 6 GiB/s >30 GiB/s Design 2 MDS, 2 OSS 2 disková pole pro OST 10 OSTs 106 2TB NL-SAS 7.2krpm disks 10 groups of 10 disks in RAID6 (8+2) 6 hot-spare disks 2 MDS, 6 OSS 1 diskové pole pro OST 54 OSTs 540 4TB NL-SAS 7.2krpm disks 54 groups of 10 disks in RAID6 (8+2) 15 hot-spare disks 4x 400GB SSD 6Gb/s SAS disky rozšiřující cache

Datové úložiště SCRATCH- rozdělení Anselm /scratch Data se po 90 dnech nepoužívání promazávají Salomon /scratch/temp Obdoba /scratch na anselmu pro dočasná data Data se po 90 dnech nepoužívání promazávají Salomon /scratch/work Persistentní, data se nepromazávají pro pracovní data /scratch/work/user /scratch/work/project

Datové úložiště SCRATCH- kvóty Anselm /scratch Lustre kvóta Salomon /scratch Lustre kvóta Salomon /scratch/temp RobinHood kvóta Salomon /scratch/work RobinHood kvóta

Datová úložiště - brány Připravujeme protokolové brány a data movery (nejenom) pro HOME a SCRATCH scp, sftp CIFS

Zálohování I Zálohování HOME Zálohování serverů Zálohování virtuálních serverů

Zálohování II EMC Networker arcserve Unified Data Protection arcserve Backup SGI DMF a OpenVault Pásková knihovna SpetraLogic T950B 18 mechanik LTO6 1600 slotů 3PB bez komprese

Plánovač Anselm Salomon Plánovač PBS Pro PBS Pro Verze PBSPro_12.0.1.130184 PBSPro_12.2.4.142262 Stejné principy Konfigurace plánovačů je obdobná Změny reflektují zejména rozdíly v systémech (a jejich velikostech)

PBS fronty I fronta Anselm Salomon qexp ano ano qfree ano ano qprod ano ano qlong ano ano qfree ano ano qprace ano ano qfat ano ano qviz ano ano qnvidia ano ne, nemá GPU qmic ano zatím ne, nový význam qmpp - nová fronta

PBS fronty II Walltime byl zachován Priorita front je shodná Účtování využitých zdrojů je shodné* Limity, omezení na zdroje a úlohy se liší

PBS fronty III

PBS akcelerátory $ qsub -A OPEN-0-0 -q qprod \ -l select=4:accelerator=true:naccelerators=2 \./myjob

PBS nastavení procesorů Intel Turbo Boost Core enabling/disabling (experimental) Intel HyperThreading (experimental)

PBS - Job scheduling - job execution priority Job execution priority je určována shodně na obou systémech Backfilling

PBS job estimation Co je job estimation? Proč je job estimation zlo?

PBS nodes statement PBS statement nodes (qsub -l nodes=nodespec) není podporován Používejte statement select (qsub -l select= )

SGI UV2000 Fat node SMP systém s architekturou SGI cc-numa 1x UV2 Large IRU, 8 Blades, 10U 6x UV2 Blade, 2CPU, 16x DIMM slot 14x Intel Xeon E5-4627v2, 3.3GHz, 8cores Ivy Bridge Instruction Set Extensions AVX celkem 112 jader RAM 3328 GB DDR3

Identity management Jednotná správa účtů uživatelů IT4Innovations

Web interfaces system visualization Anselm https://extranet.it4i.cz/rsweb/anselm/ Salomon https://extranet.it4i.cz/rsweb/salomon/ Ganglia https://extranet.it4i.cz/ganglia/

Web interfaces Anselm visualization

Web interfaces Salomon visualization

Web interfaces visualization

Děkuji za pozornost