C2115 Praktický úvod do superpočítání

Podobné dokumenty
C2115 Praktický úvod do superpočítání

C2115 Praktický úvod do superpočítání

architektura mostů severní / jižní most (angl. north / south bridge) 1. Čipové sady s architekturou severního / jižního mostu

C2115 Praktický úvod do superpočítání

C2115 Praktický úvod do superpočítání

Výběr zdrojů, zadávání a správa úloh v MetaCentru

C2115 Praktický úvod do superpočítání

HPC Users' Access Workshop: nový superpočítač Salomon

Server je v informatice obecné označení pro počítač, který poskytuje nějaké služby nebo počítačový program, který tyto služby realizuje.

Provozní statistiky centra CERIT-SC

MetaCentrum. Martin Kuba CESNET

Příloha č. 1 k Č.j.: OOP/10039/ Specifikace zařízení

Hyperkonvergovaná řešení jako základní stavební blok moderního IT

Datová úložiště. Zdroj: IBM

Datová úložiště v MetaCentru a okolí. David Antoš

Příloha č. 2A Zadávací dokumentace k Veřejné zakázce Dodávka technologického řešení pro Geoportál

levné pc pro nenáročné použití specifikace/ minimální požadavek zadavatele o výkonu min bodů v programu Passmark CPU Mark (

MetaCentrum. Martin Kuba CESNET

FUJITSU PRIMEFLEX. Human Centric Innovation in Action. Integrované systémy pro Vaše řešení. 30. května 2017 Pavel Čáslavský. 0 Copyright 2017 FUJITSU

Příloha č. 1 zadávací dokumentace. Technická dokumentace, specifikace požadovaného plnění a popis hodnocení

Cloudy a gridy v národní einfrastruktuře

C2115 Praktický úvod do superpočítání

Osobní počítač. Zpracoval: ict Aktualizace:

Základní pojmy informačních technologií

METACentrum Český národní gridovýprojekt. Projekt METACentrum. Jan Kmuníček ÚVT MU & CESNET. meta.cesnet.cz

Hlavní využití počítačů

Datová úložiště v MetaCentru a okolí II. David Antoš Oddělení datových úložišť

Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115

Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115

Obsah. Úschova dat v síti čtvrtletní práce. Jméno: Michal Tydrych Třída: 4.B Datum:

Počítačové síťě (computer network) Realizují propojení mezi PC z důvodu sdílení SW (informací, programů) a HW(disky, tiskárny..)

METACENTRUM. Miroslav Ruda CESNET. Seminář MetaCentra, Praha

SADA VY_32_INOVACE_PP1

Gridy v České republice. Luděk Matyska Masarykova univerzita v Brně CESNET, z.s.p.o.

ZÁKLADNÍ DESKA ASUS PRIME X370-PRO ZÁKLADNÍ DESKA, AMD X370, AM4, 4X DIMM DDR4, 1X M.2, ATX

Výpočetní zdroje v MetaCentru a jejich využití

Výběr zdrojů, zadávání a správa úloh

Paralelní architektury se sdílenou pamětí typu NUMA. NUMA architektury

SUPERPOČÍTAČE DANIEL LANGR ČVUT FIT / VZLÚ

Technická specifikace HW pro rok 2012

CHARAKTERISTIKA VEŘEJNÉ ZAKÁZKY

MetaCentrum. Miroslav Ruda. listopad 2013 CESNET

Identifikátor materiálu: ICT-1-08

Dagmar Adamová, Jiří Chudoba Jednalo se o Monte Carlo simulace případů srážek p+p a Pb+Pb. Fungování

Základní deska (mainboard)

Forenzní analytická jednotka - technická specifikace (9 ks)

Příloha č.2 - Technická specifikace předmětu veřejné zakázky

Diskové paměti nové pojmy a technologie

METACentrum zastřešení českých gridových aktivit

CERIT SCIENTIFIC CLOUD. Centrum CERIT-SC. Luděk Matyska. Praha, Seminář MetaCentra,

2.7 Základní deska. Střední průmyslová škola strojnická Vsetín. Ing. Martin Baričák. Název šablony Název DUMu. Předmět Druh učebního materiálu

Pokročilé architektury počítačů

Úvod do počítačových sítí

Informační a komunikační technologie

INFORMAČNÍ A KOMUNIKAČNÍ TECHNOLOGIE

STORAGE SPACES DIRECT

Přednáška 1. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012

PB002 Základy informačních technologií

Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115

CEITEC a jeho IT požadavky. RNDr. Radka Svobodová Vařeková, Ph.D.

3. Maturitní otázka PC komponenty 1. Počítačová skříň 2. Základní deska

Technická specifikace HW pro Upgrade systému NS-VIS PROD

MetaCentrum. Tomáš Rebok MetaCentrum NGI, CESNET z.s.p.o. CERIT-SC, Masarykova Univerzita Olomouc,

Nová éra diskových polí IBM Enterprise diskové pole s nízkým TCO! Simon Podepřel, Storage Sales

Výpočetní klastr pro molekulové modelování

C2115 Praktický úvod do superpočítání

Výzva na podání nabídek na veřejnou zakázku malého rozsahu

Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115

TECHNICKÁ SPECIFIKACE

Témata profilové maturitní zkoušky

Agora Brno - 3.červen FUJITSU PRIMEFLEX Cluster-in-a-box. Radek Procházka Server presales FTS PUBLIC. Copyright 2014 FUJITSU

» STORAGE A SERVERY ABACUS Jan Petrák jp@abacus.cz

Ro R dina procesor pr ů Int In e t l Nehalem Šmída Mojmír, SMI108 PAP PA 2009

Specifikace předmětu veřejné zakázky

Shrnutí Obecné Operační systém Microsoft Windows 7 Ultimate Centrální procesor

České Budějovice. 2. dubna 2014

SOUV-VVC, o.p.s. Nasavrky. Informační a komunikační technologie

ČÁST III. zadávací dokumentace technické podmínky ČÁST 1 veřejné zakázky

ReDefine Midrange Storage VNX/VNXe. Václav Šindelář, EMC

Operační systémy. Přednáška 1: Úvod

2.10 Vnější paměti. Střední průmyslová škola strojnická Vsetín. Ing. Martin Baričák. Název šablony Název DUMu. Předmět Druh učebního materiálu

Technická specifikace ČÁST 1. Místo plnění: PČR Kriminalistický ústav Praha, Bartolomějská 10, Praha 1

Metody připojování periferií BI-MPP Přednáška 1

Základní deska (motherboard, mainboard)

Storage Management Workload Management Backup and Recovery Management

CERIT-SC reloaded. už se všichni těšíme. Seminář gridového počítání,

Ondřej Lorenc System x a virtualizace ondrej_lorenc@cz.ibm.com

Přednášky o výpočetní technice. Hardware teoreticky. Adam Dominec 2010

Využití moderních přístupů při budování Technologického centra kraje

TECHNICKÁ SPECIFIKACE PŘEDMĚTU VEŘEJNÉ ZAKÁZKY. Pořízení Počítačů a strojů na zpracování dat 2017 pro Vysokou školu polytechnickou Jihlava

Praha, Martin Beran

Datasheet Server FUJITSU PRIMERGY CX272 S1 Dvoupaticový serverový uzel pro klastrový server PRIMERGY CX420

ELI: Petawatt nebo Petabyte kdo z koho?

Nimbus Data All Flash Systems

CENÍK SLUŽEB FIREMNÍHO ŘEŠENÍ

2.1 Obecné parametry Obecné parametry Rack serveru

Část 1. Technická specifikace. Posílení ochrany demokratické společnosti proti terorismu a extremismu

SERVERY A STORAGE ABACUS Jan Petrák jp@abacus.cz

1x server pro distanční vzdělávání (výpočtový server)

pole Princip 1. Zvýšení rychlosti. 2. Zvýšení bezpečnosti uložených dat (proti ztrátě).

Transkript:

C2115 Praktický úvod do superpočítání II. lekce Petr Kulhánek, Tomáš Bouchal kulhanek@chemi.muni.cz Národní centrum pro výzkum biomolekul, Přírodovědecká fakulta, Masarykova univerzita, Kotlářská 2, CZ-61137 Brno C2115 Praktický úvod do superpočítání -1-

Obsah Architektura klastrů a (super)počítačů Čelní uzly Výpočetní uzly a elementy Datové úložiště Síťová infrastruktura C2115 Praktický úvod do superpočítání -2-

(Super)počítačová centra User Interface (UI) (Frontend) Cluster Computational Node #1 Cluster Computational Node #1 Computational Node #1 Computational Node #1 Computational Worker (WN) Worker Node Node (WN) #1 Computational Worker (WN) Worker Node Node (WN) #1 Worker Node (WN) Worker Node (WN) Cluster User Interface (UI) (Frontend) Computational Node #1 Computational Node #1 Computational Worker (WN) Worker Node Node (WN) #1 Worker Node (WN) storage storage node node (SN) (SN) #1 #1 Batch Server Other services C2115 Praktický úvod do superpočítání -3-

(Super)počítačová centra User Interface (UI) (Frontend) Cluster Computational Node #1 Cluster Computational Node #1 Computational Node #1 Computational Node #1 Computational Worker (WN) Worker Node Node (WN) #1 Computational Worker (WN) Worker Node Node (WN) #1 Worker Node (WN) Worker Node (WN) User Interface (UI) (Frontend) použití UI nemusí být geograficky omezeno Batch Server Cluster Computational Node #1 Computational Node #1 Computational Worker (WN) Worker Node Node (WN) #1 Worker Node (WN) storage storage node node (SN) (SN) #1 #1 Other services C2115 Praktický úvod do superpočítání -4-

Čelní uzel Čelní uzel (front-end node, user interface) je počítač vyhrazený pro přímou interakci s uživatelem. Uživatel jej může použít pro přípravu vstupních dat úloh, zadávání úloh do dávkového systému, správu úloh a pro manipulaci s výsledky úloh (vizualizace). Čelní uzel, pokud to není explicitně povoleno, by se neměl používat pro spouštění CPU a paměťově náročných úloh, případný pre-processing či post-processing dat úloh je nutné zadávat jako samostatné úlohy do dávkového systému. U malých výpočetních klastrů je čelní uzel často zároveň i výpočetním uzlem. Klastr či superpočítač většinou obsluhuje úlohy celé řady uživatelů, což vyžaduje přistupovat k čelnímu uzlu pouze vzdáleně. (Nehledě na to, že čelní uzel je typicky fyzicky přítomen v počítačovém sále, kde je poměrně velký hluk.). C2115 Praktický úvod do superpočítání -5-

CE #1 Výpočetní uzel Výpočetní uzel (worker node - WN, computational node) je jednotka, která se chová jako samostatný počítač, který je vyhrazený pro řešení úloh uživatelů. Uzel může obsluhovat několik úloh současně. Počet úloh by však neměl překročit výpočetní zdroje (CPU, RAM, HDD), které tento uzel poskytuje. O efektivní využívání výpočetních zdrojů se stará OS (operační systém) ve spojení s dávkovým systémem. Výpočetní element (computational element - CE), velmi často též nazýván jako klastr, je uskupení výpočetních uzlů nejčastěji se stejnou architekturou (homogenní klastr). Tyto uzly jsou většinou spojeny velmi rychlou lokální sítí (ethernet 1 Gbs, Infiniband, či proprietárním řešením). Kromě výše uvedeného může jedna úloha běžet na více výpočetních uzlech. Úloha může běžet i na uzlech, které jsou v různých CE. Toto je však vhodné jen pro speciální typ úloh. WN #1 úloha #1 úloha #2 WN #2 WN #3 úloha #3 C2115 Praktický úvod do superpočítání -6-

Výpočetní element / uzel Klastr LEX (výpočetní element) výpočetní uzly Řadiče Infinibandu skříň (rack) C2115 Praktický úvod do superpočítání -7-

Výpočetní uzel 1U výška = 1,75 palce (44.45 mm) jeden počítač v jednom šasi twin dva počítače v jednom šasi ukázky typických výpočetních uzlů, které se používají v "levných" klastrech v superpočítačích se většinou používá proprietární řešení C2115 Praktický úvod do superpočítání -8-

Výpočetní uzel procesory paměť chlazení disky lokální datové úložiště C2115 Praktický úvod do superpočítání -9-

Výpočetní uzel SGI UV2000 pip jeden výpočetní uzel 192 CPU jader, 4 TB paměti blades sběrnice diskové pole lokální datové úložiště C2115 Praktický úvod do superpočítání -10-

Výpočetní uzel - akcelerátory NVidia Tesla K20 (GPGPU) Intel Xeon Phi (MIC) Výpočetní výkon akcelerátorů může přesáhnout výkon instalovaných CPU na výpočetním uzlu. C2115 Praktický úvod do superpočítání -11-

Typické schéma počítače paměť CPU řadič paměti severní můstek grafický systém periferie s rychlým přístupem přes PCI Express (akcelerátory) zvuk USB jižní můstek síť (ethernet) BIOS myš, klávesnice PCI sběrnice hodiny reálného času řadiče SATA pevné disky C2115 Praktický úvod do superpočítání -12-

Víceprocesorové uzly Výpočetní uzly v dnešní době obsahují více fyzické procesorů (minimálně dva), kdy každý obsahuje více výpočetních CPU jader. Operační paměť je pak většinou přístupná s různou rychlostí (NUMA Non-Uniform Memory Architecture). Důvodem pro toto uspořádání je navyšování výpočetního výkonu, což však sebou přináší zvýšené nároky na přípravu a spouštění výpočetních úloh. C2115 Praktický úvod do superpočítání -13-

Datové úložiště - dělení Typy úložišť a jejich použití: lokální datové úložiště dočasné data úloh (vzdálená) datové úložiště (diskové pole) živá data úloh či řešených projektů hierarchické datové úložiště ukončené projekty a zálohy wikipedia.org C2115 Praktický úvod do superpočítání -14-

Lokální datové úložiště Diskové pole připojená lokálně k výpočetnímu uzlu. HDD - pevný disk (Hard Disk Drive) je zařízení, které se používá v počítačích k trvalému uchovávání většího množství dat pomocí magnetické indukce. SSD - Solid-State Drive je v informačních technologiích typ datového média, které na rozdíl od magnetických pevných disků neobsahuje pohyblivé mechanické části a má mnohem nižší spotřebu elektrické energie. Lokální dočasné úložiště (scratch adresáře) jsou určené pro aktuálně běžící úlohy na výpočetním uzlu. Tyto adresáře se NESMÍ* používat pro dlouhodobé ukládání dat. *) samozřejmě můžete, ale pak se nedivte, že je jednoho krásného dne nenaleznete, protože administrátor, či jiný inteligentní nástroj, úložiště pročistil wikipedia.org C2115 Praktický úvod do superpočítání -15-

Diskové pole brno9-ceitec 269 TiB souborové servery zpřístupňující data diskového pole vzdáleně přes NFS (Network File System) protokol diskové pole RAID6 RAID 0 diskové pole RAID6 Disková pole jsou vhodná pro aktuálně řešené projekty. velké množství HDD C2115 Praktický úvod do superpočítání -16-

Diskové pole ochrana dat Diskové pole obsahují velké množství HDD, což jsou mechanické komponenty, které jsou náchylné k selhání. Pro omezení poškození dat jsou data nejčastěji chráněna pomocí techniky RAID. RAID (Redundant Array of Inexpensive/Independent Disks) je v informatice metoda zabezpečení dat proti selhání pevného disku. Zabezpečení je realizováno specifickým ukládáním dat na více nezávislých disků, kdy jsou uložená data zachována i při selhání některého z nich. Úroveň zabezpečení se liší podle zvoleného typu RAID, které je označováno čísly (nejčastěji RAID 0, RAID 1, RAID 5 či nověji RAID 6). Při poškození části diskového pole běží pole v degradovaném režimu, kdy již další selhání by bylo neopravitelné. Proto jsou v diskových polích vyhrazeny tzv. spare disky, které se ihned použiji jako náhrada za poškozené. Po dobu rebuildování diskového pole (nový výpočet parity dat) může být přístupová rychlost k datům snížena. wikipedia.org C2115 Praktický úvod do superpočítání -17-

Hierarchické datové úložiště Hierarchical storage management (HSM) is a data storage technique, which automatically moves data between high-cost and low-cost storage media. While it would be ideal to have all data available on high-speed devices all the time, this is prohibitively expensive for many organizations. Instead, HSM systems store the bulk of the enterprise's data on slower devices, and then copy data to faster disk drives when needed. The HSM system monitors the way data is used and makes best guesses as to which data can safely be moved to slower devices and which data should stay on the fast devices. brno10-ceitec-hsm (páskový robot) HSM úložiště jsou vhodná pro archivaci a zálohu dat. wikipedia.org C2115 Praktický úvod do superpočítání -18-

Jednotky původní značení wikipedia.org C2115 Praktický úvod do superpočítání -19-

Síťová infrastruktura Ethernet (česky i eternet) je název souhrnu technologií pro lokální počítačové sítě (LAN), které používají kabely s kroucenou dvoulinkou, optické kabely pro komunikaci přenosovými rychlostmi od 10 Mbit/s po 100 Gbit/s. InfiniBand (abbreviated IB), a computer-networking communications standard used in high-performance computing, features very high throughput and very low latency. It is used for data interconnect both among and within computers. InfiniBand is also utilized as either a direct, or switched interconnect between servers and storage systems, as well as an interconnect between storage systems. Infiniband je vhodné použít pro datově náročné paralelní úlohy, které využívají více výpočetních uzlů. wikipedia.org C2115 Praktický úvod do superpočítání -20-

Dávkový systém Dávkové zpracování je vykonávání série programů (tzv. dávek) na počítači bez účasti uživatele. Dávky jsou připraveny předem, takže mohou být zpracovány předány bez účasti uživatele. Všechna vstupní data jsou předem připravena v souborech (skriptech) nebo zadána pomocí parametrů na příkazovém řádku. Dávkové zpracování je opakem interaktivního zpracování, kdy uživatel až teprve za běhu programu poskytuje požadované vstupy. Výhody dávkového zpracování sdílení zdrojů počítače mezi mnoha uživateli a programy odložení zpracování dávek do doby, kdy je počítač méně vytížen odstranění prodlev způsobeným čekáním na vstup od uživatele maximalizace využití počítače zlepšuje využití investic (zejména u dražších počítačů) Naše lokalní klastry, MetaCentrum: Torque IT4I: PBSPro PBSPro a Torque jsou odvozeny z OpenPBS. wikipedia.org C2115 Praktický úvod do superpočítání -21-

Cvičení 1 1. Jaké jméno má vaše pracovní stanice (počítač) na klastru WOLF? 2. Jakou roli má tento počítač v rámci klastru WOLF? 3. Z dokumentace zjistěte jména čelních uzlů virtuální organizace MetaCentrum. 4. Ověřte, že se můžete přihlásit na jeden z čelních uzlů MetaCentra. 5. Kolik pevných disků může selhat ve skupině disků, které jsou chráněny pomocí RAID6? 6. Může sloužit RAID0 k ochraně dat? 7. Jak se označuje kombinace RAID6 a RAID0? 8. Jaký typ akcelerátoru je využit v superpočítači salomon (IT4I)? C2115 Praktický úvod do superpočítání -22-