Povídání na téma. SUPERPOČÍTAČE DNES A ZÍTRA (aneb krátký náhled na SC) 3. 12. 2009 Filip Staněk



Podobné dokumenty
Povídání na téma SUPERPOČÍTAČE DNES A ZÍTRA

Grid jako superpočítač

Hlavní využití počítačů

Blue Gene Vysoká škola báňská-technická univerzita Ostrava. Blue Gene. Karel Chrastina. Úvod. Blue Gene L. Blue Gene P.

IB109 Návrh a implementace paralelních systémů. Organizace kurzu a úvod. RNDr. Jiří Barnat, Ph.D.

Přehled paralelních architektur. Dělení paralelních architektur Flynnova taxonomie Komunikační modely paralelních architektur

Pokročilé architektury počítačů

Paralelní výpočty ve finančnictví

IT4Innovations centrum excelence. Vít Vondrák & Filip Staněk VŠB-Technická univerzita v Ostravě

CERIT SCIENTIFIC CLOUD. Centrum CERIT-SC. Luděk Matyska. Praha, Seminář MetaCentra,

METACentrum Český národní gridovýprojekt. Projekt METACentrum. Jan Kmuníček ÚVT MU & CESNET. meta.cesnet.cz

SUPERPOČÍTAČE DANIEL LANGR ČVUT FIT / VZLÚ

OPS Paralelní systémy, seznam pojmů, klasifikace

Superpočítač včera, dnes a zítra; v Ostravě a mimo ni

IB109 Návrh a implementace paralelních systémů. Organizace kurzu a úvod. Jiří Barnat

METACentrum zastřešení českých gridových aktivit

Úvod do modelování v programu COMSOL Multiphysics verze 4

Martin Lísal. Úvod do MPI

Operační systémy. Přednáška 1: Úvod

Paralelní a distribuované výpočty (B4B36PDV)

Paralelní architektury - úvod

MetaCentrum. Martin Kuba CESNET

Představení a vývoj architektur vektorových procesorů

Paralelní architektury - úvod

Tvorba počítačových clusterů pomocí Linuxu. Vedoucí práce: Mgr. Jiří Pech, Ph.D. Katedra informatiky

Numerické modelování interakce proudění a pružného tělesa v lidském vokálním traktu

Návrhy elektromagnetických zení

Identifikátor materiálu: ICT-1-08

Roman Výtisk, VYT027

VÝUKOVÝ MATERIÁL. 3. ročník učebního oboru Elektrikář Přílohy. bez příloh. Identifikační údaje školy

architektura mostů severní / jižní most (angl. north / south bridge) 1. Čipové sady s architekturou severního / jižního mostu

Matematika, supercomputing a řesení reálných úloh

Ro R dina procesor pr ů Int In e t l Nehalem Šmída Mojmír, SMI108 PAP PA 2009

Architektura Intel Atom

Výpočetní zdroje v MetaCentru a jejich využití

České Budějovice. 2. dubna 2014

GPGPU Aplikace GPGPU. Obecné výpočty na grafických procesorech. Jan Vacata

PROCESOR. Typy procesorů

HP EliteBook 8440p. Záruka: 12 měsíců Cena: 5 690,- kč s DPH

INOVACE ODBORNÉHO VZDĚLÁVÁNÍ NA STŘEDNÍCH ŠKOLÁCH ZAMĚŘENÉ NA VYUŽÍVÁNÍ ENERGETICKÝCH ZDROJŮ PRO 21. STOLETÍ A NA JEJICH DOPAD NA ŽIVOTNÍ PROSTŘEDÍ

Cloudy a gridy v národní einfrastruktuře

Architektury počítačů

HAL3000 Niké II moderní síla pro náročné hraní her i práci

Jak ti vědci počítají

PV109: Historie a vývojové trendy ve VT

Vyuºití GPGPU pro zpracování dat z magnetické rezonance

Intel Itanium. Referát. Vysoká škola báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky Katedra informatiky

Přednášky o výpočetní technice. Hardware teoreticky. Adam Dominec 2010

Motivace. Software. Literatura a odkazy

GPU jako levný výpočetní akcelerátor pro obrazovou JPEG2000 kompresi. ORS 2011 Karviná,

CEITEC a jeho IT požadavky. RNDr. Radka Svobodová Vařeková, Ph.D.

DRUHY SESTAV. Rozlišujeme 4 základní druhy sestav. PC v provedení desktop. PC v provedení tower. Server. Notebook neboli laptop

Výkonnost mikroprocesoru ovlivňují nejvíce dvě hlediska - architektura mikroprocesoru a tzv. taktovací frekvence procesoru.

Přednáška 1. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012

Linux a 64 bitů. SUSE Labs. Michal Ludvig Vojtěch Pavlík

Informatika teorie. Vladimír Hradecký

Jak ti v dci po ítají

Od lineárních rovnic k extrémním superpočítačovým úlohám. Vít Vondrák

5 990,- září ceník. HCOMP AMD 4020 Trinity. Záruka 2 roky. Příplatky a software: Cena s DPH. Počítač: 4GB DDR3 RAM AMD HD GB HDD

Základní pojmy informačních technologií

HPC Users' Access Workshop: nový superpočítač Salomon

Základní jednotka procvičování

Volitelný počet jader

Provozní statistiky centra CERIT-SC

Výpočetní clustery v METACentru

5 990,- listopad ceník. HCOMP AMD 4020 Trinity. Záruka 2 roky. Příplatky a software: Cena s DPH. Počítač: 4GB DDR3 RAM AMD HD GB HDD

SOU Valašské Klobouky. VY_32_INOVACE_01_8 IKT Procesory, Intel, AMD, Architektura x86-64, AMR. Mgr. Radomír Soural

Cell broadband engine architecture

Vícejádrový procesor. Dvě nebo více nezávislých jader Pro plné využití. podporovat multihreading

Co je grafický akcelerátor

Specifikace VT 11 ks. Ultrabook dle specifikace v příloze č ks. 3G modem TP-LINK M5350

2.8 Procesory. Střední průmyslová škola strojnická Vsetín. Ing. Martin Baričák. Název šablony Název DUMu. Předmět Druh učebního materiálu

Pokročilé architektury počítačů

různých profesních oblastech

Nvidia CUDA Paralelní programování na GPU

Výběr zdrojů, zadávání a správa úloh v MetaCentru

Hardware. Z čeho se skládá počítač

Obecné výpočty na GPU v jazyce CUDA. Jiří Filipovič

C2115 Praktický úvod do superpočítání

Systémy pro sběr a přenos dat

Profilová část maturitní zkoušky 2014/2015

Hardware 1. Přehled platforem podle procesorů. PC (Wintel) různí výrobci - domácí počítače, pracovní stanice, servery 1-4 procesory Intel, AMD

Příloha č. 1 zadávací dokumentace. Technická dokumentace, specifikace požadovaného plnění a popis hodnocení

Procesor. Procesor FPU ALU. Řadič mikrokód

Procesor. Hardware - komponenty počítačů Procesory

5 790,- únor ceník. HCOMP AMD 4020 Trinity. Záruka 2 roky. Příplatky a software: Cena s DPH. Počítač: 4GB DDR3 RAM AMD HD GB HDD

Fujitsu Siemens Lifebook S752

Pokročilé architektury počítačů

Hardware 1. Přehled platforem podle procesorů

Pokročilé architektury počítačů

C2115 Praktický úvod do superpočítání

ZÁPADOČESKÁ UNIVERZITA V PLZNI FAKULTA ELEKTROTECHNICKÁ. Katedra technologií a měření BAKALÁŘSKÁ PRÁCE

5 590,- říjen ceník. HCOMP AMD 4020 Trinity. Záruka 2 roky. Příplatky a software: Cena s DPH. Počítač: Nová nižší cena!

VÝUKOVÝ MATERIÁL. 3. ročník učebního oboru Elektrikář Přílohy. bez příloh. Identifikační údaje školy

Dell Latitude E6420/E6520

INFORMAČNÍ A KOMUNIKAČNÍ TECHNOLOGIE

Přednáška #12: Úvod do paralelních počítačů. Paralelní počítače a architektury

Výběr zdrojů, zadávání a správa úloh

MetaCentrum. Tomáš Rebok MetaCentrum NGI, CESNET z.s.p.o. CERIT-SC, Masarykova Univerzita Olomouc,

5 990,- květen , ,- ceník. HCOMP AMD 4000 Trinity. Záruka 2 roky možnost splátek. Doporučený software. Cena s DPH.

Transkript:

Povídání na téma SUPERPOČÍTAČE DNES A ZÍTRA (aneb krátký náhled na SC) 3. 12. 2009 Filip Staněk

Co je to vlastně SC? Výpočetní systém, který určuje hranici maximálního možného výpočetního výkonu......v dané době samozřejmě. Jak poznat onu maximální hranici v konkrétní době? www.top500.org

Historie výkonu SC

Kategorizace SC Podle architektury SC konstelace (constellation) masivně paralelní počítač (MPP) klastr (cluster) Podle architektury CPU vektorové skalární

Masivně paralelní počítače (massive parallel processing - MPP) počítač s globálně sdílenou pamětí dvěmi a více procesory dělení na systémy se symetrickým (SMP) a nesymetrickým (NUMA/ccNUMA) přístupem do paměti paralelizace pomocí systému vláken (OpenMP), možnost autoparalelizace Výhody jednoduchá paralelizace i správa Nevýhody cena, často proprietární řešení Například Cray XT5 (1. místo), IBM Blue Gene P (4. místo).

Klastr (Cluster) většinou homogenní soubor vzájemně propojených počítačů, tzv. uzlů (node) paralelizace pomocí zasílání zpráv (message-passing MPI) potřeba kvalitního propojení (interconnect) s velkou propustností a malými latencemi Výhody cena, dostupnost Nevýhody nároky na interconnect (topologie), složitější paralelizace, správa Například RoadRunner (2. místo), Tianhe-1 (5. místo).

Konstelace (constellation) cluster menších MPP propojených do clusteru (min. 16 a více CPU na uzel) paralelizace pomocí kombinace MPI a OpenMP Výhody menší závislost na propojení uzlů, možnost paralelizace v rámci uzlu Nevýhody složitost paralelizace (MPI vs OpenMP), složitost plánování úloh, poměr cena/výkon Tera-10 (86. místo) a CEA-CCRT-Platin (118. místo) BULL

Zastoupení podle architektury SC Architektura Počet Proc. podíl Výkon Rmax Výkon Rpeak Konstelace 2 0.40 % 94970 112947 Mas. Par. Sys. 81 16.20 % 10939467 13614091 Clustery 417 83.40 % 16943065 27223084 Údaje z listopadu 2009 TOP500

Architektury CPU v SC Dominantní (99%) skalární architektura (superskalární, VLIW, RISC) Intel EM64T (79%) IBM Power (10%) AMD x86_64 (8%) IA-64 (1%) SPARC a další (1%) Minoritní (1%) vektorová architektura NEC SX-9 Earth simulator (31. místo) Údaje z listopadu 2009 TOP500

Akcelerátory Možný doplněk clusterů, MPP i konstelací. GP-GPU akcelerátory (grafické karty) FPGA (programovatelná hradlová pole) Propritetární (např. vektorové X2 pro CRAY XT) Vysoký výpočetní výkon, ale spíše single precision (mění se), omezená práce s pamětí (vhodné pro některé typy úloh), dobrá cena.

Propojení (interconnect) v rámci NUMA systémů mezi jednotlivými CPU (HyperTransport, QPI, NUMALINK, Cray IC) v rámci clusterů mezi jednotlivými uzly (Ethernet, Infiniband, Myrinet, Quadrics)

Zastoupení IC Ethernet (52%) Gigabit (51%) a 10G (0,2%) Infiniband (36%) 27%, DDR (6%), DDR 4x (2%), QDR () Myrinet (1,4%) Cray IC (1%) Proprietární (7,4%)

Vlasnosti IC Ethernet levný, běžný, otevřený, limit rychlosti a linek (STP) Infiniband otevřený, poměrně levný, rychlý (BW i latence) Cray IC proprietární, vázáný na Cray XT Myrinet dneš již starý, pomalý (BW), proprietární Quadrics zastaralý, uzavřený, pomalý

Základní topologie

3D-Mesh Cray XT

Torus Cray XT úplná topologie

3D-Torus IBM Blue Gene

CLOS (Fat-Tree)

Software Operační systém Linux (89%), UNIX (5%), smíšené (5%), Windows (1%) Paralelní souborový systém LUSTRE, GPFS, Panasas Plánovač Platform LFS, PBS/Torque, SUN SGE, MOAB

Jak se stanovuje výkon SC? FLOP/s počet operací s plovoucí čárkou za 1 s. (konkrétně se jedná o 64bitové číslo s plovoucí čárkou a operaci sčítání nebo násobení) Dnes se používá spíše TFLOP/s (10 12 FLOP/s). Rpeak maximální teoretický výkon pro jedno jádro: PO*FR (PO počet operací za cyklus, FR frekvence CPU) Rmax výkon naměřený v High Performance Linpack (HPL) benchmarku Linpack program na měření výpočetního výkonu, pomocí řešení husté soustavy lineárních rovnic

Nejvýkonější SC Pořadí Jméno - Země Výrobce Jádra Rmax Rpeak Energie (kw) Počítač/Rok 1 Jaguar - USA Cray Inc. 224162 1759.00 2331.00 6950.60 Cray XT5-HE Opteron Six Core 2.6 GHz / 2009 2 Roadrunner - USA IBM 122400 1042.00 1375.78 2345.50 BladeCenter QS22/LS21 Cluster, PowerXCell 8i 3.2 Ghz / Opteron DC 1.8 GHz, IB / 2009 3 Kraken - USA Cray Inc. 98928 831.70 1028.85 XT5 - Cray XT5-HE Opteron Six Core 2.6 GHz / 2009 4 JUGENE - Německo IBM 294912 825.50 1002.70 2268.00 Blue Gene/P Solution / 2009 5 Tianhe-1 - NUDT TH-1 Cluster NUDT 71680 563.10 1206.19 Xeon E5540/E5450, ATI Radeon HD 4870 2, Infiniband / 2009 Čína

Nejčastější úlohy SC Název Počet Procent. podíl Nespecifikováno 117 23.40 % Výzkum 78 15.60 % Finance 47 9.40 % Informační služby 34 6.80 % Geofyzika 31 6.20 % Logistické služby 30 6.00 % Polovodiče 22 4.40 % Služby zpracování informací 18 3.60 %

Příklady úloh SC kvantová mechanika předpověď počasí výzkum klimatických změn molekulární modelování (výpočty struktury a vlastností chemických sloučenin, biologických makromolekul, polymérů a krystalů) fyzikální simulace (proudění kapalin aerodynaický tunel, detonace jaderných zbraní, výzkum jaderné fůze)

Budoucnost SC EXA Scale Computing Nové technologie CPU integrace GPU do jader CPU, lepší vektorové jednotky a více jader... Problémy s propustností paměti proti CPU + další I/O problémy. Energetická náročnost. Nasazení technologie memristoru. Optické přenosy a uchovávání dat (plně optické kruhové přepínače).

Predikce výkonu SC

Situace v ČR V současnosti neexistuje žádný SC (jak je známe z TOP500). Do budoucna plánován SC v rámci IT4Innovations. Předpokládaný výkon přes 1 PFLOP/s. (rok 2015)

Příklad SCC (supercomputing centre)

Zdroje informací www.top500.org www.hpcwire.com www.wikipedia.org www.google.com

Děkuji za pozornost Otázky?