IT4I HPC prostředky pro řešení obrovských inženýrských úloh

Podobné dokumenty
Od lineárních rovnic k extrémním superpočítačovým úlohám. Vít Vondrák

Hlavní využití počítačů

Povídání na téma SUPERPOČÍTAČE DNES A ZÍTRA

Povídání na téma. SUPERPOČÍTAČE DNES A ZÍTRA (aneb krátký náhled na SC) Filip Staněk

Grid jako superpočítač

Matematika, supercomputing a řesení reálných úloh

GPGPU Aplikace GPGPU. Obecné výpočty na grafických procesorech. Jan Vacata

Blue Gene Vysoká škola báňská-technická univerzita Ostrava. Blue Gene. Karel Chrastina. Úvod. Blue Gene L. Blue Gene P.

Část 2 POROVNÁNÍ VÝKONNOSTI A POUŽITELNOSTI ARCHITEKTUR V TYPICKÝCH APLIKACÍCH

C2115 Praktický úvod do superpočítání

Training v PRACE a IT4Innovations. Ondřej Jakl IT4Innovations & PRACE

IT4Innovations centrum excelence. Vít Vondrák & Filip Staněk VŠB-Technická univerzita v Ostravě

IT4Innovations Centre of Excellence

CERIT-SC reloaded. už se všichni těšíme. Seminář gridového počítání,

CERIT SCIENTIFIC CLOUD. Centrum CERIT-SC. Luděk Matyska. Praha, Seminář MetaCentra,

SUPERPOČÍTAČE DANIEL LANGR ČVUT FIT / VZLÚ

HPC Users' Access Workshop: nový superpočítač Salomon

IB109 Návrh a implementace paralelních systémů. Organizace kurzu a úvod. RNDr. Jiří Barnat, Ph.D.

Vážené kolegyně, vážení kolegové, SUPERPOČÍTAČ SALOMON JE 40. NEJVÝKONNĚJŠÍ NA SVĚTĚ TECHNICKÉ PARAMETRY

Superpočítač včera, dnes a zítra; v Ostravě a mimo ni

Obecné výpočty na GPU v jazyce CUDA. Jiří Filipovič

MetaCentrum. Martin Kuba CESNET

Paralelní a distribuované výpočty (B4B36PDV)

Martin Lísal. Úvod do MPI

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

Cloudy a gridy v národní einfrastruktuře

OPS Paralelní systémy, seznam pojmů, klasifikace

Paralelní výpočty ve finančnictví

FP - SEMINÁŘ Z NUMERICKÉ MATEMATIKY. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Základní rutiny pro numerickou lineární algebru. I. Šimeček, M. Šoch

SUPERPOČÍTAČOVÉ CENTRUM. Luděk Matyska

2.8 Procesory. Střední průmyslová škola strojnická Vsetín. Ing. Martin Baričák. Název šablony Název DUMu. Předmět Druh učebního materiálu

Návrhy elektromagnetických zení

Přehled paralelních architektur. Dělení paralelních architektur Flynnova taxonomie Komunikační modely paralelních architektur

C2115 Praktický úvod do superpočítání

METACentrum Český národní gridovýprojekt. Projekt METACentrum. Jan Kmuníček ÚVT MU & CESNET. meta.cesnet.cz

INOVACE ODBORNÉHO VZDĚLÁVÁNÍ NA STŘEDNÍCH ŠKOLÁCH ZAMĚŘENÉ NA VYUŽÍVÁNÍ ENERGETICKÝCH ZDROJŮ PRO 21. STOLETÍ A NA JEJICH DOPAD NA ŽIVOTNÍ PROSTŘEDÍ

Procesor Intel Pentium (1) Procesor Intel Pentium (3) Procesor Intel Pentium Pro (1) Procesor Intel Pentium (2)

Architektury počítačů

Vážené kolegyně, vážení kolegové,

Výkonnost mikroprocesoru ovlivňují nejvíce dvě hlediska - architektura mikroprocesoru a tzv. taktovací frekvence procesoru.

Vyuºití GPGPU pro zpracování dat z magnetické rezonance

Projekt IT4Innovations schválen

PROCESOR. Typy procesorů

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

Tvorba počítačových clusterů pomocí Linuxu. Vedoucí práce: Mgr. Jiří Pech, Ph.D. Katedra informatiky

VÝUKOVÝ MATERIÁL. 3. ročník učebního oboru Elektrikář Přílohy. bez příloh. Identifikační údaje školy

INFORMAČNÍ A KOMUNIKAČNÍ TECHNOLOGIE

METACentrum zastřešení českých gridových aktivit

Centrum excelence IT4Innovations: superpočítání ve službách vědy

Závěrečná zpráva projektu Experimentální výpočetní grid pro numerickou lineární algebru


EGI-InSPIRE. Gridové výpočty pro velké projekty i jednotlivé uživatele (aktivity ve VS FZÚ) Jiří Chudoba. Fyzikální ústav AV ČR a CESNET.

Katedra geotechniky a podzemního stavitelství

1. Informace a informatika

Aplikovaná numerická matematika - ANM

Klasifikace počítačů a technologické trendy Modifikace von Neumanova schématu pro PC

Infrastruktura IT4Innovations Superpočítač Anselm. Ing. Jan Przezwiecki

Zřízení studijního oboru HPC (High performance computing)

Provozní statistiky centra CERIT-SC

Numerické metody a programování

Nová éra diskových polí IBM Enterprise diskové pole s nízkým TCO! Simon Podepřel, Storage Sales

Numerické modelování interakce proudění a pružného tělesa v lidském vokálním traktu

Vážené kolegyně, vážení kolegové,

Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Motivace. Software. Literatura a odkazy

BRDSM core: Komplexní systém dynamického řízení kvality plynule odlévané oceli

Objektově orientovaná implementace škálovatelných algoritmů pro řešení kontaktních úloh

MetaCentrum. Miroslav Ruda. listopad 2013 CESNET

Osobní počítač. Zpracoval: ict Aktualizace:

různých profesních oblastech

Představení a vývoj architektur vektorových procesorů

Předmět: informační a komunikační technologie

<Insert Picture Here> Software, Hardware, Complete

METACENTRUM. Miroslav Ruda CESNET. Seminář MetaCentra, Praha

HP EliteBook 8440p. Záruka: 12 měsíců Cena: 5 690,- kč s DPH

UMÍ POČÍTAČE POČÍTAT?

Téma: Základní rozdělení Hardware

Paralelní algoritmy --- Parallel Algorithms

Úvod do přesnosti MKP, generace sítí a metod řešení soustav lineárních rovnic

Mgr. Renáta Rellová. Výukový materiál zpracován v rámci projektu EU peníze školám

Static Load Balancing Applied to Time Dependent Mechanical Problems

VYBRANÉ PARTIE Z NUMERICKÉ MATEMATIKY

HAL3000 Niké II moderní síla pro náročné hraní her i práci

Výpočetní zdroje v MetaCentru a jejich využití

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

NOVÝ DIAGNOSTICKÝ TESTER DCU 100 UPGRADE KTS 460

Představení projektu Vize: zaměřením na rozvoj a aplikace superpočítačových metod Mise: největších superpočítačů Implementovat výzkumné programy

Pokročilé architektury počítačů

Globální matice konstrukce

MetaCentrum. Tomáš Rebok MetaCentrum NGI, CESNET z.s.p.o. CERIT-SC, Masarykova Univerzita Olomouc,

AKČNÍ NABÍDKA BAREVNÝCH NOTEBOOKŮ

Simulace (nejen) fyzikálních jevů na počítači

Ro R dina procesor pr ů Int In e t l Nehalem Šmída Mojmír, SMI108 PAP PA 2009

Jak ti vědci počítají

MetaCentrum. datové služby. Miroslav Ruda, Zdeněk Šustr

Synergické efekty VaVpI projektů na VŠB-TU Ostrava

5 790,- únor ceník. HCOMP AMD 4020 Trinity. Záruka 2 roky. Příplatky a software: Cena s DPH. Počítač: 4GB DDR3 RAM AMD HD GB HDD

KOMENTÁŘ VÍTA VONDRÁKA, ŘEDITELE IT4INNOVATIONS

HAL3000 MČR Pro tak hrají skuteční profesionálové

Transkript:

IT4I HPC prostředky pro řešení obrovských inženýrských úloh www.it4i.cz David Horák Lubomír Říha Marta Jarošová Tomáš Karásek Tomáš Kozubek Vít Vondrák Václav Hapla

V.Láska, V.Hruška, Praha, 1927: Teorie a prakse numerického počtu industry.it4i.cz www.it4i.cz

Pomůcky počtářské industry.it4i.cz www.it4i.cz

1

Anselm Mobilní superpočítač výkon 2000+ mobilních počítačů

Anselm Dieselový generátor industry.it4i.cz www.it4i.cz 4 chladící věže Chladící infrastruktura Servisní kontejner MOBULL kontejner

Anselm kdysi Rozvoj průmyslu ve velkém měřítku na Ostravsku 1835 vzniká hloubením jámy později nazvané Strojní uprostřed důlního pole Ferdinandovo štěstí 1843 přejmenován na Důl Anselm 1847 prvním v revíru, kde byl v roce 1847 použit parní stroj industry.it4i.cz www.it4i.cz Technické parametry těžilo se zde 157 let hloubka 621,5 metrů

Anselm dnes uvnitř První superpočítač prvního superpočítačového centra v ČR IT4I 94 000 000 000 000 = 94x10 12 výpočtů za sekundu = FLOPS 207 extrémně výkonných počítačů 1000+ domácích počítačů rychlá komunikace mezi jednotlivými počítači 4000x rychlejší než průměrné připojení k internetu nové technologie a architektury v HPC Výpočetní akcelerátory Intel Xeon Phi Grafické akcelerátory Nvidia Tesla K20 Spuštění květen 2013 Životnost 4-5 let industry.it4i.cz www.it4i.cz

Anselm dnes uvnitř industry.it4i.cz www.it4i.cz 180 x 307.2 GFLOPS 55296 GFLOPS 27 x 294.4 GFLOPS 7948 GFLOPS 43 GFLOPS 23 x 1170 GFLOPS 26910 GFLOPS 4 x 1010 GFLOPS 4040 GFLOPS -------------------- 94 195 GFLOPS GFLOP = Giga FLOP = 10 9 = 1 000 000 000 výpočtů za sekundu

Anselm dnes uvnitř industry.it4i.cz www.it4i.cz

2

8 ks (700/900MHz,512MB RAM, 8x870Kč) + 1 ks 280 Kč + 1 ks + 2 ks + 8 ks + 170 Kč 2x45 Kč 8x170 Kč + cca 1 týden intenzivní práce D. & M. Horáka & L. Říhy = 8 ks 8x80 Kč

Given the challenge of illustrating parallel computing to secondary school students here is an account by Ben Eagan, a computational scientist at ICHEC and a recent graduate of the EPCC MSc. in High Performance Computing, where he designed and developed both the hardware and software for a "mini" cluster centred around the Raspberry Pi. In October 2012 Ben was assigned to build a Raspberry Pi cluster as apart of the outreach programme within ICHEC at the Galway 091 Labs Makerspace. Several of his classmates had been planning to build a Raspberry Pi cluster of their own as a Dissertation project, but demand was so high they were forced to plan something else. The cluster was built following instructions made available by Prof. Simon Cox at the University of Southampton, who built a supercomputer from 64 Raspberry Pis running the Debian based Raspbian Wheezy operating systems, with parallel jobs being executed using the Message Passing Interface (mpich2).

PERMONÍCI jsou obecně mýtické bytosti vyskytující se zejména v dolech a důlních štolách, tedy zejména v podzemí. V bájích, pohádkách a mýtech se jedná o zvláštní podzemní skřítky, kteří normálním horníkům snad někdy pomáhají a někdy prý i úmyslně škodí - pověsti tohoto typu se vyskytují v mnoha oblastech světa, v tomto smyslu se jedná pravděpodobně o jeden ze základních lidských kulturních archetypů. Označení pochází z německého výrazu Bergmann (muž z hory) a je tedy vytvořeno obdobně jako vasrman (Wassermann - vodník) nebo fajérman (Feuermann - ohnivý muž). [Wikipedie]

3

Salomon - Ostravská šachta + bankéř Salomon Mayer Rotschild - teoretický výkon 2,5 PFLOPS, dodavatel SGI, dodání červenec 2015-1008 výpočetních uzlů, 24192 jader, 864 akcelerátorů - 24192 jader Intel Xeon (Haswell-EP, 24 jader, 2,5GHz, 128GB RAM) - 52704 jader akceleračních koprocesorů Intel Xeon Phi 7120P (MIC, 61 jader, 16 GB) - 129024 GB operační paměti - Infiniband FDR 56Gb/s, topolgie 7D Enhanced Hypercube - 2 PB úložiště - Příkon 732kVA, hmotnost 30 t - Cena 274 900 000 Kč

Test na motorové brzdě 300 kw Linpack test 1,045 PFlops Linpack test 1 GFlops

LINPACK benchmark J. Dongarry: Měření výkonu počítačů ww.top500.org Pomocí HPL (High Performance Linpack) Jedná se o řešení soustavy n lineárních rovnic o n neznámých LU rozkladem s částečnou pivotizací mající výpočetní náročnost 2/3n 3 +2n 2 Ax = b Û ( LU)x = b Û L( Ux) = b Ly = b Ux = y

Basic Linear Algebra Subprograms BLAS Standardizace nejčastěji používaných operací v lineární algebře, tj. operací s vektory a maticemi Poprvé zmíněno Lawsonem, Hansonem, Kincaidem a Kroghem v roce 1979. Dnes existuje celá řada knihoven implementující velmi efektivně BLAS: ACML - AMD Core Math Library, ATLAS - Automatically Tuned Linear Algebra Software cublas BLAS pro NVIDIA GPU karty, Intel MKL - Intel Math Kernel Library, Netlib BLAS. Standardizace názvů subroutin: Dle datových typů S... Single precision D... Double precision C... Komplexní čísla Dle typů matic: GE GEneral obecné matice GB General Banded obecná pásová matice SY Symmetric symetrická matice TR Triangular trojúhelníková matice Příklad: DGEMM = Double precision, GEneral matrix, Matrix-Matrix operation C := αab + βc asymptotickou náročností f(n)=n 3 +3n 2, tj. O(n 3 )

Silná paralelní škálovatelnost: čas potřebný pro řešení úlohy na N procesorech je T(N) = T(1)/N

Superpočítače ve světě Tianhe-2 55 PFLOPS 16,000 počítačů 2x Intel procesor 8 jader 3x Intel Xeon Phi akcelerátor 384,000 procesorových jader 48,000 akcelerátorů Titan 27 PFLOPS 18,688 počítačů 1x AMD procesor 16 jader 1x Tesla K20 grafický akcelerátor 299,008 procesorových jader 18,688 akcelerátorů PFLOP = Peta FLOP = 10 15 = 1 000 000 000 000 000 výpočtů za sekundu ~80 x větší než Anselm

PRACE Partnership for Advanced Computing in Europe http://prace-ri.eu/ http://prace.it4i.cz/ Tier- 0 Tier-1 Tier-2 Sixth production system available by January 2013: 1 Petaflop/s IBM (MareNostrum) at BSC. Upgrade: 5.9 Petaflop/s IBM Blue Gene/Q (JUQUEEN) First production system available: 1 Petaflop/s IBM BlueGene/P (JUGENE) at GCS (Gauss Centre for Supercomputing) partner FZJ (Forschungszentrum Jülich) Fifth production system available by August 2011: 2.1 Petaflop/s IIBM BG/Q (FERMI) at CINEC. Second production system available: Bull Bullx CURIE at GENCI partner CEA. Full capacity of 1.7 Petaflop/s reached by late 2011. Fourth production system available by mid 2012: 3.2 Petaflop/s IBM (SuperMUC) at GCS partner LRZ (Leibniz-Rechenzentrum). Third production system available by the end of 2011: 1 Petaflop/s Cray (HERMIT) at GCS partner HLRS (High Performance Computing Center Stuttgart).

Výzkum na IT4Innovations

Škálovatelné algoritmy založené na metodách rozložení oblasti F Ku = f výpočet. nároč. sekvenčních alg. je úměrná počtu neznámých na třetío(n 3 ) výpočet. nároč. paralelních alg. je přímo úměrná počtu neznámých O(N) F Ku = f na Bu = c F Ku = f na Bu c kontaktní úloha Čas řešení log (s) 1000000 100000 10000 1000 100 10 0,1 1 0,01 0,001 0,0001 0,00001 0,000001 0,0000001 100 400 1600 6400 25600 Počet neznámých Gaussova metoda Rozložení oblasti

Aplikace superpočítačů Důlní výztuž

Mechanika industry.it4i.cz www.it4i.cz

Aerodynamika industry.it4i.cz www.it4i.cz

Lamborghini Aventador ~30 dní na domácím PC

Lampa industry.it4i.cz www.it4i.cz

Boeing 787 Dreamliner

Boeing 787 Dreamliner industry.it4i.cz www.it4i.cz

Znečištění ovzduší

Povodně (Stonavka Olše)

Hezké obrázky industry.it4i.cz www.it4i.cz

www.it4i.cz industry.it4i.cz