Hlavní využití počítačů

Podobné dokumenty
Povídání na téma SUPERPOČÍTAČE DNES A ZÍTRA

Blue Gene Vysoká škola báňská-technická univerzita Ostrava. Blue Gene. Karel Chrastina. Úvod. Blue Gene L. Blue Gene P.

Přehled paralelních architektur. Dělení paralelních architektur Flynnova taxonomie Komunikační modely paralelních architektur

Povídání na téma. SUPERPOČÍTAČE DNES A ZÍTRA (aneb krátký náhled na SC) Filip Staněk

IB109 Návrh a implementace paralelních systémů. Organizace kurzu a úvod. RNDr. Jiří Barnat, Ph.D.

Grid jako superpočítač

2.8 Procesory. Střední průmyslová škola strojnická Vsetín. Ing. Martin Baričák. Název šablony Název DUMu. Předmět Druh učebního materiálu

Přednášky o výpočetní technice. Hardware teoreticky. Adam Dominec 2010

PROCESOR. Typy procesorů

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

architektura mostů severní / jižní most (angl. north / south bridge) 1. Čipové sady s architekturou severního / jižního mostu

OPS Paralelní systémy, seznam pojmů, klasifikace

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

Identifikátor materiálu: ICT-1-08

CERIT SCIENTIFIC CLOUD. Centrum CERIT-SC. Luděk Matyska. Praha, Seminář MetaCentra,

INFORMAČNÍ A KOMUNIKAČNÍ TECHNOLOGIE

SUPERPOČÍTAČE DANIEL LANGR ČVUT FIT / VZLÚ

Základní pojmy informačních technologií

Architektura Intel Atom

Osobní počítač. Zpracoval: ict Aktualizace:

Představení a vývoj architektur vektorových procesorů

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

Ro R dina procesor pr ů Int In e t l Nehalem Šmída Mojmír, SMI108 PAP PA 2009

Hardware - komponenty počítačů Von Neumannova koncepce počítače. Von Neumannova koncepce počítače

C2115 Praktický úvod do superpočítání

Paralelní a distribuované výpočty (B4B36PDV)

Cell broadband engine architecture

Výkonnost mikroprocesoru ovlivňují nejvíce dvě hlediska - architektura mikroprocesoru a tzv. taktovací frekvence procesoru.

Paralelní programování

Základní deska (motherboard, mainboard)

Návrhy elektromagnetických zení

G R A F I C K É K A R T Y

Základní deska (mainboard)

Vyuºití GPGPU pro zpracování dat z magnetické rezonance

PV109: Historie a vývojové trendy ve VT

IB109 Návrh a implementace paralelních systémů. Organizace kurzu a úvod. Jiří Barnat

Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague

Architektura počítače

Nvidia CUDA Paralelní programování na GPU

Paralelní výpočty ve finančnictví

Jak do počítače. aneb. Co je vlastně uvnitř

Hardware. Příklad převodu čísla: =1*32+0*16+0*8+1*4+0*2+1*1= Převod z dvojkové na desítkovou Sčítání ve dvojkové soustavě

GPU A CUDA HISTORIE GPU CO JE GPGPU? NVIDIA CUDA

PŘEDSTAVENÍ GRAFICKÉHO PROCESORU NVIDIA G200

Pokročilé architektury počítačů

Roman Výtisk, VYT027

Vícejádrový procesor. Dvě nebo více nezávislých jader Pro plné využití. podporovat multihreading

Historie výpočetní techniky. Autor: Ing. Jan Nožička SOŠ a SOU Česká Lípa VY_32_INOVACE_1121_Histrorie výpočetní techniky_pwp

Složení počítače. HARDWARE -veškeré fyzicky existující technické vybavení počítače 12 -MONITOR

CERIT-SC reloaded. už se všichni těšíme. Seminář gridového počítání,

2.1 Historie a vývoj počítačů

Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/ Vzdělávání v informačních a komunikačních technologií

Architektura počítačů

Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague

Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

Základní deska (1) Parametry procesoru (2) Parametry procesoru (1) Označována také jako mainboard, motherboard

HW počítače co se nalézá uvnitř počítačové skříně

Pokročilé architektury počítačů

České Budějovice. 2. dubna 2014

PROCESOR. Rozdělení procesorů

Pohled do nitra mikroprocesoru Josef Horálek

Úvod do modelování v programu COMSOL Multiphysics verze 4

Vysoká škola báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky. referát do předmětu: Pokročilé architektury počítačů.

Základní deska (mainboard)

Hardware 1. Přehled platforem podle procesorů

Pojem architektura je převzat z jiného oboru lidské činnosti, než počítače.

Otázka číslo 3 Hardware PC komponent

Paralelní architektury - úvod

Základní deska (mainboard, motherboard)

Provozní statistiky centra CERIT-SC

Technické prostředky počítačové techniky

Paralelní architektury - úvod

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

C2115 Praktický úvod do superpočítání

Cache paměti (2) Cache paměti (1) Cache paměti (3) Cache paměti (4) Cache paměti (6) Cache paměti (5) Cache paměť:

Pokročilé architektury počítačů

Paměti Josef Horálek

NSWI /2011 ZS. Principy cpypočítačůčů aoperačních systémů ARCHITEKTURA

Hardware 1. Přehled platforem podle procesorů. PC (Wintel) různí výrobci - domácí počítače, pracovní stanice, servery 1-4 procesory Intel, AMD

Paralelní architektury se sdílenou pamětí typu NUMA. NUMA architektury

Sbě b r ě n r i n ce

Úvod do problematiky návrhu počítačových systémů. INP 2008 FIT VUT v Brně

Úvod do architektur personálních počítačů

Server je v informatice obecné označení pro počítač, který poskytuje nějaké služby nebo počítačový program, který tyto služby realizuje.

Obecné výpočty na GPU v jazyce CUDA. Jiří Filipovič

Volitelný počet jader

Portfolio úložišť WD pro datová centra Kapacitní úložiště prošlo vývojem

Martin Lísal. Úvod do MPI

METACentrum Český národní gridovýprojekt. Projekt METACentrum. Jan Kmuníček ÚVT MU & CESNET. meta.cesnet.cz

VÝUKOVÝ MATERIÁL. 3. ročník učebního oboru Elektrikář Přílohy. bez příloh. Identifikační údaje školy

GPU jako levný výpočetní akcelerátor pro obrazovou JPEG2000 kompresi. ORS 2011 Karviná,

CEITEC a jeho IT požadavky. RNDr. Radka Svobodová Vařeková, Ph.D.

Využití ICT pro rozvoj klíčových kompetencí CZ.1.07/1.5.00/

Intel Centrino 2 - Úvod a procesory

Nimbus Data All Flash Systems

PROCESORY. Typy procesorů

Architektury počítačů

ARCHITEKTURA PROCESORŮ

Z{kladní struktura počítače

Transkript:

Úvod

Hlavní využití počítačů Počítače jsou výkonné nástroje využívané pro zpracování dat. Provádějí: načtení a binární kódování dat provedení požadovaného výpočtu zobrazení výsledku

Hlavní využití počítačů Počítače jsou výkonné nástroje využívané pro zpracování dat. Provádějí: načtení a binární kódování dat provedení požadovaného výpočtu zobrazení výsledku Z toho plyne rozdělení většiny úloh na: ukládání dat - databáze výpočty - simulace vizualizace uložených dat vypočtených výsledků

Von Neumannova architektura http://en.wikipedia.org/wiki/von_neumann_architecture RAM PU Timer I/O PU = processing unit, RAM = random-acces memory, I/O = vstupně/výstupní zařízení, Timer = časovač Pamět obsahuje instrukce i data.

Původ výpočetně náročných úloh CFD - computational fluid dynamics, modely turbulencí, modely hoření modelování globálních změn počasí supravodivost, jaderné a termojaderné reakce biologie, zpracování genomů, tzv. protein folding medicína, zpracování medicínských dat správa velkých databází obsloužení velkého počtu transakcí strojové učení - deep learning

Možnosti urychlení/provedení náročných výpočtů výpočet se skládá z posloupnosti základních instrukcí CPU instrukce = provedení elementárního výpočtu nebo datového přenosu. mnoho instrukcí dokáže procesor provést během jednoho taktu časovače nejjednodušší odhad výkonu CPU lze odvodit z frekvence jeho časovače 1GHz 1GFLOPS FLOPS = FLoating-point Operations Per Second nejjednodušší způsobu zvýšení výkonu CPU je navýšení jeho taktu tím zkrátíme čas potřebný k provedení jedné instrukce

Možnosti urychlení/provedení náročných výpočtů Zdroj: Henessy, Patterson, Computer architecture: A quantitative approach, Morgan Kaufmann, 2011.

Možnosti urychlení/provedení náročných výpočtů Zdroj: Henessy, Patterson, Computer architecture: A quantitative approach, Morgan Kaufmann, 2011.

Možnosti urychlení/provedení náročných výpočtů vidíme, že energetická náročnost roste rychleji než frekvence power wall většina energie se navíc přeměňuje na teplo, což zvyšuje nároky na chlazení kromě navyšování frekvence můžeme navýšit počet tranzistorů na čipu a tím: získat důmyslnější logiku pro zpracování instrukcí to se děje uvnitř CPU a není nutné modofikovat algoritmus provádět více instrukcí současně, tj. paralelně

Možnosti urychlení/provedení náročných výpočtů Problémy paralelního zpracování dat: ne každou úlohu lze řešit paralelně paralelizace je často efektivní jen pro velké úlohy vývoj paralelních programů bývá mnohem složitější Přínosy paralelního zpracování dat: umožňuje provádět velké výpočty běžně velké úlohy lze provádět rychleji snižuje energetickou náročnost

Paralelní architektura Definice: Paralelní architektura je taková, která obsahuje více jednotek pro zpracování dat (PU). RAM RAM RAM PU PU PU Timer I/O

Kde se paralelní architektury vyskytují II. Mobilní zařízení telefony a tablety vícejádrové procesory GPU akcelerátory

Kde se paralelní architektury vyskytují I. Domácí a kancelářské počítače běžné CPU - prakticky každé dnešní CPU je tzv. implicitně paralelní speciální rozšíření CPU - MMX, SSE, 3D Now kodeky pro přehrávání hudby a filmů zpracování fotografií apod. vícejádrové procesory - tzv. symetrický multiprocesing umožňují skutečně současný běh více procesů (aplikací) najednou - to umožňuje rychlejší odezvu na podněty uživatele dual channel pamět ové řadiče urychlují přístup do paměti tím, že umožňují číst z více pamět ových modulů současně technologie RAID urychluje přenos dat mezi pamětí a pevným diskem tím, že se současně čte/zapisuje z/na více disků

Kde se paralelní architektury vyskytují III. Pracovní stanice jsou jako běžná PC ale mají... více procesorů rychlejší paměti pokročilejší podporu tzv. vektorizace často optimalizované pro vizualizace, např. pro OpenGL rozhraní jde například o stanice HP postavené na kombinaci HP-UX + PARISC počítače vybavené procesory Xeon

Kde se paralelní architektury vyskytují IV. Mainframe systémy mainframe silně využívají paralelizace, podporují (z13, 2015)... až 168 jader, 10 TB RAIM (288 GB/s) zváštní I/O řadič pro každý z 1024 I/O portů hardwarovou podporu pro šifrování tzv. Parallel Sysplex tj. cluster mainframů to umožňuje... vysokou úroveň zabezpečení uložených dat prakticky nepřetržitou dostupnost systému vysokou datovou propustnost, ta je nutná pro úspěšné zpracování velkého počtu transakcí současně plynulý běh tisíců operačních systému současně, tzv. virtualizace

Kde se paralelní architektury vyskytují V. Superpočítače narozdíl od mainframe je cílem soustředit maximální výpočetní výkon do jedné aplikace podle www.top500.org Tainhe-2 (Milkyway-2) 32, 000x Intel Xeon E5-2692 12 jader (=384,000 jader) 48, 000x Inte Xeon Phi 31S1P 57 jader (=2,736,000 jader) výkon 33.86 PFLOPS 1.37 TB RAM příkon 17.6 MW + 6.4 MW chlazení propojení pomocí TH Express-2 (20 GB/s, 1 µs latence) BlueWaters Cray 22,640 Cray XE6 AMD Opteron, 16 jader, 32/64 GB RAM 4,224 Cray XK7 AMD Opteron, 16 jader, Nvidia Tesla K20, 16/32 GB RAM 1.5 PB RAM Gemini Interconnect 160 GB/s https://bluewaters.ncsa.illinois.edu/ Mira IBM BlueGene/Q 786.432 jader PowerPC A2 16 jader, 4 cestný multhreading 64 vláken na CPU 768 TB RAM příkon 4 MW cena na 1 jadro/hodinu $0.05 (Titan - Cray) http://www.anandtech.com/show/6421/ inside-the-titan-supercomputer-299k-amd-x86-cores-and-186k-nvidia-gpu-cores

Kde se paralelní architektury vyskytují V. Grid velké množství počítačů spojených do jedné sítě spojení je mnohem volnější, než u clusterů (superpočítače) uzly nemusí používat stejný operační systém uzly se mohou libovolně připojovat a zase odpojovat výkon je mnohem vyšší než u nejvýkonějších superpočítačů grid je téměř nepoužitelný na numerické simulace aplikace: Folding@home - http://folding.stanford.edu/ 2008 4.28 PFLOPS 2014 47 EFLOPS GIMPS - http://www.mersenne.org/ SETI@home - http://setiathome.ssl.berkeley.edu/

Shrnutí v tomto předmětu se budeme kromě paralelizace zabývat i optimalizováním kódu obecně se tak mluví o HPC = High performance computing to nám umožní provádět větší výpočty dosáhnout plynulejšího běhu aplikací šetřit spotřebu energie jak mobilních zařízení, tak i velkých systémů to vše je v současnosti velice důležité díky rychlému růstu výkonu v letech 1986 2002 je mnoho PC aplikací (narozdíl např. od mainframe) napsáno neoptimálně