Přehled paralelních architektur. Dělení paralelních architektur Flynnova taxonomie Komunikační modely paralelních architektur

Podobné dokumenty
Paralelní architektury - úvod

Paralelní architektury - úvod

OPS Paralelní systémy, seznam pojmů, klasifikace

Paralelní a distribuované výpočty (B4B36PDV)

Paralelní programování

Operační systémy. Přednáška 1: Úvod

Přednáška 1. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012

MATURITNÍ OTÁZKY ELEKTROTECHNIKA - POČÍTAČOVÉ SYSTÉMY 2003/2004 TECHNICKÉ VYBAVENÍ POČÍTAČŮ

Paralelní systémy. SIMD jeden tok instrukcí + více toků dat jedním programem je zpracováváno více různých souborů dat

Základy informatiky. 2. Přednáška HW. Lenka Carr Motyčková. February 22, 2011 Základy informatiky 2

Paralelní architektury se sdílenou pamětí typu NUMA. NUMA architektury

CHARAKTERISTIKA MODERNÍCH PENTIÍ. Flynnova klasifikace paralelních systémů

Architektura Intel Atom

4. Úvod do paralelismu, metody paralelizace

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

Hlavní využití počítačů

Úvod do GPGPU J. Sloup, I. Šimeček

Martin Lísal. Úvod do MPI

Úvod SISD. Sekvenční výpočty SIMD MIMD

Úvod do problematiky návrhu počítačových systémů. INP 2008 FIT VUT v Brně

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

INFORMAČNÍ A KOMUNIKAČNÍ TECHNOLOGIE

Identifikátor materiálu: ICT-1-08

Architektury paralelních počítačů I.

Charakteristika dalších verzí procesorů Pentium

Pohled do nitra mikroprocesoru Josef Horálek

Struktura počítačů z{kladní pojmy

Představení a vývoj architektur vektorových procesorů

IB109 Návrh a implementace paralelních systémů. Organizace kurzu a úvod. Jiří Barnat

Pro úlohy digitálního zpracování obrazu je příznačný velký objem dat. Doposud ani rychlé počítače s konvenční sériovou architekturou nejsou schopny

VÝUKOVÝ MATERIÁL. 3. ročník učebního oboru Elektrikář Přílohy. bez příloh. Identifikační údaje školy

Charakteristika dalších verzí procesorů v PC

Roman Výtisk, VYT027

Přednáška #12: Úvod do paralelních počítačů. Paralelní počítače a architektury

Paralelní a distribuované výpočty (B4B36PDV)

13. Paralelní architektury SISD, SIMD, MISD, MIMD.

Povídání na téma. SUPERPOČÍTAČE DNES A ZÍTRA (aneb krátký náhled na SC) Filip Staněk

Využití paralelních výpočtů v geodézii

2.8 Procesory. Střední průmyslová škola strojnická Vsetín. Ing. Martin Baričák. Název šablony Název DUMu. Předmět Druh učebního materiálu

Architektura počítačů Paralelní zpracování

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

Paralelní programování

SUPERPOČÍTAČE DANIEL LANGR ČVUT FIT / VZLÚ

1 Osobní počítač Obecně o počítačích Technické a programové vybavení... 4

IB109 Návrh a implementace paralelních systémů. Organizace kurzu a úvod. RNDr. Jiří Barnat, Ph.D.

Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/ Vzdělávání v informačních a komunikačních technologií

Ústav technické matematiky FS ( Ústav technické matematiky FS ) / 35

Architektura počítačů

Procesor Intel Pentium (1) Procesor Intel Pentium (3) Procesor Intel Pentium Pro (1) Procesor Intel Pentium (2)

architektura mostů severní / jižní most (angl. north / south bridge) 1. Čipové sady s architekturou severního / jižního mostu

Integrovaná střední škola, Sokolnice 496

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. Fakulta elektrotechniky a komunikačních technologií BAKALÁŘSKÁ PRÁCE

Využití ICT pro rozvoj klíčových kompetencí CZ.1.07/1.5.00/

VÝUKOVÝ MATERIÁL. 3. ročník učebního oboru Elektrikář Přílohy. bez příloh. Identifikační údaje školy

Pokročilé architektury počítačů

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

Profilová část maturitní zkoušky 2014/2015

GPU A CUDA HISTORIE GPU CO JE GPGPU? NVIDIA CUDA

C2115 Praktický úvod do superpočítání

Nvidia CUDA Paralelní programování na GPU

ZČU/FAV/KIV/PPR 1 Architektury paralelních počítačů, modely dekompozice výpočtu, interakce a výkonnost

Obsah. Kapitola 1 Hardware, procesory a vlákna Prohlídka útrob počítače...20 Motivace pro vícejádrové procesory...21

PB002 Základy informačních technologií

Obecné výpočty na GPU v jazyce CUDA. Jiří Filipovič

Přednášky o výpočetní technice. Hardware teoreticky. Adam Dominec 2010

PRINCIPY POČÍTAČŮ Metodický list číslo 1

Intel (2) Intel (1) Intel (3) Intel (4) Intel (6) Intel (5) Nezřetězené zpracování instrukcí:

Pokročilé architektury počítačů

Hardware - komponenty počítačů Von Neumannova koncepce počítače. Von Neumannova koncepce počítače

Činnost CPU. IMTEE Přednáška č. 2. Několik úrovní abstrakce od obvodů CPU: Hodinový cyklus fáze strojový cyklus instrukční cyklus

Ro R dina procesor pr ů Int In e t l Nehalem Šmída Mojmír, SMI108 PAP PA 2009

Server je v informatice obecné označení pro počítač, který poskytuje nějaké služby nebo počítačový program, který tyto služby realizuje.

Paralení programování pro vícejádrové stroje s použitím OpenMP. B4B36PDV Paralelní a distribuované výpočty

Pokročilé architektury počítačů

Počítač jako prostředek řízení. Struktura a organizace počítače

METACentrum Český národní gridovýprojekt. Projekt METACentrum. Jan Kmuníček ÚVT MU & CESNET. meta.cesnet.cz

Osobní počítač. Zpracoval: ict Aktualizace:

Práce v textovém editoru

Procesor EU peníze středním školám Didaktický učební materiál

AGP - Accelerated Graphics Port

Semestrální práce z předmětu Speciální číslicové systémy X31SCS

VÝUKOVÝ MATERIÁL. 3. ročník učebního oboru Elektrikář Přílohy. bez příloh. Identifikační údaje školy

Mezipaměti počítače. L2 cache. L3 cache

Architektury počítačů

GPU a CUDA. Historie GPU. Co je GPGPU? Nvidia CUDA

Profilová část maturitní zkoušky 2015/2016

PŘEDSTAVENÍ GRAFICKÉHO PROCESORU NVIDIA G200

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

ZÁKLADY PROGRAMOVÁNÍ. Mgr. Vladislav BEDNÁŘ /14

Procesor. Hardware - komponenty počítačů Procesory

Výstavba PC. Vývoj trhu osobních počítačů

REALIZACE SUPERPOČÍTAČE POMOCÍ GRAFICKÉ KARTY

Intel Itanium. Referát. Vysoká škola báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky Katedra informatiky

Identifikátor materiálu: ICT-1-05

PRINCIPY POČÍTAČŮ. Schopnost logického uvažování a rešeršní práce v prostředí Internetu.

Technické prostředky počítačové techniky

Procesy a vlákna (Processes and Threads)

Algoritmy a struktury neuropočítačů ASN - P14. Neuropočítače

Grid jako superpočítač

SEKVENČNÍ LOGICKÉ OBVODY

Transkript:

Přehled paralelních architektur Přehled paralelních architektur Dělení paralelních architektur Flynnova taxonomie Komunikační modely paralelních architektur

Přehled I. paralelní počítače se konstruují od poloviny šedesátých let vysoká cena integrovaných obvodů a tedy i řídících jednotek vedla ke stavění vektorových procesorů a procesorových polí, která obsahovala velký počet zjednodušených výpočetních jednotek s rozvojem VLSI obvodů klesala cena procesorů, což vedlo k rostoucí oblibě víceprocesorových systémů - 1980 ty byly výhodnější pro zpracování kódu s podmínkami a mohlo na nich pracovat více uživatelů u systému se 100 a více procesory se naráží na potíže s pamět ovým systémem problém cache coherence a rovnocenné propojení procesorů s pamět ovými moduly je náročné

Přehled II. tento problém řeší architektury s distribuovanou pamětí s rostoucím výkonem běžných PC a sít ových komponent (Ethernet) spolu s klesajícími cenami těchto zařízení došlo v devadesátých letech k velkému příklonu k distribuovaným systémům po roce 2000 se ukazuje, že je obtížné nadále zvyšovat výkonu jednoprocesorových systémů zvyšováním frekvence CPU ještě asi v roce 2002 IBM odhadovalo, že v roce 2010 budou mainframy používat 10 GHz procesory hledají se cesty, jak zvýšit výkon jednoho PC

Přehled III. jedním řešením jsou vícejádrové procesory = SMP ( 1980) běžná CPU od Intel/AMD mají maximálně 18 jader počet jader roste pomalu druhým řešením je GPGPU = procesorová pole ( 1970) trend současnosti je instalování GPU dohromady do superpočítačů objevuje se Intel Knight Corner

Přehled IV. vedle tohoto směru se rozvíjí technologie gridu dnes jsou snahy využít grid i k numerickému počítání (asynchronní iterativní maticové řešiče) z grid computingu vzniká tzv. cloud computing (2007) apod.

Dělení paralelních architektur Existuje mnoho způsobů, jak klasifikovat paralelní architektury. Nejznámější jsou: Flynnova taxonomie - 1966 rozděluje paralelní architektury v závislosti na toku instrukcí a dat rozdělení podle způsobu komunikace architektury se sdílenou a distribuovanou pamětí

Flynnova taxonomie I. Datový tok Single Multiple SISD SIMD Instrukční tok Single Multiple jednoprocesorové arch. MISD systolická pole (systolic arrays) vektorové procesory procesorová pole GPU MIMD multiprocesory - SMP multipočítače - klastry, gridy

Flynnova taxonomie II. SISD architektury na jednu instrukci připadá jeden jednoduchý datový typ jde typicky o jednoprocesorové architektury ty sice mohou zpracovávat více instrukcí a dat současně... pipelining, superskalární zpracování,...... to je ale považováno spíše za paralelní zpracování sekvenčního kódu než za provedení paralelního kódu navíc - čistě sekvenční architektury dnes prakticky neexistují

Flynnova taxonomie - SIMD I. SIMD architektury na jednu instrukci připadá více dat např. instrukce sečíst dva vektory tyto architektury mají jednu řídící jednotku a několik jednotek výpočetních výpočetní jednotky v daný okamžik provádí stejnou instrukci, každá ale s různými daty jde hlavně o vektorové procesory... MMX, SSE, 3DNow! rozšíření procesorů architektury x086 GPU moderní GPU umožňují rozdělení výpočetních jednotek do více skupin, které pak mohou zpracovávat odlišné úlohy např. rozdělení na vertex a pixel shadery... nebo procesorová pole

Flynnova taxonomie - SIMD II. Řídící jednotka Výpočetní jednotka Výpočetní jednotka Výpočetní jednotka Výpočetní jednotka Komunikační síť

Flynnova taxonomie - MISD I. MISD jedny data jsou postupně zpracovány více instrukcemi typickým zástupcem jsou systolická pole název pochází od slova systola = srdeční kontrakce pumpující krev systolická pole jsou velmi speciální architektury příklady použití některé třídící algoritmy Hornerovo schéma pro vyčíslení polynomu násobení matic - Cannonův algoritmus

Flynnova taxonomie - MISD II. Vstupní data Vstupní data Výstupní data Výstupní data

Flynnova taxonomie - MIMD I. MIMD jde o systémy, které jsou schopné současně provádět různé instrukce a různými daty typickým příkladem jsou multiprocesory a multipočítače

Flynnova taxonomie - MIMD II. Řídící jednotka + výpočetní jednotka Řídící jednotka + výpočetní jednotka Řídící jednotka + výpočetní jednotka Řídící jednotka + výpočetní jednotka Komunikační síť

Flynnova taxonomie - MIMD III. v praxi nepíšeme zvláštní kód pro každý procesor všude běží stejný program, ale podle ID procesoru se zpracovávají různé větve mluvíme pak spíše o SPMD architektuře SPMD = single program multiple data prakticky všechny významné paralelní architektury dnes spadají do MIMD kategorie to je velká nevýhoda Flynnovy taxonomie

Komunikační modely I. Podle způsobu komunikace dělíme paralelní architektury na: systémy se sdíleným adresovým prostorem systémy s distribuovanou pamětí systémy se sdíleně distribuovanou

Komunikační modely II. Sdílený adresový prostor Ne Ano Sekvenční systémy Architektury se sdílenou pamětí Distribuovaná paměť Ne Ano jednoprocesorové arch. Architektury s distribuovanou pamětí multipočítače, klastry multiprocesory se sdílenou pamětí UMA, SMP Architektury se sdílenědistribuovanou pamětí NUMA

Architektury se sdílenou pamětí obsahují fyzicky sdílenou pamět, do které mají všechny procesory (výpočetní jednotky) stejně rychlý přístup jde o UMA architektury stejná adresa na různých procesorech odkazuje na stejnou fyzickou pamět ovou buňku sdílená pamět je tu prostředkem komunikace kromě sdílené paměti mohou být jednotlivé procesory vlastní lokální pamět - cache ta bývá mnohem rychlejší...... ale není přístupná ostatním procesorům, nejde tedy o NUMA architekturu typickým příkladem je SMP - symetrický multiprocesing sdílená pamět se stává úzkým hrdlem celého systému, proto se tyto architektury omezují na maximálně 100 procesorů pro vývoj se často používá standard OpenMP

Architektury s distribuovanou pamětí nemají společnou pamět ani virtuální adresový prostor komunikují spolu pomocí posílání zpráv přes komunikační sít to je náročnější z pohledu programátora odstranění společné paměti umožňuje vytvářet systémy s tisíci procesory pro vývoj se často používá standard MPI

Architektury se sdíleně distribuovanou pamětí jde o architektury s distribuovanou pamětí, které mají podporu pro sdílený virtuální adresový prostor jde o NUMA architektury podpora pro virtuální adresový prostor bývá zabudovaná již na úrovni hardware

Sdílený adresový prostor vs. posílání zpráv programování založené na posílání zpráv je náročnější posílání zpráv lze snadno a efektivně emulovat na systémech se sdílenou pamětí programy napsané pomocí standardu MPI dobře běží i na SMP systémech neplatí to naopak