Paralelní systémy. SIMD jeden tok instrukcí + více toků dat jedním programem je zpracováváno více různých souborů dat



Podobné dokumenty
PROCESORY. Typy procesorů

OPS Paralelní systémy, seznam pojmů, klasifikace

Z{kladní struktura počítače

Principy počítačů I Propojovací systémy

Mikrořadiče fy ATMEL

Architektura počítače

Pro úlohy digitálního zpracování obrazu je příznačný velký objem dat. Doposud ani rychlé počítače s konvenční sériovou architekturou nejsou schopny

NÁVOD K OBSLUZE MODULU VIDEO 64 ===============================

Marketing. Modul 3 Zásady marketingu

Algoritmizace a programování

Katedra obecné elektrotechniky Fakulta elektrotechniky a informatiky, VŠB - TU Ostrava 16. ZÁKLADY LOGICKÉHO ŘÍZENÍ

Profilová část maturitní zkoušky 2015/2016

Ėlektroakustika a televize. TV norma ... Petr Česák, studijní skupina 205

Mikroprocesor Intel 8051

Vstupní zařízení počítače

TECHNICKÁ UNIVERZITA V LIBERCI

Charakteristika dalších verzí procesorů v PC

LPS2. Sada pro synchronní komunikaci na 1000m s galvanickým oddělením. 15. října 2010 w w w. p a p o u c h. c o m

Obvody a architektura počítačů. Jednoprocesorové počítače

Základy informatiky. 2. Přednáška HW. Lenka Carr Motyčková. February 22, 2011 Základy informatiky 2

Procesor. Procesor FPU ALU. Řadič mikrokód

účetních informací státu při přenosu účetního záznamu,

Přehled paralelních architektur. Dělení paralelních architektur Flynnova taxonomie Komunikační modely paralelních architektur

-1- N á v r h ČÁST PRVNÍ OBECNÁ USTANOVENÍ. 1 Předmět úpravy

MOBILNÍ KOMUNIKACE STRUKTURA GSM SÍTĚ

Číslicová technika 3 učební texty (SPŠ Zlín) str.: - 1 -

19 Jednočipové mikropočítače

Základnímí částmi počítače jsou procesor, operační paměť, vstupní a výstupní zařízení.

Projekt: Inovace oboru Mechatronik pro Zlínský kraj Registrační číslo: CZ.1.07/1.1.08/

Úvod do problematiky návrhu počítačových systémů. INP 2008 FIT VUT v Brně

Adresace paměti. 11.přednáška

Jedna z nejdůležitějších součástek počítače = mozek počítače, bez něhož není počítač schopen vykonávat žádné operace.

Úvod do programování a práce s počítačem

Názory na bankovní úvěry

Karel Johanovský Michal Bílek. Operační paměť

Profilová část maturitní zkoušky 2015/2016

13. Sítě WAN. Rozlehlé sítě WAN. Počítačové sítě I. 1 (6) KST/IPS1. Studijní cíl. Představíme rozlehlé sítě typu WAN. Doba nutná k nastudování

Architektury počítačů na bázi sběrnice PCI. Cíl přednášky: Obsah přednášky:

Slovní úlohy vedoucí na lineární rovnice I

Modul Řízení objednávek.

ODŮVODNĚNÍ VEŘEJNÉ ZAKÁZKY

CL232. Převodník RS232 na proudovou smyčku. S galvanickým oddělením, vysokou komunikační rychlostí a se zvýšenou odolností proti rušení

Architektura grafických ip pro Xbox 360 a PS3

Orientační průvodce mateřstvím a rodičovstvím v zadávacích dokumentacích poskytovatele

Vítězslav Bártl. únor 2013

ICT plán ZŠ praktické Bochov na rok 2009

ROZDÍL SE SKRÝVÁ V DETAILECH

INTELIGENTNÍ DŮM. Zdeněk Kolář, Viktor Daněk. Střední průmyslová škola sdělovací techniky Panská 856/3, Praha 1

Simulátor EZS. Popis zapojení

KIS A JEJICH BEZPEČNOST I PŘENOS INFORMACÍ DOC. ING. BOHUMIL BRECHTA, CSC.

Distribuované algoritmy

Česká zemědělská univerzita v Praze Fakulta provozně ekonomická. Obor veřejná správa a regionální rozvoj. Diplomová práce

SimOS. Jakub Doležal Radek Hlaváček Michael Očenášek Marek Reimer

- regulátor teploty vratné vody se záznamem teploty

Protokol Drak4. Dokumentace protokolu Drak4 měřicího přístroje Drak května 2010 w w w. p a p o u c h. c o m

Semestrální práce z předmětu mobilní komunikace na téma: Bezdrátové optické sítě

Výstup. Registrační číslo projektu CZ.01.07/1.1.01/ PaedDr. Vladimír Hůlka, PaedDr. Zdenka Kınigsmarková

Inteligentní zastávky Ústí nad Labem

Zvyšování kvality výuky technických oborů

VYUŽITÍ NEURONOVÝCH SÍTÍ PROSTŘEDÍ MATLAB K PREDIKCI HODNOT NÁKLADŮ PRO ELEKTRICKÉ OBLOUKOVÉ PECE

DUM 16 téma: Kreslení šroubu se 6HR hlavou

NUR - Interaktivní panel, D1

7. Stropní chlazení, Sálavé panely a pasy - 1. část

POPIS VÝROBKU A ZAMÝŠLENÉ POUŽITÍ

Škola VOŠ a SPŠE Plzeň, IČO , REDIZO

2. Úroveň bydlení, náklady na bydlení a ceny nemovitostí v Olomouckém kraji

téma: Formuláře v MS Access

29 Evidence smluv. Popis modulu. Záložka Evidence smluv

Databázovéa informačnísystémy NÁVRH IMPLEMENTACE 2 KONZISTENCE DATABÁZE

Obsah. Podrobná uživatelská příručka

SRF08 ultrazvukový dálkoměr

Operační systém z hlediska procesu Mgr. Josef Horálek

Quido USB 0/ Spínač síťového napětí 230 V ovládaný z PC přes USB rozhraní. 28. února 2011 w w w. p a p o u c h. c o m

Data v počítači EIS MIS TPS. Informační systémy 2. Spojení: jan.skrbek@tul.cz tel.: Konzultace: úterý

TECHNICKÉ SPECIFIKACE systémů, zařízení a výrobků

Vývoj výpočetní techniky. Rozdělení počítačů. Blokové schéma počítače

Zkouška z předmětu Počítačové systémy

Monitoring Insolvence Insolvency search. Návod k používání

Používání služebních mobilních telefonů a prostředků pro přenos dat

Deska zvukové signalizace DZS

Přednáška 1. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012

CHARAKTERISTIKA MODERNÍCH PENTIÍ. Flynnova klasifikace paralelních systémů

Osvětlovací modely v počítačové grafice

KÓDOVÝ ZÁMEK 1105/2 A 1156/10

Vlastnosti IIR filtrů:

Vzdělávací program pro obchodní partnery společnosti ROCKWOOL průvodce školením

O b s a h : 12. Úřední sdělení České národní banky ze dne 1. října 2001 k využívání outsourcingu bankami

Rozvoj vzdělávání žáků karvinských základních škol v oblasti cizích jazyků Registrační číslo projektu: CZ.1.07/1.1.07/

Komunikativní regulátor fancoilu s ventilátorem

Analýza oběžného kola

CENÍK SLUŽBA ETHERNET. Účinnost od Ceny uvedeny bez i s 20% DPH 1. PODMÍNKY

Varianty zkouškových testů

Dynamický model predikovaného vývoje krajiny. Vilém Pechanec

Předpoklad dotace: lead-partner princip. přednášející: Manuela Prchalová / Marek Liebscher Společný technický sekretariát (JTS)

Z OBRAZOVÉHO ZÁZNAMU. Jan HAVLÍK. Katedra teorie obvodů, Fakulta elektrotechnická

ZÁKLADNÍ POVINNOSTI DOPRAVCE I PRÁCI S DATY Z DIGITÁLNÍHO TACHOGRAFU

Struktura počítačů z{kladní pojmy

1. Vstupní data Pro HBV EM 1.0 jsou nutná data definující:

Vše, co musíte vědět o PRAVIDELNÉ PROHLÍDCE DOPORUČUJE

VYR-32 POKYNY PRO SPRÁVNOU VÝROBNÍ PRAXI - DOPLNĚK 6

Transkript:

Paralelní systémy Paralelním systémem rozumíme takový systém, který paralelně zpracovává více samostatných úloh nebo zpracování určité úlohy automaticky rozdělí do menších částí a paralelně je zpracovává. Při rozlišení jednotlivých případů paralelismu hovoříme o granularitě paralelního zpracování hrubozrnná granularita paralelismus na úrovni procesů, systémy obsahující více než jeden procesor jemnozrnná granularita paralelismus na úrovni příkazů Ve výpočetních systémech je možné setkat se s jemnozrnnou granularitou paralelismu: při proudovém zpracování instrukcí u superskalární (hyperskalární) architektury více jednotek ALU u I/O kanálů pracujících nezávisle na procesoru při přenosu dat přímý přístup do paměti (DMA) u vektorových počítačů Rozdělení paralelních systémů Výpočetní systém je zařízení, do kterého vstupuje jeden nebo více toků dat a jeden nebo více toků instrukcí, které zpracování dat řídí. (M.J.Flynn, 1972) Výpočetní systém lze pak charakterizovat vlastnostmi: SI (Single Instruction) zpracování jen jednoho toku instrukcí MI (Multiple Instruction) zpracování více toků instrukcí SD (Single Data) zpracování jen jednoho toku dat MD (Multiple Data) zpracování více toků dat Kategorie výpočetních systémů SISD jeden tok instrukcí + jeden tok dat klasický Von Neumannův počítač SIMD jeden tok instrukcí + více toků dat jedním programem je zpracováváno více různých souborů dat MISD více toků instrukcí + jeden tok dat více procesorů s různými programy zpracovávající společná data jen pro velmi speciální aplikace MIMD více toků instrukcí + více toků dat převážná většina paralelních systémů - 1 -

Paralelní systémy SIMD MIMD Vektorové počítače Maticové počítače Multiprocesory (Společná paměť) Multipočítače (Distribuovaná paměť) Paralelní systémy SIMD Jeden proud instrukcí (program) řídí zpracování různých souborů dat ve více nezávislých paralelních jednotkách Typickým představitelem je vektorový počítač IBM 3090 Hlavní paměť Cache Dekodér instrukcí Skalární procesor procesor Skalární registry Vektorové registry - 2 -

Procesory vektorového počítače Skalární procesor zpracovává standardní sadu strojových instrukcí procesor zpracovává instrukce pro práci s vektory, jejichž složky jsou čísla v pohyblivé řádové čárce se skupinou paralelně pracujících ALU (FPU) s proudovou ALU (FPU) m počítačům se také říká numerické superpočítače používají se pro složité výpočty procesor s paralelními jednotkami ALU Paralelní ALU jednotky zpracovávají stejnolehlé složky vstupních registrů A a B a výsledek ukládají do vektorového registru C. registr A registr B Paralelní jednotky ALU registr C procesor s proudovou jednotkou ALU Jednotka ALU zpracovává stejnolehlé složky vstupních registrů A a B proudově a výsledek ukládá do vektorového registru C. registr A registr B Proudová jednotka ALU registr C - 3 -

Maticové procesory Maticový procesor - každá dílčí jednotka zpracovává jiný prvek matice, všechny jednotky synchronně provádějí tutéž operaci zpracovávající jednotka řadič několik datových jednotek - PE (Processor Element) každá datová jednotka má lokální paměť - MEM Princip maticového procesoru: řadič je odpovědný za načtení a interpretaci instrukce vyšle instrukci všem datovým jednotkám, které vykonají stejnou operaci skalární a řídící instrukce se vykonávají přímo v řadiči řadič musí zajistit rozmístění potřebných operandů do lokálních pamětí datových jednotek datové jednotky mohou mezi sebou komunikovat (posílat si data) prostřednictvím meziprocesorové komunikační sítě Další architektury SIMD Asociativní procesory maticové procesory používající v některých případech místo adresového výběru dat z paměti asociativní výběr, tedy podle obsahu Systolické pole pevně propojená síť funkčních jednotek určená pro řešení jedné konkrétní úlohy propojení je obvodová realizace algoritmu výpočtu, takže systolickou síť není třeba řídit programem Paralelní systémy MISD Systémy MISD - kategorie počítačů, která není v praxi příliš běžná Lze sem zařadit některé speciální systémy: Systolické pole Neuronové sítě pokoušejí se napodobit funkci biologických neuronových síti mozku základním prvkem matematický model neuronu - 4 -

Organizace paměti Výkon počítače je kromě rychlosti a počtu procesorů ovlivněn také rychlostí a velikostí paměti U rychlosti paměti rozlišujeme: vybavovací doba (access time) doba, za niž se realizuje jeden zápis nebo čtení z paměti současné paměti mají vybavovací dobu do 70 ns cyklus paměti (cycle time) délka intervalu mezi dvěma po sobě jdoucími požadavky na paměť během této periody žádné jiné zařízení nemůže použít paměť v současné době mají paměti cyklus do 200 ns Paměť s prokládanými cykly Paměť s prokládanými cykly (interleaved memory) se používá ve výkonných počítačích ke snížení cyklu paměti paměť je rozdělená do několika bloků (bank) pracujících samostatně a schopných provádět nezávisle čtecí nebo zápisový cyklus procesor komunikuje střídavě s různými paměťovými bloky přenosy mohou probíhat paralelně a komunikace mezi pamětí a procesorem se celkově zrychlí doba potřebná k realizaci jedné komunikace mezi blokem a procesorem se nazývá cyklus bloku procesor může v každém taktu provést jeden přístup do paměti Sdílená paměť Moduly hlavní paměti jsou pro všechny procesory společné a využívají se střídavě K jejich propojení se používají propojovací sítě, umožňující propojit libovolný procesor s libovolným paměťovým modulem Procesory spolu mohou komunikovat prostřednictvím dat zapsaných do paměti vhodné pro úlohy s velkými nároky na rozsah a rychlost komunikací mezi procesory - 5 -

Může nastat konflikt při komunikaci u systému s více než deseti procesory přidáním dalšího procesoru již nedochází k nárůstu výkonu paměťový systém založený na použití rychlých vyrovnávacích pamětí (cache) na straně procesoru problém s konzistencí dat Distribuovaná paměť Každý procesor vybaven velkou lokální pamětí a často i vlastním souborem periferních zařízení Každý procesor se tak stává jádrem počítačového uzlu, který je vybaven značným stupněm autonomie Všechny počítačové uzly jsou propojené propojovací sítí Výhody distribuované paměti: Každý procesor může přistupovat k své lokální paměti plnou rychlosti bez zásahu jiných procesorů Nevznikají konflikty při komunikaci není omezen počet počítačových modulů v systému Není žádný problém s konzistencí dat Procesy komunikují obvykle formou zpráv přenášených propojovací sítí šířka toku dat v propojovací síti bývá poměrně malá vhodné pro úlohy, které nevyžadují silnou interakci mezi procesory - 6 -