Principy počítačů I Taxonomie, organizace s vysokým výkonem

Podobné dokumenty
Princip paralelního řazení vkládáním (menší propadává doprava)

IAJCE Přednáška č. 12

12. N á h o d n ý v ý b ě r

Paralelní systémy. SIMD jeden tok instrukcí + více toků dat jedním programem je zpracováváno více různých souborů dat

Pravděpodobnost a aplikovaná statistika

základním prvkem teorie křivek v počítačové grafice křivky polynomiální n

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

Aplikovaná informatika. Podklady předmětu Aplikovaná informatika pro akademický rok 2006/2007 Radim Farana. Obsah. Algoritmus

n=1 ( Re an ) 2 + ( Im a n ) 2 = 0 Im a n = Im a a n definujeme předpisem: n=1 N a n = a 1 + a a N. n=1

Matematika I, část II

2.4. INVERZNÍ MATICE

Téma: 11) Dynamika stavebních konstrukcí

Lineární a adaptivní zpracování dat. 8. Modely časových řad I.

Analýza a zpracování signálů. 4. Diskrétní systémy,výpočet impulsní odezvy, konvoluce, korelace

Statistika. Statistické funkce v tabulkových kalkulátorech MSO Excel a OO.o Calc

Tento materiál vznikl díky Operačnímu programu Praha Adaptabilita CZ.2.17/3.1.00/33254

Přehled paralelních architektur. Dělení paralelních architektur Flynnova taxonomie Komunikační modely paralelních architektur

Statistika je vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter.

jako konstanta nula. Obsahem centrálních limitních vět je tvrzení, že distribuční funkce i=1 X i konvergují za určitých

3. Sekvenční obvody. b) Minimalizujte budící funkce pomocí Karnaughovy mapy

OPS Paralelní systémy, seznam pojmů, klasifikace

1. ZÁKLADY VEKTOROVÉ ALGEBRY 1.1. VEKTOROVÝ PROSTOR A JEHO BÁZE

Sekvenční logické obvody(lso)

P2: Statistické zpracování dat

Matematika 1. Katedra matematiky, Fakulta stavební ČVUT v Praze. středa 10-11:40 posluchárna D / 13. Posloupnosti

6. Posloupnosti a jejich limity, řady

Principy počítačů I Netradiční stroje

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

Přednáška 7, 14. listopadu 2014

1. Definice elektrického pohonu 1.1 Specifikace pohonu podle typu poháněného pracovního stroje Rychlost pracovního mechanismu

Deskriptivní statistika 1

8.2.1 Aritmetická posloupnost I

Popisná statistika. Zdeněk Janák 9. prosince 2007

Základy statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková

Iterační metody řešení soustav lineárních rovnic

Vyhledávání v tabulkách

Intervalové odhady parametrů některých rozdělení.

Spojitost a limita funkcí jedné reálné proměnné

MATICOVÉ HRY MATICOVÝCH HER

6. FUNKCE A POSLOUPNOSTI

1. Nakreslete všechny kostry následujících grafů: nemá žádnou kostru, roven. roven n,

Základy informatiky. 2. Přednáška HW. Lenka Carr Motyčková. February 22, 2011 Základy informatiky 2

TECHNICKÝ AUDIT VODÁRENSKÝCH DISTRIBUČNÍCH

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

Odhady parametrů 1. Odhady parametrů

1 Základy Z-transformace. pro aplikace v oblasti

3. Lineární diferenciální rovnice úvod do teorie

procesy II Zuzana 1 Katedra pravděpodobnosti a matematické statistiky Univerzita Karlova v Praze

PRAVDĚPODOBNOST A STATISTIKA. Náhodná proměnná vybraná rozdělení

Závislost slovních znaků

1.3. POLYNOMY. V této kapitole se dozvíte:

Komplexní čísla. Definice komplexních čísel

Prostředky automatického řízení

Příloha č. 7 Dodatku ke Smlouvě o službách Systém měření kvality Služeb

Představení a vývoj architektur vektorových procesorů

Budeme pokračovat v nahrazování funkce f(x) v okolí bodu a polynomy, tj. hledat vhodné konstanty c n tak, aby bylo pro malá x a. = f (a), f(x) f(a)

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

III/2 Inovace a zkvalitnění výuky prostřednictvím ICT

8.2.1 Aritmetická posloupnost

MATURITNÍ OTÁZKY ELEKTROTECHNIKA - POČÍTAČOVÉ SYSTÉMY 2003/2004 TECHNICKÉ VYBAVENÍ POČÍTAČŮ

Metodický postup pro určení úspor primární energie

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

Paralelní programování

9. Měření závislostí ve statistice Pevná a volná závislost

Aplikace teorie neuronových sítí

Petr Šedivý Šedivá matematika

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

DERIVACE FUNKCÍ JEDNÉ REÁLNÉ PROM

Příklady k přednášce 9 - Zpětná vazba

Tento materiál vznikl díky Operačnímu programu Praha Adaptabilita CZ.2.17/3.1.00/33254

11. přednáška 16. prosince Úvod do komplexní analýzy.

Matematická analýza I

Náhodný výběr 1. Náhodný výběr

Analýza a zpracování signálů. 3. Číselné řady, jejich vlastnosti a základní operace, náhodné signály

f x a x DSM2 Cv 9 Vytvořující funkce Vytvořující funkcí nekonečné posloupnosti a0, a1,, a n , reálných čísel míníme formální nekonečnou řadu ( )

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor nezávislost, funkce náhodného vektoru

Systém pro zpracování, analýzu a vyhodnocení statistických dat ERÚ. Ing. Petr Kusý Energetický regulační úřad odbor statistický a bezpečnosti dodávek

4EK212 Kvantitativní management 4. Speciální úlohy lineárního programování

POLYNOM. 1) Základní pojmy. Polynomem stupně n nazveme funkci tvaru. a se nazývají koeficienty polynomu. 0, n N. Čísla. kde

Funkce. RNDr. Yvetta Bartáková. Gymnázium, SOŠ a VOŠ Ledeč nad Sázavou

U klasifikace podle minimální vzdálenosti je nutno zvolit:

6. ČÍSELNÉ POSLOUPNOSTI A ŘADY 6.1. ČÍSELNÉ POSLOUPNOSTI

Pro úlohy digitálního zpracování obrazu je příznačný velký objem dat. Doposud ani rychlé počítače s konvenční sériovou architekturou nejsou schopny

CHARAKTERISTIKA MODERNÍCH PENTIÍ. Flynnova klasifikace paralelních systémů

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

Pravděpodobnostní modely

Iterační výpočty projekt č. 2

Profilová část maturitní zkoušky 2017/2018

Lineární programování

pravděpodobnostn podobnostní jazykový model

2. Náhodná veličina. je konečná nebo spočetná množina;

Laboratorní práce č. 10 Úloha č. 9. Polarizace světla a Brownův pohyb:

Analýza a zpracování signálů. 3. Číselné řady, jejich vlastnosti a základní operace, náhodné signály

8.2.7 Geometrická posloupnost

Operační systémy. Přednáška 1: Úvod

Transkript:

ricipy počítačů I Taxoomie, orgaizace s vysokým výkoem símek ricipy počítačů Část IX Taxoomie, orgaizace s vysokým výkoem símek 2 Flyova taxoomie SISD - Sigle Istructio Sigle Data SIMD - Sigle Istructio Multiple Data MISD - Multiple Istructio Sigle Data MIMD - Multiple Istructio Multiple Data 2 símek 3 Stroje SISD M MS diagram stroje SISD klasické stroje vo Neumaova typu problém se zařazeím vektorových strojů dyamický pohled - stroje SISD statický pohled - stroje SIMD 3

símek 4 M K Stroje SIMD Md Md Md MS diagram stroje SIMD Lokálí paměť rocesorový elemet (aktiví ebo ečiý) Řadič - zodpovídá za vyzdvižeí, dekódováí a přiděleí istrukce vektorové zpracováí - distribuce elemetů vektoru do lokálích pamětí 4 símek 5 MS diagram stroje MISD Stroje MISD Mi Mi Mi Md velmi málo strojů systolické pole proudová lika - evyzvedává istrukce a operady z lokálí paměti 5 símek 6 MS diagram stroje MIMD Stroje MIMD M M M M široká škála zařízeí -multiprocesorové stroje většiou použity pro paralelizaci úloh počítačové sítě 6

símek 7 Další taxoomie ejvětším problémem je začleěí vektorových procesorů pokusy o velmi složité taxoomie selhaly rozšířeí Flyovy taxoomie o stroj SMD - Sigle rogram Multiple Data - sychoizovaý stroj MIMD, kde všechy procesory pracují pod řízeím stejého programu. 7 símek 8 očítačové systémy s vysokým výkoem Implemetace Architektura Orgaizace text text text text Techologické postupy 8 símek 9 a úrovi úlohy a úrovi programu ezávislost sekcí ezávislost iterací a úrovi istrukcí a úrovi aritmetiky aralelizace Kocepce paralelího zpracováí závisí a graularitě úlohy 9

símek 0 Orgaizace s vysokým výkoem multiprocesory MIMD se sdíleou pamětí multiprocesorové vektorové stroje systémy MIMD s distribuovaými pamětmi stroje SIMD distribuovaé paměti 0 símek Stroj MIMD se sdíleou pamětí Stroj c.mmp - ázev odvoze od MS diagramu M M M M M M Základí elemet Skupia původí verze s křížovým přepíačem, později strom propojey počítače D- lieárí adresový prostor postupé vyřizováí žádosti o přístup do paměti (NUMA) símek 2 M c Mc Mc KSR-- sdíleá virtuálí paměť Druhá úroveň hierarchie, spojuje max. 34 kruhů prví hierarchie Mc rví úroveň hierarchie, spojuje max. 32 procesorů, rychlost GB/s Mc Mc Vyrovávací paměť 32 MB 2

símek 3 Multiprocesorové vektorové stroje většiou obsahují malé možství výkoých vektorových procesorů apř. CRAY C - 90 max. 6 procesorů vyladěí paměťových modulů šířce pásma procesoru více paměťových modulů propojeých sítí (víceúrovňové křížové přepíače) k procesorům výjimka Fujitsu V500, 222 procesorů 3 símek 4 MIMD s distribuovaými pamětmi prví stroje s procesory Itel 8086 v síti hyperkrychle 6 až 28 procesorů (Cosmic Cube) růzé strategie výměy zpráv (jedoduché protokoly, Worm Hole ) a bázi Cosmic Cube postavey komerčí počítače s procesory RISC i860 apod. 4 símek 5 CM-5 (Thikig Machies) () Topologie stroje používá fat-tree rocesor SARC, 32 MB paměti, vektorový koprocesor 4 2 20 Mbit/s 5

símek 6 CM-5 (Thikig Machies) (2) Odděleá datová a řídící síť v M v M v M v M v M Kio Ket Ket Datová Řídící síť síť a) Datový uzel stroje CM-5 Datová Řídící síť síť b) Řídící uzel stroje CM-5 6 símek 7 Adresy odmíky aměť 4 kb SIMD - stroj CM-2 Jedobitový procesor stroje SIMD - CM-2 4 096 procesorů ve dvaáctirozměré krychli říze počítačem VAX Vstup A Vstup A Vstup B aměť podmíek ALU Řízeí ALU Výrazé zrychleí pro prohledáváí databází, řazeí zázamů 7 símek 8 SIMD - maticové stroje () Řídící počítač Datová sběrice Řadič Řídící sběrice 0 2 3 M0 M M2 M3 M ropojovací síť Maticový stroj s lokálími pamětmi 8

símek 9 SIMD - maticové stroje (2) Řídící počítač Datová sběrice Řadič Řízeí propojovacího pole Řídící sběrice 0 2 3 ropojovací síť k M0 M M2 M3 M Maticový stroj se sdíleou pamětí 9 símek 20 oužití maticových strojů matematické modely založeé a práci s maticemi (operace typu ásobeí, rozklad, iverze a výpočet vlastí hodoty) lieárí a celočíselé programováí modelováí v meteorologii sigálové procesory (filtrace, FFT) zpracováí map v geodézii a kartografii zpracováí obrazů a aalýza scéy v reálém čase 20 símek 2 Distribuovaé paměti () uiversálí procesor spojeý s lokálí pamětí (multipočítačové systémy) výko je urče výkoem komuikačího systému programovací techiky (sychroizace procesů) 2

símek 22 Distribuovaé paměti (2) M K0 K M K0 K E0 E M K0 K M K0 K E2 E3 22 símek 23 orováí SIMD a MIMD SIMD stejý program pro celý systém cetralizovaé řízeí sychroizace je vlastí již ávrhu speciálí použití MIMD každý procesor vlastí program distribuovaé řízeí obtížá sychroizace obecější ávrh, větší segmet aplikací 23 símek 24 aralelí systémy podmíky omezující paralelí výpočet závislost toku dat - istrukce s produkuje vstupí data pro istrukci s 2 závislost výstupu - istrukce s a istrukce s 2 zapisují do téže proměé závislost vstupu - istrukce s přepisuje vstupí data istrukce s 2 vstupě/výstupí závislost - istrukce s a istrukce s 2 zapisují do téhož souboru 24

símek 25 Latetí závislosti závislost idexů (apř. idexovaé idexy) idexy, které eobsahují řídící proměou cyklu proměé, které se vyskytují pokaždé s jiými idexy elieárí idexy 25 símek 26 Graularita úlohy programu podprogramu cyklu strojové istrukce mikroistrukce 26 símek 27 aralelismus řízeí paralelí zpracováí procedur ebo příkazů doplěých o paralelí kostrukty paralelí kostrukty založeé a sychroizačích primitivech model stroje - propojeí ěkolika běžých procesorů, kde každý z ich vykoává istrukce podle stavu svého vlastího programového čítače 27

símek 28 iput d,e,f; c[0]0; for(i;i<4;i++) { a[i]d[i]+e[i]; b[i]a[i]*f[i]; c[i]b[i]+c[i]; } aralelismus datových toků c0 d e f d2 e2 f2 d3 e3 f3 d4 e4 f4 + * + a b + * a2 + * a3 b2 b3 b4 c c2 c3 c4 + + + Datové položky poukazují a exekutibilí kód, který se zače vykoávat teprve tehdy, až všecha potřebá data budou k dispozici - vykoáváí fragmetů kódu odspoda + * a4 28 símek 29 Redukčí paralelismus a(b+)*c-d/e b + - * / c d e saha po odstraěí ízké efektivosti stroje řízeého tokem dat odstartováí fragmetu kódu vyvolá potřeba výsledku zpracováí vede ke stromovému rozvoji operací 29 símek 30 arametry paralelího systému () Nechť existuje program, který vykoává t paralelích istrukcí během dostatečě malého časového itervalu t. arametr t azýváme profilem ebo paralelím profilem programu. Celkový počet operací E v čase t t -t 0 Idealizovaý výpočetí výko jedoho procesoru t E µ t dt t0 30

símek 3 arametry paralelího systému (2) růměrý paralelizmus úlohy E T µ µ φ t t 0 t t0 t dt Celkový čas běhu úlohy sekvečí běh plě paralelí běh Ei T i. µ t 3 símek 32 arametry paralelího systému (3) Asymptotické zrychleí S T () T ( ) i E Ei i 32 símek 33 W k růměrý výko Aritmetický průměr Geometrický průměr a W i k i Harmoický průměr W h k i k W i W k k g W i i latí Cauchyho věta W a > W g > W h 33

símek 34 růměré harmoické zrychleí ro sekvečí běh programu T W ro paralelí běh programu Ti W i i růměré harmoické zrychleí výpočtu a stroji s i procesory S wi W i i 34 símek 35 Okrajové stavy systému. -procesorový stroj může používat libovolý stupeň paralelizace ke zpracováí / úlohy 2. i procesorů zpracovává paralelě části úlohy, které jsou úměré i 3. i procesorů zpracovává paralelě části úlohy, které jsou úměré převráceé hodotě i 4. úloha má dvě části, jeda se zpracovává pouze sekvečě, druhá pouze paralelě a procesorech 35 símek 36 řípad. oužité váhy jsou stejé w w2 K růměré harmoické zrychleí Eulerova S Ψ( ) + C kostata i i Gamma fukce Některé hodoty S 2,33 S 32 7,88 S 024 36,36 36

símek 37 řípad 2. oužité váhy odpovídají předpisu w, q 2 w2, q 3 w3, L, w, q q růměré harmoické zrychleí S i q q + i 2 i q i ( + ) i 2 Asymptotické zrychleí 50% 37 símek 38 řípad 3. oužité váhy odpovídají předpisu 2 w, w2, w3, L, w q q q růměré harmoické zrychleí S i q ( + ) + i 2 2 + Ψ( ) ( + ) + C( + ) i q Některé typické hodoty S 2,2 S 32 5,8 S 024 78,64 38 símek 39 řípad 4 - Amdahlův záko oužité váhy odpovídají předpisu w s, w2 w3 L w 0, w s růměré harmoické zrychleí S s s + s + s s( ) + V limitím případě S lim s 39

símek 40 Zrychleí výpočtu 40 20 00 80 60 40 20 0 Amdahlovův záko (2) 28 procesorů 64 procesorů 32 procesorů 6 procesorů 8 procesorů 2 procesory 0 0, 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 Stupeň paralelosti úlohy 40 símek 4 Účiost paralelího zpracováí O počet operací a -procesorovém systému T poměrá doba zpracováí programu v - procesorovém systému Zrychleí T S ; S T Účiost η S T T η 4 símek 42 Redudace a využití prostředků Kvalita paralelizace Redudace Koeficiet využití prostředků S η R O U R η T T O 2 Q 2 R T O ; Q < O S 42

símek 43 Účiost paralelích algoritmů graularita profil paralelího zpracováí způsob komuikace jedotlivých částí stroje zvoleý způsob sychroizace procesů společé prvky ávrhu požadavky a paměť a její orgaizace 43 símek 44 Účiost paralelizace Účiost paralelizace w( s) E w( s) + h( s, ) Fukce rovoměré účiosti E w( s) h( s,,) E 44