Představení a vývoj architektur vektorových procesorů

Podobné dokumenty
Cell broadband engine architecture

Intel (2) Intel (1) Intel (3) Intel (4) Intel (6) Intel (5) Nezřetězené zpracování instrukcí:

OPS Paralelní systémy, seznam pojmů, klasifikace

Procesor Intel Pentium (1) Procesor Intel Pentium (3) Procesor Intel Pentium Pro (1) Procesor Intel Pentium (2)

ARCHITEKTURA PROCESORŮ

Základy informatiky. 2. Přednáška HW. Lenka Carr Motyčková. February 22, 2011 Základy informatiky 2

Architektura Intel Atom

2.8 Procesory. Střední průmyslová škola strojnická Vsetín. Ing. Martin Baričák. Název šablony Název DUMu. Předmět Druh učebního materiálu

Úvod do architektur personálních počítačů

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

PROCESOR. Typy procesorů

CHARAKTERISTIKA MODERNÍCH PENTIÍ. Flynnova klasifikace paralelních systémů

Hardware - komponenty počítačů Von Neumannova koncepce počítače. Von Neumannova koncepce počítače

Základní deska (1) Označována také jako mainboard, motherboard. Deska plošného spoje tvořící základ celého počítače Zpravidla obsahuje:

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

Pohled do nitra mikroprocesoru Josef Horálek

Roman Výtisk, VYT027

Intel Itanium. Referát. Vysoká škola báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky Katedra informatiky

Výukový materiál Hardware je zaměřený především na výuku principů práce hardwaru a dále uvádí konkrétní příklady použití.

Základní deska (1) Parametry procesoru (2) Parametry procesoru (1) Označována také jako mainboard, motherboard

Procesor. Hardware - komponenty počítačů Procesory

Paralelní systémy. SIMD jeden tok instrukcí + více toků dat jedním programem je zpracováváno více různých souborů dat

INFORMAČNÍ A KOMUNIKAČNÍ TECHNOLOGIE

Architektura počítače

Charakteristika dalších verzí procesorů v PC

Katedra informatiky a výpočetní techniky. 10. prosince Ing. Tomáš Zahradnický doc. Ing. Róbert Lórencz, CSc.

Architektura procesoru ARM

VÝUKOVÝ MATERIÁL. 3. ročník učebního oboru Elektrikář Přílohy. bez příloh. Identifikační údaje školy

Jan Nekvapil ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická

Charakteristika dalších verzí procesorů Pentium

Přehled paralelních architektur. Dělení paralelních architektur Flynnova taxonomie Komunikační modely paralelních architektur

Úvod do architektur personálních počítačů

Semestrální práce z předmětu Speciální číslicové systémy X31SCS

Úvod do problematiky návrhu počítačových systémů. INP 2008 FIT VUT v Brně

Přednášky o výpočetní technice. Hardware teoreticky. Adam Dominec 2010

Cache paměť - mezipaměť

PŘEDSTAVENÍ GRAFICKÉHO PROCESORU NVIDIA G200

Procesor. Procesor FPU ALU. Řadič mikrokód

Výkonnost mikroprocesoru ovlivňují nejvíce dvě hlediska - architektura mikroprocesoru a tzv. taktovací frekvence procesoru.

RISC a CISC architektura

Činnost CPU. IMTEE Přednáška č. 2. Několik úrovní abstrakce od obvodů CPU: Hodinový cyklus fáze strojový cyklus instrukční cyklus

Referát (pokročilé architektury počítačů)

MIKROPROCESOR. (c) Ing. Josef Varačka. Title: XI 28 11:40 (1 of 8)

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

Strojový kód k d a asembler procesoru MIPS SPIM. MIPS - prostředí NMS NMS. 32 ks 32bitových registrů ( adresa registru = 5 bitů).

Další aspekty architektur CISC a RISC Aktuálnost obsahu registru

Architektury počítačů a procesorů

Využití ICT pro rozvoj klíčových kompetencí CZ.1.07/1.5.00/

Využití ICT pro rozvoj klíčových kompetencí CZ.1.07/1.5.00/

Jak do počítače. aneb. Co je vlastně uvnitř

Obecné výpočty na GPU v jazyce CUDA. Jiří Filipovič

ARCHITEKTURA PROCESORŮ

Architektura procesoru ARM Cortex-A9 MPCore

Strojový kód. Instrukce počítače

Úvod SISD. Sekvenční výpočty SIMD MIMD

Intel Procesor a jeho konstrukce. Vývojové typy, činnost procesoru

Xbox 360 Cpu = IBM Xenon

Techniky zvýšení výkonnosti procesoru, RISC a CISC procesory

Procesory. Autor: Kulhánek Zdeněk

4. Úvod do paralelismu, metody paralelizace

Architektura procesorů PC shrnutí pojmů

Pokročilé architektury počítačů

Mikrokontroléry. Doplňující text pro POS K. D. 2001

architektura mostů severní / jižní most (angl. north / south bridge) 1. Čipové sady s architekturou severního / jižního mostu

Profilová část maturitní zkoušky 2014/2015

Osobní počítač. Zpracoval: ict Aktualizace:

PROCESOR. Rozdělení procesorů

Paralelní a distribuované výpočty (B4B36PDV)

SUPERPOČÍTAČE DANIEL LANGR ČVUT FIT / VZLÚ

Paralelní programování

Řízení IO přenosů DMA řadičem

Miroslav Tichý, tic136

C2115 Praktický úvod do superpočítání

Vývoj principů adresování operační paměti Princip adresování paměti - mikroprocesor I8086

Hlavní využití počítačů

4. Procesory CISC a RISC: Základní rysy a podněty pro vznik, zřetězení, predikce skoku, základní zástupci.

Vlastnosti mikroprocesorů Josef Horálek

6. Procesory jiných firem... 1

AGP - Accelerated Graphics Port

Procesor EU peníze středním školám Didaktický učební materiál

Profilová část maturitní zkoušky 2015/2016

Architektura Pentia 1

Informační a komunikační technologie

Paměťový podsystém počítače

Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115

Architekura mikroprocesoru AVR ATMega ( Pokročilé architektury počítačů )

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

Princip funkce počítače

Blue Gene Vysoká škola báňská-technická univerzita Ostrava. Blue Gene. Karel Chrastina. Úvod. Blue Gene L. Blue Gene P.

Pro úlohy digitálního zpracování obrazu je příznačný velký objem dat. Doposud ani rychlé počítače s konvenční sériovou architekturou nejsou schopny

1 Osobní počítač Obecně o počítačích Technické a programové vybavení... 4

NSWI /2011 ZS. Principy cpypočítačůčů aoperačních systémů ARCHITEKTURA

G R A F I C K É K A R T Y

Struktura a architektura počítačů

CHARAKTERISTIKA PROCESORU PENTIUM První verze:

logický obvod instruk ní sadou program napsaný v mikroinstrukcích RISC CISC registry adresovacích mechanism Instruk ní sada mikroprocesoru

Počítač jako elektronické, Číslicové zařízení

Operační systémy. Přednáška 1: Úvod

Systém řízení sběrnice

Transkript:

Představení a vývoj architektur vektorových procesorů Drong Lukáš Dro098 1

Obsah Úvod 3 Historie, současnost 3 Architektura 4 - pipelining 4 - Operace scatter a gather 4 - vektorové registry 4 - Řetězení 5 - Skalární registry 5 - Prokládaná paměť 5 Typy vektorových procesorů 5 Architektura vektorového procesoru CELL 6 Použitá literatura 9 2

Úvod Tyto procesory obsahují instrukční soubor, který zahrnuje současné vykonávání matematických operací nad množinou datových prvků. Délka vektoru činila 64 nebo 128 reálných čísel s pohyblivou řadovou čárkou. Vektorové procesory se nejvíce využívaly u superpočítačů v 80. a 90. letech minulého století pro vědecké výpočty a také pro předpověď počasí. V dnešní době se uplatňuje návrh procesoru, který zahrnuje jednotlivé instrukce pro zpracování vektoru na vícenásobné skupině dat, známé jako SIMD ( Single Instruction Multiple Data), a také vícenásobné instrukce pro zpracování vektoru na vícenásobných skupinách dat MIMD (Multiple Instruction Multiple Data). Historie, současnost Základní myšlenky vektorového procesoru CDC Star 100 byly formulovány v 60. letech minulého století. K realizaci došlo až v 70. letech. V roce 1976 byl uveden počítač Cray-1. Tento superpočítač obsahoval 8 vektorových registrů, které obsahovaly čtyřiašedesát 64. bitových slov, 12 různých pipelinů nebo funkčních jednotek. Mezi další společnosti, které představily vektorové stroje podobné Cray-1 byly Fujitsu, Hitachi a Nec. Poté Cray následoval k výrobě výkonnějších superpočítačů od Cray X-MP, Cray-2, Cray Y- MP, Cray-3. Moderní herní konsole obsahují ve své architektuře vektorové jednotky. Ve spolupráci firem IBM, Toshiba a Sony v roce 2000 začal projekt procesoru CELL, který obsahoval jednu skalární jednotku a 8 vektorových jednotek. 3

Architektura U vektorových procesorů je výpočet prvku vektoru nezávislý na ostatních prvků vektoru. Operace mohou být prováděny najednou a zároveň nezávisle na sobě. Funkční jednotky vektorových procesorů provádějí základní aritmetické a logické operace jako jsou: - součet - rozdíl - součin - posun Nejdůležitější charakteristikou vektorových procesorů: - pipelining - vektorové registry - Řetězení - Operace scatter a gather - Skalární registry - Prokládaná paměť Pipelining Ve skutečnosti se nepočítají složky vektoru najednou. Paralelita je řešena právě pomocí pipeliningu (roura). Operace scatter a gather Tyto operace slouží pro shromáždění a rozptýlení prvků ve vektoru. Např. chceme prvky v1,v3,v5,v7 z vektoru v(v1,v2,vn) použijeme operaci scatter pro přeformátování výstupu. Vektorové registry V obyčejných registrech se uchovává jen jedna hodnota. Naproti tomu u vektorových registrů může být uchováno více prvků vektoru najednou. Řetězení Funkční jednotky vektorových procesorů jsou navzájem zřetězeny (chaining), takže výsledky z jedné jednotky mohou být přesměrovány, jako vstup do jiné jednotky za účelem dalšího zpracovaní, čímž je umožněno překrývaní datově závislých instrukcí. 4

Skalární registry Tyto registry slouží pro uchování jedné hodnoty jako obecné registry, ale jsou uzpůsobeny k tomu, aby mohly být využity ve vektorovém pipelinu. Prokládaná paměť Paměť je rozdělena do bloků, které jsou schopny pracovat nezávisle na sobě a tím je možná paralelní komunikace a přenosy. Bez této prokládané paměti nebo jiného způsobu poskytování operandů by bylo zpracování celého vektoru s jedinou instrukcí dosti redukovaná. Pro použití větší délky vektoru se u vektorových procesorů používá technika Strip Mining: -Generace smyčky, která zachází s MVL (Maximum Vector Length) prvky pomocí iterací Nastavení operace na MVL prvcích je přeložená do jediné instrukce vektoru Typy vektorových procesorů: 1. Paměť-paměť U těchto procesorů se operandy načítají přímo do pipeline a ukládají se přímo do paměti. U těchto procesorů se nevyužívá registr. Procesor CDC Cyber 205 je takto řešen. 2. Registr-registr Tyto procesory oproti procesorům paměť-paměť načítaní operandy nejprve do vektorových registrů. Výsledky se poté uloží do těchto registrů. 5

Architektura vektorového procesoru CELL Cell Block Diagram Zde se budu věnovat architektuře vektorového procesoru CELL, která vychází od společností Sony, Toshiba a IBM. Tento procesor se skládá ze dvou prvků: - PPE (Power Procesor Element) - SPE(Synergistic Processing Elements) a také ze sběrnice EIB (Element Interconnect Bus) CELL procesor je vyroben 90nm technologií SOI a obsahuje 234 miliónů tranzistorů. Tento procesor má disponovat > 256 GFLOPS při jednoduché přesnosti a dále > 26 GFLOPS při dvojité. Taktovací kmitočet počítače > 4 GHz. Je postaven na IBM 64 - bitových výkonových jádrech. 6

PPE -je založeno na POWER architektuře, která se skládá z obousměrné multivláknového jádra vykonávající jako kontrolér pro osm SPE, který vykonává většinu výpočetního výkonu. PPE pracuje s konvekčními operačními systémy, zatímco SPE vykonává funkci pro náročnější výpočty. PPE obsahuje: - Cache L1 64KB, kde 32KB je pro instrukce a dalších 32KB pro data - Cache L2 512KB. - MMU (jednotka pro správu paměti) - IU (instrukční jednotku) Velikost cache linky je 128 B. SPE V tomto procesoru je obsaženo 8 SPE jednotek a z toho každá SPE jednotka se skládá ze součinné procesové jednotky SPU, LS paměti a funkčních bloků SXU (Synergistic Execution Unit). SPE je 128 bitový procesor architektury RISC. Dále každá jednotka obsahuje 256KB paměť pro instrukce a data nazývanou Local Storage. Každá SPE jednotka může disponovat až s 4GB lokální pamětí. Tyto jednotky mohou pracovat nezávisle na sobě.v případě potřeby mohou spolupracovat i předávat si mezi sebou data. 7

SMF SMF kontrolér přesunuje s daty a vykonává synchronizaci v paralelním SPU zpracování a realizuje propojení sběrnice BUS. SPU SPU architektura podporuje využívat programově techniky kompilátoru, k tomu, aby se zaměřil na paralelní datové provedení. EIB -spojuje různé čipové prvky systému: PPE procesor, paměťový kontrolér (MIC), osm SPE koprocesorů a dvě volná I/O rozhraní. 8

Cell Broadband Engine Seznam použité literatury http://en.wikipedia.org/wiki/vector_processor http://download.matfyz.info/swi087/jirovsky/5%20procesory.pdf http://www.root.cz/clanky/architektura-procesora-cell/ http://en.wikipedia.org/wiki/cell_%28microprocessor%29 http://homel.vsb.cz/~las03/pa/index.html http://www.svethardware.cz/art_doc-071410f96de4ab46c12574fd005ca1e5.html http://domino.research.ibm.com/comm/research.nsf/pages/r.arch.innovation.html 9

10