Pokročilé architektury počítačů

Podobné dokumenty
2.8 Procesory. Střední průmyslová škola strojnická Vsetín. Ing. Martin Baričák. Název šablony Název DUMu. Předmět Druh učebního materiálu

Procesor Intel Pentium (1) Procesor Intel Pentium (3) Procesor Intel Pentium Pro (1) Procesor Intel Pentium (2)

Vysoká škola báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky. referát do předmětu: Pokročilé architektury počítačů.

Využití ICT pro rozvoj klíčových kompetencí CZ.1.07/1.5.00/

Architektura Intel Atom

Procesory nvidia Tegra

Procesor. Hardware - komponenty počítačů Procesory

ARCHITEKTURA AMD PUMA

VÝUKOVÝ MATERIÁL. 3. ročník učebního oboru Elektrikář Přílohy. bez příloh. Identifikační údaje školy

Pokročilé architektury počítačů

Pokročilé architektury počítačů

Základní deska (1) Parametry procesoru (2) Parametry procesoru (1) Označována také jako mainboard, motherboard

Využití ICT pro rozvoj klíčových kompetencí CZ.1.07/1.5.00/

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

ARCHITEKTURA PROCESORŮ

Roman Výtisk, VYT027

Grafické karty s podporou DirectX 11 Quynh Trang Dao Dao007

Intel (2) Intel (1) Intel (3) Intel (4) Intel (6) Intel (5) Nezřetězené zpracování instrukcí:

Vícejádrový procesor. Dvě nebo více nezávislých jader Pro plné využití. podporovat multihreading

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

Xbox 360 Cpu = IBM Xenon

Procesory. Autor: Kulhánek Zdeněk

Základy informatiky. 2. Přednáška HW. Lenka Carr Motyčková. February 22, 2011 Základy informatiky 2

GRAFICKÉ ADAPTÉRY. Pracovní režimy grafické karty

ARCHITEKTURA AMD PUMA

PŘEDSTAVENÍ GRAFICKÉHO PROCESORU NVIDIA G200

Představení a vývoj architektur vektorových procesorů

CHARAKTERISTIKA MODERNÍCH PENTIÍ. Flynnova klasifikace paralelních systémů

Základní jednotka procvičování

Intel Itanium. Referát. Vysoká škola báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky Katedra informatiky

Architektura Intel Nehalem

Intel Microarchitecture Nehalem

PV109: Historie a vývojové trendy ve VT

Platforma Intel Centrino 2

PROCESOR. Typy procesorů

Vlastnosti mikroprocesorů Josef Horálek

Nvidia CUDA Paralelní programování na GPU

Výkonnost mikroprocesoru ovlivňují nejvíce dvě hlediska - architektura mikroprocesoru a tzv. taktovací frekvence procesoru.

VŠB Technická univerzita Ostrava Fakulta Elektrotechniky a informatiky. Představení a vývoj architektury Intel Atom

5 990,- květen , ,- ceník. HCOMP AMD 4000 Trinity. Záruka 2 roky možnost splátek. Doporučený software. Cena s DPH.

Jedna z nejdůležitějších součástek počítače = mozek počítače, bez něhož není počítač schopen vykonávat žádné operace.

Ve čtyřjádrové soutěži s Intelem teď

HP EliteBook 8440p. Záruka: 12 měsíců Cena: 5 690,- kč s DPH

Volitelný počet jader

Pohled do nitra mikroprocesoru Josef Horálek

PROCESORY. Typy procesorů

Ro R dina procesor pr ů Int In e t l Nehalem Šmída Mojmír, SMI108 PAP PA 2009

Pokročilá architektura počítačů

Blue Gene Vysoká škola báňská-technická univerzita Ostrava. Blue Gene. Karel Chrastina. Úvod. Blue Gene L. Blue Gene P.

Architektura procesoru ARM Cortex-A9 MPCore

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

Vyuºití GPGPU pro zpracování dat z magnetické rezonance

HISTORIE VÝPOČETNÍ TECHNIKY. Od abakusu k PC

Referát (pokročilé architektury počítačů)

ZÁKLADNÍ DESKA ASUS PRIME X370-PRO ZÁKLADNÍ DESKA, AMD X370, AM4, 4X DIMM DDR4, 1X M.2, ATX

Výstavba PC. Vývoj trhu osobních počítačů

Co je grafický akcelerátor

HP Compaq Pro 6300 SFF

Platforma Intel Centrino 2

Intel Centrino 2 - Úvod a procesory

Historie a vývoj Intel Atom

Geekovo Minimum. Počítačové Grafiky. Nadpis 1 Nadpis 2 Nadpis 3. Božetěchova 2, Brno

Pravda leží v poušti odtamtud totiž

GPGPU Aplikace GPGPU. Obecné výpočty na grafických procesorech. Jan Vacata

architektura mostů severní / jižní most (angl. north / south bridge) 1. Čipové sady s architekturou severního / jižního mostu

Úvod do architektur personálních počítačů

Procesor. Procesor FPU ALU. Řadič mikrokód

Pojem architektura je převzat z jiného oboru lidské činnosti, než počítače.

DUM č. 14 v sadě. 31. Inf-7 Technické vybavení počítačů

Cache paměti (2) Cache paměti (1) Cache paměti (3) Cache paměti (4) Cache paměti (6) Cache paměti (5) Cache paměť:

Uspořádání cache pamětí procesorů historie a současný stav

Semestrální práce z předmětu Speciální číslicové systémy X31SCS

Procesory. Závěrečná práce. Základní škola sv. Voršily v Olomouci Aksamitova 6, Olomouc

ARCHITEKTURA PROCESORŮ

PROCESOR. Rozdělení procesorů

Hardware Základní pojmy. Autor: Ing. Jan Nožička SOŠ a SOU Česká Lípa VY_32_INOVACE_1122_Hardware Základní pojmy_pwp

Testujeme notebook pro opravdové hráče: Toshiba X200

Pokročilé architektury počítačů

INFORMAČNÍ A KOMUNIKAČNÍ TECHNOLOGIE

Karel Johanovský Michal Bílek SPŠ-JIA GRAFICKÉ KARTY

Hardwarová akcelerace HD videa v návaznosti na architektury čipu grafických karet

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

Hardware. Z čeho se skládá počítač

Procesor EU peníze středním školám Didaktický učební materiál

Satori. Uživatelský manuál

Představení procesorů od firmy Tilera a jejich architektura

Toshiba a Intel: vzrušující personalizovaná digitální zábava na cestách

Úvod do programování a práce s počítačem

Informační a komunikační technologie

Základní informace. Operační systém (OS)

SEZNAM A VYSVĚTLENÍ VYBRANÝCH POJMŮ TÝKAJÍCÍCH SE PARAMETRŮ ZOBRAZOVACÍCH JEDNOTEK ELEKTRONICKÝCH SYSTÉMŮ

Architektura počítačů

5 990,- prosinec , ,- ceník. HCOMP AMD 4000 Trinity. Záruka 2 roky možnost splátek. Doporučený software. Cena s DPH.

Využití ICT pro rozvoj klíčových kompetencí CZ.1.07/1.5.00/

Úvod do problematiky návrhu počítačových systémů. INP 2008 FIT VUT v Brně

Hlavní využití počítačů

Nové technologie v průmyslových PC

Základní deska (mainboard)

ORGANIZACE A REALIZACE OPERAČNÍ PAMĚTI

Transkript:

Vysoká škola báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky Pokročilé architektury počítačů Architektura Intel Larrabee 5.12.2009 Josef Stoklasa STO228

Obsah: 1. Úvod do tajů projektu Larrabe 2. Srovnání s příbuznými projekty Intel 3. Struktura Larrabee použité technologie 4. Srovnání s konkurencí ATI a NVIDIA 5. Závěr a realita projektu 6. Zdroje

1. Úvod do tajů projektu Larrabee Na začátek je nutno říct, že Larrabee není klasické GPU! Jedná se ve skutečnosti o modifikovaný CPU s několika jádry. Intel se na poli grafických karet sice vyskytuje pouze ve formě základních grafických karet, které nezvládají pokročilejší 3D aplikace, či přehrávání videa v HD kvalitě. V tomto ohledu mají konkurenční firmy jako je NVIDIA, či ATI mnohaletý náskok ve vývoji výkonných grafických karet. Jistě si říkáte v čem je vlastně síla projektu Larrabe. Pojďme se tedy na něj podívat více z blízka. Projekt Larrabee je založena na velkém počtu jader modifikované, velmi dobře známé architektury Intel Pentium. Architektura Intel Pentium byla ve své době samozřejmě vyráběna 600 nm technologií, což se pochopitelně projevilo na velikosti celého čipu. Wafer Polaris s 80-ti jádrovými procesory Intel Dnes je oproti tomu standardem vyrábění 45 nm technologií, což samozřejmě Intelu umožňuje implementaci několika takovýchto jader na jeden čip. Tak například ve srovnání s architekturou Intel Core 2 Duo (L2 Chache okolo 4MB) se na stejnou plochu vejde okolo 10 jader starší architektury Pentium. Intel Larrabee je tedy ve své podstatě založeno na původní architektuře Pentium, což mu dává nebývalé možnosti pracovat s jakýmkoli x86 kódem, tedy použít jej také pro výpočetní aplikace a nejen pro zpracovávání grafického kódu, a také zaručuje zpětnou kompatibilitu se staršími aplikacemi určenými pro starší grafické akcelerátory. Cílem Larrabee tedy bylo sestavit super výkonnou grafickou kartu s mnoha jádry, která bude zvládat až 160 vektorových operací za takt. Srovnání můžeme vidět v níže uvedené tabulce.

Problémem samozřejmě zůstává uzpůsobení instrukční sady takového x86 procesoru, tak aby bylo efektivně využito všech 10 jader. V tomto ohledu je ovšem zase výhodou plná programovatelnost takovéhoto procesoru. Dokonce se díky ovladačům dokáže v systému tvářit nikoli jako grafická karta, nýbrž jako x86 procesor. 2. Srovnání s příbuznými projekty Intel Larabee je do značné míry podobný architektuře Intel Atom a to především krátkým zřetězením při zpracovávání instrukcí. Larrabee totiž využívá 5-ti stavové pipeline a Atom 16-ti stavové pipeleine. Jádra Larabee mají k dispozici každé (32kB l + 32kB D) cache L1 a jejich cache L2 je společná. Důvod si rozebereme později. Oproti tomu Atom má podstatně nižší cache L1 (32 kb l/24 kb D) a to z důvodu snížení spotřeby, jelikož menší cache L1 má dle expertů zásadní vliv na nižší spotřebu procesoru. Srovnání všech tří architektur Larrabee, Pentium a Atom vidíme v tabulce. 3. Struktura Larrabee použité technologie Jak již bylo předesláno jádra Larrabe využívají společnou L2 cache z níž má každé jádro vyhrazeno 256 kb, což by měla být ta pravá a optimalizovaná velikost (dle Intelu) pro zpracovávání grafického kódu. Larrabee by mělo využívat známé metody tile-based rendering, která při zpracovávání grafiky pod DirectX, nebo OpenGL rozdělí danou scénu do několika polí o velikosti 64*64 bodů (popřípadě 128*128 bodů) a spolu s informací o barvě a tzv. hodnotě Z (32-bit RGB/32-bit Z) tvoří právě oněch požadovaných 256 kb. Metodu tile-based jsme již mohli vidět v pradávných grafických akcelerátorech Kyro, které se nakonec na trhu neuchytily v tehdejší konkurenci NVIDIA, 3dfx, či ATI. Předností Larrabee, která jej předurčuje právě pro grafické operace je 16-wide ALU, která dokáže pracovat až s 16-ti 32-bitovými operacemi v oblastech čísel s plovoucí řádovou čárkou. Larrabee také disponuje podporou 64-bitových x86 operací a možností 4-cestného simultánního zpracování vícevláknových operací.

Struktura jednoho jádra Larrabee Aby Larrabee mohlo dosáhnout požadovaného výkonu využívá tzv. ring-bus sběrnice. Ring-bus jsme mohli vidět již u některého z dřívějších modelů karet ATI (např. s jádrem ATI R600), která tehdy obsahovala kombinaci čtyř 256-ti bitových sběrnic pro oba směry (512-bit čtení/zápis). Larrabee bude s největší pravděpodobností disponovat rovněž 512-bitovou sběrnicí pro každý směr, což při synchronizovaném taktu 2GHz sběrnice s jádrem dá ve srovnání s konkurencí doposud nevídaný výkon. Toto řešení se zdá pro Larrabee ideální, jelikož jak již bylo předesláno, jádra Larrabee využívají společnou dostatečně velkou L2 cache v níž má každé z jader vyhrazeno 256 kb. Toto tedy patřičně nahrává koherentnosti dat a velice usnadní výměnu velkého množství dat a jejich případné sdílení. Na níže uvedeném obrázku můžeme vidět ilustrativní znázornění struktury jader spolu s L2 cache.

Ilustrativní znázornění struktury jader okolo společné L2 cache 4. Srovnání s konkurencí ATI a NVIDIA Oba výše zmínění konkurenti využívají pro dosažení požadovaného výkonu GPU oproti Larrabee tzv. stream procesorů. Srovnáme si tedy alespoň teoreticky vektorovou ALU Larrabee se stream procesory obsaženými v jádrech NVIDIA GT200 a ATI RV770. ATI RV770 je složeno ze 160-ti superskalárních procesorů, přičemž každý z nich obsahuje 5 výpočetních jednotek. NVIDIA s jádrem GT200 obsahuje 240 subskalárních jednotek v podobě stream procesorů. Oproti tomu Larrabee má v každém jádře ALU, jež zvládne 16 operací za takt. Není to sice mnoho, ovšem je potřeba si uvědomit, že prototyp Larrabee by měl obsahovat 32 jader, přičemž pokročilejší vývoj by měl teoreticky pomocí 32 nm technologie dosáhnout až 48-mi jader obsažených na jednom čipu. Srovnání jader Larrabee se současnými AMD RV770 a NVIDIA GT200

5. Závěr a realita projektu Larrabee se jevil jako velmi nadějný projekt a byl označován za možnou revoluci ve světě grafických čipů, avšak je nutno si uvědomit, že vývoj se táhne již od roku 2007 a prototyp měl být původně sestrojen již v letošním roce. Realita je ovšem taková, že Intel letos na podzim oznámil nekomerční distribuci a tedy stažení celého projektu Larrabee pro veřejnou sféru. Po četných problémech, jež provázely celý vývoj již od začátku, mimo jiné také neúnosná spotřeba tolika jader, se projekt Larrabee specializoval na odnož superpočítačů z čehož je zřejmé, že my jakožto běžní uživatelé desktopů si s touto kartou zřejmě nikdy nezadáme. Nezbývá nám, tedy než spoléhat na ostřílené výrobce grafických čipů ATI a NVIDIA, kteří by však zdravou konkurenci již potřebovali, jelikož nadsazené ceny jejich novinek jsou pro průměrného uživatele neúnosné. 6. Zdroje http://www.svethardware.cz http://www.ddworld.cz http://asd.cdr.cz http://www.intel.com