PŘEDSTAVENÍ GRAFICKÉHO PROCESORU NVIDIA G200



Podobné dokumenty
Představení a srovnání grafických procesorů ATI RV770 a NVIDIA G(T)200

GRAFICKÉ ADAPTÉRY. Pracovní režimy grafické karty

Pokročilá architektura počítačů

Intel (2) Intel (1) Intel (3) Intel (4) Intel (6) Intel (5) Nezřetězené zpracování instrukcí:

Architektura grafických ip pro Xbox 360 a PS3

GPU A CUDA HISTORIE GPU CO JE GPGPU? NVIDIA CUDA

Karel Johanovský Michal Bílek SPŠ-JIA GRAFICKÉ KARTY

Grafické karty. Autor: Kulhánek Zdeněk

Hardware. Z čeho se skládá počítač

Základní deska (1) Parametry procesoru (2) Parametry procesoru (1) Označována také jako mainboard, motherboard

Herní PC HAL3000 Artemis výkonný lovec pro nekončící zábavu

OPS Paralelní systémy, seznam pojmů, klasifikace

Zobrazovací a zvuková soustava počítače

ARCHITEKTURA AMD PUMA

PROCESOR. Typy procesorů

Architektura počítače

Grafické adaptéry a monitory

DUM č. 14 v sadě. 31. Inf-7 Technické vybavení počítačů

Grafické karty s podporou DirectX 11 Quynh Trang Dao Dao007

Procesor Intel Pentium (1) Procesor Intel Pentium (3) Procesor Intel Pentium Pro (1) Procesor Intel Pentium (2)

Charakteristika dalších verzí procesorů v PC

Pokročilé architektury počítačů

HW počítače co se nalézá uvnitř počítačové skříně

Procesor. Procesor FPU ALU. Řadič mikrokód

G R A F I C K É K A R T Y

Výzva k podání nabídky včetně zadávací dokumentace na veřejnou zakázku malého rozsahu

Hardwarová akcelerace HD videa v návaznosti na architektury čipu grafických karet

Nová architektura od ATI (Radeon HD 4800) Datum: Vypracoval: Bc. Radek Stromský

HAL3000 MČR Pro tak hrají skuteční profesionálové

Testujeme notebook pro opravdové hráče: Toshiba X200

Geekovo Minimum. Počítačové Grafiky. Nadpis 1 Nadpis 2 Nadpis 3. Božetěchova 2, Brno

Obecné výpočty na GPU v jazyce CUDA. Jiří Filipovič

Představení a vývoj architektur vektorových procesorů

Masivně paralelní zpracování obrazu v prostředí systému VisionLab Liberec Roman Cagaš, rc@mii.cz

Nvidia CUDA Paralelní programování na GPU

Základní deska (mainboard, motherboard)

Kč s DPH HAL3000 TITAN X spoutejte sílu nejvýkonnějších technologií

Grafická karta SVGA (2) Grafická karta SVGA (1) Grafická karta SVGA (4) Grafický akcelerátor: Grafická karta SVGA (3) Grafická karta SVGA (5)

Obsah. Úvod 15. Vše potřebné o psaní a plánování 27. Oddíl I Preprodukce

Otázka číslo 3 Hardware PC komponent

GPU a CUDA. Historie GPU. Co je GPGPU? Nvidia CUDA

Nvidia CUDA Paralelní programování na GPU

Principy činnosti sběrnic

E.C.S. řada nová generace obrat o 360 ( Systém vyvinut ve Florencii v r.2009 )

SEZNAM A VYSVĚTLENÍ VYBRANÝCH POJMŮ TÝKAJÍCÍCH SE PARAMETRŮ ZOBRAZOVACÍCH JEDNOTEK ELEKTRONICKÝCH SYSTÉMŮ

Přednáška 1. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012

Pokročilé architektury počítačů

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Obecný popis základní jednotky

Pokročilé architektury počítačů

Přednášky o výpočetní technice. Hardware teoreticky. Adam Dominec 2010

CHARAKTERISTIKA MODERNÍCH PENTIÍ. Flynnova klasifikace paralelních systémů

Úvod do architektur personálních počítačů

Základní deska (1) Označována také jako mainboard, motherboard. Deska plošného spoje tvořící základ celého počítače Zpravidla obsahuje:

AGP - Accelerated Graphics Port

Pro úlohy digitálního zpracování obrazu je příznačný velký objem dat. Doposud ani rychlé počítače s konvenční sériovou architekturou nejsou schopny

Jakub Novák 4.ledna ledna

Technické prostředky počítačové techniky

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115

Základy informatiky. 2. Přednáška HW. Lenka Carr Motyčková. February 22, 2011 Základy informatiky 2

Procesory nvidia Tegra

Vlastnosti produktu. Seznamte se s novým šampionem na poli stolních počítačů

Jednokamerový systém pro sledování objektů

CHARAKTERISTIKY MODELŮ PC

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

ZÁKLADNÍ DESKA ASUS PRIME X370-PRO ZÁKLADNÍ DESKA, AMD X370, AM4, 4X DIMM DDR4, 1X M.2, ATX

GRAFICKÉ KARTY. Pracovní režimy grafické karty. Základní blokové schéma grafické karty

Pokročilé architektury počítačů

Co je grafický akcelerátor

Technická specifikace: NPMK Nákup výpočetní techniky

Digitální učební materiál

Roman Výtisk, VYT027

Streaming multimediálního obsahu s

Inovace bakalářského studijního oboru Aplikovaná chemie. Reg. č.: CZ.1.07/2.2.00/

IB109 Návrh a implementace paralelních systémů. Organizace kurzu a úvod. RNDr. Jiří Barnat, Ph.D.

Vysoká škola báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky. referát do předmětu: Pokročilé architektury počítačů.

Úvod do GPGPU J. Sloup, I. Šimeček

Váš stylový multimediální společník v karamelově smetanovém provedení. Oficiální webové stránky VAIO Europe

Výzva k podání nabídky včetně zadávací dokumentace na veřejnou zakázku malého rozsahu

5 990,- květen , ,- ceník. HCOMP AMD 4000 Trinity. Záruka 2 roky možnost splátek. Doporučený software. Cena s DPH.

Vlastnosti produktu. HAL3000 herní sestava MČR Pro V2 navržena hráči pro hráče

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

Vlastnosti produktu. Neutuchající pracovní nasazení s HAL3000 EliteWork

Hardware Základní pojmy. Autor: Ing. Jan Nožička SOŠ a SOU Česká Lípa VY_32_INOVACE_1122_Hardware Základní pojmy_pwp

Pinnacle Studio 14. Josef Pecinovský. Obsah. Odpovědný redaktor Ing. Pavel Němeček Sazba Jana Davídková Počet stran 128 První vydání, Praha 2010

5 990,- prosinec , ,- ceník. HCOMP AMD 4000 Trinity. Záruka 2 roky možnost splátek. Doporučený software. Cena s DPH.

Vlastnosti produktu. Neutuchající pracovní nasazení s HAL3000 EliteWork

Grafické adaptéry a monitory

Miroslav Tichý, tic136

Volitelný počet jader

2.8 Procesory. Střední průmyslová škola strojnická Vsetín. Ing. Martin Baričák. Název šablony Název DUMu. Předmět Druh učebního materiálu

5 790,- únor ceník. HCOMP AMD 4020 Trinity. Záruka 2 roky. Příplatky a software: Cena s DPH. Počítač: 4GB DDR3 RAM AMD HD GB HDD

Kupní smlouva uzavřená dle ust. 409 a násl. zákona Č. 513/1991 Sb., Obchodní zákoník, ve znění pozdějších předpisů (dále jen "obchodní zákoník")

Počítačová grafika Grafické karty a monitory (metodické materiály) dr. Josef Šedivý Centrum talentů UHK, 2010

Monitory a grafické adaptéry

GPGPU. Jan Faigl. Gerstnerova Laboratoř pro inteligentní rozhodování a řízení České vysoké učení technické v Praze

Vyuºití GPGPU pro zpracování dat z magnetické rezonance

Pojem architektura je převzat z jiného oboru lidské činnosti, než počítače.

Technická specifikace ČÁST 1. Místo plnění: PČR Kriminalistický ústav Praha, Bartolomějská 10, Praha 1

Transkript:

PŘEDSTAVENÍ GRAFICKÉHO PROCESORU NVIDIA G200 Bc.Adam Berger Ber 208

Historie a předchůdci G200 V červnu roku 2008 spatřila světlo světa nová grafická karta od společnosti Nvidia. Tato grafická karta opět posunula veškeré chápání grafiky o kus dál a přináší tak mnohem věrohodnější, rychlejší a lepší zpracování obrazu. Její vývoj trval bezmála 4 roky. Výsledek snažení skutečně stojí za to. Předchůdcem grafického čipu G200 jsou grafické karty postavené na čipu G80 (např. Geforce 8800GT a 8800GTX) a G 92( např.9800gtx ). V tabulce níže je porovnání karet 8800GTX s GTX280 Grafické karty postavené na jádru G200 se zatím nabízí ve 2 variantách. Výkonnější GTX280 a méně výkonná GTX260. GTX 260 je postavená na úplně stejné architektuře, pouze má omezené některé jednotky. Výkon je tak uměle snížen. G200 je vyráběná 65nm technologií. Na jádro o velikosti 24mm x 24mm dokázali technici v Nvidii umístit 1,4 miliard tranzistorů. Pro zajímavost G80 měla něco kolem 681 milionů a jádro G92 754 milionů. Což znamená že jádro G200 má skoro dvojnásobný počet tranzistorů oproti G92.

Hlavní přínosy G200 Unifikovaná architektura druhé generace Integrovaná PhysX Multi-GPU SLI a Tri-SLI Podpora DirectX 10 Shader Model 4.0. Jazyk CUDA PCI Express 2.0 Giga Thread Technologie paralelní zpracování operací Lumenex engine - velmi přesné zobrazení objektů. 128-bitové HDR osvětlení - slibuje dvakrát kvalitnější světelné efekty. Dual Link a Display Port - Přes obě rozhraní je možné zobrazit digitálně rozlišení až 2560x1600 Pure Video HD - Dva HD dekodéry dokáží zobrazit dva HD streamy zároveň. Vylepšené režimy spotřeby

Architektura Na obrázku níže je zobrazeno zjednodušené schéma procesoru G200. Zobrazení hlavně představuje tok dat od thread Schedule(řídí plánování úloh, které jsou poté zpracovány v clusterech jádra) až po ROPs (Render Output unit - zabezpečuje výstup dat z grafické karty), kde se finální pixely dostávají do frame bufferu a jsou následně zobrazené na vaší obrazovce. Jedná se o architekturu druhé generace. Díky vylepšenému komunikačnímu protokolu má G200 rychlejší a lepší přenos informací v jádru. Vylepšení také doznalo plánování mezi TMUs (Texture mapping unit - mapuje textury na objekty) a SM řadičem. V jádru se využívají 2 modely zpracování údajů: MIMD (multiple instruction, multiple data) v případe jednotlivých clusterů SIMT (single instruction, multiple thread) v jednotlivých SMs.

TP CLUSTER Celkově se v jádru nachází 10 thread processing clusterů (na obrázku) Každý jeden cluster je sestaven ze : 1. Tří streaming multiprocessors (SMs), 2. z osmi texturovacích jednotek (TMUs) složených z 8 filtrovacích (TFUs), 8 adresovacích jednotek (TAUs) 3. a lokální paměti L1 cache. Úkolem paměti cache, která se nachází mezi jednotlivými ALUs je uchování jednotlivých informací, které si ALUs vyměňují mezi sebou bez toho,aniž by museli přistupovat na externí paměťový systém.

FAKTA o G200 Vyšší výkon při zpracování textur G200obsahuje v každém clusteru dvě texturovací jednotky skládající se z 2x4 filtrovacích a 2x4 adresovacích jednotek, které dokáží za takt filtrovat a adresovat osm bilineárně filtrovaných pixelů a nebo čtyři: 2x anizotropní filtrované pixely. Více úloh najednou Jelikož je u her potřeba zvýšit aritmetický výkon, nemusela nvidia nijak razantně zvětšovat počet TMUs ale ALUs. G200 obsahuje 240 tzv. stream procesorů. K navýšení úloh také pomohl jazyk CUDA o kterém bude zmínka za chvíli. G200 vs G80 Vyšší přesnost operací v plovoucí desetinné čárce - nutné pro výpočty Vyšší frekvence jádra i pamětí Téměř 2x více SP procesorů Možnost třikrát vyššího počtu spuštěných paralelních úloh 1GB pamětí + 512-bit paměťová sběrnice Plná rychlost ROP jednotek Dvakrát delší velikost registrů - vyšší efektivita a výkon Několikrát rychlejší geometry shadery Efektivnější plánovač instrukcí, vyšší výkon při zpracování textur Vylepšený "z-cull" a komprese, vyšší výkon při vysokých rozlišeních

CUDA CUDA je unifikovaná architektura druhé generace umožňující využít u grafických karet jejich GPU nejen pro hry, ale i pro složité výpočty. Cuda je postavena na bázi jazyka C a C++ tak, aby umožnila programování jednoduchých SP jednotek v GPU. Hlavní předností, kterou si CUDA kladla za cíl je paralelizace prováděných úloh tak,aby využila výpočetní možnosti GPU na maximum a bezezbytku. Princip je jednoduchý. CPU zpracovává vlákno programu a při potřebě výpočtu předá tento úkol právě GPU. V případě, že program je napsaný pro jedno vlákno spustí jej CUDA na všech SP procesorech a tím proces paralelizuje. Tedy i když bude aplikace napsaná na jedno vlákno a spustí se na GPU, stane se z ní více vláknová. CPU vs GPU Běžné procesory spouští 2 vlákna instrukcí. Ty se snaží provádět jednu za druhou v co nejkratším čase. V současnosti je největší problém v tom, že aplikace jsou psané pro jedno vlákno nikoliv pro více. Jediné více vláknové aplikace jsou hry, editory videa, encodery,simulace, fotografií. GPU je ve skutečnosti mnoho jádrový multiprocesor. Ten je v jednom okamžiku schopen provést několik instrukcí najednou. Například čtyř jádrový procesor provede v jednom okamžiku jen několik instrukcí oproti tomu GPU provede až 100vky instrukcí. Čtyř jádrové CPU může navíc provádět jen 8 vláken, zatím co GPU jich může mít až tisíc. GPU nebude nikdy nahrazovat CPU. Už jen proto, že účel GPU je směrován jedním směrem a podle toho je i vybavena jeho instrukční sada. Ve výpočtech s plovoucí desetinnou čárkou však nemají GPU konkurenci. Velký význam mají GPU pro astro-fyzikální, lékařské, letecké apod. simulace a výpočty. Objevují se i první reálně využitelné aplikace ku prospěchu všech, například software pro výpočet obrazu u mamografů, modelů tomografů a dalších. Na obrázku níže můžete sledovat rozdíl ve zpracování videa HD nebo výpočtu PhysiX.

Závěr Grafický chip společnosti Nvidia rozhodně přinesl mnoho nových aspektů a technik do světa obrazu a grafiky. Díky vylepšené technologii, je možné zpracovávat rychleji video, lékařské snímky a nebo simulace jakéhokoliv typu. Novinka sebou také přinesla snížení spotřeby energie, možnost zapojit kartu do DUAL,TRI SLI režimu nebo Pure video HD. GPU s Cuda má velký potenciál, který se bude dále rozšiřovat. Zdroje http://pctuning.tyden.cz/ http://cs.wikipedia.org/wiki/geforce_200 http://www.nvidia.com/content/global/global.php