Část 1 ZÁKLADNÍ RYSY VÝPOČETNÍ PROSTŘEDKŮ DOSTUPNÝCH NA IT4INNOVATIONS
|
|
- Simona Marešová
- před 7 lety
- Počet zobrazení:
Transkript
1 Část 1 ZÁKLADNÍ RYSY VÝPOČETNÍ PROSTŘEDKŮ DOSTUPNÝCH NA IT4INNOVATIONS
2 Maximální výkonnost CPU Maximální výkonnost CPU je dána výrazem P max =cores*k*f, kde: cores je počet jader v CPU, k je počet FP instrukcí, které mohou být provedeny v jednom taktu, f je frekvence CPU. V současnosti (jaro 2014) nejmodernější Intel CPU mají tyto parametry rovny cores=6, f=3.6 GHz, k=16 pro jednoduchou přesnost nebo 8 pro dvojitou přesnost. Takže maximální výkonnost vychází 350 Gflops pro jednoduchou přesnost a 170 Gflops pro dvojitou přesnost. 2
3 Maximální výkonnost GPU I Maximální výkonnost GPU je dána výrazem P max =cores*k*f, kde: cores je počet výkonných jader v GPU, k je počet FP instrukcí, které mohou být provedeny v jednom taktu, f je frekvence GPU. V současnosti (jaro 2014) nejmodernější GPU od firmy Nvidia (Geforce GTX Titan) mají tyto parametry rovny: cores= 2688, f= 837 MHz, k=2 pro jednoduchou přesnost. k=2/3 pro dvojitou přesnost. Takže maximální výkonnost vychází 4.5 Tflops pro jednoduchou přesnost(sp) a 1.5 Tflops pro dvojitou přesnost(dp) 3
4 Maximální výkonnost GPU II Pro výpočty v dvojité přesnosti nebyla řada Geforce (pro řadu Fermi) optimalizována nejvýkonnější GPU od firmy Nvidia řady Tesla K40 má tyto parametry rovny: cores=2880, f=0.8 GHz, k=2 pro jednoduchou přesnost. k=2/3 pro dvojitou přesnost. Takže maximální výkonnost vychází 4.3 Tflops pro SP a 1.3 Tflops pro DP. 4
5 Maximální výkonnost Xeon Phi I Maximální výkonnost Xeon Phi je dána výrazem P max =cores*k*f, kde: cores je počet výkonných jader v GPU, k je počet FP instrukcí, které mohou být provedeny v jednom taktu, f je frekvence GPU. Daný CPU (Xeon Phi 7120P) mají tyto parametry rovny: cores= 61, f= 1238 MHz, k=32 pro jednoduchou přesnost. k=16 pro dvojitou přesnost. Takže maximální výkonnost vychází 2.4 Tflops pro jednoduchou přesnost(sp) a 1.2 Tflops pro dvojitou přesnost(dp) 5
6 Srovnání rychlostí výpočtu 6
7 Srovnání rychlostí výpočtu CUDA training course 7
8 Srovnání rychlostí přenosu Xeon Phi 8
9 Flynova klasifikace HW Single Instruction Single Data stream (SISD) =1 procesor provádí 1 instrukční proud nad daty uloženými v 1 paměti = klasický CPU Single Instruction Multiple Data stream (SIMD) =1 instrukce je prováděna nad množinou dat množinou procesorů = vektorové a maticové počítače Multiple Instruction Single Data stream (MISD) = posloupnost dat je přenášena k množině procesorů provádějících různé instrukce=systolické pole, fault-tolerant systémy Multiple Instruction Multiple Data stream (MIMD) = množina procesorů současně provádí různé instrukce nad různými daty=multiprocesory, multipočítače, distribuované systémy
10 Proč jsou GPU tak rychlé? Nelze zvyšovat frekvenci procesorů kvůli přehřívání, ale lze přidávat další funkční jednotky,díky tomu se oddělily 2 vývojové linie: 1. multi-core (několik plnohodnotných jader na jednom čipu). Po této linii jdou současné CPU. 2. many-core (mnoho jednodušších jader na jednom čipu). Po této linii jdou současné GPU. Využití GPU pro negrafické účely je označováno jako GPGPU ( generalpurpose computing on graphics processing units ). ] 10
11 Využití křemíku
12 Rozdíly CPU a GPU CPU optimalizováno pro zpracování sekvenčního kódu přidání dalších jader je složité (díky 1D architektuře) hierarchie cache pamětí včetně velké L3 cache k snížení latence přístupů do paměti většina křemíku v složité řídící logice zajišťující efektivní zpracování instrukcí (v ALU) a přísun dat GPU optimalizováno pro zpracování paralelních aplikací přidání dalších jader je jednoduché (díky 2D architektuře) řídící logika a cache sdílená několika jádry malá cache, latence přístupů do paměti snížena přepínáním mezi vlákny (až 1024 u GT 200) většina křemíku je v jednotlivých ALU 12
13 SIMD a SIMT Moderní CPU podporují vektorové=simd instrukce (technologie MMX, SSE, AVX, ) GPU se díky velkému datovému paralelismu ve zobrazovacím řetězci vyvinuly do specializovaných SIMD procesorů, ale s tolika rozšířeními, že jsou označována jako SIMT (Single Instruction Multiple Threads). Každé vlákno má vlastní identitu to jest např. registry. SIMT je obecnější = umožňuje např. nepřímý přístup do paměti vynechání instrukce některým vláknem GPU jednotky SIMT (CUDA: warp=32, ATI: wavefront=64) jsou větší než u CPU SIMD (AVX-512 bude mít 16 položek) 13
14 Limit FPU a paměti Skalární součin vektoru o vel. n Načteno 2n FP čísel Výsledek 1 FP číslo Potřeba 2n FP operací Intenzita = počet FP operací / objem dat = 1 Násobení matic o vel. n Načteno 2n 2 FP čísel Výsledek n 2 FP čísel Potřeba 2n 3 FP operací Intenzita = počet FP operací / objem dat = 2n/3 14
15 Skalární součin CPU Teoretická maximální výkonnost FPU 350 Gflops Maximální rychlost přenosu 50 GB/s => 12,5 Gflops maximum Xeon Phi Teoretická maximální výkonnost FPU 2400 Gflops Maximální rychlost přenosu 180 GB/s => 45 Gflops maximum GPU Teoretická maximální výkonnost FPU 4500 Gflops Maximální rychlost přenosu 300 GB/s => 75 Gflops maximum 15
16 Násobení matic Kdy bude dosaženo 50% P_max? 2*n^3/P_max = 50% (2*n^3/P_max + 3*4*n^2/B_max) CPU 50% P_max teoreticky dosaženo pro n>42 Xeon Phi 50% P_max teoreticky dosaženo pro n>80 GPU 50% P_max teoreticky dosaženo pro n>90 Prakticky nemožno, protože při výpočtu dochází k výpadků v cache U Xeon Phi a GPU chybí připočítat režii PCIe přenosu 16
17 Které aplikace na GPU? Požadavky: Snadno paralelizovatelné Nezávislé výpočty bez nutnosti částé globální synchronizace Dobře se mapují na GPU výpočetní model Problémy když: Malá paměť GPU Častá a objemná komunikace s CPU Velké datové závislosti 17
18 MIC v superpočítačích Tianhe 2 and Titan: #1 and #2 in 2013 Tianhe 2 34/55 PFLOPS 16,000 nodes 2x Intel Xeon CPU 3x Xeon Phi 384,000 CPU cores 48,000 MICs Titan 18/27 PFLOPS 18,688 nodes 1x AMD 6200 CPU 1x Tesla K20 GPU 299,008 CPU cores 18,688 GPUs
19 Intel Xeon Phi První z nové rodiny Intel Many Integrated Core (Intel MIC) Architecture. 50+ jader compatibilních s Intel instrukčním souborem (61 Cores), 4 threads na jádro (244 Threads), 512 bit registry pro SIMD vektorové operace Peak performance 1TFLOPS in DP Up to 16GB GDDR5 Memory 352 GB/s peak, but ~170 GB/s measured PCIe 2.0 x GT/s, 16 bit 512K L2 cache na core, L1 32KB/core Up to 300W TDP (card)
20 Intel Xeon Phi 8 paměťových kontrolerů + High speed bi-directional ring spojující jádra paměťové moduly (obrázek z intel.com)
21 MIC core Downgrade na Pentium (x86 kompatibilní) In-order execution Ale: Více MC + jiný typ pamětí Neexistuje sdílená L3 cache 512bit SIMD AVX-512 like (32 vektorových registrů) Nepodporuje MMX,SSE 4 thready na vlákno (round robin) Clock speed about 1Ghz Porovnání rychlostí (single core) Vektorově: 2x performance compared to dual E5 CPUs Scalar performance is 1/10th of E5 core
22 Xeon Phi zrychlení
23 Porovnání architektur Intel i7 Xeon Phi 7120P Geforce TITAN Počet jader Složitost jader složité jednodušší velmi jednoduché Počet vláken 8 nebo nebo 122 nebo K+ Cache L3 20MB L2 30,5MB L2 1,5MB Typ pamětí DDR4 vlastní GDDR vlastní GDDR5 Příkon 140W 300W 250W
GPU A CUDA HISTORIE GPU CO JE GPGPU? NVIDIA CUDA
GPU A CUDA HISTORIE GPU CO JE GPGPU? NVIDIA CUDA HISTORIE GPU GPU = graphics processing unit jde o akcelerátory pro algoritmy v 3D grafice a vizualizaci mnoho z nich původně vzniklo pro účely počítačových
VíceIntel 80486 (2) Intel 80486 (1) Intel 80486 (3) Intel 80486 (4) Intel 80486 (6) Intel 80486 (5) Nezřetězené zpracování instrukcí:
Intel 80486 (1) Vyroben v roce 1989 Prodáván pod oficiálním názvem 80486DX Plně 32bitový procesor Na svém čipu má integrován: - zmodernizovaný procesor 80386 - numerický koprocesor 80387 - L1 (interní)
VíceÚvod do GPGPU J. Sloup, I. Šimeček
Úvod do GPGPU J. Sloup, I. Šimeček xsimecek@fit.cvut.cz Katedra počítačových systémů FIT České vysoké učení technické v Praze Ivan Šimeček, 2011 MI-PRC, LS2010/11, Predn.3 Příprava studijního programu
VíceVyužití ICT pro rozvoj klíčových kompetencí CZ.1.07/1.5.00/34.0448
Střední odborná škola elektrotechnická, Centrum odborné přípravy Zvolenovská 537, Hluboká nad Vltavou Využití ICT pro rozvoj klíčových kompetencí CZ.1.07/1.5.00/34.0448 CZ.1.07/1.5.00/34.0448 1 Číslo projektu
VícePředstavení a srovnání grafických procesorů ATI RV770 a NVIDIA G(T)200
Představení a srovnání grafických procesorů ATI RV770 a NVIDIA G(T)200 Adam Količ, kol400 NVIDIA G(T)200 Technické info: 65nm (G200b - 55nm) 1,4 mld. tranzistorů 240 stream procesorů 32 ROP/RBE 80 texturovacích
VíceCharakteristika dalších verzí procesorů v PC
Charakteristika dalších verzí procesorů v PC 1 Cíl přednášky Poukázat na principy tvorby architektur nových verzí personálních počítačů. Prezentovat aktuální pojmy. 2 Úvod Zvyšování výkonu cestou paralelizace
VíceArchitektura AMD K10. Kozelský Martin, koz230. Datum: 11.11.2008
Architektura AMD K10 Vytvořil: Šuráb Jakub, sur072 Kozelský Martin, koz230 Datum: 11.11.2008 Obsah I. Připomenutí architektury AMD K8 IMC Cool'n'Quiet II. Architektura AMD K10 Struktura cache IMC, Hypertransport
VícePŘEDSTAVENÍ GRAFICKÉHO PROCESORU NVIDIA G200
PŘEDSTAVENÍ GRAFICKÉHO PROCESORU NVIDIA G200 Bc.Adam Berger Ber 208 Historie a předchůdci G200 V červnu roku 2008 spatřila světlo světa nová grafická karta od společnosti Nvidia. Tato grafická karta opět
VícePetr Havíček HAV319. Rodina procesorů Intel Nehalem (historie a vývoj)
Petr Havíček HAV319 Rodina procesorů Intel Nehalem (historie a vývoj) Úvod Nehalem je označení pro novou mikroarchitekturu procesorů od společnosti Intel. Je následníkem architektury Intel Core. První
VícePrincipy překladačů. Architektury procesorů. Jakub Yaghob
Principy překladačů Architektury procesorů Jakub Yaghob Architektury procesorů Architektura procesoru představuje cílový jazyk Platí pro překladače do kódu konkrétního procesoru Ovlivňuje celý backend
VíceProcesor Intel Pentium (1) Procesor Intel Pentium (3) Procesor Intel Pentium Pro (1) Procesor Intel Pentium (2)
Procesor Intel Pentium (1) 32-bitová vnitřní architektura s 64-bitovou datovou sběrnicí Superskalární procesor: obsahuje více než jednu (dvě) frontu pro zřetězené zpracování instrukcí (značeny u, v) poskytuje
VíceParalelní systémy. SIMD jeden tok instrukcí + více toků dat jedním programem je zpracováváno více různých souborů dat
Paralelní systémy Paralelním systémem rozumíme takový systém, který paralelně zpracovává více samostatných úloh nebo zpracování určité úlohy automaticky rozdělí do menších částí a paralelně je zpracovává.
VíceHlavní využití počítačů
Úvod Hlavní využití počítačů Počítače jsou výkonné nástroje využívané pro zpracování dat. Provádějí: načtení a binární kódování dat provedení požadovaného výpočtu zobrazení výsledku Hlavní využití počítačů
VíceGPU a CUDA. Historie GPU. Co je GPGPU? Nvidia CUDA
GPU a CUDA Historie GPU Co je GPGPU? Nvidia CUDA Historie GPU GPU = graphics processing unit jde o akcelerátory pro algoritmy v 3D grafice a vizualizaci mnoho z nich původně vzniklo pro účely počítačových
VícePROCESOR. Typy procesorů
PROCESOR Procesor je ústřední výkonnou jednotkou počítače, která čte z paměti instrukce a na jejich základě vykonává program. Primárním úkolem procesoru je řídit činnost ostatních částí počítače včetně
VíceREALIZACE SUPERPOČÍTAČE POMOCÍ GRAFICKÉ KARTY
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV TELEKOMUNIKACÍ FACULTY OF ELECTRICAL ENGINEERING AND COMMUNICATION DEPARTMENT OF TELECOMMUNICATIONS
VíceProcesor. Procesor FPU ALU. Řadič mikrokód
Procesor Procesor Integrovaný obvod zajišťující funkce CPU Tvoří srdce a mozek celého počítače a do značné míry ovlivňuje výkon celého počítače (čím rychlejší procesor, tím rychlejší počítač) Provádí jednotlivé
VícePV109: Historie a vývojové trendy ve VT
PV109: Historie a vývojové trendy ve VT Vývojové trendy Luděk Matyska Fakulta informatiky Masarykovy univerzity podzim 2014 Luděk Matyska (FI MU) PV109: Historie a vývojové trendy ve VT podzim 2014 1 /
VíceČást 2 POROVNÁNÍ VÝKONNOSTI A POUŽITELNOSTI ARCHITEKTUR V TYPICKÝCH APLIKACÍCH
Část 2 POROVNÁNÍ VÝKONNOSTI A POUŽITELNOSTI ARCHITEKTUR V TYPICKÝCH APLIKACÍCH Paralelizace kódu Rozdíl v přístupu k paralelizaci kódu si ukážeme na operaci násobení matice maticí: Mějme tři čtvercové
VíceParalelní a distribuované výpočty (B4B36PDV)
Paralelní a distribuované výpočty (B4B36PDV) Branislav Bošanský, Michal Jakob bosansky@fel.cvut.cz Artificial Intelligence Center Department of Computer Science Faculty of Electrical Engineering Czech
VíceCharakteristika dalších verzí procesorů Pentium
Charakteristika dalších verzí procesorů Pentium 1 Cíl přednášky Poukázat na principy architektur nových verzí typů Pentií. Prezentovat aktuální pojmy. 2 Úvod Paralelní systémy lze třídit z hlediska počtu
VíceCHARAKTERISTIKA MODERNÍCH PENTIÍ. Flynnova klasifikace paralelních systémů
Úvod: CHARAKTERISTIKA MODERNÍCH PENTIÍ Flynnova klasifikace paralelních systémů Paralelní systémy lze třídit z hlediska počtu toků instrukcí a počtu toků dat: SI systém s jedním tokem instrukcí (Single
VícePokročilé architektury počítačů
Pokročilé architektury počítačů Přednáška 5 GPU - CUDA Martin Milata Obsah Obecné výpočty a GPU Grafické procesory NVIDIA Tesla Výpočetní model Paměťový model GT200 Zpracování instrukcí Vydávání instrukcí
VíceVolitelný počet jader
Co přinese nového Co platí pro všechny Volitelný počet jader Charakteristika Nanometr nm10-9 mikrometr µm 10-6 Milimetr mm 10-3 FSB procesor s více jádry komunikuje prostřednictvím jednoho vlákna QPI
VíceSběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC
Informatika 2 Technické prostředky počítačové techniky - 2 Přednáší: doc. Ing. Jan Skrbek, Dr. - KIN Přednášky: středa 14 20 15 55 Spojení: e-mail: jan.skrbek@tul.cz 16 10 17 45 tel.: 48 535 2442 Obsah:
VíceJiné výpočetní platformy J. Sloup, M. Skrbek, I. Šimeček
Jiné výpočetní platformy J. Sloup, M. Skrbek, I. Šimeček xsimecek@fit.cvut.cz Katedra počítačových systémů FIT České vysoké učení technické v Praze Ivan Šimeček, 2011 BI-EIA, ZS2011/12, Predn.12 Příprava
VíceTechnické prostředky počítačové techniky
Počítač - stroj, který podle předem připravených instrukcí zpracovává data Základní části: centrální procesorová jednotka (schopná řídit se posloupností instrukcí a ovládat další části počítače) zařízení
VíceVyuºití GPGPU pro zpracování dat z magnetické rezonance
Vyuºití pro zpracování dat z magnetické rezonance Katedra matematiky, Fakulta jaderná a fyzikáln inºenýrská, ƒeské vysoké u ení technické v Praze Bakalá ská práce 2007/2008 Cíle práce Zpracování dat z
VícePokročilé architektury počítačů
Pokročilé architektury počítačů referát Intel Core 2 Quad Martin Samek SAM094 Abstrakt Text se bude zabývat procesorem Core 2 Quad firmy Intel. Text bude rozdělen do dvou hlavních částí, kde první část
VícePřednáška 1. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012
Přednáška 1 Úvod do HW a OS. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012 Příprava studijního programu Informatika je podporována projektem financovaným z Evropského
VícePřehled paralelních architektur. Dělení paralelních architektur Flynnova taxonomie Komunikační modely paralelních architektur
Přehled paralelních architektur Přehled paralelních architektur Dělení paralelních architektur Flynnova taxonomie Komunikační modely paralelních architektur Přehled I. paralelní počítače se konstruují
VíceVysoká škola báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky. referát do předmětu: Pokročilé architektury počítačů.
Vysoká škola báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky referát do předmětu: Pokročilé architektury počítačů na téma: Intel Atom Jan Bajer; baj102 Úvod Během posledních let
VíceZáklady informatiky. 2. Přednáška HW. Lenka Carr Motyčková. February 22, 2011 Základy informatiky 2
Základy informatiky 2. Přednáška HW Lenka Carr Motyčková February 22, 2011 Základy informatiky 1 February 22, 2011 Základy informatiky 2 February 22, 2011 Základy informatiky 3 February 22, 2011 Základy
VíceVícejádrový procesor. Dvě nebo více nezávislých jader Pro plné využití. podporovat multihreading
Vývoj Jan Smuda, Petr Zajíc Procesor ALU (aritmeticko logická jednotka) Registry Řadič Jednotky pro práci s plovoucí čárkou Cache Vývoj procesorů Predikce skoku Plánování instrukcí Naráží na fyzická omezení
VíceZákladní deska (1) Parametry procesoru (2) Parametry procesoru (1) Označována také jako mainboard, motherboard
Základní deska (1) Označována také jako mainboard, motherboard Deska plošného spoje tvořící základ celého počítače Zpravidla obsahuje: procesor (mikroprocesor) patici pro numerický koprocesor (resp. osazený
VíceArchitektura počítače
Architektura počítače Výpočetní systém HIERARCHICKÁ STRUKTURA Úroveň aplikačních programů Úroveň obecných funkčních programů Úroveň vyšších programovacích jazyků a prostředí Úroveň základních programovacích
VíceHAL3000 MČR Pro 2016 - tak hrají skuteční profesionálové
HAL3000 Herní sestava MČR Pro 2016 Sestava HAL3000 MČR Pro, se kterou si vychutnáte profesionální herní zážitky. Vypořádejte se všemi soupeři stylově a bez kompromisů. Vaše rychlé reakce a pokyny dokonale
VíceARCHITEKTURA PROCESORŮ
ARCHITEKTURA PROCESORŮ Základními jednotkami, které tvoří vnitřní strukturu procesorů, jsou: řadič, který má za úkol číst operandy (data, čísla) a instrukce z operační paměti, dekódovat je a na základě
VícePovídání na téma. SUPERPOČÍTAČE DNES A ZÍTRA (aneb krátký náhled na SC) 3. 12. 2009 Filip Staněk
Povídání na téma SUPERPOČÍTAČE DNES A ZÍTRA (aneb krátký náhled na SC) 3. 12. 2009 Filip Staněk Co je to vlastně SC? Výpočetní systém, který určuje hranici maximálního možného výpočetního výkonu......v
VícePředstavení a vývoj architektur vektorových procesorů
Představení a vývoj architektur vektorových procesorů Drong Lukáš Dro098 1 Obsah Úvod 3 Historie, současnost 3 Architektura 4 - pipelining 4 - Operace scatter a gather 4 - vektorové registry 4 - Řetězení
VícePovídání na téma SUPERPOČÍTAČE DNES A ZÍTRA
Povídání na téma SUPERPOČÍTAČE DNES A ZÍTRA (aneb krátký náhled na SC) 29. 10. 2015 Filip Staněk Osnova Co jsou to Superpočítače? Výkon SC Architektura Software Algoritmy IT4Innovations Odkazy na další
VíceORGANIZAČNÍ A VÝPOČETNÍ TECHNIKA
Střední škola, Havířov Šumbark, Sýkorova 1/613, příspěvková organizace ORGANIZAČNÍ A VÝPOČETNÍ TECHNIKA PROCESORY Ing. Bouchala Petr 2010 Vytištěno pro vnitřní potřebu školy PROCESORY 1.Úvod základní pojmy
VíceObecné výpočty na GPU v jazyce CUDA. Jiří Filipovič
Obecné výpočty na GPU v jazyce CUDA Jiří Filipovič Obsah přednášky motivace architektura GPU CUDA programovací model jaké algoritmy urychlovat na GPU? optimalizace Motivace Moorův zákon stále platí pro
VíceGPU a CUDA. Historie GPU. Co je GPGPU? Nvidia CUDA
GPU a CUDA Historie GPU Co je GPGPU? Nvidia CUDA Historie GPU GPU = graphics processing unit jde o akcelerátory pro algoritmy v 3D grafice a vizualizaci mnoho z nich původně vzniklo pro účely počítačových
VíceÚvod do architektur personálních počítačů
Úvod do architektur personálních počítačů 1 Cíl přednášky Popsat principy proudového zpracování informace. Popsat principy zřetězeného zpracování instrukcí. Zabývat se způsoby uplatnění tohoto principu
VíceVyužití ICT pro rozvoj klíčových kompetencí CZ.1.07/1.5.00/
Střední odborná škola elektrotechnická, Centrum odborné přípravy Zvolenovská 537, Hluboká nad Vltavou Využití ICT pro rozvoj klíčových kompetencí CZ.1.07/1.5.00/34.0448 CZ.1.07/1.5.00/34.0448 1 Číslo projektu
VíceGPGPU Aplikace GPGPU. Obecné výpočty na grafických procesorech. Jan Vacata
Obecné výpočty na grafických procesorech Motivace Úvod Motivace Technologie 3 GHz Intel Core 2 Extreme QX9650 Výkon: 96 GFLOPS Propustnost paměti: 21 GB/s Orientační cena: 1300 USD NVIDIA GeForce 9800
VíceNvidia CUDA Paralelní programování na GPU
Mendelova univerzita v Brně Provozně ekonomická fakulta Nvidia CUDA Paralelní programování na GPU 2014 O čem to bude... Trocha historie Shadery Unifikace GPGPU CUDA Využití GPGPU GPU a jeho Hardware Nvidia
VíceJan Nekvapil ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická
Jan Nekvapil jan.nekvapil@tiscali.cz ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická Motivace MMX, EMMX, MMX+ 3DNow!, 3DNow!+ SSE SSE2 SSE3 SSSE3 SSE4.2 Závěr 2 Efektivní práce s vektory
VíceNvidia CUDA Paralelní programování na GPU
Mendelova univerzita v Brně Provozně ekonomická fakulta Nvidia CUDA Paralelní programování na GPU 2017 O čem to bude... Trocha historie Shadery Unifikace GPGPU CUDA Využití GPGPU GPU a jeho Hardware Nvidia
VíceArchitektura grafických ip pro Xbox 360 a PS3
Architektura grafických ip pro Xbox 360 a PS3 Jakub Stoszek sto171 VŠB TU Ostrava 12.12.2008 Obsah Grafická karta ATI Xenox (Xbox 360)...3 ip grafické karty ATI Xenos (Xbox 360)...3 Pam grafické karty
VícePro úlohy digitálního zpracování obrazu je příznačný velký objem dat. Doposud ani rychlé počítače s konvenční sériovou architekturou nejsou schopny
Obrazová matice Pro úlohy digitálního zpracování obrazu je příznačný velký objem dat. Doposud ani rychlé počítače s konvenční sériovou architekturou nejsou schopny vykonat instrukce v čase, který odpovídá
VíceNotebooky za výhodné ceny. Počítačové sestavy s prodlouženou zárukou. Základní domácí počítač ASUS X53BR ASUS K53U.
KVĚTNOVÁ AKČNÍ NABÍDKA LSCJABLONEC s.r.o. Notebooky za výhodné ceny 2 roky záruka na notebooky ZÁRUKA společnost s 19 letou tradicí Skříň: REDSTAR MIDI OEM 16 350W ASUS X53BR ASUS K53U Procesor: Intel
VícePokročilé architektury počítačů
Pokročilé architektury počítačů Tutoriál 3 CUDA - GPU Martin Milata Výpočetní model CUDA Organizace kódu Sériově organizovaný kód určený pro CPU Paralelní kód prováděný na GPU Označuje se jako kernel GPU
Více5 790,- červenec 2016. ceník. HCOMP AMD 4020 Trinity. Záruka 2 roky. Příplatky a software: Cena s DPH. Počítač: 4GB DDR3 RAM AMD HD7480 500 GB HDD
Počítač: HCOMP AMD 4020 Trinity 4GB DDR3 RAM 500 GB HDD AMD HD7480 Procesor: AMD A4-X2 4020 Trinity socket FM2 - výkonný dvoujádrový procesor 2x3,2GHz, - vhodný pro hry a multimedia Základní deska: GIGABYTE
VícePaměti EEPROM (1) Paměti EEPROM (2) Paměti Flash (1) Paměti EEPROM (3) Paměti Flash (2) Paměti Flash (3)
Paměti EEPROM (1) EEPROM Electrically EPROM Mají podobné chování jako paměti EPROM, tj. jedná se o statické, energeticky nezávislé paměti, které je možné naprogramovat a později z nich informace vymazat
VíceGPGPU. Jan Faigl. Gerstnerova Laboratoř pro inteligentní rozhodování a řízení České vysoké učení technické v Praze
GPGPU Jan Faigl Gerstnerova Laboratoř pro inteligentní rozhodování a řízení České vysoké učení technické v Praze 8. cvičení katedra kybernetiky, FEL, ČVUT v Praze X33PTE - Programovací techniky GPGPU 1
VíceIntel Itanium. Referát. Vysoká škola báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky Katedra informatiky
Vysoká škola báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky Katedra informatiky Pokročilé architektury počítačů Intel Itanium Referát Tomáš Vojtas (voj209) 2.12.2009 Úvod Itanium
VíceIB109 Návrh a implementace paralelních systémů. Organizace kurzu a úvod. RNDr. Jiří Barnat, Ph.D.
IB109 Návrh a implementace paralelních systémů Organizace kurzu a úvod RNDr. Jiří Barnat, Ph.D. Sekce B109 Návrh a implementace paralelních systémů: Organizace kurzu a úvod str. 2/25 Organizace kurzu Organizace
VíceMultiprocesorové a multipočítačové systémy
Multiprocesorové a multipočítačové systémy Podle způsobu komunikace se paralelní systémy typu MIMD (Multiple Instruction Multiple Data) dělí: prostřednictvím společně sdílené paměti multiprocesorové systémy
VícePROCESORY. Typy procesorů
PROCESORY Procesor (CPU Central Processing Unit) je ústřední výkonnou jednotkou počítače, která čte z paměti instrukce a na jejich základě vykonává program. Primárním úkolem procesoru je řídit činnost
VíceCache paměť - mezipaměť
Cache paměť - mezipaměť 10.přednáška Urychlení přenosu mezi procesorem a hlavní pamětí Hlavní paměť procesoru je typu DRAM a je pomalá. Proto se mezi pomalou hlavní paměť a procesor vkládá menší, ale rychlá
VíceHW počítače co se nalézá uvnitř počítačové skříně
ZVT HW počítače co se nalézá uvnitř počítačové skříně HW vybavení PC Hardware Vnitřní (uvnitř počítačové skříně) Vnější ( ) Základní HW základní jednotka + zobrazovací zařízení + klávesnice + (myš) Vnější
VíceSložení počítače. HARDWARE -veškeré fyzicky existující technické vybavení počítače 12 -MONITOR
Složení počítače Složení počítače HARDWARE -veškeré fyzicky existující technické vybavení počítače 1 -MONITOR 2 -ZÁKLADNÍ DESKA 3 -PROCESOR 4 -ATA/SATA KONEKTORY 5 -OPERAČNÍ PAMĚŤ 6 -ROZŠIŘUJÍÍ SLOTY 7
VíceCUDA J. Sloup a I. Šimeček
CUDA J. Sloup a I. Šimeček xsimecek@fit.cvut.cz Katedra počítačových systémů FIT České vysoké učení technické v Praze Ivan Šimeček, 2011 MI-PAP, LS2010/11, Predn.6 Příprava studijního programu Informatika
VíceOPS Paralelní systémy, seznam pojmů, klasifikace
Moorův zákon (polovina 60. let) : Výpočetní výkon a počet tranzistorů na jeden CPU chip integrovaného obvodu mikroprocesoru se každý jeden až dva roky zdvojnásobí; cena se zmenší na polovinu. Paralelismus
VíceHistorie počítačů v kostce. Marek Kocián, KOC322 Daniel Kapča, KAP077
Historie počítačů v kostce Marek Kocián, KOC322 Daniel Kapča, KAP077 Evoluce počítačů Pravěk Středověk Velká průmyslová revoluce Novověk Budoucnost Počítačový pravěk - Abakus Vznik už v Antice Základní
VíceSběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC
Informační systémy 2 Obsah: Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC ROM RAM Paměti typu CACHE IS2-4 1 Dnešní info: Informační systémy 2 03 Informační systémy
Více5 790,- únor 2016. ceník. HCOMP AMD 4020 Trinity. Záruka 2 roky. Příplatky a software: Cena s DPH. Počítač: 4GB DDR3 RAM AMD HD7480 500 GB HDD
HCOMP AMD 4020 Trinity 4GB DDR3 RAM 500 GB HDD AMD HD7480 Procesor: AMD A4-X2 4020 Trinity socket FM2 - výkonný dvoujádrový procesor 2x3,2GHz, - vhodný pro hry a multimedia Základní deska: GIGABYTE F2A68HM-DS2
VícePokročilá architektura počítačů
Pokročilá architektura počítačů Technologie PhysX Jan Lukáč LUK145 Sony PlayStation 2 Emotion Engine První krok do světa akcelerované fyziky učinily pro mnohé velmi překvapivě herní konzole. Sony Playstation
VíceVlastnosti mikroprocesorů Josef Horálek
Vlastnosti mikroprocesorů Josef Horálek Vlastnosti mikroprocesorů = Vlastnosti jsou dány architekturou mikroprocesoru, kde se používají, jak již bylo řečeno, různé technologie. = Vlastnosti kterými se
VíceHerní PC HAL3000 Artemis výkonný lovec pro nekončící zábavu
HAL3000 Artemis W8 HAL3000 Artemis W8; Herní sestava HAL3000 Artemis představuje ideální volbu pro uživatele, kteří chtějí schopné a kvalitní PC v dostupnější kategorii pro hraní her na vysoké detaily
VícePokročilé architektury počítačů
Vysoká škola báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky Pokročilé architektury počítačů Architektura Intel Larrabee 5.12.2009 Josef Stoklasa STO228 Obsah: 1. Úvod do tajů
VíceGrid jako superpočítač
Grid jako superpočítač Jiří Chudoba Fyzikální ústav AV ČR, v. v. i. Potřeba výkonných počítačů Vědecké aplikace Podnikové aplikace Internetové aplikace Microsoft datová centra Google datová centra 600
VíceParalelní programování
Paralelní programování přednáška 5 Michal Krupka 15. března 2011 Michal Krupka (KI UP) Paralelní programování 15. března 2011 1 / 13 Ještě ke kritickým sekcím Použití v praxi obvykle pomocí zámků (locks)
VíceOperační systémy. Přednáška 1: Úvod
Operační systémy Přednáška 1: Úvod 1 Organizace předmětu Přednášky každé úterý 18:00-19:30 v K1 Přednášející Jan Trdlička email: trdlicka@fel.cvut.z kancelář: K324 Cvičení pondělí, úterý, středa Informace
VícePalit GT 240 512MB. 40nm 96 cores 512MB 128bit GDDR5 550MHz 3400MHz (1700x2) 1340MHz 54.4 (GB/Sec)
Palit GT 240 512MB GPU Osazeno pametí NE5T2400FHD51 GT215 512MB 3400MHz (1700x2) 54.4 (GB/Sec) PCB: 168mm(L) x 112mm(W) základní deska s jedním single-width x16 grafickým slotem GT 240_N2151A_F162 Palit
VíceHardware. Z čeho se skládá počítač
Hardware Z čeho se skládá počítač Základní jednotka (někdy také stanice) obsahuje: výstupní zobrazovací zařízení CRT nebo LCD monitor počítačová myš vlastní počítač obsahující všechny základní i přídavné
Vícetímto vyzývá zájemce k podání nabídky na veřejnou zakázku
Gymnázium a obchodní akademie Mariánské Lázně, příspěvková organizace Karlovarského kraje, zastoupená ředitelem Mgr. Miloslavem Pelcem se sídlem: Ruská 355, 353 69 Mariánské Lázně, Česká republika tel.:
VíceARCHITEKTURA PROCESORŮ
ARCHITEKTURA PROCESORŮ Základními jednotkami, které tvoří vnitřní strukturu procesorů, jsou: řadič, který má za úkol číst operandy (data, čísla) a instrukce z operační paměti, dekódovat je a na základě
VíceDalší aspekty architektur CISC a RISC Aktuálnost obsahu registru
Cíl přednášky: Vysvětlit principy práce s registry v architekturách RISC a CISC, upozornit na rozdíly. Vysvětlit možnosti využívání sad registrů. Zabývat se principy využívanými v procesorech Intel. Zabývat
VíceÚvod do problematiky návrhu počítačových systémů. INP 2008 FIT VUT v Brně
Úvod do problematiky návrhu počítačových systémů INP 2008 FIT VUT v Brně Čím se budeme zabývat Budou nás zejména zajímat jednoprocesorové číslicové počítače: Funkce počítače Struktura propojení funkčních
Více74 590 Kč s DPH HAL3000 TITAN X spoutejte sílu nejvýkonnějších technologií
Počítač HAL3000 TITAN X Nejvýkonnější herní sestava HAL3000 TITAN X. TITAN X je další stupeň k dokonalosti založený na špičkovém výkonu všech kompont a zejména pak jnovější grafické karty NVIDIA TITAN
VíceRoman Výtisk, VYT027
Roman Výtisk, VYT027 Ohlédnutí za architekturou AMD K8 Představení architektury procesoru AMD K10 Přínos Struktura cache IMC, HyperTransport sběrnice Použitá literatura Ohlášení x86-64 architektury 5.
VíceBlue Gene 24. 11. 2009. Vysoká škola báňská-technická univerzita Ostrava. Blue Gene. Karel Chrastina. Úvod. Blue Gene L. Blue Gene P.
Blue Gene Vysoká škola báňská-technická univerzita Ostrava 24. 11. 2009 Obsah prezentace 1 2 3 4 5 Trocha pojmů a historie FLOPS FLoating point Operations Per Second. Někdy se zapisuje jako flop, flop/s.
VíceÚvod do paralelních systémů
Úvod do paralelních systémů 1. část FIT VUT v Brně Obsah Paralelní přístup z pohledu praxe Technologické důvody pro zavedení paralelismu Proč nestačí jedno jádro? Moderní procesory přehled vývoje architektur
VíceOtázka číslo 3 Hardware PC komponent
Otázka číslo 3 Hardware PC komponent Počítačová skříň (case) - Na výšku (tower) x na šířku (desktop) - Drží komponenty pohromadě a v bezpečí (od mechanického poškození či odpojení nějaké součástky za běhu
VíceIntel Pentium D (1) Intel Pentium D (4) Intel Pentium Extreme Edition (1) Intel Pentium D (5)
Intel Pentium D () Založen na mikroarchitektuře NetBurst Vyráběn s frekvencemi, GHz, GHz Systémová sběrnice pracuje s taktem MHz (vyjma procesoru s frekvencí, GHz, u něhož je frekvence systémové sběrnice
VíceDne: Case Coolermaster minitower Elite 342, matx,black,bez zdroje 1. ARCTIC-COOLING F8, ventilátor 80mm 1
Strana 1 raise MINION1 Intel Pentium (DOS - bez systému WIN) 9309067 INTEL Pentium G5400 (3.7GHz, 4MB, 2j, HT) LGA1151 Coffee Lake 54W, VGA UHD 1 2 211,00 9624833 CASE MICROTOWER MC X201 (BLACK/BLACK)
VícePokročilé architektury počítačů
Pokročilé architektury počítačů Přednáška 7 CUDA První paralelní aplikace Martin Milata Obsah SIMD versus SIMT Omezení a HW implementace Způsob zpracování warp skupiny vláken CUDA - pohled programátora
VíceCell broadband engine architecture
Cell broadband engine architecture Semestrální práce z předmětu 31SCS Martin Černý Abstrakt Specifikace procesoru ukazují při zachování nízké pořizovací ceny na velké výpočetní kapacity. Procesor kombinuje
VíceARCHITEKTURA AMD PUMA
VŠB-TU Ostrava Fakulta elektrotechniky a informatiky Katedra informačných technológií ARCHITEKTURA AMD PUMA Martin Raichl, RAI033 21. listopadu 2009 Ján Podracký, POD123 Obsah Architektura AMD PUMA nová
VíceArchitektura procesoru Athlon 64 X2
Architektura procesoru Athlon 64 X2 Athlon 64 X2 je prvním dvoujádrovým procesorem od firmy AMD, určeným pro domácí využití. Tento procesor byl papírově oznámen 21.dubna 2005. V tento den byly oficiálně
VíceDne: Case Coolermaster minitower Elite 342, matx,black,bez zdroje 1 Seasonic zdroj (Energy knight) SS-400ET 400W BRONZE80PLUS OEM 1
Strana 1 raise MINION1 Intel Pentium (DOS - bez systému WIN) Zakázková sestava počítače raise 1 9309067 INTEL Pentium G5400 (3.7GHz, 4MB, 2j, HT) LGA1151 Coffee Lake 54W, VGA UHD 1 2 048,00 9624833 CASE
VíceDne: Case Coolermaster minitower Elite 342, matx,black,bez zdroje 1 Seasonic zdroj (Energy knight) SS-400ET 400W BRONZE80PLUS OEM 1
Strana 1 raise MINION1 Intel Pentium (DOS - bez systému WIN) Zakázková sestava počítače raise 1 9309067 INTEL Pentium G5400 (3.7GHz, 4MB, 2j, HT) LGA1151 Coffee Lake 54W, VGA UHD 1 2 048,00 9624833 CASE
VíceIntel Pentium D (1) Intel Pentium D (4) Intel Pentium Extreme Edition (1) Intel Pentium D (5)
Intel Pentium D () Založen na mikroarchitektuře NetBurst Vyráběn s frekvencemi, GHz, GHz Systémová sběrnice pracuje s taktem MHz (vyjma procesoru s frekvencí, GHz, u něhož je frekvence systémové sběrnice
VíceCHARAKTERISTIKY MODELŮ PC
CHARAKTERISTIKY MODELŮ PC Historie: červenec 1980 skupina 12 pracovníků firmy IBM byla pověřena vývojem osobního počítače 12. srpna 1981 byl počítač veřejně prezentován do konce r. 1983 400 000 prodaných
Více5 790,- prosinec 2014. ceník. HCOMP AMD 4020 Trinity. Záruka 2 roky. Příplatky a software: Cena s DPH. Počítač: 4GB DDR3 RAM AMD HD7480 500 GB HDD
HCOMP AMD 4020 Trinity 4GB DDR3 RAM 500 GB HDD AMD HD7480 Procesor: AMD A4-X2 4020 Trinity socket FM2 - výkonný dvoujádrový procesor 2x3,2GHz, - vhodný pro hry a multimedia Základní deska: ASUS A88XM -
VíceKarel Johanovský Michal Bílek SPŠ-JIA GRAFICKÉ KARTY
Karel Johanovský Michal Bílek SPŠ-JIA GRAFICKÉ KARTY Úvod Grafická karta se stará o grafický výstup na monitor, TV obrazovku či jinou zobrazovací jednotku. V případě, že grafická karta obsahuje tzv. VIVO
VíceDne: Case Coolermaster minitower Elite 342, matx,black,bez zdroje 1 Seasonic zdroj (Energy knight) SS-400ET 400W BRONZE80PLUS OEM 1
Strana 1 raise MINION1 Intel Pentium (DOS - bez systému WIN) Zakázková sestava počítače raise 1 9309067 INTEL Pentium G5400 (3.7GHz, 4MB, 2j, HT) LGA1151 Coffee Lake 54W, VGA UHD 1 2 048,00 9624833 CASE
Více