Architektura Intel Nehalem

Podobné dokumenty
Architektura Intel Nehalem

Roman Výtisk, VYT027

Ro R dina procesor pr ů Int In e t l Nehalem Šmída Mojmír, SMI108 PAP PA 2009

Volitelný počet jader

Intel Microarchitecture Nehalem

Referát (pokročilé architektury počítačů)

Rodina Intel Nehalem:

Architektura Intel Atom

Vlastnosti mikroprocesorů Josef Horálek

Pokročilé architektury počítačů

Vícejádrový procesor. Dvě nebo více nezávislých jader Pro plné využití. podporovat multihreading

Procesor Intel Pentium (1) Procesor Intel Pentium (3) Procesor Intel Pentium Pro (1) Procesor Intel Pentium (2)

2.8 Procesory. Střední průmyslová škola strojnická Vsetín. Ing. Martin Baričák. Název šablony Název DUMu. Předmět Druh učebního materiálu

Vysoká škola báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky. referát do předmětu: Pokročilé architektury počítačů.

Využití ICT pro rozvoj klíčových kompetencí CZ.1.07/1.5.00/

Procesory. Autor: Kulhánek Zdeněk

PROCESOR. Typy procesorů

Výkonnost mikroprocesoru ovlivňují nejvíce dvě hlediska - architektura mikroprocesoru a tzv. taktovací frekvence procesoru.

Využití ICT pro rozvoj klíčových kompetencí CZ.1.07/1.5.00/

Intel Centrino 2 - Úvod a procesory

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

architektura mostů severní / jižní most (angl. north / south bridge) 1. Čipové sady s architekturou severního / jižního mostu

Pokročilé architektury počítačů

Procesor. Hardware - komponenty počítačů Procesory

Základní deska (mainboard)

ARCHITEKTURA PROCESORŮ

ZÁKLADNÍ DESKA ASUS PRIME X370-PRO ZÁKLADNÍ DESKA, AMD X370, AM4, 4X DIMM DDR4, 1X M.2, ATX

Charakteristika dalších verzí procesorů v PC

Pokročilé architektury počítačů

ARCHITEKTURA PROCESORŮ

Intel (2) Intel (1) Intel (3) Intel (4) Intel (6) Intel (5) Nezřetězené zpracování instrukcí:

Jak se procesory vyrábí

CHARAKTERISTIKA MODERNÍCH PENTIÍ. Flynnova klasifikace paralelních systémů

Charakteristika dalších verzí procesorů Pentium

Platforma Intel Centrino 2

Grafické karty s podporou DirectX 11 Quynh Trang Dao Dao007

Základní deska (mainboard)

Základní deska (1) Parametry procesoru (2) Parametry procesoru (1) Označována také jako mainboard, motherboard

Intel Pentium D (1) Intel Pentium D (4) Intel Pentium Extreme Edition (1) Intel Pentium D (5)

Základní deska (motherboard, mainboard)

Procesor. Procesor FPU ALU. Řadič mikrokód

Základní jednotka procvičování

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

Základy informatiky. 2. Přednáška HW. Lenka Carr Motyčková. February 22, 2011 Základy informatiky 2

Intel Pentium D (1) Intel Pentium D (4) Intel Pentium Extreme Edition (1) Intel Pentium D (5)

SOU Valašské Klobouky. VY_32_INOVACE_01_8 IKT Procesory, Intel, AMD, Architektura x86-64, AMR. Mgr. Radomír Soural

Identifikátor materiálu: ICT-1-08

Xbox 360 Cpu = IBM Xenon

Úvod do architektur personálních počítačů

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

Představení procesorů od firmy Tilera a jejich architektura

PROCESOR. Rozdělení procesorů

OPS Paralelní systémy, seznam pojmů, klasifikace

VÝUKOVÝ MATERIÁL. 3. ročník učebního oboru Elektrikář Přílohy. bez příloh. Identifikační údaje školy

Historie a vývoj Intel Atom

INFORMAČNÍ A KOMUNIKAČNÍ TECHNOLOGIE

Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

Procesory nvidia Tegra

VŠB Technická univerzita Ostrava Fakulta Elektrotechniky a informatiky. Představení a vývoj architektury Intel Atom

Přehled paralelních architektur. Dělení paralelních architektur Flynnova taxonomie Komunikační modely paralelních architektur

HW počítače co se nalézá uvnitř počítačové skříně

Složení počítače. HARDWARE -veškeré fyzicky existující technické vybavení počítače 12 -MONITOR

ARCHITEKTURA AMD PUMA

Platforma Intel Centrino 2

Cache paměť - mezipaměť

Blue Gene Vysoká škola báňská-technická univerzita Ostrava. Blue Gene. Karel Chrastina. Úvod. Blue Gene L. Blue Gene P.

5. Procesory Intel: Vývojová řada, základní rysy a vnitřní architektura.

Základní deska (1) Označována také jako mainboard, motherboard. Deska plošného spoje tvořící základ celého počítače Zpravidla obsahuje:

Provádění instrukcí. procesorem. Základní model

ORGANIZAČNÍ A VÝPOČETNÍ TECHNIKA

Informační a komunikační technologie

PV109: Historie a vývojové trendy ve VT

Intel Itanium. Referát. Vysoká škola báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky Katedra informatiky

Průvodce Chipu po CPU a GPU

Výstavba PC. Vývoj trhu osobních počítačů

5 990,- září ceník. HCOMP AMD 4020 Trinity. Záruka 2 roky. Příplatky a software: Cena s DPH. Počítač: 4GB DDR3 RAM AMD HD GB HDD

Sestava HAL3000 Prodigy profesionální digitální zábava až ve 4K

MIKROPROCESOR. (c) Ing. Josef Varačka. Title: XI 28 11:40 (1 of 8)

Paměti EEPROM (1) Paměti EEPROM (2) Paměti Flash (1) Paměti EEPROM (3) Paměti Flash (2) Paměti Flash (3)

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

Paměti Josef Horálek

5 990,- listopad ceník. HCOMP AMD 4020 Trinity. Záruka 2 roky. Příplatky a software: Cena s DPH. Počítač: 4GB DDR3 RAM AMD HD GB HDD

VÝUKOVÝ MATERIÁL. 3. ročník učebního oboru Elektrikář Přílohy. bez příloh. Identifikační údaje školy

Paměťové prvky. ITP Technika personálních počítačů. Zdeněk Kotásek Marcela Šimková Pavel Bartoš

5 590,- říjen ceník. HCOMP AMD 4020 Trinity. Záruka 2 roky. Příplatky a software: Cena s DPH. Počítač: Nová nižší cena!

Pravda leží v poušti odtamtud totiž

Technické prostředky počítačové techniky

Historie procesoru Pentium a jeho konkurence. Rostislav Kreisinger a Kamil Perutka

Mezipaměti počítače. L2 cache. L3 cache

Sluchu zapřisáhlých příznivců AMD to

PŘEDSTAVENÍ GRAFICKÉHO PROCESORU NVIDIA G200

Fakulta elektrotechnická. kompatibilních. Studijní program: Elektrotechnika a informatika strukturovaný bakalářský

Cache paměti (2) Cache paměti (1) Cache paměti (3) Cache paměti (4) Cache paměti (6) Cache paměti (5) Cache paměť:

AGP - Accelerated Graphics Port

5 990,- leden ceník. HCOMP AMD 4020 Trinity. Záruka 2 roky. Příplatky a software: Cena s DPH. Počítač: 4GB DDR3 RAM AMD HD GB HDD

Zobrazovací a zvuková soustava počítače

ARCHITEKTURA AMD PUMA

Paralelní výpočty ve finančnictví

Silný výkon dvoujádrové architektury pro podnikání dnes i zítra

Transkript:

VŠB-TUO FEI Architektura Intel Nehalem Pokročilé architektury PC Zdeněk Ryška (rys093) 5.11.2009

Procesor Intel Core i7 kódovým jménem nazývaný Nehalem je první nativní čtyřjádrový procesor firmy Intel. Je součástí nového modelu Tic-Toc, dle kterého vydá Intel každé 2 roky novou architekturu. Změny v tomto případě nebyly pouze kosmetické. Architektura procesorů rodiny Nehalem je samozřejmě postavena na velmi úspěšné architektuře Intel Core přičemž byly odstraněny hlavní její nedostatky. Došlo k nahrazení FSB sběrnice, která byla bezesporu brzdou pro moderní procesory a hlavně při použití ve víceprocesorových systémech způsobovala značné omezení výkonu. FSB sběrnice byla nahrazena sběrnicí QPI (QuickPath inteface)u této technologie je komunikace vedena bodově (point-to-point) není tedy sdílená všemi zařízeními jako tomu bylo u FSB. Výkon QPI sběrnice je od 4,8 do GT/s na linku. Tento fakt se projeví hlavně v multiprocesorových systémech, kde bude efektivnější komunikace CPU a čipsetu. 2

Dále byl do čipu integrován i paměťový řadič, který zvýšil prostupnost a snížil latenci operačních pamětí. Intel Nehalem v zatím nejvyšší verzi i7 obsahuje 3-kanálový řadič pamětí typu DDR3. Díky tomuto řadiči dosahuje procesor Intel Nehalem až 4x vyšší propustnost oproti staršímu jádru Harpertown. Také platí, že přidáním procesorů u víceprocesorových systémů se zvyšuje úměrně i výkon paměťového systému. Bylo zapracováno i na modulárnosti čipu lze tedy velice snadno rozšířit přidáním dalších jader, zvětšit paměť cache případně doplnit integrovanou grafickou kartou přímo do pouzdra procesoru (GPU bude přidávána do procesorů řady i5 a i3). V dnešní době je velmi diskutovanou věcí spotřeba počítače jako celku a ní se velkou měrou podílí i CPU v dané sestavě obsažené. Intel proto do Nehalemů umístil speciální čip (PCU), který řídí úsporné funkce jako je podtaktování či úplné vypínání jader procesoru a také paměti cache. Z tohoto důvodu mají tyto procesory velmi nízkou spotřebu v idle režimu. V zatíženém stavu už spotřeba bohužel tak 3

nízká není a je Intelem nastavena TDP < 130W. Tato hodnota dle prvních testů značně klesne u nadcházejících procesorů vyrobených 32nm (kódové jméno Westmere) výrobním procesem. Se změnou architektury přišla i změna socketu socket LGA775 byl nahrazen socketem LGA1366 pro high-end procesory i7 a paticí LGA 1160 pro střední a nižší střední třídu core i5 a i3. Změny byly provedeny i na cache pamětech procesoru nyní má procesor L1 cache pro každé jádro 64kb dále obsahuje L2 cache do 256kb na jádro a poté sdílenou L3 cache pro všechna jádra. Pozměněn byl i Front-end, který slouží k získávání a dekódování instrukcí. Intel Nehalem stejně jako architektura Core zpracovává microops, což můžeme přirovnat k nejzákladnějším povelům, na které je každá x86 instrukce rozložena. Nehalem má stejně jako Core architektura 4 instrukční dekodéry (3 jednoduché a jeden komplexní). Fúzování Makroinstrukcí bylo představeno již s rodinou procesorů Intel Core 2 a stejně tak Loop Stream Detector. Nehalem podědil fúzování makroinstrukcí po Core 2 a dále jej rozšiřuje. Při zfúzování makroinstrukcí dojde na dekódování na microop, jako by se jednalo o jedinou instrukci tento postup přináší vyšší výkon a vyšší energetickou účinnost. Také přibylo fúzování i v 64bit režimu (Core 2 zvládá pouze 32bit). Dále byl vylepšen Loop Stream Detector (LSD), ten umožňuje odhalit cyklus v právě zpracovávaném kódu a zamezit opakovanému dekódování stejných instrukcí. LSD má tedy hlavní zásluhu na výkon v průběhu cyklu a vypíná části procesoru, které nejsou aktuálně potřeba. Tento postup má příznivý dopad i na spotřebu procesoru. 4

Kompletně byla přepracována i predikce větvení a předvídání skoku. Obecně platí, že čím je vyšší přesnost predikce tím má daný procesor vyšší výkon i nižší spotřebu nemusí zahazovat spočítané výsledky a počítat odlišní instrukce. V Nehalemu tuto funkci obstarává L2 Branch Predictor. Procesory dnešní architektury jsou celkem často v IDLE režimu. Nehalemu se snaží držet výpočetní jednotky v činnosti, a proto jsou zde rozšířeny Load a Store Buffery a Reservation Station (ta dodává informace pro výpočetní část, ukládá a čte data a tak dále). Navýšen je dále paralelismus a zvětšen počet microops, které procesor zvládne. Dothan zvládl 64, Merom 96 a u Nehalemu došlo k dalšímu navýšení, na 128 microops. U procesorů rodiny Nehalem byla obnovena funkce známá z procesorů Intel Pentium 4, které měli od jádra Northwood funkci zvanou HyperTheading. Tato funkce umožňovala, že se jedno fyzické jádro procesory tvářilo jako 2 logické jednotky a bylo schopné zpracovat 2 instrukce naráz. Tato technologie se jmenuje SMT (Simultaneous Multi-Threading). Operační systém tedy v případě 4-jádrového procesoru detekuje procesor s 8mi jádry. Touto technologií by se měli využít nevyžité prostředky procesoru a navýšit výkon o cca 20-30%. Samozřejmě musí být provozovány aplikace určené pro vícejádrové procesory (například vícevláknové aplikace, dekódování videa...). V aplikacích neoptimalizovaných pro vícejádrové procesory navýšení výkonu nebude a je možný i mírný propad výkonu oproti procesoru s vypnutou technologií SMT. 5

Právě pro zvýšení výkonu u aplikací náročných na výkon jednoho jádra uvedl Intel s procesory Nehalem technologii TurboBoost, která přetaktuje jedno jádro procesoru v případě jeho silného zatížení a zároveň nízkého vytížení ostatních jader. To vše při zachování předepsaného TDP. Přetaktování u procesorů i7 probíhá ve 2 krocích -> nejdříve o 133MHz a poté o 266MHz u procesorů i5 jsou tyto hodnoty vyšší. V dnešní době je velmi oblíbená virtualizace. Proto byly značně upraveny SSE instrukce a aktuálně jsou ve verzi SSE 4.2. Zvýšení výkonu virtualizovaného stroje má být až o 40%. 6

Intel používá k výrobě procesorů Nehalem výrobní technologii 45nm s High-k a technologií kovových hradel. Tato technologie je stejná jako u procesorů Core 2 u posledního jádra (Perin). Jako novinka se představilo použití 9. vrstvy měděných mezispojů pro maximální snížení odporu. Dále použitá technologie Power Gate efektivně odděluje a vypíná jádra procesoru a tím snižuje spotřebu. První uvedené procesory jsou core i7 a to o taktech 2,66, 2,93, 3,2 TDP je u všech tří shodně na 130W. 7

Výkon procesorů Core i7: 8

9

Z přiložených grafů je jasně vidět, že ve výkonu se jedná o velmi výrazný skok. Procesor je bezkonkurenčně nejrychlejší na trhu a AMD bohužel ještě relativně dlouhou dobu nebude mít proti tomuto procesoru výkostně alespoň srovnatelnou alternativu. Zatím architekturu nehalem brzdí od masového rozšíření hlavně cena celé platformy, která je značně vysoká a to nejen z důvodu vysoké 10

ceny procesoru, ale i nutnosti pořídit si tři kusy kvalitních operačních pamětí DDR3 pro využití paměťového řadiče a také základní desky jsou pro tento procesor velmi nákladné. Cenově výhodná alternativa je v podobě procesorů i5, kde celá platforma vychází značně výhodněji 2kanálový řadič a levnější základní desky. Procesory i5 oproti i7 nemají zásadní omezení schází jim STM a pouze 2kanálový řadič DDR3 pamětí. Dle mého názoru se Intelu architektura Nehalem velmi povedla a hlavně zmíněná verze i5 je velmi sympatická v poměru cena výkon a také má nižší spotřebu. 11

Použité zdroje: http://www.svethardware.cz/art_doc-9b124c440894e932c12574f40033d2b8.html http://en.wikipedia.org/wiki/intel_core_i7 http://www.cdr.cz/a/23871 http://pctuning.tyden.cz/index.php?option=com_content&task=view&id=9944&itemid=67 12