ARCHITEKTURA PROCESORŮ



Podobné dokumenty
ARCHITEKTURA PROCESORŮ

2.8 Procesory. Střední průmyslová škola strojnická Vsetín. Ing. Martin Baričák. Název šablony Název DUMu. Předmět Druh učebního materiálu

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

PROCESOR. Typy procesorů

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

Intel (2) Intel (1) Intel (3) Intel (4) Intel (6) Intel (5) Nezřetězené zpracování instrukcí:

Architektura Intel Atom

Procesor Intel Pentium (1) Procesor Intel Pentium (3) Procesor Intel Pentium Pro (1) Procesor Intel Pentium (2)

Výkonnost mikroprocesoru ovlivňují nejvíce dvě hlediska - architektura mikroprocesoru a tzv. taktovací frekvence procesoru.

PROCESOR. Rozdělení procesorů

Vlastnosti mikroprocesorů Josef Horálek

Využití ICT pro rozvoj klíčových kompetencí CZ.1.07/1.5.00/

Základy informatiky. 2. Přednáška HW. Lenka Carr Motyčková. February 22, 2011 Základy informatiky 2

Představení a vývoj architektur vektorových procesorů

Procesory. Autor: Kulhánek Zdeněk

Vícejádrový procesor. Dvě nebo více nezávislých jader Pro plné využití. podporovat multihreading

ORGANIZAČNÍ A VÝPOČETNÍ TECHNIKA

PROCESORY. Typy procesorů

Cache paměť - mezipaměť

Využití ICT pro rozvoj klíčových kompetencí CZ.1.07/1.5.00/

Ro R dina procesor pr ů Int In e t l Nehalem Šmída Mojmír, SMI108 PAP PA 2009

INFORMAČNÍ A KOMUNIKAČNÍ TECHNOLOGIE

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

Procesor. Hardware - komponenty počítačů Procesory

Základní deska (1) Parametry procesoru (2) Parametry procesoru (1) Označována také jako mainboard, motherboard

Pohled do nitra mikroprocesoru Josef Horálek

Jan Nekvapil ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická

architektura mostů severní / jižní most (angl. north / south bridge) 1. Čipové sady s architekturou severního / jižního mostu

CHARAKTERISTIKA MODERNÍCH PENTIÍ. Flynnova klasifikace paralelních systémů

Procesor EU peníze středním školám Didaktický učební materiál

Základní deska (1) Označována také jako mainboard, motherboard. Deska plošného spoje tvořící základ celého počítače Zpravidla obsahuje:

Hardware - komponenty počítačů Von Neumannova koncepce počítače. Von Neumannova koncepce počítače

Roman Výtisk, VYT027

Pokročilé architektury počítačů

Paměti. Paměť je zařízení, které slouží k ukládání programů a dat, s nimiž počítač pracuje

Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115

Charakteristika dalších verzí procesorů Pentium

Úvod do architektur personálních počítačů

OPS Paralelní systémy, seznam pojmů, klasifikace

Pokročilé architektury počítačů

Procesor. Procesor FPU ALU. Řadič mikrokód

Přednášky o výpočetní technice. Hardware teoreticky. Adam Dominec 2010

Intel Microarchitecture Nehalem

Hardware. Příklad převodu čísla: =1*32+0*16+0*8+1*4+0*2+1*1= Převod z dvojkové na desítkovou Sčítání ve dvojkové soustavě

Pokročilé architektury počítačů

Jak do počítače. aneb. Co je vlastně uvnitř

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

MIKROPROCESOR. (c) Ing. Josef Varačka. Title: XI 28 11:40 (1 of 8)

Identifikátor materiálu: ICT-1-08

VÝUKOVÝ MATERIÁL. 3. ročník učebního oboru Elektrikář Přílohy. bez příloh. Identifikační údaje školy

Základní pojmy informačních technologií

Informační a komunikační technologie

Architektura Intel Nehalem

Semestrální práce z předmětu Speciální číslicové systémy X31SCS

Hardware = technické (hmatatelné, materiální) vybavení počítače Rozdělení dílů (komponent) dle umístění: vně skříně počítače)

Intel Pentium D (1) Intel Pentium D (4) Intel Pentium Extreme Edition (1) Intel Pentium D (5)

Profilová část maturitní zkoušky 2014/2015

Profilová část maturitní zkoušky 2015/2016

Přehled paralelních architektur. Dělení paralelních architektur Flynnova taxonomie Komunikační modely paralelních architektur

Sběrnicová architektura POT POT. Jednotlivé subsystémy počítače jsou propojeny sběrnicí, po které se přenáší data oběma směry.

AGP - Accelerated Graphics Port

Referát (pokročilé architektury počítačů)

SOU Valašské Klobouky. VY_32_INOVACE_01_8 IKT Procesory, Intel, AMD, Architektura x86-64, AMR. Mgr. Radomír Soural

Základní jednotka procvičování

Intel Pentium D (1) Intel Pentium D (4) Intel Pentium Extreme Edition (1) Intel Pentium D (5)

Činnost CPU. IMTEE Přednáška č. 2. Několik úrovní abstrakce od obvodů CPU: Hodinový cyklus fáze strojový cyklus instrukční cyklus

Úvod do problematiky návrhu počítačových systémů. INP 2008 FIT VUT v Brně

Architektura procesorů PC shrnutí pojmů

ZÁKLADY PROGRAMOVÁNÍ. Mgr. Vladislav BEDNÁŘ /14

logický obvod instruk ní sadou program napsaný v mikroinstrukcích RISC CISC registry adresovacích mechanism Instruk ní sada mikroprocesoru

Architektura počítače

VÝUKOVÝ MATERIÁL. 3. ročník učebního oboru Elektrikář Přílohy. bez příloh. Identifikační údaje školy

ZÁKLADNÍ DESKA ASUS PRIME X370-PRO ZÁKLADNÍ DESKA, AMD X370, AM4, 4X DIMM DDR4, 1X M.2, ATX

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

Vysoká škola báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky. referát do předmětu: Pokročilé architektury počítačů.

Volitelný počet jader

Charakteristika dalších verzí procesorů v PC

Výstavba PC. Vývoj trhu osobních počítačů

Princip funkce počítače

Jak se procesory vyrábí

2.9 Vnitřní paměti. Střední průmyslová škola strojnická Vsetín. Ing. Martin Baričák. Název šablony Název DUMu. Předmět Druh učebního materiálu

Technické prostředky počítačové techniky

Mezipaměti počítače. L2 cache. L3 cache

Úvod do architektur personálních počítačů

VÝUKOVÝ MATERIÁL. 3. ročník učebního oboru Elektrikář Přílohy. bez příloh. Identifikační údaje školy

Paměti Josef Horálek

Paměťový podsystém počítače

Informatika ročník

ORGANIZAČNÍ A VÝPOČETNÍ TECHNIKA

HISTORIE VÝPOČETNÍ TECHNIKY. Od abakusu k PC

Struktura a architektura počítačů (BI-SAP) 10

Cache paměti (2) Cache paměti (1) Cache paměti (3) Cache paměti (4) Cache paměti (6) Cache paměti (5) Cache paměť:

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

Historie procesoru Pentium a jeho konkurence. Rostislav Kreisinger a Kamil Perutka

KAPITOLA 1 - ZÁKLADNÍ POJMY INFORMAČNÍCH A KOMUNIKAČNÍCH TECHNOLOGIÍ

Cache paměti (1) Cache paměť: V dnešních počítačích se běžně používají dva, popř. tři druhy cache pamětí:

Intel Procesor a jeho konstrukce. Vývojové typy, činnost procesoru

Vstupně - výstupní moduly

CPU

Řízení IO přenosů DMA řadičem

Transkript:

ARCHITEKTURA PROCESORŮ Základními jednotkami, které tvoří vnitřní strukturu procesorů, jsou: řadič, který má za úkol číst operandy (data, čísla) a instrukce z operační paměti, dekódovat je a na základě provádění mikrokódu, generovat řídící signály, tedy řídit činnost ostatních jednotek v procesoru a počítači. ALU, mající za úkol na základě řídících signálů z řadiče CPU provádět matematické a logické operace. Pro práci s reálnými čísly s plovoucí (pohyblivou) řádovou čárkou jsou v procesoru integrovány výpočetní jednotky FPU (Floating Point Unit). Nejstarší procesory řady x86 (8086, 80186, 80286, 80386) obsahovaly pouze jednotku ALU, která pracovala jak s celými, tak reálnými čísly s pohyblivou řádovou čárkou. Pro zvýšení výkonu byla na základní desce patice pro připojení tzv. matematického koprocesoru, který se využíval pro aritmetické operace s reálnými čísly s pohyblivou řádovou čárkou (zvýšení výpočetního výkonu). Tento specializovaný procesor nesl označení podobné hlavnímu procesoru (např. Intel 80287). ALU a FPU nazýváme výkonné jednotky (Execution Units) registry, jsou rychlé statické paměti typu RAM (čtení/zápis) malé kapacity uvnitř jádra procesoru, které slouží k uchování aktuálních instrukcí, adres v paměti, operandů, mezivýsledků a výsledků matematických a logických operací. Ve vnitřní struktuře současných procesorů však existují další jednotky podporující nové technologie pro práci s instrukcemi a daty, jejichž úkolem je co možná nejoptimálněji zvýšit jeho operační rychlost a stabilitu bez nutnosti použít hrubé síly, tedy zvyšovat základní pracovní kmitočet a napětí jádra procesoru. Vždy je nutná podpora operačního systému a aplikace! Veškeré obvody uvnitř procesoru optimalizující práci s instrukcemi a daty či snižující spotřebu elektrické energie a vyzářené ztrátové teplo pak tvoří tzv. architekturu (resp. mikroarchitekturu) procesoru, určující jeho vlastnosti. Přehled architektur dvou významných výrobců procesorů pro osobní a mobilní počítače (rok 2013): Firma INTEL: Skalární architektura: 8088, 8086, 80286, 80386, 80486 Superskalární architektura: Pentium, Pentium Pro, Pentium MMX, Pentium II, Pentium III, Celeron NetBurst hyperskalární architektura (Pentium 4, Penium D, Xeon, Celeron) Core (Core Duo, Core 2 Duo, Core 2 Extreme, Core 2 Quad, Celeron) Atom (procesory optimalizované výhradně na co nejnižší spotřebu elektrické energie) Nehalem (1. generace procesorů řady Core i7, Core i5, Core i3) Sandy Bridge (2. generace procesorů řady Core i7, Core i5, Core i3) Ivy Bridge (3. generace procesorů řady Core i7, Core i5, Core i3) Haswell (4. generace procesorů řady Core i7, Core i5, Core i3) Firma AMD: Am286, Am386, Am486 AMD K5, AMD K6, AMD K6-2, K6-III AMD K7 (Athlon, Athlon XP, Athlon MP + odlehčené verze Duron, Sempron) AMD K8 (Athlon 64, athlon 64 X2, Turion 64, Turion 64 X2, Sempron) AMD K10 (4-jádrové procesory Phenom, Opteron) AMD K11 (architektura vícejádrových APU 1 ) 1 APU spojení CPU a GPU. GPU se využívá na zpracování obrazových dat a jako rychlá výpočetní jednotka

Obecně (bez ohledu na výrobce procesoru) jsou architektury rozděleny podle šířky datové a adresové sběrnice. Platí, že čím větší šířka sběrnice, tím je schopen přenášet větší objem dat za jednotku času (vyšší rychlost), umožňuje pracovat s většími čísly, resp. větší přesností čísel a umožňuje adresovat větší rozsah operační paměti. Zjednodušeně se dá říci, že např. 8 bitový procesor umí přímo pracovat s čísly od 0 do 255 (tj. 0 až 2 8-1) v jednom kroku, 16 bitový s čísly od 0 do 65535 (tj. 0 až 2 16-1), atd. Operace s většími čísly musí být rozděleny do několika kroků (hodinových cyklů). Podle šířky datové sběrnice můžeme současné procesory pro osobní počítače rozdělit na 32 a 64 bitové. Skalární architektury procesorů Procesor skalární architektury je složen z více funkčních bloků pro zpracování instrukce, které pracují samostatně. Umožňuje tzv. pipelining (pipeline 2 = datovod), neboli zřetězené zpracování instrukcí. Základní myšlenkou je rozdělení zpracování jedné instrukce mezi různé části procesoru a tím i dosažení možnosti zpracovávat více instrukcí najednou. Zpracování instrukce se nejčastěji sestává z těchto kroků (stupeň pipeline): 1. výpočet adresy místa v operační paměti, 2. načtení instrukce z dané adresy v operační paměti, 3. dekódování instrukce (nalezení mikrokódu reprezentující instrukci v paměti ROM), 4. provedení výpočtů v ALU / FPU, 5. zápis výsledku do registrů. Jelikož se zpracování jedné instrukce sestává z několika kroků, které řeší samostatný obvod, lze zpracování další instrukce zahájit dříve než je předchozí instrukce dokončena (např. zatímco se jedna instrukce dekóduje, další instrukce může být načtena z paměti do registru instrukcí, atd.). Analogie: Výrobní linka v automobilce, na které je v jednom okamžiku sestavováno více aut najednou, každé z nich se však nachází v jiné fázi kompletace. Pokud bychom museli čekat na dokončení výroby (úplné kompletace) jednoho auta, před zahájením výroby druhého, nastaly by ve výrobě velké prodlevy - některé části výrobní linky by byly zbytečně nevyužity (velmi pomalý výrobní proces!). Čím více má pipeline stupňů, tím je efektivnější zpracování instrukcí (tím více instrukcí lze rozpracovat). V případě, že dojde v programu ke skoku, musí se celá pipeline (fronta instrukcí) vyprázdnit a načíst s dlouhým zdržením instrukce nové. 2 pipeline = souhrn prováděcích jednotek uvnitř procesoru umožňujících zpracovat instrukci (viz blokové schéma CPU)

Vybrané technologie současných architektur procesorů 1. Vyrovnávací paměť CACHE (od skalární architektury procesory 80486) Statická paměť RAM, která urychluje komunikaci procesoru s operační pamětí. Jde v o velmi rychlý paměťový zásobník, určený k dočasnému ukládání dat a instrukcí, které bude procesor s největší pravděpodobností požadovat. Vyrovnávací paměť procesoru bývá obvykle dvoustupňová nebo třístupňová (stupně L1, L2, L3). První stupeň (L1) paměti CACHE má malou kapacitu (řádově desítky kb), je přímo součástí procesoru a je stejně rychlá jako vlastní procesor. Dělí se na instrukční a datovou CACHE. Slouží k ukládání právě zpracovávaných instrukcí a dat v procesoru. Druhý a třetí stupeň (L2, L3) paměti CACHE je pomalejší, ale s větší kapacitou (řádově jednotky MB), je mezi L1 CACHE a operační pamětí (dnes se již umisťuje do pouzdra společně s jádrem procesoru). Obsahuje data a instrukce, které procesor aktuálně nepoužívá, ale pravděpodobně bude potřebovat. Princip vyrovnávací paměti L2 CACHE: Vyrovnávací paměť L2 je fyzicky umístěna na datové sběrnici mezi procesorem a operační pamětí. Paměť je rozdělena do bloků o konstantní velikosti, které se nazývají CACHE line. Operační paměť je taktéž rozdělena na bloky o stejné velikosti, těchto bloků je však mnohem více, než bloků ve vyrovnávací paměti CACHE. Z tohoto vyplývá, že zdaleka ne všechny bloky operační paměti mohou být obsaženy ve vyrovnávací paměti. Na strategii výběru bloků je závislá efektivita vyrovnávací paměti. Požaduje-li procesor načíst určitý obsah paměťové buňky na určité adrese v operační paměti (může se jednat jak o instrukce, tak o zpracovávaná data), provede se kontrola, zda se tato data nachází ve vyrovnávací paměti. Pokud ano, jsou data z vyrovnávací paměti přečtena a předána procesoru mnohem rychleji, než v případě čtení dat přímo z operační paměti. Ovšem ve chvíli, kdy potřebná data nejsou nalezena ve vyrovnávací paměti, musí do ní být přenesena. Dojde k uvolnění bloku ve vyrovnávací paměti a data jsou do tohoto bloku načtena (přenáší se vždy celý blok) a dále se pokračuje v přenosu do procesoru. U vícejádrových architektur procesorů je CACHE paměť poslední úrovně (L2, resp. L3) společná všem procesorovým jádrům.

2. Rozšíření instrukční sady procesoru (od superskalární architektury procesory Pentium MMX) Od procesoru Pentium MMX jsou k základní instrukční sadě procesoru přidány nové instrukce využívající techniku SIMD (Single Instruction Multiple Data), která dovoluje zpracovat více operandů (dat, čísel) během jedné instrukce. SISD instrukce (Single Instruction Single Data): 1. mikroinstrukce: 5 * 2 = 10 2. mikroinstrukce: 5 * 3 = 15 3. mikroinstrukce: 5 * 1 = 5 4. mikroinstrukce: 5 * 8 = 40 SIMD instrukce (Single Instruction Multiple Data): 1. mikroinstrukce: 5 * (2; 3; 1; 8) = (10; 15; 5; 40) Klasický způsob výpočtu vyžaduje čtyřikrát více mikroinstrukcí (SISD). Jejich dekódování tedy zabere delší dobu (bude trvat více hodinových cyklů). Nevýhodou je, že SIMD instrukcemi je možné provádět výpočty pouze v situaci, kdy se operace přiřazené ke všem datům shodují - v ukázce se všechny operandy násobí číslem 5. Kdyby ale jedno číslo bylo nutné násobit číslem 4, nebude možné SIMD instrukci použít. SIMD využívají především multimediální aplikace pro práci s: - 2D/3D grafikou, - zvukem, rozpoznávání řeči, - videem, - kompresí a šifrováním dat. 3. Tepelný monitor (od architektury NetBurst procesory Pentium 4, Pentium D, Xeon) Jedná se o tepelnou ochranu procesoru. Přesně nastavené teplotní čidlo přímo na čipu neustále snímá aktuální teplotu. Je napojeno na obvod tepelné ochrany (TCC - Thermal Control Circuit), který schopen udržet teplotu procesorového čipu v rozsahu továrních specifikací za prakticky všech podmínek (např. selhání chlazení). V případě selhání chlazení sníží obvody tepelné ochrany taktovací kmitočet procesoru, čímž sníží tepelné vyzařování. Aplikace běží dále, avšak pomaleji. V případě nárůstu teploty nad kritickou mez (přes 120 až 130 o C), obvody tepelné ochrany procesor odstaví od napájení. http://www.youtube.com/watch?v=06myyb9bl70

4. HyperThreading (HT) (od architektury NetBurst procesory Pentium 4, Pentium D, Xeon) Thread = programové vlákno (např. matematický výpočet s číselnými operandy) Myšlenkou této technologie je, že jeden fyzický procesor (resp. procesorové jádro) bude schopen pracovat jako dva logické procesory. Toho se dosáhlo zdvojením jednotek, které uchovávají aktuální stav výpočetních procesů registrů. Všechny ostatní prostředky procesoru, jako jsou výpočetní jednotky ALU / FPU, dekodér instrukce a paměti CACHE, jsou sdílené. 5. Intel SpeedStep, AMD Cool'n'Quiet (Intel: od architektury NetBurst procesory Pentium 4, Pentium D, Xeon) (AMD: od architektury K8 procesory Athlon 64) Technologie, vyvinuté pro úsporu energie spotřebované procesorem, snížení vyzářeného ztrátového tepla a snížení hlučnosti ventilátoru. Dosahuje se toho snížením taktovací frekvence a napájecího napětí podle potřeb spuštěné aplikace. To vše funguje za běhu počítače, bez pozorovatelného vlivu na výkon. 6. Vícejádrové 64 bitové architektury (Intel: od architektury Core procesory Core Duo, Core 2 Duo, Core 2 Quad) (AMD: od architektury K8 procesory Athlon 64 X2) Jeden procesor obsahuje v pouzdře více procesorových jader (jádro = core). Pokud je vícejádrový procesor podporován operačním systémem a konkrétní aplikací, lze instrukce zpracovávat paralelně. To znamená, že procesor může řešit více úloh současně, popřípadě jednu úlohu rozložit na více jader. Taktovací frekvence procesorového jádra může být nižší. Významnou změnou je také podpora 64 bitových operačních systémů a aplikací (obsahuje plně 64 bitové výpočetní jednotky ALU a registry). To znamená, že v jednom hodinovém taktu dokáže zpracovat najednou 64 bitové číslo (instrukci, operand, adresu).

7. Integrace severního mostu čipové sady do procesoru (Intel: od 1. generace architektury Core i3, i5, i7) (AMD: od architektury K8) V současné době se vývojáři čipových sad a procesorů snaží o plnou integraci obvodů severního mostu přímo do struktury procesoru. Obvody procesoru a severního mostu jsou součástí jednoho polovodičového čipu, včetně integrace grafického procesoru (GPU). Jedná se především o tyto obvody: obvody grafické sběrnice PCI-Express s podporou Multi-GPU technologie, řadič operační paměti DDR3, obvod PCU (Power Control Unit) - obvod řízení napájení, frekvence a tepelného monitoringu procesoru, Media engine - obvod pro dekódování videa a převod do jiných formátů.

8. Technologie Turbo Boost (Intel), Turbo Core (AMD) (Intel: od 1. generace architektury Core i5, i7) (AMD: od architektury K10) Turbo Boost je technologie, která monitoruje TDP procesoru a zároveň vytížení jader procesoru. Pokud program nevyužívá všechna jádra procesoru, přepínají se nepoužívaná jádra do úsporného nebo spánkového režimu nebo jsou kompletně odpojena od napájení. Výsledkem je nejen úspora energie, ale hlavně snížení teploty vyzařované procesorem. Jelikož v tu chvíli je chlazení procesoru naddimenzované, mohou být aktivní jádra automaticky přetaktována změnou násobiče na vyšší kmitočet. U nové verze funkce Turbo Boost má každé jádro vlastní násobič, může tedy dojít k situaci, kdy dvě jádra budou vypnutá a zbylá dvě poběží každé na jiné frekvenci. Obvod PCU (Power Control Unit) dokáže krátkodobě přetaktovat procesor nad rámec maximální hodnoty TDP (např. při spouštění programu, náročný výpočet). Poté klesne na základní frekvenci s maximálním Turbo násobičem (urychlení startu náročných programů, urychlení výpočtu, apod.) Využívá se toho, že chladič má určitou setrvačnost při zahřívání. Technologie Turbo Core od AMD funguje obdobně.