Architektura procesorů PC shrnutí pojmů



Podobné dokumenty
Architektura Pentia úvod

Architektury CISC a RISC, uplatnění v personálních počítačích

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

Kubatova Y36SAP procesor - control unit obvodový a mikroprogramový řadič RISC Y36SAP-control unit 1

Další aspekty architektur CISC a RISC Aktuálnost obsahu registru

Architektury VLIW M. Skrbek a I. Šimeček

Architektury CISC a RISC, uplatnění v personálních počítačích - pokračování

Procesor. Procesor FPU ALU. Řadič mikrokód

CHARAKTERISTIKA MODERNÍCH PENTIÍ. Flynnova klasifikace paralelních systémů

Architektury počítačů a procesorů

Princip funkce počítače

Architektury CISC a RISC, uplatnění rysů architektur RISC v personálních počítačích - pokračování

Architektury CISC a RISC, uplatnění rysů architektur RISC v personálních počítačích - pokračování

Pohled do nitra mikroprocesoru Josef Horálek

CHARAKTERISTIKA PROCESORU PENTIUM První verze:

Provádění instrukcí. procesorem. Základní model

Principy komunikace s adaptéry periferních zařízení (PZ)

Strojový kód k d a asembler procesoru MIPS SPIM. MIPS - prostředí NMS NMS. 32 ks 32bitových registrů ( adresa registru = 5 bitů).

Sběrnicová architektura POT POT. Jednotlivé subsystémy počítače jsou propojeny sběrnicí, po které se přenáší data oběma směry.

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

Architektura Intel Atom

CISC A RISC PROCESORY Jak pracují procesory CISC:

Strojový kód. Instrukce počítače

Hardware - komponenty počítačů Von Neumannova koncepce počítače. Von Neumannova koncepce počítače

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

Činnost CPU. IMTEE Přednáška č. 2. Několik úrovní abstrakce od obvodů CPU: Hodinový cyklus fáze strojový cyklus instrukční cyklus

PROCESOR. Typy procesorů

Úvod do architektur personálních počítačů

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

Vývoj architektur PC 1

Technické prostředky počítačové techniky

Charakteristika dalších verzí procesorů v PC

Architektura Pentia 1

VÝUKOVÝ MATERIÁL. 3. ročník učebního oboru Elektrikář Přílohy. bez příloh. Identifikační údaje školy

Techniky zvýšení výkonnosti procesoru, RISC a CISC procesory

Úvod do architektur personálních počítačů

Vstupně - výstupní moduly

Představení a vývoj architektur vektorových procesorů

Disková pole (RAID) 1

Úvod. Instrukce musí obsahovat: typ operace adresu operandu (operandů) typ operandů modifikátory adresy modifikátory operace POT POT

Architektura počítače

Řízení IO přenosů DMA řadičem

Charakteristika dalších verzí procesorů Pentium

Architektura počítačů

Testování jednotky ALU a aplikace metody FMEA

OPS Paralelní systémy, seznam pojmů, klasifikace

Semestrální práce z předmětu Speciální číslicové systémy X31SCS

Procesor Intel Pentium (1) Procesor Intel Pentium (3) Procesor Intel Pentium Pro (1) Procesor Intel Pentium (2)

Assembler RISC RISC MIPS. T.Mainzer, kiv.zcu.cz

PB002 Základy informačních technologií

Úvod. Programovací paradigmata

Pojem architektura je převzat z jiného oboru lidské činnosti, než počítače.

ZÁKLADY PROGRAMOVÁNÍ. Mgr. Vladislav BEDNÁŘ /14

Základní uspořádání pamětí MCU

Von Neumannovo schema počítače

Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/ Vzdělávání v informačních a komunikačních technologií

Struktura a architektura počítačů (BI-SAP) 1

Základy informatiky. 2. Přednáška HW. Lenka Carr Motyčková. February 22, 2011 Základy informatiky 2

Struktura a architektura počítačů (BI-SAP) 7

Y36SAP

Paralelní systémy. SIMD jeden tok instrukcí + více toků dat jedním programem je zpracováváno více různých souborů dat

V 70. letech výzkumy četnosti výskytu instrukcí ukázaly, že programátoři a

Počítač jako prostředek řízení. Struktura a organizace počítače

Procesor z pohledu programátora

Profilová část maturitní zkoušky 2014/2015

Struktura počítačů z{kladní pojmy

Intel (2) Intel (1) Intel (3) Intel (4) Intel (6) Intel (5) Nezřetězené zpracování instrukcí:

Procesor. Základní prvky procesoru Instrukční sada Metody zvýšení výkonu procesoru

Vstupně výstupní moduly. 13.přednáška

Jako pomůcka jsou v pravém dolním rohu vypsány binární kódy čísel od 0 do 15 a binární kódy příkazů, které máme dispozici (obr.21). Obr.

Architektura a princip funkce počítačů

Úvod do problematiky návrhu počítačových systémů. INP 2008 FIT VUT v Brně

Řetězené zpracování. INP 2008 FIT VUT v Brně

Základní principy konstrukce systémové sběrnice - shrnutí. Shrnout základní principy konstrukce a fungování systémových sběrnic.

Profilová část maturitní zkoušky 2015/2016

RISC a CISC architektura

Základní deska (1) Označována také jako mainboard, motherboard. Deska plošného spoje tvořící základ celého počítače Zpravidla obsahuje:

ARCHITEKTURA PROCESORŮ

2 Hardware a operační systémy

Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115

Disková pole (RAID) 1

Principy počítačů a operačních systémů

Procesory, mikroprocesory, procesory na FPGA O. Novák, CIE 11 1

MSP 430F1611. Jiří Kašpar. Charakteristika

Pohled do nitra mikroprocesoru

Architektura počítačů

Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague

Systém adresace paměti

NSWI /2011 ZS. Principy cpypočítačůčů aoperačních systémů ARCHITEKTURA

TÉMATICKÝ OKRUH TZD, DIS a TIS

Pokročilé architektury počítačů

Přednáška. Strojový kód a data. 4. Přednáška ISA J. Buček, R. Lórencz

Mikrokontroléry. Doplňující text pro POS K. D. 2001

Přednášky o výpočetní technice. Hardware teoreticky. Adam Dominec 2010

Přehled paralelních architektur. Dělení paralelních architektur Flynnova taxonomie Komunikační modely paralelních architektur

Kapitola 13: Transakce. Koncept transakce. ACID vlastnosti

Výstavba PC. Vývoj trhu osobních počítačů

Koncepce DMA POT POT. Při vstupu nebo výstupu dat se opakují jednoduché činnosti. Jednotlivé kroky lze realizovat pomocí speciálního HW.

Přidělování CPU Mgr. Josef Horálek

Transkript:

Architektura procesorů PC shrnutí pojmů 1

Co je to superskalární architektura? Minimálně dvě fronty instrukcí. Provádění instrukcí je možné iniciovat současně, instrukce se pak provádějí paralelně. Realizovatelné jak v CISC tak i RISC architekturách. 2

Superskalární architektura - obecně Několik funkčních jednotek - každá z nich realizovaná jako fronta podpora paralelního provádění instrukcí Dva typy instrukcí (pro operace s čísly typu integer a operace s čísly v pohyblivéřádovéčárce). 3

Superzřetězené architektury (superpipelined) Existují situace, kdy je možné instrukci zpracovat v kratším čase než polovina cyklu nebo zahájit zpracování instrukce uprostřed vnějšího cyklu. Jeden vnější cyklus dva interní cykly. Ve vztahu k vnějšímu cyklu provádějí se dvě úlohy v jednom vnějším cyklu. 4

Superzřetězené architektury Klasická zřetězená architektura jedna fronta instrukcí Superzřetězené architektury vnitřní kmitočet 2x vyšší než vnější. Superskalární architektura v obou frontách se provádění zahajuje ve stejném okamžiku. 5

Omezení superskalárních architektur Pojem paralelismus na úrovni provádění instrukcí (instruction level parallelism) - ILP Snaha o maximální využití těchto technik: na úrovni překladu na úrovni hardware Omezení využití: datová závislost, procedurální závislost, konflikt zdrojů, výstupní závislost, antidatová závislost. 6

Datová závislost ADD r1, r2 (r1 := r1+r2;) MOVE r3,r1 (r3 := r1;) Druhou instrukci je možné paralelně vložit do fronty instrukcí a dekódovat, není možné ji začít provádět. Není možné zahájit provádění další instrukce. Závislost, kdy následná instrukce nemůže být provedena dříve než je ukončena instrukce předcházející. 7

Procedurální závislost Není možné provádět instrukce, které jsou za instrukcí skoku, dokud není znám výsledek vyhodnocení podmínky skoku. Obdobně: instrukce je dlouhá, je nutno ji nejdříve dekódovat (zjistí se délka instrukce), pak se teprve přečte zbytek instrukce není možné zahájit čtení další instrukce. Procedurální závislost postihuje situace, kdy se pracuje s pamětí a je nutné rozhodnout, kdy bude možné zahájit další činnost s pamětí. 8

Konflikt zdrojů Dvě nebo více instrukcí potřebuje přístup ke stejnému zdroji (paměť, RVP, sběrnice, ALU, např. dvě aritmetické instrukce Řešení: zdvojení zdrojů: - např. dvě aritmetické jednotky V superskalárních architekturách je snaha, aby každá fronta a každý stupeň měly kompletní vybavení. 9

Vliv závislostí Bez závislosti Datová závislost (instrukce i1 potřebuje data vypočtená instrukcí i0) Procedurální závislost Konflikt zdrojů 10

Paralelismus na úrovni instrukcí a počítače Na úrovni instrukcí (Instruction Level Parallelism - ILP) Nezávislost instrukcí ve frontě. Provádění instrukcí se může překrývat. Souvislost s datovou a procedurální závislostí. Na úrovni počítače (Machine Level Parallelism MLP) Počítač musí být vybaven tak, aby bylo možné využít ILP. Závislost na počtu paralelně pracujících front. 11

Souvislost s prováděním instrukcí Paralelní provádění instrukcí kvalitní procesor musí být vybaven tak, aby se při plánování činností nemusel držet striktně pořadí instrukcí, ale mohl provádět změny v posloupnosti provádění instrukcí reordering. Možnosti přeuspořádání: - Pořadí, v němž jsou instrukce řazeny do fronty. - Pořadí provádění instrukcí. - Pořadí, podle něhož instrukce mění obsahy registrů a pamětí. 12

Vstup instrukcí podle pořadí, dokončení instrukcí podle pořadí Instrukce jsou čteny podle pořadí v programu. Nepříliš efektivní. Do vstupní fronty je čtena více jak jedna instrukce. V případě potřeby se provádění instrukcí pozastaví. RISC reorganizace posloupnosti instrukcí při překladu. 13

Vstup instrukcí podle pořadí, dokončení instrukcí podle pořadí (diagram) 2 vstupní fronty, 3 funkční jednotky, 2 výstupní fronty. Na provedení instrukce I1 jsou potřeba 2 cykly. I3 a I4 potřebují při provádění stejné funkční jednotky. I5 čeká na výsledek I4. I5 a I6 potřebují stejnou funkční jednotku. Doba trvání 8 cyklů. 14

Vstup instrukcí podle pořadí, změna pořadí výstupu (diagram) Doba provedení 7 cyklů. Ve všech doposud diskutovaných případech se organizace pořadí instrukcí mění ve vstupní frontě. Následující případ jiná koncepce. 15

Změna pořadí na vstupu, změna pořadí na výstupu Na výstupu jsou instrukce párovány jinak než ve vstupní frontě. Do vstupní fronty se přivádějí instrukce a rozdekódují se. Jakmile se uvolní funkční jednotka, instrukce se provede. Instrukce byly rozdekódovány, procesor se může dívat dopředu. Pokud při rozdekódování instrukce vznikne konflikt, tak se řeší a nejsou dekódovány další instrukce, dokud se tento konflikt nevyřeší procesor se přestane zabývat instrukcemi, které následují za touto konfliktní instrukcí (chybí pohled dopředu lookahead). Řešení instruction window. 16

Změna pořadí na vstupu, změna pořadí na výstupu (diagram) Do fronty se plynule čte (na rozdíl od předcházejících architektur) konflikty se řeší až ve window. Instrukční okno není další frontou. O instrukci, která je v okně platí, že procesor má dostatek informace o tom, jaké mohou při realizaci instrukce vzniknout konflikty, takže může být rozhodnuto o tom, že provádění instrukce bude zahájeno. 17

Změna pořadí na vstupu, změna pořadí na výstupu Zařazení do window znamená, že procesor má dostatek informací o tom, co bude pro provedení instrukce potřeba. Reorganizace se odehrává v režii procesoru.

Antizávislost (antidatová závislost) Předcházející situace datové závislosti: při párování (současném zpracování dvou instrukcí ve dvou frontách) nesmí být instrukce n+1 provedena dříve než instrukce n, pokud obě instrukce pracují se stejným operandem (instrukce n přiřazovala hodnotu parametru, s nímž se pracuje jako s operandem v instrukci n+1). Write-write dependency R3:=R3 + R5; (I1) R4:=R3 + 1; (I2) R3:=R5 + 1; (I3) R7:=R3 + R4; (I4) Pokud by se I3 a I2 prováděli paralelně, nesmí se I3 dokončit dříve než I2, protože I2 potřebuje hodnotu uloženou v R3 a I3 mění hodnotu v R3 (nesmí se stát, aby I3 změnila hodnotu v R3 předtím, než I2 vezme hodnotu z R3). 19