Pokročilé architektury počítačů
|
|
- Alena Křížová
- před 6 lety
- Počet zobrazení:
Transkript
1 Pokročilé architektury počítačů 04 Superskalární techniky Předvýběr instrukcí (Predikce větvení aj.) České vysoké učení technické, Fakulta elektrotechnická A4M36PAP Pokročilé architektury počítačů Ver
2 Superskalární techniky Uvědomme si, že cílem je maximální propustnost zpracování instrukcí Na zpracování instrukcí můžeme nahlížet jako na tok instrukcí a tok dat, přesněji: tok samotných instrukcí (instruction flow) tok dat mezi registry procesoru (register data flow) téma dnešní přednášky a tok dat z/do paměti (memory data flow) To zhruba odpovídá: skokové instrukce aritmeticko-logické / výpočetní instrukce load/strore instrukce Pokud tedy chceme maximalizovat celkový tok, musíme minimalizovat čas (penalizaci) těchto tří typů instrukcí A4M36PAP Pokročilé architektury počítačů 2
3 Tohle všichni známe Náš vlastní program vyjádřen jako Control Flow Graph (CFG): CFG musí být namapován do sekvenční paměti: Adresa Adr + offset A co objektové programování??? Používáte virtuální metody??? A4M36PAP Pokročilé architektury počítačů 3
4 Tohle všichni známe Náš vlastní program vyjádřen jako Control Flow Graph (CFG): CFG musí být namapován do sekvenční paměti: Problém č.1 Fetch group current address Fetch group next address Problém č.2 Next? A co objektové programování??? Problém č.3: Používáte virtuální metody??? Zřetězení A4M36PAP Pokročilé architektury počítačů 4
5 Predikce větvení - motivace Penalizace 3 cykly pro vybrání následující instrukce; Počet prázdných instrukčních slotů násoben šířkou pipeline; Amdahlův zákon.. Issue Execute Branch Fetch Decode Dispatch Instruction / decode buffer Dispatch buffer Reservation stations Finish Complete Retire Store buffer Reorder / Completion buffer A4M36PAP Pokročilé architektury počítačů 5
6 Predikce větvení - motivace Fetch Register indirect with offset Register indirect Issue PCrelative Decode Dispatch Instruction / decode buffer Dispatch buffer Reservation stations Branch Execute Finish Reorder / Completion buffer Complete AMD Athlon: 10 stupňů v celočíselné pipeline Intel NetBurst (Pentium 4): 20 stupňů Retire Store buffer A4M36PAP Pokročilé architektury počítačů 6
7 Predikce větvení Dvě fundamentální složky: branch target speculation (kde), branch condition speculation (zda vůbec). Predikce cíle větvení: BTB (Branch Target Buffer) asociativní cache obsahující dvě položky: BIA (Branch Instruction Address) a BTA (Branch Target Adress) přistupuje se do ní současně při výběru instrukce hodnotou PC pokud se BIA shoduje s PC, je vybrána BTA a v případě, že se skok predikuje mění PC A4M36PAP Pokročilé architektury počítačů 7
8 Branch Target Speculation PC Branch Target Buffer (BTB) BIA BTA Do instrukční cache Předpovídaná adresa A4M36PAP Pokročilé architektury počítačů 8
9 Predikce větvení Predikce splnění podmínky větvení: statická predikce (70%-80%) BTFNT (Backwards Taken / Forwards Not-Taken) cyklus for, while, do-while,.. - relativně k PC, branch delay slot Heuristiky analyzující program (NULL pointer, porovnávání na shodu čísla, vnořené funkce ) výsledky se předávají jako tipy (branch hints) kódované v skokových instrukcích (podpora ISA) Profilace vykonávání programu s různými vstupy - statistiky dynamická predikce (80%-97%) hybridní (predikuje se dynamicky, pokud však není informace o predikci dostupná, použije se statická predikce..) A4M36PAP Pokročilé architektury počítačů 9
10 Posuvný registr Predikce větvení Prediktor Směr posledního skoku Predikovaný směr PC Branch Target Buffer (BTB) Lokální historie +4 BIA BTA Branch hist. Globální historie Do instrukční cache Branch history Předpovídaná adresa FSM Predikce směru A4M36PAP Pokročilé architektury počítačů 10
11 Predikce splnění podmínky větvení Smithův algoritmus (saturující počítadlo) 2 m k-bitových počítadel Branch address Aktualizovaná hodnota m Inkrementace / dekrementace počítadla Predikce (MSB bit) Skutečný výsledek větvení A4M36PAP Pokročilé architektury počítačů 11
12 Smithův algoritmus Predikce splnění podmínky větvení Zamysleme se Pokud má PC 32 bitů, pak bychom potřebovali (1/8)*k*2^32 B paměti pro uchování stavů všech počítadel (pro k=2 to představuje 1GB) Conflict aliasing: neutrální interference negativní interference ješte existuje Compulsory aliasing uvidíme později (důsledek indexování přes adress-history) A4M36PAP Pokročilé architektury počítačů 12
13 Predikce splnění podmínky větvení Dvou-úrovňový prediktor s globální historií větvení a 4- bitovým registrem historie Branch Address PC = PHT (Pattern History Table) BHR (Branch History Register) Predikce (MSB bit) Kolik bitů použijeme pro BHR a kolik pro BA? A4M36PAP Pokročilé architektury počítačů 13
14 Predikce splnění podmínky větvení Dvou-úrovňový prediktor s globální historií větvení a 4- bitovým registrem historie Proč používat i globální historii pro indexaci do PHT? a=0; if(podmínka č.1) a=3; if(podmínka č.2) b=10; if(a <= 0) F(); Chování skokové instrukce může souviset (korelovat) s vykonáním jiných skokových instrukcí v minulosti Na našem příkladu bude vykonání funkce F() fakticky podmíněno splněním podmínky č.1. Naopak podmínka č.2 je irelevantní. Prediktor se musí naučit tyto skokové instrukce (podmínky) odlišit. A4M36PAP Pokročilé architektury počítačů 14
15 Predikce splnění podmínky větvení Dvou-úrovňový prediktor s lokální historií větvení a 3- bitovou tabulkou historie Branch Address PC = n bitů PHT (Pattern History Table) BHT (Branch History Table) m bitů Predikce (MSB bit) Intel P6 používá 4 bity pro BHR A4M36PAP Pokročilé architektury počítačů 15
16 Predikce splnění podmínky větvení Dvou-úrovňový prediktor s lokální historií větvení a 3- bitovou tabulkou historie Proč používat i lokální historii pro indexaci do PHT? do{... }while(podmínka); Chování skokové instrukce může souviset s její vlastní minulostí A4M36PAP Pokročilé architektury počítačů 16
17 Predikce splnění podmínky větvení Dvou-úrovňový prediktor s lokální historií větvení a 3- bitovou tabulkou historie Příklad: Předpokládejme, že na adrese 0xC0A5 je loop-closing branch se vzorem: , kde 1 znamená skok. Jak rychle se naučí uvedený prediktor správně predikovat skok a s jakou úspěšností? Nechť BHT a PHT jsou na začátku vynulovány. PHT (Pattern History Table) Branch Address PC = BHT (Branch History Table) Predikce (MSB bit) A4M36PAP Pokročilé architektury počítačů 17
18 Predikce splnění podmínky větvení Index-sharing prediktory (hashují BHR a PC) lepší využití bitů (větší historie..) Například gshare predictor: Branch Address PC = PHT (Pattern History Table) hash BHR (Branch History Register) Predikce (MSB bit) gshare: Hash: XOR A4M36PAP Pokročilé architektury počítačů 18
19 Predikce splnění podmínky větvení Index-sharing prediktory dvou-módový prediktor (bi-mode) dvě oddělené PHT stejný hash: Branch Address PC = PHT PHT 1 Choise predictor xor BHR (Branch History Register) MSB bit MSB bit MSB bit Predikce Choise prediktor Smith. Důsledek: Skákavé skoky se berou z jedné PHT, neskákavé z té druhé PHT (Statisticky skoky tuto vlastnost mají.) A4M36PAP Pokročilé architektury počítačů 19
20 alloyed predictor Predikce splnění podmínky větvení Branch Address PC = PHT (Pattern History Table) BHT ( Local Branch History Table) Global BHR Predikce (MSB bit) Spojuje část PC s lokální historií a globální historií pro indexaci do PHT A4M36PAP Pokročilé architektury počítačů 20
21 gskewed predictor Predikce splnění podmínky větvení Garance nekonfliktního přístupu k alespoň dvěma PHT Hašovací funkce f0, f1 a f2 mají tuto vlastnost: Pokud f0(x1)=f0(x2) pro x1 x2, pak f1(x1) f1(x2) a f2(x1) f2(x2) Total update (aktualizace všech bank bez rozdílu výsledkem dané skok. instrukce) a partial update (lepší) neaktualizujeme danou banku i když dávala špatnou predikci, ale celková predikce byla správná A4M36PAP Pokročilé architektury počítačů 21
22 agree prediktor Predikce splnění podmínky větvení Skoky mají tendenci buďto skákat nebo naopak neskákat -> bias Nechme tedy počítadlo v PHT saturovat.. (Eliminace negativní interference) A4M36PAP Pokročilé architektury počítačů 22
23 Predikce splnění podmínky větvení YAGS prediktor Je rozšířením Bi-mode prediktoru Nicméně se zásadním rozdílem! Pokud PHT počítadlo indikuje taken, pak NT cache je použita pro predikci. Obě cache si totiž pamatují pouze skoky, které nesouhlasily s PHT. PHT slouží jako pravidlo, a cache jako výjimky z tohoto pravidla. Cache miss pak znamená souhlas s PHT. A4M36PAP Pokročilé architektury počítačů 23
24 Predikce splnění podmínky větvení Filtering prediktor Víme, že skoky mají tendenci saturovat. Využijme toho a oddělme je. Drahé HW struktury pak věnujme skokům se zajímavějším vzorem. A4M36PAP Pokročilé architektury počítačů 24
25 Predikce splnění podmínky větvení Prediktory vzorce chování (Pattern-Based Predictors) Rozšířením myšlenky 1-bitové či vícebitové predikce je rozpoznávání vzorce v chování skoku Př. Vzorce chování skoku (patterns 0-neproveden, 1-proveden) , , , Tyto vzorce chování jsou obtížně předpověditelné pomocí klasické 1-bitové či 2-bitové predikce, přitom jde o pravidelné chování (vzorec) Po každé 0 přijde 1, po 1 přijde Po 11 přijde 0, po 10 přijde 1, po 01 přijde Po 100 přijde 1, po 001 přijde 1, po 011 přijde 1, po 111 přijde 0, po 110 přijde 1, po 101 přijde 0, po 010 přijde 0 Rozpoznávaly předchozí prediktory vzor??? Pozn: Prediktory používající kombinaci lokální historie (příslušného skoku) a globální historie (předchozích skoků) se nazývají korelační prediktory A4M36PAP Pokročilé architektury počítačů 25
26 Predikce splnění podmínky větvení Two-level adaptive branch predictor (též Correlating/ed predictor) Autoři: Yeh a Patt z University of Michigan První level historie posledních K skoků (např. posledních K skokových instrukcí, nebo také K skoků téže instrukce) vytváří vzor Druhý level chování posledních N výskytů tohoto vzoru indexuje PHT BHR je asociován s danou skokovou instrukcí A4M36PAP Pokročilé architektury počítačů 26
27 Two-level adaptive branch predictor (též Correlating/ed predictor) Autoři: Yeh a Patt z University of Michigan Totéž, ale jiný pohled: (Intel P6) Predikce splnění podmínky větvení Někdy se zase PHT kreslí jako matice, kde řádky (sloupce) indexuje část PC a sloupce (řádky) indexuje BHR, případně může být použit i Global BHR (GBHR) A4M36PAP Pokročilé architektury počítačů 27
28 Loop Counting predictor Predikce splnění podmínky větvení Specializovaný prediktor pro zachycení mnoha iterací Používá se pouze v kombinaci s dalším prediktorem (viz hybridní prediktory) Pentium M A4M36PAP Pokročilé architektury počítačů 28
29 Predikce splnění podmínky větvení Sofistikovanější prediktory berou v potaz negativní a neutrální interferenci (bi-mode prediktor a další ) Některé další dynamické prediktory: Perceptronové prediktory (větší historie, odhalí korelované skoky) Data flow prediktory explicitně sledují meziregistrové závislosti Hybridní, multi-hybridní a fusion-based prediktory: Tournament prediktor dva prediktory P0 a P1 a metaprediktor M (Smithův). (a) Hybridní: Tournament prediktor nyní implementující Bimodalní a Gshare prediktor (b) Fusion-Based Hybrid Predictor odstraňuje multiplexor (který vybíral pouze jeden prediktor - Selection) za Fusion A4M36PAP Pokročilé architektury počítačů 29
30 Predikce splnění podmínky větvení Selective branch inversion (SBI) Nesoustřeďuje se primárně na redukci interference, ale spíš koriguje její dopady Počítá (odhaduje) spolehlivost predikce použitého prediktoru Například SBI Bi-Mode prediktor dává lepší výsledky než samotný Bi- Mode (zde: interference avoidance + interference correction) A4M36PAP Pokročilé architektury počítačů 30
31 Dvě fundamentální složky: Predikce větvení branch condition speculation (zda vůbec), branch target speculation (kde). Predikce cíle větvení: O tom jsme se bavili doposud (od slide 10 dál) Na tohle se podíváme nyní BTB (Branch Target Buffer) asociativní cache obsahující dvě položky: BIA (Branch Instruction Address) a BTA (Branch Target Adress) PC Branch Target Buffer (BTB) BIA BTA Do instrukční cache Předpovídaná adresa A4M36PAP Pokročilé architektury počítačů 31
32 Predikce cíle větvení Cíl skoku: PC-relativní nebo nepřímý (adresa je určena za běhu) Co byste zde ukládali? Zamysleme se nad využitím cache A4M36PAP Pokročilé architektury počítačů 32
33 Predikce cíle větvení A co nepřímé skoky? MIPS: jal $ra - kam vlastně máme skočit??? Objektové programování a polymorfizmus Výsledkem je mnohem více nepřímých skoků než při použití imperativního programování Základní myšlenka je zde: Branch Address PC = Target Cache Target Adress History hash Řešení tedy spočívá v indexaci BTB (Branch Taget Buffru) Hash-em může být i pouhá konkatenace Jiný pohled: Jedná se o 2-úrovňový prediktor s tím rozdílem, že cache nyní neobsahuje záznamy o historii skoků, ale adresy návěstí kam skáčeme A4M36PAP Pokročilé architektury počítačů 33
34 Predikce cíle větvení Řešme kolize v cache A4M36PAP Pokročilé architektury počítačů 34
35 Příklad (pro ilustraci): Virtual Program Counter (VPC) Prediction Použité zkratky: GHR Global History Register, VGHR virtual GHR VPCA Virtual PC Address V první iteraci je VPCA = PC; a VGHR = GHR; A4M36PAP Pokročilé architektury počítačů 35
36 Phantom branch / bogous branch Proč dochází k těmto falešným předpovědím? A4M36PAP Pokročilé architektury počítačů 36
37 Predikce cíle větvení RAS prediktor - return address stack specializovaný prediktor k předpovězení návratové adresy instrukce RETURN postačí HW zásobník. Hloubka 8 poskytuje >97% úspěšnost predikce (MIPS R10000 hloubka 1, Alpha hloubka 12, Intel Pentium III hloubka 16) A4M36PAP Pokročilé architektury počítačů 37
38 Moderní procesory užívají: U spekulace ale pozor řídicí spekulace (u podmíněných skoků - dnešní standard) datové spekulace (Load/Store spekulace) Load se provede dříve, než je známa adresa předchozích Store (např. Itanium, Power 5, Core 2) Musí být splněna na korektnost provádění programu To znamená: program splnil Podmínku 1 - dosahuje správný výsledek (podle sekvenční sémantiky), tedy jako při provádění procesorem bez jakéhokoliv zřetězení, Podmínku 2 - generuje stejná přerušení (výjimky) jako procesor bez jakéhokoliv zřetězení. Pro splnění korektnosti existují následující postačující podmínky: A4M36PAP Pokročílé architektury počítačů 38
39 Postačující podmínky Podm. A respektování datových závislostí instrukce čekají na jejich vyřešení Podm. B respektování řídicích závislostí skok se neprovede, dokud není známa adresa příští instrukce Podm. C Přerušení je přerušením přesným. Při spekulativním provádění se částečně nebo dočasně narušují podmínky A a B. Korektnost provádění programu ale splněno být musí, Podm. C trvá. Chybná spekulace? Musí nastat: Zotavení, Restart. Obě akce jsou relativně nákladné (až desítky ztracených taktů). Spekulaci a zotavení podporují dvě HW fronty History Buffer HB - M88110, Reorder Buffer RB ostatní procesory. - na ten se zaměříme A4M36PAP Pokročílé architektury počítačů 39
40 Řešení - History Buffer HB A4M36PAP Pokročílé architektury počítačů 40
41 Řešení - Reorder Buffer RB Výsledky instrukcí zapíšeme ve stupni WB do REORDER BUFFERU, z něj ve fázi COMMIT zapíšeme obsah do registrového pole až pokud všechny předchozí instrukce byly dokončeny. A4M36PAP Pokročílé architektury počítačů 41
42 Výhody HB History Buffer vs Reorder Buffer Hodnoty z history bufferu se nemusejí forwardovat (není asociativní prohledávání HB) => jednodušší forwarding. Nevýhody HB Nutnost rekonstruovat stav registrů sekvenčním procházením HB, Dodatečný čtecí port pro registrové pole (problém se škálováním pro superskalární procesory). Výkonnost (za běhu) obou metod je srovnatelná, při přerušení však má HB značnou nevýhodu. Opět zde je problém s instrukcí STORE. A4M36PAP Pokročílé architektury počítačů 42
43 Zotavení po chybné předpovědi Branch speculation o tom jsme se bavili doposud Branch validation/recovery kdy se dozvíme skutečný směr skoku? a co pak? - Během Branch speculation jsou označovány všechny instrukce v prováděném bloku unikátním Tag-em. Takto označená instrukce indikuje zda je spekulativní a její Tag identifikuje spekulativní blok, kterému patří. - Během Branch speculation jsou ukládány (do buffru) adresy všech skokových instrukcí (příp. adresy následující) nutné pro Branch recovery A4M36PAP Pokročilé architektury počítačů 43
44 Zotavení po chybné předpovědi Branch validation/recovery nastává v okamžiku kdy již známe skutečný směr skoku (zda jsme měli skočit nebo ne) Správná predikce: Tag patřící danému bloku je dealokován a všechny instrukce označené tímto tag-em se stávají nespekulativní (je jim umožněno dokončení). Nesprávná predikce: Dvě akce: Ukončení celé nesprávné větvě a zahájení vykonávání té správné. Ukončení větve znamená: Identifikovat všechny nesprávné instrukce (tagy všech bloků nesprávné větve) zneplatnění instrukcí v decode a dispatch bufrech, reservačních stanicích, dealokace prostoru v reorder buffru Zahájení vykonávání správné větve: Aktualizace PC buďto nově vypočtenou/získanou adresou nebo pomocí adresy uložené během Branch speculation A4M36PAP Pokročilé architektury počítačů 44
45 Predikce skoku - PowerPC 604 Superskalární procesor šířky 4 (schopen přinést, dekódovat nebo dokončit 4 instrukce/cyklus) Schopen vykonat 6 instrukcí/cyklus BTAC Branch Target address cache (plně asociativní, 64 položek) BHT Branch History Table (přímo mapovaná, 512 položek) BTAC jeden cyklus, BHT dva cykly Organizace FA-mux je komlexnější než ukazuje obrázek. A4M36PAP Pokročilé architektury počítačů 45
46 PowerPC 604 trochu jinak A4M36PAP Pokročilé architektury počítačů 46
47 Předvýběr instrukcí Pro superskalární procesor je nesmírně důležité správně předpovídat směr skoku a cíl skoku!!! V jednom cyklu může být nutno zpracovat několik skokových instrukcí například pokud fetch grupa má délku 4, pak všechny 4 instrukce mohou být skokové. Ideálním případem je pak použití adres všech skokových instrukcí Někdy první skoková.. Dalším mechanizmem spekulace je tzv predikace (angl. predication / eager execution) což je vykonávání obou větví programu Predikace poskytuje dvě jistoty první: garance, že procesor bude vykonávat užitečnou práci; druhá jistota: garance, že procesor bude vykonávat neužitečnou práci a to i v případě vysoce predikovatelných skoků. Další faktor: power consumtion A4M36PAP Pokročilé architektury počítačů 47
48 High-Bandwidth Fetch Mechanism Výběr instrukcí z i-cache je typicky limitován na výběr z jedné cache line v daném časovém okamžiku Typicky, fetch grupa obsahuje skokovou instrukci (obvykle 20% instrukcí jsou skokové instrukce; vzdálenost mezi místem skoku a příští skokovou instrukcí je 5-6 instrukcí pro běžné programy) Jenom, pokud je skákající skoková instrukce umístěna ve fetch grupě / cache line jako poslední instrukce, celá fetch grupa obsahuje užitečné instrukce. V opačném případě fetch grupa/i-cache není schopna dodat N instrukcí (N-šířka grupy). Jaký by byl důsledek??? Podobný problém vzniká pokud je požadovaný blok instrukcí rozložen ve dvou cache lines. Řešením je : Collapsing buffer který zarovnává nesousedící instrukce do bloku Trace cache která trasuje (pro daný skok) sekvenci následných instrukcí a ty pak vykonává pokud je hit v trace cache, nevybíráme z instrukční cache A4M36PAP Pokročilé architektury počítačů 48
49 High-Bandwidth Fetch Mechanism Collapsing buffer který zarovnává nesousedící instrukce do bloku Vyžaduje cache rozdělenou po bankách banked instruction cache poskytující víc než jednu cache line paralelně a interleaved BTB. Představme si, že chceme vykonat sekvenci instrukcí: A, B, C, E, G tzn. C je skoková a přeskakuje D; instrukce E skáče na G. Konvenční cache by dodala: A,B,C,D (jedna neužitečná instrukce) a v dalším cyklu pak E,F,G,H (dvě neužitečné) BTB musí poskytovat informace (valid bits) specifikující položky v cache line platné pro predikovanou cestu Organizace Collapsing buffru není snadné škálovat na víc než 2 cache lines / cyklus A4M36PAP Pokročilé architektury počítačů 49
50 High-Bandwidth Fetch Mechanism Trace cache která trasuje (pro daný skok) sekvenci následných instrukcí a ty pak vykonává pokud je hit v trace cache, nevybíráme z instrukční cache Princip (viz obrázek): Základní problém: Jak tuto cache vůbec naplnit? A4M36PAP Pokročilé architektury počítačů 50
51 High-Bandwidth Fetch Mechanism Trace cache Plnit Trace cache můžeme v zásedě na dvou místech (a) a (b) Když je Trace cnstruction buffer naplněn (což může být dáno nejenom počtem instrukcí, ale i počtem skoků v buffru zejména případ (a)), přesováme trace do cache Každý Trace v Trace cache musí rovněž obsahovat i počáteční adresy jednotlivých bloků instrukcí. Jednotka výběru instrukcí musí pak poskytovat predikované adresy několika budoucích skoků a v případě shody v Trace cache -> cache hit. (Je možná i částečná shoda, pak Trace cache poskytne část Trace) A4M36PAP Pokročilé architektury počítačů 51
52 Trace cache Princip konvenční Instruction Fetch Unit bez použití Trace Cache: i-cache decoder register renaming branch prediction trace prediction trace cache A B fill unit i-cache decoder register renaming branch prediction execution units execution units A: Všimněte si, že z Trace cache jdeme přímo do Register renaminig (Nemusí to být vždy tak pokud instrukce v Trace cache nebyli plně dekódovány) B: Sekvence instrukcí, která plní Trace cache mohou přicházet i z reorder buffru po Commitu viz předchozí slide A4M36PAP Pokročilé architektury počítačů 52
53 Trace cahce - Pentium 4 processor, NetBurst microarchitecture A4M36PAP Pokročilé architektury počítačů 53
54 Závěrem k předvýběru instrukcí Zkuste si změřit: for (int i = 0; i < max; i++) if (podmínka) sum++; podmínka vzor čas (i & ) == 0 vždy T (i & 0xffffffff) == 0 vždy F (i & 1) == 0 střídavě TF (i & 3) == 0 TFFF (i & 2) == 0 TTFF (i & 4) == 0 TTTTFFFF (i & 8) == 0 8T 8F (i & 32) == 0 32T 32F A4M36PAP Pokročilé architektury počítačů 54
55 Závěrem k předvýběru instrukcí Zkuste si změřit: for (int i = 0; i < max; i++){ } a=0; if(podmínka č.1) a=3; if((i & 2) == 0) b=10; if(a <= 0) sum++; //if(podmínka č.1) sum++; podmínka č.1 vzor čas A čas B (i & ) == 0 vždy T (i & 0xffffffff) == 0 vždy F (i & 1) == 0 střídavě TF (i & 3) == 0 TFFF (i & 4) == 0 4T 4F A4M36PAP Pokročilé architektury počítačů 55
56 Typické hodnoty dnešních procesorů AMD FX-8150 Intel i Instruction Decode Width 4-wide 4-wide Single Core Peak Decode 4 instructions 4 instructions Instruction Decode Queue 16 entry 18+ entry Buffers 40-entry load queue 24-entry store queue 48 load and 32 store buffers pipeline depth 18+ stages 14 stages branch misprediction penalty reservation station 20 clock cycles for conditional and indirect branches 15 clock cycles for unconditional jumps and returns 40-entry unified integer, memory scheduler; 60-entry unified floating point scheduler 17 cycles 36-entry centralized reservation station shared by 6 functional unit reorder buffer 128-entry retirement queue 128-entry reorder buffer A4M36PAP Pokročilé architektury počítačů 56
57 Literatura: PowerPC604 RISC Microprocessor Technical Summary: Karel Driesen: Accurate Indirect Branch Prediction &type=pdf Hyesoon Kim et al.: VPC Prediction: Reducing the Cost of Indirect Branches via Hardware-Based Dynamic Devirtualization TseYu Yeh and Yale N Patt: Alternative Implementations of TwoLevel Adaptive Branch Prediction Shen, J.P., Lipasti, M.H.: Modern Processor Design : Fundamentals of Superscalar Processors, First Edition, New York, McGraw-Hill Inc., 2005 Glenn Hinton et al.: The Microarchitecture of the Pentium 4 Processor. A4M36PAP Pokročilé architektury počítačů 57
Procesor Intel Pentium (1) Procesor Intel Pentium (3) Procesor Intel Pentium Pro (1) Procesor Intel Pentium (2)
Procesor Intel Pentium (1) 32-bitová vnitřní architektura s 64-bitovou datovou sběrnicí Superskalární procesor: obsahuje více než jednu (dvě) frontu pro zřetězené zpracování instrukcí (značeny u, v) poskytuje
Charakteristika dalších verzí procesorů v PC
Charakteristika dalších verzí procesorů v PC 1 Cíl přednášky Poukázat na principy tvorby architektur nových verzí personálních počítačů. Prezentovat aktuální pojmy. 2 Úvod Zvyšování výkonu cestou paralelizace
Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC
Informační systémy 2 Obsah: Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC ROM RAM Paměti typu CACHE IS2-4 1 Dnešní info: Informační systémy 2 03 Informační systémy
Procesor. Procesor FPU ALU. Řadič mikrokód
Procesor Procesor Integrovaný obvod zajišťující funkce CPU Tvoří srdce a mozek celého počítače a do značné míry ovlivňuje výkon celého počítače (čím rychlejší procesor, tím rychlejší počítač) Provádí jednotlivé
CHARAKTERISTIKA MODERNÍCH PENTIÍ. Flynnova klasifikace paralelních systémů
Úvod: CHARAKTERISTIKA MODERNÍCH PENTIÍ Flynnova klasifikace paralelních systémů Paralelní systémy lze třídit z hlediska počtu toků instrukcí a počtu toků dat: SI systém s jedním tokem instrukcí (Single
Strojový kód k d a asembler procesoru MIPS SPIM. MIPS - prostředí NMS NMS. 32 ks 32bitových registrů ( adresa registru = 5 bitů).
Strojový kód k d a asembler procesoru MIPS Použit ití simulátoru SPIM K.D. - cvičení ÚPA 1 MIPS - prostředí 32 ks 32bitových registrů ( adresa registru = 5 bitů). Registr $0 je zero čte se jako 0x0, zápis
Architektury VLIW M. Skrbek a I. Šimeček
Architektury VLIW M. Skrbek a I. Šimeček xsimecek@fit.cvut.cz Katedra počítačových systémů FIT České vysoké učení technické v Praze Ivan Šimeček, 2011 MI-PAP, LS2010/11, Predn.3 Příprava studijního programu
Pokročilé architektury počítačů
Pokročilé architektury počítačů 05 Superskalární techniky Tok dat z/do paměti (Memory Data Flow) a Procesory VLIW a EPIC České vysoké učení technické, Fakulta elektrotechnická A4M36PAP Pokročilé architektury
Intel 80486 (2) Intel 80486 (1) Intel 80486 (3) Intel 80486 (4) Intel 80486 (6) Intel 80486 (5) Nezřetězené zpracování instrukcí:
Intel 80486 (1) Vyroben v roce 1989 Prodáván pod oficiálním názvem 80486DX Plně 32bitový procesor Na svém čipu má integrován: - zmodernizovaný procesor 80386 - numerický koprocesor 80387 - L1 (interní)
Operační systémy. Jednoduché stránkování. Virtuální paměť. Příklad: jednoduché stránkování. Virtuální paměť se stránkování. Memory Management Unit
Jednoduché stránkování Operační systémy Přednáška 8: Správa paměti II Hlavní paměť rozdělená na malé úseky stejné velikosti (např. 4kB) nazývané rámce (frames). Program rozdělen na malé úseky stejné velikosti
Přednáška. Správa paměti II. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012
Přednáška Správa paměti II. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012 Příprava studijního programu Informatika je podporována projektem financovaným z Evropského
Charakteristika dalších verzí procesorů Pentium
Charakteristika dalších verzí procesorů Pentium 1 Cíl přednášky Poukázat na principy architektur nových verzí typů Pentií. Prezentovat aktuální pojmy. 2 Úvod Paralelní systémy lze třídit z hlediska počtu
Procesor. Základní prvky procesoru Instrukční sada Metody zvýšení výkonu procesoru
Počítačové systémy Procesor Miroslav Flídr Počítačové systémy LS 2006-1/17- Západočeská univerzita v Plzni Víceúrovňová organizace počítače Digital logic level Microarchitecture level Processor Instruction
2010/2011 ZS. operačních systémů. Copak je po jméně? Co růži zvou, i zváno jinak vonělo by stejně. William Shakespeare
Principy počítačů a operačních systémů ZVYŠOVÁNÍ VÝKONU Copak je po jméně? Co růži zvou, i zváno jinak vonělo by stejně. William Shakespeare Mikroarchitektura Zřetězené zpracování pipelining, pp deep ppp
Principy počítačů I ZVYŠOVÁNÍ VÝKONU PROCESORŮ. Sériové zpracování. Pipeline. Úspora při použití pipeline. Problém 1: přístup k datům.
Principy počítačů I Sériové zpracování ZVYŠOVÁNÍ VÝKONU PROCESORŮ Copak je po jméně? Co růží zvou i zváno jinak vonělo by stejně. William Shakespeare Pipeline Úspora při použití pipeline Pipeline s k kroky,
Principy počítačů a operačních systémů
Principy počítačů a operačních systémů Zvyšování výkonnosti procesorů Zimní semestr 2/22 Co nám omezuje výkonnost procesoru? Jednocyklové zpracování insn.fetch, dec, exec Vícecyklové zpracování insn.fetch
Architektury CISC a RISC, uplatnění v personálních počítačích
Architektury CISC a RISC, uplatnění v personálních počítačích 1 Cíl přednášky Vysvětlit, jak pracují architektury CISC a RISC, upozornit na rozdíly. Zdůraznit, jak se typické rysy obou typů architektur
Architektura počítačů Zvyšování výkonnosti
Architektura počítačů Zvyšování výkonnosti http://d3s.mff.cuni.cz http://d3s.mff.cuni.cz/teaching/nswi143 Lubomír Bulej bulej@d3s.mff.cuni.cz CHARLES UNIVERSITY IN PRAGUE faculty of mathematics and physics
CHARAKTERISTIKA PROCESORU PENTIUM První verze:
CHARAKTERISTIKA PROCESORU PENTIUM První verze: Verze Pentia 200 Mhz uvádělo se 330 MIPS (srovnávalo se s 54 MIPS procesoru 486DX2-66). Struktura Pentia Rozhraní 64 bitů datová sběrnice, 32 bitů adresová
Operační systémy. Přednáška 8: Správa paměti II
Operační systémy Přednáška 8: Správa paměti II 1 Jednoduché stránkování Hlavní paměť rozdělená na malé úseky stejné velikosti (např. 4kB) nazývané rámce (frames). Program rozdělen na malé úseky stejné
Paměťový podsystém počítače
Paměťový podsystém počítače typy pamětových systémů počítače virtuální paměť stránkování segmentace rychlá vyrovnávací paměť 30.1.2013 O. Novák: CIE6 1 Organizace paměťového systému počítače Paměťová hierarchie...
Pokročilé Architektury Procesorů
Pokročilé Architektury Procesorů Superpipelinové a Superskalární Procesory Procesory VLIW Ing. Miloš Bečvář Osnova přednášky Shrnutí vlastností skalárního proudově pracujícího procesoru Zvyšování výkonnosti
Vývoj architektur PC 1
Vývoj architektur PC 1 Cíl přednášky Prezentovat vývoj architektury PC. Prezentovat aktuální pojmy. 2 První verze Pentia První verze Pentia: kmitočet procesoru - 200 MHz (dnes vyšší jak 3 GHz) uvádělo
Architektura Intel Atom
Architektura Intel Atom Štěpán Sojka 5. prosince 2008 1 Úvod Hlavní rysem Atomu je podpora platformy x86, která umožňuje spouštět a běžně používat řadu let vyvíjené aplikace, na které jsou uživatelé zvyklí
Adresní mody procesoru
Adresní mody procesoru K.D. - přednášky 1 Obecně o adresování Různé typy procesorů mohou mít v instrukci 1, 2 nebo více adres. Operandy mohou ležet v registrech nebo v paměti. Adresní mechanismus procesoru
Princip funkce počítače
Princip funkce počítače Princip funkce počítače prvotní úlohou počítačů bylo zrychlit provádění matematických výpočtů první počítače kopírovaly obvyklý postup manuálního provádění výpočtů pokyny pro zpracování
Architektura Pentia 1
Architektura Pentia 1 Cíl přednášky Prezentovat vývoj architektury Pentia. Prezentovat aktuální pojmy. 2 První verze Pentia První verze Pentia: kmitočet procesoru - 200 MHz uvádělo se 330 MIPS, srovnání
V 70. letech výzkumy četnosti výskytu instrukcí ukázaly, že programátoři a
1 Počítače CISC a RISC V dnešní době se ustálilo dělení počítačů do dvou základních kategorií podle typu použitého procesoru: CISC - počítač se složitým souborem instrukcí (Complex Instruction Set Computer)
Algoritmizace a programování
Algoritmizace a programování Struktura počítače - pokračování České vysoké učení technické Fakulta elektrotechnická Ver.1.10 J. Zděnek 2015 Systémová struktura počítače pokrač. Systém přerušení A8B14ADP
Luděk Matyska. Jaro 2015
PA039: Architektura superpočítačů a náročné výpočty Luděk Matyska Fakulta informatiky MU Jaro 2015 Luděk Matyska (FI MU) Úvod Jaro 2015 1 / 67 Pravidla hry Účast na přednáškách není povinná Zkouška Pouze
RISC a CISC architektura
RISC a CISC architektura = dva rozdílné přístupy ke konstrukci CPU CISC (Complex Instruction Set Computer) vývojově starší přístup: pomoci konstrukci překladače z VPP co nejpodobnějšími instrukcemi s příkazy
Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC
Informatika 2 Technické prostředky počítačové techniky - 2 Přednáší: doc. Ing. Jan Skrbek, Dr. - KIN Přednášky: středa 14 20 15 55 Spojení: e-mail: jan.skrbek@tul.cz 16 10 17 45 tel.: 48 535 2442 Obsah:
Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC
Informatika 2 Technické prostředky počítačové techniky - 2 Přednáší: doc. Ing. Jan Skrbek, Dr. - KIN Přednášky: středa 14 20 15 55 Spojení: e-mail: jan.skrbek@tul.cz 16 10 17 45 tel.: 48 535 2442 Obsah:
Kubatova 19.4.2007 Y36SAP - 13. procesor - control unit obvodový a mikroprogramový řadič RISC. 19.4.2007 Y36SAP-control unit 1
Y36SAP - 13 procesor - control unit obvodový a mikroprogramový řadič RISC 19.4.2007 Y36SAP-control unit 1 Von Neumannova architektura (UPS1) Instrukce a data jsou uloženy v téže paměti. Paměť je organizována
Řetězené zpracování. INP 2008 FIT VUT v Brně
Řetězené zpracování INP 2008 FIT VUT v Brně 1 Techniky urychlování výpočtu v HW Lze realizovat speciální kódování dle potřeby dané úlohy Příklad: aritmetické operace v kódu zbytkových tříd jsou extrémně
Paralelní programování
Paralelní programování přednášky Jan Outrata únor duben 2011 Jan Outrata (KI UP) Paralelní programování únor duben 2011 1 / 14 Atomické akce dále nedělitelná = neproložitelná jiným procesem izolovaná =
Přidělování paměti II Mgr. Josef Horálek
Přidělování paměti II Mgr. Josef Horálek Techniky přidělování paměti = Přidělování jediné souvislé oblasti paměti = Přidělování paměti po sekcích = Dynamické přemisťování sekcí = Stránkování = Stránkování
Techniky zvýšení výkonnosti procesoru, RISC a CISC procesory
Techniky zvýšení výkonnosti procesoru, RISC a CISC procesory Kategorizace architektur počítačů Co popisuje architektura počítačů: (CPU = ALU + řadič + paměť + Vstupy/Výstupy) Subskalární architektura (von
Další aspekty architektur CISC a RISC Aktuálnost obsahu registru
Cíl přednášky: Vysvětlit principy práce s registry v architekturách RISC a CISC, upozornit na rozdíly. Vysvětlit možnosti využívání sad registrů. Zabývat se principy využívanými v procesorech Intel. Zabývat
PROCESOR. Typy procesorů
PROCESOR Procesor je ústřední výkonnou jednotkou počítače, která čte z paměti instrukce a na jejich základě vykonává program. Primárním úkolem procesoru je řídit činnost ostatních částí počítače včetně
Činnost CPU. IMTEE Přednáška č. 2. Několik úrovní abstrakce od obvodů CPU: Hodinový cyklus fáze strojový cyklus instrukční cyklus
Činnost CPU Několik úrovní abstrakce od obvodů CPU: Hodinový cyklus fáze strojový cyklus instrukční cyklus Hodinový cyklus CPU je synchronní obvod nutné hodiny (f CLK ) Instrukční cyklus IF = doba potřebná
Architektura procesoru ARM
Architektura procesoru ARM Bc. Jan Grygerek GRY095 Obsah ARM...3 Historie...3 Charakteristika procesoru ARM...4 Architektura procesoru ARM...5 Specifikace procesoru...6 Instrukční soubor procesoru...6
Pohled do nitra mikroprocesoru Josef Horálek
Pohled do nitra mikroprocesoru Josef Horálek Z čeho vycházíme = Vycházíme z Von Neumannovy architektury = Celý počítač se tak skládá z pěti koncepčních bloků: = Operační paměť = Programový řadič = Aritmeticko-logická
Pokročilé architektury počítačů
Pokročilé architektury počítačů Přednáška 2 Instrukční paralelizmus a jeho limity Martin Milata Obsah Instrukční hazardy a datové závislosti (připomenutí) Tomasulo algoritmus a dynamické plánování Základní
Základy informatiky. 2. Přednáška HW. Lenka Carr Motyčková. February 22, 2011 Základy informatiky 2
Základy informatiky 2. Přednáška HW Lenka Carr Motyčková February 22, 2011 Základy informatiky 1 February 22, 2011 Základy informatiky 2 February 22, 2011 Základy informatiky 3 February 22, 2011 Základy
Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague
Tomáš Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague Zjednodušené schéma systému z základ hardware pro mainframe tvoří: operační pamět - MAIN / REAL STORAGE jeden
Cache paměť - mezipaměť
Cache paměť - mezipaměť 10.přednáška Urychlení přenosu mezi procesorem a hlavní pamětí Hlavní paměť procesoru je typu DRAM a je pomalá. Proto se mezi pomalou hlavní paměť a procesor vkládá menší, ale rychlá
Úvod do architektur personálních počítačů
Úvod do architektur personálních počítačů 1 Cíl přednášky Popsat principy proudového zpracování informace. Popsat principy zřetězeného zpracování instrukcí. Zabývat se způsoby uplatnění tohoto principu
Architektura Pentia úvod
Architektura Pentia úvod 1 Co je to superskalární architektura? Minimálně dvě fronty instrukcí. Provádění instrukcí je možné iniciovat současně, instrukce se pak provádějí paralelně. Realizovatelné jak
Systém adresace paměti
Systém adresace paměti Základní pojmy Adresa fyzická - adresa, která je přenesena na adresní sběrnici a fyzicky adresuje hlavní paměť logická - adresa, kterou má k dispozici proces k adresaci přiděleného
2.8 Procesory. Střední průmyslová škola strojnická Vsetín. Ing. Martin Baričák. Název šablony Název DUMu. Předmět Druh učebního materiálu
Název školy Číslo projektu Autor Název šablony Název DUMu Tematická oblast Předmět Druh učebního materiálu Anotace Vybavení, pomůcky Ověřeno ve výuce dne, třída Střední průmyslová škola strojnická Vsetín
Algoritmizace a programování
Algoritmizace a programování Struktura počítače České vysoké učení technické Fakulta elektrotechnická Ver.1.10 J. Zděnek 2015 Struktura předmětu Systémová struktura počítače, procesor, paměti, periferní
Základní deska (1) Parametry procesoru (2) Parametry procesoru (1) Označována také jako mainboard, motherboard
Základní deska (1) Označována také jako mainboard, motherboard Deska plošného spoje tvořící základ celého počítače Zpravidla obsahuje: procesor (mikroprocesor) patici pro numerický koprocesor (resp. osazený
4-1 4. Přednáška. Strojový kód a data. 4. Přednáška ISA. 2004-2007 J. Buček, R. Lórencz
4-4. Přednáška 4. Přednáška ISA J. Buček, R. Lórencz 24-27 J. Buček, R. Lórencz 4-2 4. Přednáška Obsah přednášky Násobení a dělení v počítači Základní cyklus počítače Charakteristika třech základní typů
Struktura a architektura počítačů
Struktura a architektura počítačů Alfanumerické kódy Řadič procesoru CISC, RISC Pipelining České vysoké učení technické Fakulta elektrotechnická Ver 1.20 J. Zděnek 2014 Alfanumerické kódy Kódování zobrazitelných
Jan Nekvapil ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická
Jan Nekvapil jan.nekvapil@tiscali.cz ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická Motivace MMX, EMMX, MMX+ 3DNow!, 3DNow!+ SSE SSE2 SSE3 SSSE3 SSE4.2 Závěr 2 Efektivní práce s vektory
Pamět ová hierarchie, virtuální pamět. doc. Ing. Róbert Lórencz, CSc.
Architektura počítačových systémů Pamět ová hierarchie, virtuální pamět doc. Ing. Róbert Lórencz, CSc. České vysoké učení technické v Praze Fakulta informačních technologií Katedra počítačových systémů
Technické prostředky počítačové techniky
Počítač - stroj, který podle předem připravených instrukcí zpracovává data Základní části: centrální procesorová jednotka (schopná řídit se posloupností instrukcí a ovládat další části počítače) zařízení
Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto
Gymnázium Vysoké Mýto nám. Vaňorného 163, 566 01 Vysoké Mýto Registrační číslo projektu Šablona Autor Název materiálu CZ.1.07/1.5.00/34.0951 III/2 INOVACE A ZKVALITNĚNÍ VÝUKY PROSTŘEDNICTVÍM ICT Mgr. Petr
Assembler RISC RISC MIPS. T.Mainzer, kiv.zcu.cz
Assembler RISC T.Mainzer, kiv.zcu.cz RISC RISC, neboli Reduced Instruction Set Computer - koncepce procesorů s redukovaným souborem instrukcí (vs. CISC, neboli Complex Instruction Set Computer, "bohatý"
Algoritmizace a programování
Algoritmizace a programování Struktura počítače České vysoké učení technické Fakulta elektrotechnická Ver.1.10 J. Zděnek 2015 Struktura předmětu Systémová struktura počítače, procesor, paměti, periferní
Přerušovací systém s prioritním řetězem
Přerušovací systém s prioritním řetězem Doplňující text pro přednášky z POT Úvod Přerušovací systém mikropočítače může být koncipován několika způsoby. Jednou z možností je přerušovací systém s prioritním
Architektura procesorů PC shrnutí pojmů
Architektura procesorů PC shrnutí pojmů 1 Co je to superskalární architektura? Minimálně dvě fronty instrukcí. Provádění instrukcí je možné iniciovat současně, instrukce se pak provádějí paralelně. Realizovatelné
Představení a vývoj architektur vektorových procesorů
Představení a vývoj architektur vektorových procesorů Drong Lukáš Dro098 1 Obsah Úvod 3 Historie, současnost 3 Architektura 4 - pipelining 4 - Operace scatter a gather 4 - vektorové registry 4 - Řetězení
Sekvenční architektury II. Zpracování instrukcí
Sekvenční architektury II Zpracování instrukcí Jak zvýšit výkon CPU zkrátit čas nutný ke zpracování 1 instrukce urychlit časovač (Timer) = zvýšení taktu to je technicky velmi náročné, poslední dobou se
Semestrální práce z předmětu Speciální číslicové systémy X31SCS
Semestrální práce z předmětu Speciální číslicové systémy X31SCS Katedra obvodů DSP16411 ZPRACOVAL: Roman Holubec Školní rok: 2006/2007 Úvod DSP16411 patří do rodiny DSP16411 rozšiřuje DSP16410 o vyšší
Pokročilé architektury počítačů
Pokročilé architektury počítačů Architektura IO podsystému České vysoké učení technické, Fakulta elektrotechnická A4M36PAP Pokročílé architektury počítačů Ver.1.00 2010 1 Co je úkolem? Propojit jednotlivé
Architektura počítačů Zvyšování výkonnosti
Architektura počítačů Zvyšování výkonnosti http://d3s.mff.cuni.cz/teaching/computer_architecture/ Lubomír Bulej bulej@d3s.mff.cuni.cz CHARLES UNIVERSITY IN PRAGUE faculty of mathematcs and physics Faktory
Pokročilé architektury počítačů
Pokročilé architektury počítačů Architektura paměťového a periferního podsystému České vysoké učení technické, Fakulta elektrotechnická A4M36PAP Pokročílé architektury počítačů Ver.1.00 2010 1 Motivace
MIKROPROCESORY PRO VÝKONOVÉ SYSTÉMY. Systémová struktura počítače
MIKROPROCESORY PRO VÝKONOVÉ SYSTÉMY Systémová struktura počítače Řízení běhu programu České vysoké učení technické Fakulta elektrotechnická A1B14MIS Mikroprocesory pro výkonové systémy 05 Ver.1.20 J. Zděnek,
Intel 80286. Procesor a jeho konstrukce. Vývojové typy, činnost procesoru
Procesor a jeho konstrukce. Vývojové typy, činnost procesoru První obvod nazvaný mikroprocesor uvedla na trh firma Intel v roce 1970. Šlo o 4bitový procesor Intel 4004. V roce 1972 byl MCS8 prvním 8bitovým
Procesory, mikroprocesory, procesory na FPGA. 30.1.2013 O. Novák, CIE 11 1
Procesory, mikroprocesory, procesory na FPGA 30.1.2013 O. Novák, CIE 11 1 Od sekvenčních automatů k mikroprocesorům 30.1.2013 O. Novák, CIE 11 2 30.1.2013 O. Novák, CIE 11 3 Architektura počítačů Von Neumannovská,
Strojový kód. Instrukce počítače
Strojový kód Strojový kód (Machine code) je program vyjádřený v počítači jako posloupnost instrukcí procesoru (posloupnost bajtů, resp. bitů). Z hlediska uživatele je strojový kód nesrozumitelný, z hlediska
Struktura a architektura počítačů (BI-SAP) 11
Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Struktura a architektura počítačů (BI-SAP) 11 doc. Ing. Hana Kubátová, CSc. Katedra číslicového návrhu Fakulta informačních technologii
Proudové zpracování instrukcí II. Hazardy v proudovém zpracování Proudové zpracování FP instrukcí
Proudové zpracování instrukcí II. Hazardy v proudovém zpracování Proudové zpracování FP instrukcí Ing. Miloš Bečvář Osnova přednášky Implementace pozastavení v pipeline Datové hazardy a jejich řešení (pozastavení,
Architektura počítače
Architektura počítače Výpočetní systém HIERARCHICKÁ STRUKTURA Úroveň aplikačních programů Úroveň obecných funkčních programů Úroveň vyšších programovacích jazyků a prostředí Úroveň základních programovacích
Procesor z pohledu programátora
Procesor z pohledu programátora Terminologie Procesor (CPU) = řadič + ALU. Mikroprocesor = procesor vyrobený monolitickou technologií na čipu. Mikropočítač = počítač postavený na bázi mikroprocesoru. Mikrokontrolér
Sekvenční architektury II. Zpracování instrukcí
Sekvenční architektury II Zpracování instrukcí Jak zvýšit výkon CPU zkrátit čas nutný ke zpracování 1 instrukce urychlit časovač (Timer) = zvýšení taktu to je technicky velmi náročné, poslední dobou se
NSWI /2011 ZS. Principy cpypočítačůčů aoperačních systémů ARCHITEKTURA
Principy cpypočítačůčů aoperačních systémů ARCHITEKTURA Literatura W.Stallings: Computer Organization & Architecture J.L.Hennessy, P.A.Patterson: Patterson: Computer Architecture: a Quantitative Approach
Provádění instrukcí. procesorem. Základní model
procesorem 1 Základní model Kód programu (instrukce) a data jsou uloženy ve vnější paměti. Procesor musí nejprve z paměti přečíst instrukci. Při provedení instrukce podle potřeby čte nebo zapisuje data
Systém přerušení. Algoritmizace a programování. Struktura počítače - pokračování. Systémová struktura počítače pokrač.
Algoritmizace a programování Struktura počítače - pokračování České vysoké učení technické Fakulta elektrotechnická Ver.1.10 J. Zděnek 2015 Systémová struktura počítače pokrač. Systém přerušení A8B14ADP
Struktura a architektura počítačů (BI-SAP) 7
Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Struktura a architektura počítačů (BI-SAP) 7 doc. Ing. Hana Kubátová, CSc. Katedra číslicového návrhu Fakulta informačních technologii
Proudové zpracování instrukcí I. Celočíselná pipeline RISC
Proudové zpracování instrukcí I. Celočíselná pipeline RISC Ing. Miloš Bečvář s využitím slajdů prof. Davida Pattersona CS152, University California at Berkeley, 1996 Osnova přednášky Návrh jednoduché datové
Pamět ová hierarchie, návrh skryté paměti 2. doc. Ing. Róbert Lórencz, CSc.
Architektura počítačových systémů Pamět ová hierarchie, návrh skryté paměti 2 doc. Ing. Róbert Lórencz, CSc. České vysoké učení technické v Praze Fakulta informačních technologií Katedra počítačových systémů
Metody připojování periferií BI-MPP Přednáška 2
Metody připojování periferií BI-MPP Přednáška 2 Ing. Miroslav Skrbek, Ph.D. Katedra počítačových systémů Fakulta informačních technologií České vysoké učení technické v Praze Miroslav Skrbek 2010,2011
Architektura Intel Nehalem
VŠB-TUO FEI Architektura Intel Nehalem Pokročilé architektury PC Zdeněk Ryška (rys093) 5.11.2009 Procesor Intel Core i7 kódovým jménem nazývaný Nehalem je první nativní čtyřjádrový procesor firmy Intel.
Paměťová hierarchie. INP 2008 FIT VUT v Brně
Paměťová hierarchie INP 2008 FIT VUT v Brně 000 Výkonová mezera mezi CPU a pamětí Moorův zákon CPU CPU 60% za rok (2X/.5roku) výkonnost 00 0 980 98 DRAM 982 983 984 985 986 987 988 989 990 99 992 993 994
for (i = 0, j = 5; i < 10; i++) { // tělo cyklu }
5. Operátor čárka, - slouží k jistému určení pořadí vykonání dvou příkazů - oddělím-li čárkou dva příkazy, je jisté, že ten první bude vykonán dříve než příkaz druhý. Např.: i = 5; j = 8; - po překladu
ARCHITEKTURA PROCESORŮ
ARCHITEKTURA PROCESORŮ Základními jednotkami, které tvoří vnitřní strukturu procesorů, jsou: řadič, který má za úkol číst operandy (data, čísla) a instrukce z operační paměti, dekódovat je a na základě
Spojová implementace lineárních datových struktur
Spojová implementace lineárních datových struktur doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava Prezentace ke dni 13. března 2017 Jiří Dvorský (VŠB
Paměti cache. Cache může být realizována softwarově nebo hardwarově.
Paměti cache Cache je označení pro vyrovnávací paměť nacházející se mezi dvěma subsystémy s rozdílnou přenosovou rychlostí, a jak již její název vypovídá, tak tuto rychlost vyrovnává. Cache může být realizována
PROCESORY. Typy procesorů
PROCESORY Procesor (CPU Central Processing Unit) je ústřední výkonnou jednotkou počítače, která čte z paměti instrukce a na jejich základě vykonává program. Primárním úkolem procesoru je řídit činnost
Pokročilé architektury počítačů
Pokročilé architektury počítačů Přednáška 5 GPU - CUDA Martin Milata Obsah Obecné výpočty a GPU Grafické procesory NVIDIA Tesla Výpočetní model Paměťový model GT200 Zpracování instrukcí Vydávání instrukcí
Pokročilé architektury počítačů
Pokročilé architektury počítačů Přednáška 3 Hierarchické uspořádání pamětí počítače Martin Milata Obsah Paměťový subsystém Obvyklé chování programů při přístupu do paměti Cache paměti princip činnosti
Struktura a architektura počítačů (BI-SAP) 10
Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Struktura a architektura počítačů (BI-SAP) 10 doc. Ing. Hana Kubátová, CSc. Katedra číslicového návrhu Fakulta informačních technologii
Vícejádrový procesor. Dvě nebo více nezávislých jader Pro plné využití. podporovat multihreading
Vývoj Jan Smuda, Petr Zajíc Procesor ALU (aritmeticko logická jednotka) Registry Řadič Jednotky pro práci s plovoucí čárkou Cache Vývoj procesorů Predikce skoku Plánování instrukcí Naráží na fyzická omezení
Procesy a vlákna (Processes and Threads)
ÚVOD DO OPERAČNÍCH SYSTÉMŮ Ver.1.00 Procesy a vlákna (Processes and Threads) Správa procesů a vláken České vysoké učení technické Fakulta elektrotechnická 2012 Použitá literatura [1] Stallings, W.: Operating
Přednáška. Správa paměti I. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012
Přednáška Správa paměti I. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012 Příprava studijního programu Informatika je podporována projektem financovaným z Evropského
Využití ICT pro rozvoj klíčových kompetencí CZ.1.07/1.5.00/
Střední odborná škola elektrotechnická, Centrum odborné přípravy Zvolenovská 537, Hluboká nad Vltavou Využití ICT pro rozvoj klíčových kompetencí CZ.1.07/1.5.00/34.0448 CZ.1.07/1.5.00/34.0448 1 Číslo projektu
Akademický rok: 2004/05 Datum: Příjmení: Křestní jméno: Osobní číslo: Obor:
Západočeská univerzita v Plzni Písemná zkouška z předmětu: Zkoušející: Katedra informatiky a výpočetní techniky Počítačová technika KIV/POT Dr. Ing. Karel Dudáček Akademický rok: 2004/05 Datum: Příjmení: