Pokročilé architektury počítačů



Podobné dokumenty
Pamět ová hierarchie, virtuální pamět. doc. Ing. Róbert Lórencz, CSc.

Operační paměti počítačů PC

Paměťový podsystém počítače

Informační a komunikační technologie

Paměti EEPROM (1) Paměti EEPROM (2) Paměti Flash (1) Paměti EEPROM (3) Paměti Flash (2) Paměti Flash (3)

Operační systémy. Přednáška 8: Správa paměti II

Pamět ová hierarchie, návrh skryté paměti 2. doc. Ing. Róbert Lórencz, CSc.

Pamět ová hierarchie, návrh skryté paměti cache 2

Technické prostředky počítačové techniky

Architektury počítačů

Struktura a architektura počítačů (BI-SAP) 11

Paměťová hierarchie. INP 2008 FIT VUT v Brně

Paměť počítače. 0 (neprochází proud) 1 (prochází proud)

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

Architektury počítačů

Miroslav Flídr Počítačové systémy LS /21- Západočeská univerzita v Plzni

Operační systémy. Jednoduché stránkování. Virtuální paměť. Příklad: jednoduché stránkování. Virtuální paměť se stránkování. Memory Management Unit

Přednáška. Správa paměti II. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012

Paměti a jejich organizace

Paměti cache. Cache může být realizována softwarově nebo hardwarově.

Něco málo o časování a frekvenci

Paměti EEPROM (1) 25/07/2006 1

CHARAKTERISTIKY MODELŮ PC

Pokročilé architektury počítačů

asociativní paměti Ing. Jakub Št astný, Ph.D. 1 Katedra teorie obvodů FEL ČVUT Technická 2, Praha 6,

Paměťové prvky. ITP Technika personálních počítačů. Zdeněk Kotásek Marcela Šimková Pavel Bartoš

Základní deska (1) Parametry procesoru (2) Parametry procesoru (1) Označována také jako mainboard, motherboard

Karel Johanovský Michal Bílek. Operační paměť

Architektura počítače

Cílem kapitoly je seznámit studenta s pamětmi. Jejich minulostí, současností a hlavnímu parametry.

Paměti Josef Horálek

Zvyšování kvality výuky technických oborů

ÚVOD DO OPERAČNÍCH SYSTÉMŮ. Správa paměti. Přímý přístup k fyzické paměti, abstrakce: adresový prostor, virtualizace, segmentace

Paměti personálních počítačů, vývoj pojmů, technologie, organizace

Paměti v PC - souhrn

Paměti polovodičové. Jedná se o mikroelektronické obvody s velkou hustotou integrace.

Paměti. Paměť je zařízení, které slouží k ukládání programů a dat, s nimiž počítač pracuje

HW počítače co se nalézá uvnitř počítačové skříně

Paměti EEPROM (1) Paměti EEPROM (2) Paměti Flash (1) Paměti EEPROM (3) Paměti Flash (2) Paměti Flash (3)

Téma 6 Správa paměti a její virtualizace

Principy operačních systémů. Lekce 3: Virtualizace paměti

Hardware ZÁKLADNÍ JEDNOTKA

PROTOKOL O LABORATORNÍM CVIČENÍ

SDRAM (synchronní DRAM) Cíl přednášky:

Cílem kapitoly je seznámit studenta s pamětmi. Jejich minulostí, současností, budoucností a hlavními parametry.

Adresový vodič. Datový vodič 30/12/2010 4

Paměti operační paměti

Mezipaměti počítače. L2 cache. L3 cache

Organizace a zpracování dat I (NDBI007) RNDr. Michal Žemlička, Ph.D.

Paměti personálních počítačů, vývoj pojmů, technologie, organizace

např. osvícením ultrafialovým světlem; prakticky se muselo místo pro smazání zalepovat, pokud nálepka odpadla, tak se data mohly smazat

Dělení pamětí Volatilní paměti Nevolatilní paměti. Miroslav Flídr Počítačové systémy LS /11- Západočeská univerzita v Plzni

Rychlá vyrovnávací paměť v architektuře PC

Pokročilé architektury počítačů

Intel (2) Intel (1) Intel (3) Intel (4) Intel (6) Intel (5) Nezřetězené zpracování instrukcí:

Paměti Rambus DRAM (RDRAM) Paměti Flash Paměti SGRAM

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

Úvod do architektur personálních počítačů

Paměti Rambus DRAM (RDRAM) Paměti Flash Paměti SGRAM

Paměti SDRAM (synchronní DRAM)

Procesor. Procesor FPU ALU. Řadič mikrokód

PAMĚŤOVÝ SUBSYSTÉM. Principy počítačů I. Literatura. Parametry paměti. Parametry paměti. Dělení pamětí podle funkce. Kritéria dělení pamětí

Charakteristika dalších verzí procesorů v PC

INFORMAČNÍ A KOMUNIKAČNÍ TECHNOLOGIE

Principy počítačů a operačních systémů

PROCESOR. Typy procesorů

Sběrnicová struktura PC Interní počítačové paměti PC

Paměti SDRAM (synchronní DRAM)

IB109 Návrh a implementace paralelních systémů. Organizace kurzu a úvod. RNDr. Jiří Barnat, Ph.D.

Počítačová sestava paměti, operační paměť RAM

Když konvenční disky nestačí tempu vašich aplikací

Cache paměti (1) Cache paměť: V dnešních počítačích se běžně používají dva, popř. tři druhy cache pamětí:

Operační systémy 2. Přednáška číslo 2. Přidělování paměti

Paměti Rambus DRAM (RDRAM) Paměti Flash Paměti SGRAM

6. Procesory jiných firem... 1

Identifikátor materiálu: ICT-1-08

Střední odborná škola a Střední odborné učiliště, Dubno Ing. Miroslav Krýdl Tematická oblast ELEKTRONIKA

Základní deska (1) Označována také jako mainboard, motherboard. Deska plošného spoje tvořící základ celého počítače Zpravidla obsahuje:

Alfanumerické displeje

2010/2011 ZS P i r i nc č py po ít č čů a PAMĚŤOVÝ ĚŤ SUBSYSTÉM z pohledu OS OS

Paměti počítače ROM, RAM

Úvod do programování a práce s počítačem 2

Souborový systém (File System FS) Souborové systémy. Souborová fragmentace. Disková fragmentace. Organizace dat na pevném disku

Typy pamětí. Hierarchické uspořádání paměťového subsystému počítače.

Cache paměť - mezipaměť

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

2.9 Vnitřní paměti. Střední průmyslová škola strojnická Vsetín. Ing. Martin Baričák. Název šablony Název DUMu. Předmět Druh učebního materiálu

Struktura a architektura počítačů (BI-SAP) 10

Přednáška. Správa paměti I. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012

Pevné disky, fyzická struktura, geometrie disku

Vestavné systémy. BI-VES Přednáška 8. Ing. Miroslav Skrbek, Ph.D.

09. Memory management. ZOS 2006, L.Pešička

Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Paměti Chronologie a příklady jednotlivých druhů pamětí: Základní rozdělení pamětí:

Vstupně - výstupní moduly

Paralelní systémy. SIMD jeden tok instrukcí + více toků dat jedním programem je zpracováváno více různých souborů dat

Kryptoanalýza šifry PRESENT pomocí rekonfigurovatelného hardware COPACOBANA

Cache paměti (2) Cache paměti (1) Cache paměti (3) Cache paměti (4) Cache paměti (6) Cache paměti (5) Cache paměť:

Memory Management vjj 1

Memory Management vjj 1

Transkript:

Pokročilé architektury počítačů Architektura paměťového a periferního podsystému České vysoké učení technické, Fakulta elektrotechnická A4M36PAP Pokročílé architektury počítačů Ver.1.00 2010 1

Motivace Architektura Paměťový podsystém I/O podsystém A4M36PAP Pokročílé architektury počítačů 2

Disproporce ve výkonu proc-pam, Moorův zákon A4M36PAP Pokročílé architektury počítačů 3

Srovnání paměťových technologií Převzato z: A4M36PAP Pokročílé architektury počítačů 4

Paměťová hierarchie základní principy Programy/procesy přistupují v daném okamžiku jen k malé části svého adresového prostoru Časová lokalita Položky, ke kterým se přistupovalo nedávno, budou zapotřebí brzy znovu. Příklad: programová smyčka,proměnné instrukcí. Prostorová lokalita Položky poblíž nedávno používaným budou brzy zapotřebí také. Příklad: sekvenční přístup ike kódu, datová pole. A4M36PAP Pokročílé architektury počítačů 5

Co z uvedeného plyne? Je výhodné uspořádat paměťový prostor hierarchicky paměťová hierarchie. Všechny potřebné informace uchovávejte v sekundární paměti. Položky nedávno používané a blízké zkopírujte do (menší) paměti implementované DRAM. Operační paměť. Položky ještě častěji používané (i ty jim blízké) zkopírujte do menší a rychlejší SRAM. Skrytá paměť. A4M36PAP Pokročílé architektury počítačů 6

Jak a kde pak ale hledanou informaci najdeme? Podle adresy a informace o platnosti. Hledat začneme v paměti nejvyšší hierarchické úrovně (nejblíže procesoru). Požadavky: Paměťová konzistence. Prostředky: Virtualizace adresy, Mechanizmy uvolňování místa a migrace informace mezi paměťovými úrovněmi. Hit, miss. A4M36PAP Pokročílé architektury počítačů 7

Poznámka Každou paměť v hierarchii výše můžeme považovat za skrytou paměť nižší hierarchické úrovně. Přímo mapovaná skrytá paměť A4M36PAP Pokročílé architektury počítačů 8

Jen připomenutí: např. podle R.Lórenc, X36APS Mějme 8-mi blokovou skrytou paměť. Kam se do ní umístí blok 12 v případě Plně asociativní. Přímo mapované, nebo S omezeným stupněm asociativity N=2 (2-cestná, 2-way cache)? A4M36PAP Pokročílé architektury počítačů 9

Přímo mapovaná skrytá paměť podrobněji A4M36PAP Pokročílé architektury počítačů 10

SP s omezeným stupněm asociativity N=4 podrobněji A4M36PAP Pokročílé architektury počítačů 11

Paměťová hierarchie Různá hlediska posuzování: Rychlost, Velikost, Cena/kapacita, Úroveň. A4M36PAP Pokročílé architektury počítačů 12

Paměťová hierarchie konkrétně 256 B 1KB typická kapacita 8K-128KB kapacita, latence < 1ns 128 KB - 16 MB, ~10 ns latence (typicky) 128 MB 100+ GB, ~100 ns latence (typicky) A4M36PAP Pokročílé architektury počítačů 13

Virtualizace paměti VP je způsob správy operační paměti umožňující běžícímu procesu zpřístupnění paměťového prostoru, který je uspořádán jinak, nebo je dokonce větší, než je fyzicky připojená operační paměť. Převod mezi virtuální VA a fyzickou PA adresou může podporovat procesor (HW mapováním TLB, viz dále). V současně běžných operačních systémech je virtuální paměť implementována pomocí stránkování paměti spolu se stránkováním na disk, které rozšiřuje operační paměť o prostor na disku. * R. Lórenc, X36APS, 2005 A4M36PAP Pokročílé architektury počítačů 14

Virtuální paměť: spolupráce HW a SW A4M36PAP Pokročílé architektury počítačů 15

Virtuální paměť - stránkování Virtuální prostor tvoří stejně velké stránky (pages), které se přiřazují jednotlivým běžícím procesům. Fyzickou paměť tvoří stejně velké rámce (frames). A4M36PAP Pokročílé architektury počítačů 16

Realizace převodu adres? Tabulka stránek, Page Table. Jednotkou mapování jsou stránky, Stránka je také jednotkou přenosu mezi vedlejší a hlavní paměti. Mapovací funkce se nejčastěji implementuje Look-up Table (vyhledávací tabulkou). Příklad: A4M36PAP Pokročílé architektury počítačů 17

Tabulka stránek význam položek Look-up Table A4M36PAP Pokročílé architektury počítačů 18

Poznámky Každý proces má svou Tabulku stránek, Tedy i svou hodnotu PTBR (bázového registru). To, mimochodem, zajišťuje paměťovou bezpečnost procesů. Formát položky Tabulky stránek V Validity Bit. V=0 Stránka není platná. AR Access Rights. Přístupová práva (Read Only, Read/Write, Executable, apod.), Frame# - číslo rámce. V AR Frame# A4M36PAP Pokročílé architektury počítačů 19

Co dělat, když je výpadek stránky Page Fault? Fyzická paměť je volná, ale Rámec je prázdný, data jsou na disku. Požadovaná stránka se DMA načítá do prázdného rámce. Přepne se na případně čekající proces, který může probíhat. Po dokončení DMA přenosu přerušení, aktualizuje se Tabulka stránek procesu. Přepne se zpět na původní proces. Paměti je nedostatek Pomocí LRU najdeme rámec, který můžeme uvolnit. Má-li nastaven Dirty Bit, zapíšeme stránku do vedlejší paměti. Aktualizuje se Tabulka stránek procesu. A4M36PAP Pokročílé architektury počítačů 20

TLB Translation Lookaside Buffer Jde Paměť stránek udělat i jinak? Ano, skrytou pamětí. Plně asociativní TLB, reálné pro 256-512 položek). A4M36PAP Pokročílé architektury počítačů 21

Jak to potom vypadá? Běžná a bezpečná organizace hierarchie pamětí. Pozor: Namísto PA teď píšeme FA. Nevýhoda sekvenčního překladu pomocí TLB a následného čtení dlouhý Hit Time. Jsou možná i jiná uspořádání A4M36PAP Pokročílé architektury počítačů 22

Jiná uspořádání hierarchie s TLB nebo Pozor! Tady může dojít k přístupu jiných procesů do jiných bloků fyzické paměti. I tady se tomu říká Aliasing. A4M36PAP Pokročílé architektury počítačů 23

Srovnání, nenechte se zmást Virtuální paměť Stránka Page Fault Velikost stránky: 512 B 8 KB Asociativní Výběr oběti: LRU Write Back Skrytá paměť Blok/řádek Read/Write Miss Velikost bloku: 8 128 B DM, N-cestná, asociativní LRU/Náhodný Write Thru/Write Back Rozumíte pojmům? Co je oběť Závěr: každé adjektivum popisuje o něco jiného A4M36PAP Pokročílé architektury počítačů 24

Výkon paměťového podsystému A4M36PAP Pokročílé architektury počítačů 25

Opakování terminologie Vybavovací doba paměti Doba přístupu Propustnost Latence A4M36PAP Pokročílé architektury počítačů 26

Výpočet výkonnosti paměťového podsystému Hit: zásah. Data jsme nalezli v příslušném bloku paměti (tady blok X). Hit Time (HT) = vybavovací doba paměti příslušné úrovně. Zahrnuje samotný vybavovací čas pamětí vyšší úrovně + čas na určení Hit/Miss. Hit Rate (HR) = četnost zásahup podíl úspěšných k celkovému počtu přístupů. Miss: výpadek. Požadovaná data nebyla nalezena v dané úrovni paměti (blok X), ale až v nižší úrovni (blok Y), X Y.Procesor čekal. Miss Rate (MR) = 1 HR. Jinak též koeficient výpadku. Miss Penalty (MP) = čas na získaní dat z nižší úrovně paměti (blok Y) + čas na přenos dat do vyšší úrovně (blok X) + čas na doručení dat do procesoru. AMAT = HT + MR * MP AMAT (Memory Access Time). Střední přístupová doba do paměti. HT << MP. A4M36PAP Pokročílé architektury počítačů 27

Vliv paměťového podsystému na dobu výpočtu Tcpu = IC * (CPIint + CPImem) * Tclk = IC * (CPIint + MAPI * MR * MP) * Tclk MAPI Memory Access Per Instruction C Miss Per Instruction MPI = MAPI*MR = Memory Accesses * MR/IC Tcpu = IC * (CPIint + MPI * MP) * Tclk A4M36PAP Pokročílé architektury počítačů 28

Konkrétní příklad: Celeron Čtení/zápis z/do Registr procesoru Skrytá paměť L1 cca 3 Skrytá paměť L2 cca 14 Operační paměť cca 240 Počet taktů procesoru, které jsou zapotřebí 1či méně. To v případě úspěšného zřetězení instrukcí Zdroj: http://www.root.cz/clanky/architektury-vyrovnavacich-pameti/ A4M36PAP Pokročílé architektury počítačů 29

Paměťové čipy A4M36PAP Pokročílé architektury počítačů 30

Fáze přístupu k datům v DRAM čipu A4M36PAP Pokročílé architektury počítačů 31

Klasická DRAM asynchronní rozhraní Důvod rozdělení adresy na 2 části byl dán malým počtem pinů původních DRAM pouzder. Toto rozdělení se dodnes zachovává, ačkoli pouzdro už není problém. RAS Row Address Strobe, CAS Column Address Strobe A4M36PAP Pokročílé architektury počítačů 32

EDO DRAM cca 1995 EDO DRAM má registr na výstupu, což umožní překrýt následující CAS s čtením předchozích dat. A4M36PAP Pokročílé architektury počítačů 33

SDRAM konec 90.let časování čtení synchronních DRAM SDRAM čip obsahuje čítač, který umožňuje nastavit délku souvislého (burst) čtení dat. A4M36PAP Pokročílé architektury počítačů 34

SDRAM paměť současnosti SDRAM frekvence až 100 MHz, 2.5V. DDR SDRAM použití obou hran CLK při přenosu dat, 2.5V. DDR2 SDRAM snížení spotřeby použitím napětí 1.8V, frekvence až 400 MHz. DDR3 SDRAM snížení spotřeby použitím napětí 1.5V, frekvence až 800 MHz. DDR4 SDRAM Dále ještě existují paměti a moduly RAMBUS, které ovšem mají zcela odlišné rozhraní i způsob použití. Všechny tyto inovace vylepšují propustnost čtení dat, nikoli latenci čtení první položky. A4M36PAP Pokročílé architektury počítačů 35

Architektura A4M36PAP Pokročílé architektury počítačů 36

Co je úkolem? Propojit jednotlivé části výpočetního systému Možnosti? Optimální datové cesty S ohledem na závislost cena/výkon existuje hranice výkonnosti datové cesty je možné sdílet Datové cesty je výhodné sdílet A4M36PAP Pokročílé architektury počítačů 37

Obecně architektura počítače A4M36PAP Pokročílé architektury počítačů 38

A4M36PAP Pokročílé architektury počítačů 39

Příklad I. A4M36PAP Pokročílé architektury počítačů 40