Pokročilé architektury počítačů

Rozměr: px
Začít zobrazení ze stránky:

Download "Pokročilé architektury počítačů"

Transkript

1 Pokročilé architektury počítačů Přednáška 3 Hierarchické uspořádání pamětí počítače Martin Milata

2 Obsah Paměťový subsystém Obvyklé chování programů při přístupu do paměti Cache paměti princip činnosti optimalizace hierarchizace cache pamětí Virtuální paměť a stránkování synonyma a homonyma TLB Cache Hlavní paměť dynamická paměť organizace hlavní paměti

3 Paměťový systém a Cache Přístupová doba do hlavní (DRAM) paměti je dnes extrémně velká ve srovnání s rychlostí CPU Přímý přístup do hlavní paměti by měl značný negativní dopad na výkonnost procesoru Přítomnost Cache systému má zajistit přístupovou dobu srovnatelnou s extrémně rychlými pamětmi při současném použití levných DRAM pamětí značné velikosti

4 Cache jako zprostředkovatel přístupu do hlavní paměti Otázkou je, jak je možné, že malý kus rychlé paměti dokáže do značné míry předat svou rychlost celému paměťovému systému? Aplikace v jednom okamžiku obvykle využívá jen malou část svého, jinak značně velkého, paměťového prostoru (chování se označuje jako princip lokality) Malá část pomalé paměti, které je právě využívána, může být uložena v rychlé paměti cache Dočasně ukládaná část má obvykle fixní velikost a nazývá se blok Otázkou zůstává Na jaké místo paměti cache kopírovaný blok umístit? Jak bude blok vyhledán, pokud je v paměti cache umístěn? Co se stane při zaplnění cache a vzniklé nutnosti zapsat nový blok? Jak bude realizován zápis dat?

5 Princip lokality Princip lokality Aplikace v jednu chvíli pracuje obvykle jen s malou částí svého paměťového prostoru. Dva typy lokálního přístupu Dočasná lokálnost (Temporary Locality) Použitý paměťový blok bude znovu použit v blízké budoucnosti např. při zpracovávání smyček (podmínky, či inkrementované proměnné) Prostorová lokálnost (Spatial Locality) Pokud je použit paměťový blok, je pravděpodobné, že bude brzy použit další v jeho těsné blízkosti např. přístup k prvkům pole

6 Terminologie Cach pamětí Čtení dat z cache (Cache Hit) Požadované data byla nalezena v některém z bloků, které právě cache paměť obsahuje Četnost čtení z paměti cache (Hit rate) je určená jako počet přístupů do cache s nalezením požadovaných dat dělená celkovým počtem přístupů do paměti Přístupová doba cache paměti (Hit time) je čas potřebný k nalezení požadovaných dat a jejich předání CPU Výpadek cache (Cache Miss) Cache paměť neobsahuje požadovaná data. Ta musejí být dodána z pamětí nižšího stupně (cache vyšší úrovně nebo hlavní paměť). Četnost výpadků cache (Miss rate) reprezentuje doplněk k četnosti čtení z cache (Miss rate = 1 Hit rate) Pokuta výpadku cache (Miss penalty) je doba potřebná k získání dat z pomalejší paměti, výměně bloku v cache a doručení dat na procesor Přístupová doba, stejně jako pokuta výpadku cache, může být měřena buď jako absolutní časová hodnota nebo jako počet cyklů procesoru, které uplynou do dodání požadovaných dat.

7 Terminologie Cache paměti Blok (Block/Line) Skupina (nebo Set) Každý blok pomalejší paměti má přesně stanovené místo, kam může být v cache uložen. Velikost setu v cache paměti je právě jeden blok. Plně asociativní paměť Skupina bloků v cache paměti, která může být použita pro uložení dat z pomalejší paměti. Úseky pomalé pamětí jsou obvykle jednoznačně mapovány na jednotlivé skupiny, jenž můžou být pro uložení dat použity. Přímo mapovaná paměť Jedná se o skupinu paměťových slov pevné délky, jenž slouží jako jednotka pro přenos dat mezi různě rychlými pamětmi. Blok z pomalé paměti může být uložen kdekoliv v cache. Cache paměť obsahuje jen jeden set. N-cestně asociativní paměť V každém setu cache paměti může být uloženo právě N bloků.

8 Na jaké místo paměti cache kopírovaný blok umístit? Místo v cache, kde může být paměťový blok uložen je obvykle více či méně určeno strukturou cache paměti. Plně asociativní cache umožňuje zaplnit svůj libovolný blok libovolným blokem pomalé paměti Přímo mapovaná cache každému bloku pomalé paměti striktně definuje jedinou možnou pozici pro jeho uložení N-cestně (zde dvou-cestně) asociativní cache definuje vždy dvě pozice pro možné uložení bloku z pomalé paměti.

9 Jak bude blok vyhledán, pokud je v paměti cache umístěn? Cache paměť musí obsahovat adresní značky (tags), které informují o adrese bloku v pomalejší paměti Všechny značky dané skupiny (setu) jsou prohledávaný paralelně na shodu s požadovanou adresou. Data v cache nesou příznak platnosti (valid bit) Vztah mezi adresou zasílanou procesorem a obsahem cache Procesorem zaslaná adresa je nejprve dělena na adresu bloku a offset bloku. Adresa bloku se obvykle dále dělí na tag (vyhledávání v rámci setu) a index (jednoznačné určení jednoho ze setů cache paměti). Při kontrole přítomnosti bloku v cache se nepoužívá hodnota offsetu. Celý blok musí být přítomen s nastaveným příznakem validity. Kontrola shodnosti tagu se provádí jen v rámci indexem zvoleného setu.

10 Co se stane při zaplnění cache a vzniklé nutnosti zapsat nový blok? Pokud dojde k výpadku cache, je jeden z bloků přepsán požadovanými daty z nadřazené paměti. Řídící logika cache paměti musí rozhodnout, který z bloků bude nahrazen Přímo mapovaná paměť volí vždy jeden daný blok. HW implementace volby bloku je jednodušší N-cestně asociativní a plně asociativní paměť má možnost výběru z více bloků. HW implementace je složitější a závisí na zvolené strategii výběru Náhodný výběr (Random) vybrán je náhodný z možných bloků (výběr bývá speudo-náhodný) Strategie je vhodná pro velké cache kde má výsledky podobné s LRU. Nejdéle nepoužívaný (Last-recently used - LRU) vybrán je blok, jenž byl nejdéle nepoužíván. Předpokládá se jeho neaktuálnost vzhledem k lokalitě běhu programu a tudíž i nepoužitelnost v budoucnu Frontová strategie (First-in First-out) LRU přístup je z důvodu náročné implementace aproximován strategii FIFO. Blok na konci fronty představuje v paměti nejstarší (neznamená nejdéle nepoužívaný).

11 Jak bude realizován zápis dat? Procesor aktualizuje data v cache. Další postup závisí na zvoleném scénáři Okamžitá aktualizace (Write through) Opožděná aktualizace (Write back) Současně se aktualizuje cache i pomalá paměť Dnes vždy kombinována s tzv. zápisovým bufferem (write buffer). Zamezí se čekání na aktualizaci pomalé paměti. Změněné informace jsou uloženy v cache a do pomalé paměti zapsány až v okamžiku potřeby výměny bloku v cache Cache je pro každý blok vybavena příznakovým bitem, který udává, zda v rámci bloku došlo ke změně dat (dirty bit) Pro a proti? WT vhodnější při sdílení cache mezi více jádry procesoru (obvyklý pro L2 a L3 cache) WB - aktualizace pomalé paměti se neprovádí opakovaně, v případě výpadku a náhrady bloku vnáší další latenci

12 Write Buffer a Cache Prostřednictvím Write bufferu se provádí aktualizace pomalé paměti bez nutnosti čekání procesoru na její dokončení. Procesor zapisuje změny do cache paměti a write bufferu Řadič paměti (memory controller) zapisuje změny z WB do pomalé paměti Write Buffer bývá implementován jako jednoduchá fronta (FIFO) Typický počet položen je roven 4. Pokud pro zápis požadovaná data nejsou v cache paměti, aplikuje se jeden z následujících dvou přístupů Zápis s výpadkem cache (Write allocate) V cache je aktualizován blok do něhož měly být data zapsána Zápis bez výpadku cache (No-write allocate) Cache paměť zůstává požadavkem na zápis nedotčená

13 Výpadek cache paměti Výpadky cache paměti můžeme kategorizovat podle tzv. třech C kritérií Nucený (Compulsory) jedná se obvykle o první přístup procesoru k paměti v rámci provádění nově spuštěné aplikace Kapacitní (Capacity) cache paměť není schopna pojmout všechny bloky potřebné při provádění programu Konflitkní (Conflict) strategie výměny bloků v cache paměti působí konflikty nad stejným blokem v cache (paměť není dostatečně asociativní) Výpočet průměrné doby přístupu do paměti (AMAT) Average memory access time = Hit time + Miss rate x Miss penalty kde: Hit time je přístupová doba do cache paměti bez výpadku Miss rate je četnost výpadků Miss penalty je doba potřebná k získání dat při výpadku cache

14 Základní optimalizace cache paměti Snižování četnosti výpadků cache paměti Zvýšením velikosti bloku využívá principu lokality zvyšuje pokutu při výpadku cache paměti Zvýšení velikosti cache paměti redukuje kapacitní výpadky potenciálně zvyšuje přístupovou dobu k datům v cache, nároky na napájení a cenu Zvýšení asociativity cache paměti snižuje počet konfliktních výpadků zvyšuje přístupovou dobu k datům v cache paměti Více úrovňová cache paměť napomáhá ke snížení pokuty v případě výpadku cache paměti nižší stupně Cache vyššího úrovně může být kapacitně větší, mít větší velikost bloku a větší asociativitu

15 Závislost četnosti výpadků na velikosti cache a její asociativitě Obrazový materiál převzat z wikipedia.org

16 Základní optimalizace cache paměti Priorizace výpadků cache při čtení před výpadky při zápisu Výpadek při zápisu do cache je dočasně potlačen pomocí zápisového bufferu (write buffer). Změna je uložena k zápisu pouze v něm s tím, že příslušný blok bude v cache vyměněn po obsloužení prioritnějších výpadků způsobených při čtení z cache Přináší potenciální datový hazard. Čtená data nemusí být aktuální. Zápisový buffer se proto prohledává a pokud má dojít ke konfliktu, je nejdříve obsloužen zápis. Snížení času vyhledávání v cache pomocí použití společné části fyzické a virtuální adresy (page offset) Jak virtuální tak fyzická adresa má obvykle společnou (neměnnou) část page offset Během překladu adresy z virtuální na fyzickou může paralelně probíhat prohledávání cache podle page offset indexu K prohledávání cache na schodu tagu již ale musí být použita fyzická adresa

17 Pokročilé optimalizace cache (I) Použití malé jednoduché cache s minimální přístupovou dobou Důvod je potřeba extrémní rychlosti a z toho plynoucí přítomnosti cache na čipu procesoru Predikce dalšího přístupu L1 cache se s vývojem procesorů příliš nezvětšuje Cache uchovává informaci o předpokládaném dalším přístupu s tím, že v okamžiku potřeby je paralelně kontrolována správnost predikce, případné vyhledávání nepredikovaných dat a načítání predikovaných dat (1. takt) Pokud je predikce chybná jsou na základě výsledků hledání načtena případná data (2. takt) Zřetězení přístupu do paměti cache Zpoždění cache paměti první úrovně bývá často několik taktů (4 takty pro i7) Díky zřetězení přístupu je možný překryv požadavků na cache. Teoreticky je tak možno docílit vydání jednoho výsledku v každém taktu.

18 Pokročilé optimalizace cache (II) Specializované vyrovnávací paměti Victim Cache Vedle přímo mapované cache je přítomen malý, většinou 4 položkový buffer pro data, jenž jsou z původní cache vyřazena kvůli konfliktům. V některých případech dokáže pomocí přídavného bufferu pokrýt až 90% výpadků 4 KB přímo mapované paměti Trace Cache Slouží k uchování dekódovaných mikroinstrukcí (například architektury P4) Jejich obsah není dán statickým uspořádáním instruckí programu v paměti, ale je vytvářen dynamicky při jejich dekódování Odbourávají nutnost opětovného dekódování instrukcí na mikrokód v případě jeho opětovného provádění (smyčka) Nehalem používá obdobnou jednotku Loop Stream Detector s 28 položkami (LSD) pro práci se smyčkami

19 Pokročilé optimalizace cache (III) Neblokující cache paměť Cílem neblokující paměti je umožnit čtení dat před dokončením obsluhy výpadku Výpadek datové cache nemusí ovlivnit vydávání instrukcí. Mohou vznikat další požadavky na přístup do cache. Režimy hit under miss, miss under miss, hit under multiple miss Poslední režim vyžaduje podporu obsluhy více výpadků u pomalejší paměti Cache rozdělená do více banků Umožňuje více paralelních přístupu Vyžaduje jednoznačné mapování bloků na banky, obvykle sekvenční prokládání

20 Pokročilé optimalizace cache (IV) Paměť s rychlým předáváním dat při výpadku Procesor obvykle potřebuje jen jedno slovo z bloku, který je při výpadku v paměti zaměňován Cílem optimalizace je nečekat na načtení celého bloku, ale předat data v okamžiku, kdy jsou k dispozici. Přednostní čtení požadovaného slova z pomalejší paměti s okamžitým předáním procesoru Čtení bloku z pomalé paměti ve standardním uspořádání. Nečeká se však na dokončení čtení ale na přečtení požadovaných dat. Následuje okamžité předání na CPU V obou případech je čtení bloku následně dokončena Má význam především pro cache s velkými bloky Write Buffer a aktualizace obsahu Pokud další požadavek na zápis dat míří do bloku, jenž write buffer obsahuje, není do něj přidáván další blok, ale proběhne aktualizace informace v již existujícím bloku. Často spojováno s tzv. victim cache

21 Pokročilé optimalizace cache (IV) Optimalizace kódu kompilátorem Nevyžaduje změnu v HW. Má však značný výkonový dopad Cílem optimalizace je reorganizovat vytvářený kód bez dopadu na jeho funkčnost tak, aby co nejefektivněji pracoval s právě dostupnými paměťovými bloky Reorganizace kódu a dat Příkladem je zarovnání velikosti tzv. základních bloků programu s velikostí bloku cache. Při provádění základního bloku tak nedochází k výpadkům. Úprava smyček Čílem je upravit kód tak, aby jinak nesekvenční přístup k datům ve smyčce, odpovídal fyzické organizaci dat. Typickým příkladem je práce s dvourozměrnými poli jejichž velikost překračuje velikost bloku cache.

22 Cache a optimalizace provádění smyček Neoptimální varianta for (j=0; j<100; j++) { for (i=0; i<5000; i++){ x[i][j]++; } } Přístup k prvkům pole neodpovídá jejich fyzické organizaci Velká vzdálenost mezi dvěma prvky znamená výpadek cache Optimalizované varianta for (i=0; i<5000; i++){ for (j=0; j<100; j++){ x[i][j]++; } } Optimalizace vede k mnohem intenzivnější práci s bloky, jenž jsou právě k dispozici

23 Pokročilé optimalizace cache (VI) HW řízené dopředné načítání bloků do cache (HW Prefetching) Cílem je načíst blok do paměti cache předtím, než jej bude procesor potřebovat Bloky určené pro instrukční a datovou cache mohou být načítány dopředně Často umisťovány ve tzv. stream buffer. Může být replikován (max 8) Replikace se využívá především při kombinovaném dopředném načítání instrukčních a datových bloků SW řízené dopředné načítání bloků do cache (SW Prefetching) Obdoba předchozí HW implementace Vyžaduje spolupráci s HW v podobě speciálních instrukcí pro CPU Realizuje se dopředné načítání obsahu registrů výměny bloků v cache Potřeba kontrolovat zda zátěž, kterou SW prefetching přinese nepřekračuje možný přínos.

24 Shrnutí optimalizace Cache pamětí Technika Hit Bandtime width Miss penalty Miss rate HW složitost + 0 Jednoduchá a malá cache - Predikce přístupů - Zřetězení přístupů + Victim cache - 2 Trace cache - 3 Neblokující cache Dělená cache (+) Cache s rychlým předáváním na CPU - 2 Aktualizace write buffer - 1 Optimalizace kompilátorem - 0 HW Prefetching až 3 SW Prefetching prodloužení času 0 není složité - zkrácení času 3 složité

25 Hierarchické uspořádání cache paměti Evoluci hierarchie paměťového subsystému ovlivňoval především nerovnoměrný vývoj v rychlostech procesorů a samotných pamětí Vyrovnávání rozdílu rychlostí pomocí cache umístěné na základní desce (intel 386) Vložení cache na čip procesoru vynutila nedostačující rychlost externí cache paměti. Externí je dále využívána (po Pentium MMX) Externí cache přináší jen nepatrné zrychlení oproti hlavní paměti dále se nepoužívá. Hierarchie cache je přesunuta na čip procesoru Rozšiřování hierarchického uspořádání s přítomností více jader na jednom čipu

26 Paměťový subsystém v architektuře Intel Nehalem (Datová část)

27 Paměťový subsystém v architektuře Intel Nehalem (Instrukční část)

28 Virtuální paměť a stránkování Virtuální paměť (Virtual Memory - VM) zajišťuje automatizovaný management dvoustupňové hierarchie paměti (hlavní paměť a disk) umožňuje programu přidělit adresní prostor větší než prostor celé hlavní paměti umožňuje sdílet hlavní paměť více nezávislými procesy, jenž mohou být v hlavní paměti umístěny na libovolném místě Terminologie Virtuální paměti V mnohém sdílí myšlenky s hierarchií cache paměti Stránka (page) nebo segment obdoba bloku Výpadek stránky (page fault) absence stránky v hlavní paměti. Podobně výpadek cache paměti je obsloužen načtením stránky z pomalejší paměti (disku). Virtuální adresa jednoznačně adresuje slovo ve VM, před přístupem do fyzické paměti musí být proveden její převod na fyzickou adresu Převod virtuální adresy na fyzickou je nazýván překlad nebo mapování Předpokládá se, že posluchač je obeznámen s problematikou virtuální paměti a stránkování.

29 Virtuální paměť Hledisko umístění stránky ve fyzické paměti Mezi virtuálním a fyzickým adresním prostorem existuje pevné mapování. Část virtuální adresy je za pomoci tabulky stránek překládána na fyzickou adresu. Pro urychlení překladu se využívá rychlá vyrovnávací paměť (Translation Lookaside Buffer TLB) s omezeným počtem posledních prováděných překladů Která stránka bude ve fyzické paměti nahrazena v případě výpadku Stránka může být v hlavní paměti umístěna na libovolném místě. Volba místa je záležitostí operačního systému. Výměna stránek není plně HW asistována. Jak je stránka v paměti nalezena Hlavní paměť lze chápat jako plně asociativní z pohledu možnosti umístit stránku Záleží na scénáři nahrazování. Obvykle se operační sytém pokouší najít nejdéle nepoužitou stránku (LRU) a tu nahrazuje. LRU používá HW podporu v podobě příznaku použití stránky (use bit nebo reference bit) Jak je se stránkami zacházeno při změně jejich obsahu Pro zápis je obvykle využívána strategie opožděného zápisu (write back) s použitím příznaku změn (dirty bit)

30 Virtuální paměť a stránkování

31 Synonyma a homonyma při překladu adres Homonyma virtuálních adres Stejná virtuální adres ve dvou rozdílných kontextech (procesech) míří na rozdílná místa ve fyzické paměti Zabraňuje jednoduchému ponechání záznamů v TLB v případě přepnutí kontextu procesoru. Synonyma virtuálních adres Rozdílné virtuální adresy ve stejném kontextu nebo rozdílných kontextech ukazují na stejnou fyzickou adresu Problém pro cache indexované podle virtuální adresy. Aktualizace dat pod jednou virtuální adresou v cache vede k nekonzistenci při přístupu k datům pod jinou virtuální adresou (stejná data jsou v cache umístěna dvakrát). Řešením je zabránění možnosti koexistence synonym v cache. Na úrovni operačního systému Barvení stránek HW asistovaná řešení

32 TLB Cache TLB cache Slouží k urychlení překladu často požadovaných virtuálních adres. Malá plně asociativní cache paměť s obvykle 64 záznamy na L1. Dnes hierarchizována. L2 okolo 512 záznamů s omezenou asociativitou (4 čestně asociativní) Platnost záznamů závisí na aktuálním kontextu procesoru (aktuálně používané stránce) Pokud dojde ke změně kontextu musí se TLB vymazat. Procesy mají stejný virtuální prostor. Překlad adres by nepracoval správně. Řešením je přidání identifikace procesu k záznamům v TLB. Pokud nesouhlasí s ID aktuálního procesu nesmí být záznam použit. Problematika synonym a homonym v návaznosti na ostatní cache Indexování cache podle virtuální adresy

33 Index a Tag v cache paměti V závislosti na uspořádání a vztahu virtuálních a fyzických adres, mohou být index a tag pro cache voleny následujícími způsoby Virtuální index, virtuální tag (odvozeny od virtuální adresy) Pro přístup je použito přímo virtuální adresy bez nutnosti jejího překladu. Prohledávání cache může začít okamžitě. Problematické při přepínání kontextů. Cache musí být vymazána. Virtuální index, fyzicky tag Fyzický index, virtuální tag Umožňuje paralelizaci přístupu do cache a překladu virtuální adresy při použití offsetu stránky jako cache tagu (při překladu se němění) Fyzický index, fyzický tag (odvozeny od fyzické adresy)

34 Hlavní paměť Výkonnost hlavní paměti Zpoždění hlavní paměti Šířka přístupového kanálu do HP Velikost datové sběrnice (nepřímo velikost datových bloků) Dynamická hlavní paměť (DRAM resp. SDRAM) Paměť vyžaduje pravidelné obnovování obsahu dnes okolo 8ms, paměť v této době nelze používat, konzumuje méně než 1% času Adresa bývá dělena do dvou částí vzhledem k maticové organizaci paměti Přístupová doba (doba mezi vysláním požadavku a obdržením požadovaných dat) Přístupový cyklus (čas mezi jednotlivými požadavky) RAS (adresa řádku) CAS (adresa sloupce) Statická paměť s náhodným přístupem (SRAM) nevyžaduje obnovování obsahu (konstrukčně využívá 6 tranzistorů, zabírá více místa, je energeticky náročnější a dražší)

35 Dynamická paměť Organizace paměti Maticová organizace paměti snížení počtu adresních pinů rozdělení adresy do dvou bloků (adresa řádku a adresa sloupce) Přístup k paměti zaslání adresy řádku (výběr řádku matice) zaslání adresy sloupce (vybrání konkrétní paměťové buňky) přečtení dat (data poskytnuta na datovou sběrnici) zpětný zápis dat (čtením jsou data v buňce znehodnocena, je potřeba je znovu zapsat)

36 Časování dynamické paměti Časování pamětí (4 klíčové parametry) CL (CAS Latency) TRCD (Row Address to Column Address Delay) počet cyklů mezi otevřením řádku a přístupem k sloupci v něm TRP (Row Precharge Time) čas potřebný pro získání dat po odeslání adresy sloupce (předpokládá se otevřený řádek, ze kterého se čte) počet cyklů mezi předchozím příkazem a otevřením nového řádku (práce s předchozím řádkem musí být ukončena) TRAS (Row Active Time) celkový počet cyklů potřebný k získání dat z paměti obvykle roven součtu předchozích hodnot

37 Evoluce optimalizací hlavní paměti Asynchronní hlavní paměť Vybavování požadavku je zahájeno v okamžiku změny řídícího signálu Signály řízení se po dobu vybavování prakticky nedají měnit Řadič paměti provádí synchronizaci se sběrnicí na úrovni požadavek odpověď Synchronní hlavní paměť Řídící signály jsou zpracovávány až ve chvíli příchodu hodinového signálu sběrnice (synchronizace s řadičem paměti) Požadovaná operace může být zaznamenána a vykonávána nezávisle na případných změnách řídících signálu Další požadavek může být na hlavní paměť zaslán dříve, než je předchozí vybaven (zřetězení požadavků na HP) Předpokládá se fixní známý počet cyklů mezi zasláním požadavku a vybavením dat

38 Evoluce optimalizací hlavní paměti Fast Page Mode Přináší možnost opakovaného čtení nebo zápisu dat v rámci adresovaného řádku, bez nutnosti znovu zasílání jeho adresy přineslo zvýšení výkonu při lokálních operacích (shlukové čtení nebo zápis) Další rozšíření v podobě přímého shlukového čtení (skupina blízkých/sousedních slov) nebo další dodatečné minimalizací času potřebných pro adresaci sloupce Double Data Rate Data mohou být přenášena na sestupnou i vzestupnou hranu hodinového signálu Interní organizace v podobě více modulů, větší propustnost dat mezi pamětí a řadičem zvýšení spotřeby, snížení napájecího napětí (1.8V, 1.5V)

39 Evoluce optimalizací hlavní paměti Prokládána paměť (Interleaved Memory) Paměť je organizována do několika skupin paměťových čipů (paměťových bank) Datová slova jsou do bank zapisována prokládaně například podle vzoru a mod N Paměť s N skupinami může realizovat N-cestné prokládání (N obvykle mocnina 2) a reprezentuje adresu slova a N počet paměťových bank Banky jsou na sobě nezávislé Časování operace nad jedním neovlivňuje ostatní. Zvýšení počtu paralelismu proveditelných nad HP (Překryv operací nad banky). Organizace 32 slov do paměti s 4-cestným prokládáním Bank Bank Bank Bank

40 Evoluce optimalizací hlavní paměti Rozdílné časování paměti a IO sběrnice Vnitřní organizace paměť (shlukové operace, prokládání) umožňuje poskytovat v jednom paměťovém taktu více datových slov Přenos slov na vzestupnou a sestupnou hranu hodinového signálu přestává stačit Oddělení interního časování paměti a časování sběrnice představeno u standardu DDR2 SDRAM Srovnání DDR, DDR2, DDR3 s časováním paměti 100MHz DDR DDR2 DDR3 MemClk MHz BusClk MHz DataRate MTps PeakTrans MBps Timing Clk CAS ns

41 Synchronous Dynamic RAM

42 Hlavní paměť organizace Jednoduchá organizace hlavní paměti Jednoduchost modelu, snadná implementace, velká latence Paměť s širokým datovým slovem Šířka datového slova je zachována po celou cestu hierarchii paměti od procesoru až po hlavní paměť Datová sběrnice mezi hlavní pamětí a cache pamětí je rozšířena na N násobek velikosti datového slova procesoru. Dodatečný HW k realizaci výběru konkrétního slova z N slov dlouhého řádku v cache. Významné snížení latence paměti při sekvenčním čtení v rámci N slov Prokládaná hlavní paměť Hlavní paměť je rozdělena na nezávislé moduly. Na každý z modulů jsou požadavky zasílány samostatně. Dochází ke zřetězení přístupů do HP. Snížení latence, odpadá potřeba široké sběrnice, komplexnější řadič paměti

43 Hlavní paměť organizace Sběrnice mezi CPU Stejná šířka sběrnice a Cache je rozšířena o mezi CPU a Cache, multiplexor (zúžení k CPU). Cache a Hlavní pamětí Cache a Hlavní pamětí propojena N širokou sběrnicí Paměť organizována do samostatných banků. Datová sběrnice má stejnou šířku na všech úrovních.

44 Hlavní paměť organizace Prokládaná HP Sekvenčně řazená slova jsou podle známého vzoru ukládána do jednotlivých banků paměti (jako vzor lze chápat mod počet banků ) Počet banků HP přístupové době do paměti Srovnání výkonu Jednoduchá HP 4 x ( ) = 32 taktů HP s širokým datovým slovem pro srovnání předpokládejme 1 takt pro zaslání adresy, 6 taktů pro vybavení požadavku, 1 takt pro zaslání dat požadavek na čtení zahrnuje 4 slova v HP (jeden blok v cache) = 8 taktů Prokládaná HP x 1 = 11 taktů

45 Závěr Paměťový subsystém počítače Cache paměti a jejich optimalizace Evoluce v hierarchii cache pamětí Virtuální paměť a stránkování návaznost na cache rychlý překlad Hlavní paměť dynamická paměť a její organizace

46 Dotazy?

47 Literatura John L. Hennessy, David A. Patterson, Computer Architecture: A Quantitative Approach (4th Edition) William Stallings, Computer Organization and Architecture Designing for Performance (8th Edition) Paul H. J. Kelly, Advanced Computer Architecture Lecture notes 332 B. Keeth, R. J. Baker, B. Johnson, Dram circuit design: fundamentals and high-speed topics Andrew S. Tanenbaum, Operating Systems: Design and Implementation 47

Paměťový podsystém počítače

Paměťový podsystém počítače Paměťový podsystém počítače typy pamětových systémů počítače virtuální paměť stránkování segmentace rychlá vyrovnávací paměť 30.1.2013 O. Novák: CIE6 1 Organizace paměťového systému počítače Paměťová hierarchie...

Více

Pokročilé architektury počítačů

Pokročilé architektury počítačů Pokročilé architektury počítačů Architektura paměťového a periferního podsystému České vysoké učení technické, Fakulta elektrotechnická A4M36PAP Pokročílé architektury počítačů Ver.1.00 2010 1 Motivace

Více

Struktura a architektura počítačů (BI-SAP) 11

Struktura a architektura počítačů (BI-SAP) 11 Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Struktura a architektura počítačů (BI-SAP) 11 doc. Ing. Hana Kubátová, CSc. Katedra číslicového návrhu Fakulta informačních technologii

Více

Mezipaměti počítače. L2 cache. L3 cache

Mezipaměti počítače. L2 cache. L3 cache Mezipaměti počítače Cache paměť - mezipaměť Hlavní paměť procesoru je typu DRAM a je pomalá. Proto se mezi pomalou hlavní paměť a procesor vkládá menší, ale rychlá vyrovnávací (cache) paměť SRAM. Rychlost

Více

Operační systémy. Jednoduché stránkování. Virtuální paměť. Příklad: jednoduché stránkování. Virtuální paměť se stránkování. Memory Management Unit

Operační systémy. Jednoduché stránkování. Virtuální paměť. Příklad: jednoduché stránkování. Virtuální paměť se stránkování. Memory Management Unit Jednoduché stránkování Operační systémy Přednáška 8: Správa paměti II Hlavní paměť rozdělená na malé úseky stejné velikosti (např. 4kB) nazývané rámce (frames). Program rozdělen na malé úseky stejné velikosti

Více

Přednáška. Správa paměti II. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012

Přednáška. Správa paměti II. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012 Přednáška Správa paměti II. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012 Příprava studijního programu Informatika je podporována projektem financovaným z Evropského

Více

Pamět ová hierarchie, návrh skryté paměti 2. doc. Ing. Róbert Lórencz, CSc.

Pamět ová hierarchie, návrh skryté paměti 2. doc. Ing. Róbert Lórencz, CSc. Architektura počítačových systémů Pamět ová hierarchie, návrh skryté paměti 2 doc. Ing. Róbert Lórencz, CSc. České vysoké učení technické v Praze Fakulta informačních technologií Katedra počítačových systémů

Více

Pamět ová hierarchie, návrh skryté paměti cache 2

Pamět ová hierarchie, návrh skryté paměti cache 2 Architektura počítačových systémů Róbert Lórencz 8. přednáška Pamět ová hierarchie, návrh skryté paměti cache 2 http://service.felk.cvut.cz/courses/36aps lorencz@fel.cvut.cz Róbert Lórencz (ČVUT FEL, 2005)

Více

Systém adresace paměti

Systém adresace paměti Systém adresace paměti Základní pojmy Adresa fyzická - adresa, která je přenesena na adresní sběrnici a fyzicky adresuje hlavní paměť logická - adresa, kterou má k dispozici proces k adresaci přiděleného

Více

Paměťová hierarchie. INP 2008 FIT VUT v Brně

Paměťová hierarchie. INP 2008 FIT VUT v Brně Paměťová hierarchie INP 2008 FIT VUT v Brně 000 Výkonová mezera mezi CPU a pamětí Moorův zákon CPU CPU 60% za rok (2X/.5roku) výkonnost 00 0 980 98 DRAM 982 983 984 985 986 987 988 989 990 99 992 993 994

Více

Paměti. Paměť je zařízení, které slouží k ukládání programů a dat, s nimiž počítač pracuje

Paměti. Paměť je zařízení, které slouží k ukládání programů a dat, s nimiž počítač pracuje Paměti Paměť je zařízení, které slouží k ukládání programů a dat, s nimiž počítač pracuje Paměti počítače lze rozdělit do tří základních skupin: registry paměťová místa na čipu procesoru jsou používány

Více

Pamět ová hierarchie, virtuální pamět. doc. Ing. Róbert Lórencz, CSc.

Pamět ová hierarchie, virtuální pamět. doc. Ing. Róbert Lórencz, CSc. Architektura počítačových systémů Pamět ová hierarchie, virtuální pamět doc. Ing. Róbert Lórencz, CSc. České vysoké učení technické v Praze Fakulta informačních technologií Katedra počítačových systémů

Více

Paměti EEPROM (1) Paměti EEPROM (2) Paměti Flash (1) Paměti EEPROM (3) Paměti Flash (2) Paměti Flash (3)

Paměti EEPROM (1) Paměti EEPROM (2) Paměti Flash (1) Paměti EEPROM (3) Paměti Flash (2) Paměti Flash (3) Paměti EEPROM (1) EEPROM Electrically EPROM Mají podobné chování jako paměti EPROM, tj. jedná se o statické, energeticky nezávislé paměti, které je možné naprogramovat a později z nich informace vymazat

Více

Struktura a architektura počítačů (BI-SAP) 10

Struktura a architektura počítačů (BI-SAP) 10 Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Struktura a architektura počítačů (BI-SAP) 10 doc. Ing. Hana Kubátová, CSc. Katedra číslicového návrhu Fakulta informačních technologii

Více

Paměti a jejich organizace

Paměti a jejich organizace Kapitola 5 Paměti a jejich organizace 5.1 Vnitřní a vnější paměti, vlastnosti jednotlivých typů Vnější paměti Jsou umístěny mimo základní jednotku. Lze je zařadit mezi periferní zařízení. Zápis a čtení

Více

Paměti Josef Horálek

Paměti Josef Horálek Paměti Josef Horálek Paměť = Paměť je pro počítač životní nutností = mikroprocesor z ní čte programy, kterými je řízen a také do ní ukládá výsledky své práce = Paměti v zásadě můžeme rozdělit na: = Primární

Více

Dělení pamětí Volatilní paměti Nevolatilní paměti. Miroslav Flídr Počítačové systémy LS /11- Západočeská univerzita v Plzni

Dělení pamětí Volatilní paměti Nevolatilní paměti. Miroslav Flídr Počítačové systémy LS /11- Západočeská univerzita v Plzni ělení pamětí Volatilní paměti Nevolatilní paměti Počítačové systémy Vnitřní paměti Miroslav Flídr Počítačové systémy LS 2006-1/11- Západočeská univerzita v Plzni ělení pamětí Volatilní paměti Nevolatilní

Více

Operační paměti počítačů PC

Operační paměti počítačů PC Operační paměti počítačů PC Dynamické paměti RAM operační č paměť je realizována čipy dynamických pamětí RAM DRAM informace uchovávána jako náboj na kondenzátoru nutnost náboj pravidelně obnovovat (refresh)

Více

Paměti EEPROM (1) 25/07/2006 1

Paměti EEPROM (1) 25/07/2006 1 Paměti EEPROM (1) EEPROM - Electrically EPROM Mají podobné chování jako paměti EPROM, tj. jedná se o statické, energeticky nezávislé paměti, které je možné naprogramovat a později z nich informace vymazat

Více

Něco málo o časování a frekvenci

Něco málo o časování a frekvenci Paměti 2 Něco málo o časování a frekvenci Pokud pomineme rozdílné technologie (FPM, EDO, SDRAM, DDR SDRAM...), liší se paměti v zásadě pouze frekvencí a časováním. Ale co to vůbec je? Tyto dva faktory

Více

Architektura Intel Atom

Architektura Intel Atom Architektura Intel Atom Štěpán Sojka 5. prosince 2008 1 Úvod Hlavní rysem Atomu je podpora platformy x86, která umožňuje spouštět a běžně používat řadu let vyvíjené aplikace, na které jsou uživatelé zvyklí

Více

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC Informační systémy 2 Obsah: Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC ROM RAM Paměti typu CACHE IS2-4 1 Dnešní info: Informační systémy 2 03 Informační systémy

Více

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC Informatika 2 Technické prostředky počítačové techniky - 2 Přednáší: doc. Ing. Jan Skrbek, Dr. - KIN Přednášky: středa 14 20 15 55 Spojení: e-mail: jan.skrbek@tul.cz 16 10 17 45 tel.: 48 535 2442 Obsah:

Více

Vstupně - výstupní moduly

Vstupně - výstupní moduly Vstupně - výstupní moduly Přídavná zařízení sloužící ke vstupu a výstupu dat bo k uchovávání a archivaci dat Nejsou připojována ke sběrnici přímo, ale prostřednictvím vstupně-výstupních modulů ( ů ). Hlavní

Více

Paměť počítače. 0 (neprochází proud) 1 (prochází proud)

Paměť počítače. 0 (neprochází proud) 1 (prochází proud) Paměť počítače Paměť je nezbytnou součástí jakéhokoli počítače. Slouží k uložení základních informací počítače, operačního systému, aplikačních programů a dat uživatele. Počítače jsou vybudovány z bistabilních

Více

Využití ICT pro rozvoj klíčových kompetencí CZ.1.07/1.5.00/

Využití ICT pro rozvoj klíčových kompetencí CZ.1.07/1.5.00/ Střední odborná škola elektrotechnická, Centrum odborné přípravy Zvolenovská 537, Hluboká nad Vltavou Využití ICT pro rozvoj klíčových kompetencí CZ.1.07/1.5.00/34.0448 CZ.1.07/1.5.00/34.0448 1 Číslo projektu

Více

Roman Výtisk, VYT027

Roman Výtisk, VYT027 Roman Výtisk, VYT027 Ohlédnutí za architekturou AMD K8 Představení architektury procesoru AMD K10 Přínos Struktura cache IMC, HyperTransport sběrnice Použitá literatura Ohlášení x86-64 architektury 5.

Více

ÚVOD DO OPERAČNÍCH SYSTÉMŮ. Správa paměti. Přímý přístup k fyzické paměti, abstrakce: adresový prostor, virtualizace, segmentace

ÚVOD DO OPERAČNÍCH SYSTÉMŮ. Správa paměti. Přímý přístup k fyzické paměti, abstrakce: adresový prostor, virtualizace, segmentace ÚVOD DO OPERAČNÍCH SYSTÉMŮ Správa paměti Přímý přístup k fyzické paměti, abstrakce: adresový prostor, virtualizace, segmentace České vysoké učení technické Fakulta elektrotechnická Y38ÚOS Úvod do operačních

Více

Rychlá vyrovnávací paměť v architektuře PC

Rychlá vyrovnávací paměť v architektuře PC Rychlá vyrovnávací paměť v architektuře PC 1 Cíl přednášky Prezentovat důvody, které vedly k zavedení rychlé vyrovnávací paměti (RVP) do architektury počítače. Vysvětlit principy činnosti RVP. Ukázat vývoj

Více

Cache paměť - mezipaměť

Cache paměť - mezipaměť Cache paměť - mezipaměť 10.přednáška Urychlení přenosu mezi procesorem a hlavní pamětí Hlavní paměť procesoru je typu DRAM a je pomalá. Proto se mezi pomalou hlavní paměť a procesor vkládá menší, ale rychlá

Více

Přidělování paměti II Mgr. Josef Horálek

Přidělování paměti II Mgr. Josef Horálek Přidělování paměti II Mgr. Josef Horálek Techniky přidělování paměti = Přidělování jediné souvislé oblasti paměti = Přidělování paměti po sekcích = Dynamické přemisťování sekcí = Stránkování = Stránkování

Více

Cache paměti (1) Cache paměť: V dnešních počítačích se běžně používají dva, popř. tři druhy cache pamětí:

Cache paměti (1) Cache paměť: V dnešních počítačích se běžně používají dva, popř. tři druhy cache pamětí: Cache paměti (1) Cache paměť: rychlá vyrovnávací paměť mezi rychlým zařízením (např. procesor) a pomalejším zařízením (např. operační paměť) vyrobena z obvodů SRAM s přístupovou dobou 1-20 ns V dnešních

Více

Paměti operační paměti

Paměti operační paměti Paměti operační paměti Autor: Kulhánek Zdeněk Škola: Hotelová škola, Obchodní akademie a Střední průmyslová škola Teplice, Benešovo náměstí 1, příspěvková organizace Kód: VY_32_INOVACE_ICT_828 1.11.2012

Více

Řízení IO přenosů DMA řadičem

Řízení IO přenosů DMA řadičem Řízení IO přenosů DMA řadičem Doplňující text pro POT K. D. 2001 DMA řadič Při přímém řízení IO operací procesorem i při použití přerušovacího systému je rychlost přenosu dat mezi IO řadičem a pamětí limitována

Více

NSWI /2011 ZS. Principy cpypočítačůčů aoperačních systémů ARCHITEKTURA

NSWI /2011 ZS. Principy cpypočítačůčů aoperačních systémů ARCHITEKTURA Principy cpypočítačůčů aoperačních systémů ARCHITEKTURA Literatura W.Stallings: Computer Organization & Architecture J.L.Hennessy, P.A.Patterson: Patterson: Computer Architecture: a Quantitative Approach

Více

Semestrální práce z předmětu Speciální číslicové systémy X31SCS

Semestrální práce z předmětu Speciální číslicové systémy X31SCS Semestrální práce z předmětu Speciální číslicové systémy X31SCS Katedra obvodů DSP16411 ZPRACOVAL: Roman Holubec Školní rok: 2006/2007 Úvod DSP16411 patří do rodiny DSP16411 rozšiřuje DSP16410 o vyšší

Více

2.9 Vnitřní paměti. Střední průmyslová škola strojnická Vsetín. Ing. Martin Baričák. Název šablony Název DUMu. Předmět Druh učebního materiálu

2.9 Vnitřní paměti. Střední průmyslová škola strojnická Vsetín. Ing. Martin Baričák. Název šablony Název DUMu. Předmět Druh učebního materiálu Název školy Číslo projektu Autor Název šablony Název DUMu Tematická oblast Předmět Druh učebního materiálu Anotace Vybavení, pomůcky Ověřeno ve výuce dne, třída Střední průmyslová škola strojnická Vsetín

Více

Počítač jako prostředek řízení. Struktura a organizace počítače

Počítač jako prostředek řízení. Struktura a organizace počítače Řídicí počítače - pro řízení technologických procesů. Specielní přídavná zařízení - I/O, přerušovací systém, reálný čas, Č/A a A/Č převodníky a j. s obsluhou - operátorské periferie bez obsluhy - operátorský

Více

Operační systémy. Přednáška 8: Správa paměti II

Operační systémy. Přednáška 8: Správa paměti II Operační systémy Přednáška 8: Správa paměti II 1 Jednoduché stránkování Hlavní paměť rozdělená na malé úseky stejné velikosti (např. 4kB) nazývané rámce (frames). Program rozdělen na malé úseky stejné

Více

Princip funkce počítače

Princip funkce počítače Princip funkce počítače Princip funkce počítače prvotní úlohou počítačů bylo zrychlit provádění matematických výpočtů první počítače kopírovaly obvyklý postup manuálního provádění výpočtů pokyny pro zpracování

Více

Informační a komunikační technologie

Informační a komunikační technologie Informační a komunikační technologie 7. www.isspolygr.cz Vytvořil: Ing. David Adamovský Strana: 1 Škola Integrovaná střední škola polygrafická Ročník Název projektu 1. ročník SOŠ Interaktivní metody zdokonalující

Více

Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti MI-SOC: 7 ČASOVÁNÍ A SYNCHRONIZACE TECHNICKÉHO VYBAVENÍ doc. Ing. Hana Kubátová, CSc. Katedra číslicového návrhu Fakulta informačních

Více

Pár odpovědí jsem nenašla nikde, a tak jsem je logicky odvodila, a nebo jsem ponechala odpověď z pefky, proto je možné, že někde bude chyba.

Pár odpovědí jsem nenašla nikde, a tak jsem je logicky odvodila, a nebo jsem ponechala odpověď z pefky, proto je možné, že někde bude chyba. Odpovědi jsem hledala v prezentacích a na http://www.nuc.elf.stuba.sk/lit/ldp/index.htm Pár odpovědí jsem nenašla nikde, a tak jsem je logicky odvodila, a nebo jsem ponechala odpověď z pefky, proto je

Více

Přednáška. Správa paměti I. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012

Přednáška. Správa paměti I. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012 Přednáška Správa paměti I. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012 Příprava studijního programu Informatika je podporována projektem financovaným z Evropského

Více

Paměťové prvky. ITP Technika personálních počítačů. Zdeněk Kotásek Marcela Šimková Pavel Bartoš

Paměťové prvky. ITP Technika personálních počítačů. Zdeněk Kotásek Marcela Šimková Pavel Bartoš Paměťové prvky ITP Technika personálních počítačů Zdeněk Kotásek Marcela Šimková Pavel Bartoš Vysoké učení technické v Brně, Fakulta informačních technologií v Brně Božetěchova 2, 612 66 Brno Osnova Typy

Více

Paměti personálních počítačů, vývoj pojmů, technologie, organizace

Paměti personálních počítačů, vývoj pojmů, technologie, organizace Paměti personálních počítačů, vývoj pojmů, technologie, organizace 1 Cíl přednášky Popsat architektury vnitřních pamětí personálních počítačů. Zabývat se vývojem pojmů, technologií, organizací. Vývoj technologie

Více

Cache paměti (2) Cache paměti (1) Cache paměti (3) Cache paměti (4) Cache paměti (6) Cache paměti (5) Cache paměť:

Cache paměti (2) Cache paměti (1) Cache paměti (3) Cache paměti (4) Cache paměti (6) Cache paměti (5) Cache paměť: Cache paměti (1) Cache paměť: rychlá vyrovnávací paměť mezi rychlým zařízením (např. procesor) a pomalejším zařízením (např. operační paměť) vyrobena z obvodů SRAM s přístupovou dobou 1 20 ns V dnešních

Více

Adresování paměti. Adresní prostor. Adresní módy (v instrukcích) T.Mainzer

Adresování paměti. Adresní prostor. Adresní módy (v instrukcích) T.Mainzer Adresování paměti T.Mainzer Adresní prostor Logický adresní prostor - Adresní prostor se kterým může pracovat/může adresovat daný procesor. Pracuje li procesor s 16-bitovou adresou má log.adresní prostor

Více

Parametry pamětí vybavovací doba (tj. čas přístupu k záznamu v paměti) = 10 ns ms rychlost toku dat (tj. počet přenesených bitů za sekundu)

Parametry pamětí vybavovací doba (tj. čas přístupu k záznamu v paměti) = 10 ns ms rychlost toku dat (tj. počet přenesených bitů za sekundu) Paměti Parametry pamětí vybavovací doba (tj. čas přístupu k záznamu v paměti) = 10 ns...100 ms rychlost toku dat (tj. počet přenesených bitů za sekundu) kapacita paměti (tj. počet bitů, slabik, slov) cena

Více

Paměti EEPROM (1) Paměti EEPROM (2) Paměti Flash (1) Paměti EEPROM (3) Paměti Flash (2) Paměti Flash (3)

Paměti EEPROM (1) Paměti EEPROM (2) Paměti Flash (1) Paměti EEPROM (3) Paměti Flash (2) Paměti Flash (3) Paměti EEPROM (1) EEPROM Electrically EPROM Mají podobné chování jako paměti EPROM, tj. jedná se o statické, energeticky nezávislé paměti, které je možné naprogramovat a později z nich informace vymazat

Více

Identifikátor materiálu: ICT-1-08

Identifikátor materiálu: ICT-1-08 Identifikátor materiálu: ICT-1-08 Předmět Informační a komunikační technologie Téma materiálu Motherboard, CPU a RAM Autor Ing. Bohuslav Nepovím Anotace Student si procvičí / osvojí základní desku počítače.

Více

Procesy a vlákna (Processes and Threads)

Procesy a vlákna (Processes and Threads) ÚVOD DO OPERAČNÍCH SYSTÉMŮ Ver.1.00 Procesy a vlákna (Processes and Threads) Správa procesů a vláken České vysoké učení technické Fakulta elektrotechnická 2012 Použitá literatura [1] Stallings, W.: Operating

Více

Pohled do nitra mikroprocesoru Josef Horálek

Pohled do nitra mikroprocesoru Josef Horálek Pohled do nitra mikroprocesoru Josef Horálek Z čeho vycházíme = Vycházíme z Von Neumannovy architektury = Celý počítač se tak skládá z pěti koncepčních bloků: = Operační paměť = Programový řadič = Aritmeticko-logická

Více

Základní deska (1) Označována také jako mainboard, motherboard. Deska plošného spoje tvořící základ celého počítače Zpravidla obsahuje:

Základní deska (1) Označována také jako mainboard, motherboard. Deska plošného spoje tvořící základ celého počítače Zpravidla obsahuje: Základní deska (1) Označována také jako mainboard, motherboard Deska plošného spoje tvořící základ celého počítače Zpravidla obsahuje: procesor (mikroprocesor) patici pro numerický koprocesor (resp. osazený

Více

Paměti počítače ROM, RAM

Paměti počítače ROM, RAM Paměti počítače ROM, RAM Paměť je zařízení, které slouží k ukládání programů a dat, s nimiž počítač pracuje. Paměti počítače lze rozdělit do tří základních skupin: registry paměťová místa na čipu procesoru

Více

Paměti Flash. Paměti Flash. Základní charakteristiky

Paměti Flash. Paměti Flash. Základní charakteristiky Paměti Flash K.D. - přednášky 1 Základní charakteristiky (Flash EEPROM): Přepis dat bez mazání: ne. Mazání: po blocích nebo celý čip. Zápis: po slovech nebo po blocích. Typická životnost: 100 000 1 000

Více

Gymnázium Vysoké Mýto nám. Vaňorného 163, 566 01 Vysoké Mýto

Gymnázium Vysoké Mýto nám. Vaňorného 163, 566 01 Vysoké Mýto Gymnázium Vysoké Mýto nám. Vaňorného 163, 566 01 Vysoké Mýto Registrační číslo projektu Šablona Autor Název materiálu CZ.1.07/1.5.00/34.0951 III/2 INOVACE A ZKVALITNĚNÍ VÝUKY PROSTŘEDNICTVÍM ICT Mgr. Petr

Více

Paměti personálních počítačů, vývoj pojmů, technologie, organizace

Paměti personálních počítačů, vývoj pojmů, technologie, organizace Paměti personálních počítačů, vývoj pojmů, technologie, organizace 1 Cíl přednášky Popsat architektury vnitřních pamětí personálních počítačů. Zabývat se vývojem pojmů, technologií, organizací. Vyvodit

Více

Vstupně výstupní moduly. 13.přednáška

Vstupně výstupní moduly. 13.přednáška Vstupně výstupní moduly 13.přednáška Vstupně-výstupn výstupní modul (I/O modul) Přídavná zařízení sloužící ke vstupu a výstupu dat nebo k uchovávání a archivaci dat Nejsou připojována ke sběrnici přímo,

Více

Pokročilé architektury počítačů

Pokročilé architektury počítačů Pokročilé architektury počítačů Architektura IO podsystému České vysoké učení technické, Fakulta elektrotechnická A4M36PAP Pokročílé architektury počítačů Ver.1.00 2010 1 Co je úkolem? Propojit jednotlivé

Více

Technické prostředky počítačové techniky

Technické prostředky počítačové techniky Počítač - stroj, který podle předem připravených instrukcí zpracovává data Základní části: centrální procesorová jednotka (schopná řídit se posloupností instrukcí a ovládat další části počítače) zařízení

Více

Adresní mody procesoru

Adresní mody procesoru Adresní mody procesoru K.D. - přednášky 1 Obecně o adresování Různé typy procesorů mohou mít v instrukci 1, 2 nebo více adres. Operandy mohou ležet v registrech nebo v paměti. Adresní mechanismus procesoru

Více

Procesor Intel Pentium (1) Procesor Intel Pentium (3) Procesor Intel Pentium Pro (1) Procesor Intel Pentium (2)

Procesor Intel Pentium (1) Procesor Intel Pentium (3) Procesor Intel Pentium Pro (1) Procesor Intel Pentium (2) Procesor Intel Pentium (1) 32-bitová vnitřní architektura s 64-bitovou datovou sběrnicí Superskalární procesor: obsahuje více než jednu (dvě) frontu pro zřetězené zpracování instrukcí (značeny u, v) poskytuje

Více

Miroslav Flídr Počítačové systémy LS 2006-1/21- Západočeská univerzita v Plzni

Miroslav Flídr Počítačové systémy LS 2006-1/21- Západočeská univerzita v Plzni Počítačové systémy Vnitřní paměti Miroslav Flídr Počítačové systémy LS 2006-1/21- Západočeská univerzita v Plzni Hierarchire pamětí Miroslav Flídr Počítačové systémy LS 2006-2/21- Západočeská univerzita

Více

asociativní paměti Ing. Jakub Št astný, Ph.D. 1 Katedra teorie obvodů FEL ČVUT Technická 2, Praha 6,

asociativní paměti Ing. Jakub Št astný, Ph.D. 1 Katedra teorie obvodů FEL ČVUT Technická 2, Praha 6, Pamět ové obvody, řadiče a implementace, asociativní paměti AČS Ing. Jakub Št astný, Ph.D. 1 1 FPGA Laboratoř Katedra teorie obvodů FEL ČVUT Technická 2, Praha 6, 166 27 http://amber.feld.cvut.cz/fpga

Více

Paměti Rambus DRAM (RDRAM) Paměti Flash Paměti SGRAM

Paměti Rambus DRAM (RDRAM) Paměti Flash Paměti SGRAM Paměti Rambus DRAM (RDRAM) Paměti Flash Paměti SGRAM 1 Požadavky na RDRAM - začátky Nové DRAM musí zajistit desetinásobné zvýšení šířky pásma srovnání výkonu procesoru a paměti. Náklady na výrobu a prodej

Více

2010/2011 ZS P i r i nc č py po ít č čů a PAMĚŤOVÝ ĚŤ SUBSYSTÉM z pohledu OS OS

2010/2011 ZS P i r i nc č py po ít č čů a PAMĚŤOVÝ ĚŤ SUBSYSTÉM z pohledu OS OS Pi Principy i počítačů čů PAMĚŤOVÝ SUBSYSTÉM z pohledu OS Správa paměti OS je správcem prostředků, tedy i paměti přidělování procesům zajištění ochrany systému i procesů zajištění požadavků aniž by došlo

Více

Referát (pokročilé architektury počítačů)

Referát (pokročilé architektury počítačů) Referát (pokročilé architektury počítačů) Představení architektury procesoru AMD K10 Roman Výtisk, VYT027 1 AMD K8 Nejprve bych zmínil, co této architektuře předcházelo a co tato architektura přinesla

Více

Přidělování zdrojů (prostředků)

Přidělování zdrojů (prostředků) Přidělování zdrojů (prostředků) Proces potřebuje zdroje (prostředky) hardware (I/O zařízení, paměť) software (data, programy) Klasifikace zdrojů (z hlediska multitaskingového režimu) Násobně použitelné

Více

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC Informatika 2 Technické prostředky počítačové techniky - 2 Přednáší: doc. Ing. Jan Skrbek, Dr. - KIN Přednášky: středa 14 20 15 55 Spojení: e-mail: jan.skrbek@tul.cz 16 10 17 45 tel.: 48 535 2442 Obsah:

Více

Pokročilé architektury počítačů

Pokročilé architektury počítačů Pokročilé architektury počítačů Tutoriál 3 CUDA - GPU Martin Milata Výpočetní model CUDA Organizace kódu Sériově organizovaný kód určený pro CPU Paralelní kód prováděný na GPU Označuje se jako kernel GPU

Více

Paměti SDRAM (synchronní DRAM)

Paměti SDRAM (synchronní DRAM) Paměti SDRAM (synchronní DRAM) 1 Paměti SDRAM Cíl přednášky: - Shrnout předcházející techniky řízení pamětí. - Prezentovat techniku SDRAM, postihnout její výrazné rysy a odlišnosti od předcházejících typů.

Více

Paměti. Paměti. Rozdělení, charakteristika, druhy a typy pamětí. Banky

Paměti. Paměti. Rozdělení, charakteristika, druhy a typy pamětí. Banky Paměti. Rozdělení, charakteristika, druhy a typy pamětí. Banky Paměti Paměť počítače je zařízení, které slouží k ukládání programů a dat, s nimiž počítač pracuje. Paměti lze rozdělit do tří základních

Více

Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115

Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115 Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115 Číslo projektu: Číslo šablony: 3 CZ.1.07/1.5.00/34.0410 Název materiálu: Ročník: Identifikace materiálu: Jméno autora: Předmět: Tématický celek:

Více

Paměti v PC - souhrn

Paměti v PC - souhrn Paměti v PC - souhrn V současném PC se vyskytuje podstatně více různých typů pamětí hierarchicky uspořádaných než v prvních typech. Zvýšila se kapacita pamětí, získávání dat z pamětí o velké kapacitě je

Více

Operační systémy. Přednáška 7: Správa paměti I

Operační systémy. Přednáška 7: Správa paměti I Operační systémy Přednáška 7: Správa paměti I 1 Správa paměti (SP) Memory Management Unit (MMU) hardware umístěný na CPU čipu např. překládá logické adresy na fyzické adresy, Memory Manager software, který

Více

CHARAKTERISTIKA MODERNÍCH PENTIÍ. Flynnova klasifikace paralelních systémů

CHARAKTERISTIKA MODERNÍCH PENTIÍ. Flynnova klasifikace paralelních systémů Úvod: CHARAKTERISTIKA MODERNÍCH PENTIÍ Flynnova klasifikace paralelních systémů Paralelní systémy lze třídit z hlediska počtu toků instrukcí a počtu toků dat: SI systém s jedním tokem instrukcí (Single

Více

Přednáška. Vstup/Výstup. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012

Přednáška. Vstup/Výstup. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012 Přednáška Vstup/Výstup. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012 Příprava studijního programu Informatika je podporována projektem financovaným z Evropského

Více

Základní uspořádání pamětí MCU

Základní uspořádání pamětí MCU Základní uspořádání pamětí MCU Harwardská architektura. Oddělený adresní prostor kódové a datové. Používané u malých MCU a signálových procesorů. Von Neumannova architektura (Princetonská). Kódová i jsou

Více

Operační systémy. Správa paměti (SP) Požadavky na SP. Spojování a zavedení programu. Spojování programu (linking) Zavádění programu (loading)

Operační systémy. Správa paměti (SP) Požadavky na SP. Spojování a zavedení programu. Spojování programu (linking) Zavádění programu (loading) Správa paměti (SP) Operační systémy Přednáška 7: Správa paměti I Memory Management Unit (MMU) hardware umístěný na CPU čipu např. překládá logické adresy na fyzické adresy, Memory Manager software, který

Více

Pokročilé architektury počítačů

Pokročilé architektury počítačů Pokročilé architektury počítačů Přednáška 5 GPU - CUDA Martin Milata Obsah Obecné výpočty a GPU Grafické procesory NVIDIA Tesla Výpočetní model Paměťový model GT200 Zpracování instrukcí Vydávání instrukcí

Více

Základní principy konstrukce systémové sběrnice - shrnutí. Shrnout základní principy konstrukce a fungování systémových sběrnic.

Základní principy konstrukce systémové sběrnice - shrnutí. Shrnout základní principy konstrukce a fungování systémových sběrnic. Základní principy konstrukce systémové sběrnice - shrnutí Shrnout základní principy konstrukce a fungování systémových sběrnic. 1 Co je to systémová sběrnice? Systémová sběrnice je prostředek sloužící

Více

I. Dalšívnitřní paměti

I. Dalšívnitřní paměti BI-JPO (Jednotky počítače) I. Dalšívnitřní paměti c doc. Ing. Alois Pluháček, CSc. 2010 Katedra číslicového návrhu Fakulta informačních technologií České vysoké učení technické v Praze Evropský sociální

Více

09. Memory management. ZOS 2006, L.Pešička

09. Memory management. ZOS 2006, L.Pešička 09. Memory management ZOS 2006, L.Pešička Správa paměti paměťová pyramida absolutní adresa relativní adresa počet bytů od absolutní adresy fyzický prostor adres fyzicky k dispozici výpočetnímu systému

Více

Ro R dina procesor pr ů Int In e t l Nehalem Šmída Mojmír, SMI108 PAP PA 2009

Ro R dina procesor pr ů Int In e t l Nehalem Šmída Mojmír, SMI108 PAP PA 2009 Rodina procesorů Intel Nehalem Šmída Mojmír, SMI108 PAP 2009 Obsah: Úvod Nejpodstatnější prvky Nehalemu (i7 900) Nehalem ve střední třídě (i7 800, i5 700) Výkon Závěr Úvod Nhl Nehalem staví na úspěšné

Více

SDRAM (synchronní DRAM) Cíl přednášky:

SDRAM (synchronní DRAM) Cíl přednášky: SDRAM (synchronní DRAM) Cíl přednášky: Shrnout předcházející techniky řízení pamětí. Prezentovat techniku SDRAM, postihnout její výrazné rysy a odlišnosti od předcházejících typů. Shrnout získané informace.

Více

Paměti Rambus DRAM (RDRAM) Paměti Flash Paměti SGRAM

Paměti Rambus DRAM (RDRAM) Paměti Flash Paměti SGRAM Paměti Rambus DRAM (RDRAM) Paměti Flash Paměti SGRAM 1 Požadavky na RDRAM - začátky Nové DRAM musí zajistit desetinásobné (?) zvýšení šířky pásma srovnání výkonu procesoru a paměti. Náklady na výrobu a

Více

Metody připojování periferií BI-MPP Přednáška 2

Metody připojování periferií BI-MPP Přednáška 2 Metody připojování periferií BI-MPP Přednáška 2 Ing. Miroslav Skrbek, Ph.D. Katedra počítačových systémů Fakulta informačních technologií České vysoké učení technické v Praze Miroslav Skrbek 2010,2011

Více

Strojový kód. Instrukce počítače

Strojový kód. Instrukce počítače Strojový kód Strojový kód (Machine code) je program vyjádřený v počítači jako posloupnost instrukcí procesoru (posloupnost bajtů, resp. bitů). Z hlediska uživatele je strojový kód nesrozumitelný, z hlediska

Více

DUM č. 10 v sadě. 31. Inf-7 Technické vybavení počítačů

DUM č. 10 v sadě. 31. Inf-7 Technické vybavení počítačů projekt GML Brno Docens DUM č. 10 v sadě 31. Inf-7 Technické vybavení počítačů Autor: Roman Hrdlička Datum: 04.12.2013 Ročník: 1A, 1B, 1C Anotace DUMu: jak fungují vnitřní paměti, typy ROM a RAM pamětí,

Více

Obecné výpočty na GPU v jazyce CUDA. Jiří Filipovič

Obecné výpočty na GPU v jazyce CUDA. Jiří Filipovič Obecné výpočty na GPU v jazyce CUDA Jiří Filipovič Obsah přednášky motivace architektura GPU CUDA programovací model jaké algoritmy urychlovat na GPU? optimalizace Motivace Moorův zákon stále platí pro

Více

Cílem kapitoly je seznámit studenta s pamětmi. Jejich minulostí, současností a hlavnímu parametry.

Cílem kapitoly je seznámit studenta s pamětmi. Jejich minulostí, současností a hlavnímu parametry. Paměti Cílem kapitoly je seznámit studenta s pamětmi. Jejich minulostí, současností a hlavnímu parametry. Klíčové pojmy: paměť, RAM, rozdělení pamětí, ROM, vnitřní paměť, vnější paměť. Úvod Operační paměť

Více

Paměti cache. Cache může být realizována softwarově nebo hardwarově.

Paměti cache. Cache může být realizována softwarově nebo hardwarově. Paměti cache Cache je označení pro vyrovnávací paměť nacházející se mezi dvěma subsystémy s rozdílnou přenosovou rychlostí, a jak již její název vypovídá, tak tuto rychlost vyrovnává. Cache může být realizována

Více

Počítačová sestava paměti, operační paměť RAM

Počítačová sestava paměti, operační paměť RAM Pavel Dvořák Gymnázium Velké Meziříčí Počítačová sestava paměti, operační paměť RAM Registrační číslo projektu: CZ.1.07/1.5.00/34.0948 Jazyk: čestina Datum vytvoření: 17. 10. 2012 Cílová skupina: studenti

Více

Základní deska (1) Parametry procesoru (2) Parametry procesoru (1) Označována také jako mainboard, motherboard

Základní deska (1) Parametry procesoru (2) Parametry procesoru (1) Označována také jako mainboard, motherboard Základní deska (1) Označována také jako mainboard, motherboard Deska plošného spoje tvořící základ celého počítače Zpravidla obsahuje: procesor (mikroprocesor) patici pro numerický koprocesor (resp. osazený

Více

PAMĚŤOVÝ SUBSYSTÉM. Principy počítačů I. Literatura. Parametry paměti. Parametry paměti. Dělení pamětí podle funkce. Kritéria dělení pamětí

PAMĚŤOVÝ SUBSYSTÉM. Principy počítačů I. Literatura. Parametry paměti. Parametry paměti. Dělení pamětí podle funkce. Kritéria dělení pamětí Principy počítačů I PAMĚŤOVÝ SUBSYSTÉM Literatura http://www.tomshardware.com http://www.play-hookey.com/digital/ 6 kb ought to be enough for anybody. Bill Gates, 98 Parametry paměti kapacita objem informace,

Více

OPS Paralelní systémy, seznam pojmů, klasifikace

OPS Paralelní systémy, seznam pojmů, klasifikace Moorův zákon (polovina 60. let) : Výpočetní výkon a počet tranzistorů na jeden CPU chip integrovaného obvodu mikroprocesoru se každý jeden až dva roky zdvojnásobí; cena se zmenší na polovinu. Paralelismus

Více

Paměti počítače 9.přednáška

Paměti počítače 9.přednáška Paměti počíta tače 9.přednáška Paměť Paměť je zařízení, které slouží k ukládání programů a dat, s nimiž počítač pracuje Paměti počítače lze rozdělit do tří základních skupin: registry paměťová místa na

Více

Gymnázium Vysoké Mýto nám. Vaňorného 163, 566 01 Vysoké Mýto

Gymnázium Vysoké Mýto nám. Vaňorného 163, 566 01 Vysoké Mýto Gymnázium Vysoké Mýto nám. Vaňorného 163, 566 01 Vysoké Mýto Registrační číslo projektu Šablona Autor Název materiálu CZ.1.07/1.5.00/34.0951 III/2 INOVACE A ZKVALITNĚNÍ VÝUKY PROSTŘEDNICTVÍM ICT Mgr. Petr

Více

Architektura procesoru ARM

Architektura procesoru ARM Architektura procesoru ARM Bc. Jan Grygerek GRY095 Obsah ARM...3 Historie...3 Charakteristika procesoru ARM...4 Architektura procesoru ARM...5 Specifikace procesoru...6 Instrukční soubor procesoru...6

Více