Technologie Intel SSE I. Šimeček, J. Trdlička
|
|
- Růžena Černá
- před 7 lety
- Počet zobrazení:
Transkript
1 Technologie Intel SSE I. Šimeček, J. Trdlička Katedra počítačových systémů FIT České vysoké učení technické v Praze Ivan Šimeček, 2011 MI-PAP, LS2010/11, Predn.2 Příprava studijního programu Informatika je podporována projektem financovaným z Evropského sociálního fondu a rozpočtu hlavního města Prahy. Praha & EU: Investujeme do vaší budoucnosti
2 Nevýhody FPU na x86 Starý návrh S registry se pracuje jako se zásobníkem => aktuální výsledek je na vrcholu. Zdála se to hezká idea: pracuji jen s nejvíce aktuálními výsledky Ale: Do operací vstupuje jen jeden nový operand, druhý je automaticky vrchol zásobníku. Ale vrchol zásobníku(výsledek operace) je operand pro další instrukci (nutnost čekání na dokončení)!!! Jediná možnost překrytí latencí je FXCH (prohození registrů) = nepřehledné (i pro kompilátor)
3 Vektorizace na x86 Zjednodušená verze z vektorových superpočítačů SIMD Single Instruction Mutliple Data Může zmenšit nárok na tok instrukcí
4 Technologie SSE Streaming SIMD Extensions Dostupná od Pentium III (1999) zpo48tku označována jako Katmai New Instructions" (KNI) 8ice 128bitových XMM registrů nezávislé na FPU zásobníku Možno použít současně FPU/MMX a SSE Možné problémy při přepnutí kontextu = OS musí ukládat i stav SSE registrů
5 Použití SSE 70 instrukcí pro pokročilou 2-D a 3-D grafiku motion video, image processing, rozpoznávání hlasu, audio syntézu, telefonní a videokonference.
6 SSE registry 128 bitové označené xmm0-xmm7 Význam jedno 32-bitová float čísla (scalar = skalární hodnota), čtyři 32-bitová float čísla (packed = komprimovaná hodnota = double quadword), Hlavně pro operace s plovoucí řádovou čárkou 32-bitový MXCSR registr, který nabízí řídící a stavové bity pro operace prováděné nad XMM registry
7 Registr MXCSR řídící/stavový registr maskování/odmaskování obsluhy číselných výjimek, Nastavení zaokrouhlovacích módů kontrola stavových flagů.
8 Registr MXCSR The MXCSR register is a 32-bit register. Od SSE3, bity 0-15 definovány jako: FZ bit 15 Flush To Zero R+ bit 14 Round Positive R- bit 13 Round Negative RZ bits 13 and 14 Round To Zero RN bits 13 and 14 are 0 Round To Nearest PM bit 12 Precision Mask UM bit 11 Underflow Mask OM bit 10 Overflow Mask ZM bit 9 Divide By Zero Mask DM bit 8 Denormal Mask IM bit 7 Invalid Operation Mask DAZ bit 6 Denormals Are Zero PE bit 5 Precision Flag UE bit 4 Underflow Flag OE bit 3 Overflow Flag ZE bit 2 Divide By Zero Flag DE bit 1 Denormal Flag IE bit 0 Invalid Operation Flag
9 Operace SSE Skalární Operace se provádí pouze s položkami č.0 Ostatní položky se pouze kopírují Skalární SSE může nahradit FPU! Výhoda: SSE mapování registrů pevné na rozdíl od FPU zásobníku Packed (komprimovaný) Operace se provádí se všemi 4mi položkami paralelně
10 Operace SSE 128bit operace s komprimovanými hodnotami v plovoucí řádové čárce (packed single precision floating-point) uloženými v XMM registrech, spravování stavu (state management), řízení cache (cache control) a operace pro organizaci paměti. 64 bitové SIMD instrukce (i nové instrukce) pro celá čísla, s komprimovanými celočíselnými operandy (packed-integer) uloženými v MMX registrech.
11 Operace SSE komparační instrukce převodní instrukce Tyto instrukce podporují komprimovaný i skalární převod mezi 128 bitovými SIMD registry a jedním z 64 bitových MMX registrů nebo 32 bitových x86 registrů. logické instrukce přídavné SIMD instrukce pro celá čísla shuffle instrukce instrukce pro správu stavu instrukce řízení cache
12 Příklad skalární instrukce ADDSS xmm1, xmm2 Přičítá nejnižší dvojslovo (single) ze zdrojového operandu k cílovému operandu a ukládá výsledek v plovoucí čárce jednoduché přesnosti do cílového operandu. Zdrojovým operandem xmm2. Cílovým operandem je xmm1 registr. Tři vyšší dvojslova cílového operandu se nezmění
13 ADDSS
14 Příklad komprimované (packed) instrukce ADDPS xmm1, xmm2 Instrukce provádí SIMD součet čtyř komprimovaných single hodnot zdrojového operandu a cílového operandu a ukládá komprimovaný výsledek do cílového operandu. Zdrojovým operandem je xmm2. Cílovým operandem je registr xmm1.
15 ADDPS
16 Další instrukce Podobně jako ADD se chovají instrukce XXXYY, kde XXX je ADD, SUB, MUL, DIV, RCP, SQRT, RSQRT, MAX, MIN YY je buď PS nebo SS
17 Porovnání cmpxxps porovnání čtveřice dvojic Výsledek je buď 0 (ne) nebo FFFFFFFFh (ano) xx je možno takto: eq - Equal to. lt - Less than. le - Less than or equal to. ne - Not equal. nlt - Not less than. nle - Not less than or equal to. ord - Ordered. unord - Unordered. comiss porovnání nejnižší dvojici a výsledek uloží do EFLAGS. ucomiss - porovnání nejnižší dvojici a výsledek uloží do EFLAGS, ale negeneruje vyjímky
18 Cache a SSE prefetcht0 - načte cache-line do všech úrovní prefetcht1 - načte cache-line do všech úrovní kromě nejbližší k CPU prefetcht2 - načte cache-line do všech úrovní kromě 2 nejbližších k CPU prefetchnta - načte cache-line do úrovně nejbliž k CPU sfence Garantuje, že všechny (pozdržené) paměťové zápisy budou po této instrukci provedeny, negeneruje vyjímky Důležité pro HT a SMP MOVNTQ uloží MMX register do paměti, je weakly-ordered a nealokuje cache NT = not temporal MOVNTPS uloží SSE register do paměti, je weakly-ordered a nealokuje cache, adresa musí být zarovnána na 16 bytů.
19 SSE2 SSE2 bylo uvedeno s Pentium 4 (2001) - "Willamette instructions. Rozšíření původního SSE: operací s datovými typy v plovoucí řádové čárce a dvojité přesnosti. možnost operací s XMM jako s 128 bitovým integerem datové typy 2 čísla v plovoucí řádové čárce s dvojnásobnou přesností, 4 čísla v plovoucí řádové čárce v jednoduché přesností, 16 zkomprimovaných slabik (char), 8 zkomprimovaných slov (word), 4 zkomprimovaná dvojslova (dword), 2 zkomprimovaná čtyřslova (quadword)
20 SSE2 Instrukce pro podporu nových datových typů a rozšíření SIMD operací pro celá čísla Komprimované a skalární instrukce pro plovoucí řádovou dvojité přesnosti Přídavné 64 bitové a 128 bitové SIMD instrukce pro plovoucí čárku 128 bitová verze SIMD instrukcí pro celá čísla z MMX a SSE Přídavné instrukce pro řízení cache a organizaci instrukcí Modifikace existujících IA-32 instrukcí pro podporu SSE2: Rozšíření a modifikace CPUID instrukce Modifikace instrukce RDPMC
21 Příklady instrukcí ADDPD xmm1, xmm2 Instrukce provádí SIMD součet dvou double hodnot zdrojového operandu a cílového operandu a ukládá výsledek do cílového operandu. PAND xmm1, xmm2 Logický AND dvou XMM (128bit) registrů
22 Příklady instrukcí PADDQ mm1,mm2/m64 mm1 (64b) = mm1 (64b) + mm2 (64b) Pokud je quadword výsledek příliš velký pro reprezentaci v 64 bitech (dojde k přetečení), ukládá se pouze dolních 64 bitů do cílového elementu. (tzn. přenos je ignorován).
23 Příklady instrukcí PADDQ xmm1,xmm2/m64 xmm1 (lo 64b) = mm1 (lo 64b) + mm2 (lo 64b) xmm1 (hi 64b) = mm1 (hi 64b) + mm2 (hi 64b) Pokud je quadword výsledek příliš velký pro reprezentaci v 64 bitech (dojde k přetečení), ukládá se pouze dolních 64 bitů docílového elementu. (tzn. přenos je ignorován).
24 Příklady instrukcí PMULUDQ mm1,mm2/m64 mm1 (64b) = mm1 (lo 32b) * mm2 (lo 32b) PADDQ xmm1,xmm2/m64 xmm1 (lo 64b) = mm1 (lo lo 64b) + mm2 (lo lo 64b) xmm1 (hi 64b) = mm1 (hi lo 64b) + mm2 (hi lo 64b)
25 Příklady instrukcí PUNPCKHQDQ xmm1, xmm2/m128 Prokládá vyšší quadword zdrojového operandu a vyšší slovo cílového operandu Výsledek zapisuje do cílového registru. Nižší quadwordy jsou ignorovány.
26 SSE2 SSE2 rozšíření zvyšuje podporu zavedenou SSE pro řízení cache paměti SIMD operací SSE2 instrukce pro řízení cache poskytuje možnosti proudění dat z/do XMM registrů v lepší spolupráci s cache a možnosti přednačítání dat (prefetch) předtím než jsou použita.
27 SSE2 a podmíněné skoky Byly implementovány prefixy pro modifikaci chování prediktoru podmíněných skoků (Branch Hints). hwnt = Hint Weakly Not Taken. hst = Hint Strongly Taken.
28 Cache a SSE2 clflush Vyprázdní Cache Line ze všech úrovní cache. lfence - Garantuje, že všechny (pozdržené) paměťové čtení budou po této instrukci provedeny mfence - Garantuje, že všechny (pozdržené) paměťové operace budou po této instrukci provedeny
29 SSE3 SSE3 bylo uvedeno na začátku roku 2004 procesoru Pentium 4 s kódovým označením Prescott = Prescott New Instructions (PNI). SSE3 dále rozšiřuje SSE2 o dalších 13 instrukcí. Nejpodstatnější změnou je nový horizontální přístup k registrům, zatímco všechny předešlé SSE instrukce měly více či méně striktní přístup vertikální. Přibyly specializované instrukce pro horizontální součet a rozdíl. Tyhle instrukce zjednodušují implementaci mnoha 3D operací a digitálního zpracování signálu.
30 SSE3 Toto rozšíření zahrnuje 13 instrukcí. 10 z nich podporuje SIMD model provádění instrukcí užívaný již předešlými sadami SSE/SSE2. 1 SSE3 instrukce zrychluje styl x87 programování pro převod čísel v plovoucí řádové čárce na celočíselnou hodnotu. Zbylé 2 instrukce (MONITOR a MWAIT) urychlují synchronizaci vláken.
31 SSE3 (detailně) jedna instrukce zvyšující výkon při konverzi x87 FPU plovoucí čárky na jedna instrukce poskytující specializované nezarovnané načtení 128 bitových dat Tři instrukce zvyšující výkon pro načítání, přesun a duplikaci Dvě instrukce pro komprimované sčítání a odčítání Čtyři instrukce pro horizontální sčítání a odčítání Instrukce pro synchronizaci vláken Dvě instrukce zlepšující synchronizaci mezi agenty multivláken
32 Horizontální a asymetrické zpracování Většina SSE/SSE2 instrukcí urychluje SIMD zpracování dat použitím modelu označovaného jako vertikální počítání. Užitím tohoto modelu je tok dat mezi vstupními a výstupními datovými elementy vertikální SSE3 přináší instrukce, které urychlují SIMD zpracování v plovoucí řádové čárce, kde výsledek každého výstupního datového elementu zahrnuje buďto asymetrické zpracování nebo horizontální přesun dat vstupních datových elementů.
33 Cache a SSE prefetcht0 - načte cache-line do všech úrovní prefetcht1 - načte cache-line do všech úrovní kromě nejbližší k CPU prefetcht2 - načte cache-line do všech úrovní kromě 2 nejbližších k CPU prefetchnta - načte cache-line do všech úrovní kromě 2 nejbližších k CPU sfence - Guarantees that all memory writes issued before the sfence instruction are completed before any writes after the sfence instruction.
34 ADDSUBPD Nesymetrický výpočet Cíl xmm1 = <A,B> Zdroj xmm2 = <C,D> Výsledek <A+C, B-D>
35 HADDPD Horizontální výpočet Cíl xmm1 = <A,B> Zdroj xmm2 = <C,D> Výsledek <C+D, A+B>
36 AMD a SSE SSE Tahle instrukční sada byla později adoptována i firmou AMD a poprvé se objevila s procesorem Athlon XP. SSE2 Rival AMD později přidal podporu SSE2 s uvedením procesoru Opteron a Athlon 64 (64 bitový procesor) roku AMD také rozšířil původní Intelovskou SSE2 zdvojnásobením počtu XMM registrů z 8 na 16, tj. XMM0 až XMM15. Přídavné registry jsou však viditelné pouze v 64 bitovém módu, známém jako AMD64. Intel také později přejal přídavné XMM registry, uvedené AMD, když doznámil, že přijme AMD64 architekturu pro své vlastní procesory v roce 2004 (x86 64). SSE3 AMD uvedlo SSE3 v revizi E procesorů Athlon 64 (duben 2005), ale vypustilo podporu instrukcí monitor and mwait
37 Po SSE3 SSSE3 = Intel Core 2, 16 nových instrukcí, zpočátku označováno jako SSE4 nebo Tejas New Instructiosn (TNI), or Merom New Instructions (MNI). SSE4 (začátek roku 2007) SSE nových instrukcí SSE4.2 7 nových instrukcí SSE4a je od AMD, částečná podpora SSE4 a 6 nových instrukcí
38 AVX Rozšíření navazují na SSE Uvedeno poprvé v CPU Sandy Bridge Zatím jen první generace Podpora 256bit operandů 3 a 4-operandové instrukce
39 Detekce rozšíření Intel Předpokládáme dostupnost CPUID mov EAX, 1 ; požadavek na vzhled flagů CPUID ; ; nebo db 0Fh, 0A2h = instrukce CPUID test EDX, hodnota
40 Detekce rozšíření AMD mov EAX, 0x ; požadavek na vzhled flagů CPUID ; 0Fh, 0A2h instrukce CPUID test EDX, hodnota
41 Vložení CPUID #define cpuid(func,a,b,c,d)\ asm {\ mov eax, func\ cpuid\ mov a, eax\ mov b, ebx\ mov c, ecx\ mov d, edx\ }
42 Detekce rozšíření (2) V registru EDX Bit 23 = MMX Bit 25 = SSE Bit 26 = SSE2 Bit 28 = HyperThreading V registru ECX Bit 0 = SSE3
43 Detekce rozšíření AMD(2) V registru EDX Bit 22 = AMD MMX Extensions Bit 30 = 3DNow!2 Bit 31 = 3DNow!
Jan Nekvapil ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická
Jan Nekvapil jan.nekvapil@tiscali.cz ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická Motivace MMX, EMMX, MMX+ 3DNow!, 3DNow!+ SSE SSE2 SSE3 SSSE3 SSE4.2 Závěr 2 Efektivní práce s vektory
VíceProcesor z pohledu programátora
Procesor z pohledu programátora Terminologie Procesor (CPU) = řadič + ALU. Mikroprocesor = procesor vyrobený monolitickou technologií na čipu. Mikropočítač = počítač postavený na bázi mikroprocesoru. Mikrokontrolér
VíceArchitektury VLIW M. Skrbek a I. Šimeček
Architektury VLIW M. Skrbek a I. Šimeček xsimecek@fit.cvut.cz Katedra počítačových systémů FIT České vysoké učení technické v Praze Ivan Šimeček, 2011 MI-PAP, LS2010/11, Predn.3 Příprava studijního programu
VíceProcesor Intel Pentium (1) Procesor Intel Pentium (3) Procesor Intel Pentium Pro (1) Procesor Intel Pentium (2)
Procesor Intel Pentium (1) 32-bitová vnitřní architektura s 64-bitovou datovou sběrnicí Superskalární procesor: obsahuje více než jednu (dvě) frontu pro zřetězené zpracování instrukcí (značeny u, v) poskytuje
VíceIntel 80486 (2) Intel 80486 (1) Intel 80486 (3) Intel 80486 (4) Intel 80486 (6) Intel 80486 (5) Nezřetězené zpracování instrukcí:
Intel 80486 (1) Vyroben v roce 1989 Prodáván pod oficiálním názvem 80486DX Plně 32bitový procesor Na svém čipu má integrován: - zmodernizovaný procesor 80386 - numerický koprocesor 80387 - L1 (interní)
VíceIPA - Lab.3 SSE instrukce, zarovnání dat
IPA - Lab.3 SSE instrukce, zarovnání dat Ondřej Klubal http://www.fit.vutbr.cz/~iklubal/ipa/ 2015 Ondřej Klubal IPA - Lab.3 1 / 25 Osnova Data alignment Data alignment ve VS 2010 Příklad na data alignment
VíceCHARAKTERISTIKA MODERNÍCH PENTIÍ. Flynnova klasifikace paralelních systémů
Úvod: CHARAKTERISTIKA MODERNÍCH PENTIÍ Flynnova klasifikace paralelních systémů Paralelní systémy lze třídit z hlediska počtu toků instrukcí a počtu toků dat: SI systém s jedním tokem instrukcí (Single
VíceRoman Výtisk, VYT027
Roman Výtisk, VYT027 Ohlédnutí za architekturou AMD K8 Představení architektury procesoru AMD K10 Přínos Struktura cache IMC, HyperTransport sběrnice Použitá literatura Ohlášení x86-64 architektury 5.
VíceCharakteristika dalších verzí procesorů v PC
Charakteristika dalších verzí procesorů v PC 1 Cíl přednášky Poukázat na principy tvorby architektur nových verzí personálních počítačů. Prezentovat aktuální pojmy. 2 Úvod Zvyšování výkonu cestou paralelizace
VícePředstavení a vývoj architektur vektorových procesorů
Představení a vývoj architektur vektorových procesorů Drong Lukáš Dro098 1 Obsah Úvod 3 Historie, současnost 3 Architektura 4 - pipelining 4 - Operace scatter a gather 4 - vektorové registry 4 - Řetězení
VíceCharakteristika dalších verzí procesorů Pentium
Charakteristika dalších verzí procesorů Pentium 1 Cíl přednášky Poukázat na principy architektur nových verzí typů Pentií. Prezentovat aktuální pojmy. 2 Úvod Paralelní systémy lze třídit z hlediska počtu
VícePohled do nitra mikroprocesoru Josef Horálek
Pohled do nitra mikroprocesoru Josef Horálek Z čeho vycházíme = Vycházíme z Von Neumannovy architektury = Celý počítač se tak skládá z pěti koncepčních bloků: = Operační paměť = Programový řadič = Aritmeticko-logická
VíceVyužití ICT pro rozvoj klíčových kompetencí CZ.1.07/1.5.00/
Střední odborná škola elektrotechnická, Centrum odborné přípravy Zvolenovská 537, Hluboká nad Vltavou Využití ICT pro rozvoj klíčových kompetencí CZ.1.07/1.5.00/34.0448 CZ.1.07/1.5.00/34.0448 1 Číslo projektu
VíceSběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC
Informační systémy 2 Obsah: Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC ROM RAM Paměti typu CACHE IS2-4 1 Dnešní info: Informační systémy 2 03 Informační systémy
VíceARCHITEKTURA PROCESORŮ
ARCHITEKTURA PROCESORŮ Základními jednotkami, které tvoří vnitřní strukturu procesorů, jsou: řadič, který má za úkol číst operandy (data, čísla) a instrukce z operační paměti, dekódovat je a na základě
VíceProcesor. Procesor FPU ALU. Řadič mikrokód
Procesor Procesor Integrovaný obvod zajišťující funkce CPU Tvoří srdce a mozek celého počítače a do značné míry ovlivňuje výkon celého počítače (čím rychlejší procesor, tím rychlejší počítač) Provádí jednotlivé
VíceZáklady informatiky. 2. Přednáška HW. Lenka Carr Motyčková. February 22, 2011 Základy informatiky 2
Základy informatiky 2. Přednáška HW Lenka Carr Motyčková February 22, 2011 Základy informatiky 1 February 22, 2011 Základy informatiky 2 February 22, 2011 Základy informatiky 3 February 22, 2011 Základy
VíceČinnost CPU. IMTEE Přednáška č. 2. Několik úrovní abstrakce od obvodů CPU: Hodinový cyklus fáze strojový cyklus instrukční cyklus
Činnost CPU Několik úrovní abstrakce od obvodů CPU: Hodinový cyklus fáze strojový cyklus instrukční cyklus Hodinový cyklus CPU je synchronní obvod nutné hodiny (f CLK ) Instrukční cyklus IF = doba potřebná
VícePROCESOR. Typy procesorů
PROCESOR Procesor je ústřední výkonnou jednotkou počítače, která čte z paměti instrukce a na jejich základě vykonává program. Primárním úkolem procesoru je řídit činnost ostatních částí počítače včetně
VíceOPS Paralelní systémy, seznam pojmů, klasifikace
Moorův zákon (polovina 60. let) : Výpočetní výkon a počet tranzistorů na jeden CPU chip integrovaného obvodu mikroprocesoru se každý jeden až dva roky zdvojnásobí; cena se zmenší na polovinu. Paralelismus
Více2.8 Procesory. Střední průmyslová škola strojnická Vsetín. Ing. Martin Baričák. Název šablony Název DUMu. Předmět Druh učebního materiálu
Název školy Číslo projektu Autor Název šablony Název DUMu Tematická oblast Předmět Druh učebního materiálu Anotace Vybavení, pomůcky Ověřeno ve výuce dne, třída Střední průmyslová škola strojnická Vsetín
VícePřednáška. Správa paměti II. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012
Přednáška Správa paměti II. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012 Příprava studijního programu Informatika je podporována projektem financovaným z Evropského
VíceAdresní mody procesoru
Adresní mody procesoru K.D. - přednášky 1 Obecně o adresování Různé typy procesorů mohou mít v instrukci 1, 2 nebo více adres. Operandy mohou ležet v registrech nebo v paměti. Adresní mechanismus procesoru
VícePrincip funkce počítače
Princip funkce počítače Princip funkce počítače prvotní úlohou počítačů bylo zrychlit provádění matematických výpočtů první počítače kopírovaly obvyklý postup manuálního provádění výpočtů pokyny pro zpracování
VíceCache paměť - mezipaměť
Cache paměť - mezipaměť 10.přednáška Urychlení přenosu mezi procesorem a hlavní pamětí Hlavní paměť procesoru je typu DRAM a je pomalá. Proto se mezi pomalou hlavní paměť a procesor vkládá menší, ale rychlá
VíceStruktura a architektura počítačů (BI-SAP) 7
Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Struktura a architektura počítačů (BI-SAP) 7 doc. Ing. Hana Kubátová, CSc. Katedra číslicového návrhu Fakulta informačních technologii
VíceReferát (pokročilé architektury počítačů)
Referát (pokročilé architektury počítačů) Představení architektury procesoru AMD K10 Roman Výtisk, VYT027 1 AMD K8 Nejprve bych zmínil, co této architektuře předcházelo a co tato architektura přinesla
VíceFaculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague
Tomáš Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague Zjednodušené schéma systému z základ hardware pro mainframe tvoří: operační pamět - MAIN / REAL STORAGE jeden
VícePetr Krajča. 26. říjen, 2012
Operační systémy Řízení výpočtu Petr Krajča Katedra informatiky Univerzita Palackého v Olomouci 26. říjen, 2012 Petr Krajča (UP) KMI/YOS: Přednáška II. 26. říjen, 2012 1 / 18 Reprezentace hodnot záporná
VíceÚvod. Instrukce musí obsahovat: typ operace adresu operandu (operandů) typ operandů modifikátory adresy modifikátory operace POT POT
Úvod Instrukce musí obsahovat: typ operace adresu operandu (operandů) typ operandů modifikátory adresy modifikátory operace K.D. - přednášky 2 Pevná a proměnná délka instrukce (1) Pevná délka instrukce
Vícex86 assembler and inline assembler in GCC
x86 assembler and inline assembler in GCC Michal Sojka sojkam1@fel.cvut.cz ČVUT, FEL License: CC-BY-SA 4.0 Useful instructions mov moves data between registers and memory mov $1,%eax # move 1 to register
VíceReprezentace dat v informačních systémech. Jaroslav Šmarda
Reprezentace dat v informačních systémech Jaroslav Šmarda Reprezentace dat v informačních systémech Reprezentace dat v počítači Datové typy Proměnná Uživatelské datové typy Datové struktury: pole, zásobník,
VíceMIKROPROCESOR. (c) Ing. Josef Varačka. Title: XI 28 11:40 (1 of 8)
MIKROPROCESOR 1/ Účel: Vzhledem k pokračující digitalizaci (používání zpracování dvojkového signálu) je žádoucí provozovat univerzální zařízení, které podle programu instrukcí informace zpracuje. Mikroprocesor
VíceJak do počítače. aneb. Co je vlastně uvnitř
Jak do počítače aneb Co je vlastně uvnitř Po odkrytí svrchních desek uvidíme... Von Neumannovo schéma Řadič ALU Vstupně/výstupní zař. Operační paměť Počítač je zařízení, které vstupní údaje transformuje
VíceArchitektura počítačů Logické obvody
Architektura počítačů Logické obvody http://d3s.mff.cuni.cz/teaching/computer_architecture/ Lubomír Bulej bulej@d3s.mff.cuni.cz CHARLES UNIVERSITY IN PRAGUE faculty of mathematics and physics Digitální
VíceGymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto
Gymnázium Vysoké Mýto nám. Vaňorného 163, 566 01 Vysoké Mýto Registrační číslo projektu Šablona Autor Název materiálu CZ.1.07/1.5.00/34.0951 III/2 INOVACE A ZKVALITNĚNÍ VÝUKY PROSTŘEDNICTVÍM ICT Mgr. Petr
VíceArchitektury CISC a RISC, uplatnění v personálních počítačích
Architektury CISC a RISC, uplatnění v personálních počítačích 1 Cíl přednášky Vysvětlit, jak pracují architektury CISC a RISC, upozornit na rozdíly. Zdůraznit, jak se typické rysy obou typů architektur
VíceCHARAKTERISTIKA PROCESORU PENTIUM První verze:
CHARAKTERISTIKA PROCESORU PENTIUM První verze: Verze Pentia 200 Mhz uvádělo se 330 MIPS (srovnávalo se s 54 MIPS procesoru 486DX2-66). Struktura Pentia Rozhraní 64 bitů datová sběrnice, 32 bitů adresová
VícePROCESORY. Typy procesorů
PROCESORY Procesor (CPU Central Processing Unit) je ústřední výkonnou jednotkou počítače, která čte z paměti instrukce a na jejich základě vykonává program. Primárním úkolem procesoru je řídit činnost
VícePřednáška. Vstup/Výstup. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012
Přednáška Vstup/Výstup. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012 Příprava studijního programu Informatika je podporována projektem financovaným z Evropského
VíceStruktura a architektura počítačů (BI-SAP) 6
Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Struktura a architektura počítačů (BI-SAP) 6 doc. Ing. Hana Kubátová, CSc. Katedra číslicového návrhu Fakulta informačních technologii
VíceStrojový kód k d a asembler procesoru MIPS SPIM. MIPS - prostředí NMS NMS. 32 ks 32bitových registrů ( adresa registru = 5 bitů).
Strojový kód k d a asembler procesoru MIPS Použit ití simulátoru SPIM K.D. - cvičení ÚPA 1 MIPS - prostředí 32 ks 32bitových registrů ( adresa registru = 5 bitů). Registr $0 je zero čte se jako 0x0, zápis
VíceVektorové instrukční sady a použití assembleru v gcc
Vektorové instrukční sady a použití assembleru v gcc Martin Bruchanov BruXy bruxy@regnet.cz http://bruxy.regnet.cz 23. března 2009 1 Instrukční sady SIMD procesorů x86........................................
VíceIvan Šimeček, Pavel Tvrdík
Optimalizace a hodnocení efektivity lineárních kódů Ivan Šimeček, Pavel Tvrdík Department of Computer Science and Engineering Faculty of Electrical Engineering Czech Technical University Karlovo nám. 13
VíceVyužití ICT pro rozvoj klíčových kompetencí CZ.1.07/1.5.00/
Střední odborná škola elektrotechnická, Centrum odborné přípravy Zvolenovská 537, Hluboká nad Vltavou Využití ICT pro rozvoj klíčových kompetencí CZ.1.07/1.5.00/34.0448 CZ.1.07/1.5.00/34.0448 1 Číslo projektu
VíceČíselné soustavy v mikroprocesorové technice Mikroprocesorová technika a embedded systémy
Ústav radioelektroniky Vysoké učení technické v Brně Číselné soustavy v mikroprocesorové technice Mikroprocesorová technika a embedded systémy Přednáška 8 doc. Ing. Tomáš Frýza, Ph.D. listopad 2012 Obsah
VíceISU Cvičení 3. Marta Čudová
ISU Cvičení 3 Marta Čudová Supercomputing Technologies Research Group Brno University of Technology, Faculty of Information Technology Božetěchova 1/2, 612 66 Brno - Královo Pole icudova@fit.vutbr.cz Program
VícePřednášky o výpočetní technice. Hardware teoreticky. Adam Dominec 2010
Přednášky o výpočetní technice Hardware teoreticky Adam Dominec 2010 Rozvržení Historie Procesor Paměť Základní deska přednášky o výpočetní technice Počítací stroje Mechanické počítačky se rozvíjely už
VíceSemestrální práce z předmětu Speciální číslicové systémy X31SCS
Semestrální práce z předmětu Speciální číslicové systémy X31SCS Katedra obvodů DSP16411 ZPRACOVAL: Roman Holubec Školní rok: 2006/2007 Úvod DSP16411 patří do rodiny DSP16411 rozšiřuje DSP16410 o vyšší
VíceArchitektura počítačů Logické obvody
Architektura počítačů Logické obvody http://d3s.mff.cuni.cz/teaching/computer_architecture/ Lubomír Bulej bulej@d3s.mff.cuni.cz CHARLES UNIVERSITY IN PRAGUE faculty of mathematics and physics 2/36 Digitální
VíceStrojový kód. Instrukce počítače
Strojový kód Strojový kód (Machine code) je program vyjádřený v počítači jako posloupnost instrukcí procesoru (posloupnost bajtů, resp. bitů). Z hlediska uživatele je strojový kód nesrozumitelný, z hlediska
VíceParalelní systémy. SIMD jeden tok instrukcí + více toků dat jedním programem je zpracováváno více různých souborů dat
Paralelní systémy Paralelním systémem rozumíme takový systém, který paralelně zpracovává více samostatných úloh nebo zpracování určité úlohy automaticky rozdělí do menších částí a paralelně je zpracovává.
VícePokročilé architektury počítačů
Pokročilé architektury počítačů Tutoriál 3 CUDA - GPU Martin Milata Výpočetní model CUDA Organizace kódu Sériově organizovaný kód určený pro CPU Paralelní kód prováděný na GPU Označuje se jako kernel GPU
VíceMetody připojování periferií
Metody připojování periferií BI-MPP Přednáška 3 Ing. Miroslav Skrbek, Ph.D. Katedra počítačových systémů Fakulta informačních technologií České vysoké učení technické v Praze Miroslav Skrbek 2010,2011
Vícev aritmetické jednotce počíta
v aritmetické jednotce počíta tače (Opakování) Dvojková, osmičková a šestnáctková soustava () Osmičková nebo šestnáctková soustava se používá ke snadnému zápisu binárních čísel. 2 A 3 Doplněné nuly B Číslo
VíceArchitektura Intel Atom
Architektura Intel Atom Štěpán Sojka 5. prosince 2008 1 Úvod Hlavní rysem Atomu je podpora platformy x86, která umožňuje spouštět a běžně používat řadu let vyvíjené aplikace, na které jsou uživatelé zvyklí
VíceProcesor. Základní prvky procesoru Instrukční sada Metody zvýšení výkonu procesoru
Počítačové systémy Procesor Miroslav Flídr Počítačové systémy LS 2006-1/17- Západočeská univerzita v Plzni Víceúrovňová organizace počítače Digital logic level Microarchitecture level Processor Instruction
VíceData v počítači. Informační data. Logické hodnoty. Znakové hodnoty
Data v počítači Informační data (elementární datové typy) Logické hodnoty Znaky Čísla v pevné řádové čárce (celá čísla) v pohyblivé (plovoucí) řád. čárce (reálná čísla) Povelová data (instrukce programu)
VícePřednáška 1. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012
Přednáška 1 Úvod do HW a OS. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012 Příprava studijního programu Informatika je podporována projektem financovaným z Evropského
VíceKubatova 19.4.2007 Y36SAP - 13. procesor - control unit obvodový a mikroprogramový řadič RISC. 19.4.2007 Y36SAP-control unit 1
Y36SAP - 13 procesor - control unit obvodový a mikroprogramový řadič RISC 19.4.2007 Y36SAP-control unit 1 Von Neumannova architektura (UPS1) Instrukce a data jsou uloženy v téže paměti. Paměť je organizována
VíceVlastnosti mikroprocesorů Josef Horálek
Vlastnosti mikroprocesorů Josef Horálek Vlastnosti mikroprocesorů = Vlastnosti jsou dány architekturou mikroprocesoru, kde se používají, jak již bylo řečeno, různé technologie. = Vlastnosti kterými se
VíceSběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC
Informatika 2 Technické prostředky počítačové techniky - 2 Přednáší: doc. Ing. Jan Skrbek, Dr. - KIN Přednášky: středa 14 20 15 55 Spojení: e-mail: jan.skrbek@tul.cz 16 10 17 45 tel.: 48 535 2442 Obsah:
VíceARCHITEKTURA PROCESORŮ
ARCHITEKTURA PROCESORŮ Základními jednotkami, které tvoří vnitřní strukturu procesorů, jsou: řadič, který má za úkol číst operandy (data, čísla) a instrukce z operační paměti, dekódovat je a na základě
VíceArchitektura počítačů
Architektura počítačů Studijní materiál pro předmět Architektury počítačů Ing. Petr Olivka katedra informatiky FEI VŠB-TU Ostrava email: petr.olivka@vsb.cz Ostrava, 2010 1 1 Architektura počítačů Pojem
VíceČísla, reprezentace, zjednodušené výpočty
Čísla, reprezentace, zjednodušené výpočty Přednáška 5 A3B38MMP kat. měření, ČVUT - FEL, Praha J. Fischer A3B38MMP, 2015, J.Fischer, ČVUT - FEL, kat. měření 1 Čísla 4 bitová dec bin. hex. 0 0000 0 1 0001
VíceLinux a 64 bitů. SUSE Labs. Michal Ludvig Vojtěch Pavlík
1 Linux a 64 bitů Michal Ludvig Vojtěch Pavlík SUSE Labs 02.04.04 Linux a 64 bitů, Michal Ludvig+Vojtěch Pavlík, SUSE Labs, 02.04.04, Strana 1 64 čeho? 2 bitovost procesoru
VícePetr Krajča. Katedra informatiky Univerzita Palackého v Olomouci. Petr Krajča (UP) KMI/YOS: Přednáška I. 10. 10. 2014 1 / 21
Operační systémy Úvod do Operačních Systémů Petr Krajča Katedra informatiky Univerzita Palackého v Olomouci Petr Krajča (UP) KMI/YOS: Přednáška I. 10. 10. 2014 1 / 21 Organizační informace email: petr.krajca@upol.cz
VíceStruktura a architektura počítačů (BI-SAP) 11
Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Struktura a architektura počítačů (BI-SAP) 11 doc. Ing. Hana Kubátová, CSc. Katedra číslicového návrhu Fakulta informačních technologii
VíceRISC a CISC architektura
RISC a CISC architektura = dva rozdílné přístupy ke konstrukci CPU CISC (Complex Instruction Set Computer) vývojově starší přístup: pomoci konstrukci překladače z VPP co nejpodobnějšími instrukcemi s příkazy
VíceZákladní deska (1) Parametry procesoru (2) Parametry procesoru (1) Označována také jako mainboard, motherboard
Základní deska (1) Označována také jako mainboard, motherboard Deska plošného spoje tvořící základ celého počítače Zpravidla obsahuje: procesor (mikroprocesor) patici pro numerický koprocesor (resp. osazený
VíceVysoká škola báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky. referát do předmětu: Pokročilé architektury počítačů.
Vysoká škola báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky referát do předmětu: Pokročilé architektury počítačů na téma: Intel Atom Jan Bajer; baj102 Úvod Během posledních let
VíceProfilová část maturitní zkoušky 2014/2015
Střední průmyslová škola, Přerov, Havlíčkova 2 751 52 Přerov Profilová část maturitní zkoušky 2014/2015 TEMATICKÉ OKRUHY A HODNOTÍCÍ KRITÉRIA Studijní obor: 26-41-M/01 Elektrotechnika Zaměření: technika
VíceIntel 80286. Procesor a jeho konstrukce. Vývojové typy, činnost procesoru
Procesor a jeho konstrukce. Vývojové typy, činnost procesoru První obvod nazvaný mikroprocesor uvedla na trh firma Intel v roce 1970. Šlo o 4bitový procesor Intel 4004. V roce 1972 byl MCS8 prvním 8bitovým
VícePetr Krajča. Katedra informatiky Univerzita Palackého v Olomouci. Petr Krajča (UP) KMI/YOS: Přednáška II. 14. říjen, / 26
Operační systémy Řízení výpočtu Petr Krajča Katedra informatiky Univerzita Palackého v Olomouci Petr Krajča (UP) KMI/YOS: Přednáška II. 14. říjen, 2016 1 / 26 Reprezentace hodnot záporná čísla jsou v doplňkovém
VíceParalelní programování
Paralelní programování přednáška 5 Michal Krupka 15. března 2011 Michal Krupka (KI UP) Paralelní programování 15. března 2011 1 / 13 Ještě ke kritickým sekcím Použití v praxi obvykle pomocí zámků (locks)
VíceC2115 Praktický úvod do superpočítání
C2115 Praktický úvod do superpočítání IX. lekce Petr Kulhánek, Tomáš Bouchal kulhanek@chemi.muni.cz Národní centrum pro výzkum biomolekul, Přírodovědecká fakulta, Masarykova univerzita, Kotlářská 2, CZ-61137
VíceProcesy a vlákna (Processes and Threads)
ÚVOD DO OPERAČNÍCH SYSTÉMŮ Ver.1.00 Procesy a vlákna (Processes and Threads) Správa procesů a vláken České vysoké učení technické Fakulta elektrotechnická 2012 Použitá literatura [1] Stallings, W.: Operating
Víceproduktů. produkty: AutoCAD Mechanical Showcase Autodesk Autodesk Designer SketchBook Autodesk Mudbox Vault Autodesk Ultimate Intel Xeon Intel Core
Autodesk Product Design Suite Standard 20122 Systémové požadavky Typičtí uživatelé a pracovní postup Konstruktérům a inženýrům, kteří vyvíjejí pozoruhodné produkty, nabízí sada Autodesk Product Design
VícePřehled paralelních architektur. Dělení paralelních architektur Flynnova taxonomie Komunikační modely paralelních architektur
Přehled paralelních architektur Přehled paralelních architektur Dělení paralelních architektur Flynnova taxonomie Komunikační modely paralelních architektur Přehled I. paralelní počítače se konstruují
VíceArchitektury CISC a RISC, uplatnění v personálních počítačích - pokračování
Architektury CISC a RISC, uplatnění v personálních počítačích - pokračování 1 Cíl přednášky Vysvětlit, jak pracují architektury CISC a RISC, upozornit na rozdíly. Upozornit, jak se typické rysy obou typů
VíceRegistry 32 bitové pro všeobecné použití: EAX, EBX, ECX, EDX, ESI, EDI, EBP, ESP.
1 Procesor i486 a vyšší - úvodní seznámení Procesory i486 a vyšší jsou v technické literatuře dobře dokumentovány, ale dokumentace je rozsáhlá a obsahuje pro začínajícího i zkušeného programátora mnoho
VíceOperační systémy 2. Přednáška číslo 1. Úvod do OS
Operační systémy 2 Přednáška číslo 1 Úvod do OS Co je to operační systém (definice) Operační systém jsou ty programové moduly ve výpočetním systému, jež ovládají řízení prostředku, jimiž je tento výpočetní
VíceDalší aspekty architektur CISC a RISC Aktuálnost obsahu registru
Cíl přednášky: Vysvětlit principy práce s registry v architekturách RISC a CISC, upozornit na rozdíly. Vysvětlit možnosti využívání sad registrů. Zabývat se principy využívanými v procesorech Intel. Zabývat
VíceÚvod do problematiky návrhu počítačových systémů. INP 2008 FIT VUT v Brně
Úvod do problematiky návrhu počítačových systémů INP 2008 FIT VUT v Brně Čím se budeme zabývat Budou nás zejména zajímat jednoprocesorové číslicové počítače: Funkce počítače Struktura propojení funkčních
VíceStruktura a architektura počítačů (BI-SAP) 10
Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Struktura a architektura počítačů (BI-SAP) 10 doc. Ing. Hana Kubátová, CSc. Katedra číslicového návrhu Fakulta informačních technologii
VíceCell broadband engine architecture
Cell broadband engine architecture Semestrální práce z předmětu 31SCS Martin Černý Abstrakt Specifikace procesoru ukazují při zachování nízké pořizovací ceny na velké výpočetní kapacity. Procesor kombinuje
VíceSekvenční architektury II. Zpracování instrukcí
Sekvenční architektury II Zpracování instrukcí Jak zvýšit výkon CPU zkrátit čas nutný ke zpracování 1 instrukce urychlit časovač (Timer) = zvýšení taktu to je technicky velmi náročné, poslední dobou se
Více1.1 Struktura programu v Pascalu Vstup a výstup Operátory a některé matematické funkce 5
Obsah Obsah 1 Programovací jazyk Pascal 1 1.1 Struktura programu v Pascalu.................... 1 2 Proměnné 2 2.1 Vstup a výstup............................ 3 3 Operátory a některé matematické funkce 5
VíceZÁKLADY PROGRAMOVÁNÍ. Mgr. Vladislav BEDNÁŘ 2013 1.3 2/14
ZÁKLADY PROGRAMOVÁNÍ Mgr. Vladislav BEDNÁŘ 2013 1.3 2/14 Co je vhodné vědět, než si vybereme programovací jazyk a začneme programovat roboty. 1 / 14 0:40 1.3. Vliv hardware počítače na programování Vliv
VíceCISC A RISC PROCESORY Jak pracují procesory CISC:
Cíl přednášky Seznámit se s charakteristickými rysy architektur CISC a RISC. Ukázat, jak tyto rysy postupně pronikaly do architektur procesorů Intel. Ukázat, jak se vyvíjely principy zřetězeného zpracování.
VíceAssembler - 2.část. poslední změna této stránky: Zpět
1 z 9 19.2.2007 7:51 Assembler - 2.část poslední změna této stránky: 9.2.2007 1. Příznaky (flagy) Zpět Flagy (česky podivně "příznaky", proto používám výhradně anglický název) jsou výlučnou záležitostí
VícePokročilé architektury počítačů
Pokročilé architektury počítačů Přednáška 5 GPU - CUDA Martin Milata Obsah Obecné výpočty a GPU Grafické procesory NVIDIA Tesla Výpočetní model Paměťový model GT200 Zpracování instrukcí Vydávání instrukcí
VíceObecné výpočty na GPU v jazyce CUDA. Jiří Filipovič
Obecné výpočty na GPU v jazyce CUDA Jiří Filipovič Obsah přednášky motivace architektura GPU CUDA programovací model jaké algoritmy urychlovat na GPU? optimalizace Motivace Moorův zákon stále platí pro
VícePROCESOR. Rozdělení procesorů
PROCESOR Procesor je ústřední výkonnou jednotkou počítače, která čte z operační paměti (resp. CACHE paměti) instrukce a na jejich základě vykonává program. Primárním úkolem procesoru je řídit činnost ostatních
VíceArchitektura počítače
Architektura počítače Výpočetní systém HIERARCHICKÁ STRUKTURA Úroveň aplikačních programů Úroveň obecných funkčních programů Úroveň vyšších programovacích jazyků a prostředí Úroveň základních programovacích
VíceInstrukční sada pro používání ControlLogix a CompactLogix výňatek
Instrukční sada pro používání ControlLogix a CompactLogix výňatek V této části uvedeme několik instrukcí potřebných pro řešení laboratorních úloh v předmětu BPGA. Uvádíme jenom část instrukcí, v případě
VíceVÝRAZY výrazy = operandy prokládané operátory, vyhodnocované podle priority operátorů
VÝRAZY výrazy = operandy prokládané operátory, vyhodnocované podle priority operátorů Výrazy podle priority operátorů (od nejnižší priority) OPERANDY OPERÁTORY výraz = jednoduché výrazy a relační operátory
VíceArchitektury CISC a RISC, uplatnění rysů architektur RISC v personálních počítačích - pokračování
Architektury CISC a RISC, uplatnění rysů architektur RISC v personálních počítačích - pokračování 1 Cíl přednášky Vysvětlit další rysy architektur CISC a RISC, upozornit na rozdíly. Upozornit, jak se typické
VíceSekvenční architektury II. Zpracování instrukcí
Sekvenční architektury II Zpracování instrukcí Jak zvýšit výkon CPU zkrátit čas nutný ke zpracování 1 instrukce urychlit časovač (Timer) = zvýšení taktu to je technicky velmi náročné, poslední dobou se
VíceAssembler DRUHÁ ČÁST OBSAH.
DRUHÁ ČÁST OBSAH. 1. Knihovny DLL obecný popis. 2. Statické knihovny Dll - výstupní soubor.lib 3. Připojení statické knihovny do konzolové aplikace. 4. Tvorba vlastních API ve statické knihovně a připojení
Více