Kvantitativní principy návrhu počítačů. doc. Ing. Róbert Lórencz, CSc.

Podobné dokumenty
Kvantitativní principy návrhu počítačů

Kvantitativní principy návrhu počítačů

Výkonnost počítačů, empirické zákony o výkonnosti. INP 2008 FIT VUT v Brně

Aplikovaná numerická matematika - ANM

Architektura počítačů Výkonnost počítačů

Pohled do nitra mikroprocesoru Josef Horálek

Pamět ová hierarchie, virtuální pamět. doc. Ing. Róbert Lórencz, CSc.

Struktura a architektura počítačů (BI-SAP) 1

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

Architektury VLIW M. Skrbek a I. Šimeček

Aplikovaná numerická matematika

Y36SAP

Architektura počítačů Výkonnost počítačů

Strojový kód k d a asembler procesoru MIPS SPIM. MIPS - prostředí NMS NMS. 32 ks 32bitových registrů ( adresa registru = 5 bitů).

Profilová část maturitní zkoušky 2014/2015

Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/ Vzdělávání v informačních a komunikačních technologií

Pamět ová hierarchie, návrh skryté paměti 2. doc. Ing. Róbert Lórencz, CSc.

Procesor. Procesor FPU ALU. Řadič mikrokód

Architektura počítače

OPS Paralelní systémy, seznam pojmů, klasifikace

Profilová část maturitní zkoušky 2015/2016

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

Procesy a vlákna (Processes and Threads)

Přednáška 1. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012

Představení a vývoj architektur vektorových procesorů

Katedra informatiky a výpočetní techniky. 10. prosince Ing. Tomáš Zahradnický doc. Ing. Róbert Lórencz, CSc.

Technické prostředky počítačové techniky

Architektura procesoru ARM

NSWI /2011 ZS. Principy cpypočítačůčů aoperačních systémů ARCHITEKTURA

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

Dynamické programování

Architektura počítačů

Činnost CPU. IMTEE Přednáška č. 2. Několik úrovní abstrakce od obvodů CPU: Hodinový cyklus fáze strojový cyklus instrukční cyklus

2.8 Procesory. Střední průmyslová škola strojnická Vsetín. Ing. Martin Baričák. Název šablony Název DUMu. Předmět Druh učebního materiálu

Architektura počítačů Výkonnost počítačů

1.2 Operační systémy, aplikace

INFORMAČNÍ A KOMUNIKAČNÍ TECHNOLOGIE

Úvod do architektur personálních počítačů

Hospodářská informatika

Architektury počítačů a procesorů

Sběrnicová struktura PC Procesory PC funkce, vlastnosti Interní počítačové paměti PC

PB002 Základy informačních technologií

8. RSA, kryptografie s veřejným klíčem. doc. Ing. Róbert Lórencz, CSc.

PB002 Základy informačních technologií

Architektura procesorů PC shrnutí pojmů

Základy informatiky. 2. Přednáška HW. Lenka Carr Motyčková. February 22, 2011 Základy informatiky 2

Programovací jazyky. imperativní (procedurální) neimperativní (neprocedurální) assembler (jazyk symbolických instrukcí)

Přednáška. Vstup/Výstup. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012

Obsah. Kapitola 1 Hardware, procesory a vlákna Prohlídka útrob počítače...20 Motivace pro vícejádrové procesory...21

Zátěžové testy aplikací

Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Přehled paralelních architektur. Dělení paralelních architektur Flynnova taxonomie Komunikační modely paralelních architektur

PROCESOR. Typy procesorů

Pokročilé architektury počítačů

Virtualizace. Lukáš Krahulec, KRA556

Metody připojování periferií

úvod Historie operačních systémů

Architektura Intel Atom

VÝVOJ ŘÍDICÍCH ALGORITMŮ HYDRAULICKÝCH POHONŮ S VYUŽITÍM SIGNÁLOVÉHO PROCESORU DSPACE

Architektury CISC a RISC, uplatnění v personálních počítačích

Výkonnost mikroprocesoru ovlivňují nejvíce dvě hlediska - architektura mikroprocesoru a tzv. taktovací frekvence procesoru.

Výukový materiál Hardware je zaměřený především na výuku principů práce hardwaru a dále uvádí konkrétní příklady použití.

Kubatova Y36SAP procesor - control unit obvodový a mikroprogramový řadič RISC Y36SAP-control unit 1

1 Úvod 1.1 Vlastnosti programového vybavení (SW)

Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Přednáška. Správa paměti II. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012

Pokročilé architektury počítačů

Struktura a architektura počítačů (BI-SAP) 7

MATURITNÍ OTÁZKY ELEKTROTECHNIKA - POČÍTAČOVÉ SYSTÉMY 2003/2004 PROGRAMOVÉ VYBAVENÍ POČÍTAČŮ

Hardware - komponenty počítačů Von Neumannova koncepce počítače. Von Neumannova koncepce počítače

Datové struktury 2: Rozptylovací tabulky

Další aspekty architektur CISC a RISC Aktuálnost obsahu registru

SUPERPOČÍTAČE DANIEL LANGR ČVUT FIT / VZLÚ

LOGICKÉ OBVODY X36LOB

Klasifikace počítačů a technologické trendy Modifikace von Neumanova schématu pro PC

Principy počítačů a operačních systémů

Procesor z pohledu programátora

Paralelní programování

Programovací jazyky. imperativní (procedurální) neimperativní (neprocedurální) assembler (jazyk symbolických instrukcí)

Přednáška. Strojový kód a data. 4. Přednáška ISA J. Buček, R. Lórencz

Provádění instrukcí. procesorem. Základní model

Integrovaná střední škola, Sokolnice 496

Zpráva o průběhu přijímacího řízení na vysokých školách dle Vyhlášky MŠMT č. 343/2002 a její změně 276/2004 Sb.

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

Paralelní výpočty ve finančnictví

Princip funkce počítače

5.15 INFORMATIKA A VÝPOČETNÍ TECHNIKA

Z{kladní struktura počítače

Počítač jako prostředek řízení. Struktura a organizace počítače

Přednášky o výpočetní technice. Hardware teoreticky. Adam Dominec 2010

Využití ICT pro rozvoj klíčových kompetencí CZ.1.07/1.5.00/

Semestrální práce z předmětu Speciální číslicové systémy X31SCS

Technologie II. Strojní programování. Přednáška č. 7. Autor: doc. Ing. Martin Vrabec, CSc.

Název DUM: VY_32_INOVACE_2B_9_Software_-_základní_programové_vybavení_počítače

Počítač jako elektronické, Číslicové zařízení

Využití ICT pro rozvoj klíčových kompetencí CZ.1.07/1.5.00/

Počítačová sestava popis, komponenty, zkratky

Operační systémy. Přednáška 1: Úvod

Formální Metody a Specifikace (LS 2011) Formální metody pro kyber-fyzikální systémy

Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115

Transkript:

Architektura počítačových systémů Kvantitativní principy návrhu počítačů doc. Ing. Róbert Lórencz, CSc. České vysoké učení technické v Praze Fakulta informačních technologií Katedra počítačových systémů Příprava studijních programů Informatika pro novou fakultu ČVUT je spolufinancována Evropským sociálním fondem a rozpočtem Hlavního města Prahy v rámci Operačního programu Praha adaptabilita (OPPA) projektem CZ.2.17/3.1.00/31952 Příprava a zavedení nových studijních programů Informatika na ČVUT v Praze. Praha & EU: Investujeme do vaší budoucnosti R. Lórencz (ČVUT FIT) Kvantitativní principy návrhu počítačů BI-APS, 2011, Předn. 1.-3. 1 / 30

Obsah přednášky historie časová složitost, propustnost, výkonnost Amdahlův zákon CPU výkonnostní rovnice přesnější CPU výkonnostní rovnice zkušební úlohy MIPS a MFLOPS R. Lórencz (ČVUT FIT) Kvantitativní principy návrhu počítačů BI-APS, 2011, Předn. 1.-3. 2 / 30

Historie vývojové mezníky víc než 50 let uplynulo od vytvoření 1. univerzálního elektronického počítače dnešní PC za 1000 $ jsou výkonnější než počítač z r. 1980 za 1 mil. $ HW průlom: VLSI technologie a příchod mikroprocesorů (70. léta) SW průlom: univerzální na výrobci nezávislé OS (UNIX) a přechod od programování v SOJ k programování ve vyšších jazycích nástup RISC (Reduced Instruction Set Computer), důsledek: paralelizmus na úrovni zpracování instrukcí ILP (Instruction Level Parallelism), tj. proudové zpracování instrukcí, super-skalární architektury atd. používání vnitřních skrytých pamětí (cache) průlom v navrhování: vývoj kvantitativního přístupu k návrhu a analýze počítačů, který využívá empirická pozorování, experimentování a simulace R. Lórencz (ČVUT FIT) Kvantitativní principy návrhu počítačů BI-APS, 2011, Předn. 1.-3. 3 / 30

Historie - chronologie 60. léta: dominantní velké sálové počítače s aplikacemi jako: zpracování dat ve finanční sféře rozsáhlé vědeckotechnické výpočty 70. léta: mikropočítače pro aplikace ve vědeckých laboratořích 80. léta: příchod stolních počítačů založených na mikroprocesorech (osobní počítače a pracovní stanice) dále se objevují servery a lokální sítě pro větší úlohy s větší pamětí a výkonem 90. léta: Internet a WWW technologie současnost: rozdělení počítačového trhu na 3 oblasti charakterizované rozdílným použitím, požadavky a počítačovou technologií: 1 osobní, stolní a přenosné počítače 2 servery a výkonné paralelní počítače a superpočítače 3 vestavěné a řídící počítače v jednoúčelových zařízeních R. Lórencz (ČVUT FIT) Kvantitativní principy návrhu počítačů BI-APS, 2011, Předn. 1.-3. 4 / 30

Časová složitost, propustnost, výkonnost Letadlo Doba letu t Rychlost v Kapacita c Propustnost r = c v DC - Paříž [h] [km/h] [osoba] [osoba km/h] Boeing 747 6.5 981 470 461070 Concorde 3 2172 132 286704 Která linka má větší propustnost / výkonnost? doba letu (doba výpočtu, čas odezvy, latence) = čas, za který splní daný úkon propustnost (šířka pásma, výkon) = práce za den, hodinu, týden, s,... Počítačové analogie: # vykonaných instrukcí v procesoru # přenesených paketů v síti propustnost dat na sběrnici atd. R. Lórencz (ČVUT FIT) Kvantitativní principy návrhu počítačů BI-APS, 2011, Předn. 1.-3. 5 / 30

Časová složitost a výkonnost Concorde vs. Boeing 747 doba letu různá, ale úkon stejný Úkon: let DC Paříž nezáleží na počtu přepravených osob Doba letu: Concorde T C = 3 h, Boeing T B = 6.5 h Concorde je T B /T C = 6.5/3 = 2.2 krát rychlejší Výkonnost P(T ): inverzní hodnota doby T provedení 1 úkonu P T (T ) = Počítačová analogie: 1 časová složitost 1 úkonu = 1 let DC - Paříž = 1 T úkon: provedení 1 programu doba: doba T provedení programu X je k krát rychlejší než Y X má k krát větší výkonnost než Y k = P T (T x ) P T (T y ) = T y T x R. Lórencz (ČVUT FIT) Kvantitativní principy návrhu počítačů BI-APS, 2011, Předn. 1.-3. 6 / 30

Časová složitost a propustnost Concorde vs. Boeing 747: doba letu různá, ale také různě velký úkon Úkon: # přepravených osob DC Paříž Concorde c = 132 os., Boeing c = 470 os. Doba letu: Concorde T C = 3 h, Boeing T B = 6.5 h Boeing je r B /r C = 461070/286704 = 1.6 krát propustnější Výkonnost P(n, T ): n úkonů za čas T úkon P r (n, T )= čas. složitost = # osob vzdál. let DC - Paříž = n T = cd T Počítačová analogie: úkon: různý, provedení n krát jednoho programu doba: doba T pro provedení úkonu =cv =r X je k krát propustnější než Y X má k krát větší výkonnost než Y k = P r (n X, T X ) P r (n Y, T Y ) = T Y n X T X n Y R. Lórencz (ČVUT FIT) Kvantitativní principy návrhu počítačů BI-APS, 2011, Předn. 1.-3. 7 / 30

Amdahlův zákon 1 Amdahlův zákon (AZ) = výpočet výkonového zisku, čili zrychlení S, dosaženého vylepšením nějaké části počítače nebo S = výkonnost při využití vylepšení výkonnost bez využití vylepšení = P NEW P OLD S = doba výpočtu bez využití vylepšení doba výpočtu při využití vylepšení = T OLD T NEW Zrychlení S = číslo, kolikrát je rychlejší běh úlohy na počítači s vylepšením oproti běhu stejné úlohy na původním počítači R. Lórencz (ČVUT FIT) Kvantitativní principy návrhu počítačů BI-APS, 2011, Předn. 1.-3. 8 / 30

Amdahlův zákon 2 Definujeme: F E = původní doba výpočtu zlepšené části úlohy původní celková doba výpočtu 1 nebo S E = původní doba výpočtu zlepšené části úlohy doba výpočtu zlepšené části úlohy > 1 Doba výpočtu T NEW na vylepšeném počítači se bude skládat z: (1 F E )T OLD = doba výpočtu té části úlohy, kterou nelze vylepšit F E S E T OLD = doba výpočtu vylepšené části úlohy R. Lórencz (ČVUT FIT) Kvantitativní principy návrhu počítačů BI-APS, 2011, Předn. 1.-3. 9 / 30

Amdahlův zákon 3 Doba výpočtu T NEW na vylepšeném počítači: ( T NEW = T OLD (1 F E ) + F ) E S E Pro celkové zrychlení S OVERALL odpovídající danému vylepšení: S OVERALL = T OLD T NEW = 1 (1 F E ) + F E S E R. Lórencz (ČVUT FIT) Kvantitativní principy návrhu počítačů BI-APS, 2011, Předn. 1.-3. 10 / 30

Amdahlův zákon 4 Příklad 1 Předpokládejme, že chceme vylepšit procesor serveru pro Web. Nový CPU je desetkrát rychlejší pro Web aplikace než nynější. Dále víme, že nyní je CPU zaměstnáno ze 40% výpočty a 60% času je čekání na I/O. Jaké bude celkové zrychlení po plánovaném vylepšení? Řešení: F E = 0.4, S E = 10 S OVERALL = 1 (1 0.4) + 0.4 10 = 1 0.64 = 1.56 R. Lórencz (ČVUT FIT) Kvantitativní principy návrhu počítačů BI-APS, 2011, Předn. 1.-3. 11 / 30

Amdahlův zákon 5 Příklad 2 Pro FP výpočty v počítačové grafice je hodně používaná operace odmocniny FPSQRT a výkonnost procesorů pro grafiku je na jejím efektivním provádění silně závislá. Předpokládejme, že FPSQRT odpovídá 20% a všechny FP instrukce odpovídají 50% doby výpočtu kritické zkušební úlohy pro grafiku. Úkolem je rozhodnout, zda je výhodnější: 1 10 x zrychlit provádění instrukce FPSQRT, nebo 2 1.6 x zrychlit provádění všech FP instrukcí? Řešení: 1 1 S FPSQRT = (1 0.2) + 0.2 10 1 2 S FP = (1 0.5) + 0.5 = 1.6 = 1 0.82 = 1.22 1 = 1.23 výhodnější řešení 0.8125 R. Lórencz (ČVUT FIT) Kvantitativní principy návrhu počítačů BI-APS, 2011, Předn. 1.-3. 12 / 30

CPU výkonnostní rovnice 1 Výkonnost CPU vyjádřená pomocí doby T CPU (prg) pro vykonání programu prg jednotkou CPU je P(T CPU (prg)) = 1 T CPU (prg) Všechny počítače používají hodiny s konstantními frekvencemi = cykly (ticks, clock ticks, clock periods, cycles, clock cycles). Rychlost hodin se udává: dobou trvání hodinového cyklu (clock period) - T CLK, nebo frekvencí taktů (clock rate) - f CLK f CLK = 1 T CLK R. Lórencz (ČVUT FIT) Kvantitativní principy návrhu počítačů BI-APS, 2011, Předn. 1.-3. 13 / 30

CPU výkonnostní rovnice 2 Doba CPU pro vykonání daného programu prg je CPU výkonnostní rovnice T CPU (prg) = T CLK Cyc CPU (prg) = (1/f CLK ) Cyc CPU (prg) Cyc CPU (prg) = # hodinových cyklů CPU pro provedení programu prg. Pokud známe počet instrukcí IC (instruction count) pro provedení programu prg, můžeme vypočítat CPI = průměrný počet hodinových cyklů na instrukci (clock cycles per instruction), nebo hodnotu IPC (instructions per clock cycle). CPI(prg) = 1 IPC(prg) = Cyc CPU(prg) IC(prg) R. Lórencz (ČVUT FIT) Kvantitativní principy návrhu počítačů BI-APS, 2011, Předn. 1.-3. 14 / 30

CPU výkonnostní rovnice 3 Doba CPU pro vykonání daného programu prg s proměnnými IC a CPI je CPU výkonnostní rovnice T CPU (prg)=ic(prg) CPI(prg) T CLK =IC(prg) CPI(prg) (1/f CLK ) Po převedení komponentů této rovnice do měřicích jednotek dostáváme [ instrukce program hod. cyklus instrukce sekunda ] [ ] sekunda = =T CPU (prg) hod. cyklus program Rozklad T CPU (prg) demonstruje závislost T CPU (prg) na 3 parametrech: 1 hodinový cyklus T CLK hodinová frekvence f CLK 2 CPI = # hodinových cyklů na jednu instrukci daného programu prg 3 IC = # instrukcí daného programu prg R. Lórencz (ČVUT FIT) Kvantitativní principy návrhu počítačů BI-APS, 2011, Předn. 1.-3. 15 / 30

Závislost parametrů T CPU Pokud se některý z parametrů zlepší o k %, pak se zlepší o k % i T CPU. Parametry T CLK, CPI, IC jsou provázány: IC CPI T CLK Program Překladač Architektura instrukčního souboru (ISA) Organizace CPU Technologie CPU přímý vliv není součástí systému nepřímý, zprostředkovaný vliv R. Lórencz (ČVUT FIT) Kvantitativní principy návrhu počítačů BI-APS, 2011, Předn. 1.-3. 16 / 30

Přesnější CPU výkonnostní rovnice 1 Přesnější metrika: Cyc CPU (prg) = n (ic i cpi i ) i=1 ( n ) T CPU (prg) = ic i cpi i T CLK kde i=1 ic i = # provedení instrukcí i programu prg, cpi i = průměrný # hodinových cyklů instrukce i, n = # instrukcí v architektuře instrukčního souboru (ISA - Instruction Set Architecture). R. Lórencz (ČVUT FIT) Kvantitativní principy návrhu počítačů BI-APS, 2011, Předn. 1.-3. 17 / 30

Přesnější CPU výkonnostní rovnice 2 Průměrné CPI CPI(prg) = n (ic i cpi i ) i=1 IC(prg) = n i=1 ( ) ici IC(prg) cpi i cpi i zahrnuje vliv čekacích stavů, výpadků vnitřní skryté paměti atd. cpi i lze měřit a počítat (v některých případech) Dále je uveden příklad, kde průměrná hodnota CPI je vypočítána na základě znalosti IC a hodnot: ic i = # instrukcí typu ALU, Load, Store a Branch cpi i průměrná hodnota pro instrukce typu ALU, Load, Store a Branch R. Lórencz (ČVUT FIT) Kvantitativní principy návrhu počítačů BI-APS, 2011, Předn. 1.-3. 18 / 30

Přesnější CPU výkonnostní rovnice 3 Příklad typického mixu instrukcí RISC procesoru: Otázky: Instrukce ic i /IC cpi i (ic i /IC) cpi i % čas ALU 0.5 1 0.5 23 % Load 0.2 5 1 45 % Store 0.1 3 0.3 14 % Branch 0.2 2 0.4 18 % CPI 2.2 1 Jakým způsobem se urychlí celkový výpočet, pokud vylepšením datové vnitřní skryté paměti klesne cpi Load na 2? 2 Předchozí zlepšení porovnejte s použitím vylepšení predikce skoku, které zmenší cpi Branch na 1? 3 Co se stane, když budou 2 ALU instrukce vykonávány najednou? R. Lórencz (ČVUT FIT) Kvantitativní principy návrhu počítačů BI-APS, 2011, Předn. 1.-3. 19 / 30

Přesnější CPU výkonnostní rovnice 4 Příklad 3 Z měření instrukčního mixu jsme získali následující hodnoty: 25% provedených instrukcí jsou FP operace cpi FP instrukcí = 4.0 průměrná hodnota cpi ostatních operací = 1.33 FPSQRT instrukcí činí 2% provedených instrukcí cpi FPSQRT instrukce = 20 Úkolem je rozhodnout, zda je výhodnější: 1 zmenšit cpi FPSQRT na 2, nebo 2 zmenšit průměrnou hodnotu cpi všech FP instrukcí na 2.5? Řešení: f CLK a IC zůstávají stejné. Pro původní CPI platí: n ( ) ici CPI ORIGINAL = IC cpi i = (0.25 4) + (0.75 1.33) = 2.0 i=1 R. Lórencz (ČVUT FIT) Kvantitativní principy návrhu počítačů BI-APS, 2011, Předn. 1.-3. 20 / 30

Přesnější CPU výkonnostní rovnice 5 1 Pro CPI vylepšeného počítače u FPSQRT platí: CPI NEW _FPSQRT = CPI ORIGINAL 0.02 (cpi OLD_FPSQRT cpi NEW _FPSQRT ) = 2.0 0.02 (20 2) = 1.64 2 Pro CPI počítače vylepšeného u všech FP platí: CPI NEW _FP = (0.25 2.5) + (0.75 1.33) = 1.623 Zrychlení počítače vylepšeného podle 2. varianty oproti původnímu je S NEW _FP = T CPU ORIGINAL T CPU NEW _FP = 2 1.623 = 1.23 = IC CPI ORIGINAL T CLK IC CPI NEW _FP T CLK = CPI ORIGINAL CPI NEW _FP Druhá alternativa dává o něco lepší výkonnost. Poznámka: toto je stejný výsledek jako ve 2. příkladě spočítaném Amdahlovým zákonem. R. Lórencz (ČVUT FIT) Kvantitativní principy návrhu počítačů BI-APS, 2011, Předn. 1.-3. 21 / 30

Přesnější CPU výkonnostní rovnice 6 Souvislost se zadáním 2. příkladu spočítaném Amdahlovým zákonem: Instrukce ic i /IC cpi i (ic i /IC) cpi i %čas FP 0.25 4 1 50% Ostatní 0.75 1.33 1 50% CPI 2 FPSQRT 0.02 20 0.4 20% protože 0.4 je 20% ze 2 Ve 2. příkladě spočítaném Amdahlovým zákonem je hodnota F E pro FP instrukce rovna 0.5 (50% doby výpočtu) a pro FPSQRT 0.2 (20% doby výpočtu). Hodnota S E pro FP je (původní cpi FP instrukcí) / (nové cpi FP instrukcí), a to je rovno: 4.0/2.5 = 1.6, a hodnota S E pro FPSQRT je potom analogicky rovna: 20/2=10. R. Lórencz (ČVUT FIT) Kvantitativní principy návrhu počítačů BI-APS, 2011, Předn. 1.-3. 22 / 30

Amdahlův zákon vs. CPU výkonnostní rovnice Výhody použití CPU výkonnostních rovnic pro měření výkonu jsou: měřitelný nebo simulací získaný počet instrukcí ic i měřitelné nebo simulací získané cpi i instrukcí oddělený výpočet ic i cpi i pro zvolenou instrukci, nebo skupinu instrukcí výpočet výkonnosti bez znalosti celkové doby provádění vybraných instrukcí Výhody použití Amdahlova zákona pro měření výkonu jsou: jednoduchý výpočet za předpokladu znalosti doby výpočtu vylepšené části a jejího původního podílu na celkovém výpočtu výpočet výkonnosti bez znalosti cpi i, ic i, T CLK, CPI a IC R. Lórencz (ČVUT FIT) Kvantitativní principy návrhu počítačů BI-APS, 2011, Předn. 1.-3. 23 / 30

Zkušební úlohy: benchmarks 1 Pro měření a vyhodnocení výkonností počítače jsou používané zkušební programy, které se dělí do 5 základních skupin: 1 Reálné aplikace: překladače C, Word, Photoshop atd. Zde existuje problém přenositelnosti, tj. závislosti na OS nebo překladači. 2 Upravené aplikace: reálné aplikace jsou stavebními bloky pro zkušební úlohy. Důvod modifikace je bud zlepšit přenositelnost aplikace, nebo zaměření na určitou část výkonnosti systému. 3 Jádra (kernels): malé klíčové části reálných aplikací (např. Linpack). Nezahrnují vliv pamět ového systému (vejdou se do vnitřních skrytých pamětí). Jsou pro uživatele nedostupné. 4 Toy zkušební úlohy: typické 10 100 řádkové programy (Eratostenovo síto, Quicksort, atd.). Nezahrnují vliv pamět ového systému (vejdou se do vnitřních skrytých pamětí). Uživatel dopředu pozná výstup. 5 Umělé zkušební úlohy: podobné filozofii jader. Zkouší nalézt průměrné hodnoty výskytu operací a operandů v rozsáhlých programech (např. Whetstone a Dhrystone). R. Lórencz (ČVUT FIT) Kvantitativní principy návrhu počítačů BI-APS, 2011, Předn. 1.-3. 24 / 30

Zkušební úlohy: benchmarks 2 Eliminace slabin jedné zkušební úlohy jinou vedla k vytvoření sad zkušebních úloh určených pro různé aplikační oblasti. Standardní sadou aplikačních zkušebních úloh je sada SPEC (Standard Performance Evaluation Corporation) zkušebních úloh, která se dělí na : 1 Zkušební úlohy pro osobní, stolní a nepřenosné počítače (Desktop benchmarks) CPU (SPEC89, SPEC92, SPEC92, SPEC CPU2000): celočíselné a FP zkušební úlohy, modifikované pro přenositelnost a minimalizování I/O grafické (zahrnují také CPU aktivity): SPECviewperf a SPECapc, podpora OpenGL a CAD/CAM aplikaci 2 Zkušební úlohy pro servery (Server benchmarks) pro měření výkonnosti: CPU propustně orientované zkušební úlohy zkušební úlohy SPEC CPU použité pro víceprocesorový systém R. Lórencz (ČVUT FIT) Kvantitativní principy návrhu počítačů BI-APS, 2011, Předn. 1.-3. 25 / 30

Zkušební úlohy: benchmarks 3 I/O aktivita pro databázové servery a WEB servery zkušební úlohy SPECFS (file server) zkušební úlohy SPECWeb Transakční procesy: zkušební úlohy TPC (Transaction Process Council). 3 Zkušební úlohy pro vestavěné počítačové systémy (Embedded benchmarks) nová třída zkušebních úloh, hodnotí se také spotřeba, cena atd. nejlépe standardizovanými zkušebními úlohami se jeví sada EDN Embedded Microprocessor Benchmark Consortium (EEMBC vysloveno embassy ), obsahující 5 podskupin: 1 automobilové/průmyslové 2 zákaznické 3 sít ové 4 automatizační pro kancelářskou práci 5 telekomunikační R. Lórencz (ČVUT FIT) Kvantitativní principy návrhu počítačů BI-APS, 2011, Předn. 1.-3. 26 / 30

Zkušební úlohy: benchmarks 4 Zkušební úlohy pro OS MS Windows Business Winstone aplikace sady office (Microsoft, Corel, WordPerfect) skripty simulující uživatele přepínajícího a spouštějícího množství aplikací CC Winstone práce s větším objemem dat (Photoshop, Premiere a různé audio editovací programy) skripty simulující uživatele spouštějícího skupinu smíšených aplikací Winbench skripty spouštějící testy výkonnosti CPU video systémů, disků atd. používají se jádra se zaměřením na každý podsystém R. Lórencz (ČVUT FIT) Kvantitativní principy návrhu počítačů BI-APS, 2011, Předn. 1.-3. 27 / 30

Zkušební úlohy: benchmarks 5 LINPACK [MFLOPS] FP zkušební úloha řešení SLR (Ax = b, hod(a) = 100) mnoho FP operací, ale použito jen několik typů vzhledem k tomu, že operace y i = y i + a x i jsou prováděny nejdelší dobu, může se projevit silný vliv i malé, instrukční vnitřní skryté paměti data jsou rozmístěna ve velkém prostoru vhodná jako zkušební úloha pro vektorové a paralelní superpočítače verze LINPACK: single/double rolled/unrolled R. Lórencz (ČVUT FIT) Kvantitativní principy návrhu počítačů BI-APS, 2011, Předn. 1.-3. 28 / 30

Zkušební úlohy: benchmarks 6 Starší známé zkušební úlohy (jejich použití se dnes nedoporučuje) Whetstone [Whips] FP výpočty nad velkým množstvím dat, také celočíselné výpočty, lokálních proměnných málo, většina globálních proměnných (skalární a jednorozměrná pole) výsledný kód malý a může se vejít do vnitřní skryté paměti v úloze využity transcendentní funkce, podmíněné skoky, volání procedur a indexování polí určená k měření propustnosti vědeckotechnických výpočtů, 963 tisíc instrukcí Dhrystone [Dhrystone] typická sada celočíselných výpočtů, neobsahují FP operace většina proměnných je lokální je určena pro systémové programování, není vhodná z hlediska numerických výpočtů R. Lórencz (ČVUT FIT) Kvantitativní principy návrhu počítačů BI-APS, 2011, Předn. 1.-3. 29 / 30

Měření výkonností - MIPS, MFLOPS Definice měření výkonnosti jednotkami MIPS IC MIPS = T CPU 10 6 = IC IC CPI T CLK 10 6 = f CLK CPI 10 6 =[106 instr./s] MIPS závisí na: ISA a programu, nebot CPI závisí na programu, mixu instrukcí Důsledek: výkonnost vyjádřena v jednotkách MIPS je závislá na programu, i když se tato závislost často neuvádí Měření výkonnosti MFLOPS totéž pro FP instrukce k vyjádření špičkové výkonnosti superpočítačů, reálná výkonnost může být značně nižší R. Lórencz (ČVUT FIT) Kvantitativní principy návrhu počítačů BI-APS, 2011, Předn. 1.-3. 30 / 30