1 Paralelní a distribuované architektury
|
|
- Vilém Procházka
- před 9 lety
- Počet zobrazení:
Transkript
1 1 Paralelní a distribuované architektury Flynnova klasifikace procesorů: SISD konvenční procesory SIMD vektorové procesory MISD řetězové procesory MIMD multiprocesory (komukují sdílenou pamětí) multicomputery a distribuované systémy (zasílání zpráv) Flynnova klasifikace popisuje pouze Von-Neumannovské architektury. Data-flow a reukční architektury jsou také paralelní architektury. Architektura data-flow nemá program a PC (Program Counter), provádí interpretaci grafu toku dat. Do uzlu vstupují operandy a vystupuje výsledek. V paměti udržuje struktury pro uzly, které definují operace, vstupy a výstupy, propojeno do orientovaného grafu. Paralelismus spočívá v několika operačních jednotkách, které vybírají události a pouští je grafem. Redukční počítač bere výraz a nahrazuje jeho části výsledkem dané operace (2*3 na 6). Program se převede na strom a po zadání hodnot se strom redukuje až na jeden uzel. VLIW (Very Long Instruction Word) je SISD, jedna velmi dlouhá instrukce (představuje několik menších pro různé procesory). Tyto procesory mohou pracovat paralelně, pokud je to možné (nejsou kolize, nečeká se na mezivýsledek). Jednoduchá implementace a škálovatelnost, ale některé instrukce špatné (skok využije jedinou podinstrukci, mezivýsledky apod). Pohybují se někde mezi statickými a dynamickými superskaláry. Statické superskalární procesory zpracovávají sekvenční program na více procesorech in-order, takže paralelnost je jen za souběhu správných instrukcí. Dynamické superskalární procesory zpracovávají sekvenční program na více procesorech out-of-order, např. spekulativní výpočty za skokem. MISD jsou lineárně propojené procesory, řeší proudové úlohy, sekvenční průchod. Zřetězené procesory využívájí několik paralelních postupů provádění (pipelines), protože jednotlivé části výpočetního řetězce by jednou pipeline byly nevyužity. Některé jednotky se pak mohou vyskytovat vícekrát (ALU). SIMD jsou vektorové procesory, paralelně se provádí stejná instrukce na n procesorech a n částech vstupních dat (MMX, SSE). Rozlišují se podle toho, zda každý procesor má vlastní pamět, nebo je přístupná všem a alokuje se. Jednoduchá implementace, latence a synchronizace oproti MIMD. Ne všechny problémy jsou vhodné, nevyplatí se v malém počtu. Granularita paralelismu na úrovni instrukcí, mezi instrukcemi, mezi příkazy, mezi bloky procesu, mezi procesy Synchronizace zajišt uje dodržení požadovaných časových vztahů. Řeší soupeření a kooperaci, použivá zasílání zpráv, rendezvous, semafor, monitor a bariéru. Komunikace je přenos dat mezi paralelními procesy, hlavními prostředky je zasílání zpráv a sdílená pamět. 1
2 2 Topologie Multitasking 1 CPU přepíná kontext (virtuální procesor), pamět je sdílená, předávání zpráv simulováno SW Systém se sdílenou pamětí CPU mají svou cache, zbytek na sběrnici (boj), předávání zpráv může být v HW nebo simulace SW Virtuální sdílená pamět CPU má svou pamět, ale je virtuálně spojena v simulovanou sdílenou, opět HW/SW simulované zasílání zpráv Systém s předáváním zpráv CPU vázány volně (např. počítačová sít ), sdílená pamět simulovaná SW Sdílená pamět : Všechny procesory mají přístup do celého pamět ového prostoru. Řešení současného přístupu k jedné buňce: Předávání zpráv: EREW Exclusive Read, Exclusive Write (velmi omezující) CREW Concurrent Read, Exclusive Write (časté, jednoduché) ERCW Exclusive Read, Concurrent Write (nedává smysl) CRCW Concurrent Read, Concurrent Write (složité) Každý procesor má vlastní adresový prostor. Také každý procesor má vlastní fyzickou pamět, přístup jinam komunikací. Statické propojovací sítě: Všechny uzly jsou procesory. Všechny hrany jsou komunikační kanály. Neobsahují sdílenou pamět. Průměr je nejdelší délka nejkratších cest mezi všemi dvojicemi uzlů. Konektivita je minimální počet hran, které je nutné odstranit pro rozdělení na dvě části. Šířka bisekce je minimální počet hran, které spojují dvě přibližně stejně velké části sítě. Typická statická propojení: Úplné propojení Hvězda Lineární pole D-rozměrná mřížka K-ární d-rozměrná kostka D-ární strom Dynamické propojovací sítě: Uzly jsou procesory, pamět ové moduly nebo přepínače. 2
3 Často implementují sdílenou pamět. Implementace: křížový přepínač, sběrnice,... Víceúrovňové sítě spojují p procesorů s p pamět ovými moduly pomocí p.log(p) přepínačů. 3 Distribuované a paralelní algoritmy a jejich složitost Počet procesorů p je odvozen on délky vstupu n. p(n) = {1, c, log(n), n, n.log(n), n 2,..., n r, r n }. Čas výpočtu t je také odvozen od n a je udáván v jednotkách (krocích). Cena algoritmu c(n) = p(n).t(n). Algoritmus s optimální cenou je stejně drahý jako sekvenční algoritmus (jde o cenu, ne rychlost) c opt (n) = t seq (n). Zrychlení paralelizací je dáno vztahem t seq (n)/t(n), efektivnost pak t seq (n)/c(n), nastavení je závislé na případu použití. Složitostí většinou rozumíme počet procesorů. Při výpočtu závislosti na délce vstupu je nejzajímavější nejhorší případ, takže pokud jedna část algoritmu vyžaduje p(n) procesorů a druhá p(n 2 ) procesorů, výsledná složitost je p(n 2 ). 4 Algoritmy řazení Řazení bere posloupnost prvků a podle relace > je seřadí. Zjednodušujeme na řazení pomocí operace porovnání. Také předpokládáme, že v posloupnosti nejsou žádné dva prvky rovny. Všechny posloupnosti tak lze vyjádřit (můžeme přidat index - složitost O(n)). Optimální složitost podle sekvenčního algoritmu je c(n) = O(n.log(n)). Enumeration sort: Princip: výsledná pozice prvku je dáná počtem prvků, které jsou menší Topologie: mřížka n krát n, řádky a sloupce jsou binární stromy v poli Procesory: registry A,B,RANK; do A,B zápis prvku, RANK inkrementace; možnost poslat registr synům Algoritmus: pomocí jedné řady se prvky porovnají (a přitom se mění RANK); správná pozice je RANK; nakonec se prvky přesunou stromem Složitost: t(n) = O(log(n)) nejrychlejší paralelní řešení; c(n) = O(n 2.log(n)) není optimální Odd-even transposition sort Princip: paralelní bubble-sort, porovnávají se jen sousedé a mohou se přehodit Topologie: lineární pole n procesorů Procesory: obsahují jediný registr s hodnotou prvku Algoritmus: na počátku se pole naplní posloupností; v lichém kroku pracují liché procesory, v sudém sudé; porovná se s následníkem a případně prohodí hodnoty; algoritmus končí po n krocích (lze urychlit testem na prohození) 3
4 Složitost: t(n) = O(n) nejrychlejší řešení pro lineární topologii; c(n) = O(n 2 ) není ideální Odd-even merge sort Princip: sít složená ze speciálních procesorů Topologie: procesory propojeny tak, aby složením jednotlivých porovnání byla seřazená posloupnost Procesory: 2 vstupy a 2 výstupy, porovná vstupy a dá na výstupy high a low Algoritmus: spočívá v zapojení sítě, kaskáda 1 1, 2 2, 4 4,... Složitost: t(n) = O(log 2 (n)); c(n) = O(n.log 4 (n)) není optimální Merge-splitting sort Princip: varianta odd-even sortu, každý procesor řadí krátkou posloupnost Topologie: lineární pole procesorů p(n) < n Procesory: obsahuje m prvků, které umí seřadit optimálním sekvenčním algoritmem Algoritmus: místo porovnání sousedů se provede spojení posloupností (O(n)) a pak rozdělení na půl Složitost: c(n) = O(n.log(n)) + O(n.p), optimální pro p log(n) Pipeline merge sort Princip: rozděleno na několik kroků, první spojuje posloupnosti délky 1, pak 2, atd. Topologie: linární pole procesorů p(n) = log(n) + 1 Procesory: umí spojovat dvě seřazené posloupnosti O(n) Algoritmus: ze vstupní posloupnosti se vezme první prvek a dá jej do jedné posloupnosti, druhý do druhé; další vybere vždy největší prvek a první dva dává do první posloupnosti, druhé dva do druhé; třetí krok také bere největší, ale střídá posloupnosti po čtyřech, atd. Složitost: t(n) = O(n); c(n) = O(n).O(log(n) + 1) = O(n.log(n)) optimální Enumeration sort podruhé Princip: porovnání se všemi prvky a počet menších určuje pořadí Topologie: lineární pole n procesorů a sběrnice, která muže přenést jednu hodnotu Procesory: registr C (počet menších), X (prvek na dané pozici), Y (prvek posloupnosti, který se porovnává) a Z (výsledná pozice) Algoritmus: C se nastaví na 1; sběrnicí se pošle hodnota X a lineárně přes procesory Y prvnímu prvku; Y se posunou doprava a v dalším prvku se pošle X druhému a Y zase lineárně prvnímu; neprázdné registry se porovnají a případně inkrementuje C; po vyčerpání vstupu se X pošle do Z procesoru, který je určen C a to sběrnicí (protože Y se stále posouvá doprava) Složitost: t(n) = n; c(n) = O(n 2 ) není optimální Minimum extraction sort Princip: stromem odebírá vždy nejmenší prvek Topologie: strom s n listy, log(n) + 1 úrovněmi a 2n 1 procesory 4
5 Procesory: listový procesor obsahuje prvek posloupnosti, nelistové prvky umí porovnat syny Algoritmus: naplní se listy; v každém kroku otec vybere menší hodnotu; jakmile je v kořenu hodnota je to první prvek seřazené posloupnosti Složitost: t(n) = O(n); c(n) = O(n 2 ) není optimální Bucket sort Princip: stromem spojené procesory, které řadí menší posloupnosti a pak spojení Topologie: strom s m listy, kde n = 2 m Procesory: listové procesory řadí krátkou posloupnost, ostatní spojují syny O(n) Algoritmus: Složitost: t(n) = O(n); c(n) = O(n.log(n)) optimální Median finding and splitting Princip: dělí posloupnost mediánem až na dvojice, které porovná Topologie: strom s m listy, kde n = 2 m Procesory: listové procesory porovnají dvojici, ostatní vyberou medián a rozdělí posloupnost O(n) Algoritmus: je jasný, pro výběr mediánu je potřeba optimální, např. select Složitost: t(n) = O(n); c(n) = O(n.log(n)) optimální 5 Algoritmy vyhledávání Vyhledávání zjišt uje přítomnost zadaného prvku v posloupnosti a případně i jeho pozici. Optimální složitost podle sekvenčního algoritmu je O(n) pro neseřazenou posloupnost sekvenční vyhledávání; O(log(n)) pro seřazenou posloupnost binární vyhledávání. N-ary search Seřazeno: ano Princip: paralelní analogie k binárnímu hledání, zjišt uje se část, ve které prvek je Topologie: lineární pole m procesorů, kde m < n; CREW (hledaný prvek) Procesory: porovnávají prvek na svém místě s hledaným, registr, který říká, na které straně pokračovat Algoritmus: v každé iteraci se nastaví registry, v úseku, kde na obou stranách je hodnota odlišná se hledá v další iteraci Složitost: t(n) = O(log m+1 (n + 1)); c(n) = O(m.log m+1 (n + 1)) není optimální Unsorted search Seřazeno: ne Princip: paralelně volaný sekvenční algoritmus Topologie: lineární pole m procesorů, kde m < n Procesory: sekvenčně hledají prvek X s přidělenou posloupností 5
6 Algoritmus: procesory načtou prvek do registru a provedou hledání, mohou nastavit flag nalezení Složitost: EREW c(n) = O(m.log(m) + n); CREW c(n) = O(n) (pokud zapisuje pouze jediný procesor) Tree search Seřazeno: ne Princip: listy porovnají a výsledek se propaguje stromem Topologie: strom s 2n 1 procesory Procesory: listy umějí porovnat, otec logický OR vysledků synů Algoritmus: kořen načte hledaný prvek a stromem propaguje; listy obsahují prvky posloupnosti a porovnají; otec udělá OR Složitost: t(n) = O(log(n)); c(n) = O(n.log(n)) není optimální 6 Maticové algoritmy Složitost u maticových algoritmů nebývá založena na počtu prvků, ale na počtu řádků/sloupců n, také většinou uvažujeme čtvercové matice n n. Transpozice matic má sekvenční složitost O(n 2 ). Mesh transpose Princip: prvky se posílají maticí na svá nová místa vždy v obou směrech Topologie: mřížka n krát n procesorů Procesory: 3 registry, A obsahuje výsledný prvek, B prvek od pravého/horního souseda, C od levého/dolního Algoritmus: vždy nejkrajnější prvky pošlou svou hodnotu sousedovi tak, aby dorazil na své místo (vždy pouze horizontálně a pak vertikálně Složitost: t(n) = O(n); c(n) = O(n 3 ) není optimální EREW transpose Princip: prvky se prohodí přímo mezi sebou paralelně Topologie: (n 2 n)/2 procesorů (jeden na dva prvky a bez diagonály) Procesory: nejsou to ani procesory, pouze přehodí prvky Algoritmus: v jednom kroku se najednou paralelně přehodí potřebné prvky Složitost: t(n) = 1 nejrychlejší; c(n) = O(n 2 ) optimální Násobení matic A(m, n) a B(n, k) dává matici C(m, k), kde C ij = n a il.b lj. Složitost podle sekvenčního algoritmu je O(n 3 ), ale optimální není znám, pohybuje se někde mezi O(n 2 ) a O(n 3 ). Obecné řešení paralelizuje pouze výslednou matici, ale výpočet sumy ponechává sekvenční. Mesh multiplication l=1 6
7 Topologie: mřížka n krát k procesorů Procesory: udržují průběžnou hodnotu výsledného prvku, na konci výsledek Algoritmus: prvky matic se přivádějí do prvního řádku resp. prvního sloupce a posléze se posílájí mezi procesory dále Složitost: t(n) = O(n); c(n) = O(n 3 ) není optimální Násobení matice vektorem je specializovaný případ násobení matic k = 1. Linear array multiplication je specializovaný případ mesh multiplication (vektor přichází shora, matice zboku, jeden sloupec procesorů). t(n) = O(n); c(n) = O(n 2 ) optimální Tree MV multiplication Topologie: binární strom 2n 1 procesorů Procesory: listové násobí, nelistové sčítají Algoritmus: v listech je vektor, matice se přivádí po řádcích; výsledky násobení řádku se sčítají otcem až do kořene Složitost: t(n) = O(n); c(n) = O(n 2 ) optimální 7 Model PRAM PRAM (Parallel Random Access Machine) je synchronní model paralelního výpočtu pomocí procesorů se sdílenou pamětí a společným programem. Alternativa k paralelnímu Turingovu stroji. Procesor: Aditivní a logické operace Multiplikativní operace Podmíněné skoky Přístup ke svému unikátnímu číslu (index) Pamět : Náhodný přístup pro všechny procesory Reprezentovaná neomezeným počtem registrů Neomezená délka slova (dnes není vyžadováno) Módy přístupu EREW, CREW a CRCW Výpočet probíhá synchronně po krocích čtení, lokální operace, zápis. Řešení CRCW konfliktů: 1. COMMON všechny hodnoty musejí být stejné, jinak se nezapíše 2. ARBITRARY zapíše se libovolná z hodnot 3. PRIORITY procesory mají přidělenu prioritu Broadcast je algoritmus pro EREW PRAM pro distribuci hodnoty na jednom místě v paměti do všech procesorů. Šíření je logaritmické jeden procesor přečte, předá dalšímu, pak jsou dva, každý jednomu, atd. t(n) = O(log(n)) 7
8 8 Suma prefixů Suma prefixů (all-prefix-sums, allsums, scan) je základním kamenem paralelních algoritmů. Je to operace, jejíž vstupem je uspořádaná posloupnost a binární asociativní operace. Výsledkem je posloupnost a 0, (a 0 a 1 ), (a 0 a 1 a 2 ),.... Použití: vyhodnocování polynomů, rychlé sčítání v HW, lexikální analýza a porovnávání, řazení, hledání regulárních výrazů, odstranění označených prvků apod. Sekvenční řešení prochází všechny prvky a nese si mezivýsledek, složitost O(n). Varianty: Scan je normální suma prefixů. Prescan je rozšířena o neutrální prvek na počátku výsledku a bez posledního prvku. Reduce je pouze hodnota posledního prvku scan. Segmentovaný scan je doplněn o pole příznaků, který určuje hranici segmentu, každý segment je scanován zvlášt. Paralelní reduce je možno spočítat pomocí stromu procesorů, výsledek je v kořeni. t(n) = O(log(n)); c(n) = O(n.log(n)) není optimální, lze vylepšit tak, že se paralelně počítá reduce menších posloupností Algoritmy scan není nutné přímo uvádět, jelikož se jedná o prescan s použitím reduce. Prescan se skládá ze dvou částí upsweep a downsweep. Složitost je stejná jako u reduce. Upsweep je totožný s reduce, ale mezivýsledky se nezahazují. Downsweep: 1. Kořenu se přiřadí neutrální prvek. 2. Kořen přiřadí pravému synovi svou hodnotu hodnotu levého syna. 3. Kořen přiřadí levému synovi svou hodnotu. 4. Opakuje se pro další úrovně. Packing problem bere vstupní pole, kde pouze některé hodnoty jsou důležité a tyto shrne na počátek pole. 1. Potřebné položky se označí flagem. 2. Spočte se +-scan flagů. 3. Každý prvek s hodnotou vyšší než levý soused se přesune na pozici danou touto hodnotou. Problém viditelnosti je dána výšková mapa (matice) a na ní pozorovací bod X. Je potřeba zjistit, které body jsou viditelné z bodu X. 1. Bod je viditelný, pokud žádný bod mezi ním a pozorovatelem nemá větší vertikální úhel. 2. Vytvoří se vektor výšek bodů na cestě paprsku. 3. Vektor výšek se přepočítá na vektor úhlů. 4. Pomocí max-prescan se spočte vektor maximálních úhlů. 8
9 5. Určí se úhel studovaného bodu a porovná s maximem. Binární sčítačka Carry Lookahead Parallel Binary Adder. U normální sčítačky paralelizaci vadí závislost na carry ze sčítání nižších bitů. Je potřeba carry předpočítat. 1. Vypočte se vektor s oborem hodnot Propagate, Stop, Generate podle tabulky. 2. Vypočte se scan nad vektorem opět pomocí tabulky. 3. Hodnota Generate říká, že na vyšším bitu bude potřeba uplatnit carry. 4. Carry je tak vypočteno logaritmicky, pak je možné sečíst v konstantním čase. Radix sort je založen na dvojkovém radix sort, tedy prvky s bitem 0 se přemístí na počátek. To se provede pro všechny řády. Operace split je operace přesunutí prvků na počátek, implementována jako scan a prescan, složitost jako scan. Quicksort používá segmentovaný scan, segmenty jsou 3 menší, rovné, větší než pivot. Pivot se nepočítá, většinou se bere náhodný/první prvek. 1. Kontroluje se, zda již není seřazeno (test mezi sousedy a AND-reduce výsledků). 2. Vybere se pivot každého segmentu, opět scan. Na počátku segment jeden. 3. V každém segmentu porovnej prvky s pivotem a rozděl. 4. Modifikovaný split pro přeřazení do segmentu. 5. Rekurzivně na segmenty quicksort. 6. Složitost t(n) = O(n/m.log(n) + log(m).log(n)); c(n) = O(n.log(m) + m.log(n).log(m)) optimální pro malé m. 9 Seznamy Lineární seznam je modelován jako pole (možno přistoupit indexem) prvků v paměti, které obsahují hodnotu a index následníka. Poslední prvek ukazuje sám na sebe. Predecessor computing počítá index předchůdce v konstantním čase (Pred[Succ[i]] = i). List ranking přiřazuje prvkům jejich vzdálenost od konce. Sekvenční složitost je O(n). V paralelním prostředí se používá technika path doubling. Path doubling: 1. Paralelně se všem prvkům přiřadí RANK (0 pro poslední prvek, jinak 1). 2. Každý procesor prvku v log(n) krocích se počítá RANK jako RANK[i] + RANK[Succ[i]] a posune ukazatel Succ[i] = Succ[Succ[i]]. 9
10 3. t(n) = O(log(n)); c(n) = O(n.log(n)) není optimální Suma suffixů je obdoba sumy prefixů, ale na seznamech (kde pevný bod je konec). Počítá se stejně jako list ranking, ale použije se zadaná operace. Vylepšení list rankingu (a sumy suffixů) spočívá ve snížení ceny, některé procesory totiž provádějí zbytečnou práci (počítají již spočítané věci nebo cyklí na konci). Řešením je odpojovat procesory a tím snížit cenu. Nejprve každý procesor dostane vzdálenost 1, pak pracuje každý druhý a zvýší ji na 2 pak každý čtvrtý a opět zvýší. V rekonstrukční fázi se pouze přičítají mezivýsledky. Problém v paralelismu jak se určí každý druhý? Random mating náhodně si vybere pohlaví, female následovaný male se odpojí Optimal list ranking každý procesor má zásobník prvků, simulace random mating List coloring je obarvení seznamu tak, aby sousedé neměli stejnou barvu. k-obarvení může použít k různých barev. 2log(n) coloring využívá index procesoru k určení barvy. Hodnota k je index nejnižšího bitu ID, ve kterém se sousedé liší, pak je barva C = 2k + ID[k]. k-ruling set (množina oddělovačů) je podmnožina seznamu taková, že žádné vybrané vrcholy nesousedí a je mezi nimi maximálně k nevybraných prvků. 2k-ruling set from k-coloring vybere prvek tehdy, když jeho barva má menší index než předchůdce a následníka. 10 Stromy Stromy jsou prezentovány podobně jako seznamy, ale vazba není na následníka (i+1), nýbrž na syny (2i a 2i+1). Eulerova cesta je obecný případ průchodu stromem (linearizace). Převádí strom na orientovaný graf (nahradí hranu dvěma opačnými) Eulerova kružnice. Eulerova kružnice je reprezentována funkcí etour(e), která hraně přiřadí následující hranu v kružnici. Funkce je uložena jako seznam sousednosti. Kořen stromu vznikne tak, že se v jednom bodě (kořeni) Eulerova kružnice přeruší. Pozice uzlu je vypočtena jako 2n 2 Rank(e), kde Rank je výsledek list rankingu O(log(n)). Využívá se pro zjištění rodiče. Tree contraction je operace použitá při výpočtu výrazů ve stromě. Eulerova cesta není použitelná. Každý list obsahuje operand a nelist operátor. Tree contraction strom postupně zmenšuje až do jediného uzlu, tedy výsledku. RAKE operation odstraní daný uzel a otce, na jehož místo dosadí sourozence s jeho podstromem. Využívá se pro tree contraction. Paralelní RAKE nesmí být aplikován na sousedící uzly (konflikt), snaha co nejvíce RAKE najednou. 1. Označíme listy zleva doprava. 10
11 2. Krajní se vyřadí (zůstanou poslední). 3. Nejprve se volá RAKE na liché a pak na sudé listy. 4. Redukce stromu za t(n) = O(log(n)). 11 Interakce mezi procesy Interakce mezi procesy můžeme rozdělit na kooperaci (je potřeba synchronizace) a soupeření (je potřeba výlučný přístup). Problém: jelikož procesy běží paralelně (popř. pseudoparalelně), není jasné pořadí vykonávání instrukcí obou programů. Zde odkazuji na podklady předmětu POS, tomuto tématu se tam věnuje několik kapittol, stačí si odmyslet části spojené s OS. Operátor <await B->S> je původně pouze teoretický operátor, implementovaný ve vyšších programovacích jazycích pro paralelní programování. Jeho implementace je problémová. Zajišt uje atomičnost <>, očekává splnění podmínky B a poté atomicky vykoná sekvenci příkazů S. Critical Region ve vyšších jazycích jsou obalení použití semaforů pro přístup ke KS, klíčové slovo region a označení proměnných shared. Problém, pokud se zanořují, pak může dojít ke konfliktu. Jednoduchá implementace (téměř makro). Conditional Critical Region rozšiřuje koncepci o podmínku, pokud je stanovena dobře, ke kolizi nedojde. Implementace je ovšem velmi složitá. Základní algoritmy (chybné) by chtít neměli, pokročilé (bez chyby) se učit nebudu. 12 Předávání zpráv Zasílání zpráv je založeno na dvou operacích send() a receive(). Zprávy se posílají tzv. kanálem. Asynchronní kanál neblokuje odesílání, data bufferuje v sobě, těžko se implementuje (buffer je problém). Synchronní kanál blokuje (hned nebo pokud je naplněn buffer), buffer může být, ale je omezen, většinou bez bufferu, jde simulovat asynchronním kanálem (použití ACK). OCCAM je programovací jazyk založený na CSP (Communicating Sequential Processes). Základem je proces, operace přiřazení :=, vstup? a výstup!. Sekvenční příkazy v oddílu SEQ. Paralelně prováděné příkazy v oddílu PAR. Podmínka na základě vstupního kanálu ALT. ADA je imperativní objektový jazyk s validačními prostředky. Má silné prostředky pro zasílání zpráv. Konstrukce accept očekává příchod zprávy daného jména a parametrů, pak zpracuje úkol a odešle výsledek. 11
12 Konstrukce select očekává více typů zpráv a pak vybere ošetřující kód. Linda je paralelní programovací jazyk založený na C. Je založena na asynchroním zasílání zpráv přes globální prostor zpráv (global space). Tuple Space (nástěnka) globální prostor zpráv (sdílená pamět ). Tuple n-tice obsahující pole s daty (zpráva). Actual field pole zprávy, které je vyhodnoceno před odesláním Formal field pole zprávy, které je předáno jako proměnná Vkládání na TS provádějí out a eval. Přijímání pak in a rd. out generuje data (passive tuple), data vyhodnocena sekvenčně eval generuje procesy (active tuple), které vypočítají data paralelně in přijme a odebere z TS, blokující rd pouze přečte z TS, blokující Požadavky na čtení zpráv jsou ve tvaru šablon (("x",?y,?z)). 13 Jazyky pro paralelní zpracování Situace: obrovské sítě počítačů propojené rychlým spojením, je možné používat distribuované výpočty, potřeba jazyka a protokolu, nejpoužívanější jsou PVM a MPI PVM (Parallel Virtual Machine) Vytvořen jednou skupinou. Distribuovaný operační systém. Přenosný mezi HW. Heterogenní (různé možnosti reprezentace dat). Velká odolnost proti chybám. Dynamický (přidat, odebrat proces, vyrovnání zátěže, chyby). MPI (Message Passing Interface) Vytvořen fórem firem. Knihovna poskytující funkce. Přenosný mezi HW a SW (je to knihovna). Heterogenní (zabalení různých dat do daných typů). Zaměřen na vysoký výkon. Přesně definované chování. Statický (vyšší výkon). Není odolnost proti chybám (neurčitý výsledek). Implementace PVM 12
13 Démon, bežící na stanicích. Démoni spolu komunikují. Spojení démonů tvoří virtální paralelní stroj. Démon má pod sebou procesy, kterým je nadřazen. První démon je označen jako master. Master se stará o nastavení, přidávání, hlídání. Implementace MPI Na každém počítači běží procesy (jeden na CPU). Procesy mají identifikaci. Procesy znají ID ostatních procesů. Procesy komunikují mezi sebou přímo. Proces neumí fork() (MPIv1) Message Passing v MPI Kooperativní explicitní send() a recv(). Jednostranné (MPIv2) zápis do paměti cíle/čtení zdroje Put() a Get(). Procesy se sdružují do skupin a zprávy do kontextu. Komunikátor určuje kontext a skupinu (např. MPI_COMM_WORLD). Kolektivní operace bcast() a reduce(). Neblokující operace Isend() a Irecv(), pak Iwait(). MPI_Barrier() pro synchronizaci. 13
OPS Paralelní systémy, seznam pojmů, klasifikace
Moorův zákon (polovina 60. let) : Výpočetní výkon a počet tranzistorů na jeden CPU chip integrovaného obvodu mikroprocesoru se každý jeden až dva roky zdvojnásobí; cena se zmenší na polovinu. Paralelismus
Princip funkce počítače
Princip funkce počítače Princip funkce počítače prvotní úlohou počítačů bylo zrychlit provádění matematických výpočtů první počítače kopírovaly obvyklý postup manuálního provádění výpočtů pokyny pro zpracování
PARALELNÍ PROCESY A PROGRAMOVÁNÍ
PARALELNÍ PROCESY A PROGRAMOVÁNÍ 8 Paralelní výpočetní modely Ing. Michal Bližňák, Ph.D. Zlín 2013 Tento studijní materiál vznikl za finanční podpory Evropského sociálního fondu (ESF) a rozpočtu české
Přehled paralelních architektur. Dělení paralelních architektur Flynnova taxonomie Komunikační modely paralelních architektur
Přehled paralelních architektur Přehled paralelních architektur Dělení paralelních architektur Flynnova taxonomie Komunikační modely paralelních architektur Přehled I. paralelní počítače se konstruují
Adresní vyhledávání (přímý přístup, zřetězené a otevřené rozptylování, rozptylovací funkce)
13. Metody vyhledávání. Adresní vyhledávání (přímý přístup, zřetězené a otevřené rozptylování, rozptylovací funkce). Asociativní vyhledávání (sekvenční, binárním půlením, interpolační, binární vyhledávací
1. Převeďte dané číslo do dvojkové, osmičkové a šestnáctkové soustavy: a) 759 10 b) 2578 10
Úlohy- 2.cvičení 1. Převeďte dané číslo do dvojkové, osmičkové a šestnáctkové soustavy: a) 759 10 b) 2578 10 2. Převeďte dané desetinné číslo do dvojkové soustavy (DEC -> BIN): a) 0,8125 10 b) 0,35 10
NPRG030 Programování I, 2018/19 1 / :03:07
NPRG030 Programování I, 2018/19 1 / 20 3. 12. 2018 09:03:07 Vnitřní třídění Zadání: Uspořádejte pole délky N podle hodnot prvků Měřítko efektivity: * počet porovnání * počet přesunů NPRG030 Programování
Základy informatiky. 2. Přednáška HW. Lenka Carr Motyčková. February 22, 2011 Základy informatiky 2
Základy informatiky 2. Přednáška HW Lenka Carr Motyčková February 22, 2011 Základy informatiky 1 February 22, 2011 Základy informatiky 2 February 22, 2011 Základy informatiky 3 February 22, 2011 Základy
Profilová část maturitní zkoušky 2013/2014
Střední průmyslová škola, Přerov, Havlíčkova 2 751 52 Přerov Profilová část maturitní zkoušky 2013/2014 TEMATICKÉ OKRUHY A HODNOTÍCÍ KRITÉRIA Studijní obor: 78-42-M/01 Technické lyceum Předmět: TECHNIKA
Základní komunikační operace
Základní komunikační operace Úvod Operace send a recieve Blokující a neblokující posílání zpráv Blokující posílání zpráv Neblokující posílání zpráv One-to-all broadcast/all-to-one reduction All-to-all
Profilová část maturitní zkoušky 2017/2018
Střední průmyslová škola, Přerov, Havlíčkova 2 751 52 Přerov Profilová část maturitní zkoušky 2017/2018 TEMATICKÉ OKRUHY A HODNOTÍCÍ KRITÉRIA Studijní obor: 78-42-M/01 Technické lyceum Předmět: TECHNIKA
Stromy, haldy, prioritní fronty
Stromy, haldy, prioritní fronty prof. Ing. Pavel Tvrdík CSc. Katedra počítačů FEL České vysoké učení technické DSA, ZS 2008/9, Přednáška 6 http://service.felk.cvut.cz/courses/x36dsa/ prof. Pavel Tvrdík
Operační systémy. Jednoduché stránkování. Virtuální paměť. Příklad: jednoduché stránkování. Virtuální paměť se stránkování. Memory Management Unit
Jednoduché stránkování Operační systémy Přednáška 8: Správa paměti II Hlavní paměť rozdělená na malé úseky stejné velikosti (např. 4kB) nazývané rámce (frames). Program rozdělen na malé úseky stejné velikosti
Pohled do nitra mikroprocesoru Josef Horálek
Pohled do nitra mikroprocesoru Josef Horálek Z čeho vycházíme = Vycházíme z Von Neumannovy architektury = Celý počítač se tak skládá z pěti koncepčních bloků: = Operační paměť = Programový řadič = Aritmeticko-logická
Paralelní programování
Paralelní programování přednáška 5 Michal Krupka 15. března 2011 Michal Krupka (KI UP) Paralelní programování 15. března 2011 1 / 13 Ještě ke kritickým sekcím Použití v praxi obvykle pomocí zámků (locks)
Dynamické programování
Dynamické programování prof. Ing. Pavel Tvrdík CSc. Katedra počítačových systémů Fakulta informačních technologií České vysoké učení technické v Praze c Pavel Tvrdík, 2010 Efektivní algoritmy (BI-EFA)
Reprezentace aritmetického výrazu - binární strom reprezentující aritmetický výraz
Reprezentace aritmetického výrazu - binární strom reprezentující aritmetický výraz (2 + 5) * (13-4) * + - 2 5 13 4 - listy stromu obsahují operandy (čísla) - vnitřní uzly obsahují operátory (znaménka)
PARALELNÍ PROCESY A PROGRAMOVÁNÍ
PARALELNÍ PROCESY A PROGRAMOVÁNÍ 12 Paralelní algoritmy - paralelní prefixové součty Ing Michal Bližňák, PhD Zlín 2013 Tento studijní materiál vznikl za finanční podpory Evropského sociálního fondu (ESF)
Úvod do teorie grafů
Úvod do teorie grafů Neorientovaný graf G = (V,E,I) V množina uzlů (vrcholů) - vertices E množina hran - edges I incidence incidence je zobrazení, buď: funkce: I: E V x V relace: I E V V incidence přiřadí
Systém adresace paměti
Systém adresace paměti Základní pojmy Adresa fyzická - adresa, která je přenesena na adresní sběrnici a fyzicky adresuje hlavní paměť logická - adresa, kterou má k dispozici proces k adresaci přiděleného
Vyvažování a rotace v BVS, všude se předpokládá AVL strom
Vyvažování a rotace v BVS, všude se předpokládá AVL strom 1. Jednoduchá levá rotace v uzlu u má operační složitost a) závislou na výšce levého podstromu uzlu u b) mezi O(1) a Θ(n) c) závislou na hloubce
Paralelní systémy. SIMD jeden tok instrukcí + více toků dat jedním programem je zpracováváno více různých souborů dat
Paralelní systémy Paralelním systémem rozumíme takový systém, který paralelně zpracovává více samostatných úloh nebo zpracování určité úlohy automaticky rozdělí do menších částí a paralelně je zpracovává.
Definice 7.2. Nejmenší přirozené číslo k, pro které je graf G k-obarvitelný, se nazývá chromatické číslo (barevnost) grafu G a značí se χ(g).
7 Barevnost grafu Definice 71 Graf G se nazývá k-obarvitelný, jestliže každému jeho uzlu lze přiřadit jednu z barev 1 k tak, že žádné dva sousední uzly nemají stejnou barvu Definice 72 Nejmenší přirozené
Náplň. v.0.03 16.02.2014. - Jednoduché příklady na práci s poli v C - Vlastnosti třídění - Způsoby (algoritmy) třídění
Náplň v.0.03 16.02.2014 - Jednoduché příklady na práci s poli v C - Vlastnosti třídění - Způsoby (algoritmy) třídění Spojení dvou samostatně setříděných polí void Spoj(double apole1[], int adelka1, double
II. Úlohy na vložené cykly a podprogramy
II. Úlohy na vložené cykly a podprogramy Společné zadání pro příklady 1. - 10. začíná jednou ze dvou možností popisu vstupních dat. Je dána posloupnost (neboli řada) N reálných (resp. celočíselných) hodnot.
Návrh Designu: Radek Mařík
1. 7. Najděte nejdelší rostoucí podposloupnost dané posloupnosti. Použijte metodu dynamického programování, napište tabulku průběžných délek částečných výsledků a tabulku předchůdců. a) 5 8 11 13 9 4 1
Procesy a vlákna (Processes and Threads)
ÚVOD DO OPERAČNÍCH SYSTÉMŮ Ver.1.00 Procesy a vlákna (Processes and Threads) Správa procesů a vláken České vysoké učení technické Fakulta elektrotechnická 2012 Použitá literatura [1] Stallings, W.: Operating
Operace ALU. INP 2008 FIT VUT v Brně
Operace ALU INP 2008 FIT VUT v Brně 1 Princip ALU (FX) Požadavky: Logické operace Sčítání (v doplňkovém kódu) Posuvy/rotace Násobení ělení B A not AN OR XOR + Y 1) Implementace logických operací je zřejmá
4. Úvod do paralelismu, metody paralelizace
4. Úvod do paralelismu, metody paralelizace algoritmů Ing. Michal Bližňák, Ph.D. Ústav informatiky a umělé inteligence Fakulta aplikované informatiky UTB Zĺın Paralelní procesy a programování, Zĺın, 26.
Zpráva o průběhu přijímacího řízení na vysokých školách dle Vyhlášky MŠMT č. 343/2002 a její změně 276/2004 Sb.
Zpráva o průběhu přijímacího řízení na vysokých školách dle Vyhlášky MŠMT č. 343/2002 a její změně 276/2004 Sb. 1. Informace o přijímacích zkouškách Studijní program: Informatika navazující magisterský
Přidělování paměti II Mgr. Josef Horálek
Přidělování paměti II Mgr. Josef Horálek Techniky přidělování paměti = Přidělování jediné souvislé oblasti paměti = Přidělování paměti po sekcích = Dynamické přemisťování sekcí = Stránkování = Stránkování
Dynamické datové struktury III.
Dynamické datové struktury III. Halda. Tomáš Bayer bayertom@natur.cuni.cz Katedra aplikované geoinformatiky a kartografie, Přírodovědecká fakulta UK. Tomáš Bayer bayertom@natur.cuni.cz (Katedra aplikované
A4B33ALG 2010/05 ALG 07. Selection sort (Select sort) Insertion sort (Insert sort) Bubble sort deprecated. Quicksort.
A4B33ALG 2010/05 ALG 07 Selection sort (Select sort) Insertion sort (Insert sort) Bubble sort deprecated Quicksort Stabilita řazení 1 Selection sort Neseřazeno Seřazeno Start T O U B J R M A K D Z E min
Maturitní otázky z předmětu PROGRAMOVÁNÍ
Wichterlovo gymnázium, Ostrava-Poruba, příspěvková organizace Maturitní otázky z předmětu PROGRAMOVÁNÍ 1. Algoritmus a jeho vlastnosti algoritmus a jeho vlastnosti, formy zápisu algoritmu ověřování správnosti
Da D to t v o é v ty t py IB111: Datové typy
Datové typy IB111: Datové typy Data a algoritmizace jaká data potřebuji pro vyřešení problému? jak budu data reprezentovat? jaké operaci s nimi potřebuji provádět? Navržení práce s daty je velice důležité
Katedra informatiky a výpočetní techniky. 10. prosince Ing. Tomáš Zahradnický doc. Ing. Róbert Lórencz, CSc.
Katedra informatiky a výpočetní techniky České vysoké učení technické, fakulta elektrotechnická Ing. Tomáš Zahradnický doc. Ing. Róbert Lórencz, CSc. 10. prosince 2007 Pamět ové banky S výhodou používáme
IB109 Návrh a implementace paralelních systémů. Kolektivní komunikační primitava. RNDr. Jiří Barnat, Ph.D.
IB109 Návrh a implementace paralelních systémů Kolektivní komunikační primitava RNDr. Jiří Barnat, Ph.D. Kvantitativní parametry komunikace B109 Návrh a implementace paralelních systémů: Kolektivní komunikační
Maturitní témata. IKT, školní rok 2017/18. 1 Struktura osobního počítače. 2 Operační systém. 3 Uživatelský software.
Maturitní témata IKT, školní rok 2017/18 1 Struktura osobního počítače Von Neumannova architektura: zakreslete, vysvětlete její smysl a popište, jakým způsobem se od ní běžné počítače odchylují. Osobní
STROMOVE ALGORITMY Prohledavani do sirky (level-order) Po vodorovnejch carach fronta
STROMOVE ALGORITMY Prohledavani do sirky (level-order) Po vodorovnejch carach vlož do fronty kořen opakuj, dokud není fronta prázdná 1. vyber uzel z fronty a zpracuj jej 2. vlož do fronty levého následníka
Rekurzivní algoritmy
Rekurzivní algoritmy prof. Ing. Pavel Tvrdík CSc. Katedra počítačových systémů Fakulta informačních technologií České vysoké učení technické v Praze c Pavel Tvrdík, 2010 Efektivní algoritmy (BI-EFA) ZS
Přednáška. Správa paměti II. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012
Přednáška Správa paměti II. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012 Příprava studijního programu Informatika je podporována projektem financovaným z Evropského
Pole a kolekce. v C#, Javě a C++
Pole a kolekce v C#, Javě a C++ C# Deklarace pole typ_prvku_pole[] jmeno_pole; Vytvoření pole jmeno_pole = new typ_prvku_pole[pocet_prvku_pole]; Inicializace pole double[] poled = 4.8, 8.2, 7.3, 8.0; Java
IB111 Úvod do programování skrze Python
Vyhledávání, řazení, složitost IB111 Úvod do programování skrze Python 2012 Otrávené studny 8 studen, jedna z nich je otrávená laboratorní rozbor dokáže rozpoznat přítomnost jedu ve vodě je drahý (je časově
Obsah prezentace. Základní pojmy v teorii o grafech Úlohy a prohledávání grafů Hledání nejkratších cest
Obsah prezentace Základní pojmy v teorii o grafech Úlohy a prohledávání grafů Hledání nejkratších cest 1 Základní pojmy Vrchol grafu: {množina V} Je to styčná vazba v grafu, nazývá se též uzlem, prvkem
Algoritmizace řazení Bubble Sort
Algoritmizace řazení Bubble Sort Cílem této kapitoly je seznámit studenta s třídícím algoritmem Bubble Sort, popíšeme zde tuto metodu a porovnáme s jinými algoritmy. Klíčové pojmy: Třídění, Bubble Sort,
Přerušovací systém s prioritním řetězem
Přerušovací systém s prioritním řetězem Doplňující text pro přednášky z POT Úvod Přerušovací systém mikropočítače může být koncipován několika způsoby. Jednou z možností je přerušovací systém s prioritním
Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague
Tomáš Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague Zjednodušené schéma systému z základ hardware pro mainframe tvoří: operační pamět - MAIN / REAL STORAGE jeden
Algoritmizace prostorových úloh
INOVACE BAKALÁŘSKÝCH A MAGISTERSKÝCH STUDIJNÍCH OBORŮ NA HORNICKO-GEOLOGICKÉ FAKULTĚ VYSOKÉ ŠKOLY BÁŇSKÉ - TECHNICKÉ UNIVERZITY OSTRAVA Algoritmizace prostorových úloh Grafové úlohy Daniela Szturcová Tento
Paralení programování pro vícejádrové stroje s použitím OpenMP. B4B36PDV Paralelní a distribuované výpočty
Paralení programování pro vícejádrové stroje s použitím OpenMP B4B36PDV Paralelní a distribuované výpočty Minulé cvičení: Vlákna a jejich synchronizace v C++ 11... 1 Minulé cvičení: Vlákna a jejich synchronizace
09. Memory management. ZOS 2006, L.Pešička
09. Memory management ZOS 2006, L.Pešička Správa paměti paměťová pyramida absolutní adresa relativní adresa počet bytů od absolutní adresy fyzický prostor adres fyzicky k dispozici výpočetnímu systému
Paralelní programování
Paralelní programování přednášky Jan Outrata únor duben 2011 Jan Outrata (KI UP) Paralelní programování únor duben 2011 1 / 11 Literatura Ben-Ari M.: Principles of concurrent and distributed programming.
Test prvočíselnosti. Úkol: otestovat dané číslo N, zda je prvočíslem
Test prvočíselnosti Úkol: otestovat dané číslo N, zda je prvočíslem 1. zkusit všechny dělitele od 2 do N-1 časová složitost O(N) cca N testů 2. stačí zkoušet všechny dělitele od 2 do N/2 (větší dělitel
MATURITNÍ OTÁZKY ELEKTROTECHNIKA - POČÍTAČOVÉ SYSTÉMY 2003/2004 TECHNICKÉ VYBAVENÍ POČÍTAČŮ
MATURITNÍ OTÁZKY ELEKTROTECHNIKA - POČÍTAČOVÉ SYSTÉMY 2003/2004 TECHNICKÉ VYBAVENÍ POČÍTAČŮ 1) INFORMACE VE VÝPOČETNÍ TECHNICE 3 2) POČÍTAČOVÉ ARCHITEKTURY, POČÍTAČ JAKO ČÍSLICOVÝ STROJ 3 3) SIGNÁLY 3
Prohledávání do šířky = algoritmus vlny
Prohledávání do šířky = algoritmus vlny - souběžně zkoušet všechny možné varianty pokračování výpočtu, dokud nenajdeme řešení úlohy průchod stromem všech možných cest výpočtu do šířky, po vrstvách (v každé
přirozený algoritmus seřadí prvky 1,3,2,8,9,7 a prvky 4,5,6 nechává Metody řazení se dělí:
Metody řazení ve vnitřní a vnější paměti. Algoritmy řazení výběrem, vkládáním a zaměňováním. Heapsort, Shell-sort, Radix-sort, Quicksort. Řazení sekvenčních souborů. Řazení souborů s přímým přístupem.
B3B33ALP - Algoritmy a programování - Zkouška z předmětu B3B33ALP. Marek Boháč bohacm11
333LP - lgoritmy a programování - Zkouška z předmětu 333LP Jméno Příjmení Už. jméno Marek oháč bohacm11 Zkouškový test Otázka 1 Jaká je hodnota proměnné count po vykonání následujícího kódu: data=[4,4,5,5,6,6,6,7,7,7,7,8,8]
2) Napište algoritmus pro vložení položky na konec dvousměrného seznamu. 3) Napište algoritmus pro vyhledání položky v binárním stromu.
Informatika 10. 9. 2013 Jméno a příjmení Rodné číslo 1) Napište algoritmus pro rychlé třídění (quicksort). 2) Napište algoritmus pro vložení položky na konec dvousměrného seznamu. 3) Napište algoritmus
Obecné výpočty na GPU v jazyce CUDA. Jiří Filipovič
Obecné výpočty na GPU v jazyce CUDA Jiří Filipovič Obsah přednášky motivace architektura GPU CUDA programovací model jaké algoritmy urychlovat na GPU? optimalizace Motivace Moorův zákon stále platí pro
B3B33ALP - Algoritmy a programování - Zkouška z předmětu B3B33ALP. Marek Boháč bohacm11
Jméno Příjmení Už. jméno Marek oháč bohacm11 Zkouškový test Otázka 1 Jaká je hodnota proměnné count po vykonání následujícího kódu: data=[4,4,5,5,6,6,6,7,7,7,7,8,8] count=0 for i in range(1,len(data)):
3. úloha - problém batohu metodami branch & bound, dynamické programování, heuristika s testem
ČVUT FEL X36PAA - Problémy a algoritmy 3. úloha - problém batohu metodami branch & bound, dynamické programování, heuristika s testem Jméno: Marek Handl Datum: 1. 1. 2009 Cvičení: Pondělí 9:00 Zadání Naprogramujte
Zdůvodněte, proč funkce n lg(n) roste alespoň stejně rychle nebo rychleji než než funkce lg(n!). Symbolem lg značíme logaritmus o základu 2.
1 3 4 5 6 7 8 9 10 11 1 13 14 15 16 17 18 19 0 1 3 4 5 6 7 8 9 30 31 3 Zdůvodněte, proč funkce f(n) = n log(n) 1 n 1/ roste rychleji než funkce g(n) = n. Zdůvodněte, proč funkce f(n) = n 3/ log(n) roste
Operační systémy. Přednáška 1: Úvod
Operační systémy Přednáška 1: Úvod 1 Organizace předmětu Přednášky každé úterý 18:00-19:30 v K1 Přednášející Jan Trdlička email: trdlicka@fel.cvut.z kancelář: K324 Cvičení pondělí, úterý, středa Informace
Grafy. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 13.
Grafy doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava Prezentace ke dni 13. března 2017 Jiří Dvorský (VŠB TUO) Grafy 104 / 309 Osnova přednášky Grafy
Algoritmizace a programování
Algoritmizace a programování Výrazy Operátory Výrazy Verze pro akademický rok 2012/2013 1 Operace, operátory Unární jeden operand, operátor se zapisuje ve většině případů před operand, v některých případech
Architektura počítačů Logické obvody
Architektura počítačů Logické obvody http://d3s.mff.cuni.cz/teaching/computer_architecture/ Lubomír Bulej bulej@d3s.mff.cuni.cz CHARLES UNIVERSITY IN PRAGUE faculty of mathematics and physics Digitální
Způsoby realizace této funkce:
KOMBINAČNÍ LOGICKÉ OBVODY U těchto obvodů je výstup určen jen výhradně kombinací vstupních veličin. Hodnoty výstupních veličin nezávisejí na předcházejícím stavu logického obvodu, což znamená, že kombinační
Charakteristika dalších verzí procesorů v PC
Charakteristika dalších verzí procesorů v PC 1 Cíl přednášky Poukázat na principy tvorby architektur nových verzí personálních počítačů. Prezentovat aktuální pojmy. 2 Úvod Zvyšování výkonu cestou paralelizace
Kapitola 10: Diskové a souborové struktury. Klasifikace fyzických médií. Fyzická média
- 10.1 - Kapitola 10: Diskové a souborové struktury Přehled fyzických ukládacích médií Magnetické disky RAID (Redundant Array of Inexpensive Disks) Terciární úložiště Přístup k médiu Souborové organizace
Hardware - komponenty počítačů Von Neumannova koncepce počítače. Von Neumannova koncepce počítače
V roce 1945 vystoupil na přednášce v USA matematik John von Neumann a představil architekturu samočinného univerzálního počítače (von Neumannova koncepce/schéma/architektura). Základy této koncepce se
Semestrální práce z předmětu Speciální číslicové systémy X31SCS
Semestrální práce z předmětu Speciální číslicové systémy X31SCS Katedra obvodů DSP16411 ZPRACOVAL: Roman Holubec Školní rok: 2006/2007 Úvod DSP16411 patří do rodiny DSP16411 rozšiřuje DSP16410 o vyšší
Datové struktury 2: Rozptylovací tabulky
Datové struktury 2: Rozptylovací tabulky prof. Ing. Pavel Tvrdík CSc. Katedra počítačových systémů Fakulta informačních technologií České vysoké učení technické v Praze c Pavel Tvrdík, 2010 Efektivní algoritmy
Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague
Assembler pro Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague Zápis instrukcí umíme už zapisovat instrukce v binárním tvaru to je silně nešikovné pro snazší vývoj
Paralelní a distribuované výpočty (B4B36PDV)
Paralelní a distribuované výpočty (B4B36PDV) Branislav Bošanský, Michal Jakob bosansky@fel.cvut.cz Artificial Intelligence Center Department of Computer Science Faculty of Electrical Engineering Czech
Metody síťové analýzy
Metody síťové analýzy Řeší problematiku složitých systémů, zejména pak vazby mezi jejich jednotlivými prvky. Vychází z teorie grafů. Základní metody síťové analýzy: CPM (Critical Path Method) deterministický
Dynamické programování
ALG 11 Dynamické programování Úloha batohu neomezená Úloha batohu /1 Úloha batohu / Knapsack problem Máme N předmětů, každý s váhou Vi a cenou Ci (i = 1, 2,..., N) a batoh s kapacitou váhy K. Máme naložit
Přednáška 1. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012
Přednáška 1 Úvod do HW a OS. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012 Příprava studijního programu Informatika je podporována projektem financovaným z Evropského
Internet a zdroje. (ARP, routing) Mgr. Petr Jakubec. Katedra fyzikální chemie Univerzita Palackého v Olomouci Tř. 17. listopadu
Internet a zdroje (ARP, routing) Mgr. Petr Jakubec Katedra fyzikální chemie Univerzita Palackého v Olomouci Tř. 17. listopadu 12 26. 11. 2010 (KFC-INTZ) ARP, routing 26. 11. 2010 1 / 10 1 ARP Address Resolution
Datové typy a struktury
atové typy a struktury Jednoduché datové typy oolean = logická hodnota (true / false) K uložení stačí 1 bit často celé slovo (1 byte) haracter = znak Pro 8-bitový SII kód stačí 1 byte (256 možností) Pro
Ústav technické matematiky FS ( Ústav technické matematiky FS ) / 35
Úvod do paralelního programování 2 MPI Jakub Šístek Ústav technické matematiky FS 9.1.2007 ( Ústav technické matematiky FS ) 9.1.2007 1 / 35 Osnova 1 Opakování 2 Představení Message Passing Interface (MPI)
Strojový kód k d a asembler procesoru MIPS SPIM. MIPS - prostředí NMS NMS. 32 ks 32bitových registrů ( adresa registru = 5 bitů).
Strojový kód k d a asembler procesoru MIPS Použit ití simulátoru SPIM K.D. - cvičení ÚPA 1 MIPS - prostředí 32 ks 32bitových registrů ( adresa registru = 5 bitů). Registr $0 je zero čte se jako 0x0, zápis
Paralelní algoritmy --- Parallel Algorithms
Paralelní algoritmy --- Parallel Algorithms Přemysl Šůcha suchap@fel.cvut.cz Motivace Nepopíratelnost trendu směřování k paralelním systémům i více-jádrový telefon je dnes samozřejmostí energetická efektivita
Základní datové struktury III: Stromy, haldy
Základní datové struktury III: Stromy, haldy prof. Ing. Pavel Tvrdík CSc. Katedra počítačových systémů Fakulta informačních technologií České vysoké učení technické v Praze c Pavel Tvrdík, 2010 Efektivní
Úvod do programovacích jazyků (Java)
Úvod do programovacích jazyků (Java) Michal Krátký Katedra informatiky VŠB Technická univerzita Ostrava Úvod do programovacích jazyků (Java), 2007/2008 c 2006 2008 Michal Krátký Úvod do programovacích
Náhled testu. Přijímací zkouška magisterského studia. konečný automat bez zbytečných stavů, který přijímá jazyk popsaný tímto výrazem, má:
1 z 6 14.11.2017 0:03 Přijímací zkouška magisterského studia Moodle Test MSP Testy VzorTest-2 Pokus 1 Jste přihlášeni jako Josef Kolář (Odhlásit se) Náhled testu 1 Je dán regulární výraz. Minimální deterministický
Časová a prostorová složitost algoritmů
.. Časová a prostorová složitost algoritmů Programovací techniky doc. Ing. Jiří Rybička, Dr. ústav informatiky PEF MENDELU v Brně rybicka@mendelu.cz Hodnocení algoritmů Programovací techniky Časová a prostorová
Paralelní grafové algoritmy
Paralelní grafové algoritmy Značení Minimální kostra grafu Nejkratší cesta z jednoho uzlu Nejkratší cesta mezi všemi dvojicemi uzlů Použité značení Definition Bud G = (V, E) graf. Pro libovolný uzel u
Strojový kód. Instrukce počítače
Strojový kód Strojový kód (Machine code) je program vyjádřený v počítači jako posloupnost instrukcí procesoru (posloupnost bajtů, resp. bitů). Z hlediska uživatele je strojový kód nesrozumitelný, z hlediska
Architektura procesorů PC shrnutí pojmů
Architektura procesorů PC shrnutí pojmů 1 Co je to superskalární architektura? Minimálně dvě fronty instrukcí. Provádění instrukcí je možné iniciovat současně, instrukce se pak provádějí paralelně. Realizovatelné
Profilová část maturitní zkoušky 2014/2015
Střední průmyslová škola, Přerov, Havlíčkova 2 751 52 Přerov Profilová část maturitní zkoušky 2014/2015 TEMATICKÉ OKRUHY A HODNOTÍCÍ KRITÉRIA Studijní obor: 26-41-M/01 Elektrotechnika Zaměření: technika
Počítač jako prostředek řízení. Struktura a organizace počítače
Řídicí počítače - pro řízení technologických procesů. Specielní přídavná zařízení - I/O, přerušovací systém, reálný čas, Č/A a A/Č převodníky a j. s obsluhou - operátorské periferie bez obsluhy - operátorský
Náhled testu. Přijímací zkouška magisterského studia. konečný automat bez zbytečných stavů, který přijímá jazyk popsaný tímto výrazem, má:
Přijímací zkouška magisterského studia Moodle Test MSP Testy VzorTest-2 Pokus 1 Jste přihlášeni jako Josef Kolář (Odhlásit se) Info Výsledky Náhled Upravit Náhled testu 1 Je dán regulární výraz. Minimální
Vyhledávání. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 21.
Vyhledávání doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava Prezentace ke dni 21. září 2018 Jiří Dvorský (VŠB TUO) Vyhledávání 242 / 433 Osnova přednášky
Principy počítačů I Netradiční stroje
Principy počítačů I Netradiční stroje snímek 1 Principy počítačů Část X Netradiční stroje VJJ 1 snímek 2 Netradiční procesory architektury a organizace počítačů, které se vymykají struktuře popsané Johnem
Binární soubory (datové, typované)
Binární soubory (datové, typované) - na rozdíl od textových souborů data uložena binárně (ve vnitřním tvaru jako v proměnných programu) není čitelné pro člověka - všechny záznamy téhož typu (může být i
Mezipaměti počítače. L2 cache. L3 cache
Mezipaměti počítače Cache paměť - mezipaměť Hlavní paměť procesoru je typu DRAM a je pomalá. Proto se mezi pomalou hlavní paměť a procesor vkládá menší, ale rychlá vyrovnávací (cache) paměť SRAM. Rychlost
CHARAKTERISTIKA MODERNÍCH PENTIÍ. Flynnova klasifikace paralelních systémů
Úvod: CHARAKTERISTIKA MODERNÍCH PENTIÍ Flynnova klasifikace paralelních systémů Paralelní systémy lze třídit z hlediska počtu toků instrukcí a počtu toků dat: SI systém s jedním tokem instrukcí (Single
Přednáška. Vstup/Výstup. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012
Přednáška Vstup/Výstup. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012 Příprava studijního programu Informatika je podporována projektem financovaným z Evropského
Algoritmizace prostorových úloh
INOVACE BAKALÁŘSKÝCH A MAGISTERSKÝCH STUDIJNÍCH OBORŮ NA HORNICKO-GEOLOGICKÉ FAKULTĚ VYSOKÉ ŠKOLY BÁŇSKÉ - TECHNICKÉ UNIVERZITY OSTRAVA Algoritmizace prostorových úloh Datové struktury Daniela Szturcová
Jan Březina. 7. března 2017
TGH03 - stromy, ukládání grafů Jan Březina Technical University of Liberec 7. března 2017 Kružnice - C n V = {1, 2,..., n} E = {{1, 2}, {2, 3},..., {i, i + 1},..., {n 1, n}, {n, 1}} Cesta - P n V = {1,
Architektura počítačů Logické obvody
Architektura počítačů Logické obvody http://d3s.mff.cuni.cz/teaching/computer_architecture/ Lubomír Bulej bulej@d3s.mff.cuni.cz CHARLES UNIVERSITY IN PRAGUE faculty of mathematics and physics 2/36 Digitální