Spark Jan Hučín 15. listopadu 2017
|
|
- Pavla Štěpánková
- před 6 lety
- Počet zobrazení:
Transkript
1 Spark Jan Hučín 15. listopadu 2017
2 Osnova 1. Co to je a k čemu slouží 2. Jak se to naučit 3. Jak se s tím pracuje 4. Jak to funguje Logický a technický pohled Transformace, akce, kešování Příklady Architektura a alokace zdrojů Příště: Spark SQL Spark streaming 2
3 Co je Spark
4 Co je to Spark a k čemu slouží framework pro distribuované výpočty vylepšení původního map-reduce, o 2 řády rychlejší zpracování v paměti méně I/O operací, vhodné pro iterativní algoritmy nebo analýzu dat optimalizace operací před zpracováním nyní i pseudo-sql příkazy API pro Scalu, Javu, Python a R s Hadoopem (využívá HDFS, YARN) i samostatně napsán ve Scale, běží na JVM nejaktivnější opensource Big Data projekt 4
5 Spark vs. map-reduce 5
6 Vhodné úlohy dostatečně velké, ale ne extrémně dobře paralelizovatelné iterační obtížné pro stávající technologie Např. 1. výpočty charakteristik klientů (riskové skóre, zůstatky) 2. ETL pro odlehčení DWH 3. noční výpočet celodenní využití 4. hledání vazeb v síti 5. text-mining 6
7 Nevhodné úlohy příliš malé s extrémními požadavky na paměť šité na míru jiné technologii (SQL, Java) špatně paralelizovatelné real-time Např. 1. modelování na malých datech 2. výpočet mediánu, náhodné přeskoky mezi řádky souboru 3. JOIN několika opravdu velkých tabulek 7
8 Jak se to naučit aspoň základy Python Scala Java R vlastní praxe rady zkušených, StackOverflow apod. 8
9 Jak se s tím pracuje interaktivně z příkazové řádky (shell pro Python i Scalu) Zeppelin/Jupyter notebook dávka / aplikace zkompilovaný.jar soubor skript Pythonu 9
10 Jak funguje Spark
11 Pohled high level (logický) RDD výstup transformace akce série transformací zakončená akcí transformace se plánují a optimalizují, ale zatím neprovádějí lazy evaluation: až první akce spustí celý proces Co je to RDD? resilient distributed dataset kolekce prvků (např. řádky v textovém souboru, datová matice, posloupnost binárních dat) musí být dělitelné na části místo rozdělení (spolu)určí Spark! 11
12 Pohled mid level (technický) vytvoření JVM na nodech (exekutory) rozdělení úlohy na joby a jobů na tasky distribuce tasků a případně dat na nody řízení procesu více v architektuře Sparku 12
13 Spark RDD transformace RDD1 RDD2, po prvcích ( řádcích ) map (prvek transformační funkce nový prvek) flatmap (prvek transformační funkce 0 až N nových prvků) filter, distinct (pustí se jen řádky vyhovující podmínce / unikátní) join (připojí řádky jiného RDD podle hodnot klíče) union, intersection (sjednocení a průnik s jiným RDD) groupbykey, reducebykey (setřídí / agreguje prvky podle klíče)... a mnoho dalších Kde vzít klíč? výsledek transformace, např. slovo (slovo, 1) první prvek tuple se bere jako klíč "tuple" (má Scala i Python) 13
14 map a flatmap 14
15 Příklad 1 word count Úkol: spočítat četnosti slov v dokumentu Vstup: textový soubor rozdělený do řádků (RDD) Postup: transformace řádků: řádek rozdělení na slova prvky typu (slovo, 1) seskupení prvků se stejným klíčem a sečtení jedniček Výsledek transformace: RDD s prvky (slovo, četnost) 15
16 Vsuvka interaktivní shell pyspark (Python) spark-shell (Scala) spouští se z příkazové řádky funguje lokálně nebo v YARNu: pyspark --master local pyspark --master yarn vytvoří důležité objekty, např. sc (SparkContext), sqlcontext má další parametry o nich později ukončuje se exit() 16
17 Příklad 1 word count Úkol: spočítat četnosti slov v dokumentu Vstup: textový soubor rozdělený do řádků (RDD) lines = sc.textfile("/user/pascepet/bible.txt") Postup: transformace řádků: řádek jednotlivá slova (více prvků) words = lines.flatmap(lambda line: line.split(" ")) transformace řádků: řádek čili slovo struktura (slovo, 1) pairs = words.map(lambda word: (word, 1)) seskupení prvků se stejným klíčem a sečtení jedniček counts = pairs.reducebykey(lambda a, b: a + b) to be or not to be to be or not to be (to, 1) (be, 1) (or, 1) (not, 1) (to, 1) (be, 1) (to, 2) (be, 2) (or, 1) (not, 1) 17
18 Proč se nic nespočítalo? Protože jsme zatím neprovedli žádnou akci. 18
19 Spark RDD akce reduce (pomocí zadané funkce agreguje všechny prvky RDD) take (vypíše prvních n prvků RDD) count (počet prvků) collect (vypíše RDD jako pole prvků) saveastextfile (uloží jako textový soubor, resp. více txt souborů)... a další Akce spustí celý řetězec od začátku! Všechny mezivýsledky se zapomenou. Pokud to nechceme, musíme některé RDD uložit do keše. 19
20 Kešování Kešování: RDD se nezapomene, ale uchová v paměti / na disku. Metody pro kešování: cache (pokusí se uchovat v paměti) persist (obecnější, např. serializace, využití disku atd.) unpersist (uvolnění RDD z paměti) Typy kešování: MEMORY_ONLY MEMORY_AND_DISK MEMORY_ONLY_SER MEMORY_AND_DISK_SER SER = serializace úspora paměti, ale vyšší výpočetní náročnost Volby se SER pouze Java a Scala, v Pythonu serializace vždy Kešování není akce! 20
21 Spark program jako graf 21
22 Příklad 2 podobnost obrázků Úkol: spočítat podobnosti mezi dvojicemi obrázků Vstup: čb soubory BMP (4 4, 256 barev) prvky RDD Postup: parsing: binární BMP posloupnost 16 čísel 0/1 vytvoření dvojic obrázků výpočet podobnosti dvojic obrázků Výsledek transformace: RDD s prvky (soubor1, soubor2, podobnost) Akce na konci např. uložení do textového souboru 22
23 Příklad 2 podobnost obrázků Úkol: spočítat podobnosti mezi dvojicemi obrázků Vstup: čb soubory BMP (4 4, 256 barev) prvky RDD files = sc.binaryfiles("/user/pascepet/pismena/*.bmp") Postup: parsing: binární BMP posloupnost 16 čísel 0/1 filesparsed = files.map(parsebmp) vytvoření dvojic obrázků filespairs = filesparsed.cartesian(filesparsed) \.filter(lambda f: f[0][0]<f[1][0]) výpočet podobnosti dvojic obrázků simil = filespairs.map(similpair) (N, ) (J, ) (L, ) (N, ) (J, ) (L, ) (N, ), (J, ) (N, ), (L, ) (J, ), (L, ) (N, J, 0.5) (N, L, 0.6) (J, L, 0.3) 23
24 Příklad 2 parsing (N, ) (J, ) (L, ) (N, ) (J, ) (L, ) def parsebmp(file): name = file[0] bytes = file[1] byteslast = bytes[-16:] bits = [] for z in byteslast: if z=='\x00': bits.append(1) elif z=='\xff': bits.append(0) else: pass return (name, bits) 24
25 Příklad 2 podobnost ((N, ), (J, )) def similpair(pair): file1 = pair[0] file2 = pair[1] return (file1[0],file2[0], similarity(file1[1],file2[1]) ) def similarity(bits, pattern=[0]*16): sum = 0 for i in range(0, len(bits)): sum += (bits[i]==pattern[i]) return sum*1.0/len(bits) (N, J, 0.5) 25
26 Další operace Spark RDD
27 27
28 28
29 Architektura Sparku
30 Důležité pojmy 1 Application master proces zodpovědný za vyjednání výpočetních zdrojů od res. manageru Driver hlavní proces plánuje workflow distribuuje práci do exekutorů Executor proces běžící na některém z nodů (ideálně na každém) provádí tasky (může i několik paralelně) 30
31 Důležité pojmy 2 Job akce volaná uvnitř programu driveru Stage sada transformací, které mohou být vykonány bez shuffle Task jednotka práce, kterou provádí exekutor na nějakém kousku dat 31
32 Plánování a optimalizace 32
33 Plánování a optimalizace přetypování posloupnost transformací (např. přehození FILTER a JOIN) volba typu JOINu, využití clusterování, partitions, skew apod. atd. 33
34 Plánování a optimalizace rozdělení a distribuce dat překlad transformací a akcí do příkazů pro JVM atd. 34
35 Ukázka DAG graf popisující průběh výpočtu určení závislostí (X musí být uděláno před Y) optimalizace v rámci dodržení závislostí 35
36 Rozdělení dat partitions partition část dat zpracovaná v jednom tasku defaultně 1 partition = 1 HDFS block = 1 task = 1 core partition se zpracuje na nodu, kde je uložená více partitions víc tasků vyšší paralelizace menší velikost jedné partition nižší efektivita vyšší overhead... a naopak Lze ovlivnit? A jak? při vstupu: např. sc.textfile(soubor, počet_part) za běhu: coalesce, repartition, partitionby shuffle! 36
37 Spuštění a konfigurace
38 Spuštění Sparku pyspark spark-shell spark-submit --param value Kde a jak poběží na clusteru plné využití paralelismu mod client mod cluster lokálně paralelní běh na více jádrech určeno parametry --master a --deploy-mode 38
39 Spark on YARN client mode 39
40 Spark on YARN cluster mode 40
41 Mod client versus mod cluster default je client mod client je vhodný pro interaktivní práci a debugging (výstup jde na lokální konzolu) mod cluster je vhodný pro produkční účely 41
42 Konfigurace běhu Sparku požadavky na zdroje --name jméno aplikace --driver-memory paměť pro driver --num-executors počet exekutorů --executor-cores počet jader pro exekutor --executor-memory paměť pro exekutor Příklad pyspark --master yarn --deploy-mode client --driver-memory 1G --num-executors 3 --executor-cores 2 --executor-memory 3G 42
43 Příklad plánu alokace zdrojů Obecná doporučení: --num-cores <= 5 --executor-memory <= 64 GB Cluster 6 nodů, každý 16 jader a 64 GB RAM Rezervovat 1 jádro a 1GB /node pro OS zbývá 6 *15 jader a 63 GB 1 jádro pro Spark Driver: 6 * 15 1 = 89 jader. 89 / 5 ~ 17 exekutorů. Každý node (kromě toho s driverem) bude mít 3 exekutory. 63 GB / 3 ~ 21 GB paměti na exekutor. Navíc se musí počítat s memory overhead -> nastavit 19 GB na exekutor 43
44 Díky za pozornost Profinit, s.r.o. Tychonova 2, Praha 6 Telefon Web LinkedIn linkedin.com/company/profinit Twitter twitter.com/profinit_eu
Spark Jan Hučín 5. dubna 2017
Spark Jan Hučín 5. dubna 2017 Osnova 1. Co to je a k čemu slouží 2. Jak se to naučit 3. Jak se s tím pracuje 4. Jak to funguje Logický a technický pohled Transformace, akce, kešování Příklady Nadstavby
Spark SQL, Spark Streaming. Jan Hučín
Spark SQL, Spark Streaming Jan Hučín 21. listopadu 2018 Osnova 1. Spark SQL 2. Další rozšíření Sparku Spark streaming GraphX Spark ML 2 Spark SQL Spark SQL a DataFrames (DataSets) Rozšíření k tradičnímu
Spark SQL, Spark Streaming. Jan Hučín
Spark SQL, Spark Streaming Jan Hučín 22. listopadu 2017 Osnova 1. Spark SQL 2. Další rozšíření Sparku Spark streaming GraphX Spark ML 2 Spark SQL Spark SQL a DataFrames (DataSets) Rozšíření k tradičnímu
B0M33BDT Technologie pro velká data. Supercvičení SQL, Python, Linux
B0M33BDT Technologie pro velká data Supercvičení SQL, Python, Linux Sergej Stamenov, Jan Hučín 18. 10. 2017 Osnova cvičení Linux SQL Python 2 SQL pro uživatele aneb co potřebuje znát a umět bigdatový uživatel:
BigData. Marek Sušický
BigData Marek Sušický 28. Únoru 2017 Osnova Big data a Hadoop Na jakém hardware + sizing Jak vypadá cluster - architektura HDFS Distribuce Komponenty YARN, správa zdrojů 2 Big data neznamená Hadoop 3 Apache
A4M33BDT Technologie pro velká data
A4M33BDT Technologie pro velká data Milan Kratochvíl 22. března 2017 MapReduce 3 MapReduce Paradigma/framework/programovací model pro distribuované paralelní výpočty Princip: MAP vstupní data ve formátu
B0M33BDT 7. přednáška Architektury a bezpečnost. Marek Sušický Milan Kratochvíl
B0M33BDT 7. přednáška Architektury a bezpečnost Marek Sušický Milan Kratochvíl 5. prosinec 2018 Osnova Něco ze života Architektury Hadoop Lambda Kappa Zetta Security a dopady do architektury 2 Jak vypadá
Hadoop a HDFS. Bc. Milan Nikl
3.12.2013 Hadoop a HDFS Bc. Milan Nikl Co je Hadoop: Open-Source Framework Vyvíjený Apache Software Foundation Pro ukládání a zpracovávání velkých objemů dat Big Data trojrozměrný růst dat (3V) Objem (Volume)
Hadoop, Hive a Spark: Využití pro data mining. Václav Zeman, KIZI VŠE
Hadoop, Hive a Spark: Využití pro data mining Václav Zeman, KIZI VŠE VŠE: Katedra informačního a znalostního inženýrství Hlavní činnosti: Data Mining a Machine Learning Nástroje: LispMiner a EasyMiner
B0M33BDT Stream processing. Milan Kratochvíl
B0M33BDT Stream processing Milan Kratochvíl 13. prosinec 2017 Stream processing Průběžné zpracování trvalého toku zpráv Vstupní stream Message processor Stream processor Úložiště Stream processing Hlavní
BIG DATA je oveľa viac ako Hadoop. Martin Pavlík
BIG DATA je oveľa viac ako Hadoop Martin Pavlík Analýza všech dostupných dat? Big data =? = Buzzword? = Hadoop? Hadoop Jen ke zpracování nestrukturovaných dat? Mentální posun něco za něco 2 Big data =
Programování: základní konstrukce, příklady, aplikace. IB111 Programování a algoritmizace
Programování: základní konstrukce, příklady, aplikace IB111 Programování a algoritmizace 2011 Připomenutí z minule, ze cvičení proměnné, výrazy, operace řízení výpočtu: if, for, while funkce příklady:
Da D to t v o é v ty t py IB111: Datové typy
Datové typy IB111: Datové typy Data a algoritmizace jaká data potřebuji pro vyřešení problému? jak budu data reprezentovat? jaké operaci s nimi potřebuji provádět? Navržení práce s daty je velice důležité
Matematika v programovacích
Matematika v programovacích jazycích Pavla Kabelíková am.vsb.cz/kabelikova pavla.kabelikova@vsb.cz Úvodní diskuze Otázky: Jaké programovací jazyky znáte? S jakými programovacími jazyky jste již pracovali?
B0M33BDT Technologie pro velká data. Storage
B0M33BDT Technologie pro velká data Storage Milan Kratochvíl 24.10.2018 Motivace Jak efektivně ukládat data v Hadoop ekosystému? formát ukládání dat a jejich komprese možnost paralelně zpracovávat na mnoha
UAI/612 - Cloudová Řešení. Technologie
UAI/612 - Cloudová Řešení Technologie Rekapitulace Multitenance Bezestavovost Škálovatelnost Cachování Bezpečnost Způsoby nasazení Datová úložiště SQL databáze NoSQL databáze Cloudová datová úložiště (API)
SPJA, cvičení 1. ipython, python, skripty. základy syntaxe: základní datové typy, řetězce. podmínky: if-elif-else, vyhodnocení logických výrazů
SPJA, cvičení 1 ipython, python, skripty základy syntaxe: základní datové typy, řetězce podmínky: if-elif-else, vyhodnocení logických výrazů cykly: for, while kolekce: seznam, n-tice, slovník funkce, list
Paralelní architektury se sdílenou pamětí typu NUMA. NUMA architektury
Paralelní architektury se sdílenou pamětí typu NUMA NUMA architektury Multiprocesorové systémy s distribuovanou pamětí I. úzkým hrdlem multiprocesorů se sdílenou pamětí je datová komunikace s rostoucím
Paralelní výpočty ve finančnictví
Paralelní výpočty ve finančnictví Jan Houška HUMUSOFT s.r.o. houska@humusoft.cz Výpočetně náročné úlohy distribuované úlohy mnoho relativně nezávislých úloh snížení zatížení klientské pracovní stanice
11. Přehled prog. jazyků
Jiří Vokřínek, 2016 B6B36ZAL - Přednáška 11 1 Základy algoritmizace 11. Přehled prog. jazyků doc. Ing. Jiří Vokřínek, Ph.D. Katedra počítačů Fakulta elektrotechnická České vysoké učení technické v Praze
MetaCentrum. datové služby. Miroslav Ruda, Zdeněk Šustr
MetaCentrum datové služby Miroslav Ruda, Zdeněk Šustr Agenda Národní gridová infrastruktura přehled služeb MetaCentra aktuální stav výpočetní grid cloudové prostředí MapReduce výpočty Národní gridová infrastruktura
Bi-Direction Replication
Bi-Direction Replication P2D2 2015 Petr Jelínek, 2ndQuadrant (petr@2ndquadrant.com) BDR Bi-Directional Replication Je možné zapisovat na všech serverech Asynchronní Nízká latence (zápisu) Tolerance ke
OPS Paralelní systémy, seznam pojmů, klasifikace
Moorův zákon (polovina 60. let) : Výpočetní výkon a počet tranzistorů na jeden CPU chip integrovaného obvodu mikroprocesoru se každý jeden až dva roky zdvojnásobí; cena se zmenší na polovinu. Paralelismus
Operátory ROLLUP a CUBE
Operátory ROLLUP a CUBE Dotazovací jazyky, 2009 Marek Polák Martin Chytil Osnova přednášky o Analýza dat o Agregační funkce o GROUP BY a jeho problémy o Speciální hodnotový typ ALL o Operátor CUBE o Operátor
Rekurzivní algoritmy
Rekurzivní algoritmy prof. Ing. Pavel Tvrdík CSc. Katedra počítačových systémů Fakulta informačních technologií České vysoké učení technické v Praze c Pavel Tvrdík, 2010 Efektivní algoritmy (BI-EFA) ZS
IUJCE 07/08 Přednáška č. 6
Správa paměti Motivace a úvod v C (skoro vždy) ručně statické proměnné o datový typ, počet znám v době překladu o zabírají paměť po celou dobu běhu programu problém velikosti definovaných proměnných jak
9 - Map/filter/reduce OMO. Ing. David Kadleček, PhD
9 - Map/filter/reduce OMO Ing. David Kadleček, PhD kadlecd@fel.cvut.cz, david.kadlecek@cz.ibm.com 1 Map/filter/reduce v Java Map/filter/reduce v Java = Java 1.8 streams API Funkcionální přístup (řetězíme
Aktuální stav MetaCentra, novinky
Aktuální stav MetaCentra, novinky Jan Kmuníček CESNET 1 Obsah Začlenění do evropského kontextu Aktuální projekty MetaCentra Užší spolupráce s uživateli 2 Evropský kontext Superpočítačová centra simulace
Martin Lísal. Úvod do MPI
Martin Lísal září 2003 PARALELNÍ POČÍTÁNÍ Úvod do MPI 1 1 Co je to paralelní počítání? Paralelní počítání je počítání na paralelních počítačích či jinak řečeno využití více než jednoho procesoru při výpočtu
Algoritmus pro hledání nejkratší cesty orientovaným grafem
1.1 Úvod Algoritmus pro hledání nejkratší cesty orientovaným grafem Naprogramoval jsem v Matlabu funkci, která dokáže určit nejkratší cestu v orientovaném grafu mezi libovolnými dvěma vrcholy. Nastudoval
Přednášky o výpočetní technice. Hardware teoreticky. Adam Dominec 2010
Přednášky o výpočetní technice Hardware teoreticky Adam Dominec 2010 Rozvržení Historie Procesor Paměť Základní deska přednášky o výpočetní technice Počítací stroje Mechanické počítačky se rozvíjely už
Provoz Počet zaměstnanců Průměrná nemocnost hod/osoba/rok
PŘIJÍMACÍ TEST z informatiky a matematiky pro navazující magisterské studium Fakulta informatiky a managementu Univerzity Hradec Králové Registrační číslo Hodnocení část A Hodnocení část B Hodnocení A+B
Činnost počítače po zapnutí
Projekt: Inovace oboru Mechatronik pro Zlínský kraj Registrační číslo: CZ.1.07/1.1.08/03.0009 Činnost počítače po zapnutí Paměť RWM(Read Write Memory - paměť pro čtení a zápis, označovaná také jako RAM)
Příprava dat v softwaru Statistica
Příprava dat v softwaru Statistica Software Statistica obsahuje pokročilé nástroje pro přípravu dat a tvorbu nových proměnných. Tyto funkcionality přinášejí značnou úsporu času při přípravě datového souboru,
Přednáška. Správa paměti II. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012
Přednáška Správa paměti II. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012 Příprava studijního programu Informatika je podporována projektem financovaným z Evropského
NSS - Cache 5. LECTURE MARTIN TOMASEK
NSS - Cache 5. LECTURE MARTIN TOMASEK Cache mechanismus 1. Lze využít k: 1. Optimalizaci výkonu systému 2. Snížení náročností jednotlivých operací 3. Snížení náročností na jednotlivé vrstvy 4. Mitigaci
Operační systémy. Jednoduché stránkování. Virtuální paměť. Příklad: jednoduché stránkování. Virtuální paměť se stránkování. Memory Management Unit
Jednoduché stránkování Operační systémy Přednáška 8: Správa paměti II Hlavní paměť rozdělená na malé úseky stejné velikosti (např. 4kB) nazývané rámce (frames). Program rozdělen na malé úseky stejné velikosti
Rozpoznávání písmen. Jiří Šejnoha Rudolf Kadlec (c) 2005
Rozpoznávání písmen Jiří Šejnoha Rudolf Kadlec (c) 2005 Osnova Motivace Popis problému Povaha dat Neuronová síť Architektura Výsledky Zhodnocení a závěr Popis problému Jedná se o praktický problém, kdy
SUPERPOČÍTAČE DANIEL LANGR ČVUT FIT / VZLÚ
SUPERPOČÍTAČE DANIEL LANGR ČVUT FIT / VZLÚ TITAN / HOPPER / NOTEBOOK TITAN HOPPER NOTEBOOK Počet CPU jader 299 008 153 216 2 Operační paměť [GB] 598 016 217 000 8 Počet GPU (CUDA) jader 50 233 344 0 8
Programy a algoritmy pracující s čísly. IB111 Úvod do programování skrze Python
Programy a algoritmy pracující s čísly IB111 Úvod do programování skrze Python 2013 1 / 60 Připomenutí z minule proměnné, výrazy, operace řízení výpočtu: if, for, while funkce příklady: faktoriál, binární
Zpracování obrazu v FPGA. Leoš Maršálek ATEsystem s.r.o.
Zpracování obrazu v FPGA Leoš Maršálek ATEsystem s.r.o. Základní pojmy PROCESOROVÉ ČIPY Křemíkový čip zpracovávající obecné instrukce Různé architektury, pracují s různými paměti Výkon instrukcí je závislý
Healtcheck. databáze ORCL běžící na serveru db.tomas-solar.com pro
Ukázka doporučení z health checku zaměřeného na PERFORMANCE. Neobsahuje veškeré podkladové materiály, proto i obsah píše špatné odkazy. Healtcheck databáze ORCL běžící na serveru db.tomas-solar.com pro
Operační systémy. Přednáška 2: Procesy a vlákna
Operační systémy Přednáška 2: Procesy a vlákna 1 Procesy Všechen běžící software v systému je organizován jako množina sekvenčně běžících procesů. (Sekvenční) proces Abstrakce běžícího programu. Sekvence
Přednáška 1. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012
Přednáška 1 Úvod do HW a OS. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012 Příprava studijního programu Informatika je podporována projektem financovaným z Evropského
Konečný automat. Jan Kybic.
Konečný automat Jan Kybic http://cmp.felk.cvut.cz/~kybic kybic@fel.cvut.cz 2016 2017 1 / 33 Konečný automat finite state machine Konečný automat = výpočetní model, primitivní počítač Řídící jednotka s
Programování v Pythonu
ƒeské vysoké u ení technické v Praze FIT Programování v Pythonu Ji í Znamená ek P íprava studijního programu Informatika je podporována projektem nancovaným z Evropského sociálního fondu a rozpo tu hlavního
IW3 MS SQL SERVER 2014
Instalace a konfigurace IW3 MS SQL SERVER 2014 Ing. Peter Solár, MCITP EA solar@pocitacoveskoleni.cz 1 OSNOVA 1. příprava instalace SQL serveru 2. instalace SQL serveru 3. základní konfigurace SQL serveru
Principy operačních systémů. Lekce 7: Souborový systém
Principy operačních systémů Lekce 7: Souborový systém Souborový systém Souborový systém (anglicky file system) je označení pro způsob organizace dat ve formě souborů (a většinou i adresářů) tak, aby k
Architektura rodiny operačních systémů Windows NT Mgr. Josef Horálek
Architektura rodiny operačních systémů Windows NT Mgr. Josef Horálek = Velmi malé jádro = implementuje jen vybrané základní mechanismy: = virtuální paměť; = plánování vláken; = obsluha výjimek; = zasílání
Management procesu I Mgr. Josef Horálek
Management procesu I Mgr. Josef Horálek Procesy = Starší počítače umožňovaly spouštět pouze jeden program. Tento program plně využíval OS i všechny systémové zdroje. Současné počítače umožňují běh více
VISUAL BASIC. Práce se soubory
VISUAL BASIC Práce se soubory Práce se soubory 1/2 2 Vstupní data pro programy bývají uloženy do souborů Vstupy pro výpočet, nastavení vzhledu aplikace Výsledky práce programu je potřeba uchovat uložit
Programovací jazyky. imperativní (procedurální) neimperativní (neprocedurální) assembler (jazyk symbolických instrukcí)
Programovací jazyky Programovací jazyky nižší assembler (jazyk symbolických instrukcí) vyšší imperativní (procedurální) Pascal, C/C++, Java, Basic, Python, php neimperativní (neprocedurální) Lisp, Prolog
SEARCH & BIG DATA [ & ANALYTICS] INFORUM 2015, Pavel Kocourek
SEARCH & BIG DATA [ & ANALYTICS] INFORUM 2015, Pavel Kocourek NÁSLEDUJÍCÍCH 25 MINUT Proč je letošní prezentace modro-zelená Vyhledávání a Big data Search architektura s využitím Big data Co to může přinést
Hlavní využití počítačů
Úvod Hlavní využití počítačů Počítače jsou výkonné nástroje využívané pro zpracování dat. Provádějí: načtení a binární kódování dat provedení požadovaného výpočtu zobrazení výsledku Hlavní využití počítačů
Paralelní výpočty na clusteru KMD
Paralelní výpočty na clusteru KMD Jiří Hozman jiri.hozman@tul.cz Technická univerzita v Liberci Fakulta přírodovědně-humanitní a pedagogická Katedra matematiky a didaktiky matematiky Vytvoření a rozvoj
Algoritmy a datové struktury
Algoritmy a datové struktury 1 / 34 Obsah přednášky Základní řídící struktury posloupnost příkazů podmínka cyklus s podmínkou na začátku cyklus s podmínkou na konci cyklus s pevným počtem opakování Jednoduchá
Souborové systémy a práce s daty David Antoš
Souborové systémy a práce s daty David Antoš antos@ics.muni.cz Úvod obecný úvod do síťových souborových systémů souborové systémy v MetaCentru jejich použití práce s nimi praktické poznámky kvóty efektivní
Operační systémy. Přednáška 8: Správa paměti II
Operační systémy Přednáška 8: Správa paměti II 1 Jednoduché stránkování Hlavní paměť rozdělená na malé úseky stejné velikosti (např. 4kB) nazývané rámce (frames). Program rozdělen na malé úseky stejné
Disková pole (RAID) 1
Disková pole (RAID) 1 Architektury RAID Důvod zavedení RAID: reakce na zvyšující se rychlost procesoru. Pozice diskové paměti v klasickém personálním počítači vyhovuje pro aplikace s jedním uživatelem.
Paralelní dotazy v PostgreSQL 9.6 (a 10.0)
Paralelní dotazy v PostgreSQL 9.6 (a 10.0) Tomáš Vondra tomas.vondra@2ndquadrant.com Prague PostgreSQL Developer Day 16. února, 2017 Agenda spojení vs. procesy v PostgreSQL využití zdrojů výhody, nevýhody,
PSK3-9. Základy skriptování. Hlavička
PSK3-9 Název školy: Autor: Anotace: Vyšší odborná škola a Střední průmyslová škola, Božetěchova 3 Ing. Marek Nožka Základy skriptování v unixovém shellu Vzdělávací oblast: Informační a komunikační technologie
5. Vyhledávání a řazení 1
Jiří Vokřínek, 2016 B6B36ZAL - Přednáška 5 1 Základy algoritmizace 5. Vyhledávání a řazení 1 doc. Ing. Jiří Vokřínek, Ph.D. Katedra počítačů Fakulta elektrotechnická České vysoké učení technické v Praze
TSM for Virtual Environments Data Protection for VMware v6.3. Ondřej Bláha CEE+R Tivoli Storage Team Leader. TSM architektura. 2012 IBM Corporation
TSM for Virtual Environments Data Protection for VMware v6.3 Ondřej Bláha CEE+R Tivoli Storage Team Leader TSM architektura 2012 IBM Corporation Tradiční zálohování a obnova dat ze strany virtuálního stroje
Uklízení odpadků a analýza úniku
Uklízení odpadků a analýza úniku Jiří Vokřínek Katedra počítačů Fakulta elektrotechnická Ceské vysoké ucení technické v Praze Prednáška 11 B0B36PJV Programování v JAVA Uklízení odpadků a analýza úniku
Bc. David Gešvindr MSP MCSA MCTS MCITP MCPD
Bc. David Gešvindr MSP MCSA MCTS MCITP MCPD 1. Příprava k instalaci SQL Serveru 2. Instalace SQL Serveru 3. Základní konfigurace SQL Serveru Vychází ze Sybase SQL Server Verze Rok Název Codename 7.0 1998
Windows Server 2012. Novinky. Petr Špetlík Cloud & Server PTA
Windows Server 2012 Novinky Petr Špetlík Cloud & Server PTA TOP Hotel Praha Více než virtualizace Síla mnoha serverů, jednoduchost jednoho Každá aplikace, Jakýkoliv Cloud 7. 8. 3. 2012 2 Moderní Pracovní
Praha, 31.3. 2011. Martin Beran
Datová centra Design studie Praha, 31.3. 2011 Martin Beran martin.beran@simac.cz cz 1 Design studie 2 Implementace virtuálních pracovních stanic na platformě FlexPod + VMWare View 2 Výchozí stav Provozování
Stručný návod k programu Octave
Stručný návod k programu Octave Octave je interaktivní program vhodný pro technické výpočty. Je nápadně podobný programu MATLAB, na rozdíl od něho je zcela zadarmo. Jeho domovská vebová stránka je http://www.octave.org/,
IB111 Úvod do programování skrze Python Přednáška 7
IB111 Úvod do programování skrze Python Přednáška 7 Správa paměti (proměnné podrobněji) Práce se soubory Nikola Beneš 2. listopad 2016 IB111 přednáška 7: správa paměti, práce se soubory 2. listopad 2016
Operační systémy. Přednáška 7: Správa paměti I
Operační systémy Přednáška 7: Správa paměti I 1 Správa paměti (SP) Memory Management Unit (MMU) hardware umístěný na CPU čipu např. překládá logické adresy na fyzické adresy, Memory Manager software, který
Virtualizace. Lukáš Krahulec, KRA556
Virtualizace Lukáš Krahulec, KRA556 Co je vitualizace Způsob jak přistupovat ke zdrojům systému jako k univerzálnímu výkonu a nezajímat se o železo Způsob jak využít silný HW a rozložit ho mezi uživatele,
Úvod do Matlabu. Praha & EU: Investujeme do vaší budoucnosti. 1 / 24 Úvod do Matlabu
Vytěžování dat, cvičení 1: Úvod do Matlabu Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Fakulta elektrotechnická, ČVUT 1 / 24 Úvod do Matlabu Proč proboha Matlab? Matlab je SW pro
Struktura pamětí a procesů v DB Oracle. Radek Strnad
Struktura pamětí a procesů v DB Oracle Radek Strnad radek.strnad@gmail.com 1 Základní rozdělení paměti Software codes area Chráněná část spustitelného kódu samotné DB. System global area (SGA) Sdílená
Přednáška 2. Systémy souborů OS UNIX. Nástroje pro práci se souborovým systémem. Úvod do Operačních Systémů Přednáška 2
Přednáška 2 Systémy souborů OS UNIX. Nástroje pro práci se souborovým systémem. 1 Systém souborů (FS) I 2 Systém souborů II Logický systém souborů pro běžného uživatele se jeví jako jediná homogenní struktura
Tvorba informačních systémů
Tvorba informačních systémů Michal Krátký 1, Miroslav Beneš 1 1 Katedra informatiky VŠB Technická univerzita Ostrava Tvorba informačních systémů, 2005/2006 c 2006 Michal Krátký, Miroslav Beneš Tvorba informačních
Řídicí struktury. alg3 1
Řídicí struktury Řídicí struktura je programová konstrukce, která se skládá z dílčích příkazů a předepisuje pro ně způsob provedení Tři druhy řídicích struktur: posloupnost, předepisující postupné provedení
09. Memory management. ZOS 2006, L.Pešička
09. Memory management ZOS 2006, L.Pešička Správa paměti paměťová pyramida absolutní adresa relativní adresa počet bytů od absolutní adresy fyzický prostor adres fyzicky k dispozici výpočetnímu systému
Přednáška. Vstup/Výstup. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012
Přednáška Vstup/Výstup. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012 Příprava studijního programu Informatika je podporována projektem financovaným z Evropského
Programy a algoritmy pracující s čísly. IB111 Úvod do programování skrze Python
Programy a algoritmy pracující s čísly IB111 Úvod do programování skrze Python 2015 1 / 66 Rozcvička 1 2 + 2 2 + 3 2 + + 99 2 + 100 2 2 / 66 Připomenutí z minule proměnné, výrazy, operace řízení výpočtu:
O Apache Derby detailněji. Hynek Mlnařík
O Apache Derby detailněji Hynek Mlnařík Agenda Historie Vlastnosti Architektura Budoucnost Historie 1997 Cloudscape Inc. - JBMS 1999 Informix Software, Inc. odkoupila Cloudscape, Inc. 2001 IBM odkoupila
On line analytical processing (OLAP) databáze v praxi
On line analytical processing (OLAP) databáze v praxi Lukáš Matějovský Lukas.Matejovsky@CleverDecision.com Jan Zajíc Jan.Zajic@CleverDecision.com Obsah Představení přednášejících Základy OLAP Příklady
8. Rekurze. doc. Ing. Jiří Vokřínek, Ph.D. Katedra počítačů Fakulta elektrotechnická České vysoké učení technické v Praze
Jiří Vokřínek, 2016 B6B36ZAL - Přednáška 8 1 Základy algoritmizace 8. Rekurze doc. Ing. Jiří Vokřínek, Ph.D. Katedra počítačů Fakulta elektrotechnická České vysoké učení technické v Praze Jiří Vokřínek,
B3B33ALP - Algoritmy a programování - Zkouška z předmětu B3B33ALP. Marek Boháč bohacm11
Jméno Příjmení Už. jméno Marek oháč bohacm11 Zkouškový test Otázka 1 Jaká je hodnota proměnné count po vykonání následujícího kódu: data=[4,4,5,5,6,6,6,7,7,7,7,8,8] count=0 for i in range(1,len(data)):
Teradata Basic. RNDr. Ondřej Zýka
Teradata Basic RNDr. Ondřej Zýka 1 Něco z historie Založena v roce 1979 v garáži v Kalifornii (Brentwood). Původně součástí NCR Teradata symbolizuje schopnost spravovat extrémní množství dat. Primárně
Přednáška. Systémy souborů. FAT, NTFS, UFS, ZFS. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012
Přednáška Systémy souborů. FAT, NTFS, UFS, ZFS. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012 Příprava studijního programu Informatika je podporována projektem
ČÁST 1. Základy 32bitového programování ve Windows
Obsah Úvod 13 ČÁST 1 Základy 32bitového programování ve Windows Kapitola 1 Nástroje pro programování ve Windows 19 První program v Assembleru a jeho kompilace 19 Objektové soubory 23 Direktiva INVOKE 25
Windows 2008 R2 - úvod. Lumír Návrat
Windows 2008 R2 - úvod Lumír Návrat Operační systémy Windows Stručný přehled Klientské OS Windows 95, 98, ME Windows NT Windows 2000 Windows XP Windows Vista Windows 7 Windows 8 Windows 8.1 Windows 10
Operační systémy. Tomáš Hudec. Tomas.Hudec@upce.cz. http://asuei01.upceucebny.cz/usr/hudec/vyuka/os/
Operační systémy Tomáš Hudec Tomas.Hudec@upce.cz http://asuei01.upceucebny.cz/usr/hudec/vyuka/os/ Osnova definice OS historie rozdělení dle určení koncepce systémová volání rozdělení dle struktury 2 Literatura
Přednáška. Správa paměti I. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012
Přednáška Správa paměti I. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012 Příprava studijního programu Informatika je podporována projektem financovaným z Evropského
Algoritmus. Algoritmus je posloupnost kroků, které jsou potřeba k vyřešení problému.
ZAL 2. cvičení 2016 Algoritmus Algoritmus je posloupnost kroků, které jsou potřeba k vyřešení problému. Algoritmus na vstupu přijímá instanci problému a na výstupu dává řešení zadané instance. U algoritmu
Programy a algoritmy pracující s čísly. IB111 Úvod do programování
Programy a algoritmy pracující s čísly IB111 Úvod do programování 2016 1 / 56 Dnešní přednáška práce s čísly v Pythonu ukázky programů, ilustrace použití základních konstrukcí ukázky jednoduchých algoritmů,
Zobrazování barev. 1995-2015 Josef Pelikán CGG MFF UK Praha. pepca@cgg.mff.cuni.cz http://cgg.mff.cuni.cz/~pepca/
Zobrazování barev 1995-2015 Josef Pelikán CGG MFF UK Praha pepca@cgg.mff.cuni.cz http://cgg.mff.cuni.cz/~pepca/ ColorRep 2015 Josef Pelikán, http://cgg.mff.cuni.cz/~pepca 1 / 18 Barevné schopnosti HW True-color
Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague
1 / 23 Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague 2 / 23 biologové často potřebují najít často se opakující sekvence DNA tyto sekvence bývají relativně krátké,
Maturitní otázky z předmětu PROGRAMOVÁNÍ
Wichterlovo gymnázium, Ostrava-Poruba, příspěvková organizace Maturitní otázky z předmětu PROGRAMOVÁNÍ 1. Algoritmus a jeho vlastnosti algoritmus a jeho vlastnosti, formy zápisu algoritmu ověřování správnosti
B0M33BDT Technologie pro velká data. Storage
B0M33BDT Technologie pro velká data Storage Milan Kratochvíl 25.10.2017 Motivace Jak efektivně ukládat data v Hadoop ekosystému? formát ukládání dat a jejich komprese možnost paralelně zpracovávat na mnoha
Úvod do Linuxu. SŠSI Tábor 1
Úvod do Linuxu SŠSI Tábor 1 Trocha historie konec 60. let - AT&T vyvíjí MULTICS 1969 - AT&T Bell Labs - začátek OS Unix začátek 70.let - AT&T vývoj OS Unix kolem 1975 - University of California at Berkley
Předmluva k aktuálnímu vydání Úvod k prvnímu vydání z roku Typografické a syntaktické konvence... 20
Obsah 5 Obsah Předmluva k aktuálnímu vydání 15 1 Úvod k prvnímu vydání z roku 2000 16 Typografické a syntaktické konvence................ 20 2 Základní pojmy 21 2.1 Trocha historie nikoho nezabije................
Michal Krátký. Úvod do programovacích jazyků (Java), 2006/2007
Úvod do programovacích jazyků (Java) Michal Krátký 1 Katedra informatiky VŠB Technická univerzita Ostrava Úvod do programovacích jazyků (Java), 2006/2007 c 2006 Michal Krátký Úvod do programovacích jazyků
C2115 Praktický úvod do superpočítání
C2115 Praktický úvod do superpočítání IX. lekce Petr Kulhánek, Tomáš Bouchal kulhanek@chemi.muni.cz Národní centrum pro výzkum biomolekul, Přírodovědecká fakulta, Masarykova univerzita, Kotlářská 2, CZ-61137
PŘIJÍMACÍ TEST z informatiky a matematiky pro navazující magisterské studium Fakulta informatiky a managementu Univerzity Hradec Králové
PŘIJÍMACÍ TEST z informatiky a matematiky pro navazující magisterské studium Fakulta informatiky a managementu Univerzity Hradec Králové Registrační číslo Hodnocení část A Hodnocení část B Hodnocení A+B