Cvičení MI-PAP I. Šimeček, M. Skrbek, J. Trdlička

Podobné dokumenty
Přednáška. Vstup/Výstup. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012

Paralelní výpočty na clusteru KMD

Základy programování (IZP)

CUDA J. Sloup a I. Šimeček

Cvičení MI-PRC I. Šimeček

SUPERPOČÍTAČE DANIEL LANGR ČVUT FIT / VZLÚ

Architektury VLIW M. Skrbek a I. Šimeček

Knihovny pro CUDA J. Sloup a I. Šimeček

Paralelní výpočty ve finančnictví

Základy programování (IZP)

Základy programování (IZP)

Vícevláknové programování na CPU: POSIX vlákna a OpenMP I. Šimeček

Rocrail. Nejprve: Obecný úvod. Instalace

Téma 7: Konfigurace počítačů se systémem Windows 7 III. Téma 7: Konfigurace počítačů se systémem Windows 7 III

Paralelní výpočetní jádro matematického modelu elektrostatického zvlákňování

1 Uživatelská dokumentace

IMPLEMENTACE OPERAČNÍHO SYSTÉMU LINUX DO VÝUKY INFORMAČNÍCH TECHNOLOGIÍ JAZYK C

Přednáška. Správa paměti II. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012

Vývoj programů. ÚVOD DO OPERAČNÍCH SYSTÉMŮ

9. lekce Úvod do jazyka C 4. část Funkce, rekurze Editace, kompilace, spuštění Miroslav Jílek

Úvod do OpenMP. Jiří Fürst

Real Time programování v LabView. Ing. Martin Bušek, Ph.D.

Program Computer Setup

Téma 8: Konfigurace počítačů se systémem Windows 7 IV

C2115 Praktický úvod do superpočítání

Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115

Paralelní programování

Simluátor Trilobota. (projekt do předmětu ROB)

Úvod do GPGPU J. Sloup, I. Šimeček

Provoz DOS verzí programů VIS pod Windows 7

Přednáška 1. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012

Matematika v programovacích

AUTHOR : Robert Follner DATE. Abstrakt ABSTRACT: Několik poznatků autora (Robert Follner) z programování

Jan Kratochvíl, F 3 MOD. 15. února 2004

C2110 Operační systém UNIX a základy programování

Implementace numerických metod v jazyce C a Python

Úprava naměřených stavů

Ročníkový projekt DYNAMICKÉ HTML. Projektová dokumentace. Jan Ehrlich, Petr Marek, Tomáš Marván, Martin Paľo. Vedoucí projektu: RNDr.

Novinky z vývoje v MetaCentru

C2115 Praktický úvod do superpočítání

Nastavení programu pro práci v síti

Vložení expiračního kódu do spojů ALCOMA

Ing. Jan Buriánek. Katedra softwarového inženýrství Fakulta informačních technologií České vysoké učení technické v Praze Jan Buriánek, 2010

Téma 11: Instalace a práva programů. Téma 11: Instalace a práva programů

GPGPU Aplikace GPGPU. Obecné výpočty na grafických procesorech. Jan Vacata

Paralení programování pro vícejádrové stroje s použitím OpenMP. B4B36PDV Paralelní a distribuované výpočty

Provoz DOS verzí programů VIS pod Windows XP (NT, 2000)

Pokročilé architektury počítačů

Práce s knihovnami. Karel Richta a kol. katedra počítačů FEL ČVUT v Praze. Karel Richta, Martin Hořeňovský, Aleš Hrabalík, 2016

PŘÍRUČKA SYSTÉMOVÉHO ADMINISTRÁTORA PRO HOMEBANKING PPF banky a.s.

Národní šetření výsledků žáků v počátečním vzdělávání

PHP. nejen pro začátečníky. $c; echo { Martin Pokorný. Vzdìlávání, které baví Nakladatelství a vydavatelství.

První kroky s METEL IEC IDE

1 Návod na instalaci prostředí LeJOS-NXJ a přehrání firmwaru NXT kostky

Vložení expiračního kódu do spojů ALCOMA

Vláknové programování část I

Využití systému Dynamips a jeho nástaveb pro experimenty se síťovými technologiemi Petr Grygárek

Preprocesor. Karel Richta a kol. katedra počítačů FEL ČVUT v Praze. Karel Richta, Martin Hořeňovský, Aleš Hrabalík, 2016

Emulátory. Autor: Martin Fiala. Spouštění programů a her z jiných OS nebo jiných platforem. InstallFest

ISU Cvičení 2. Marta Čudová

Nvidia CUDA Paralelní programování na GPU

11. Přehled prog. jazyků

Compatibility List. GORDIC spol. s r. o. Verze

T-Mobile Internet. Manager. pro Windows NÁVOD PRO UŽIVATELE

Programové vybavení počítačů operační systémy

1 Správce licencí Správce licencí Správce licencí Start > Všechny programy > IDEA StatiCa > Správce licencí Soubor > Správce licencí Licence

Obsah. Kapitola 1 Hardware, procesory a vlákna Prohlídka útrob počítače...20 Motivace pro vícejádrové procesory...21

AUTOMATICKÉ ZÁLOHOVÁNÍ DATABÁZE PRO SQL Express 2005

Karel Bittner HUMUSOFT s.r.o. HUMUSOFT s.r.o.

Digitální učební materiál

BRICSCAD V15. Licencování

Semestrální práce KIV/PC Řešení kolizí frekvencí sítě vysílačů Zdeněk Bečvář A14B0466P 10. ledna 2016

Předměty. Algoritmizace a programování Seminář z programování. Verze pro akademický rok 2012/2013. Verze pro akademický rok 2012/2013

Základní informace a postup instalace systému IS MPP

Instalační a uživatelská příručka aplikace VHDT

Přednáška. Správa paměti I. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012

faktura, LaTeX, open source, freeware, Python, multiplatformní program


ČÁST 1. Základy 32bitového programování ve Windows

Šifrování/Dešifrování s použitím hesla

Téma 1: Práce s Desktop. Téma 1: Práce s Desktop

Bootkity v teorii a praxi. Martin Dráb martin.drab@ .cz

Koncepce (větších) programů. Základy programování 2 Tomáš Kühr

STUDIJNÍ MATERIÁL PRO TECHNICKOU CERTIFIKACI ESET Business Edition, ESET Remote Administrator

Úprava a instalace lokálního repozitáře pro provoz ve virtualizačním prostředí VMware Server

Základy programování (C#) Autor: Ing. Jan Nožička SOŠ a SOU Česká Lípa VY_32_INOVACE_1134_Základy programování (C#) _PWP

Doporučení pro použití AVG na starších/pomalejších počítačích

eliška 3.04 Průvodce instalací (verze pro Windows 7) w w w. n e s s. c o m

Vlákno (anglicky: thread) v informatice označuje vlákno výpočtu neboli samostatný výpočetní tok, tedy posloupnost po sobě jdoucích operací.

Implementace LMS MOODLE. na Windows 2003 Server a IIS 6.0

09. Memory management. ZOS 2006, L.Pešička

Obsah. KELOC CS, s.r.o... v ý v o j a p r o d e j e k o n o m i c k é h o s o f t w a re

monolitická vrstvená virtuální počítač / stroj modulární struktura Klient server struktura

Nastavení pro SW Pohoda Zkušební verze

GPGPU. Jan Faigl. Gerstnerova Laboratoř pro inteligentní rozhodování a řízení České vysoké učení technické v Praze

C2110 Operační systém UNIX a základy programování

MS WINDOWS I. řada operačních systémů firmy Microsoft *1985 -? Historie. Práce ve Windows XP. Architektura. Instalace. Spouštění

Transkript:

Cvičení MI-PAP I. Šimeček, M. Skrbek, J. Trdlička xsimecek@fit.cvut.cz Katedra počítačových systémů FIT České vysoké učení technické v Praze Ivan Šimeček, 2011 MI-PAP, LS2010/11, Cvičení 1-6 Příprava studijního programu Informatika je podporována projektem financovaným z Evropského sociálního fondu a rozpočtu hlavního města Prahy. Praha & EU: Investujeme do vaší budoucnosti

Kompilace a spouštění úloh pod sdílenou pamětí na serveru STAR [M... https://edux.fit.cvut.cz/courses/mi-pap/labs/spousteni_uloh of 2 210.2011 23:04 Kompilace a spouštění úloh pod sdílenou pamětí na serveru STAR Kompilace úloh (pro OpenMP) gcc -fopenmp -O3 <soubor.c> g++ -fopenmp -O3 <soubor.cpp> Spuštění úloh(pro PAP) stáhněte si šablonu job_souboru z /home/mpi/queue_12_1slots_per_host_job.sh a upravte ho dle potřeb. spusťte pomocí příkazu /opt/bin/qrun.sh takto: /opt/bin/qrun.sh 12c 1 1slots_per_host <job_soubor> Obecně spuštění úloh (např. pro PAR) stáhněte si šablonu job_souboru z /home/mpi a upravte ho dle potřeb. spusťte pomocí příkazu /opt/bin/qrun.sh takto: /opt/bin/qrun.sh [4c 12c mix] #CPU FRONTA job_soubor 4c: Uloha pobezi na vypocetnich uzlech se 4 CPU na zakladni desce desce, 8GB RAM. 12c: Uloha pobezi na vypocetnich uzlech se 12 CPU na zakladni desce desce, 24GB RAM. mix: Uloha nahodne pobezi na vypocetnich uzlech 4c nebo 12c nebo jejich kombinace.!!! Tento rezim je pouze pro testovani uloh!!!!!! Pro mereni uloh je treba pouzivat rezim 4c nebo 12c!!! Pokud neni uvedena zadna hodnota 4c, 12c nebo mix tak se pouzije hodnota: 12c #CPU: Na kolika procesorech ma dana uloha bezet v dane fronte FRONTA. (Ciselna hodnota v rozsahu 1-104) Kazda FRONTA ma svuj vlastni rozsah procesoru, viz. sekce FRONTA! FRONTA: fronta min #CPU max #CPU doba behu ulohy ================ ========== ========== ================= 1slots_per_host 1 1 60 min default 1 8 30 min fast 1 8 1 min long 1 32 40 min serial 1 1 60 min short 1 16 20 min Fronty na serveru STAR zjistíme pomocí příkazu qconf -sql 12c_1slots_per_host.q 12c_default.q 12c_fast.q 12c_long.q 12c_serial.q 12c_short.q

ompilace a spouštění úloh pod sdílenou pamětí na serveru STAR [M... https://edux.fit.cvut.cz/courses/mi-pap/labs/spousteni_uloh of 2 210.2011 23:04 12c_vip.q 2slots_per_host.q 4c_1slots_per_host.q 4c_default.q 4c_fast.q 4c_long.q 4c_serial.q 4c_short.q 4c_vip.q all.q linsolve.q /mnt/www/courses/mi-pap/data/pages/labs/spousteni_uloh.txt Poslední úprava: 2011/04/08 08:18 autor: xsimecek

ompilace a spouštění úloh s technologií OpenCL na serveru STAR [... https://edux.fit.cvut.cz/courses/mi-pap/labs/spousteni_ulohopencl of 1 210.2011 23:05 Kompilace a spouštění úloh s technologií OpenCL na serveru STAR Kompilace zkopírovat nějaký příklad z: /opt/share/ati-stream-sdk-v3-lnx64/samples/ upravit cestu v daném makefile na /opt/share/ati-stream-sdk-v3-lnx64 spustit make spustitelný soubor vznikne v adresáři: build/debug/x86_64/xyz Další možné volby -O<cislo> = úroveň optimalizace -g = vloží informace pro debug Spuštění pokud spustíme bez parametrů dostaneme chybovou hlášku: Platform Vendor : Advanced Micro Devices, Inc. Error: clgetdeviceids failed Error code : CL_DEVICE_NOT_FOUND Error: samplecommon::displaydevices() failed Pro správnou funkci je třeba zkopírovat soubor.cl do adresáře ke spustitelnému souboru a spouštět s parametrem - -device cpu (znaky minus jsou po sobe bez mezery) spouštění úloh s technologií OpenCL na serveru STAR je stejné jako pro OpenMP Debug 3. 4. Zkompilovat s volbou -g spustit clbuildprogram() s volbou -g nastavit proměnnou prostředí CPU_COMPILER_OPTIONS= -g raději nastavit proměnnou prostředí CPU_MAX_COMPUTE_UNITS=1 Ukázkové kódy opencl.zip /mnt/www/courses/mi-pap/data/pages/labs/spousteni_ulohopencl.txt Poslední úprava: 2011/04/20 18:49 autor: xsimecek

ompilace a spouštění úloh s technologií CUDA na GPU serverech [... https://edux.fit.cvut.cz/courses/mi-pap/labs/spousteni_ulohcuda 1 of 1 210.2011 23:06 Kompilace a spouštění úloh s technologií CUDA na GPU serverech Kompilace pro CUDA-enabled grafické karty nvcc <soubor s priponou.cu> -lcuda -lcudart -o spust Další možné volby -O<cislo> = úroveň optimalizace -g = vloží informace pro debug -gencode = vloží překlad pro GPU s CUDA capabilities lepší než 0 (např. -gencode arch=compute_13,code=sm_13) -deviceemu = Kompilace pro emulaci na CPU. Dříve (do verze SDK 3) bylo možno emulovat CUDA kód na CPU pomocí tohoto přepínače Spouštění úloh Po kompilaci (a slinkování) je vytvořen normální spustitelný soubor, takže spuštení je triviální, jen je třeba nastavit správnou cestu k dynamickým knihovnám (pokud není správně nastavena): export LD_LIBRARY_PATH= /usr/local/cuda/lib64 Debug Linux cuda-gdb Windows 3. Nsight [http://developer.nvidia.com/nvidia-parallel-nsight] cuda-memcheck v adresáři /bin waste [http://code.google.com/p/cuda-waste/] Ukázkové kódy cuda.zip /mnt/www/courses/mi-pap/data/pages/labs/spousteni_ulohcuda.txt Poslední úprava: 2011/04/20 18:43 autor: xsimecek

ompilace a spouštění úloh s technologií OpenCL na GPU serverech... https://edux.fit.cvut.cz/courses/mi-pap/labs/spousteni_ulohopenclg of 1 210.2011 23:06 Kompilace a spouštění úloh s technologií OpenCL na GPU serverech Kompilace clang -I/usr/local/cuda/include -lopencl hello_cl.c -o hello_cl Další možné volby -O<cislo> = úroveň optimalizace -g = vloží informace pro debug Spuštění Pro správnou funkci je třeba zkopírovat soubor.cl do adresáře ke spustitelnému souboru a pak normálně spustit. Debug na kartách AMD/ATI lze použít printf(), nutno zapnout rozšíření cl_amd_printf použít debugger gdebuggercl [http://www.gremedy.com/gdebuggercl.php] Ukázkové kódy opencl.zip /mnt/www/courses/mi-pap/data/pages/labs/spousteni_ulohopenclg.txt Poslední úprava: 2011/04/20 18:48 autor: xsimecek