Zp soby vyuºití datových úloºi² CESNET. Michal Strnad

Podobné dokumenty
Datová úloºi²t CESNET

Způsoby využití datových úložišť CESNET

Způsoby využití datových úložišť CESNET. David Antoš

Způsoby využití datových úložišť CESNET

Datová úložiště CESNET. David Antoš

Datová úložiště CESNET. David Antoš

Způsoby využití datových úložišť CESNET. Petr Benedikt

Datová úložiště CESNET

Způsoby využití datových úložišť CESNET

Datová úložiště CESNET. David Antoš

DATOVÁ ÚLOŽIŠTĚ. David Antoš CESNET

Datová úložiště CESNET

Datová úloºi²t CESNET

DATOVÁ ÚLOŽIŠTĚ CESNET

Datová úložiště v MetaCentru a okolí II. David Antoš Oddělení datových úložišť

Datová úložiště v MetaCentru a okolí. David Antoš

Datová úloºi²t CESNET

Národní e-infrastruktura v ČR

Jakub Šesták. ESEJ DO PŘEDMĚTU DIGITÁLNÍ KNIHOVNY

Virtualizace MetaCentra

CESNET - Datová úložiště

Konceptuální modelování

Novinky ze sv ta grid

MetaCentrum. datové služby. Miroslav Ruda, Zdeněk Šustr

Úvod, terminologie. Ing. Michal Valenta PhD. Databázové systémy BI-DBS ZS 2010/11, P edn. 1

Jak ti v dci po ítají

Služby e-infrastruktury CESNET

Efektivní vyuºívání programových nástroj Ansys na infrastrukturách MetaCentra / CERIT-SC

Datová centra z pohledu univerzity. David Antoš Ústav výpočetní techniky Masarykova univerzita antos@ics.muni.cz

Datová centra, virtualizace a cloud computing

ZNAK ČERVENÉHO KŘÍŽE, JEHO OCHRANA A UŽÍVÁNÍ

Inovace výuky prostřednictvím šablon pro SŠ

Specifikace systému ESHOP

BOZP - akcepta ní testy

Co je L Y X? Vlastnosti a nástroje Instalace Zdroje. Adam Farnik. V B - TU Ostrava. Elektronické publikování, 2008

MĚSTO BENEŠOV. Rada města Benešov. Vnitřní předpis č. 16/2016. Směrnice k zadávání veřejných zakázek malého rozsahu. Čl. 1. Předmět úpravy a působnost

Online komunikace a videokonference

CESNET, GRIDy a přenosy dat

ROZKLIKÁVACÍ ROZPOČET - ONLINE ZVEŘEJŇOVÁNÍ EKONOMICKÝCH DAT ÚŘADU

Standard č.9 Personální a organizační zajištění sociální služby

MetaCentrum. Martin Kuba CESNET

Služby e-infrastruktury CESNET

DIGITÁLNÍ TECHNOLOGIE VE VZDĚLÁVÁNÍ. Daniela Růžičková, NÚV ICT ve školství,

Miroslav Kunt. Srovnávací přehled terminologie archivních standardů ISAD(G), ISAAR(CPF) a české archivní legislativy

Sazba zdrojových kód. Jakub Kadl ík

Výpočetní zdroje v MetaCentru a jejich využití

Seminá e. Ing. Michal Valenta PhD. Databázové systémy BI-DBS ZS 2010/11, sem. 1-13

ICT plán školy 2015/2016

Návod pro vzdálené p ipojení do sít UP pomocí VPN pro MS Windows 7

Souborové systémy a práce s daty David Antoš

Koncepce rozvoje Polytematického strukturovaného hesláře (PSH)

Využití EduBase ve výuce 10

Odpov di na dotazy uchaze k ve ejné zakázce. 25/

1. TECHNICKÉ POŽADAVKY PRODUKTŮ VEMA Klasifikace konfigurací z hlediska podpory... 7

Server. Software serveru. Služby serveru

Limity funkcí v nevlastních bodech. Obsah

Fakulta elektrotechnická

Optimalizace. v kontextu datových schránek. Kateřina Černá Pavel Nemrava

Odpov di na dotazy k ve ejné zakázce. 30/ SSZ Registr IKP

Platební styk (mezibankovní, klientský) Jitka Vachtová 28. íjna 2011

DATOVÉ SCHRÁNKY. Seminární práce z předmětu Information and communication policy

Zásady a podmínky pro poskytování dotací na program Podpora implementace Evropské charty regionálních či menšinových jazyků 2011

Aktuální stav. Martin Kuba CESNET a ÚVT MU

Sbírka zákonů ČR Předpis č. 473/2012 Sb.

MetaCentrum. Miroslav Ruda. listopad 2013 CESNET

e²ení systém lineárních rovnic pomocí s ítací, dosazovací a srovnávací metody

VÝZVA K PODÁNÍ NABÍDKY

Data v počítači EIS MIS TPS. Informační systémy 2. Spojení: jan.skrbek@tul.cz tel.: Konzultace: úterý

Dne obdržel zadavatel tyto dotazy týkající se zadávací dokumentace:

METACentrum Český národní gridovýprojekt. Projekt METACentrum. Jan Kmuníček ÚVT MU & CESNET. meta.cesnet.cz

Zám r a cíle projektu

Nastavení vestav ného p evodníku Ethernet -> sériová linka ES01

Dálkové p enosy ze za ízení aktivní protikorozní ochrany Severomoravské plynárenské, a.s.

DOCEAR: POPIS A POROVNÁNÍ SE SYSTÉMY ZOTERO A MENDELEY Jan Hendl

účetních informací státu při přenosu účetního záznamu,

-1- N á v r h ČÁST PRVNÍ OBECNÁ USTANOVENÍ. 1 Předmět úpravy

Cloudy a gridy v národní einfrastruktuře

ORGANIZAČNÍ ŘÁD ŠKOLY

Přijímací řízení ve školním roce 2012/ Informace pro vycházející žáky a zákonné zástupce

METACentrum zastřešení českých gridových aktivit

SK SLAVIA PRAHA POZEMNÍ HOKEJ, z.s. Stanovy spolku Návrh. Čl. I Název a sídlo. Čl. II Účel spolku. Čl. III Hlavní činnost spolku

HW vybavení nov vybudovaného datového centra SSZ (Zvýšení kapacity Datového úložišt )

Bezpečné sdílení a správa dokumentů v on-line prostředí

PŘIJÍMACÍ ŘÍZENÍ. Strana

Analýza zdrojů systému sociálních služeb na Horšovskotýnsku a Holýšovsku

ETICKÝ KODEX VÝZKUMU V RÁMCI SLEZSKÉ UNIVERZITY V OPAVĚ

P íklad 1 (Náhodná veli ina)

ŘÁD UPRAVUJÍCÍ POSTUP DO DALŠÍHO ROČNÍKU

Ministerstvo kultury Odbor umění, literatury a knihoven KNIHOVNA 21.STOLETÍ

PUBLICITA v OP VK. Seminář pro příjemce v rámci globálních grantů Olomouckého kraje. Olomouc, 20. a 21. dubna 2009

Uºivatelská p íru ka Octopus

Adresa p íslušného ú adu. Ú ad:... Ulice:... PS, obec:...

Odpov di na dotazy uchaze k ve ejné zakázce. 20/ Rámcová smlouva o vývoji a údržb aplika ního programového vybavení EDS, EXK a DAP

Zákon o elektronickém podpisu

S T A T U T Á R N Í M Ě S T O L I B E R E C

CERIT-SC, MetaCentrum

DAŇOVÉ AKTULITY Daň z přidané hodnoty

Směrnice pro zadávání veřejných zakázek malého rozsahu města Poděbrady

11. Počítačové sítě protokoly, přenosová média, kapacity přenosu. Ethernet

Právní úprava spolků dle nového občanského zákoníku

Transkript:

Zp soby vyuºití datových úloºi² CESNET Michal Strnad

P ehled infrastruktura dostupná na CESNETu sluºby úloºi² podle r zných typ pouºití smysl úloºi²t a zamý²lené pouºití synchronizace a sdílení dat zálohy, archivy, sdílení klasickými metodami speciální sluºby správa uºivatel a modely pouºití výhledy rozvoje sluºeb volitelná témata o ekávané rychlosti p enos dat velká data

ćst I Infrastruktura

Infrastruktura Děčín Liberec Plzeň Praha Hradec Králové Pardubice PIONIER Opava Karviná Ostrava Olomouc AMS-IX NIX Jihlava Zlín České Budějovice Brno GÉANT Internet ACONET SANET

Infrastruktura celková hrubá kapacita cca 21 PB Plze (od pol. 2012) v areálu ZƒU cca 500 TB disk, 4800 TB pásek, 3584 TB SGI COPAN SGI Data Migration Facility, CXFS Jihlava (2013) Krajský ú ad Jihlava 1041 TB disk, 3744 TB pásek, 2934 TB MAID Brno (2013) rektorát VUT Brno 498 TB disk, 3500 TB pásek, 2116 TB MAID e²ení IBM zaloºené na GPFS a TSM

Knihovna v Plzni

Úloºi²t jsou hierarchická vrstvy médií r zné kapacity a rychlosti rychlé disky/pomalej²í disky/maid/pásky drahý provoz levn j²í provoz a automatizovaný systém pro p esuny dat mezi nimi déle nepouºívaná data do pomalej²ích vrstev pro uºivatele transparentní, resp. tém transparentní p ístup k dlouho nepouºitému souboru trvá déle uºivatel m to obvykle nevadí

Zapln ní archivu v Plzni

ƒást II Sluºby datových úloºi² motivace

Smysl externího úloºi²t uºivatelé rad ji drºí data na vlastním za ízení... to ale nedává rozumné garance dlouhodobého uchovávání pouºívají se nevhodná média, chybí systematická pé e data je lépe uchovávat v ºivém systému konsolidace zdroj národní úloºi²t v deckých dat umoº uje po ídit za ízení dostate né velikosti spravované specializovaným týmem s moºností sdílení dat mezi skupinami uºivatel

Cíl: dlouhodobé uchování dat pot eba dlouhodob uchovávat v decká data vzr stá uchování primárních dat z experiment a výpo t s ohledem na potenciál jejich dal²ího vyuºití k návratu a revizi publikovaných výsledk uchování zaji² ujeme na úrovni zachování binárních dat (bitstream) správce úloºi²t nerozumí odborné povaze dat ani nem ºe rozhodovat o smysluplnosti jejich archivace proto ned láme LTP (Long-Term Preservation) bitstream je nicmén p edpokladem pro uchování dat dal²í kopie, geogracké repliky, redundance v systému

Organiza n -právní pohled data uºivatel zásadn pat í uºivatel m srovnejte s provozními podmínkami komer ních poskytovatel

ƒást III Sluºby datových úloºi²

Jednorázové zaslání souboru FileSender: webová sluºba pro jednorázový p enos (velkých) soubor velkých: aktuáln 500 GB p ispíváme i k jeho vývoji http://filesender.cesnet.cz alespo jedna strana komunikace musí být oprávn ný uºivatel infrastruktury autentizace federací eduid.cz oprávn ný uºivatel m ºe nahrát soubor a poslat mu oznámení lze poslat komukoli pozvánku testovací verze na http://filesender2.cesnet.cz

Synchronizace a sdílení dat pokud hledáte zp sob, jak a p itom owncloud synchronizovat data mezi svými po íta i i mobilními za ízeními mít je zárove dostupná p es web moci data sdílet data nejsou p íli² velká

owncloud cloudové úloºi²t se synchronizací soubor pro osobní po íta e (Windows, Linux, Mac OS X) mobilní Android, Apple (klient pod 1 Euro) a webové rozhraní data se synchronizují p es úloºi²t na po íta i jsou i lokáln, na mobilní p i otev ení data lze sdílet konkrétní osob nebo kdo zná odkaz kalendá, kontakty registrace federací na http://owncloud.cesnet.cz standardní limit 100 GB na uºivatele

owncloud po et uºivatel

Klasické moºnosti vyuºití úloºi² zálohy archivace uºivatelé mají primární data u sebe na úloºi²t odkládají zálohu pro p ípad havárie bu pro zálohování jednotlivých stroj nebo i agregovan IT odd lení zálohuje celou katedru uºivatelé na úloºi²t odkládají cenná primární data data nejsou asto vyuºívána uºivatelé nemají prost edky pro jejich uchovávání individuální p ístup koncových uºivatel vs. laboratorní archivá

Klasické moºnosti vyuºití úloºi² sdílení dat distribuovaný tým pot ebuje spole n pracovat nad v t²ími objemy dat, p ípadn je zve ej ovat typicky koncoví uºivatelé n co jiného distribuce obsahu, jiné speciální aplikace

Standardní p ístup k soubor m pokud chcete p ipojit souborový systém nebo p ená²et soubory NFSv4 (známé uºivatel m MetaCentra) rsync, scp, FTPS obvykle autentizované systémem Kerberos existují GUI klienti i nástroje pro p íkazovou ádku pro hlavní platformy CIFS (známý sí ový disk z Windows) Globus vysokorychlostní p enosy

Globus d íve zvaný GlobusOnline klikací FTP na steroidech kopírování velkého objemu dat ízené pomocí webového rozhraní mezi koncovými body úloºi²ti podporujícími Globus nebo lokálním strojem

Jak za ít pouºívat souborový p ístup pokud chcete vyuºívat souborov orientované protokoly dosta uje prefabrikovaná politika migrací dat ukládáte jen individuální data pot ebujete ukládat nejvý²e jednotky TB tak se jen zaregistrujte na http://du.cesnet.cz vyºaduje to ov ení uºivatele z akademické instituce lenství se po roce prodluºuje jako indikace, ºe uºivatel je²t ví o svých datech kódové ozna ení: VO Storage

Jak se stát uºivatelem snadno 2 pokud pot ebujete (t eba okamºit ) i výpo etní zdroje a vyhovují podmínky podobné jako ve VO Storage tak se zaregistrujte do MetaCentra na http://metavo.metacentrum.cz/ jestli to nesta í, tak...

Jak se stát uºivatelem snadno 2 pokud pot ebujete (t eba okamºit ) i výpo etní zdroje a vyhovují podmínky podobné jako ve VO Storage tak se zaregistrujte do MetaCentra na http://metavo.metacentrum.cz/ jestli to nesta í, tak... ale aº za chvilku

Správa uºivatelských ú t systém Perun uºivatel (osoba) má (ideáln ) jedinou identitu v infrastruktu e pot ebujeme ov ení identity a p íslu²nosti k oprávn né instituci pro to? zodpovídáme v projektu za to, komu sluºby poskytujeme (akademické komunit ), ídíme mnoho r zných sluºeb na identitu uºivatele jsou navázány jednotlivé mechanismy p ístupu ke zdroj m ízeno lenstvím ve virtuálních organizacích uºivatelé v²e ídí p es webové rozhraní

Úloºi²t pro náro n j²í nesta í VO Storage? zaloºíme vám virtuální organizaci! VO je skupina uºivatel se spole ným zájmem, kte í vystupují jako celek VO má správce, který jedná s poskytovatelem zdroj rozhoduje o podmínkách lenství jednotlivých uºivatel dohoda o poskytování zdroj mezi VO a správcem zdroje popisuje nastavení technických parametr velikost poskytovaného prostoru pouºité p ístupové protokoly politika ukládání dat, po ty kopií/replik VO m ºe vyuºívat r zné typy zdroj

Náro n j²í poºadavky prakticky napi²te nám na du-support@cesnet.cz domluvíme se, co pot ebujete opravdu to pot ebujeme pochopit kolik dat máte, jak s nimi pracujete,... p ipravíme konguraci úloºi²t zaloºíme virtuální organizaci organiza ní jednotka pro správu uºivatel pozveme vás do ní a pový²íme na administrátora dál si uºivatele spravujete sami, vytvá íte skupiny,... ukládáte data p es FTP/rsync/NFSv4/... my se staráme, aby na se vytvá ely jejich repliky,...

Stav shrnutí na²ím dlouhodobým zám rem je spolupracovat se skupinami, které mají velká data pomoci s ukládáním pomoci se zpracováním na²e úloºi²t jsou v b ºném provozu zde popsané sluºby jsou k dispozici dva reºimy sluºeb: p ihla²te se vs. napi²te nám pro napi²te nám sluºby vºdy pot ebujeme pochopit zám ry uºivatele vyºaduje komunikaci a jisté úsilí na obou stranách

Výhled cílem je udrºet úloºi²t s otev eným p ístupem pro v deckou komunitu ideové pilí e rozvoje 1. technologie a její provoz 2. organizace dat (Hadoop, databáze) 3. aplikace analýza velkých dat v etn schopnosti fungovat jako testovací prost edí pro takové aplikace 4. dlouhodobé uchování dat poskytnutí nástroj pro práci aplika ního knihovníka 5. Open Access repozitá publikací a dat body 2 a 3 v úzké spolupráci s národním gridem MetaCentrum

Kontakty http://du.cesnet.cz uºivatelská podpora: du-support@cesnet.cz

Záloha

... to uº jsou velká data? lze o ekávat propustnosti n kolika stovek MB/s na 10Gbit/s p ipojení bez v t²ích zásah na gigabitu 5080 MB/s pokud v nujete pozornost vylad ní systém na 10Gbit/s p ípojce, tak dosáhnete aº 400 MB/s to zahrnuje lad ní parametr TCP/IP stacku jádra OS a pot ebujete íst ze/psát na 810 rota ních disk pro dosaºení takového toku pro tak málo? úloºi²t mají vnit ní propustnost 2,5 GB/s navenek a dovnit hierarchie limit technologie za p ijatelné náklady p istupuje více uºivatel sou asn synchronními protokoly

Co znamená 400 MB/s? m jme t eba 100 TB dat tedy 100.000.000 MB, tedy 250.000 sekund cca 69 hodin to je necelé t i dny takºe 1 PB by se p ená²el m síc pro to v bec podporujete? uºivatelé tato rozhraní cht jí jsou zvyklí na standardní POSIX souborové systémy

Intermezzo: co znamená 10 Mbit/s p ípojka? úloºi²t vyºadují rozumné p ipojení uºivatele jak dlouho bude uºivatel linkou o teoretické propustnosti 10 Mbit/s kopírovat 20 TB? 20 TB = 160.000.000 Mbit 160 mil. Mbit / (10 Mbit/s * 86400 sekund za den) 185 dn p i plném teoretickém vytíºení linky reáln ekn me rok na druhou stranu pln posta í p ipojení do sdílené páte e pro p enosy dat na úloºi²t s disky obvykle není t eba lambda

Big Data wikipedia: Big data is an all-encompassing term for any collection of data sets so large and complex that it becomes dicult to process them using traditional data processing applications. z toho obecn plyne: cena, rychlost, pohodlí vyberte si nejvý²e dv z nich ;) pro nás jsou data velká, kdyº se jim uºivatelé musí p izp sobit tedy kdyº nelze nasadit standardní techniky a dosáhnout pro uºivatele p ijatelného výsledku specializované nástroje vyºadují zna né úsilí p i nasazování

Jak se to d lá vzdáme se bohatosti POSIX souborového systému typicky ponecháme pouze operace uloº soubor a stáhni soubor ve velkých datech nelze mít miliardy mali kých soubor p íklad: odhad moºností zpracování dat byl sou ástí návrhu LHC p íklad: dcache jeden ze systém správy dat vyvinutých pro CERN pro ukládání PB objem na heterogenních úloºi²tích jsme také jeden z uzl