Datová úložiště v MetaCentru a okolí II. David Antoš Oddělení datových úložišť



Podobné dokumenty
Datová úložiště v MetaCentru a okolí. David Antoš

Způsoby využití datových úložišť CESNET

Datová úložiště CESNET. David Antoš

Datová úložiště CESNET. David Antoš

Způsoby využití datových úložišť CESNET. David Antoš

Způsoby využití datových úložišť CESNET. Petr Benedikt

Způsoby využití datových úložišť CESNET

Způsoby využití datových úložišť CESNET

Datová úložiště CESNET

Datová úložiště CESNET. David Antoš

Datová úložiště CESNET

DATOVÁ ÚLOŽIŠTĚ. David Antoš CESNET

DATOVÁ ÚLOŽIŠTĚ CESNET

Souborové systémy a práce s daty David Antoš

CESNET - Datová úložiště

Datová úloºi²t CESNET

Jakub Šesták. ESEJ DO PŘEDMĚTU DIGITÁLNÍ KNIHOVNY

Výpočetní zdroje v MetaCentru a jejich využití

METACentrum Český národní gridovýprojekt. Projekt METACentrum. Jan Kmuníček ÚVT MU & CESNET. meta.cesnet.cz

Datová úloºi²t CESNET

MetaCentrum. Miroslav Ruda. listopad 2013 CESNET

aktivita CESNETu společně MU, UK a ZČU sdružuje výpočetní prostředky

MetaCentrum. Martin Kuba CESNET

Cloudy a gridy v národní einfrastruktuře

Aktuální stav. Martin Kuba CESNET a ÚVT MU

METACentrum zastřešení českých gridových aktivit

Služby ÚVT pro VaV & IT pro CEITEC. David Antoš

Výběr zdrojů, zadávání a správa úloh v MetaCentru

MetaCentrum. Miroslav Ruda. Skalský Dvůr, Miroslav Ruda (MetaCentrum) MetaCentrum Skalský Dvůr, / 11

Novinky z vývoje v MetaCentru

Konsolidace zálohování a archivace dat Připojení k DÚ CESNET

CERIT SCIENTIFIC CLOUD. Centrum CERIT-SC. Luděk Matyska. Praha, Seminář MetaCentra,

Zp soby vyuºití datových úloºi² CESNET. Michal Strnad

Gridy v České republice. Luděk Matyska Masarykova univerzita v Brně CESNET, z.s.p.o.

Výpočetní clustery v METACentru

MetaCentrum. Tomáš Rebok MetaCentrum NGI, CESNET z.s.p.o. CERIT-SC, Masarykova Univerzita Olomouc,

MetaCentrum a e-infrastruktura CESNET

Hardware - minulý rok

METACENTRUM. Miroslav Ruda CESNET. Seminář MetaCentra, Praha

CESNET, GRIDy a přenosy dat

MetaCentrum. Miroslav Ruda. březen 2017, Brno CESNET

Aktuality a plány virtuální organizace

MetaCentrum. Martin Kuba CESNET

Služby e-infrastruktury CESNET a IPv6

Souhrnný pohled na služby e-infrastruktury CESNET

Zadavatel: CESNET, zájmové sdružení právnických osob se sídlem Zikova 4, Praha 6 IČ:

Služby e-infrastruktury CESNET

Služby e-infrastruktury CESNET

Představení e-infrastruktury CESNET Ing. Jan Gruntorád, CSc. ředitel CESNET, z.s.p.o.

SUPERPOČÍTAČOVÉ CENTRUM. Luděk Matyska

Souhrnný pohled na služby e-infrastruktury CESNET

Virtualizace MetaCentra

Souhrnný pohled na služby e-infrastruktury CESNET

Souhrnný pohled na služby e-infrastruktury CESNET

Souhrnný pohled na služby e-infrastruktury CESNET

MetaCentrum a náro (nejen matematické) výpočty

DATOVÁ ÚLOŽIŠTĚ CESNET, FAIR DATA

Provozní statistiky centra CERIT-SC

Střední úložiště. Uživatelská dokumentace Zřízení přístupu

MetaCentrum. Miroslav Ruda CESNET

Bezpečnost v Gridech. Daniel Kouřil EGEE kurz 12. prosince Enabling Grids for E-sciencE.

Souhrnný pohled na služby e-infrastruktury CESNET

CERIT-SC. Luděk Matyska, David Antoš, Aleš Křenek

Martin Kuba, Daniel Kouřil seminář řešitelů, Žďár n.s. 1

Výběr zdrojů, zadávání a správa úloh

Národní gridová infrastruktura MetaCentrum & související služby pro akademickou obec

MetaCentrum. datové služby. Miroslav Ruda, Zdeněk Šustr

Národní e-infrastruktura a její služby

Datová úloºi²t CESNET

Základní uživatelský manuál služby WMS Drive

Konsolidace zálohování a archivace dat

Zálohovací stokrát jinak

Souborové služby. Richard Biječek

Czech National e-infrastructure. Projekt MetaCentrum. Jan Kmuníček CESNET. meta.cesnet.cz

Hana Jedličková Novell Tour Praha,

CESNET. Národní e-infrastruktura. Ing. Jan Gruntorád, CSc. ředitel CESNET, z.s.p.o.

Czech National e-infrastructure. Projekt MetaCentrum. Jan Kmuníček CESNET. meta.cesnet.cz

Jak spustit provoz v DR lokalitě snadno a rychle

JSEM ELEKTRONICKÁ IDENTITA. VĚŘÍTE MI? Jiří Bořík CESNET Olomouc

MetaCentrum - Virtualizace a její použití

Portfolio úložišť WD pro datová centra Kapacitní úložiště prošlo vývojem

C2115 Praktický úvod do superpočítání

HPC Users' Access Workshop: nový superpočítač Salomon

METACENTRUM. Miroslav Ruda CESNET. Konference CESNET, Praha

Datová úložiště. Zdroj: IBM

Představení Kerio Control

TSM for Virtual Environments Data Protection for VMware v6.3. Ondřej Bláha CEE+R Tivoli Storage Team Leader. TSM architektura IBM Corporation

Efektivní vyuºívání programových nástroj Ansys na infrastrukturách MetaCentra / CERIT-SC

Příloha č. 1 zadávací dokumentace. Technická dokumentace, specifikace požadovaného plnění a popis hodnocení

EGI a česká NGI aktuální informace o stavu a plánech. Luděk Matyska CESNET, z.s.p.o. Masarykova universita

Služby (nejen) ÚVT MU (nejen) v oblasti výpočtů a práce s daty

CERIT-SC reloaded. už se všichni těšíme. Seminář gridového počítání,

Karel Bittner HUMUSOFT s.r.o. HUMUSOFT s.r.o.

současný stav a další rozvoj Martin Procházka Kraj Vysočina

ZPRAVODAJ. Centra výpočetní techniky

TECHNICKÁ SPECIFIKACE

Služby e-infrastruktury CESNET. Tomáš Košňar CESNET z. s. p. o.

Paralelní výpočty ve finančnictví

2.2 Acronis True Image 19

Příručka nastavení funkcí snímání

Transkript:

Datová úložiště v MetaCentru a okolí II David Antoš Oddělení datových úložišť

Přehled úložiště v MetaCentru proč (většinou) nemám počítat nad daty ze /storage? proč je v Brně plné pole? jak mám přesouvat větší data? úložiště v okolí hierarchická datová úložiště CESNET a CERIT-SC na co je mám použít v MetaCentru? na co je mohu používat i jinde? D.A. (CESNET) Datová úložiště v MetaCentru a okolí II 2 / 24

Úložiště v MetaCentru scratche svazky /storage těch máme hodně domovské adresáře na clusterech /software, /packages (AFS) hierarchické úložiště (HSM) pro archivní data D.A. (CESNET) Datová úložiště v MetaCentru a okolí II 3 / 24

Úložiště v MetaCentru scratche svazky /storage těch máme hodně domovské adresáře na clusterech /software, /packages (AFS) hierarchické úložiště (HSM) pro archivní data těch ale je! mají různé vlastnosti, které potřebujeme důsledek: je potřeba o nich vědět D.A. (CESNET) Datová úložiště v MetaCentru a okolí II 3 / 24

Scratch (lokální) úložiště dat při běhu úlohy na výpočetním uzlu použití: stage-in/stage-out typy /scratch.ssd (SSD, malé, velmi rychlé) /scratch (lokální rotační HD) /scratch.shared (sdílený na clusteru) volbou typu ssd nebo shared omezíte možné stroje novinka: do /scratch*/$user nelze zapisovat (práva 555) úlohy mohou používat /scratch*/$user/job_jobid jeho hodnotu zjistí v proměnné $SCRATCHDIR vychovaná úloha po sobě scratch smaže po nevychovaných úlohách se scratch maže po 14 dnech D.A. (CESNET) Datová úložiště v MetaCentru a okolí II 4 / 24

Scratch 2 při zadání úlohy lze vyžádat kapacitu a případně typ např. -l scratch=10gb:ssd -l scratch=10gb vybere nejrychlejší dostupný typ v plánovači jsou skripty pro přesuny dat do scratche a zpět viz dokumentace na wiki MetaCentra D.A. (CESNET) Datová úložiště v MetaCentru a okolí II 5 / 24

Svazky /storage disková pole v každém městě adresáře uživatelů /storage/město/home/uživatel jsou dostupné ze všech strojů s vlastností nfs4 tj. téměř odevšad autentizace Kerberem potřebujete lístky dají se připojit i na vlastní pracovní stanici přes NFSv4 na jednotlivá úložiště můžete přistupovat i přes ssh, scp, SFTP v návodech je přehled, jak se jmenují stroje D.A. (CESNET) Datová úložiště v MetaCentru a okolí II 6 / 24

Svazky /storage Your Home Directories ---------------------- Size AvailS.Quota Used Directory 85T 5.9T 5T 3G /storage/brno1/home/antos 110T 4.7T 3T 278M /storage/brno2/home/antos 260T 35T 1T 256k /storage/brno3-cerit/home/anto.. 44T 32T 3T 28k /storage/budejovice1/home/anto.. 374T 356T 1T 0 /storage/jihlava1-cerit/home/a.. 88T 88T 3T 4k /storage/ostrava1/home/antos 44T 31T 1T 1M /storage/plzen1/home/antos 51T 33T 3T 84k /storage/praha1/home/antos D.A. (CESNET) Datová úložiště v MetaCentru a okolí II 7 / 24

/storage doporučení který /storage mám používat nějaký volný pro velké soubory to není kritické pro malé soubory fyzicky nejbližší ke clusteru fyzicky nejbližší /storage je použit jako /home clusteru pro co se /storage nehodí pro přímé výpočty nad daty s výjimkou sekvenčního čtení velkých souborů archivy, dlouho nepoužívaná data na to máme hierarchické úložiště D.A. (CESNET) Datová úložiště v MetaCentru a okolí II 8 / 24

/software, /packages (/afs) dnes již výhradně pro instalace software autentizace Kerberem umožňuje velmi detailní správu přístupových práv lze připojit k vlastní stanici D.A. (CESNET) Datová úložiště v MetaCentru a okolí II 9 / 24

Přístupová práva, kvóty přístupová práva klasická unixová (standardně rwxr-xr-x) ACL na AFS ACL na NFS kvóty soft quota vs. limit přehled je na osobní stránce na webu je autoritativní zdroj na starších systémech program quota dává nesmyslné výstupy lze požádat o změnu D.A. (CESNET) Datová úložiště v MetaCentru a okolí II 10 / 24

Přesuny dat, doporučení velká data stovky GB a více pokud potřebujete větší přesuny dat, vezměte si interaktivní úlohy (ne přímo na frontendu) lze použít cp mezi připojenými adresáři lze kopírovat data přímo z úložiště pro přesuny opravdu velkých dat (více TB) se domluvte s uživatelskou podporou archivní data přesuňte na hierarchická úložiště D.A. (CESNET) Datová úložiště v MetaCentru a okolí II 11 / 24

Hierarchická úložiště celková hrubá kapacita cca 21 PB Plzeň (od pol. 2012) v areálu ZČU cca 500 TB disků, 4800 TB pásek, 3584 TB SGI COPAN SGI Data Migration Facility, CXFS Jihlava (2013) Krajský úřad Jihlava 1041 TB disků, 3744 TB pásek, 2934 TB MAID Brno (2013) rektorát VUT Brno 498 TB disků, 3500 TB pásek, 2116 TB MAID řešení IBM založené na GPFS a TSM D.A. (CESNET) Datová úložiště v MetaCentru a okolí II 12 / 24

Úložiště jsou hierarchická vrstvy médií různé kapacity a rychlosti rychlé disky/pomalejší disky/maid/pásky drahý provoz levnější provoz a automatizovaný systém pro přesuny dat mezi nimi déle nepoužívaná data do pomalejších vrstev pro uživatele transparentní, resp. téměř transparentní přístup k dlouho nepoužitému souboru trvá déle uživatelům to obvykle nevadí D.A. (CESNET) Datová úložiště v MetaCentru a okolí II 13 / 24

Možnosti využití datových úložišť zálohy uživatelé mají primární data u sebe na úložiště odkládají zálohu pro případ havárie archivace uživatelé na úložiště odkládají cenná primární data data nejsou často využívána uživatelé nemají prostředky pro jejich uchovávání sdílení dat distribuovaný tým potřebuje společně pracovat nad většími objemy dat, případně je zveřejňovat něco jiného distribuce obsahu, jiné speciální aplikace D.A. (CESNET) Datová úložiště v MetaCentru a okolí II 14 / 24

Knihovna v Plzni D.A. (CESNET) Datová úložiště v MetaCentru a okolí II 15 / 24

Zaplnění úložiště v Plzni D.A. (CESNET) Datová úložiště v MetaCentru a okolí II 16 / 24

Přenos dat na HSM souborové NFSv4 přímo připojeno do MetaCentra rsync, scp, FTPS Globus vysokorychlostní přenosy řízené webovým rozhraním speciální gridové úložiště v systému dcache FileSender jednorázový přenos souborů http://filesender.cesnet.cz owncloud D.A. (CESNET) Datová úložiště v MetaCentru a okolí II 17 / 24

FileSender webová služba pro jednorázový přenos (velkých) souborů velkých: aktuálně 500 GB přispíváme i k jeho vývoji alespoň jedna strana komunikace musí být oprávněný uživatel infrastruktury autentizace federací eduid.cz oprávněný uživatel může nahrát soubor a poslat mu oznámení lze poslat komukoli pozvánku připravujeme upload z dávkové úlohy D.A. (CESNET) Datová úložiště v MetaCentru a okolí II 18 / 24

owncloud cloudové úložiště se synchronizací souborů pro osobní počítače (Windows, Linux, Mac OS X) mobilní Android, Apple (klient pod 1 Euro) a webové rozhraní data se synchronizují přes úložiště na počítači jsou i lokálně, na mobilní při otevření data lze sdílet konkrétní osobě nebo kdo zná odkaz kalendář, kontakty registrace federací na http://owncloud.cesnet.cz standardní limit 100 GB na uživatele D.A. (CESNET) Datová úložiště v MetaCentru a okolí II 19 / 24

owncloud počet uživatelů D.A. (CESNET) Datová úložiště v MetaCentru a okolí II 20 / 24

Správa uživatelských účtů systém Perun uživatel (osoba) má (ideálně) jedinou identitu v infrastruktuře potřebujeme ověření identity a příslušnosti k oprávněné instituci proč to? zodpovídáme v projektu za to, komu služby poskytujeme (akademické komunitě), řídíme mnoho různých služeb na identitu uživatele jsou navázány jednotlivé mechanismy přístupu ke zdrojům řízeno členstvím ve virtuálních organizacích D.A. (CESNET) Datová úložiště v MetaCentru a okolí II 21 / 24

Jak se stát uživatelem nedělat nic owncloud, FileSender přihlašte se federací uživatelé MetaCentra už úložiště používají přímo přímo připojeno na clustery MetaCentra (NFSv4) uživatelé MetaCentra tam mají adresáře podporu zajišťuje MetaCentrum tj. meta@cesnet.cz i nepřímo zálohy z MetaCentra připojeno jako /storage/plzen2-archive/home/... ale pozor, neukládejte data do home, ale do prostoru VO MetaCentrum D.A. (CESNET) Datová úložiště v MetaCentru a okolí II 22 / 24

Jak se stát uživatelem speciální požadavky pokud chcete využívat souborové protokoly ve větší míře napište nám na du-support@cesnet.cz domluvíme se, co potřebujete opravdu to potřebujeme pochopit kolik dat máte, jak s nimi pracujete,... připravíme konfiguraci úložiště založíme virtuální organizaci pozveme vás do ní a povýšíme na administrátora dál si uživatele spravujete sami, vytváříte skupiny,... ukládáte data přes FTP/rsync/NFSv4/... my se staráme, aby na se vytvářely jejich repliky,... D.A. (CESNET) Datová úložiště v MetaCentru a okolí II 23 / 24

Shrnutí pro efektivní práci s daty je třeba mít představu o možnostech jejich ukládání máme hierarchická úložiště pro archivní data přímo přístupná z MetaCentra uživatelskou podporu zajišťuje MetaCentrum standardními kanály i pro další použití podrobnější informace viz http://du.cesnet.cz a du-support@cesnet.cz D.A. (CESNET) Datová úložiště v MetaCentru a okolí II 24 / 24