Datová úložiště CESNET. David Antoš



Podobné dokumenty
Datová úložiště CESNET. David Antoš

Způsoby využití datových úložišť CESNET. David Antoš

Datová úložiště CESNET. David Antoš

Způsoby využití datových úložišť CESNET. Petr Benedikt

Způsoby využití datových úložišť CESNET

Datová úložiště CESNET

Datová úložiště v MetaCentru a okolí. David Antoš

Způsoby využití datových úložišť CESNET

Způsoby využití datových úložišť CESNET

Datová úložiště v MetaCentru a okolí II. David Antoš Oddělení datových úložišť

Datová úložiště CESNET

DATOVÁ ÚLOŽIŠTĚ CESNET

DATOVÁ ÚLOŽIŠTĚ. David Antoš CESNET

Datová úloºi²t CESNET

Datová úloºi²t CESNET

Jakub Šesták. ESEJ DO PŘEDMĚTU DIGITÁLNÍ KNIHOVNY

Zp soby vyuºití datových úloºi² CESNET. Michal Strnad

CESNET - Datová úložiště

Virtualizace MetaCentra

CESNET, GRIDy a přenosy dat

Cloudy a gridy v národní einfrastruktuře

MetaCentrum. Martin Kuba CESNET

Výpočetní zdroje v MetaCentru a jejich využití

aktivita CESNETu společně MU, UK a ZČU sdružuje výpočetní prostředky

Souborové systémy a práce s daty David Antoš

METACentrum Český národní gridovýprojekt. Projekt METACentrum. Jan Kmuníček ÚVT MU & CESNET. meta.cesnet.cz

JSEM ELEKTRONICKÁ IDENTITA. VĚŘÍTE MI? Jiří Bořík CESNET Olomouc

MetaCentrum a e-infrastruktura CESNET

CERIT SCIENTIFIC CLOUD. Centrum CERIT-SC. Luděk Matyska. Praha, Seminář MetaCentra,

MetaCentrum. Miroslav Ruda. listopad 2013 CESNET

Konsolidace zálohování a archivace dat Připojení k DÚ CESNET

Služby ÚVT pro VaV & IT pro CEITEC. David Antoš

Souhrnný pohled na služby e-infrastruktury CESNET

Služby e-infrastruktury CESNET

METACentrum zastřešení českých gridových aktivit

Služby e-infrastruktury CESNET

Aktuální stav. Martin Kuba CESNET a ÚVT MU

MetaCentrum. Miroslav Ruda. březen 2017, Brno CESNET

MetaCentrum. Miroslav Ruda. Skalský Dvůr, Miroslav Ruda (MetaCentrum) MetaCentrum Skalský Dvůr, / 11

MetaCentrum. Tomáš Rebok MetaCentrum NGI, CESNET z.s.p.o. CERIT-SC, Masarykova Univerzita Olomouc,

DIGITÁLNÍ IDENTITY. Jiří Bořík CESNET. konference e-infrastruktury CESNET 2019 Praha

Datová úloºi²t CESNET

Souhrnný pohled na služby e-infrastruktury CESNET

Souhrnný pohled na služby e-infrastruktury CESNET

METACENTRUM. Miroslav Ruda CESNET. Seminář MetaCentra, Praha

Souhrnný pohled na služby e-infrastruktury CESNET

Provozní řád zálohování virtuální infrastrukury

Služby e-infrastruktury CESNET a IPv6

Služby e-infrastruktury CESNET. Tomáš Košňar CESNET z. s. p. o.

CESNET. Národní e-infrastruktura. Ing. Jan Gruntorád, CSc. ředitel CESNET, z.s.p.o.

Představení e-infrastruktury CESNET Ing. Jan Gruntorád, CSc. ředitel CESNET, z.s.p.o.

Gridy v České republice. Luděk Matyska Masarykova univerzita v Brně CESNET, z.s.p.o.

Hardware - minulý rok

Souhrnný pohled na služby e-infrastruktury CESNET

Souhrnný pohled na služby e-infrastruktury CESNET

DIGITÁLNÍ IDENTITY. Jiří Bořík CESNET. CESNET Day České Budějovice

Cloud Slovník pojmů. J. Vrzal, verze 0.9

Bezpečnost v Gridech. Daniel Kouřil EGEE kurz 12. prosince Enabling Grids for E-sciencE.

Datová úložiště. Zdroj: IBM

CESNET A SÍŤ ZČU. Michal Petrovič

Výběr zdrojů, zadávání a správa úloh v MetaCentru

DATOVÁ ÚLOŽIŠTĚ CESNET, FAIR DATA

Realizace datového centra kraje Vysočina Regionální SAN kraje Vysočina

Národní e-infrastruktura v ČR

Historie, současnost a budoucnost sdružení CESNET. Ing. Jan Gruntorád, CSc. ředitel CESNET, z.s.p.o Praha

MetaCentrum. Martin Kuba CESNET

Souhrnný pohled na služby e-infrastruktury CESNET

Služby e-infrastruktury CESNET

C1A I. CELOSTÁTNÍ DOROSTENECKÁ LIGA - U19

Nasazení jednotné správy identit a řízení přístupu na Masarykově univerzitě s využitím systému Perun. Slávek Licehammer

Data Protection Delivery Center, s. r. o. JEDNODUCHOST, SPOLEHLIVOST a VÝKONNOST. DPDC Protection. zálohování dat

7. října 2008, Systémy pro zpřístupňování evškp Miroslav Křipač Michal Brandejs, Jitka Brandejsová, Jan Kasprzak, Martin Stančík

Projekt EGEE / EGI. Jan Kmuníček CESNET. Enabling Grids for E-sciencE. EGEE-III INFSO-RI

2012 (červen) Microsoft Sharepoint Portal Server. Microsoft Live Communications Server 2003 Řešení pro online komunikaci. Microsoft Exchange

DATA ULOŽENÁ NA VĚČNÉ ČASY. (ICZ DESA / Microsoft Azure) Mikulov Michal Matoušek (ICZ) / Václav Koudele (Microsoft)

Portfolio úložišť WD pro datová centra Kapacitní úložiště prošlo vývojem

Novinky z vývoje v MetaCentru

1. Organizace dokumentu. 2. Zabezpečení jako priorita. 3. Cloudová infrastruktura Hybrid Ads

TSM for Virtual Environments Data Protection for VMware v6.3. Ondřej Bláha CEE+R Tivoli Storage Team Leader. TSM architektura IBM Corporation

Koncepce rozvoje sdružení CESNET do roku 2015

Zadavatel: CESNET, zájmové sdružení právnických osob se sídlem Zikova 4, Praha 6 IČ:

Versiondog Co je nového

MARIE PACS S PACSem hezky od podlahy když se data sypou!

METACENTRUM. Miroslav Ruda CESNET. Konference CESNET, Praha

ZPRAVODAJ. Centra výpočetní techniky

Jednotlivé hovory lze ukládat nekomprimované ve formátu wav. Dále pak lze ukládat hovory ve formátu mp3 s libovolným bitrate a také jako text.

Konsolidace zálohování a archivace dat

CEITEC a jeho IT požadavky. RNDr. Radka Svobodová Vařeková, Ph.D.

MetaCentrum a náro (nejen matematické) výpočty

POZVÁNKA NA KURZY. Literatura Ke všem kurzům jsou poskytovány metodické příručky pro školství v elektronické podobě.

eduroam v kostce aneb šest pohledů na mobilní wifi CESNET Day v Liberci

Alternativy k SAP HANA appliance? Představení možnosti TDI a cloudové infrastruktury

Střední úložiště. Uživatelská dokumentace Zřízení přístupu

EU EGEE Presentace projektu

Důvěryhodná výpočetní základna v prostředí rozsáhlých IS státní správy

Enabling Grids for E-sciencE. Projekt EGEE / VOCE. Jan Kmuníček ÚVT MU & CESNET. INFSO-RI

Efektivní ochrana dat ve virtualizovaném prostředí. Marek Bradáč

Zálohování v Linuxu: která možnost je ta správná?

TECHNICKÁ SPECIFIKACE

SUPERPOČÍTAČOVÉ CENTRUM. Luděk Matyska

Transkript:

Datová úložiště CESNET David Antoš

Přehled proč má smysl budovat národní datová úložiště pro vědecká data budovaná infrastruktura jak úložiště použít přístupové mechanismy správa uživatelů na úložištích použití pro náročnější uživatele speciální aplikace D.A. (CESNET) Datová úložiště CESNET 2 / 24

Smysl externího úložiště uživatelé raději drží data na vlastním zařízení... to ale nedává rozumné garance dlouhodobého uchovávání používají se nevhodná média, chybí systematická péče data je lépe uchovávat v živém systému konsolidace zdrojů národní úložiště vědeckých dat umožňuje pořídit zařízení dostatečné velikosti spravované specializovaným týmem s možností sdílení dat mezi skupinami uživatelů D.A. (CESNET) Datová úložiště CESNET 3 / 24

Cíl: dlouhodobé uchování dat potřeba dlouhodobě uchovávat vědecká data vzrůstá uchování primárních dat z experimentů a výpočtů s ohledem na potenciál jejich dalšího využití k návratu a revizi publikovaných výsledků uchování zajišťujeme na úrovni zachování binárních dat (bitstream) správce úložiště nerozumí odborné povaze dat ani nemůže rozhodovat o smysluplnosti jejich archivace proto neděláme LTP (Long-Term Preservation) bitstream je nicméně předpokladem pro uchování dat další kopie, geografické repliky, redundance v systému D.A. (CESNET) Datová úložiště CESNET 4 / 24

Možnosti využití datových úložišť zálohy uživatelé mají primární data u sebe na úložiště odkládají zálohu pro případ havárie archivace uživatelé na úložiště odkládají cenná primární data data nejsou často využívána uživatelé nemají prostředky pro jejich uchovávání sdílení dat distribuovaný tým potřebuje společně pracovat nad většími objemy dat, případně je zveřejňovat něco jiného distribuce obsahu, jiné speciální aplikace D.A. (CESNET) Datová úložiště CESNET 5 / 24

Možnosti využití datových úložišť a naopak: na co se vzdálené úložiště příliš nehodí interaktivní práce zejména s velkým množstvím malých souborů ukládání dat s potřebou přístupu v reálném čase prioritou je spolehlivost uložení přímý provoz systémů s nutností 24/7 přístupu toto není úložiště pod váš SAP na to je obecně vzdálené úložiště nevhodné vhodné použití pro podobné scénáře primární 24/7 data u uživatele, na CESNET zálohy/repliky rozdělení životně důležitých dat vs. nice to have dat D.A. (CESNET) Datová úložiště CESNET 6 / 24

Infrastruktura Děčín Liberec Plzeň Praha Hradec Králové Pardubice PIONIER Opava Karviná Ostrava Olomouc AMS-IX NIX Jihlava Zlín České Budějovice Brno GÉANT Internet ACONET SANET D.A. (CESNET) Datová úložiště CESNET 7 / 24

Infrastruktura trojice úložišť: Plzeň, Jihlava, Brno celková hrubá kapacita cca 21 PB Plzeň v rutinním provozu v areálu ZČU cca 500 TB disků, 4800 TB pásek, 3584 TB SGI COPAN SGI Data Migration Facility, CXFS Jihlava a Brno v pilotním provozu Krajský úřad Jihlava, rektorát VUT Brno Jihlava 1041 TB disků, 3744 TB pásek, 2934 TB MAID Brno 498 TB disků, 3500 TB pásek, 2116 TB MAID řešení IBM založené na GPFS a TSM D.A. (CESNET) Datová úložiště CESNET 8 / 24

Knihovna v Plzni D.A. (CESNET) Datová úložiště CESNET 9 / 24

Úložiště jsou hierarchická vrstvy médií různé kapacity a rychlosti rychlé disky/pomalejší disky/maid/pásky drahý provoz levnější provoz a automatizovaný systém pro přesuny dat mezi nimi déle nepoužívaná data do pomalejších vrstev pro uživatele transparentní, resp. téměř transparentní přístup k dlouho nepoužitému souboru trvá déle uživatelům to obvykle nevadí D.A. (CESNET) Datová úložiště CESNET 10 / 24

Zaplnění archivu v Plzni D.A. (CESNET) Datová úložiště CESNET 11 / 24

Jak na úložiště přenášet data motivace úložiště musí podporovat řadu přístupových protokolů možnosti a potřeby uživatelů nelze shrnout pod jedno univerzální od protokolů poskytujících souborový systém dává aplikaci iluzi lokálního disku ale platí se výkonem (za bohatost POSIX rozhraní) přes jednoduchou put/get sémantiku použitelné pro stage-in/out práci nebo speciální aplikace speciální rozhraní webové, synchronizační aplikace D.A. (CESNET) Datová úložiště CESNET 12 / 24

Přenos dat na úložiště souborové NFSv4 (známé uživatelům MetaCentra) rsync, scp, FTPS obvykle autentizované systémem Kerberos existují GUI klienti i nástroje pro příkazovou řádku pro hlavní platformy Globus Online vysokorychlostní přenosy výhledově CIFS (známý síťový disk z Windows) speciální aplikace gridové úložiště v systému dcache FileSender owncloud bloková zařízení (není preferováno) D.A. (CESNET) Datová úložiště CESNET 13 / 24

FileSender webová služba pro jednorázový přenos (velkých) souborů velkých : aktuálně 500 GB přispíváme i k jeho vývoji http://filesender.cesnet.cz alespoň jedna strana komunikace musí být oprávněný uživatel infrastruktury autentizace federací eduid.cz oprávněný uživatel může nahrát soubor a poslat mu oznámení lze poslat komukoli pozvánku testovací verze na http://filesender2.cesnet.cz D.A. (CESNET) Datová úložiště CESNET 14 / 24

owncloud cloudové úložiště se synchronizací souborů pro osobní počítače (Windows, Linux, Mac OS X) mobilní Android, Apple (klient pod 1 Euro) a webové rozhraní data se synchronizují přes úložiště na počítači jsou i lokálně, na mobilní při otevření data lze sdílet konkrétní osobě nebo kdo zná odkaz kalendář, kontakty registrace federací na http://owncloud.cesnet.cz standardní limit 100 GB na uživatele D.A. (CESNET) Datová úložiště CESNET 15 / 24

Další speciální protokoly/aplikace GlobusOnline klikací FTP na steroidech kopírování velkého objemu dat řízené pomocí webového rozhraní mezi koncovými body úložišti podporujícími GlobusOnline nebo lokálním strojem dcache jeden ze systémů správy dat vyvinutých pro CERN pro ukládání PB objemů D.A. (CESNET) Datová úložiště CESNET 16 / 24

Jak se stát uživatelem snadno pokud chcete využívat souborově orientované protokoly dostačuje prefabrikovaná politika migrací dat ukládáte jen individuální data potřebujete ukládat nejvýše jednotky TB tak se jen zaregistrujte na http://du.cesnet.cz vyžaduje to ověření uživatele z akademické instituce členství se po roce prodlužuje jako indikace, že uživatel ještě ví o svých datech kódové označení: VO Storage D.A. (CESNET) Datová úložiště CESNET 17 / 24

Jak se stát uživatelem snadno 2 pokud potřebujete (třeba okamžitě) i výpočetní zdroje a vyhovují podmínky podobné jako ve VO Storage tak se zaregistrujte do MetaCentra na http://metavo.metacentrum.cz/ jestli to nestačí, tak... D.A. (CESNET) Datová úložiště CESNET 18 / 24

Jak se stát uživatelem snadno 2 pokud potřebujete (třeba okamžitě) i výpočetní zdroje a vyhovují podmínky podobné jako ve VO Storage tak se zaregistrujte do MetaCentra na http://metavo.metacentrum.cz/ jestli to nestačí, tak... ale až za chvilku D.A. (CESNET) Datová úložiště CESNET 18 / 24

Správa uživatelských účtů systém Perun uživatel (osoba) má (ideálně) jedinou identitu v infrastruktuře potřebujeme ověření identity a příslušnosti k oprávněné instituci proč to? zodpovídáme v projektu za to, komu služby poskytujeme (akademické komunitě), řídíme mnoho různých služeb na identitu uživatele jsou navázány jednotlivé mechanismy přístupu ke zdrojům řízeno členstvím ve virtuálních organizacích uživatelé vše řídí přes webové rozhraní D.A. (CESNET) Datová úložiště CESNET 19 / 24

Úložiště pro náročnější nestačí VO Storage? založíme vám virtuální organizaci! VO je skupina uživatelů se společným zájmem, kteří vystupují jako celek VO má správce, který jedná s poskytovatelem zdrojů rozhoduje o podmínkách členství jednotlivých uživatelů dohoda o poskytování zdrojů mezi VO a správcem zdroje popisuje nastavení technických parametrů velikost poskytovaného prostoru použité přístupové protokoly politika ukládání dat, počty kopií/replik VO může využívat různé typy zdrojů D.A. (CESNET) Datová úložiště CESNET 20 / 24

Založení VO prakticky napište nám na du-support@cesnet.cz domluvíme se, co potřebujete opravdu to potřebujeme pochopit kolik dat máte, jak s nimi pracujete,... připravíme konfiguraci úložiště založíme virtuální organizaci pozveme vás do ní a povýšíme na administrátora dál si uživatele spravujete sami, vytváříte skupiny,... ukládáte data přes FTP/rsync/NFSv4/... my se staráme, aby na se vytvářely jejich repliky,... D.A. (CESNET) Datová úložiště CESNET 21 / 24

Aktuální stav úložiště v Plzni v běžném provozu přichází na něj uživatelé individuální se mohou přihlásit do VO Storage připojeno do MetaCentra úložiště v Jihlavě a Brně v provozu FileSender v provozu, owncloud v pilotním provozu postupně obsluhujeme zájemce o náročnější využívání vždy vyžaduje komunikaci pro velká data (desítky TB+): nezbytná technická znalost uživatelů D.A. (CESNET) Datová úložiště CESNET 22 / 24

Výhled cílem je udržet úložiště s otevřeným přístupem pro vědeckou komunitu ideové pilíře rozvoje 1. technologie a její provoz 2. organizace dat (Hadoop, databáze) 3. aplikace analýza velkých dat včetně schopnosti fungovat jako testovací prostředí pro takové aplikace 4. dlouhodobé uchování dat poskytnutí nástrojů pro práci aplikačního knihovníka body 2 a 3 v úzké spolupráci s národním gridem MetaCentrum D.A. (CESNET) Datová úložiště CESNET 23 / 24

Kontakty http://du.cesnet.cz uživatelská podpora: du-support@cesnet.cz D.A. (CESNET) Datová úložiště CESNET 24 / 24