Způsoby využití datových úložišť CESNET. David Antoš

Podobné dokumenty
Způsoby využití datových úložišť CESNET

Datová úložiště CESNET. David Antoš

Datová úložiště CESNET. David Antoš

Způsoby využití datových úložišť CESNET. Petr Benedikt

Datová úložiště CESNET

Způsoby využití datových úložišť CESNET

Datová úložiště CESNET. David Antoš

Způsoby využití datových úložišť CESNET

Datová úložiště CESNET

DATOVÁ ÚLOŽIŠTĚ. David Antoš CESNET

Datová úložiště v MetaCentru a okolí II. David Antoš Oddělení datových úložišť

DATOVÁ ÚLOŽIŠTĚ CESNET

Datová úložiště v MetaCentru a okolí. David Antoš

Datová úloºi²t CESNET

Datová úloºi²t CESNET

Zp soby vyuºití datových úloºi² CESNET. Michal Strnad

Jakub Šesták. ESEJ DO PŘEDMĚTU DIGITÁLNÍ KNIHOVNY

CESNET - Datová úložiště

Virtualizace MetaCentra

Výpočetní zdroje v MetaCentru a jejich využití

METACentrum Český národní gridovýprojekt. Projekt METACentrum. Jan Kmuníček ÚVT MU & CESNET. meta.cesnet.cz

Služby e-infrastruktury CESNET

Cloudy a gridy v národní einfrastruktuře

MetaCentrum a e-infrastruktura CESNET

MetaCentrum. Martin Kuba CESNET

JSEM ELEKTRONICKÁ IDENTITA. VĚŘÍTE MI? Jiří Bořík CESNET Olomouc

Souborové systémy a práce s daty David Antoš

MetaCentrum. Miroslav Ruda. březen 2017, Brno CESNET

aktivita CESNETu společně MU, UK a ZČU sdružuje výpočetní prostředky

Služby ÚVT pro VaV & IT pro CEITEC. David Antoš

Konsolidace zálohování a archivace dat Připojení k DÚ CESNET

CESNET, GRIDy a přenosy dat

METACentrum zastřešení českých gridových aktivit

MetaCentrum. Miroslav Ruda. listopad 2013 CESNET

CERIT SCIENTIFIC CLOUD. Centrum CERIT-SC. Luděk Matyska. Praha, Seminář MetaCentra,

Souhrnný pohled na služby e-infrastruktury CESNET

Provozní řád zálohování virtuální infrastrukury

Souhrnný pohled na služby e-infrastruktury CESNET

Aktuální stav. Martin Kuba CESNET a ÚVT MU

METACENTRUM. Miroslav Ruda CESNET. Seminář MetaCentra, Praha

Souhrnný pohled na služby e-infrastruktury CESNET

DIGITÁLNÍ IDENTITY. Jiří Bořík CESNET. konference e-infrastruktury CESNET 2019 Praha

Souhrnný pohled na služby e-infrastruktury CESNET

MetaCentrum. Tomáš Rebok MetaCentrum NGI, CESNET z.s.p.o. CERIT-SC, Masarykova Univerzita Olomouc,

DATOVÁ ÚLOŽIŠTĚ CESNET, FAIR DATA

Služby e-infrastruktury CESNET. Tomáš Košňar CESNET z. s. p. o.

Souhrnný pohled na služby e-infrastruktury CESNET

Datová úloºi²t CESNET

Souhrnný pohled na služby e-infrastruktury CESNET

MetaCentrum. Miroslav Ruda. Skalský Dvůr, Miroslav Ruda (MetaCentrum) MetaCentrum Skalský Dvůr, / 11

Služby e-infrastruktury CESNET a IPv6

Služby e-infrastruktury CESNET

Historie, současnost a budoucnost sdružení CESNET. Ing. Jan Gruntorád, CSc. ředitel CESNET, z.s.p.o Praha

Nasazení jednotné správy identit a řízení přístupu na Masarykově univerzitě s využitím systému Perun. Slávek Licehammer

Souhrnný pohled na služby e-infrastruktury CESNET

Hardware - minulý rok

DIGITÁLNÍ IDENTITY. Jiří Bořík CESNET. CESNET Day České Budějovice

Představení e-infrastruktury CESNET Ing. Jan Gruntorád, CSc. ředitel CESNET, z.s.p.o.

Datová úložiště. Zdroj: IBM

Gridy v České republice. Luděk Matyska Masarykova univerzita v Brně CESNET, z.s.p.o.

Střední úložiště. Uživatelská dokumentace Zřízení přístupu

Cloud Slovník pojmů. J. Vrzal, verze 0.9

Národní e-infrastruktura v ČR

CESNET. Národní e-infrastruktura. Ing. Jan Gruntorád, CSc. ředitel CESNET, z.s.p.o.

Služby e-infrastruktury CESNET

Konsolidace zálohování a archivace dat

Integrace datových služeb vědecko-výukové skupiny

Bezpečnost v Gridech. Daniel Kouřil EGEE kurz 12. prosince Enabling Grids for E-sciencE.

DATA ULOŽENÁ NA VĚČNÉ ČASY. (ICZ DESA / Microsoft Azure) Mikulov Michal Matoušek (ICZ) / Václav Koudele (Microsoft)

METACENTRUM. Miroslav Ruda CESNET. Konference CESNET, Praha

TSM for Virtual Environments Data Protection for VMware v6.3. Ondřej Bláha CEE+R Tivoli Storage Team Leader. TSM architektura IBM Corporation

Výběr zdrojů, zadávání a správa úloh v MetaCentru

Koncepce rozvoje knihoven ČR na léta Priorita 2: Trvalé uchování digitálních dokumentů

Data Protection Delivery Center, s. r. o. JEDNODUCHOST, SPOLEHLIVOST a VÝKONNOST. DPDC Protection. zálohování dat

Realizace datového centra kraje Vysočina Regionální SAN kraje Vysočina

1. Organizace dokumentu. 2. Zabezpečení jako priorita. 3. Cloudová infrastruktura Hybrid Ads

MetaCentrum. Martin Kuba CESNET

C1A I. CELOSTÁTNÍ DOROSTENECKÁ LIGA - U19

7. října 2008, Systémy pro zpřístupňování evškp Miroslav Křipač Michal Brandejs, Jitka Brandejsová, Jan Kasprzak, Martin Stančík

Efektivní ochrana dat ve virtualizovaném prostředí. Marek Bradáč

Dlouhodobé a důvěryhodné uchovávání elektronických dokumentů

Projekt EGEE / EGI. Jan Kmuníček CESNET. Enabling Grids for E-sciencE. EGEE-III INFSO-RI

EU EGEE Presentace projektu

ZPRAVODAJ. Centra výpočetní techniky

Služby datového centra

CEITEC a jeho IT požadavky. RNDr. Radka Svobodová Vařeková, Ph.D.

Novinky z vývoje v MetaCentru

Zálohovací stokrát jinak

Služby datového centra

Zadavatel: CESNET, zájmové sdružení právnických osob se sídlem Zikova 4, Praha 6 IČ:

Národní archiv v Praze PRŮZKUM SPISOVÉ SLUŽBY Pouze pro interní potřebu Národního archivu a příslušné organizace!

e-pv_kalkulace nákladů pro NK - osobní náklady

Czech National e-infrastructure. Projekt MetaCentrum. Jan Kmuníček CESNET. meta.cesnet.cz

CESNET A SÍŤ ZČU. Michal Petrovič

Portfolio úložišť WD pro datová centra Kapacitní úložiště prošlo vývojem

Jak spustit provoz v DR lokalitě snadno a rychle

Služby e-infrastruktury CESNET

SUPERPOČÍTAČOVÉ CENTRUM. Luděk Matyska

CESNET A SÍŤ ZČU. Michal Petrovič

Jednotlivé hovory lze ukládat nekomprimované ve formátu wav. Dále pak lze ukládat hovory ve formátu mp3 s libovolným bitrate a také jako text.

Transkript:

Způsoby využití datových úložišť CESNET David Antoš

Přehled infrastruktura dostupná na CESNETu služby úložišť podle různých typů použití smysl úložiště a zamýšlené použití synchronizace a sdílení dat zálohy, archivy, sdílení klasickými metodami speciální služby správa uživatelů a modely použití výhledy rozvoje služeb volitelná témata očekávané rychlosti přenosů dat velká data

Část I Infrastruktura

Infrastruktura Děčín Liberec Plzeň Praha Hradec Králové Pardubice PIONIER Opava Karviná Ostrava Olomouc AMS-IX NIX Jihlava Zlín České Budějovice Brno GÉANT Internet ACONET SANET

Infrastruktura celková hrubá kapacita cca 21 PB Plzeň (od pol. 2012) v areálu ZČU cca 500 TB disků, 4800 TB pásek, 3584 TB SGI COPAN SGI Data Migration Facility, CXFS Jihlava (2013) Krajský úřad Jihlava 1041 TB disků, 3744 TB pásek, 2934 TB MAID Brno (2013) rektorát VUT Brno 498 TB disků, 3500 TB pásek, 2116 TB MAID řešení IBM založené na GPFS a TSM

Knihovna v Plzni

Úložiště jsou hierarchická vrstvy médií různé kapacity a rychlosti rychlé disky/pomalejší disky/maid/pásky drahý provoz levnější provoz a automatizovaný systém pro přesuny dat mezi nimi déle nepoužívaná data do pomalejších vrstev pro uživatele transparentní, resp. téměř transparentní přístup k dlouho nepoužitému souboru trvá déle uživatelům to obvykle nevadí

Zaplnění archivu v Plzni

Část II Služby datových úložišť motivace

Smysl externího úložiště uživatelé raději drží data na vlastním zařízení... to ale nedává rozumné garance dlouhodobého uchovávání používají se nevhodná média, chybí systematická péče data je lépe uchovávat v živém systému konsolidace zdrojů národní úložiště vědeckých dat umožňuje pořídit zařízení dostatečné velikosti spravované specializovaným týmem s možností sdílení dat mezi skupinami uživatelů

Cíl: dlouhodobé uchování dat potřeba dlouhodobě uchovávat vědecká data vzrůstá uchování primárních dat z experimentů a výpočtů s ohledem na potenciál jejich dalšího využití k návratu a revizi publikovaných výsledků uchování zajišťujeme na úrovni zachování binárních dat (bitstream) správce úložiště nerozumí odborné povaze dat ani nemůže rozhodovat o smysluplnosti jejich archivace proto neděláme LTP (Long-Term Preservation) bitstream je nicméně předpokladem pro uchování dat další kopie, geografické repliky, redundance v systému

Organizačně-právní pohled data uživatelů zásadně patří uživatelům srovnejte s provozními podmínkami komerčních poskytovatelů

Část III Služby datových úložišť

Jednorázové zaslání souboru FileSender: webová služba pro jednorázový přenos (velkých) souborů velkých : aktuálně 500 GB přispíváme i k jeho vývoji http://filesender.cesnet.cz alespoň jedna strana komunikace musí být oprávněný uživatel infrastruktury autentizace federací eduid.cz oprávněný uživatel může nahrát soubor a poslat mu oznámení lze poslat komukoli pozvánku testovací verze na http://filesender2.cesnet.cz

Synchronizace a sdílení dat pokud hledáte způsob, jak synchronizovat data mezi svými počítači i mobilními zařízeními mít je zároveň dostupná přes web moci data sdílet a přitom owncloud data nejsou příliš velká

owncloud cloudové úložiště se synchronizací souborů pro osobní počítače (Windows, Linux, Mac OS X) mobilní Android, Apple (klient pod 1 Euro) a webové rozhraní data se synchronizují přes úložiště na počítači jsou i lokálně, na mobilní při otevření data lze sdílet konkrétní osobě nebo kdo zná odkaz kalendář, kontakty registrace federací na http://owncloud.cesnet.cz standardní limit 100 GB na uživatele

owncloud počet uživatelů

Klasické možnosti využití úložišť zálohy uživatelé mají primární data u sebe na úložiště odkládají zálohu pro případ havárie buď pro zálohování jednotlivých strojů nebo i agregovaně IT oddělení zálohuje celou katedru archivace uživatelé na úložiště odkládají cenná primární data data nejsou často využívána uživatelé nemají prostředky pro jejich uchovávání individuální přístup koncových uživatelů vs. laboratorní archivář

Klasické možnosti využití úložišť sdílení dat distribuovaný tým potřebuje společně pracovat nad většími objemy dat, případně je zveřejňovat typicky koncoví uživatelé něco jiného distribuce obsahu, jiné speciální aplikace

Standardní přístup k souborům pokud chcete připojit souborový systém nebo přenášet soubory NFSv4 (známé uživatelům MetaCentra) rsync, scp, FTPS obvykle autentizované systémem Kerberos existují GUI klienti i nástroje pro příkazovou řádku pro hlavní platformy již letos CIFS (známý síťový disk z Windows) Globus vysokorychlostní přenosy

Globus dříve zvaný GlobusOnline klikací FTP na steroidech kopírování velkého objemu dat řízené pomocí webového rozhraní mezi koncovými body úložišti podporujícími Globus nebo lokálním strojem

Jak začít používat souborový přístup pokud chcete využívat souborově orientované protokoly dostačuje prefabrikovaná politika migrací dat ukládáte jen individuální data potřebujete ukládat nejvýše jednotky TB tak se jen zaregistrujte na http://du.cesnet.cz vyžaduje to ověření uživatele z akademické instituce členství se po roce prodlužuje jako indikace, že uživatel ještě ví o svých datech kódové označení: VO Storage

Jak se stát uživatelem snadno 2 pokud potřebujete (třeba okamžitě) i výpočetní zdroje a vyhovují podmínky podobné jako ve VO Storage tak se zaregistrujte do MetaCentra na http://metavo.metacentrum.cz/ jestli to nestačí, tak...

Jak se stát uživatelem snadno 2 pokud potřebujete (třeba okamžitě) i výpočetní zdroje a vyhovují podmínky podobné jako ve VO Storage tak se zaregistrujte do MetaCentra na http://metavo.metacentrum.cz/ jestli to nestačí, tak... ale až za chvilku

Správa uživatelských účtů systém Perun uživatel (osoba) má (ideálně) jedinou identitu v infrastruktuře potřebujeme ověření identity a příslušnosti k oprávněné instituci proč to? zodpovídáme v projektu za to, komu služby poskytujeme (akademické komunitě), řídíme mnoho různých služeb na identitu uživatele jsou navázány jednotlivé mechanismy přístupu ke zdrojům řízeno členstvím ve virtuálních organizacích uživatelé vše řídí přes webové rozhraní

Úložiště pro náročnější nestačí VO Storage? založíme vám virtuální organizaci! VO je skupina uživatelů se společným zájmem, kteří vystupují jako celek VO má správce, který jedná s poskytovatelem zdrojů rozhoduje o podmínkách členství jednotlivých uživatelů dohoda o poskytování zdrojů mezi VO a správcem zdroje popisuje nastavení technických parametrů velikost poskytovaného prostoru použité přístupové protokoly politika ukládání dat, počty kopií/replik VO může využívat různé typy zdrojů

Náročnější požadavky prakticky napište nám na du-support@cesnet.cz domluvíme se, co potřebujete opravdu to potřebujeme pochopit kolik dat máte, jak s nimi pracujete,... připravíme konfiguraci úložiště založíme virtuální organizaci organizační jednotka pro správu uživatelů pozveme vás do ní a povýšíme na administrátora dál si uživatele spravujete sami, vytváříte skupiny,... ukládáte data přes FTP/rsync/NFSv4/... my se staráme, aby na se vytvářely jejich repliky,...

Stav shrnutí naším dlouhodobým záměrem je spolupracovat se skupinami, které mají velká data pomoci s ukládáním pomoci se zpracováním naše úložiště jsou v běžném provozu zde popsané služby jsou k dispozici dva režimy služeb: přihlašte se vs. napište nám pro napište nám služby vždy potřebujeme pochopit záměry uživatele vyžaduje komunikaci a jisté úsilí na obou stranách

Výhled cílem je udržet úložiště s otevřeným přístupem pro vědeckou komunitu ideové pilíře rozvoje 1. technologie a její provoz 2. organizace dat (Hadoop, databáze) 3. aplikace analýza velkých dat včetně schopnosti fungovat jako testovací prostředí pro takové aplikace 4. dlouhodobé uchování dat poskytnutí nástrojů pro práci aplikačního knihovníka 5. Open Access repozitář publikací a dat body 2 a 3 v úzké spolupráci s národním gridem MetaCentrum

Kontakty http://du.cesnet.cz uživatelská podpora: du-support@cesnet.cz