Datová úložiště CESNET



Podobné dokumenty
Datová úložiště CESNET. David Antoš

Datová úložiště CESNET. David Antoš

Datová úložiště CESNET. David Antoš

Způsoby využití datových úložišť CESNET. David Antoš

Způsoby využití datových úložišť CESNET. Petr Benedikt

Způsoby využití datových úložišť CESNET

Datová úložiště CESNET

Datová úložiště v MetaCentru a okolí. David Antoš

Způsoby využití datových úložišť CESNET

DATOVÁ ÚLOŽIŠTĚ CESNET

Datová úložiště v MetaCentru a okolí II. David Antoš Oddělení datových úložišť

DATOVÁ ÚLOŽIŠTĚ. David Antoš CESNET

Způsoby využití datových úložišť CESNET

Datová úloºi²t CESNET

Datová úloºi²t CESNET

CESNET - Datová úložiště

Jakub Šesták. ESEJ DO PŘEDMĚTU DIGITÁLNÍ KNIHOVNY

Cloudy a gridy v národní einfrastruktuře

Virtualizace MetaCentra

Výpočetní zdroje v MetaCentru a jejich využití

Služby ÚVT pro VaV & IT pro CEITEC. David Antoš

JSEM ELEKTRONICKÁ IDENTITA. VĚŘÍTE MI? Jiří Bořík CESNET Olomouc

MetaCentrum. Martin Kuba CESNET

Služby e-infrastruktury CESNET

METACentrum Český národní gridovýprojekt. Projekt METACentrum. Jan Kmuníček ÚVT MU & CESNET. meta.cesnet.cz

Souborové systémy a práce s daty David Antoš

CESNET, GRIDy a přenosy dat

MetaCentrum. Miroslav Ruda. listopad 2013 CESNET

METACENTRUM. Miroslav Ruda CESNET. Seminář MetaCentra, Praha

METACentrum zastřešení českých gridových aktivit

MetaCentrum. Tomáš Rebok MetaCentrum NGI, CESNET z.s.p.o. CERIT-SC, Masarykova Univerzita Olomouc,

Služby e-infrastruktury CESNET a IPv6

Zp soby vyuºití datových úloºi² CESNET. Michal Strnad

Souhrnný pohled na služby e-infrastruktury CESNET

Souhrnný pohled na služby e-infrastruktury CESNET

Provozní řád zálohování virtuální infrastrukury

CERIT SCIENTIFIC CLOUD. Centrum CERIT-SC. Luděk Matyska. Praha, Seminář MetaCentra,

CESNET. Národní e-infrastruktura. Ing. Jan Gruntorád, CSc. ředitel CESNET, z.s.p.o.

Souhrnný pohled na služby e-infrastruktury CESNET

MetaCentrum a e-infrastruktura CESNET

Služby e-infrastruktury CESNET

aktivita CESNETu společně MU, UK a ZČU sdružuje výpočetní prostředky

DIGITÁLNÍ IDENTITY. Jiří Bořík CESNET. konference e-infrastruktury CESNET 2019 Praha

Souhrnný pohled na služby e-infrastruktury CESNET

Služby e-infrastruktury CESNET. Tomáš Košňar CESNET z. s. p. o.

Hardware - minulý rok

Aktuální stav. Martin Kuba CESNET a ÚVT MU

Gridy v České republice. Luděk Matyska Masarykova univerzita v Brně CESNET, z.s.p.o.

MetaCentrum. Miroslav Ruda. březen 2017, Brno CESNET

Souhrnný pohled na služby e-infrastruktury CESNET

Představení e-infrastruktury CESNET Ing. Jan Gruntorád, CSc. ředitel CESNET, z.s.p.o.

MetaCentrum. Miroslav Ruda. Skalský Dvůr, Miroslav Ruda (MetaCentrum) MetaCentrum Skalský Dvůr, / 11

Realizace datového centra kraje Vysočina Regionální SAN kraje Vysočina

Nasazení jednotné správy identit a řízení přístupu na Masarykově univerzitě s využitím systému Perun. Slávek Licehammer

Souhrnný pohled na služby e-infrastruktury CESNET

Bezpečnost v Gridech. Daniel Kouřil EGEE kurz 12. prosince Enabling Grids for E-sciencE.

C1A I. CELOSTÁTNÍ DOROSTENECKÁ LIGA - U19

Cloud Slovník pojmů. J. Vrzal, verze 0.9

MARIE PACS. Cloud computing a integrace v oblasti systémů PACS ehealth Days Výstaviště Brno,

Prostředí pro spolupráci Multimédia

Datové centrum a Regionální SAN kraje Vysočina. Projekt digitalizace a. Petr Pavlinec, KrÚ kraje Vysočina. Září 2009

CESNET A SÍŤ ZČU. Michal Petrovič

DIGITÁLNÍ IDENTITY. Jiří Bořík CESNET. CESNET Day České Budějovice

Novinky z vývoje v MetaCentru

Představení konceptu a praktické poznatky z nasazení proxy IdP v prostředí e-infrastrutury CESNET

Data Protection Delivery Center, s. r. o. JEDNODUCHOST, SPOLEHLIVOST a VÝKONNOST. DPDC Protection. zálohování dat

Konsolidace zálohování a archivace dat Připojení k DÚ CESNET

Národní e-infrastruktura v ČR

MetaCentrum. Martin Kuba CESNET

Zadavatel: CESNET, zájmové sdružení právnických osob se sídlem Zikova 4, Praha 6 IČ:

Služby e-infrastruktury CESNET

ZŠ Ostrava, Gen. Píky 13A, příspěvková organizace. ICT plán školy. pro období školního roku 2016/2017 a 2017/2018

eduroam v kostce aneb šest pohledů na mobilní wifi CESNET Day v Liberci

Historie, současnost a budoucnost sdružení CESNET. Ing. Jan Gruntorád, CSc. ředitel CESNET, z.s.p.o Praha

Prostředí pro spolupráci Multimédia

Identifikátor materiálu: ICT-3-16

Sdílení výukových materiálů. Inovativní podpora výuky a provozu. Ochrana dat. Moderní interaktivní výuka. Příprava vyučujících

DATOVÁ ÚLOŽIŠTĚ CESNET, FAIR DATA

Konsolidace PACS a e-health v souladu s legislativou ve FNB

2012 (červen) Microsoft Sharepoint Portal Server. Microsoft Live Communications Server 2003 Řešení pro online komunikaci. Microsoft Exchange

Konsolidace zálohování a archivace dat

MetaCentrum a náro (nejen matematické) výpočty

Moderní privátní cloud pro město na platformě OpenStack a Kubernetes

TECHNICKÁ SPECIFIKACE

Martin Kuba, Daniel Kouřil seminář řešitelů, Žďár n.s. 1

JAK NA PAPERLESS. Petr Dolejší Senior Solution Consultant

7. října 2008, Systémy pro zpřístupňování evškp Miroslav Křipač Michal Brandejs, Jitka Brandejsová, Jan Kasprzak, Martin Stančík

Případové studie a kulatý stůl. Dalibor Kačmář, Microsoft

ZŠ Ostrava, Gen. Píky 13A, příspěvková organizace. ICT plán školy. pro období školního roku 2018/2019 a 2019/2020

ARCHIVACE A SDÍLENÍ ZDRAVOTNICKÉ DOKUMENTACE V SOULADU S LEGISLATIVOU

Služby datového centra

Představení Kerio Control

Jednotlivé hovory lze ukládat nekomprimované ve formátu wav. Dále pak lze ukládat hovory ve formátu mp3 s libovolným bitrate a také jako text.

Řešení pro dlouhodobé ukládání dat

Federační politika eduid.cz

CEITEC a jeho IT požadavky. RNDr. Radka Svobodová Vařeková, Ph.D.

Služby datového centra

Projekt EGEE / EGI. Jan Kmuníček CESNET. Enabling Grids for E-sciencE. EGEE-III INFSO-RI

2.17 Archivace a komprimace dat

DOBRÉ PRAKTIKY ŘÍZENÍ INFORMATIKY APLIKOVATELNÉ VE VEŘEJNÉ SPRÁVĚ

Transkript:

Datová úložiště CESNET David Antoš CESNET, z. s. p. o. 15. 2. 2013

Přehled proč má smysl budovat národní datová úložiště pro vědecká data možnosti jeho využití co aktuálně budujeme připravovaná infrastruktura správy uživatelů připravované přístupové mechanismy k úložišti aktuální stav

Smysl externího úložiště uživatelé raději drží data na vlastním zařízení... což ale nedává rozumné garance dlouhodobého uchovávání využívají se nevhodná média, chybí systematická péče konsolidace zdrojů jako prostředek k dlouhodobému, spolehlivému a ekonomicky výhodnému uchovávání dat umožňuje pořídit zařízení dostatečné velikosti spravované specializovaným týmem s možností sdílení dat mezi skupinami uživatelů

Dlouhodobé uchování dat potřeba dlouhodobě uchovávat vědecká data vzrůstá uchování primárních dat z experimentů a výpočtů s ohledem na potenciál jejich dalšího využití k návratu a revizi publikovaných výsledků lze zajistit pouze na úrovni zachování binárních dat v heterogenních datech nelze zajistit kurátorství dat správce úložiště nerozumí odborné povaze dat ani nemůže rozhodovat o smysluplnosti jejich archivace

Možnosti využití datových úložišť zálohy uživatelé mají primární data u sebe na úložiště odkládají zálohu pro případ havárie archivace uživatelé na úložiště odkládají cenná primární data data nejsou často využívána uživatelé nemají vlastní prostředky pro dlouhodobé uchování takových dat sdílení dat distribuovaný tým potřebuje společně pracovat nad většími objemy dat, případně je zveřejňovat

Možnosti využití datových úložišť něco jiného v rámci možností podpoříme i jiné scénáře a naopak: na co se vzdálené úložiště příliš nehodí interaktivní práce zejména s velkým množstvím malých souborů ukládání dat s potřebou přístupu v reálném čase prioritou je spolehlivost uložení, dostupnost méně pokud při nedostupnosti dat zemře pacient, taková data sem nepatří

Děčín Liberec Plzeň Praha Hradec Králové Pardubice PIONIER Opava Karviná Ostrava Olomouc AMS-IX NIX Jihlava Zlín České Budějovice Brno GÉANT Internet ACONET SANET

Budovaná infrastruktura úložišť trojice úložišť: Plzeň, Jihlava, Brno celková kapacita cca 16 PB Plzeň ve zkušebním provozu od května 2012 v areálu ZČU cca 500 TB disků + 3300 TB pásek SGI Data Migration Facility, CXFS pásková knihovna Infinite Storage Jihlava a Brno: vypsána výběrová řízení probíhají dodávky řešení IBM založené na GPFS

Úložiště jsou hierarchická vrstvy médií různé kapacity a rychlosti rychlé disky/pomalejší disky/maid/pásky drahý provoz levnější provoz a automatizovaný systém pro přesuny dat mezi nimi déle nepoužívaná data do pomalejších vrstev pro uživatele transparentní, resp. téměř transparentní přístup k dlouho nepoužitému souboru trvá déle uživatelům to obvykle nevadí

Přístupy pro uživatele jednotná správa uživatelských účtů zodpovídáme v projektu za to, komu služby poskytujeme (akademické komunitě) identita uživatele je podchycena centrálně ověřena proti federaci eduid.cz alternativní mechanismus pro nečleny federace je k dispozici na identitu uživatele jsou navázány jednotlivé mechanismy přístupu k datům jednotné webové rozhraní pro správu účtu

Správa uživatelů uživatelé se formují do tzv. virtuálních organizací (VO) VO je skupina uživatelů se společným zájmem, kteří vystupují jako celek VO má správce, který jedná s poskytovatelem zdrojů rozhoduje o podmínkách členství jednotlivých uživatelů dohoda o poskytování zdrojů mezi VO a správcem zdroje popisuje nastavení technických parametrů velikost poskytovaného prostoru použité přístupové protokoly politika ukládání dat, počty kopií/replik VO může využívat různé typy zdrojů

Správa uživatelů pravidla použití úložišť obecná (platná pro všechny) + specifika dané VO sami spravujeme VO Storage dostupná pro individuální uživatele systém kvót jako forma ochrany uživatelů před chybami ve VO Storage na žádost kvótu navýšíme pro prodloužení členství budeme vyžadovat krátkou roční zprávu jako indikaci, že uživatel tuší o svých datech

Volba přístupových metod k úložišti většina software předpokládá použití lokálních disků vzdálené síťové disky jsou příliš pomalé při manipulaci s malými soubory změna sémantiky práce se soubory vynucuje změny software je nutno podporovat škálu přístupových protokolů pro různé případy použití

Přístupy k úložišti souborové NFSv4 (známé uživatelům MetaCentra) výhledově CIFS (známý síťový disk z Windows) rsync, scp, FTPS obvykle autentizované systémem Kerberos existují GUI klienti i nástroje pro příkazovou řádku pro hlavní platformy gridové úložiště v systému dcache bloková zařízení není preferováno

FileSender webová služba pro jednorázový přenos (velkých) souborů velkých: aktuálně 500 GB http://filesender.cesnet.cz alespoň jedna strana komunikace musí být oprávněný uživatel infrastruktury autentizace federací eduid.cz oprávněný uživatel může nahrát soubor a poslat mu oznámení pokud oprávněný uživatel potřebuje dostat soubor od externího uživatele, pošle mu pozvánku

Aktuální stav úložiště v Plzni v pilotním provozu byla řešena sada netriviálních technických problémů provozujeme nepříliš běžné zařízení ve velmi speciálním režimu budujeme pomocné infrastruktury (monitoring,... ) přichází na něj uživatelé integrace se systémem správy identit postupně jednáme se skupinami, které projevily zájem o používání tempo omezeno naší personální kapacitou pro velká data: nezbytná technická znalost uživatelů nutná spolupráce při řešení problémů

K okamžitému použití FileSender v provozu přístup pro individuální uživatele přístup k úložišti pro skupiny zejména pro zálohy uživatelská skupina musí mít technicky zaměřenou osobu s ochotou a časem řešit technické problémy

Kontakty http://du.cesnet.cz email: du-support@cesnet.cz

K diskusi koncept virtuálních organizací je ochota je zakládat, spravovat členy, nebo má být cílem spíše nesamoobslužný prefabrikát? HSM na národní úrovni model, kdy si organizace pořizují úložiště pro svá živá data, archivy se stěhují na CESNET připojení stanic s Windows vyžaduje komerční řešení na straně klienta je ochota platit za licenci?

K diskusi 2 služby vyšší úrovně má smysl nabízet cloud rozhraní? od rozhraní Amazon S3 po služby se speciálními klienty např. Dropbox má CESNET suplovat komerčního poskytovatele? bezpečnost model s federací a Single Sign-on? jednorázová hesla pro různá zařízení (jako má např. Google)? dlouhodobé uchování dat (klasické LTP) pro publikace na národní úrovni? i pro další data?