DATOVÁ ÚLOŽIŠTĚ CESNET, FAIR DATA

Podobné dokumenty
Datová úložiště CESNET

DATOVÁ ÚLOŽIŠTĚ. David Antoš CESNET

DATOVÁ ÚLOŽIŠTĚ CESNET

Způsoby využití datových úložišť CESNET

Datová úložiště CESNET. David Antoš

Způsoby využití datových úložišť CESNET

Datová úložiště v MetaCentru a okolí. David Antoš

Způsoby využití datových úložišť CESNET. David Antoš

Datová úložiště CESNET

Způsoby využití datových úložišť CESNET. Petr Benedikt

Datová úložiště v MetaCentru a okolí II. David Antoš Oddělení datových úložišť

Datová úložiště CESNET. David Antoš

Datová úložiště CESNET. David Antoš

CESNET - Datová úložiště

Způsoby využití datových úložišť CESNET

Data management plan (DMP)

Služby ÚVT pro VaV & IT pro CEITEC. David Antoš

Jakub Šesták. ESEJ DO PŘEDMĚTU DIGITÁLNÍ KNIHOVNY

CESNET, GRIDy a přenosy dat

CERIT SCIENTIFIC CLOUD. Centrum CERIT-SC. Luděk Matyska. Praha, Seminář MetaCentra,

Cloudy a gridy v národní einfrastruktuře

Technologická centra krajů a ORP

Provozní řád zálohování virtuální infrastrukury

MetaCentrum. Miroslav Ruda. listopad 2013 CESNET

MetaCentrum. Martin Kuba CESNET

Česká národní strategie otevřeného přístupu k vědeckým informacím

EU EGEE Presentace projektu

OpenAIRE Advance v České republice

Řešení pro dlouhodobé ukládání dat

DATA ULOŽENÁ NA VĚČNÉ ČASY. (ICZ DESA / Microsoft Azure) Mikulov Michal Matoušek (ICZ) / Václav Koudele (Microsoft)

Gridy v České republice. Luděk Matyska Masarykova univerzita v Brně CESNET, z.s.p.o.

Integrace datových služeb vědecko-výukové skupiny

þÿ C e s t a k e s k é n á r o d n í s t r a t e g i i

e-infra CZ a mezinárodní kontext (EOSC)

X33EJA Web Services. Martin Ptáček, KOMIX s.r.o.

MetaCentrum. Miroslav Ruda. březen 2017, Brno CESNET

Datové centrum a Regionální SAN kraje Vysočina. Projekt digitalizace a. Petr Pavlinec, KrÚ kraje Vysočina. Září 2009

ELIXIR CZ Spolupráce velkých infrastruktur. Jiří Vondrášek, HoN ELIXIR CZ

MetaCentrum - Virtualizace a její použití

Historie, současnost a budoucnost sdružení CESNET. Ing. Jan Gruntorád, CSc. ředitel CESNET, z.s.p.o Praha

Datová úloºi²t CESNET

Realizace datového centra kraje Vysočina Regionální SAN kraje Vysočina

Virtualizace MetaCentra

Integrace datových služeb vědecko- výukové

Veřejné licence, šedá literatura a vědecká data. Matěj Ústav práva a technologií cyber.law.muni.cz flip.law.muni.

MetaCentrum. Tomáš Rebok MetaCentrum NGI, CESNET z.s.p.o. CERIT-SC, Masarykova Univerzita Olomouc,

Souborové systémy a práce s daty David Antoš

Dlouhodobá ochrana digitální dokumentů. Mgr. Jaroslav Kvasnica

Spisová služba jako součást IBM ECM řešení

SenseLab. z / from CeMaS. Otevřené sledování senzorů, ovládání zařízení, nahrávání a přehrávání ve Vaší laboratoři

Koncepce rozvoje knihoven ČR na léta Priorita 2: Trvalé uchování digitálních dokumentů

JSEM ELEKTRONICKÁ IDENTITA. VĚŘÍTE MI? Jiří Bořík CESNET Olomouc

Cloud Slovník pojmů. J. Vrzal, verze 0.9

Obsah&/&Content& Všeobecné)podmínky)(v)češtině)) Terms)and)Conditions)(in)english)) )

Konsolidace zálohování a archivace dat

METACENTRUM. Miroslav Ruda CESNET. Seminář MetaCentra, Praha

Projekt EGEE / EGI. Jan Kmuníček CESNET. Enabling Grids for E-sciencE. EGEE-III INFSO-RI

IPR v H2020. Matěj Myška myska@ctt.muni.cz

Petr Vlk KPCS CZ. WUG Days října 2016

MetaCentrum a e-infrastruktura CESNET

Dlouhodobé a důvěryhodné uchovávání elektronických dokumentů

CESNET. Národní e-infrastruktura. Ing. Jan Gruntorád, CSc. ředitel CESNET, z.s.p.o.

KRAJSKÉ DIGITÁLNÍ ÚLOŽIŠTĚ

Co je nového v NetWorkeru a Data Domain?

EGI a česká NGI aktuální informace o stavu a plánech. Luděk Matyska CESNET, z.s.p.o. Masarykova universita

Představení e-infrastruktury CESNET Ing. Jan Gruntorád, CSc. ředitel CESNET, z.s.p.o.

Datová centra z pohledu univerzity. David Antoš Ústav výpočetní techniky Masarykova univerzita antos@ics.muni.cz

MARIE PACS S PACSem hezky od podlahy když se data sypou!

NOVÉ SLUŽBY CESNET PRO eidas. Jiří Bořík CESNET. konference e-infrastruktury CESNET 2019 Praha

MetaCentrum. Martin Kuba CESNET

Střední úložiště. Uživatelská dokumentace Zřízení přístupu

Otevřený přístup v evropském kontextu

Horizont 2020 a otevřený přístup k vědeckým publikacím a výzkumným datům:

Ukládání a archivace dat

Výpočetní zdroje v MetaCentru a jejich využití

MetaCentrum. Miroslav Ruda. Skalský Dvůr, Miroslav Ruda (MetaCentrum) MetaCentrum Skalský Dvůr, / 11

Světový den zálohování Co byste dělali VY, kdybyste přišli o všechno?

GUIDELINES FOR CONNECTION TO FTP SERVER TO TRANSFER PRINTING DATA

Bezpečnost na internetu. přednáška

Projekt OpenAIREplus. Daniela Tkačíková

Národní technické specifikace. služeb nad prostorovými daty a metadaty

Otevřený přístup k vědeckým informacím v Horizontu 2020 Brno International RD Network , Brno

Novinky z vývoje v MetaCentru

Systém pro správu experimentálních dat a metadat. Petr Císař, Antonín Bárta 2014 Ústav komplexních systémů, FROV, JU

Datová úloºi²t CESNET

Poskytujeme komplexní IT řešení

Dlouhodobé ukládání elektronických záznamů pacienta. Markéta Bušková ECM konzultant, SEFIRA

IBM Sametime 9. moderní způsob komunikace. Petr Kunc, IBM IBM Corporation

19. pracovní skupina zástupců univerzit a ústavů AV ČR. Praha, 23. března 2016

MANAGEMENT KYBERNETICKÉ BEZPEČNOSTI

DOCUMENT MANAGEMENT TOOLKIT

Copyright 2012 EMC Corporation. All rights reserved. Nové strategie pro zálohu a archiv kritických aplikací

Copyright 2012 EMC Corporation. All rights reserved.

Projekt digitalizace a ukládání v regionech. Petr Pavlinec, KrÚ kraje Vysočina Březen 2010

Služby e-infrastruktury CESNET

Novinky v ASEPu a zkušenosti s vkládáním plných textů

Certifikace Národní digitální knihovny podle ISO normy Jan Mottl AiP Safe s.r.o.

CERIT-SC reloaded. už se všichni těšíme. Seminář gridového počítání,

Jak na opendata ve veřejné správě. Michal Rada Ministerstvo vnitra

Řešení oblasti LTP v projektu NDK aneb zúročení 20 let zkušeností

Transkript:

DATOVÁ ÚLOŽIŠTĚ CESNET, FAIR DATA David Antoš CESNET 11. 5. 2018

Přehled typické možnosti použití datových úložišt současná a budovaná infrastruktura přesun na nové úložiště připravované služby komunitní budování úložiště dlouhodobé archivy FAIR data o čem mluví mezinárodní komunita D.A., Datová úložiště, CESNET, 2/22

Instantní služby úložišt jednorázový přenos souborů moc velkých do mailu FileSender http://filesender.cesnet.cz synchronizace souborů mezi svými počítači a mobilními zařízeními s webovým rozhraním s možností sdílení dat sync n share owncloud https://owncloud.cesnet.cz D.A., Datová úložiště, CESNET, 3/22

owncloud počet uživatelů D.A., Datová úložiště, CESNET, 4/22

Možnosti využití úložišt zálohy uživatelé mají primární data u sebe na úložiště odkládají zálohu pro případ havárie bud pro zálohování jednotlivých strojů nebo i agregovaně IT oddělení zálohuje celou katedru archivace uživatelé na úložiště odkládají cenná primární data data nejsou často využívána uživatelé nemají prostředky pro jejich uchovávání individuální přístup koncových uživatelů vs. laboratorní archivář D.A., Datová úložiště, CESNET, 5/22

Možnosti využití úložišt sdílení dat distribuovaný tým potřebuje společně pracovat nad většími objemy dat, případně je zveřejňovat typicky koncoví uživatelé něco jiného distribuce obsahu, jiné speciální aplikace realizováno přístupem k souborovému systému nebo objektovému úložišti D.A., Datová úložiště, CESNET, 6/22

Přístup k souborovým úložištím uživatelé MetaCentra mají na úložiště přístup v jeho rámci pro ostatní: základní služba na registraci přes http://du.cesnet.cz pro individuální data, nejvýše jednotky TB jiné použití po konzultaci s uživatelskou podporou založíme vám virtuální organizaci (VO) tj. skupinu uživatelů, která má správce a členy správce VO dohodne se správcem úložiště technické parametry objem dat, počet replik,... správce VO rozhoduje o členství jednotlivých uživatelů ve VO D.A., Datová úložiště, CESNET, 7/22

Stávající infrastruktura hierarchická úložiště pořízená v letech 2011 13 Plzeň, Jihlava, Brno celkem 22 PB hrubé kapacity médií připojena do MetaCentra resp. poskytují zdroje VO MetaCentrum v Meta jako... -archive infrastruktura dosluhuje a je obměňována D.A., Datová úložiště, CESNET, 8/22

Nová úložiště úložiště v Ostravě hierarchický systém 5 PB disků, 17 PB pásek připojený do MetaCentra plány (projekt OP VVV) 2018 diskové pole a cluster pro objektové úložiště 2019 cluster pro objektové úložiště D.A., Datová úložiště, CESNET, 9/22

Stěhování úložiště v Plzni (du1) bude odstaveno data uživatelů MetaCentra přesuneme do Ostravy typicky jsou to data trvalé hodnoty po dobu přesunu budou znepřístupněna desítky hodin v ostatních VO postupně oslovujeme uživatele, aby začali zálohovat na nové úložiště nebo si přesunuli data nepřesouváme vše sami, u záloh to nemá smysl D.A., Datová úložiště, CESNET, 10/22

Zálohy vs. archivy úložiště není nekonečné rozdělili jsme proto dva hlavní typy použití data trvalé hodnoty archiv je omezen kvótou, tj. objemem dat zálohy jsou omezeny časem uložení dnes jeden rok pak je správce úložiště smí smazat(!) samozřejmě předtím vlastníka dat upozorní při rozumné zálohovací strategii se data rotují platí na novém úložišti (= Ostrava) na starých je vše považováno za archiv D.A., Datová úložiště, CESNET, 11/22

Komunitní úložiště spolupracovat se skupinami, které mají velká data ukládání, zpracování komunitní modely budování úložišt s HSM není snadné podpořit model a co kdybych vám koupil disky/pásky/... jsme monolitický poskytovatel kapacity chceme umět podpořit scénář typu chtěl bych na tři místa uložit 500 TB dat tak si kupte 1500 TB a zapojte se k nám 500 budete mít přímo u sebe, další dvě repliky zařídí infrastruktura, zbylou kapacitu úložiště použijeme pro repliky ostatních a provozovali bychom dostatečnou infrastrukturu pro pokrytí nárazových a dočasných potřeb D.A., Datová úložiště, CESNET, 12/22

Služba archivu pro LTP implementace systému temného archivu pro dlouhodobé ukládání dat s garancemi binární korektnosti a pravidelnými kontrolami konzistence použitelného jako spolehlivý backend pro LTP systémy dle standardu OAIS služba je koncipována jako nadstandardní API + webové rozhraní + dokumentace probíhá implementace D.A., Datová úložiště, CESNET, 13/22

FAIR data Findable, Accessible, Interoperable, Reusable prosté ukládání souborů nezaručuje, že data budou v budoucnu užitečná FAIR principy byly formulovány cca 2014 15, publikovány 2016 a jsou dnes propagovány organizacemi jako FORCE11, Evropskou komisí, National Institutes of Health (US), Australian National Data Service,... jsou formulovány nezávisle na disciplíně jsou vnímány jako nástroj (seznam témat k zamyšlení?), který pomůže objevování znalostí a inovaci sdílení a znovupoužití dat strojovému zpracování dat D.A., Datová úložiště, CESNET, 14/22

FAIR a strojové zpracování Sovětští vědci jsou přesvědčeni, že do konce příští pětiletky vytvoří automatický stroj, který bude schopen vypracovat národohospodářský plán SSSR a provést jeho analýzu. zpráva ze začátku 50. let Distinct from peer initiatives that focus on the human scholar, the FAIR Principles put specific emphasis on enhancing the ability of machines to automatically find and use the data, in addition to supporting its reuse by individuals. The FAIR Guiding Principles for scientific data management and stewardship, https://www.nature.com/articles/sdata201618 D.A., Datová úložiště, CESNET, 15/22

Findable F1. (Meta)data are assigned a globally unique and persistent identifier F2. Data are described with rich metadata F3. Metadata clearly and explicitly include the identifier of the data they describe F4. (Meta)data are registered or indexed in a searchable resource D.A., Datová úložiště, CESNET, 16/22

Accessible A1. (Meta)data are retrievable by their identifier using a standardised communications protocol A1.1 The protocol is open, free, and universally implementable A1.2 The protocol allows for an authentication and authorisation procedure, where necessary A2. Metadata are accessible, even when the data are no longer available všimněte si: metadata jsou věčná, data mohou zmizet D.A., Datová úložiště, CESNET, 17/22

Interoperable I1. (Meta)data use a formal, accessible, shared, and broadly applicable language for knowledge representation I2. (Meta)data use vocabularies that follow FAIR principles I3. (Meta)data include qualified references to other (meta)data stručně: v metadatech používejte řízené slovníky a specifické odkazy X je řízeno Y je lepší než X souvisí s Y samozřejmě formálním jazykem D.A., Datová úložiště, CESNET, 18/22

Reusable R1. Meta(data) are richly described with a plurality of accurate and relevant attributes R1.1. (Meta)data are released with a clear and accessible data usage license R1.2. (Meta)data are associated with detailed provenance R1.3. (Meta)data meet domain-relevant community standards D.A., Datová úložiště, CESNET, 19/22

Co FAIR je a není FAIR veřejně přístupný FAIR dostupný zdarma jen má být jasné, jak se věci mají FAIR je užitečný checklist i pro tvorbu DMP nad čím bychom se měli zamyslet ne vše z toho je třeba splnit dokonale FAIR není standard FAIR je svatý grál FAIR je proces level of FAIRness FAIRification (ehm) D.A., Datová úložiště, CESNET, 20/22

Jak s FAIR můžeme pomoci umíme ukládat data (i velká) učíme se repozitáře a dlouhodobé uchovávání potkáváme se s komunitami, které se v tom (taky) plácají a spolupracujeme s nimi umíme poradit s technickou částí metadat D.A., Datová úložiště, CESNET, 21/22

Shrnutí typické scénáře použití datových úložišt služby nad rámec dalšího úložiště v MetaCentru stávající a plánovaná infrastruktura stěhování dat a změny v jejich organizaci archiv vs. zálohy nové služby FAIR D.A., Datová úložiště, CESNET, 22/22