Souborové systémy a práce s daty David Antoš



Podobné dokumenty
Datová úložiště v MetaCentru a okolí. David Antoš

Datová úložiště v MetaCentru a okolí II. David Antoš Oddělení datových úložišť

Výpočetní zdroje v MetaCentru a jejich využití

Výběr zdrojů, zadávání a správa úloh v MetaCentru

METACentrum Český národní gridovýprojekt. Projekt METACentrum. Jan Kmuníček ÚVT MU & CESNET. meta.cesnet.cz

Datová úložiště CESNET

Novinky z vývoje v MetaCentru

METACentrum zastřešení českých gridových aktivit

Způsoby využití datových úložišť CESNET

Datová úložiště CESNET. David Antoš

Datová úložiště CESNET. David Antoš

DATOVÁ ÚLOŽIŠTĚ CESNET

Způsoby využití datových úložišť CESNET. David Antoš

aktivita CESNETu společně MU, UK a ZČU sdružuje výpočetní prostředky

Datová úložiště CESNET. David Antoš

MetaCentrum. Miroslav Ruda. Skalský Dvůr, Miroslav Ruda (MetaCentrum) MetaCentrum Skalský Dvůr, / 11

Datová úložiště CESNET

Způsoby využití datových úložišť CESNET. Petr Benedikt

Způsoby využití datových úložišť CESNET

Aktuální stav. Martin Kuba CESNET a ÚVT MU

DATOVÁ ÚLOŽIŠTĚ. David Antoš CESNET

MetaCentrum. Martin Kuba CESNET

Hardware - minulý rok

Výběr zdrojů, zadávání a správa úloh

Příloha č. 1 zadávací dokumentace. Technická dokumentace, specifikace požadovaného plnění a popis hodnocení

Způsoby využití datových úložišť CESNET

Provozní řád zálohování virtuální infrastrukury

CESNET - Datová úložiště

Služby ÚVT pro VaV & IT pro CEITEC. David Antoš

Výpočetní clustery v METACentru

MetaCentrum. Miroslav Ruda. listopad 2013 CESNET

HPC Users' Access Workshop: nový superpočítač Salomon

Co je počítačová síť?

Konsolidace zálohování a archivace dat Připojení k DÚ CESNET

Provozní statistiky centra CERIT-SC

Plánování úloh otázky a odpovědi

SUPERPOČÍTAČOVÉ CENTRUM. Luděk Matyska

Jakub Šesták. ESEJ DO PŘEDMĚTU DIGITÁLNÍ KNIHOVNY

Datová úloºi²t CESNET

Střední úložiště. Uživatelská dokumentace Zřízení přístupu

MetaCentrum. Miroslav Ruda CESNET

Program Sharpdesk Sharpdesk řešení pro správu dokumentů

Virtualizace MetaCentra

MetaCentrum - Virtualizace a její použití

Příručka pro správu systému

Pavel Martinec 4.A 2011/2012

SRSW4IT Inventarizační SW. Prezentace aplikace. Vedoucí DP: ing. Lukáš Macura Autor: Bc. Petr Mrůzek

C2115 Praktický úvod do superpočítání

OPS Paralelní systémy, seznam pojmů, klasifikace

STORAGE SPACES DIRECT

SUPERPOČÍTAČE DANIEL LANGR ČVUT FIT / VZLÚ

Cloudy a gridy v národní einfrastruktuře

Příručka nastavení funkcí snímání

Nahrávací systém TriREC

Možnosti využití Windows Server 2003

Aplikace je program určený pro uživatele. Aplikaci je možné rozdělit na části:

Paralelní výpočty na clusteru KMD

Realizace datového centra kraje Vysočina Regionální SAN kraje Vysočina

Bezpečí před vodou a požárem. Chraňte vše, co je pro Vás nejcennější, a ještě něco navíc úložiště dat.

MetaCentrum. Tomáš Rebok MetaCentrum NGI, CESNET z.s.p.o. CERIT-SC, Masarykova Univerzita Olomouc,

Souborové systémy v cloudu

Úložiště lze v počítači připojit jako další disk. S dokumenty pak pracujete jako v běžné složce otevíráte je, upravujete, ukládáte.

7. října 2008, Systémy pro zpřístupňování evškp Miroslav Křipač Michal Brandejs, Jitka Brandejsová, Jan Kasprzak, Martin Stančík

Základní informace: vysoce komfortnímu prostředí je možné se systémem CP Recorder efektivně pracovat prakticky okamžitě po krátké zaškolení.

Registrační číslo projektu: CZ.1.07/1.5.00/ Elektronická podpora zkvalitnění výuky CZ.1.07 Vzděláním pro konkurenceschopnost

Bi-Direction Replication

Archivace dat s využitím DÚ CESNET

Tiskové služby v sítích Microsoft. PDF created with pdffactory trial version

Kapitola 13: Transakce. Koncept transakce. ACID vlastnosti

MetaCentrum. datové služby. Miroslav Ruda, Zdeněk Šustr

UAI/612 - Cloudová Řešení. Návrh aplikací pro cloud

Servery Incad, stav k

Přístup k poště MS Office 365 mají pouze studenti 1. a 2. ročníku EkF prezenčního studia. Přístup k ostatním službám mají všichni studenti.

METACENTRUM. Miroslav Ruda CESNET. Seminář MetaCentra, Praha

Velká data v knihovnách Open source tools and their use in Czech libraries

WEBFILTR živě. přímo na svém počítači. Vyzkoušejte KERNUN CLEAR WEB. Připojte se přes veřejně dostupnou WiFi síť KERNUN.

Komunikace mezi uživateli: možnost posílání dat na velké vzdálenosti

Geografické informační systémy

Zálohování a rychlá obnova dat Konsolidace serverů a diskových polí Archivace elektronické pošty

CYCLOPE PRINT MANAGEMENT SOFTWARE- UŽIVATELSKÁ PŘÍRUČKA

Databázové systémy. Doc.Ing.Miloš Koch,CSc.

SOFTWARE 5P. Instalace. SOFTWARE 5P pro advokátní praxi Oldřich Florian

Distribuovaný systém je takový systém propojení množiny nezávislých počítačů, který poskytuje uživateli dojem jednotného systému.

Obsah SLEDOVÁNÍ PRÁCE... 4

POKUD JSOU PRACOVNÍCI SPOJENI DO SÍTĚ MOHOU SDÍLET: Data Zprávy Grafiku Tiskárny Faxové přístroje Modemy Další hardwarové zdroje

Flow Monitoring & NBA. Pavel Minařík

Typy souborů ve STATISTICA. Tento článek poslouží jako přehled hlavních typů souborů v programu

Praha, Martin Beran

Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra informatiky a výpočetní techniky

Diplomová práce Simulátor distribuovaného souborového systému

Paralelní výpočty ve finančnictví

Informatika základní pojmy

PDV /2018 Detekce selhání

SADA VY_32_INOVACE_PP1

Interní předpis. Pokyn pro uživatele

Hana Jedličková Novell Tour Praha,

Fides Software Storage Administrator

TECHNICKÁ DOKUMENTACE

Bezpečnost v Gridech. Daniel Kouřil EGEE kurz 12. prosince Enabling Grids for E-sciencE.

uzly. Výpočetní uzel (Working node) výkonná jednotka clusteru.

Transkript:

Souborové systémy a práce s daty David Antoš antos@ics.muni.cz

Úvod obecný úvod do síťových souborových systémů souborové systémy v MetaCentru jejich použití práce s nimi praktické poznámky kvóty efektivní použití do prezentace přispěl Lukáš Hejtmánek (klasifikace souborových systému a graf)

Sdílené systémy souborů přístup přes síť předpokládáme mnoho klientů, kteří přistupují současně proč to kapacita, výkon, potřeba data sdílet většinou standardní rozhraní (POSIX) využitelné běžně aplikacemi uživatelé jsou zvyklí používat souborový systém v prostředí MetaCentra jsou síťové systémy transparentní nicméně to občas vede na nevhodné použití

Obecnější úvod do souborových systémů síťové souborové systémy dělíme centralizované obvykle jeden server, obtížně škálovatelné single point of failure jednoduchý design NFSv3, v4, Samba/CIFS distribuované realizované skupinou serverů komplikovaný design, potenciálně(!) výkonnější AFS, Lustre, PVFS2, GPFS, GlusterFS,...

Obecnější úvod do souborových systémů II autentizace slabá (UID/GID) vs. silná (např. Kerberos) určuje potřebu důvěryhodnosti klienta stavovost nutná synchronizace při pádu klienta nebo rozpadu spojení nutnost řešit konzistenci dat souběžný zápis několika klienty obvykle zamykání

Souborové systémy v MetaCentru inventura: rychlý lokální disk /scratch síťový scratch přes PVFS sdílený síťově připojený přes NFSv3 na lokálním clusteru sdílený síťově připojený přes AFS na všech strojích sdílený síťově připojený přes NFSv4 na téměř všech strojích každý se hodí na něco jiného, ale počet chceme omezit při výběru vhodného souborového systému používejte pravidla MetaCentra selský rozum ;) na to je ale třeba vědět, jak to funguje

Svazky /scratch svazky /scratch jsou malé a rychlé slouží k ukládání dočasných dat výpočtu tj. mezivýsledků běžící úlohy nebo výsledků do doby ukončení úlohy z toho plyne: úloha má končit tím, že odsune svá data (stage-out) ze scratche současná praxe: zasahuje se při problému /scratch není zálohován experimentuje se se síťovým Lustre jako náhradou lokálních disků přes IP nebo InfiniBand

Svazky /home vždy exportovány na jeden cluster postaveny na NFSv3 slabá autentizace (tj. nelze exportovat na pracovní stanice uživatelů) výkon verze 3 není oslnivý slouží k uchování dat, se kterými uživatelé aktuálně pracují kde aktuálně znamená, že na ně v posledním roce přistoupili

Svazky /afs dostupné a sdílené na všech strojích MetaCentra relativně pomalé, zato s velkou variabilitou nastavování ACL slouží k ukládání dat projektů, lze vytvářet svazky pro projekty kvóty nedoporučuje se provozovat svazky nad 2 GB je možno připojit k vlastní pracovní stanici přístup přes Kerberos

Svazky /storage (NFSv4) použití jako AFS, jen rychlejší neomezená kapacita standardní kvóta 5 TB fyzická kapacita 96 TB dostupné na strojích s vlastností nfs4, možno připojit k vlastní pracovní stanici přístup přes Kerberos řešeny problémy s lístky (nemožnost revokace) a kvótami (špatně zobrazeny) server umístěn v Brně výkonnostní důsledky

Kvóty slouží jako mechanismus hlídání dostupné kapacity pro správce a jako ochrana proti zaplnění celého prostoru chybou úlohy lze žádat kdykoli o změnu http://meta.cesnet.cz Můj účet Souborové systémy dole schované tlačítko Požádat o změnu kvóty

Vliv geografické vzdálenosti na výkon NFSv4 and latency 800 600 0.15ms 0.8ms 1.81ms 2.80ms 3.83ms 4.73ms Time in secs 400 200 0 untar make defconfig make tar rm -rf Operation

Kterak sobě data ku clusteru nakopírovati (a pak zpět domů) pro drobná data (desítky MB) je to jedno scp přes frontend pro větší data na interaktivní uzel qsub -I -l nodes=1:nfs4:brno sftp na libovolný stroj interaktivní uzel máte-li velká data, domluvte se předem

Kterak dopraviti data úloze do scratch do lokálního scratche ze /storage: cp sem a tam z /home: stage-in/stage-out skripty PBS #PBS -W stagein=/scratch/pepa/vstup1@skirit:vstup1, /scratch/pepa/vstup2@skirit:vstup2 #PBS -W stageout=/scratch/pepa/vystup@skirit:vystup cd /scratch/pepa formát je následující místní_soubor@jméno_stroje:vzdálený_soubor[,...]

Diskuse kolik úrovní filesystémů storage a scratch? je zajímavé optimalizovat? které aplikace mají problém? mám velký soubor a potřebuju zobat kousek? masivní paralelismus nad velkým souborem? speciální požadavky aplikací? metadata? katalogy? databáze? OGSA-DAI?...?