Jiří Chudoba Fyzikální ústav AV ČR, v.v.i.

Podobné dokumenty
EGI-InSPIRE. Gridové výpočty pro velké projekty i jednotlivé uživatele (aktivity ve VS FZÚ) Jiří Chudoba. Fyzikální ústav AV ČR a CESNET.

Dagmar Adamová, Jiří Chudoba Jednalo se o Monte Carlo simulace případů srážek p+p a Pb+Pb. Fungování

Gridové služby a IPv6. Jiří Chudoba, Marek Eliáš, Lukáš Fiala, Tomáš Kouba

Grid jako superpočítač

CESNET, GRIDy a přenosy dat

Martin Kuba, Daniel Kouřil seminář řešitelů, Žďár n.s. 1

EU EGEE Presentace projektu

Cloudy a gridy v národní einfrastruktuře

MetaCentrum. Miroslav Ruda. březen 2017, Brno CESNET

Datová úložiště v MetaCentru a okolí. David Antoš

aktivita CESNETu společně MU, UK a ZČU sdružuje výpočetní prostředky

EGI a česká NGI aktuální informace o stavu a plánech. Luděk Matyska CESNET, z.s.p.o. Masarykova universita

Enabling Grids for E-sciencE. Projekt EGEE / VOCE. Jan Kmuníček ÚVT MU & CESNET. INFSO-RI

Nová éra diskových polí IBM Enterprise diskové pole s nízkým TCO! Simon Podepřel, Storage Sales

Výpočetní zdroje v MetaCentru a jejich využití

MetaCentrum. Martin Kuba CESNET

Project EGEE-II / VOCE

Datová úložiště v MetaCentru a okolí II. David Antoš Oddělení datových úložišť

CYCLOPE PRINT MANAGEMENT SOFTWARE- UŽIVATELSKÁ PŘÍRUČKA

Uvádění pixelového detektoru experimentu ATLAS do provozu

Evaluation of the Inner Detector with Muon Tracks

Z znam workshopu k projektu QJ Program workshopu: 4. Diskuse. s metodice. H

METACentrum zastřešení českých gridových aktivit

CERIT SCIENTIFIC CLOUD. Centrum CERIT-SC. Luděk Matyska. Praha, Seminář MetaCentra,

Novinky ze sv ta grid

CESNET - Datová úložiště

Uživatelská příručka Popis postupu nastavení zabezpečené komunikace s CDS pomocí aplikace MS Outlook 2003

Instalační manuál. Uživatelská příručka informačního systému. Popis postupu nastavení zabezpečené komunikace s CDS pomocí aplikace MS Outlook 2010.

Gridy v České republice. Luděk Matyska Masarykova univerzita v Brně CESNET, z.s.p.o.

CUZAK. Uživatelská příručka. Verze

Active Directory organizační jednotky, uživatelé a skupiny

Copyright 2012 EMC Corporation. All rights reserved.


MetaCentrum. Miroslav Ruda. listopad 2013 CESNET

METACENTRUM. Miroslav Ruda CESNET. Seminář MetaCentra, Praha

Aktuální stav MetaCentra, novinky

Instalační manuál. Uživatelská příručka informačního systému. Popis postupu nastavení zabezpečené komunikace s CDS pomocí aplikace MS Outlook 2007.

METACentrum Český národní gridovýprojekt. Projekt METACentrum. Jan Kmuníček ÚVT MU & CESNET. meta.cesnet.cz

Maturitní témata. Informační a komunikační technologie. Gymnázium, Střední odborná škola a Vyšší odborná škola Ledeč nad Sázavou.

MetaCentrum. Martin Kuba CESNET

MetaCentrum - Virtualizace a její použití

A4B33SI - Softwarové Inženýrství. Vize projektu. Projekt Jumpfish. (verze 1.0) Viktor Kozák, Simona Musilová, Vojtěch Leff, Pavel Vňuk

Zkušenosti s InCites a WoS Profiles ČVUT v Praze. Lenka Němečková (Ústřední knihovna ČVUT) Josef Špaček (Výpočetní a informační centrum ČVUT)

Allegro framework. Podstatné vlastnosti. Allegro Business Solution Framework

Bc. David Gešvindr MSP MCSA MCTS MCITP MCPD

Hardware - minulý rok

Na vybraném serveru vytvoříme MySQL databázi. Soubory scratch.jpa, kickstart.php a en-gb.kickstart.ini nahrajeme na vybraný server.

Backup & recovery, SQL Server Agent, Alerts Jiří Tomeš

Když konvenční disky nestačí tempu vašich aplikací

Řešení pro správu klientů a mobilní tisk

zadávaná v otevřeném řízení v souladu s ust. 27 zákona č. 137/2006 Sb., o veřejných zakázkách, ve znění pozdějších předpisů

Flow Monitoring & NBA. Pavel Minařík

<Insert Picture Here> Software, Hardware, Complete

Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová. 5. Statistica

Uživatelský přístup do centrálního systému operátora trhu (CS OTE)

1. SYSTÉMOVÉ POŽADAVKY / DOPORUČENÁ KONFIGURACE HW A SW Databázový server Webový server Stanice pro servisní modul...

Návod k použití softwaru Solar Viewer 3D

Patrol Management System 2.0

Ceník produktů akademická licence (ceny jsou uvedeny v USD a neobsahují 21% DPH)

Uživatelská příručka pro respondenty

Studium produkce jetů v experimentu ALICE na urychlovači LHC

CAD library. Spuštění aplikace. Práce s aplikací. Popis okna

TSM for Virtual Environments Data Protection for VMware v6.3. Ondřej Bláha CEE+R Tivoli Storage Team Leader. TSM architektura IBM Corporation

Obslužný software. vizualizaci zařízení

MetaCentrum. Miroslav Ruda. Skalský Dvůr, Miroslav Ruda (MetaCentrum) MetaCentrum Skalský Dvůr, / 11

FUJITSU PRIMEFLEX. Human Centric Innovation in Action. Integrované systémy pro Vaše řešení. 30. května 2017 Pavel Čáslavský. 0 Copyright 2017 FUJITSU

Novell(r) Portal Services v. 1.0 Licenční smlouva k softwaru Novell

IB109 Návrh a implementace paralelních systémů. Organizace kurzu a úvod. RNDr. Jiří Barnat, Ph.D.

APS Web Panel. Rozšiřující webový modul pro APS Administrator. Webové rozhraní pro vybrané funkce programového balíku APS Administrator

Kapitola 10: Diskové a souborové struktury. Klasifikace fyzických médií. Fyzická média

III/2 Inovace a zkvalitnění výuky prostřednictvím ICT EU-OVK-VZ-III/2-ZÁ-301. Informace, jednotka

Konsolidace zálohování a archivace dat Připojení k DÚ CESNET

Postup instalace umožňující el. podpis v IS KP14+ pro webové prohlížeče Google Chrome a Firefox.

Endura 2.0 Nová generace CCTV IP systémů s Full-HD rozlišením Endura Optimalizace HD

Replikace je proces kopírování a udržování databázových objektů, které tvoří distribuovaný databázový systém. Změny aplikované na jednu část jsou

BigData. Marek Sušický

Organizace a zpracování dat I (NDBI007) RNDr. Michal Žemlička, Ph.D.

Projekt Turris Ondřej Filip 23 října 2014 CIF Praha

Návod pro použití snímače tlaku s rozhraním IO-Link

Analýza a Návrh. Analýza

Fakulta informačních technologií VUT v Brně Ústav počítačových systémů Periferní zařízení, cvičení IPZ Analýza komunikace na sběrnici USB

Aplikace je program určený pro uživatele. Aplikaci je možné rozdělit na části:

TIA na dosah Advanced Engineering System. SIMATIC PCS 7 Verze 8.01

Technologické postupy práce s aktovkou IS MPP

VÝVOJ PROGRAMOVÉHO VYBAVENÍ PRO HROMADNÉ ZPRACOVÁNÍ DAT - HADRON RUN COMPASS

Certifikační autorita EET Modelové postupy vytvoření souboru žádosti o certifikát

Příloha č.2 - Technická specifikace předmětu veřejné zakázky

Manuál pro web praktik: Asistent

METACENTRUM. Miroslav Ruda CESNET. Konference CESNET, Praha

Windows Server Novinky. Petr Špetlík Cloud & Server PTA

O b s a h ÚVOD. Kapitola 1 HARDWAROVÉ PRVKY SÍTÍ

Stručná instalační příručka SUSE Linux Enterprise Server 11

MetaCentrum. Tomáš Rebok MetaCentrum NGI, CESNET z.s.p.o. CERIT-SC, Masarykova Univerzita Olomouc,

Počítačová Podpora Studia. Přednáška 5 Úvod do html a některých souvisejících IT. Web jako platforma pro vývoj aplikací.

Monitoring SQL Server, Resource Governor, Tracing SQL Server

TECHNICKÁ DOKUMENTACE

a jeho podpora v Metacentru Zden k ustr cesnet 11. kv tna 2018

INOVACE ODBORNÉHO VZDĚLÁVÁNÍ NA STŘEDNÍCH ŠKOLÁCH ZAMĚŘENÉ NA VYUŽÍVÁNÍ ENERGETICKÝCH ZDROJŮ PRO 21. STOLETÍ A NA JEJICH DOPAD NA ŽIVOTNÍ PROSTŘEDÍ

Z µµ na ATLAS detektoru

VÝPOČETNĚ NÁROČNÉ APLIKACE S VYUŽITÍM VIRTUALIZACE PRACOVNÍCH STANIC NA BÁZI INTEGRACE TECHNOLOGIÍ MICROSOFT VDI A SUN RAY

Transkript:

Distribuovaná Analýza ATLAS dat Jiří Chudoba Fyzikální ústav AV ČR, v.v.i.

Model pro ATLAS Distribuované zpracování dat na gridu Hierarchie výpočetních center Tier0 CERN Tier1 10 center pro ATLAS Tier2 asi 30 center Tier3 menší příležitostná centra Farma Goliáš na FZÚ Tier2 centrum přiřazené do GidK GridKa regionu (Tier1 v Karlsruhe) Gridový software projektů EGEE, OSG a NorduGrid Model detailně popsán v ATLAS Computing TDR, CERN/LHCC/2005-022 Jiri.Chudoba@cern.ch 2

Tier2 centrum ve FZU Podepsané WLCG MoU v roce 2008 Do roku 2008 včetně větší podíl ALICE než ATLAS. Nyní se vybírá hardware pro splnění závazků na rok 2009. Jiri.Chudoba@cern.ch 3

Velikosti dat v MB/případ p TDR Nyní RAW 16 1.6 16 1.6 ESD.5 1. AOD.1.2 TAG.001.01 D1PD.01 T0 a T1 nebudou (?) přístupná běžným uživatelům, jen pro organizované produkce Data v roce 2008 50,000000 sec@200hz 10 M případů/den 60 dní v 2008: 600M případů VT0: 960 TB RAW to tape 96 TB RAW to disk (10%) 600 TB ESD to tape 60 TB ESD to disk (10%) 120 TB AOD to disk and tape 120 TB DPD to disk and tape 6TB TAG to disk V rámci každého oblaku kompletní soubor AOD v Tier 2 centrech (plus kopie v T1) V typickém Tier2 25 % AOD + DPD Ve FZU: asi 5-10 % AOD + DPD Jiri.Chudoba@cern.ch 4

Kam s daty space tokens token name storage type used for @T2 @T1 @T0 ATLASDATATAPE T1D0 RAW data, X X ESD, AOD from re-proc ATLASDATADISK T0D1 ESD, AOD from data X X X ATLASMCTAPE T1D0 HITS from G4, AOD from ATLFAST X ATLASMCDISK T0D1 AOD from MC X X X ATLASPRODDISK T0D1 buffer for in-and export X ATLASGROUPDISK T0D1 DPD X X X ATLASUSERDISK T0D1 User Data X X *) X ATLASLOCALGROUP DISK T0D1 Local User Data @T3 X Jiri.Chudoba@cern.ch 5

Data v typickém Tier2, rok 2008 Typické = 500 CPU a 100 TB pro ATLAS ATLASDATADISK (60 TB) AOD a DPD dle požadavků (nebo podílu), možno i vzorky RAW a ESD ATLASGROUPDISK (6 TB) pro analýzu organizovanou fyzikálními skupinami ATLASUSERDISK (5 TB) scratch space for users ATLASLOCALGROUPDISK (zdroje mimo MoU) permanentní prostor pro lokální uživatele Nyní ve FZU pro ATLAS ATLASUSERDISK 800 GB ATLASPRODDISK 500 GB ATLASDATADISK 2500 GB ATLASMCDISK 500 GB Zvětšení space tokens o několik TB (dohromady) možné téměř ihned. Celkem pro ATLAS zhruba 20 TB. Jiri.Chudoba@cern.ch 6

Datové formáty RAW = raw data ESD = Event Summary Data detaily z rekonstrukce případů, možno z nich dělat identifikaci částic, refitování drah, rekonstrukci jetů cílová velikost 500 kb, nyní přes 600 kb. calorimeter cells = 270 kb, tracking data 200 kb pro top případy AOD = Analysis Object Data vytvářeny pouze z ESD, určené pro analýzu nyní 200 kb/případ, plus 60 kb MC truth Jiri.Chudoba@cern.ch 7

Zkušenost z Rome produkce AOD příliš velké pro analýzu Skupiny používaly hlavně ntuply vytvořené pomocí EventView, HighPtView, TopView DPD = Derived Physics Data DPD podmnožina obsahu ESD a AOD s možným přidáním analyzačních dat Analyzační data veličiny vypočítané z ESD a AOD Několik verzí DPD: D1PD, D2PD, D3PD, performance DPD Redukce velikosti dat pomocí: skimming i vynechání celých případů thinning vynechání některých objektů slimming vynechání části objektů Jiri.Chudoba@cern.ch 8

Dnešní možnosti pro analýzu Jiri.Chudoba@cern.ch 9

Jiri.Chudoba@cern.ch 10

Co je k analýze zapotřebí? UI = User Interface (třeba lxplus) a členství v ATLAS VO Návody na spouštění analýzy na Twiki stránkách Organizují se výukové semináře Veškeré datové přenosy přes systém DQ2 Distribuce oficiálních dat pomocí subscriptions na místa registrovaná v TiersOfATLAS (TOA) Uživatelské datasety nyní není možné takto distribuovat (politické rozhodnutí), ale je možné je kopírovat na vlastní disk Výstup analyzační úlohy na USERDISK, bude pravidelně promazáván Uživatel ho může dát na LOCALGROUPDISK permanentní prostor skupiny si mohou ve svých Tier přidat diskový prostor Přístup k ESD zatím není vyřešen (povolit úlohy uživatelů v T1?) Spolehlivost gridových komponent není 100 %, problémy při velkých kolekcích úloh Jiri.Chudoba@cern.ch 11

Zdroje ATLAS Offline software výukový seminář: http://indico.cern.ch/conferencedisplay.py?confidcern ch/conferencedisplay py?confid=39198 Distributed Analysis Workshop 25.-27.8.2008 v CERN http://indico.cern.ch/conferencedisplay.py?confid=38560 Ganga výuka https://twiki.cern.ch/twiki/bin/view/atlas/gangatutorial5 ch/twiki/bin/view/atlas/gangatutorial5 Pathena výuka http://cdsweb.cern.ch/record/1118219 Analysis Model Forum Report, ATL-GEN-INT 2008-01 Jiri.Chudoba@cern.ch 12