Databáze ve fyzice vysokých energií

Podobné dokumenty
Nový řídicí a dohledový systém pro experiment COMPASS

Zřízení kontrolní místnosti

Pracoviště pro vývoj FPGA karet

Projekt 7006/2014 SDAT - Sběr dat pro potřeby ČNB. Návrh realizace řešení

Technická specifikace soutěžených služeb

Jednotlivé hovory lze ukládat nekomprimované ve formátu wav. Dále pak lze ukládat hovory ve formátu mp3 s libovolným bitrate a také jako text.

Město Varnsdorf, nám. E. Beneše 470, Varnsdorf, Česká republika SPECIFIKACE

VÝVOJ PROGRAMOVÉHO VYBAVENÍ PRO HROMADNÉ ZPRACOVÁNÍ DAT - HADRON RUN COMPASS

Virtuální učebna: VMware VDI zefektivňuje výuku, zjednodušuje správu a snižuje náklady

1. SYSTÉMOVÉ POŽADAVKY / DOPORUČENÁ KONFIGURACE HW A SW Databázový server Webový server Stanice pro servisní modul...

Specifikace předmětu veřejné zakázky

Red Hat Enterprise Virtualization

Data Protection Delivery Center, s. r. o. JEDNODUCHOST, SPOLEHLIVOST a VÝKONNOST. DPDC Protection. zálohování dat

Informace ke stavu celoměstsk xxx


aktivita CESNETu společně MU, UK a ZČU sdružuje výpočetní prostředky

LINUX - INSTALACE & KONFIGURACE

Gymnázium a Střední odborná škola, Rokycany, Mládežníků 1115

Přechod na virtuální infrastrukturu

BrightStor ARCserve Backup r Michal Opatřil - Consultant - michal.opatril@ca.com

Důvěryhodná výpočetní základna v prostředí rozsáhlých IS státní správy

Load Balancer. RNDr. Václav Petříček. Lukáš Hlůže Václav Nidrle Přemysl Volf Stanislav Živný

verze GORDIC spol. s r. o.

DataDomain pod drobnohledem

Sísyfos Systém evidence činností

IT 3. Projekt centrálního zálohovacího systému v ČSOB Pojišťovně. Michal Mikulík. špička v každém směru

METACENTRUM. Miroslav Ruda CESNET. Seminář MetaCentra, Praha

Virtualizace. Lukáš Krahulec, KRA556

TSM for Virtual Environments Data Protection for VMware v6.3. Ondřej Bláha CEE+R Tivoli Storage Team Leader. TSM architektura IBM Corporation

Část 1. Technická specifikace. Posílení ochrany demokratické společnosti proti terorismu a extremismu

aniel Dvořák, Martin Mičan Liberec Windows Server 2012/R2 Migrační scénáře

Paralelní výpočty ve finančnictví

CESNET, GRIDy a přenosy dat

Integrace formou virtualizace

ČÁST III. zadávací dokumentace technické podmínky ČÁST 1 veřejné zakázky

Databáze s tisíci uložených procedur. Pavel Bláhovec, DiS pavel@blahovec.cz

DODATEČNÉ INFORMACE K ZADÁVACÍM PODMÍNKÁM Č. 4

Výpočetní zdroje v MetaCentru a jejich využití

Acronis. Lukáš Valenta

Porovnání rychlosti mapového serveru GeoServer při přístupu k různým datovým skladům

Business Intelligence

VirtualizaceKlatovské nemocnice a.s.

DEDIKOVANÉ A MANAGED SERVERY GREENHOUSING JEDNODUCHÁ CESTA K PROFESIONÁLNÍMU SERVERHOSTINGU A VIRTUALIZACI

Versiondog Co je nového

Praha, Martin Beran

Microsoft SharePoint Portal Server Zvýšená týmová produktivita a úspora času při správě dokumentů ve společnosti Makro Cash & Carry ČR

nástroj pro jednoduchou správu a vedení agendy studentských počítačových sítí na kolejích SU OPF Karviná Ing.

Lékaři léčí, my se staráme

Příloha č. 2A Zadávací dokumentace k Veřejné zakázce Dodávka technologického řešení pro Geoportál

Příloha č. 1 k čj.: 1/120/ Technická specifikace Zajištění HW a dlouhodobé podpory infrastruktury Intel pro VoZP ČR

Příloha č. 3: Technické zadání zakázky Instalace a služby pro technologické centrum MÚ Pohořelice

CHARAKTERISTIKA VEŘEJNÉ ZAKÁZKY

IBM Informix 11.7 Edice

Střední odborná škola a Střední odborné učiliště, Hořovice

Technická specifikace HW pro rok 2012

Od virtualizace serverů k virtualizaci desktopů. Nebo opačně? Jaroslav Prodělal, OldanyGroup VMware VCP, consultant

Úvod 17 ČÁST 1. Kapitola 1: Principy návrhu doménové struktury služby Active Directory 21

Zřízení technologického centra ORP Dobruška

Administrace a Enterprise vlastnosti. RNDr. Ondřej Zýka

Zajištění komplexních sluţeb pro provoz systémové infrastruktury OSMS ZADÁVACÍ DOKUMENTACE

PŘÍPADOVÁ STUDIE ŘEŠENÍ DATOVÉHO ÚLOŽIŠTĚ S REPLIKACÍ POUŽITÉ ŘEŠENÍ: DELL EMC STORAGE, SERVER, NETWORKING A SLUŽBY IT AWACS. Kateřina, marketing, DNS

Technická specifikace ČÁST 1. Místo plnění: PČR Kriminalistický ústav Praha, Bartolomějská 10, Praha 1

Portfolio úložišť WD pro datová centra Kapacitní úložiště prošlo vývojem

Cloud Slovník pojmů. J. Vrzal, verze 0.9

Virtualizace koncových stanic Položka Požadováno Nabídka, konkrétní hodnota

Příloha č. 1 k Č.j.: OOP/10039/ Specifikace zařízení

Zkušenosti s budováním základního registru obyvatel

Experimentální systém pro WEB IR

Systémy pro sběr a přenos dat

Zálohování a rychlá obnova dat Konsolidace serverů a diskových polí Archivace elektronické pošty

VÝZVA K PODÁNÍ NABÍDKY. Ukládání, zálohování a archivace dat

Přednášky o výpočetní technice. Hardware teoreticky. Adam Dominec 2010

Copyright 2001, COM PLUS CZ a.s., Praha

Jakub Šesták. ESEJ DO PŘEDMĚTU DIGITÁLNÍ KNIHOVNY

vpsfree.cz: linuxový server u neziskovky

1 Webový server, instalace PHP a MySQL 13

Zadavatel: Česká republika Český statistický úřad Na padesátém 81/ Praha 10 Strašnice IČO:

Datová úložiště v MetaCentru a okolí. David Antoš

Modul. Univerzální tabulkový export

Citidea monitorovací a řídicí centrála pro smart řešení

Virtualizace jako nástroj snížení nákladů. Periodické opakování nákladů nové verze Licence na pevný počet klientů

Maturitní témata. Informační a komunikační technologie. Gymnázium, Střední odborná škola a Vyšší odborná škola Ledeč nad Sázavou.

NMS. Linux na Strahově. Radim Roška & Moris Bangoura InstallFest Silicon Hill

Představení Kerio Control

Úvod do počítačových sítí

Základní pojmy informačních technologií

1. Webový server, instalace PHP a MySQL 13

Servery Incad, stav k

prostředí IDS 11.5 na Martin Mikuškovic, ICZ a. s

Odbor informatiky a provozu informačních technologií

Obsah. Rozdíly mezi systémy Joomla 1.0 a Systém Joomla coby jednička online komunity...16 Shrnutí...16

Aktuální stav. Martin Kuba CESNET a ÚVT MU

Michal Andrejčák, Klub uživatelů ŘS MicroSCADA, Hotel Omnia Janské Lázně, SDM600 Stručný popis a reference.

SW ATTIS nástroje. HW a SW požadavky pro sw ATTIS. manažerského řízení. Verze manuálu: 3.5 Datum:

Video dohled bez limitů Made in Germany. Profesionální řešení. Záznamový a klientský software

PowerOPTI Řízení účinnosti tepelného cyklu

Specifikace předmětu veřejné zakázky

Výpočetní klastr pro molekulové modelování

Výměna Databázového serveru MS SQL

Transkript:

Databáze ve fyzice vysokých energií Vladimír Jarý 1 1 Fakulta jaderná a fyzikálně inženýrská ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE mailto:vladimir.jary@cern.ch InstallFest 2011 Školicí centrum Silicon Hill, Praha 5. března 2011

Přehled Experiment COMPASS 1 Experiment COMPASS 2 3

Představení experimentu COMPASS COMPASS: COmmon Muon and Proton Apparatus for Structure and Spectroscopy experiment s pevným terčem umístěný na urychlovači SPS (Super Proton Synchrotron) v laboratoři CERN [1] vědecký program: studium struktury a spektroskopie hadronů experimenty s hadronovým a s mionovým svazkem program schválen vědeckou radou CERN v roce 1997 instalace v letech 1999-2000, sběr dat od roku 2002 momentálně se čeká na schválení 2. fáze experimentu [3] (program na dalších cca 5 let) 240 vědců z 11 zemí česká účast: vývoj fotonásobičů pro detektor RICH, kryogenika polarizovaného terče, sběr dat

Popis experimentu Systém detektorů, svazek částic dopadá na terč zleva, délka spektrometru přibližně 60 m; obrázek převzat z [4]

Detekce částice interakcí částic svazku s polarizovaným terčem vznikají sekundární částice průlet částic detekován systémem detektorů: 1 měření energie částic (elektromagnetický, hadronový kalorimetr) 2 identifikace částic (RICH detektor) 3 určení trajektorie částice (různé druhy drátových komor) událost (event): data sesbíraná z různých detektorů popisující průlet částice cyklus urychlovače SPS: svazek (beam) není spojitý, skládá se z úseků (spills, bursts) systému pro sběr dat používá vyrovnávací paměti pro rozložení zátěže na celý cyklus urychlovače

Struktura systému pro sběr dat systém pro sběr dat (DAQ, data acquisition) se skládá z několika vrstev: 1 frontend elektronika detektorů ( 250000 kanálů) provádí načtení (readout) a digitalizaci dat načtení dat vyvoláno trigger systémem, který zároveň šíří identifikátor události a časovou značkou data z několika kanálů shromažd ována v modulech CATCH, GeSiCA, kde je doplněna subevent hlavička 2 ROB servery (readout buffers): klasické servery doplněné o spillbuffer PCI kartu slouží jako vyrovnávací pamět (využití pauzy mezi úseky) 3 EVB servery (event builders): klasické servery, spojené s ROB vrstvou prostřednictvím Gb Ethernetu využívají subevent hlaviček pro sestavení událostí metainformace o událostech uloženy do Oracle databáze vlastní soubory s událostmi odeslány na páskové permanentní úložiště CASTOR

Software pro sběr dat balík DATE (Data acquisition and test environment) [3] navržen pro experiment ALICE multiprocesorové distribuované prostředí důraz na škálovatelnost funkcionalita: readout a event building řízení toku dat (Event distribution manager EDM) řízení interaktivní konfigurace (nastavení v MySQL) dohled nad kvalitou dat, částečná online analýza (COOOL) ukládání deníku (MySQL databáze) filtrování událostí (Cinderella) operační systém: Scientific Linux CERN 4 distribuce založená na RHEL4 (vlastní repozitáře s CERN software, podpora pro AFS systém,... ) v současnosti probíhá migrace na SLC5 32b verze OS (s výjimkou databázových a NFS serverů)

Online a offline databáze 1 online databáze spravuje informace přímo související se sběrem dat využívána především operátory experimentu pro dohled a nastavení systému DATE servery umístěny v experimentální hale software: MySQL více na dalších stránkách prezentace... 2 offline databáze spravuje metasoubory s informacemi o událostech využívána při offline analýze dat servery umístěny ve výpočetním středisku (cca 5 km od experimentální haly) software: Oracle

Původní architektura online databáze dva fyzické databázové servery master master replikace (každý server je zároveň master a zároveň slave) klienti přistupují k serverům přes přes virtuální adresu, která ukazuje přímo na jeden z fyzických serverů při detekci výpadku serveru je virtuální adresa dočasně převedena na zbývající server Původní architektura

Problémy s původní architekturou během sběru dat v roce 2009 časté výpadky, pro rok 2010 očekávaný nárůst zátěže fyzický server spravuje 20 logických databází: beamdb20??: informace o svazku, detektorech DATE20??_log: chybová hlášení systému DATE runlb: deník další služby: web server Apache, dohledový systém Ganglia, server infologger problém: zastaralost serverů (HW i SW): SLC4 (linux 2.6.9, i386), MySQL 4.1.22 (úložiště MyISAM) 2 Intel Xeon @3 GHz, 4 GB RAM (resp. 1 Intel Xeon @3 GHz, 3 GB RAM) návrh řešení: rozdělit logické databáze na dva páry fyzických serverů, pátý server použít pro další služby

Popis nové architektury dodány pouze 3 nové servery dva servery použity pro MySQL, opět synchronizovány master master replikací třetí server pro pomocné úlohy: proxy server (MySQL Proxy) dohled (Nagios) web server (phpmyadmin, deník) Implementovaná architektura proxy server předává všechny dotazy na jeden ze serverů stejná virtuální adresa nyní ukazuje na proxy server přechod na novou architekturu je pro klienty transparentní

Migrace na novou architekturu proběhla výměna hardware i software: 2 Intel Xeon E5420 @2,5 GHz (2 4 jader), 16 GB RAM 64-bit SLC5 (linux 2.6.18), MySQL 5.1.45 instalace MySQL ze zdrojových kódů (povolena podpora pro velmi velké tabulky, pro dělené tabulky) přesun struktury a dat ze starých na nové servery pomocí klientských programů mysqldump a mysql východiskem pro nastavení serverů šablona my.cnf.huge: nastavení replikace, zaznamenávání pomalých dotazů, zvětšení limitu pro otevřené soubory test integrity dat: porovnání dumpů pomocí nástrojů md5sum a diff dumpy některých tabulek se lišily: příčinou byla změna definice type DECIMAL(m, n) nastavení MySQL Proxy a připojení klientů

Dohled a zálohování 1 Dohledový systém systém Nagios pro dohled na databázové servery (na ostatní DAQ servery dohlíží Ganglia) agent NRPE pro komunikaci mezi Nagiosem a monitorovanými servery sledování zatížení CPU, stav plánovače, volné místo na discích, stav MySQL serveru, stav replikace, teplota jader při detekci incidentu zaslán e-mail správcovi a případně vykonána nějaká akce (přeprogramování MySQL Proxy) 2 Typy záloh denní, hodinová: vytvářeny nástroji mysqldump, gzip inkrementální: binární log vytvářený při replikaci geografická: databáze je replikována do výpočetního centra

Shrnutí Experiment COMPASS migrace dokončena před začátkem sběru dat během testování se vyskytl problém s tabulkou s monitorovacími daty elektromagnetického kalorimetru několikrát došlo k uzamčení tabulky příčinou byla chyba v aplikaci Cinderella (online filtr) největší tabulka, obs. více než miliardu záznamů během sběru dat nezaznamenán žádný větší problém nové databázové aplikace (daqmon) nárůst objemu dat z 54 GB (duben) na 138 GB (listopad) prostor pro navýšení výkonu: využití MySQL Proxy pro distribuci zátěže dělené (partitioned) tabulky?

Literatura Experiment COMPASS P. Abbon et al. (the COMPASS collaboration): The COMPASS experiment at CERN, In: Nucl. Instrum. Methods Phys. Res., A 577, 3 (2007) pp. 455 518 Ch. Adolph et al. (the COMPASS collaboration): COMPASS-II proposal, CERN-SPSC-2010-014; SPSC-P-340 (May 2010) T. Anticic et al. (the ALICE collaboration): ALICE DAQ and ECS User s Guide. CERN, ALICE internal note, ALICE-INT-2005-015, 2005. COMPASS page [online]. 2010. Available at: http://wwwcompass.cern.ch