Datová centra z pohledu univerzity David Antoš Ústav výpočetní techniky Masarykova univerzita antos@ics.muni.cz
Úvod A data center or datacenter (or datacentre), also called a server farm, is a facility used to house computer systems and associated components, such as telecommunications and storage systems. http://en.wikipedia.org/wiki/data_center ovšem na datovém centru univerzity není nic zvláštního... má servery, datová úložiště, klimatizaci... dokud se nezačneme bavit o jeho službách a uživatelích
Ústav výpočetní techniky (ÚVT) ústav Masarykovy univerzity výzkum, vývoj a provoz systémů v oblastech služby datových a hlasových sítí celouniverzitní počítačové studovny ekonomicko-správní a exekutivní informační systémy podpora náročných výpočtů a velkokapacitních datových úložišť knihovní systémy a elektronické informační zdroje počítačová bezpečnost archiv obrazových dat nemocnic v Brně archiv českého webu... spolupráce s Fakultou informatiky
Superpočítačové centrum Brno (SCB) součást ÚVT integrovaná v infrastruktuře MetaCentra (CESNET) většina znalostí o provozu infrastruktury MetaCentra je v SCB celé MetaCentrum cca 1500 výpočetních jader v clusterech Brno, Plzeň, České Budějovice, Praha zapojeno v mezinárodních aktivitách EGEE, EGI, EUAsiaGrid, EPIKH,... poskytuje výpočetní výkon a prostor pro data pro akademické pracovníky provádí výzkum a vývoj v gridovém počítání
Standardní praxe univerzitního zacházení s IT souvisí s modelem financování zdroje vysoké školy za studenty hradí běžnou výuku a provoz souvisejících systémů z grantů umožňuje nákupy speciální techniky včetně výpočetní nepříjemný aspekt pro výstavbu IT podpory: výzkum nelze plánovat riziko neúspěchu přebírá někdo bohatý : grantová agentura
Důsledky modelu financování na univerzitě I skupiny s potřebou výpočetního výkonu si jej často pořizují samy nevhodné umístění syndrom racku v koutě laboratoře amatérská správa princip obětování doktorského studenta neefektivní vzhledem k skutečnému průběhu výpočetních potřeb neumožňuje sdílení zátěže situace se začíná zlepšovat totéž platí pro data od skříně s CD-R po diskové pole pod stolem občas jsou požadavky grantových agentur nesmyslné např. data se nesmějí uchovávat mimo budovu
Důsledky modelu financování na univerzitě II zdroje financí na pořízení a provoz jsou oddělené peníze na provoz se někde vezmou na fakultě přece máme zásuvky výzkumníci v oborech s horšími možnostmi financování pracují se zoufalým zabezpečením, např. data ukládaná na přenosných discích data na jednom PC bez zálohy
Náročnost provozu centralizovaných služeb i přesto náročnost provozu narůstá Rok Příkon sálů ÚVT (v kw) 1998 110 2004 200 2009 330 zahrnuje služby pro MU a PoP CESNETu pro Brno prostor pro zařízení s nízkou spotřebou
Úskalí průzkumu požadavků zkušenosti z průzkumu pro projekt CEITEC, část vědy o živé přírodě realita povědomí o IT potřebách při průzkumu požadavků nic nepotřebujeme nic nepotřebujeme, jen nám z tohoto přístroje vypadnou 2 TB dat denně celé zpracování se dělá na strojích, co dodají s přístrojem, občas to chceme přepočítat, na to budou potřeba nějaké počítače? výsledný odhad objemu dat vytvořených CEITECem: 5 PB vlastní v projektu plánovaná kapacita je méně než pětinová
Datové centrum a jeho služby datovým centrem rozumíme provozování a rozvoj stávajících činností ÚVT pro univerzitu a budování gridové a superpočítačové části národní infrastruktury v projektu CERIT datové centrum na univerzitě má smysl pouze podpořené masivním programem školení uživatelů zejména těch, kteří si myslí, že (téměř) nic nepotřebují ÚVT zahájilo projekt Vzdělávání akademických pracovníků v oblasti einfrastruktur přehledová a specializovaná školení uživatelů z univerzity o většině oblastí pokrytých ÚVT s cílem minimalizovat duplikování centrálně poskytovaných služeb lokálními skupinami
CERIT I připravovaný projekt OP VaVpI jako součást národní infrastruktury pro vědu a výzkum ÚVT, Fakulta informatiky MU, Jihomoravský kraj a komerční partneři prostředí pro spolupráci fakulty s výzkumnými odděleními firem a superpočítačové vybavení rozšíření budovy snadná fyzická dostupnost uživatelé: výzkum a vývoj (CzechGlobe, CEITEC,... )
CERIT II přidělování prostředků interním grantovým výborem data cca 16 PB raw, 6400 jader v SMP nebo ekvivalent v jiné než clusterové architektuře, 3000 jader v HDC virtualizované výpočetní zdroje umožňují uživatelské prostředí na míru v gridové části podobné prostředí připravujeme v MetaCentru doplněno nezbytným programem školení a podpory uživatelů
Shrnutí lidé z průmyslu obvykle utrpí kulturní šok systém financování výzkumu a vývoje vede na značný individualismus v zajišťování IT podpory obvykle neexistují standardní politiky pro zacházení s daty řešitel grantu má (a musí mít) značnou autonomii v prostředí univerzity lze řešit jedině systémem školení a vzdělávání a dostupného a spolehlivého prostředí pro ukládání dat a výpočty... plánovaného v projektu CERIT
Projekt Vzdělávání akademických pracovníků v oblasti einfrastruktur je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky.