OP VVV CERIT-SC v den...

Podobné dokumenty
CERIT-SC reloaded. už se všichni těšíme. Seminář gridového počítání,

CERIT-SC. Luděk Matyska, David Antoš, Aleš Křenek

MetaCentrum. Tomáš Rebok MetaCentrum NGI, CESNET z.s.p.o. CERIT-SC, Masarykova Univerzita Olomouc,

MetaCentrum. Miroslav Ruda. březen 2017, Brno CESNET

Mycroft Mind. Sdružení průmyslových partnerů FI MU

Cloudy a gridy v národní einfrastruktuře

Národní gridová infrastruktura MetaCentrum & související služby pro akademickou obec

CERIT SCIENTIFIC CLOUD. Centrum CERIT-SC. Luděk Matyska. Praha, Seminář MetaCentra,

REGIONÁLN CENTRUM ELEKTROTECHNIKY RICE

MetaCentrum. Martin Kuba CESNET

Centrum a projekt CERIT-SC

METACENTRUM. Miroslav Ruda CESNET. Seminář MetaCentra, Praha

METACENTRUM. Miroslav Ruda CESNET. Konference CESNET, Praha

SUPERPOČÍTAČOVÉ CENTRUM. Luděk Matyska

Obecné výpočty na GPU v jazyce CUDA. Jiří Filipovič

Rozsáhlé projekty v energetice

Provozní statistiky centra CERIT-SC

Centrum CERIT-SC Tomáš Rebok

Vyhodnocení 2D rychlostního pole metodou PIV programem Matlab (zpracoval Jan Kolínský, dle programu ing. Jana Novotného)

MetaCentrum a náro (nejen matematické) výpočty

MetaCentrum. Aktuální stav anové služby

DETEKCE HRAN V BIOMEDICÍNSKÝCH OBRAZECH

TERMINOLOGIE ... NAMĚŘENÁ DATA. Radek Mareček PŘEDZPRACOVÁNÍ DAT. funkční skeny

Institut teoretické informatiky (ITI) na FI MU

MetaCentrum. Miroslav Ruda. listopad 2013 CESNET

Archeologický informační systém České republiky Národní infrastruktura pro správu a prezentaci archeologických dat

VK CZ.1.07/2.2.00/

CEITEC a jeho IT požadavky. RNDr. Radka Svobodová Vařeková, Ph.D.

Datová centra z pohledu univerzity. David Antoš Ústav výpočetní techniky Masarykova univerzita antos@ics.muni.cz

Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář,

PODPORA VÝZKUMU, VÝVOJE A INOVACÍ

ČVUT a spolupráce s průmyslem při výzkumu a vývoji

2D transformací. červen Odvození transformačního klíče vybraných 2D transformací Metody vyrovnání... 2

Algoritmy a struktury neuropočítačů ASN - P11

Analýza současného systému financování vysokých škol v ČR Aleš Bartušek Praha

H Spreading excellence and widening participation (SEWP) Naďa Koníčková

od myšlenek k aplikacím Marie Stehlíková, odd. rozvoj. aktivit

DZDDPZ3 Digitální zpracování obrazových dat DPZ. Doc. Dr. Ing. Jiří Horák Institut geoinformatiky VŠB-TU Ostrava

Tomáš Hudeček Zuzana Žáková

Služby ÚVT pro VaV & IT pro CEITEC. David Antoš

Analýza dat v GIS. Dotazy na databáze. Překrytí Overlay Mapová algebra Vzdálenostní funkce. Funkce souvislosti Interpolační funkce Topografické funkce

Mapování urbanizovaných ploch a úrovně jejich zastavění

Synergické efekty VaVpI projektů na VŠB-TU Ostrava

Strojové učení se zaměřením na vliv vstupních dat

KAPPA. Program Výzkum financovaný z Fondů EHP a Norska Martina Kalášková

METODY DOLOVÁNÍ V DATECH DATOVÉ SKLADY TEREZA HYNČICOVÁ H2IGE1

Počítačová chemie. výpočetně náročné simulace chemických a biomolekulárních systémů. Zora Střelcová

Přehled paralelních architektur. Dělení paralelních architektur Flynnova taxonomie Komunikační modely paralelních architektur

Aktualizace. Dlouhodobého záměru. součásti FEL. Západočeské univerzity v Plzni. na rok 2016

Možnosti podpory plošné inventarizace kontaminovaných míst interpretací multi- a hyperspektrálního snímkování Jana Petruchová Lenka Jirásková

Informatika a výpočetní technika 1. roč./1. sem. 1. roč./2. sem. 2. roč./3. sem. 1 kr. Povinné předměty pro obor IVT

Co by kdyby? Simulační prostředí pro BIG data v energetice. Filip Procházka, Masarykova Univerzita, Mycroft Mind, a.s. filip.prochazka@gmail.

Software Form Control

Paralelní a distribuované výpočty (B4B36PDV)

Testování statistických hypotéz

K metodám převodu souřadnic mezi ETRS 89 a S-JTSK na území ČR

Brno, Příprava budoucího období kohezní politiky EU 2014+

Česká konference rektorů. 3. prosince 2015

FOURIEROVA ANAL YZA 2D TER ENN ICH DAT Karel Segeth

Hlavní využití počítačů

Výpočetní zdroje v MetaCentru a jejich využití

Koncepce kandidáta na funkci děkana. pro období

CERIT-SC & CzechGlobe

Úvodní slovo studentům informatických oborů

Geekovo Minimum. Počítačové Grafiky. Nadpis 1 Nadpis 2 Nadpis 3. Božetěchova 2, Brno

Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence

David Marek 20. dubna 2012

PROCES PŘÍPRAVY A REALIZACE PROJEKTU

Střední průmyslová škola elektrotechnická a informačních technologií Brno

RFID laboratoř Ing. Jan Gottfried, Ph.D.

Národní centrum pro výzkum biomolekul & MetaCentrum

LinuxDays 2017 Ondřej Guth GNU grep LD 17 1 / 14

20. listopadu Flexibilita, Agregátor

Kryogenní elektronová mikroskopie aneb Nobelova cena za chemii v roce 2017

Architektury počítačů

Bezkontaktní měření Fotogrammetrie v automotive

Prediktivní regulace pro energetiku

Sítě SFN Systém pro analýzu a vizualizaci pokrytí a rušení vysílacích sítí

Gridy v České republice. Luděk Matyska Masarykova univerzita v Brně CESNET, z.s.p.o.

Dílčí závěry analýzy příčin nízkého zapojení států EU-13 do rámcových programů EU pro výzkum, vývoj a inovace

Automatické generování pozic optického skeneru pro digitalizaci plechových dílů.

Národní e-infrastruktura v ČR

Paralelní programování

SIFT: Scale Invariant Feature Transform Automatické nalezení korespondencí mezi dvojicí obrázků

Slezská univerzita v Opavě Filozoficko-přírodovědecká fakulta v Opavě

Matematika pro geometrickou morfometrii

analýzy dat v oboru Matematická biologie

Bezpečně Vás provedeme světem GIS. Možnosti a přínosy využití GIS při zpracování dat

Petrov, v. o. s. Masarykova univerzita. Inovace systému pro správu prodejních automatů

Financování a hodnocení výzkumu. Tomáš Opatrný PřF UP Olomouc

Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague

Modelování anelastické odezvy vlastních kmitů zemětřesení v Chile 2010

Internacionalizace, projekt Cluster COOP. Regionální setkání CluStrat; Cheb Ing. Hana Zvariková, CzechInvest

HMOTNOSTNÍ SPEKTROMETRIE - kvalitativní i kvantitativní detekce v GC a LC - pyrolýzní hmotnostní spektrometrie - analýza polutantů v životním

Akvizice dat. Dekonvoluce Registrace. zobrazení INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ

Energetická politika a rozvoj města Litoměřice. Podnikatelské Fórum Ústeckého kraje Ústí nad Labem, 21. září 2015

Czech National e-infrastructure. Projekt MetaCentrum. Jan Kmuníček CESNET. meta.cesnet.cz

Vyhodnocení alokace OP VVV ve vztahu k Harmonogramu výzev OP VVV Doplnění ke Strategickému realizačnímu plánu OP VVV 2017

1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15

Bludiště na cestě k přiměřenému zabezpečení zpracování osobních údajů

Transkript:

OP VVV CERIT-SC v den... infrastruktura a výzkum domácí Aleš Křenek, Tomáš Rebok, Barbora Bühnová, Jiří Filipovič, David Střelák, Jana Pazúriková, Mouzhi Ge, Hind Bangui, Jan Herman, Tomáš Raček, Lukáš Hejtmánek a další Seminář gridového počítání, 11.5.2018

Projekt OP VVV Projekt Masarykova univerzita trvání 5/2017 4/2021 rozpočet 100+ mil. Kč Inovace kapacit centra většina hardware z OP VaVpI (2011-14) morálně i fyzicky zastarává komplexní obnova, srovnatelná investice, vyšší výkon díky Moorovu zákonu (teoreticky 16 ) SMP a GPU clustery 2017, HD 2018, viz http://www.cerit-sc.cz/ Tzv. In-house research výzkum domácí systematický rozvoj expertizy potřebné k efektivnímu využití infrastruktury dva hlavní výzkumné směry velká data a intenzivní výpočty A. Křenek et al. (CERIT-SC) CERIT-SC infra a výzkum Seminář gridového počítání, 11.5.2018 2 / 19

Velká data Rozsáhlé úložné kapacity máme, užívejme je smysluplně A. Křenek et al. (CERIT-SC) CERIT-SC infra a výzkum Seminář gridového počítání, 11.5.2018 3 / 19

Velká data Rozsáhlé úložné kapacity máme, užívejme je smysluplně Analýza velkých dat Big Data jsou všude velká rozsahem, požadovanou rychlostí a komplexitou zpracování ale i nedostatkem struktury, nespolehlivostí, vágností zadání,... Cíle výzkumného programu vybudování obecných znalostí v oblasti zpracování a analýzy objemných dat aplikace v konkrétních oblastech, jejich kvalitativní posun s efektivním využitím infrastruktury A. Křenek et al. (CERIT-SC) CERIT-SC infra a výzkum Seminář gridového počítání, 11.5.2018 3 / 19

Velká data aplikace Kyberbezpečnost a kyberkriminalita iniciálně analýzy dat sít ového provozu postupně i hledání komplexních souvislostí v heterogenních datech projekty CopAS vytvořený framework pro analýzy dat v prostředí ElasticSearch (Policie ČR) ANALÝZA Komplexní analýza a vizualizace heterogenních dat velkého rozsahu (MV ČR) C4e centrum excelence výzkumu kyberkriminality (OP VVV) A. Křenek et al. (CERIT-SC) CERIT-SC infra a výzkum Seminář gridového počítání, 11.5.2018 4 / 19

Velká data aplikace Energetika (spolupráce s MycroftMind + ČEZ) komplexní zpracování dat kritických infrastruktur (smartmetery) Vědy o zemi (CzechGlobe) identifikace vadných senzorů v měřících datech Smart Cities (Brno) konkretizace témat Bioinformatika a strukturní biologie A. Křenek et al. (CERIT-SC) CERIT-SC infra a výzkum Seminář gridového počítání, 11.5.2018 5 / 19

Podobnosti v PDB Databáze Protein Data Bank I 3D struktury proteinu + další informace I 140+ tis. záznamu, 500+ tis. r ete zcu I Jak moc jsou si podobné? A. Kr enek et al. (CERIT-SC) CERIT-SC infra a výzkum Seminár gridového poc ítání, 11.5.2018 6 / 19

Podobnosti v PDB Posouzení podobnosti 3D struktura se příliš neliší různé metriky používáme GESAMT Q-score N 2 align Q = (1 + MSD(A, B)/R0 2)N AN B vyvažuje průměrnou vzdálenost α uhlíku a počet rozsah 0 kompletně jiné, 1 identické srovnání dvou struktur 0.01 1 s, naivní prohledání hodiny A. Křenek et al. (CERIT-SC) CERIT-SC infra a výzkum Seminář gridového počítání, 11.5.2018 7 / 19

Podobnosti v PDB Abstraktní formulace problému 10 4 10 6 bodů v mnohorozměrném prostoru nejsou absolutně umístěny (volnost rotace a posunutí) nelze přímo srovnat umíme posoudit podobnost vzdálenost dvojice pro nový bod hledáme nejbližší Strukturní biologie informatika velká data A. Křenek et al. (CERIT-SC) CERIT-SC infra a výzkum Seminář gridového počítání, 11.5.2018 8 / 19

Podobnosti v PDB Testovací data 65 tis. řetězců od správců PDB (splehlivé, unikátní) filtr na artefakty (havaruje výpočet Q-score) Orientační analýza vlastností metriky, pokrytí prostoru, četnosti vzdáleností,... Prohledávací algoritmus nemusí být zcela přesný řádově rychlejší používá předpočítané datové struktury A. Křenek et al. (CERIT-SC) CERIT-SC infra a výzkum Seminář gridového počítání, 11.5.2018 9 / 19

Podobnosti v PDB Je Q-score (resp 1/Q 1) metrika? A. Křenek et al. (CERIT-SC) CERIT-SC infra a výzkum Seminář gridového počítání, 11.5.2018 10 / 19

Podobnosti v PDB Je prostor dostatečně pokryt? A. Křenek et al. (CERIT-SC) CERIT-SC infra a výzkum Seminář gridového počítání, 11.5.2018 11 / 19

Podobnosti v PDB Algoritmus 1. Předpočítání Q-score všech dvojic z referenční sady R 2. Pro novou strukturu t vyber k náhodných kandidátů r i R, spočítej q i = Q(t, r i ) 3. Pro q i θ hledej v {r j R : Q(r j, r i ) > θ} 4. Pro q i < θ hledej v {r j R : q i ɛ Q(r j, r i ) q i + ɛ} Volbou počtu k, prahu θ a tolerance ɛ ovlivňujeme přesnost a rychlost algoritmu A. Křenek et al. (CERIT-SC) CERIT-SC infra a výzkum Seminář gridového počítání, 11.5.2018 12 / 19

Podobnosti v PDB Předběžné výsledky (malá sada R = 14000) ɛ = 0.4, 6 ɛ = 0.25, 13 A. Křenek et al. (CERIT-SC) CERIT-SC infra a výzkum Seminář gridového počítání, 11.5.2018 13 / 19

Intenzivní výpočty Neplýtvejme výkonem našich strojů A. Křenek et al. (CERIT-SC) CERIT-SC infra a výzkum Seminář gridového počítání, 11.5.2018 14 / 19

Intenzivní výpočty Neplýtvejme výkonem našich strojů Optimalizace kódu ze dvou pohledů natvrdo zachováme postup výpočtu snažíme se maximálně využít kapacitu hardware autotuning více alternativních implementací, za běhu se vybírá nejlepší kombinace naměkko měníme postup výpočtu i numerický model vyloučíme zbytečné výpočty změny implementace dovolí agresivnější tvrdé optimalizace výsledky jsou jiné, ale ohlídáme, že to nevadí A. Křenek et al. (CERIT-SC) CERIT-SC infra a výzkum Seminář gridového počítání, 11.5.2018 14 / 19

Rekonstrukce 3D v CryoEM Single Particle Analysis rychlé zmrazením vzorku amorfní led biomolekuly v nativním stavu náhodná konformace a natočení v 3D nízký odstup signálu od šumu A. Křenek et al. (CERIT-SC) CERIT-SC infra a výzkum Seminář gridového počítání, 11.5.2018 15 / 19

Rekonstrukce 3D v CryoEM Komplexní postup zpracování korekce deformace a pohybu vzorku klasifikace ve 2D zarovnání a průměrování (potlačení šumu) rekonstrukce 3D A. Křenek et al. (CERIT-SC) CERIT-SC infra a výzkum Seminář gridového počítání, 11.5.2018 16 / 19

Rekonstrukce 3D v CryoEM Rekonstrukce 3D projekce snímku (2D) do prostoru (3D) interpolace pixelů snímku do 3D mřížky scater vs. gather přímočarý postup scatter příliš mnoho zápisů konflikty při jemnozrnné paralelizaci (GPU) Fourierova transformace, hledání nejlepšího zarovnání,... A. Křenek et al. (CERIT-SC) CERIT-SC infra a výzkum Seminář gridového počítání, 11.5.2018 17 / 19

Rekonstrukce 3D v CryoEM Výsledky GPU implementace scatter zrychlení 2.85 proti CPU NVidia P100 vs. 24 jader Intel Xeon E5-2650 v4 GPU implementace gather zrychlení 11.4 škáluje na 4 GPU zrychlení 31.7 nedává stejné výsledky, rozdíly jsou zanedbatelné A. Křenek et al. (CERIT-SC) CERIT-SC infra a výzkum Seminář gridového počítání, 11.5.2018 18 / 19

Poděkování Jmenovaní i utajení členové týmu a studenti Chlebodárci OP VVV CERIT-SC, CZ.02.1.01/0.0/0.0/16_013/0001802 H2020 West-life, 675858 A. Křenek et al. (CERIT-SC) CERIT-SC infra a výzkum Seminář gridového počítání, 11.5.2018 19 / 19