CHEMICKÝ PROSTOR. IVAN ČMELO a,b a DANIEL SVOZIL a,b. Obsah. 2. Strukturní reprezentace chemického prostoru. 1. Rozsah chemického prostoru
|
|
- Jaroslav Müller
- před 6 lety
- Počet zobrazení:
Transkript
1 CHEMICKÝ PROSTOR IVAN ČMELO a,b a DANIEL SVOZIL a,b a CZ-OPENSCREEN: Národní infrastruktura pro chemickou biologii, Ústav molekulární genetiky AV ČR v.v.i. Vídeňská 1083, Praha 4, b CZ-OPENSCREEN: Národní infrastruktura pro chemickou biologii, Laboratoř informatiky a chemie, Fakulta chemické technologie, Vysoká škola chemicko-technologická v Praze, Technická 5, Praha 6 cmeloi@vscht.cz Došlo , přijato Klíčová slova: chemický prostor; chemické knihovny; počítačový návrh molekul Obsah 1. Rozsah chemického prostoru 2. Strukturní reprezentace chemického prostoru 3. Souřadnicová reprezentace chemického prostoru 4. Síťová reprezentace chemického prostoru 5. Významné oblasti chemického prostoru 6. Pohyb v chemickém prostoru 7. Závěr 1. Rozsah chemického prostoru Chemický prostor je, ve svém nejširším slova smyslu, množinou všech molekul dostatečně stálých na to, aby mohly za reálných podmínek existovat 1. Množství takovýchto stálých molekul je ze všech praktických hledisek nezměrné. I odhady týkající se toliko množství struktur potenciálních léčiv se řádově liší v závislosti na zdroji 2 4, bez výjimky však jde o astronomicky velká čísla. Jen počet možných struktur s molekulovou hmotností pod 500 Da je odhadován na molekul 1. Ani takto omezenou množinu struktur nelze reálně připravit celou. Pokud by se celý proces návrhu, syntézy a následné izolace nové molekuly zrychlil v průměru na jednu vteřinu, příprava takové kompletní chemické knihovny malých molekul by trvala přes let. Pokud bychom nevyžadovali syntézu sloučenin v chemickém prostoru a spokojili bychom se pouze s vyčíslením všech struktur, které ho tvoří, tak ani s dnešními výpočetními prostředky bychom nedosáhli kýženého výsledku v reálně dosažitelném čase. Dosud největším projektem v tomto směru je databáze GDB-17 (cit. 5 ), kompletní vyčíslení všech chemických struktur s velikostí 17 a méně atomů C, N, O, S, F, Cl, Br a I obsahující struktur. Pro značnou část prováděného výzkumu jsou navíc z časových a ekonomických důvodů relevantní pouze molekuly, které je možno zakoupit či jiným způsobem získat z katalogu výrobce či distributora. Tuto množinu látek nazýváme komerčně dostupným chemickým prostorem. Představu o jeho velikosti nám může poskytnout databáze ZINC, která agreguje látky z katalogů většiny výrobců a dodavatelů 6. ZINC v současné době (červen 2017) obsahuje 387 milionů komerčně dostupných látek, což velikostí odpovídá 2,3 databáze GDB-17, a prakticky nekonečně malému zlomku odhadované velikosti celého chemického prostoru. Chemický prostor je tedy ze všech praktických hledisek nespočetně velký a je tudíž použitelný toliko jako abstrakce a kontext sjednocující v praxi využívaná zobrazení, postupy a metody. V tomto článku stručně popíšeme ústřední paradigmata založená na chemickém prostoru spolu s metodami, které je využívají. 2. Strukturní reprezentace chemického prostoru Chemiky běžně používanou reprezentací částí chemického prostoru jsou generické (Markushovy) vzorce, jejichž použití v patentech úspěšně obhájil Eugene A. Markush již v roce 1924 (cit. 7 ). Generické vzorce sestávají z hlavní (rodičovské) struktury, na kterou se ve vyznačených oblastech váží substituenty z předdefinovaných množin (obr. 1). Generické vzorce tak definují místo jedné konkrétní struktury celou množinu chemických struktur. Z hlediska chemického prostoru tedy Markushovy vzorce Obr. 1. Markushův vzorec převzatý z patentové přihlášky na tricyklické modulátory androgenního receptoru 8. Množiny možných substituentů byly pro názornost zjednodušeny: R 1 = {F, Cl, Br, I, NO 2, OR 2, SC 1-8, SOC 1-8, SO 2 C 1-8, N(C 1-8 )C 1-8 }, R 2-8 = {F, Cl, Br, I, CH 3, CF 3, CHF 2, CH 2 F, CF 2 Cl, CN, CF 2 OC 1-8, CH 2 OC 1-8, OC 1-8, SC 1-8, SOC 1-8, SO 2 C 1-8, C 1-8, N(C 1-8 )C 1-8 }, R 9-10 = {{F, Cl, Br, I, CN, OC 1-8, N(C 1-8 )C 1-8, C m (C 1-8 ) 2m m = (0;1;2)}}, OC 1-8, SC 1-8, SOC 1-8, SO 2 C 1-8, N(C 1-8 )C(O)C 1-8, C 1-8 }, X, Z = {O, S, NC 1-8 }, Y = {O, S, NC 1-8, C(C 1-8 )C 1-8 }, n = {1, 2} 724
2 umisťují pod patentovou ochranu místo jednotlivých bodů (struktur) celé oblasti chemického prostoru. Patentové krytí Markushovými vzorci definovaných oblastí chemického prostoru umožňuje najednou patentovat celou připravenou chemickou sérii, přímým důsledkem jejich používání je však také možnost patentovat navrhovatelem dosud nesyntetizované, tj. zcela virtuální struktury 7. Například Markushův vzorec na obr. 1 pochází z patentové přihlášky na tricyklické modulátory androgenního receptoru 8 a, ačkoliv má zde pro názornost zjednodušenou množinu možných substituentů, může i v této formě kombinatoricky vzato pokrývat více než jednotlivých struktur. Nelze očekávat, že by držitel tohoto patentu skutečně syntetizoval a izoloval každou z tímto patentem chráněných struktur. Užívání Markushových vzorců v patentech má také dopad na prohledávání chemického prostoru v patentových databázích. Úplná kombinatorická enumerace každého registrovaného Markushova vzorce by byla z hlediska úložných kapacit velmi náročná, do databází se tedy většinou ukládá samotný Markushův vzorec a jen několik z mnoha možných explicitních struktur 7. Patentem chráněná oblast chemického prostoru se tedy v databázi projeví jen jako několik bodů (explicitních struktur), což může při vyhledávání patentů podle uživatelem zadané struktury vést k falešně negativním výsledkům. I navzdory stále se vyvíjející metodologii zůstává vyhledávání struktur v patentových databázích, a tudíž i strukturně orientované patentové rešerše, netriviálním problémem 7. Reprezentace chemického prostoru založená na samotných chemických strukturách je historicky nejstarší, pracuje s nejmenší mírou abstrakce a nejlépe tak reflektuje realitu. Na ostatní reprezentace chemického prostoru, zejména na souřadnicové a síťové, lze pohlížet jako na vyšší abstrakce nad strukturní reprezentací chemického prostoru. Strukturní reprezentace má přímý chemický význam, zatímco ostatní reprezentace bývají zaváděny a používány primárně pro zpřístupnění chemického prostoru výpočetním a statistickým metodám. 3. Souřadnicová reprezentace chemického prostoru Chemický prostor je jakožto množina všech stálých molekul sám o sobě bezrozměrný. Při vizualizaci částí chemického prostoru a tvorbě predikčních modelů je však praktické tuto množinu nebo její části nějakým způsobem dimenzionalizovat. Intuitivním přístupem k dimenzionalizaci chemického prostoru je rozmístění molekul jako bodů do prostoru podle jejich deskriptorů 9 (obr. 2a). Známých deskriptorů je však příliš mnoho a pokud by každý z nich tvořil jednu osu v naší vizualizaci chemického prostoru, vzniklý prostor by obsahoval velké množství dimenzí. Velké množství dimenzí prostoru pak způsobuje řídké rozmístění bodů (v našem případě molekul), což velmi ztěžuje aplikaci výpočetních metod opírajících se o statistickou významnost. Tento jev je znám napříč mnoha se statistikou pracujícími obory jako tzv. prokletí dimenzionality (curse of dimensionality). Přirozeným způsobem redukce počtu dimenzí je cílený výběr rysů, které poskytují pro daný model nebo vizualizaci nejvíce relevantní informace (feature selection). O výběru rysů lze uvažovat jako o výběru pro daný účel nejvíce relevantních dimenzí (tedy deskriptorů) z nespočetného množství potenciálních dimenzí chemického prostoru, čímž vzniká jeho méněrozměrná reprezentace, ve které se bude daná vizualizace nebo model pohybovat (obr. 3). Výběr rysů z mnohadimenzionálních dat se v oblasti strojového učení běžně provádí například obalovacími (wrapper) a filtračními (filter) metodami 10. Při výběru Obr. 2. Schematické znázornění souřadnicové (a) a síťové (b) reprezentace chemického prostoru. Body zde zastupují chemické struktury. Osy v souřadnicové reprezentaci chemického prostoru znázorňují arbitrární počet kvantitativních vlastností (deskriptorů) molekul, podle kterých je možno chemické struktury promítat do prostoru. Spojnice mezi molekulami v síťové (b) reprezentaci chemického prostoru (hrany grafu) značí jejich významný vztah 725
3 Obr. 3. Jednoduchá dvourozměrná reprezentace části chemického prostoru. Vyobrazeno je 100 inhibitorů androgenního receptoru (zvýrazněné čtverce) mezi 1000 náhodně vybranými komerčně dostupnými látkami. Vynesenými veličinami jsou molární hmotnost a rozdělovací koeficient oktanol-voda, obě jsou asociované s Lipinského pravidlem pěti pro biologickou dostupnost látek při perorálním podání 12 vhodných deskriptorů se všek přihlíží i k jejich chemickému významu. Jedním z takto významných deskriptorů je polární povrch molekuly (polar surface area; PSA), který silně souvisí se schopností molekuly překonávat buněčné membrány, a navíc je poměrně dobře odhadnutelný přímo ze strukturního vzorce molekuly jako tzv. topological polar surface area (TPSA) 9. PSA je tedy z farmakokinetického hlediska zvláště zajímavý deskriptor, a je proto přednostně zahrnován do modelů a vizualizací spojených s návrhem léčiv či jiných biologicky aktivních látek. Další podobně farmakokineticky významné deskriptory jsou např. molekulová hmotnost, rozdělovací koeficient oktanol-voda (obr. 3), molární refraktivita, počet donorů a akceptorů vodíkové vazby či počet rotovatelných vazeb. Existují také celé předdefinované množiny vzájemně se doplňujících deskriptorů, sestavené za účelem zjednodušení interpretace na nich založených vizualizacích a modelech. Mezi ně patří např. tzv. molecular quantum numbers (MQN), což je 42 celočíselných deskriptorů reflektujících počty různých typů atomů, vazeb, kruhů a nábojů v charakterizované molekule 11. Reprezentace chemického prostoru o řádově desítkách dimenzí, tedy i zmíněný 42-dimenzionální prostor MQN, je již možno výpočetně zpracovávat a vytvářet v nich predikční modely. Problémem však zůstává vizualizace chemického prostoru, která by kvůli uživatelské čitelnosti neměla mít více než tři rozměry. Přímý výběr maximálně tří vlastností molekul zřídka poskytuje odpovídající reprezentaci chemického prostoru. Přistupuje se tedy k tvorbě nových dimenzí tvořených vhodnými kombinacemi reprezentovaných dimenzí. Zavedenou statistickou metodou pro tvorbu takovýchto nových dimenzí je analýza hlavních komponent (principal component analysis, PCA). V PCA jsou původní dimenze lineární kombinací převedeny na nové dimenze (tzv. hlavní komponenty) s cílem postihnout co největší množství informace obsažené v původním n-dimenzionálním prostoru pomocí co nejmenšího množství hlavních komponent. Prostřednictvím PCA je tedy možno pro danou množinu chemických struktur popsaných větším množstvím kvantitativních deskriptorů (např. 42 MQN) sestavit jejich nejvěrnější možnou dvou- či třídimenzionální vizualizaci (obr. 4). V souřadnicové reprezentaci chemického prostoru se kromě vizualizací pohybuje i široká škála cheminformatických metod. Jednoduché filtry založené na mezních hodnotách kvantitativních rysů molekul, např. obecně známé Lipinského pravidlo pěti 12, je možno v souřadnicové reprezentaci chemického prostoru vnímat jako plochy rozdělující chemický prostor na filtru odpovídající a neodpovídající (z hlediska filtru vhodné a nevhodné) části. Na mnoho cheminformatických metod lze v obecném kontextu chemického prostoru pohlížet jako na modely, které na základě definované výchozí množiny kvantitativních rysů molekul (známých souřadnic) v chemickém prostoru odhadují jejich další rysy (neznámé souřadnice). Odhadované rysy molekul mohou být téměř jakékoliv, od ryze fyzikálně-chemických metrik jako bod tání až po emergentní rysy jako prostupnost biologickými membránami či dokonce afinitu k danému biologickému receptoru (často farmakologickému cíli)
4 Obr. 4. Chemický prostor definovaný 42 celočíselnými deskriptory MQN zredukovaný do dvoudimenzionálního zobrazení prostřednictvím PCA. Vyobrazena je stejná množina jako u obr. 3, tedy 100 inhibitorů androgenního receptoru (zvýrazněné čtverce) mezi 1000 náhodně vybranými komerčně dostupnými látkami. Z farmakologického hlediska jsou zajímavé oblasti chemického prostoru s největším hustotou aktivních látek relativně k neaktivním, v této zjednodušené projekci by takovou oblast mohl vymezovat shluk aktivních látek v okolí [2;0] 4. Síťová reprezentace chemického prostoru Alternativou k souřadnicové reprezentaci chemického prostoru je reprezentace chemického prostoru jako sítě (chemical space network, CSN), ve které jsou molekuly uspořádány nikoliv podle svých kvantitativních rysů, ale podle vzájemných relací 14. Síťová reprezentace chemického prostoru umožňuje nasadit na chemickou problematiku aktuální metody a modely vycházející z teorie grafů, do jejichž vývoje a popisu bylo v posledních letech investováno mnoho prostředků vlivem rozvoje webové analytiky a sociálních sítí 14. Vzdálenost dvojice molekul v síťové reprezentaci není určena rozdíly jejich kvantitativních rysů, jak tomu je u souřadnicové reprezentace, nýbrž charakterem a/nebo mírou jejich vztahu (obr. 2b). Velmi často používaným vztahem je strukturní podobnost molekul, kterou lze popsat mnoha různými způsoby 9. I široce využívanou funkci podobnostního vyhledávání struktur implementovanou v řadě chemických databází je možno interpretovat jako procházení síťové reprezentace prohledávané databáze, kde se v síti vzájemných podobností vybírají nejbližší sousedé zadané struktury. Strukturní podobnost molekul samozřejmě není jediným používaným základem síťové reprezentace chemického prostoru. Molekuly je možno v síťové reprezentaci asociovat na základě libovolných kvantitativních i kvalitativních metrik. Příkladem v praxi používané metriky přímo nesouvisející s chemickou strukturou je asociace molekul založená na jejich sdílených emergentních vlastnostech, zvláště pak jejich biologické aktivitě. Takto definovaná síťová reprezentace chemického prostoru tedy spolu asociuje molekuly, které mají podobné interakce se specifickými farmakologickými cíli a/nebo biologickými systémy obecně. Veřejně dostupnou databází agregující takovéto pozorované i predikované interakce mezi chemickými látkami a bílkovinami je STITCH (cit. 15 ). STITCH tedy popisuje agregované interakce prostřednictvím heterogenní síťové reprezentace chemického prostoru. Vzájemné vztahy molekul v síťové reprezentaci chemického prostoru je možno přímo vizualizovat jako graf, ve kterém jsou jednotlivé molekuly znázorněny jako vrcholy a jejich vztahy jako hrany grafu (obr. 5). Hrany grafu často reprezentují pouze vztahy, jejichž velikost přesahuje zvolenou mezní hodnotu 14. Vrcholy i hrany takto vizualizovaného grafu mohou svou zobrazovanou tloušťkou nebo kolorací nést dodatečnou informaci o samotných látkách a o síle či charakteru vztahů mezi nimi (obr. 6). 5. Významné oblasti chemického prostoru Objev farmakologicky či jinak zajímavých oblastí, jejich omezení prostřednictvím strukturní, souřadnicové nebo síťové reprezentace a následné vzorkování takto vymezených oblastí je konceptuálním základem mnoha cheminformatických postupů, zejména pak virtuálního screeningu pro sestavování chemických knihoven zaměřených (focused) na konkrétní biologickou aktivitu 16. Navrhované chemické knihovny musí často setrvávat v komerčně do- 727
5 Obr. 5. Vizualizace vzájemných strukturních podobností ve stejné množině jako na obr. 3 a obr. 4, tedy inhibitorů androgenního receptoru (zvýrazněné body) mezi náhodně vybranými komerčně dostupnými látkami. Jsou zde patrné ostře ohraničené oblasti strukturně podobných aktivních látek. Strukturní podobnost je zde definována jako Tanimotova podobnost strukturních fingerprintů s mezní hodnotou 0,75. V podobné reprezentaci chemického prostoru se pohybuje i algoritmus Molpher, který by zde bylo možno využít k bližšímu zmapování shluků aktivních látek. Podobnostní síť je dvourozměrně vizualizována metodou Kamada-Kawai Obr. 6. Vizualizace heterogenní síťové reprezentace chemického prostoru založené na vzájemných interakcích chemických látek a proteinů. Tento graf byl generován databází STITCH 15 pro nejsilnější interakce lidského androgenního receptoru (AR). Síla hran grafu koresponduje se silou asociace jí spojených vrcholů, odstín odráží charakter interakce stupné oblasti chemického prostoru, tedy v množině všech molekul dostupných v katalozích výrobců nebo dodavatelů. Setrvání v této části chemického prostoru je nutné, pokud do pracovního postupu nemůže být začleněna syntéza zcela nových látek z finančních, časových nebo organizačních důvodů. Jako množina komerčně dostupných látek je v mnoha pracovních postupech používána výše zmíněná databáze ZINC (cit. 6 ). Nadmnožinou komerčně dostupné oblasti chemického prostoru je tzv. synteticky dostupná oblast chemického prostoru. Jde o oblast chemického prostoru adekvátně dosažitelnou stávajícími syntetickými metodami. Tu je třeba zohlednit při počítačovém návrhu nových chemických struktur, které, ač stabilní, mohou být velmi náročné na syntézu. Nejhodnotnějším odhadem syntetické dostupnosti daných struktur je přirozeně odborné stanovisko samotných chemiků. Některé současné výpočetní metody však mohou navrhovat řádově desetitisíce struktur denně 17, jejichž ruční zpracování by představovalo neúnosnou časovou a finanční zátěž. Pro adresování tohoto problému jsou vyvíjeny výpočetní metody odhadu chemické dostupnosti struktur, které na základě v nich obsažených strukturních fragmentů odhadují jejich syntetickou dostupnost jako numerické skóre 18. Z hlediska vývoje léčiv je velmi zajímavá oblast chemického prostoru obsahující látky biologicky dostupné při ústním podání, jejíž nejznámější jednoduchou aproximací je již výše popsané Lipinského pravidlo pěti 12. Tato definice oblasti molekul biologicky dostupných při perorálním podání vyniká jednoduchostí aplikace a interpretace, svým velmi zobecňujícím charakterem však nevyhnutelně opomíjí mnoho dalších faktorů souvisejících s biologickou dostupností. Jeho příliš striktní aplikace může vést k promarněným farmakologickým příležitostem, což dokazuje další oblast chemického prostoru hodná zvláštní pozornosti oblast přírodních látek. Přírodní látky jsou často biologicky aktivní i dostupné, ač nesplňují Lipinského pravidla 19. Objev a vymezení oblastí chemického prostoru se silným zastoupením molekul zcela nevhodných pro dané použití má také hodnotu v podobě prostředků, které je možno ušetřit časným vyřazením těchto oblastí z pracovního postupu. Pro účely farmakologického výzkumu jsou takovéto nevhodné oblasti typicky asociované s vysokou toxicitou. Důvody vyřazování oblastí chemického prostoru však nemusí spočívat jen ve fyzikálně-chemických vlastnostech nebo nežádoucí biologické aktivitě v nich obsažených molekul. Zejména vyhýbání se patenty chráněným oblastem chemického prostoru je často nevyhnutelnou součástí farmakochemické praxe. Oblast chemického prostoru definovanou ve strukturní, souřadnicové nebo síťové reprezentaci bývá v některých případech vhodné převést na množinu konkrétních struktur. Pokud je např. při vývoji nových léčiv identifiko- 728
6 vána oblast se zvýšenou hustotou molekul s požadovanou biologickou aktivitou, je pro ni třeba sestavit reprezentativní množinu struktur dostatečně malou na to, aby bylo možno ji posunout do náročnějších kroků pracovního postupu. Tato množina musí identifikovanou oblast chemického prostoru reprezentovat co možná nejvěrněji omezeným počtem struktur. Reprezentativní množinu je možno snadno sestavit náhodným vzorkováním, lepších výsledků lze však dosáhnout použitím vzorkování maximalizujícího rozmanitost vybrané reprezentativní množiny (diversity sampling). Metoda tvorby výchozí množiny ke vzorkování se odvíjí od používané reprezentace chemického prostoru. Explicitní výčty struktur jako chemické databáze či jejich části lze vzorkovat přímo. Ze strukturních reprezentací oblastí chemického prostoru využívajících Markushovy vzorce nebo strukturní fragmenty je možno výchozí množinu struktur vytvářet kombinatoricky. Ze souřadnicově a síťově reprezentovaných oblastí chemického prostoru je výchozí množinu struktur nutno generovat algoritmicky. Níže popsané metody algoritmického procházení chemického prostoru jsou jedním z možných přístupů k tvorbě výchozí množiny struktur ze specifické oblasti chemického prostoru. 6. Pohyb v chemickém prostoru Chemický prostor je ze své podstaty nespojitý a pohyb v něm lze provést pouze přechodem z jedné stálé chemické struktury na jinou. Jediným skutečným způsobem pohybu v chemickém prostoru jsou tak chemické reakce. Přechod reaktantů na produkty znamená strukturní změnu, která se v chemickém prostoru projeví jako změna pozice, tedy pohyb. Možnosti reálného pohybu v chemickém prostoru jsou tudíž limitovány přímo uskutečnitelností odpovídajících chemických reakcí. Náročnost jednotlivých reakcí v praxi velmi kolísá a návrh vhodného sledu posunů chemickým prostorem do zamýšleného místa (konečného produktu) je pro chemiky do značné míry intuitivním procesem, který je obtížné algoritmicky uchopit. Přesto však již existují automatizované služby, které na základě dat o komerčně dostupných látkách a zdokumentovaných reakcích asistují chemikům především při tzv. retrosyntetické analýze, tedy hledání vhodného postupu syntézy zamýšlené molekuly z komerčně dostupných látek 20. V perspektivě chemického prostoru je retrosyntetická analýza snahou najít co nejjednodušší cestu odkudkoliv z komerčně dostupného chemického prostoru do jednoho cílového bodu v synteticky dostupné oblasti chemického prostoru. Kontrastem k retrosyntetické analýze je syntéza nových látek cílená na maximalizaci jejich chemické rozmanitosti (diversity-oriented synthesis, DOS) 21. Úkolem DOS je co nejlépe využít limitovaných výchozích látek (bodů) v komerčně dostupném chemickém prostoru tak, aby produkty jejich vzájemných reakcí rovnoměrně pokryly předdefinovanou zájmovou oblast chemického prostoru. Pokrytí zájmové oblasti je možno vizuálně reprezentovat a navádět prostřednictvím výpočetních metod (např. PCA) zvolených podle používané definice chemické rozmanitosti. Tento postup se uplatňuje především při tvorbě nových chemických knihoven 21. V chemickém prostoru se lze pohybovat i zcela virtuálně, tedy provádět strukturní změny, které neodpovídají žádné uskutečnitelné chemické reakci. Tento přístup obětuje syntetickou interpretovatelnost reálného pohybu v chemickém prostoru za umožnění jednoduššího a svobodnějšího procházení zájmových oblastí chemického prostoru. Procházení chemickým prostorem zde bývá realizováno algoritmicky řízenými strukturními změnami jako přidání či odebrání atomu nebo tvorba, zánik a přesun chemických vazeb. Jedním z novějších algoritmů pro takovýto de novo průzkum chemického prostoru je DAECS (Design Algorithm for Exploring Chemical Space) 22. DAECS se pohybuje v mnohorozměrné souřadnicové reprezentaci chemického prostoru, jehož iterativní procházení je řízeno přímo uživatelem, který za pomoci průběžně aktualizované dvourozměrné projekce zpracovávané části chemického prostoru v každém kroku vybírá struktury (body v chemickém prostoru), jejichž okolí chce prozkoumat. DAECS potom z vybraných struktur prostřednictvím malých strukturních modifikací vytváří nové struktury, které v dalším kroku začleňuje do uživateli zobrazované projekce chemického prostoru. Odlišně zaměřenou metodou algoritmického průzkumu chemického prostoru je evoluční algoritmus Molpher, který iterativně prochází chemický prostor mezi zadanými dvojicemi chemických struktur 17. Pohybuje se převážně v síťové reprezentaci chemického prostoru (obr. 2b, obr. 5) a pokouší se inkrementálními strukturními modifikacemi první z dvojice vstupních struktur dosáhnout chemické struktury druhé, čímž je spojí cestou chemickým prostorem tvořenou sledem nových chemických mezistruktur (tzv. morfů ). Morfy nesou v různé míře strukturní rysy počáteční i cílové struktury. Hlavní motivací algoritmického procházení chemického prostoru je návrh zcela nových chemických struktur ležících v již identifikované zájmové oblasti chemického prostoru 23. Automaticky generované struktury mohou být prohibitivně náročné na syntézu 18, mnoho algoritmů na procházení chemického prostoru má proto kontrolu syntetické dostupnosti generovaných struktur integrovanou přímo ve svém pracovním procesu 17. Takto validované chemické struktury je možno dále zpracovat virtuálním screeningem 16 a vytvořit z nich chemickou knihovnu zaměřenou (focused) na zájmovou oblast chemického prostoru. 7. Závěr Koncept chemického prostoru je možno považovat za právně kodifikovaný již od raných let minulého století, kdy byl uznán původní Markushův patent. Kontakt chemiků s abstrakcí zde nazývanou jako chemický prostor však 729
7 nesetrvává jen v oblasti ochrany duševního vlastnictví: vyhledávání v chemické databázi, výpočetní modely, chemickou rozmanitost i vlastní chemickou syntézu je také možno vnímat v širším kontextu chemického prostoru. Odhady velikosti chemického prostoru naznačují, že byl dosud připraven a charakterizován jen velmi malý zlomek všech možných chemických struktur. Chemický prostor tedy zůstává převážně neprozkoumán a lze očekávat, že stále obsahuje nezměrné množství molekul s dosud neobjevenými užitečnými vlastnostmi. Z hlediska chemického prostoru tak chemie neztratila za dobu své existence nic ze svého převratného potenciálu. Tento článek vznikl za podpory MŠMT v rámci Národního programu udržitelnosti I projekt LO1220 (CZ- OPENSCREEN). Seznam symbolů PSA TPSA PCA MQN CSN DOS polární povrch molekuly (polar surface area) topologický PSA analýza hlavních komponent (principal component analysis) molecular quantum numbers síťová reprezentace chemického prostoru (chemical space network) syntéza zaměřená na chemickou rozmanitost (diversity-oriented synthesis) DAECS algoritmus pro průzkum chemického prostoru (design algorithm for exploring chemical space) LITERATURA 1. Dobson C. M.: Nature 432, 824 (2004). 2. Polishchuk P. G., Madzhidov T. I., Varnek A.: J Comput Aided Mol Des 27, 675 (2013). 3. Ertl, P.: J Chem Inf Comput Sci 43, 374 (2003). 4. Walters W. P., Stahl M. T., Murcko M. A.: Drug Discov Today 3, 374 (1998). 5. Ruddigkeit L., van Deursen R., Blum L. C., Reymond J. L.: J Chem Inf Model 52, 2864 (2012). 6. Irwin J. J., Sterling T., Mysinger M. M., Bolstad E. S., Coleman R. G.: J Chem Inf Model 52, 1757 (2012). staženo Šilhánek J., Benešová E., Kačer P.: Chem. Listy 110, 885 (2016). 8. Zhi L., van Oeveren C. A., Chen J., Higuchi R. I.: US 12/661,610 (2010). 9. Novotný J., Svozil D.: Chem. Listy. 111, 716 (2017). 10. Guyon I., Elisseeff A.: J. Mach. Learn. Res. 3, 1157 (2003). 11. Nguyen K. T., Blum L. C., van Deursen R., Reymond J. L.: ChemMedChem 4, 1803 (2009). 12. Lipinski C. A., Lombardo F., Dominy B. W., Feeney P. J.: Adv Drug Deliv Rev 46, 3 (2001). 13. Škuta C., Svozil D.: Chem. Listy. 111, 747 (2017). 14. Maggiora G. M., Bajorath J.: J Comput Aided Mol Des 28, 795 (2014). 15. Kuhn, M., Szklarczyk, D., Franceschini, A., Campillos, M., von Mering, C., Jensen, L. J., Beyer, A., Bork, P.: Nucleic Acids Res 38, D552 (2010). stitch.embl.de, staženo Svozil D.: Chem. Listy. 111, 738 (2017). 17. Hoksza D., Škoda P., Voršilák M., Svozil D.: J Cheminform 6, 7 (2014). spaces/molpher, staženo Voršilák M., Svozil D.: Chem. Listy. 111, 760 (2017). 19. Doak B. C., Over B., Giordanetto F., Kihlberg J.: Chem Biol 21, 1115 (2014). 20. Corey E. J.: Chem. Soc. Rev. 17, 111 (1988). 21. Thomas G. L., Wyatt E. E., Spring D. R.: Curr Opin Drug Discov Devel 9, 700 (2006). 22. Takeda S., Kaneko H., Funatsu K.: J. Chem. Inf. Model. 56, 1885 (2016). 23. van Deursen R., Reymond J. L.: ChemMedChem 2, 636 (2007). I. Čmelo a,b and D. Svozil a,b ( a CZ-OPENSCREEN: National Infrastructure for Chemical Biology, Institute of Molecular Genetics, Academy of the Sciences of the Czech Republic, b CZ-OPENSCREEN: National Infrastructure for Chemical Biology, Laboratory of Informatics and Chemistry, University of Chemistry and Technology, Prague): Chemical Space The chemical space is a concept used primarily in cheminformatics, but it indirectly relates to all fields that deal with chemical structures, from general chemistry up to patent law. It is a theoretical space consisting of all energetically stable (and thus possible) isomers of all chemical structures. This space can be arranged by any number of various criteria to create a projection, within which interesting areas can subsequently be searched, delimited and sampled. In practice, such interesting areas are usually those associated with desired biological activity, synthetic accessibility or patent coverage of contained structures. This article introduces the concept of chemical space in an interdisciplinary context and describes the commonly used forms of its representation. 730
Vícerozměrné statistické metody
Vícerozměrné statistické metody Shluková analýza Jiří Jarkovský, Simona Littnerová FSTA: Pokročilé statistické metody Typy shlukových analýz Shluková analýza: cíle a postupy Shluková analýza se snaží o
Přednáška 13 Redukce dimenzionality
Vytěžování Dat Přednáška 13 Redukce dimenzionality Miroslav Čepek Fakulta Elektrotechnická, ČVUT Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti ČVUT (FEL) Redukce dimenzionality 1 /
Využití metod strojového učení v bioinformatice David Hoksza
Využití metod strojového učení v bioinformatice David Hoksza SIRET Research Group Katedra softwarového inženýrství, Matematicko-fyzikální fakulta Karlova Univerzita v Praze Bioinformatika Biologické inspirace
Využití strojového učení k identifikaci protein-ligand aktivních míst
Využití strojového učení k identifikaci protein-ligand aktivních míst David Hoksza, Radoslav Krivák SIRET Research Group Katedra softwarového inženýrství, Matematicko-fyzikální fakulta Karlova Univerzita
Metody analýzy dat I. Míry a metriky - pokračování
Metody analýzy dat I Míry a metriky - pokračování Literatura Newman, M. (2010). Networks: an introduction. Oxford University Press. [168-193] Zaki, M. J., Meira Jr, W. (2014). Data Mining and Analysis:
Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy
Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Autor práce : RNDr. Ivo Beroun,CSc. Vedoucí práce: prof. RNDr. Milan Meloun, DrSc. PROFILOVÁNÍ Profilování = klasifikace a rozlišování
Rastrová reprezentace
Rastrová reprezentace Zaměřuje se na lokalitu jako na celek Používá se pro reprezentaci jevů, které plošně pokrývají celou oblast, případně se i spojitě mění. Používá se i pro rasterizované vektorové vrstvy,
Vytěžování znalostí z dat
Pavel Kordík, Jan Motl (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2012, Přednáška 1 1/32 Vytěžování znalostí z dat Pavel Kordík, Jan Motl Department of Computer Systems Faculty of Information Technology
Rozvoj tepla v betonových konstrukcích
Úvod do problematiky K novinkám v požární odolnosti nosných konstrukcí Praha, 11. září 2012 Ing. Radek Štefan prof. Ing. Jaroslav Procházka, CSc. Znalost rozložení teploty v betonové konstrukci nebo její
Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011
Automatická detekce anomálií při geofyzikálním průzkumu Lenka Kosková Třísková NTI TUL Doktorandský seminář, 8. 6. 2011 Cíle doktorandské práce Seminář 10. 11. 2010 Najít, implementovat, ověřit a do praxe
7. Rozdělení pravděpodobnosti ve statistice
7. Rozdělení pravděpodobnosti ve statistice Statistika nuda je, má však cenné údaje, neklesejte na mysli, ona nám to vyčíslí Jednou z úloh statistiky je odhad (výpočet) hodnot statistického znaku x i,
Opakování
Slabé vazebné interakce Opakování Co je to atom? Opakování Opakování Co je to atom? Atom je nejmenší částice hmoty, chemicky dále nedělitelná. Skládá se z atomového jádra obsahujícího protony a neutrony
Chemické databáze. Bedřich Košata
Chemické databáze Bedřich Košata Porovnávání molekul Hledání stejných struktur Hledání struktur obsahující fragment Hledání podobných molekul Hledání stejných struktur Vyžaduje použití algoritmů pro isomorfii
PRODUKTY. Tovek Tools
Analyst Pack je desktopovou aplikací určenou k vyhledávání informací, tvorbě různých typů analýz a vytváření přehledů a rešerší. Jsou vhodné pro práci i s velkým objemem textových dat z různorodých informačních
Multirobotická kooperativní inspekce
Multirobotická kooperativní inspekce prostředí Diplomová práce Multirobotická kooperativní inspekce prostředí Diplomová práce Intelligent and Mobile Robotics Group Laboratory for Intelligent Decision Making
Algoritmy pro shlukování prostorových dat
Algoritmy pro shlukování prostorových dat Marta Žambochová Katedra matematiky a informatiky Fakulta sociálně ekonomická Univerzita J. E. Purkyně v Ústí nad Labem ROBUST 21. 26. leden 2018 Rybník - Hostouň
2. přednáška z předmětu GIS1 Data a datové modely
2. přednáška z předmětu GIS1 Data a datové modely Vyučující: Ing. Jan Pacina, Ph.D. e-mail: jan.pacina@ujep.cz Pro přednášku byly použity texty a obrázky z www.gis.zcu.cz Předmět KMA/UGI, autor Ing. K.
Architektura informačních systémů. - dílčí architektury - strategické řízení taktické řízení. operativní řízení a provozu. Globální architektura
Dílčí architektury Informační systémy - dílčí architektury - EIS MIS TPS strategické řízení taktické řízení operativní řízení a provozu 1 Globální Funkční Procesní Datová SW Technologická HW Aplikační
Moderní systémy pro získávání znalostí z informací a dat
Moderní systémy pro získávání znalostí z informací a dat Jan Žižka IBA Institut biostatistiky a analýz PřF & LF, Masarykova universita Kamenice 126/3, 625 00 Brno Email: zizka@iba.muni.cz Bioinformatika:
Zobrazte si svazy a uspořádané množiny! Jan Outrata
LatVis Zobrazte si svazy a uspořádané množiny! Jan Outrata Motivace potřeba visualizovat matematické (algebraické) struktury rychle, přehledně a automaticky počítačovými prostředky ruční kreslení je zdlouhavé
Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody
Fakulta chemicko-technologická Katedra analytické chemie 3.2 Metody s latentními proměnnými a klasifikační metody Vypracoval: Ing. Tomáš Nekola Studium: licenční Datum: 21. 1. 2008 Otázka 1. Vypočtěte
Úvod do teorie grafů
Úvod do teorie grafů Neorientovaný graf G = (V,E,I) V množina uzlů (vrcholů) - vertices E množina hran - edges I incidence incidence je zobrazení, buď: funkce: I: E V x V relace: I E V V incidence přiřadí
Obsah. Zpracoval:
Zpracoval: houzvjir@fel.cvut.cz 03. Modelem řízený vývoj. Doménový (business), konceptuální (analytický) a logický (návrhový) model. Vize projektu. (A7B36SIN) Obsah Modelem řízený vývoj... 2 Cíl MDD, proč
13 Barvy a úpravy rastrového
13 Barvy a úpravy rastrového Studijní cíl Tento blok je věnován základním metodám pro úpravu rastrového obrazu, jako je např. otočení, horizontální a vertikální překlopení. Dále budo vysvětleny různé metody
7. Geografické informační systémy.
7. Geografické informační systémy. 154GEY2 Geodézie 2 7.1 Definice 7.2 Komponenty GIS 7.3 Možnosti GIS 7.4 Datové modely GIS 7.5 Přístup k prostorovým datům 7.6 Topologie 7.7 Vektorové datové modely 7.8
Základy informatiky. Teorie grafů. Zpracoval: Pavel Děrgel Úprava: Daniela Szturcová
Základy informatiky Teorie grafů Zpracoval: Pavel Děrgel Úprava: Daniela Szturcová Obsah přednášky Barvení mapy Teorie grafů Definice Uzly a hrany Typy grafů Cesty, cykly, souvislost grafů Barvení mapy
Metody in silico. stanovení výpočtem
Metody in silico stanovení výpočtem Inovace a rozšíření výuky zaměřené na problematiku životního prostředí na PřF MU (CZ.1.07/2.2.00/15.0213) spolufinancován Evropským sociálním fondem a státním rozpočtem
Matematika pro geometrickou morfometrii
Matematika pro geometrickou morfometrii Václav Krajíček Vaclav.Krajicek@mff.cuni.cz Department of Software and Computer Science Education Faculty of Mathematics and Physics Charles University Přednáška
Ing. Jiří Fejfar, Ph.D. Geo-informační systémy
Ing. Jiří Fejfar, Ph.D. Geo-informační systémy Definice, budování a život GIS Kapitola 1: Vztahy strana 2 Data, informace, IS, GIS Kapitola 1: Vztahy strana 3 Rozhodnutí Znalosti Znalostní systémy. Informace
Základy umělé inteligence
Základy umělé inteligence Automatické řešení úloh Základy umělé inteligence - prohledávání. Vlasta Radová, ZČU, katedra kybernetiky 1 Formalizace úlohy UI chápe řešení úloh jako proces hledání řešení v
vzorek1 0.0033390 0.0047277 0.0062653 0.0077811 0.0090141... vzorek 30 0.0056775 0.0058778 0.0066916 0.0076192 0.0087291
Vzorová úloha 4.16 Postup vícerozměrné kalibrace Postup vícerozměrné kalibrace ukážeme na úloze C4.10 Vícerozměrný kalibrační model kvality bezolovnatého benzinu. Dle následujících kroků na základě naměřených
Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence
APLIKACE UMĚLÉ INTELIGENCE Ing. Petr Hájek, Ph.D. Podpora přednášky kurzu Aplikace umělé inteligence Aplikace umělé inteligence - seminář ING. PETR HÁJEK, PH.D. ÚSTAV SYSTÉMOVÉHO INŽENÝRSTVÍ A INFORMATIKY
5 Orientované grafy, Toky v sítích
Petr Hliněný, FI MU Brno, 205 / 9 FI: IB000: Toky v sítích 5 Orientované grafy, Toky v sítích Nyní se budeme zabývat typem sít ových úloh, ve kterých není podstatná délka hran a spojení, nýbž jejich propustnost
Vícerozměrné statistické metody
Vícerozměrné statistické metody Ordinační analýzy principy redukce dimenzionality Jiří Jarkovský, Simona Littnerová FSTA: Pokročilé statistické metody Ordinační analýza a její cíle Cíle ordinační analýzy
Modifikace algoritmu FEKM
Modifikace algoritmu FEKM Marta Žambochová Katedra matematiky a informatiky Fakulta sociálně ekonomická Univerzita J. E. Purkyně v Ústí nad Labem ROBUST 9. 14. září 2012 Němčičky Motivace Potřeba metod
Moderní technologie ve studiu aplikované fyziky CZ.1.07/2.2.00/ Množiny, funkce
Moderní technologie ve studiu aplikované fyziky CZ.1.07/2.2.00/07.0018 2. Množiny, funkce MNOŽIN, ZÁKLDNÍ POJMY Pojem množiny patří v matematice ke stěžejním. Nelze jej zavést ve formě definice pomocí
Bioinformatika a výpočetní biologie KFC/BIN. I. Přehled
Bioinformatika a výpočetní biologie KFC/BIN I. Přehled RNDr. Karel Berka, Ph.D. Univerzita Palackého v Olomouci Definice bioinformatiky (Molecular) bio informatics: bioinformatics is conceptualising biology
GIS Geografické informační systémy
GIS Geografické informační systémy Obsah přednášky Prostorové vektorové modely Špagetový model Topologický model Převody geometrií Vektorový model Reprezentuje reálný svět po jednotlivých složkách popisu
Úvod do zpracování signálů
1 / 25 Úvod do zpracování signálů Karel Horák Rozvrh přednášky: 1. Spojitý a diskrétní signál. 2. Spektrum signálu. 3. Vzorkovací věta. 4. Konvoluce signálů. 5. Korelace signálů. 2 / 25 Úvod do zpracování
Metody analýzy dat I (Data Analysis I) Úvod do sítí (Networks Basics)
Metody analýzy dat I (Data Analysis I) Úvod do sítí (Networks Basics) Literatura Newman, M. (2010). Networks: An Introduction. Oxford University Press. [15-77] Leskovec, J., Rajaraman, A., Ullman, J. D.
Vzdálenost uzlů v neorientovaném grafu
Vzdálenosti a grafy Vzdálenost uzlů v neorientovaném grafu Je dán neorientovaný neohodnocený graf G = (V,E,I) vzdálenost uzlů u a v v neorientovaném souvislém grafu G je délka nejkratší cesty spojující
OPTIMALIZACE A MULTIKRITERIÁLNÍ HODNOCENÍ FUNKČNÍ ZPŮSOBILOSTI POZEMNÍCH STAVEB D24FZS
OPTIMALIZACE A MULTIKRITERIÁLNÍ HODNOCENÍ FUNKČNÍ ZPŮSOBILOSTI POZEMNÍCH STAVEB Optimalizace a multikriteriální hodnocení funkční způsobilosti pozemních staveb Anotace: Optimalizace objektů pozemních staveb
Informační systémy 2008/2009. Radim Farana. Obsah. Obsah předmětu. Požadavky kreditového systému. Relační datový model, Architektury databází
1 Vysoká škola báňská Technická univerzita Ostrava Fakulta strojní, Katedra automatizační techniky a řízení 2008/2009 Radim Farana 1 Obsah Požadavky kreditového systému. Relační datový model, relace, atributy,
Pracovní celky 4.4 a 5 Metody a provádění geometrické homogenizace
Pracovní celky 4.4 a 5 Metody a provádění geometrické homogenizace Obsah 1 Důvody a cíle... 2 2 Metody geometrické homogenizace (PC 4.4)... 2 2.1 Přizpůsobení dat ATKIS... 2 2.2 Zpracování dat ZABAGED
9. přednáška z předmětu GIS1 Digitální model reliéfu a odvozené povrchy. Vyučující: Ing. Jan Pacina, Ph.D.
9. přednáška z předmětu GIS1 Digitální model reliéfu a odvozené povrchy Vyučující: Ing. Jan Pacina, Ph.D. e-mail: jan.pacina@ujep.cz Lehký úvod Digitální modely terénu jsou dnes v geoinformačních systémech
Metody analýzy dat I (Data Analysis I) Úvod do sítí (Networks Basics)
Metody analýzy dat I (Data Analysis I) Úvod do sítí (Networks Basics) Literatura Newman, M. (2010). Networks: An Introduction. Oxford University Press. [15-77] Leskovec, J., Rajaraman, A., Ullman, J. D.
Citation Statistics. zpráva společné komise. Int. Mathematical Union. Int. Council of Industrial and Applied Mathematics. Institute of Statistics
Citation Statistics zpráva společné komise Int. Mathematical Union Int. Council of Industrial and Applied Mathematics Institute of Statistics Citace ze zadání: The drive towards more transparency and accountability
TGH02 - teorie grafů, základní pojmy
TGH02 - teorie grafů, základní pojmy Jan Březina Technical University of Liberec 28. února 2017 Metainformace materiály: jan.brezina.matfyz.cz/vyuka/tgh (./materialy/crls8.pdf - Introduction to algorithms)
Vojtěch Hrubý: Esej pro předmět Seminář EVF
Vojtěch Hrubý: Esej pro předmět Seminář EVF Plazma Pod pojmem plazma většinou myslíme plynné prostředí, které se skládá z neutrálních částic, iontů a elektronů. Poměr množství neutrálních a nabitých částic
K otázce pokrytí publikační aktivity českých vysokých škol v bibliografických bázích dat
K otázce pokrytí publikační aktivity českých vysokých škol v bibliografických bázích dat Jaroslav Šilhánek Vysoká škola chemicko-technologická v Praze silhanek@vscht.cz Publikované rozdíly jako výchozí
Informační systémy 2006/2007
13 Vysoká škola báňská Technická univerzita Ostrava Fakulta strojní, Katedra automatizační techniky a řízení Informační systémy 2006/2007 Ivan Kedroň 1 Obsah Analytické nástroje SQL serveru. OLAP analýza
GRAFICKÉ ŘEŠENÍ ROVNIC A JEJICH SOUSTAV
GRAFICKÉ ŘEŠENÍ ROVNIC A JEJICH SOUSTAV Mgr. Jitka Nováková SPŠ strojní a stavební Tábor Abstrakt: Grafické řešení rovnic a jejich soustav je účinná metoda, jak vysvětlit, kolik různých řešení může daný
Spektra 1 H NMR. Velmi zjednodušeně! Bohumil Dolenský
Spektra 1 MR Velmi zjednodušeně! Bohumil Dolenský Spektra 1 MR... Počet signálů C 17 18 2 O 2 MeO Počet signálů = počet neekvivalentních skupin OMe = informace o symetrii molekuly Spektrum 1 MR... Počet
Sada hodnotících kritérií OP PPR pro PO 3, specifický cíl 3.3 a PO 4, specifické cíle 4.2 a 4.3
Přehled jednotlivých kritérií a jejich zařazení do skupin kritérií Skupina kritérií (max. počet bodů) Potřebnost (30) Účelnost (20) Efektivnost a hospodárnost (20) Proveditelnost (25) Název kritéria (max.
Tutorial Kombinace zatěžovacích stavů
Tutorial Kombinace zatěžovacích stavů 2 The information contained in this document is subject to modification without prior notice. No part of this document may be reproduced, transmitted or stored in
ADAPTIVITA INFORMAČNÍCH SYSTÉMŮ INFORMATION SYSTEM ADAPTIVITY
ADAPTIVITA INFORMAČNÍCH SYSTÉMŮ INFORMATION SYSTEM ADAPTIVITY Roman Malo Mendelova zemědělská a lesnická univerzita v Brně Provozně ekonomická fakulta, Ústav informatiky, malo@pef.mendelu.cz Abstrakt Problematika
Přednášky z lékařské biofyziky Biofyzikální ústav Lékařské fakulty Masarykovy univerzity, Brno
Přednášky z lékařské biofyziky Biofyzikální ústav Lékařské fakulty Masarykovy univerzity, Brno JAMES WATT 19.1.1736-19.8.1819 Termodynamika principy, které vládnou přírodě Obsah přednášky Vysvětlení základních
MBI - technologická realizace modelu
MBI - technologická realizace modelu 22.1.2015 MBI, Management byznys informatiky Snímek 1 Agenda Technická realizace portálu MBI. Cíle a principy technického řešení. 1.Obsah portálu - objekty v hierarchiích,
CEITEC a jeho IT požadavky. RNDr. Radka Svobodová Vařeková, Ph.D.
CEITEC a jeho IT požadavky RNDr. Radka Svobodová Vařeková, Ph.D. Co je CEITEC? CEITEC je projekt výstavby středoevropského vědecko-výzkumného centra excelence v Brně Zaměření projektu: základní i aplikovaný
Usuzování za neurčitosti
Usuzování za neurčitosti 25.11.2014 8-1 Usuzování za neurčitosti Hypotetické usuzování a zpětná indukce Míry postačitelnosti a nezbytnosti Kombinace důkazů Šíření pravděpodobnosti v inferenčních sítích
Buněčné automaty a mřížkové buněčné automaty pro plyny. Larysa Ocheretna
Buněčné automaty a mřížkové buněčné automaty pro plyny Larysa Ocheretna Obsah Buněčný automat: princip modelu, vymezení pojmů Mřížkový buněčný automat pro plyny Příklady aplikace principů mřížkových buněčných
Identifikace. Jiří Jelínek. Katedra managementu informací Fakulta managementu J. Hradec Vysoká škola ekonomická Praha
Identifikace tématických sociálních sítí Katedra managementu informací Fakulta managementu J. Hradec Vysoká škola ekonomická Praha 2 Obsah prezentace Cíl Fáze řešení a navržené postupy Prototyp a výsledky
Markovovy modely v Bioinformatice
Markovovy modely v Bioinformatice Outline Markovovy modely obecně Profilové HMM Další použití HMM v Bioinformatice Analýza biologických sekvencí Biologické sekvence: DNA,RNA,protein prim.str. Sekvenování
Obecné principy chemických strukturních bází dat předmět projektu VaVpI ChemEIZ
Obecné principy chemických strukturních bází dat předmět projektu VaVpI ChemEIZ Jaroslav Šilhánek Strukturní báze dat = Grafická representace struktur chemických sloučenin (+ další informace) Reakční
Tovek Tools. Tovek Tools jsou standardně dodávány ve dvou variantách: Tovek Tools Search Pack Tovek Tools Analyst Pack. Připojené informační zdroje
jsou souborem klientských desktopových aplikací určených k indexování dat, vyhledávání informací, tvorbě různých typů analýz a vytváření přehledů a rešerší. Jsou vhodné pro práci s velkým objemem textových
PRODUKTY. Tovek Tools
jsou desktopovou aplikací určenou k vyhledávání informací, tvorbě různých typů analýz a vytváření přehledů a rešerší. Jsou vhodné pro práci i s velkým objemem textových dat z různorodých informačních zdrojů.
kamerou. Dle optických parametrů objektivu mohou v získaném obraze nastat geometrická
Odstranění geometrických zkreslení obrazu Vstupní obraz pro naše úlohy získáváme pomocí optické soustavy tvořené objektivem a kamerou. Dle optických parametrů objektivu mohou v získaném obraze nastat geometrická
Kartogramy. Přednáška z předmětu Tematická kartografie (KMA/TKA) Otakar Čerba Západočeská univerzita
Kartogramy Přednáška z předmětu Tematická kartografie (KMA/TKA) Otakar Čerba Západočeská univerzita Datum vytvoření dokumentu: 20. 9. 2004 Datum poslední aktualizace: 17. 10. 2011 Definice Kartogram je
GIS Geografické informační systémy
GIS Geografické informační systémy Obsah přednášky Prostorové vektorové modely Špagetový model Topologický model Převody geometrií Vektorový model Reprezentuje reálný svět po jednotlivých složkách popisu
Modely datové. Další úrovní je logická úroveň Databázové modely Relační, Síťový, Hierarchický. Na fyzické úrovni se jedná o množinu souborů.
Modely datové Existují různé úrovně pohledu na data. Nejvyšší úroveň je úroveň, která zachycuje pouze vztahy a struktury dat samotných. Konceptuální model - E-R model. Další úrovní je logická úroveň Databázové
Univerzita Pardubice. Fakulta chemicko-technologická Katedra analytické chemie. Licenční studium Statistické zpracování dat
Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie Licenční studium Statistické zpracování dat Semestrální práce Interpolace, aproximace a spline 2007 Jindřich Freisleben Obsah
Vícerozměrné statistické metody
Vícerozměrné statistické metody Vícerozměrné statistické rozdělení a testy, operace s vektory a maticemi Jiří Jarkovský, Simona Littnerová FSTA: Pokročilé statistické metody Vícerozměrné statistické rozdělení
autorovu srdci... Petr Hliněný, FI MU Brno 1 FI: MA010: Průnikové grafy
9 Krátké povídání o průnikových grafech Od této lekce teorie grafů se zaměříme lehce na několik vybraných partíı teorie grafů bĺızkých autorovu srdci... Naším prvním výběrem jsou průnikové grafy, což jsou
Počítačové simulace a statistická mechanika
Počítačové simulace a statistická mechanika Model = soubor aproximaci přijatých za účelem popisu určitého systému okrajové podmínky mezimolekulové interakce Statistické zpracování průměrování ve fázovém
02 Nevazebné interakce
02 Nevazebné interakce Nevazebné interakce Druh chemické vazby Určují 3D konfiguraci makromolekul, účastní se mnoha biologických procesů, zodpovědné za uspořádání molekul v krystalu Síla nevazebných interakcí
Automatické rozpoznávání dopravních značek
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA DOPRAVNÍ Jiří Hofman Automatické rozpoznávání dopravních značek Semestrální práce z předmětu ITS 2012 Obsah 1. Automatické rozpoznávání dopravních značek (ATSR)...
Jana Dannhoferová Ústav informatiky, PEF MZLU
Počítačová grafika Křivky Jana Dannhoferová (jana.dannhoferova@mendelu.cz) Ústav informatiky, PEF MZLU Základní vlastnosti křivek křivka soustava parametrů nějaké rovnice, která je posléze generativně
2D transformací. červen Odvození transformačního klíče vybraných 2D transformací Metody vyrovnání... 2
Výpočet transformačních koeficinetů vybraných 2D transformací Jan Ježek červen 2008 Obsah Odvození transformačního klíče vybraných 2D transformací 2 Meto vyrovnání 2 2 Obecné vyjádření lineárních 2D transformací
Geometrické transformace
1/15 Předzpracování v prostoru obrazů Geometrické transformace Václav Hlaváč, Jan Kybic Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání hlavac@fel.cvut.cz http://cmp.felk.cvut.cz/
Univerzita Pardubice 8. licenční studium chemometrie
Univerzita Pardubice 8. licenční studium chemometrie Statistické zpracování dat při managementu jakosti Semestrální práce Metody s latentními proměnnými a klasifikační metody Ing. Jan Balcárek, Ph.D. vedoucí
POPIS STANDARDU CEN TC278/WG7. 1 z 5. draft prenv Geografická silniční databáze. Oblast: ZEMĚPISNÁ DATA V SILNIČNÍ DOPRAVĚ ( GRD)
POPIS STANDARDU CEN TC278/WG7 Oblast: ZEMĚPISNÁ DATA V SILNIČNÍ DOPRAVĚ ( GRD) Zkrácený název: GEOGRAFICKÁ DATABÁZE Norma číslo: 14825 Norma název (en): GDF GEOGRAPHIC DATA FILES VERSION 4.0 Norma název
Státnice odborné č. 20
Státnice odborné č. 20 Shlukování dat Shlukování dat. Metoda k-středů, hierarchické (aglomerativní) shlukování, Kohonenova mapa SOM Shlukování dat Shluková analýza je snaha o seskupení objektů do skupin
2. Množiny, funkce. Poznámka: Prvky množiny mohou být opět množiny. Takovou množinu, pak nazýváme systém množin, značí se
MNOŽIN, ZÁKLDNÍ POJMY Pojem množiny patří v matematice ke stěžejním. Nelze jej zavést ve formě definice pomocí primitivních pojmů; považuje se totiž rovněž za pojem primitivní. Představa o pojmu množina
XML Š ABLONY A JEJICH INTEGRACE V LCMS XML TEMPLATES AND THEIN INTEGRATION IN LCMS
XML Š ABLONY A JEJICH INTEGRACE V LCMS XML TEMPLATES AND THEIN INTEGRATION IN LCMS Roman MALO - Arnošt MOTYČKA This paper is oriented to discussion about using markup language XML and its features in LCMS
Obsah prezentace. Základní pojmy v teorii o grafech Úlohy a prohledávání grafů Hledání nejkratších cest
Obsah prezentace Základní pojmy v teorii o grafech Úlohy a prohledávání grafů Hledání nejkratších cest 1 Základní pojmy Vrchol grafu: {množina V} Je to styčná vazba v grafu, nazývá se též uzlem, prvkem
Fyzikální chemie Úvod do studia, základní pojmy
Fyzikální chemie Úvod do studia, základní pojmy HMOTA A JEJÍ VLASTNOSTI POSTAVENÍ FYZIKÁLNÍ CHEMIE V PŘÍRODNÍCH VĚDÁCH HISTORIE FYZIKÁLNÍ CHEMIE ZÁKLADNÍ POJMY DEFINICE FORMY HMOTY Formy a nositelé hmoty
Molekulová spektroskopie 1. Chemická vazba, UV/VIS
Molekulová spektroskopie 1 Chemická vazba, UV/VIS 1 Chemická vazba Silová interakce mezi dvěma atomy. Chemické vazby jsou soudržné síly působící mezi jednotlivými atomy nebo ionty v molekulách. Chemická
Dalibor Kačmář 21. 9. 2015
Dalibor Kačmář 21. 9. 2015 200+ 75%+ $500B $3.5M Průměrný počet dní, které útočník stráví v síti oběti, než je detekován všech průniků do sítí se stalo díky úniku přihlašovacích údajů celková odhadovaná
Sada hodnotících kritérií OP PPR pro PO 3, specifický cíl 3.3 a PO 4, specifický cíl 4.2
Přehled jednotlivých kritérií a jejich zařazení do skupin kritérií Sada hodnotících kritérií OP PPR pro PO 3, specifický cíl 3.3 a PO 4, specifický cíl 4.2 Skupina kritérií (max. počet bodů) Potřebnost
Teorie informace a kódování (KMI/TIK) Reed-Mullerovy kódy
Teorie informace a kódování (KMI/TIK) Reed-Mullerovy kódy Lukáš Havrlant Univerzita Palackého 10. ledna 2014 Primární zdroj Jiří Adámek: Foundations of Coding. Strany 137 160. Na webu ke stažení, heslo:
OSA. maximalizace minimalizace 1/22
OSA Systémová analýza metodika používaná k navrhování a racionalizaci systémů v podmínkách neurčitosti vyšší stupeň operační analýzy Operační analýza (výzkum) soubor metod umožňující řešit rozhodovací,
Vývoj nového léčiva. as. MUDr. Martin Votava, PhD.
Vývoj nového léčiva as. MUDr. Martin Votava, PhD. Příprava na vývoj a registraci LP Náklady na vývoj: 800 mil USD Doba vývoje: 10 let Úspěšnost: 0,005% - 0,001% Vývoj nového léčivého přípravku IND NDA
Krajská koncepce e-gov
Krajská koncepce e-gov Koncepční dokumenty pro oblast řízení a koordinaci e-gov 01. 10. 2013 OBSAH Obsah... 2 1 Úvodní informace... 3 2 Koncepční dokumenty pro oblast řízení a koordinaci e-gov... 5 2.1
Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)
Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů) Autor: Vladimir Vapnik Vapnik, V. The Nature of Statistical Learning Theory.
STATISTICKÝ SOUBOR. je množina sledovaných objektů - statistických jednotek, které mají z hlediska statistického zkoumání společné vlastnosti
ZÁKLADNÍ STATISTICKÉ POJMY HROMADNÝ JEV Statistika pracuje s tzv. HROMADNÝMI JEVY cílem statistického zpracování dat je podání informace o vlastnostech a zákonitostech hromadných jevů: velkého počtu jedinců
12 Metody snižování barevného prostoru
12 Metody snižování barevného prostoru Studijní cíl Tento blok je věnován základním metodám pro snižování barevného rozsahu pro rastrové obrázky. Postupně zde jsou vysvětleny důvody k použití těchto algoritmů
IV117: Úvod do systémové biologie
IV117: Úvod do systémové biologie David Šafránek 8.10.2008 Obsah Metody dynamické analýzy Obsah Metody dynamické analýzy Shrnutí biologický systém definován interakcemi mezi jeho komponentami interakce
Modelování a simulace Lukáš Otte
Modelování a simulace 2013 Lukáš Otte Význam, účel a výhody MaS Simulační modely jsou nezbytné pro: oblast vědy a výzkumu (základní i aplikovaný výzkum) analýzy složitých dyn. systémů a tech. procesů oblast
Aplikace pro srovna ní cen povinne ho ruc ení
Aplikace pro srovna ní cen povinne ho ruc ení Ukázkový přiklad mikroaplikace systému Formcrates 2010 Naucrates s.r.o. Veškerá práva vyhrazena. Vyskočilova 741/3, 140 00 Praha 4 Czech Republic tel.: +420