OPVK CZ.1.07/2.2.00/28.0184
Drug-design - racionální návrh léčiv KFC/DD 05 dokování RNDr. Karel Berka, Ph.D. ZS 2012/2013
Motto a my dnes ten klíč budeme hledat
Osnova Structure-based drug design (SBDD) Dokování a de novo design proč? hledání molekul, které se váží do aktivních míst čeho? jak? knihovny léčiv generování konformací ligandů skórovací funkce a hlavně rychle!
Racionální návrh léčiv možnosti Ligand based DD Hledání podobných ligandů QSAR Farmakofor Structure based DD Dokování Virtual screening De novo design
Co je dokování? V dokování se snažíme najít co nejlepší fit mezi dvěma molekulami Bill Watterson: Calvin a Hobbes
Protein-ligand docking Výpočetní metoda, která mimikuje vazbu ligandu na protein Predikuje pózu molekuly ve vazebném místě =geometrie Vazebnou afinitu (skóre) reprezentující sílu vazby =energie Image credit: Charaka Goonatilake, Glen Group, University of Cambridge. http://www- ucc.ch.cam.ac.uk/research/cg369- research.html
Protein-ligand docking II Dokování má 2 hlavní kroky: 1. Algoritmus hledání Vytvoří se velké množství póz ve vazebném místě 2. Skórovací funkce Vypočítá skóre, nebo vazebnou afinitu pro partikulární pózu Problémy - komplexita problému Translace a rotace ligandu k pokrytí pokud možno celého prostoru, konformace ligandu a flexibilita proteinu, role solventu, čas
Problém dokování I: Flexibilita První krok prohledání možných rotačních a translačních možností ligandu Flexibilita ligandu tvorba ensemble všech možných konformací ligandu vkládání do proteinu protein jako rigidní 9
Konformace ligandu Konformace rotace kolem torzních úhlů rotovatelných molekul Pro molekulu s N rotovatelnými vazbami, kdy je každý torzní úhel s rotacemi o θ stupňů (typicky 5 ) Počet konformací je pak (360º/ θ) N Question If the torsion angles are incremented in steps of 30º, how many conformations does a molecule with 5 rotatable bonds have, compared to one with 4 rotatable bonds? Having too many rotatable bonds results in combinatorial explosion Also ring conformations Taxol Image: IUPAC Gold Book Lakdawala et al. BMC Chemical Biology 2001 1:2
Algoritmy hledání Monte Carlo Náhodný výběr hledání globálního minima Genetické algoritmy Učení se z předchozích generací Simulované žíhání Ohřev - překonání bariér Chlazení hledání minim Postupný růst Výstavba ze základního skeletu 11
Příprava na docking identifikace relevantní struktury proteinu příprava struktury proteinu příprava ligandu rozhodnout co s dalšími jevy voda flexibilita receptoru H. Jhoti & A.R. Leach (eds) Springer 2007, chapter 8 Structure based drug discovery 12
Kam? identifikace vazebného místa Dobrá struktura nízké rozlišení (přesnost) nízké B-faktory (flexibilita) nízké R-free (pravdivost) Flexibilita dokování do více struktur vybrat nejlepší dokování do struktury s největším vazebným místem použít flexible docking Příprava receptoru 13
Konformace proteinu Většina dokovacích programů bere protein jako rigidní Rigid Receptor Approximation Ale Protein se může lehce deformovat, aby přijal různé ligandy (ligand-induced fit) Aminokyseliny v aktivním místě mohou přijmout různé konformace Flexible Receptor docking: Vedlejší řetězce aminokyselin mohou rotovat kolem necyklických vazeb Zvětšuje to prohledávaný prostor! Větší pohyby proteinu mohou být brány v potaz jen samostatným dokováním do několika konformací proteinů Image: Cláudio M. Soares, Protein Modelling Laboratory, http://www.itqb.unl.pt/labs/proteinmodelling/activities/psccip-pf
Příprava receptoru protonace residuí His (pka ~ 6.04) záleží na okolí (HIV proteáza) tautomerizace rotamery výběr změní výsledky! 15
Příprava ligandu Náboj a tautomerizace Vytvořit všechny a pak je dokovat? jak pak vybrat nejvyšší skore každý stav bude mít jinou relativní energii. Ask an expert! (organičtí chemici) flexibilita rotace kolem C-C vazeb, ale ne kolem C=C úhly jsou fixovány (což může být problém) 16
Skórovací funkce 1. Ohodnocení jednotlivých póz v průběhu dockingu objective function 2. Identifikace nejnižší volné energie 3. Seřadí vazebné volné energie mezi různými ligandy Pro všechny kroky nemusí být vždy použita stejná funkce 17
Energetika vaznosti Vazebná konstanta K d = [P...L] / [P][L] odpovídá volné energii: ΔG bind = -RT ln K d = -RT ln 1/IC 50 Volná energie je kombinace enthalpie a entropie ΔG bind = ΔH bind - TΔS bind 18
Molekulární interakce - chemie Enthalpie: Elektrostatika (dielektrická konstanta) Vodíkové vazby van der Waals (disperze a repulze) Desolvatace Entropie Konformace Solvatace (hydrofobní efekt) 19
Scoring function Funkce, která ohodnotí vazebnou afinitu Funkce by měla lépe oskórovat správnou pózu, a lépe se vázající ligand Parametrizovány proti známým vazebným volným energiím a známým správným pózám. Většinou jsou nepříliš spolehlivé, ale rychlé 20
Typy scoring function Force-field parametrizovány dle molekulárně mechanických silových polí Goldscore, DOCK, Autodock empirical parametrizovány proti experimentálním vazebným afinitám(k d,ic 50 ) různé členy (H-vazby, hydrofobní kontakty) nutné trénování, rychlé ChemScore, PLP, Glide SP/XP knowledge based vycházejí ze znalostí komplexů protein-ligand Boltzmannova hypotéza co se často vyskytuje, to má silnou vazebnou volnou energii PMF, DrugScore, ASP 21
Force-field scoring functions Silové pole pro docking E = E bond + E angle + E dih + E coulomb + E vdw + E solv časté použití gridu šetří čas vyhledání v tabulce je jednodušší, než znovu počítat interakční energie receptor je často jeden a dokovaných látek je mnoho 22
Empirical scoring function Rozložení vazebné energie do chemicky odpovídajících členů Zachycuje specifické interakce H vazby, π-π stacking Linearizace členů je oblíbená DG bind = DG solvent + DG conf + DG rot + DG t + DG r + DG vib 23
Böhm s empirical scoring function lineární suma jednotlivých příspěvků k vazbě Bohm s scoring function vodíková vazba, interakce iontů, lipofilické interakce a konformační člen Vodíková vazba a interakce iontů závislé na geometrii interakce velké odchylky jsou penalizovány (ideal distance R, ideal angle α) being penalised. Lipofilní člen proporční k ploše dotyku povrchů mezi proteinem a ligandem (A lipo ) Konformační entropický člen penalizace za zmražení interních rotací ligandu - entropie proporční k množství rotovatelných vazeb ligandu (NROT) G hodnoty přiřazené jednotlivým členům jsou konstanty získané lineární regresí na experimentálních vazebných datech pro 45 protein ligand complexů Bohm, J. Comput.-Aided Mol. Des., 1994, 8, 243
Chemscore 25
Chemscore 26
Chemscore úspěšnost Korelační koefficient r r 2 <-1, 0, 1> 27
Problémy empirických skórovacích funkcí Záleží na testovacím setu chybějící interakční členy metal-ion Parametrizovány na úspěch Většinou se při parametrizaci používají jen molekuly, které se váží => takže pak se váže skoro všechno 28
Knowledge-based funkce Korelace strukturních dat z komplexů s volnou energií vazby A = -kt ln g(r) Platí pro soubor částic v plynu NE! nutně pak pro proteiny 29
Drugscore 30
Programy DOCK (I. D. Kuntz, UCSF) AUTODOCK (Arthur Olson, The Scripps Research Institute) Vina (Arthur Olson, The Scripps Research Institute) RosettaDOCK (Baker, Washington Univ., Gray, Johns Hopkins Univ.) ArgusLabs GOLD FlexX Hex Glide (Schrodinger) 31
de novo dokování 1) Určení povrchu (SASA - Connelly) valením kuličky o velikosti molekuly vody po povrchu 2) Tvorba "negativního" obrazu receptoru z kuliček na povrchu z kroku 1 3) Určení vzdáleností mezi jednotlivými kuličkami 4) Konverze vzdáleností mezi kuličkami možné vazebné vzdálenosti mezi atomy 5) Srovnání nalezených vzdáleností mezi atomy se vzdálenostmi z databáze molekul 6) Výběr ligandů, které mají největší překryv 7) Spočítání ligand-receptor interakčních energií pomocí skórovací funkce
Dostavování (Groupbuild) Stavění nových sloučenin komplementárních k cílovému vazebnému místu náhodnými kombinacemi jednotlivých fragmentů Příklady fragmentů: kyselina mravenčí, formaldehyd, formamid, amin, benzen, cyklohexan, cyklopentan, ethan, ethylen, voda, methanol, methan, sulfan, thiofen Procedura: 1) Tvorba gridu pro vazební místo 2) Generování struktury 1) Dokování základního "core" fragmentu 2) Dostavování (rozšiřování jádra o jednotlivé fragmenty) 3) Náhodně vybrat několik nejlepších struktur 4) Iterovat přes kroky 2 a 3 (i.e. pokračovat ve stavbě) dokud nejsou splněna finální kritéria (počet kroků, minimální energie, energie na atom, apod.) 3) Výběr struktur pro syntézu a analýzu FlexX, AutoGrow
Groupbuild procedura N CH 3 init ial core fragment fragment t o be added C O C O C O N N CH 2 C O N C O N C O N CH 2 CH 2
Analýza nalezených struktur A) Visuální zkoumání vzniklých struktur, zda se dají uvařit B) Identifikace specifických pozic některých skupni, které by mohly odpovídat známému farmakoforu C) Prohledání databáze pro podobné molekuly
Ukázka dostavby pro hypotetický receptor O H H N G receptor G solution -8-10 O H O O H N -30-80 O H H 3 C O O H N -30-20 G = G eq,2 G eq,1 = G receptor - G solution
Kontrola kvality Redocking zpátky do krystalu RMSD < 2A flexible ligand docking ~70% nutno otestovat, který docking program dává pózu dobře test sety validace programů GOLD test set, Astex set decoys ZINC, DUD (podobné fyz.chemické vlastnosti, odlišné struktury) VS: obohacení Enrichment factor (BED)ROC křivky ΔG eff a/n EF = ----- A/N - top (např. top10) a aktivní n - celkem - total ΔG eff = ΔG eff /N nonhatoms 37
Kvalita virtuálního screeningu 38
Metody na řazení ROC receiver operating characteristic curve AUAC area under the accumulation curve average rank of actives EF enrichment factor RIE robust initial enhancement BEDROC Boltzmann-enhanced discrimination of receiver operating characteristic Figure 9 Different accumulation curves from sampling (n = 50, N = 25000) shown together with the corresponding ROC and BEDROC values where α = 20.0. An exact CDF with λ = 20 is also shown to highlight the fact that the BEDROC metric returns a value of 1/2 for a curve close to this CDF. Published in: Jean-François Truchon; Christopher I. Bayly; J. Chem. Inf. Model. 2007, 47, 488-508. DOI: 10.1021/ci600426e Copyright 2007 American Chemical Society
Příklady použití 40
Příklady použití 41
Příště: Cvičení QSAR, dokování