Computing structural chemistry and biology
Chemistry and biology with computers http://www.nobel.se/chemistry/laureates/1998/illpres/index.html
Why computing chemistry Snížené náklady na laboratorní experimenty Zvýšená bezpečnost při práci s toxickými látkami Předpověď chování nových látek
Why computing chemistry Interpretace experimentálních dat - NMR refinement pomocí MD, mapy elektronových hustot v RTG Pohled za experiment - kam experiment nedosáhne... NMR MD vnitřní pohyby 4ns 50μs 10ms NMR nevidí... MD nevidí...
Why computing Biology Rational drug design ($$$) Založený na MECHANISMU reakce: Kvantově-mechanické studium reakční cesty, popis tranzitního stavu Založený na RECEPTORU: Známe X-ray strukturu enzymu, komplexu. Návrhy nových inhibitorů, docking Založený na LIGANDU: Neznáme exp. strukturu receptoru. Konformační prohledávání ligandů, výpočet elektron. vlastností, farmakofor, QSAR
Metody výpočtu energie Kvantová mechanika Molekulová mechanika formaldehyd vázaný vodíkovou vazbou k fluorovodíku Energie vypočtená řešením Schrodingerovy rovnice Energie vypočtená z mechanického modelu Energie pnutí
Metody molekulového modelování Ab initio kvantová mechanika Semiempirická kvantová mechanika Molekulová mechanika 100 atomů 1000 atomů 100 000 atomů Exaktní řešení Schrodingerovy rovnice Aproximativní řešení Schrodingerovy rovnice Užití empiricky odvozené potenciálové funkce roste výpočetní náročnost použití empirických parametrů
Hyperplocha potenciální energie Potential Energy (hyper)surface (PES) Globální minimum tranzitní stav Lokální minimum Energie = funkce struktury Energie reakční bariéra Reakční koordináta
Souřadné systémy - Methan Dvě vnitřní souřadnice: C -- H 1.09 Å H C H 109.5 deg 15 kartézských souřadnic
Alanin CH 3 O O=C-NH-CH-C-NH-CH3 CH3 ACE ALA NME
Kartézské souřadnice: X, Y, Z 1 3 2 5 4 7 6 9 8 11 10 12 Počet atomů N Počet souřadnic 3N Vnitřní souřadnice Torzní uhly fixní valenční uhly
Hyperplocha potenciální energie (PES) Ramachandranova mapa 2D plocha: torzní úhly ϕ a φ v proteinech β struktura α L,γ-obrat C-N-C α -C φ N-C α -C-N ϕ C α pravotočivá α šroubovice
Quantum chemistry
Born-Oppenheimerova aproximace oddělení vlnové funkce pro elektrony a pro jádra hmotnost jádra >> hmotnost elektronu eliminace elektronů potenciální energie (PES) je funkcí polohy jader
Kvalitativní MO teorie 2 H H 2 2 1s atomové orbitaly (AO) (každý na 1 atomu H) 2 molekulové orbitaly (MO): antivazebný vazebný (obsazen 2 e)
Molecular Orbitals Bonding orbitals - concentrate electron density between atoms H 2 σ g (1s a + 1s b ) Antibonding orbitals - nodal plane in electron density between atoms H 2 σ u * (1s a -1s b ) http://hyperphysics.phy-astr.gsu.edu/hbase/molecule/hmol.html
Homonuclear Diatomics http://science.widener.edu/svb/molecule/mo.html http://xbeams.chem.yale.edu/~batista/vvv/node33.html
MO orbitaly lineární AH 2 AO (fragmentové orbitaly) MO H A - H 2p z 2p y 2p x 2s 4 AO atomu A 2 AO atomu H
MO orbitály lomená H 2 A z y x C 2 C 2v bodová grupa: H A H dvojčetná osa symetrie 2 roviny symetrie v ose C 2
MO orbitaly lomené H 2 A 4 AO na atomu A b 1 a 1 a 1 b 2 2s 2p x 2p y 2p z 2 AO dvou vodíků z b 2 y a 1 x
MO orbitaly H 2 A 6 AO 6 MO Podmínky vzniku vazby: stejná symetrie fragmentálních orbitalů co největší překryv malý rozdíl energie Energie
Polyatomic molecules Linear combinations of atomic orbitals MO s delocalized over several atoms 2b 2 4a 1 2σ u 3σ g 1b 1 1π u 1b 2 3a 1 1σ u 2a 1 2σ g 1a 1 1σ g H 2 O BeH 2
Electron Density In quantum mechanics, there are two ways of describing electron location and energy Ψ: wavefunction ρ: electron density ρ = Ψ 2 Electron density: probability of locating the electron
Visualization Methods Variables: x, y, z, Ψ (or Ψ 2 ) Contour plots Dot plots Surface plots 2σ g 2σ g science.uwaterloo.ca/~cchieh/cact/c120/pibond.html http://www.shef.ac.uk/chemistry/orbitron/aos/1s/e-density.html
Electron Density Positively charged nucleus attracts electron density ρvaries with distance from nucleus ρdepends on distance, not direction isodensity surfaces ("same density" surfaces) map of points where ρ has a particular value http://academic.reed.edu/chemistry/roco/density/
Electrostatic Potential Visualizes electronic charge distributions Map electronic potential onto total electron density surface using colors to represent different levels of potential
Frontier Orbitals In a chemical reaction, the most important interaction is between the HOMO-LUMO pair Least energetically bound most readily available for interaction with other molecules Nucleophilic Frontier Density: measure of the susceptibility of the substrate to attack by an electrophile; based on electron distribution of active orbitals near the LUMO Electrophilic Frontier Density: measure of the susceptibility of the substrate to attack by an electrophile; based on electron distribution of active orbitals near the HOMO
Kvantitativní teorie MO Schrodingerova rovnice Hamiltonův operátor vlnová funkce energie systému Born-Oppenheimerova aproximace hmotnost jádra >> hmotnost elektronu jádra jsou fixní
Hartree-Fockova metoda Ab initio z počátku Hamiltonián příspěvek přitažlivé interakce mezi elektrony a jádrem příspěvek repulze mezi elektrony jádra jsou fixní
Hartree-Fockova metoda Self-consistent field (SCF) interakce mezi všemi elektrony elektron v poli ostatních HF zjednodušení
Báze soubor funkcí, jejichž lineární kombinací jsou tvořeny molekulové orbitaly. LCAO. MO AO bázové funkce Bázové funkce lze považovat za atomové orbitaly (minimální báze) matematické funkce, které dávají MO potřebnou flexibilitu (rozšířené báze)
Slater Type Orbital STO elektronová hustota v atomu H atom 1s orbital C atom 1s, 2s, 3x 2p orbitaly methan CH 4 4x 1s pro H, 1s, 2s, 3x 2p pro C celkem 9 funkcí 1 funkce = 1 AO minimální báze
STO GTO STO: e -x 1 STO nahrazena 3 GTO GTO: e -x2 (Gaussian Type orbital) methan CH 4 4x 1s pro H, 1s, 2s, 3x 2p pro C = celkem 9 funkcí STO 27 funkcí GTO Minimální báze: STO-3G
STO x GTO aproximace STO lineární kombinací několika (např. 3) GTO STO-3G 1s orbital atomu H STO STO-3G
6-31G báze (split valence) atom C 1s orbital core 1 bázová funkce - 6 GTO 2s, 2p orbitaly (valenční): 2 bázové funkce: 3 GTO +1 GTO atom uhlíku 1s 1 BF 6 GTO 2s 1 BF (3 GTO) + 1 BF (1 GTO) 2p x 1 BF (3 GTO) + 1 BF (1 GTO) 2p y 1 BF (3 GTO) + 1 BF (1 GTO) 2p z 1 BF (3 GTO) + 1 BF (1 GTO) 9 BF 22 GTO
Rozšířené báze zahrnutí polarizace přidání polarizačních funkcí (přidání funkcí odpov. vyšším orbitalům) atom H atom C polarizace s orbitalu - přidání p orbitalu přidání d orbitalu 6-31G* - přidává sadu d funkcí (např. pro C). 6-31G(d) 6-31G** - přidává sadu d funkcí a sadu p funkcí (např. pro H) Difuzní funkce 6-31+G(d). Core LANL2DZ.
Ab initio procedury jednoduchý výpočet energie (single point) výpočet energie, vlnové funkce na fixované geometrii optimalizace geometrie výpočet energie, vlnové funkce změna geometrie směrem k nižší energii výpočty frekvencí a jiné předpověď frekvencí IČ a Raman, ověření geometrie získané optimalizací. Elektrostatický potenciál. Dipólový moment.
Optimalizace energie výpočet energie - analog single point výpočet sil (1. derivace energie na každém atomu) - tzv. gradient změna struktury (proti energet. gradientu) NE výpočet energie Jsou splněna konvergenční kritéria? ANO Minimum energie nalezeno Zápis nové struktury
Omezení HF metod molekula v mezihvězdném prostoru (gas phase) HF nedává exaktní řešení Schrodingerovy rovnice. Nejlepší vlnová funkce dosažitelná HF metodami - HF limita. 2 elektrony v 1 orbitalu se nepohybují nezávisle - elektronová korelace. Rozdíl mezi HF limitní energií a exaktním řešením Schrodingerovy rovnice - korelační a relativistická energie.
Korelační energie rozdíl přesné energie a HF limity Výpočet korelační energie: E corr = E exact -E HF Moller-Plesset perturbační teorie 2.řádu = MP2 Moller-Plesset perturbační teorie 4.řádu = MP4 Teorie funkcionálu hustoty = Density Functional Theory (DFT)
Relativistická korekce Einsteinova teorie relativity Těžké atomy Elektrony na vnitřních vrstvách Rychlosti blízké rychlosti světla
Metody funkcionálu hustoty Density functional methods (DFT) Energie je vyjádřena jako funkcionál hustoty elektronového pole elektronová hustota v okolí molekuly DFT zahrnují podstatnou část korelační energie vlnová funkce je konstruována jiným způsobem (jiný druh orbitalů) není to HF metoda!
Semiempirické metody
Kvantitativní MO teorie Schrodinger Born-Oppenheimer orbitalová approximace LCAO approximace
Semiempirická aproximace zanedbání některých překryvových integrálů nahrazení některých integrálů funkcemi s empirickými parametry CNDO = Complete Neglect of Differential Overlap INDO = Intermediate Neglect of Differential Overlap NDDO = Neglect of Diatomic Differential Overlap MINDO/3 = Modified INDO MNDO = Modified NDO AM1 = Austin Model 1 PM3 = Parametric Model 3 fitování empirických parametrů zanedbání překryvových integrálů
Možnosti semiempirických metod HF vlnové funkce molekulové orbitaly, energetické hladiny, náboje minima, tranzitní stavy, reakční koordináty silové konstanty, vibrační frekvence termodynamické vlastnosti řády vazeb, analýza σ a π orbitalů polarizabilita efekty solvatace
Omezení semiempirických metod zanedbání nebo parametrizace překryvových integrálů vnitřní orbitaly jsou zanedbány elektronová korelace je zahrnuta v parametrizaci může vést k chybám výpočetně méně náročné než ab-initio výpočetně náročnější než empirické metody
Software ab-initio: program GAUSSIAN program GAMESS program Spartan semiempirické metody: MOPAC = Molecular Orbital Package program Spartan
Multiplicita 2S+1 NO: 5+6=11=5.2+1. CO: 4+6=10=5.2+0. OO: 6+6=12=5.2+2. 2x1/2+1=2 2x0+1=1 2x1+1=3
Molekulová mechanika
Molekulová mechanika Empirical force-field Theoretical conformational analysis Strain energy calculation Westheimer-Hendrickson-Wiberg
Molekulová mechanika studium biologických makromolekul (tisíce atomů) umožňuje sledovat vliv okolí (solvent) atomy = sférické částice s bodovým nábojem interakce jsou založeny na klasické mechanice: tělesa (atomy) spojená pružinami (vazbami) Silové pole (force field): rovnice silového pole soubor parametrů
Anatomie silového pole Energie(potenciální) : energie pnutí vazeb energie deformace vazebných úhlů energie rotace vazeb (torze) deformace planárních skupin (oop) křižné členy vdw energie elektrostatická energie vodíkové vazby
Rovnice silového pole energie pnutí vazeb energie rotace vazeb (torze) energie deformace vazebných úhlů vdw energie elektrostatická energie
Parametry silového pole AMBER - parm94.dat (W. Cornell et all. 1995) definice atomových typů vazby úhly torze vdw poloměry náboje
Původ parametrů Vazby a úhly: délky vazeb, velikosti vazebných úhlů - z RTG krystalografie silové konstanty - z empirických dat (vibrační frekvence) Torze: přizpůsobení torzní potenciálové funkce tak, aby co nejpřesněji reprodukovala experimentální (nebo ab initio QM) energet. bariéry Ethan 9 možností definice torze H-C-C-H Energie torze
Nevazebné interakce: reálné plyny (van der Waals) sublimační tepla dipólové momenty Původ parametrů Termodynamické funkce: tvorná a spalná tepla disociační energie vazeb
Energie pnutí vazeb harmonická funkce (Hookův zákon)
Energie pnutí vazeb kubická korekce V(r)=a(r-r o ) 3 anharmonická funkce (Morse) V(r)=D[1-exp(-a(r-r o ))] 2 -D H-H: D=108.9 kcal.mol -1 r e =0.74 Å a=1.86 Å -1
Deformace vazebných úhlů
Vliv silových konstant vazby/úhly
Energie rotace vazeb (torzní)
Vliv torzních parametrů
Dvojné vazby Deformace planárních skupin E(r)=0.5 K (φ - φ 0 ) 2 E(r)=0.5 V (1 - cos 2φ) Pseudo torzní uhel δ E(r)=0.5δ 2
Nevazebné interakce Van der Waals elektrostatika
Nevazebné interakce 12-6 Lenard-Jones exp-6 Buckingham Repulze (Pauliho princip) Atrakce (Londonovy síly) 12-10 H-vazby r*
Elektrostatická energie E(r) = 1 q i q j 4πε 0 r vakuum ε =ε 0 ε r prostředí o relativní permitivitě ε r dielektrická konstanta (ne-)závislá na vzdálenosti
Celková energie Deformace vazebných délek V(b) Deformace vazebných uhlú V(θ) Deformace planárních skupin V(δ) Křižné členy V(b,θ,φ) Van der Waalsovské interakce V(r) Vodíkové vazby V(r) V total =V(b)+V(θ)+V(δ)+V(b,θ,φ)+V nb (r)+v HB (r)
Methan
Methan Parametry silového pole Energie (single point)
Deformovaný methan Vazba K Requil R Energy C - H 340.0 1.090 2.518 693.22
Ethan
Hyperplocha potenciální energie 1D plocha: E = f(φ) (PES) 17 Energie 16 15-180 -60 60 180 φ
Restraints X Constraints (restraint = omezení, nátlak; constraint = donucení, přesné vymezení) restraints = měkké vazné podmínky constraints = tvrdé vazné podmínky silová konstanta K r 0 r 0
Aplikace metod molekulového modelování
Minimalizace energie E = f (struktury) funkce n proměnných = f (délky vazeb, pnutí vaz. úhlů, rotace vazeb, nevazebné interakce...) = hyperplocha Energie strukturní parametr
Minimum funkce z Funkce 2 proměnných: 1. derivace v bodě x i = 0 2. derivace v bodě x i > 0 x i y x Funkce více proměnných: gradient v bodě x i... vektor 1. derivací Hessian v bodě x i... matice 2. parc. derivací
Algoritmus minimalizace Spádové metody: metoda největšího spádu (steepest descent) směr negativního gradientu v bodě x i iterativní proces: startovní bod směr pohybu? prohledání regionu konvergenční kritéria? nový bod Energie konvergence? minimum strukturní parametr
Konvergenční kritéria Rozdíl mezi 2 po sobě následujícími kroky: rozdíl energie Energie rozdíl ve struktuře strukturní parametr
Metody minimalizace derivační: metoda největšího spádu konjugované gradienty Newton-Raphsonova metoda nederivační: simplexová metoda daleko od minima blízko minima pro malé molekuly vibrační frekvence
Problém lokálních minim sedlový bod Globální minimum Energie Lokální minima Reakční koordináta
Hledání minim na PES lokální metody = minimalizace (hledání lokálních minim) globální metody = hledání všech lokálních minim + globální minimum systematické prohledávání (grid, mapování) MD a odvozené techniky (simulované žíhání) Monte Carlo
Konformační prohledávání PES Grid
Konformační prohledávání Molekulová dynamika CICADA Single coordinate driving
Konformační chování Dimethylfosfát ε C - O - P - O ε ζ ζ O - P - O - C
Konformační chování DMP
Konformační chování O - P - O - C C - O - P - O
Solvent E(r) = 1 q i q j 4πε 0 r vakuum ε =ε 0 ε r prostředí o relativní permitivitě ε r dielektrická konstanta (ne-)závislá na vzdálenosti
Explicitní solvent, H 2 O sledování specifických interakcí s molekulami H 2 O značná výpočetní náročnost peptid (330 atomů) + 2400 molekul H 2 O
Dlouhodosahové elektrostatické interakce Systém N-částic: nejnáročnější část minimalizace = výpočet dlouhodosahových interakcí (Coulomb síly) N 2 výpočtů elektrostatická energie
Periodic Boundary Conditions (PBC) Hraniční podmínky
Výpočet elektrostatických interakcí v PBC odříznutí interakcí o vzdálenosti > cutoff původní funkce funkce při použití cutoffu Energie problém vyšších cutoffů vzdálenost
Ewaldova sumace Periodický box E(r) = 1 q i q j 4πε 0 r E(r) = n=0 1 q i q j 4πε 0 r+ n n... násobek délky hrany boxu L Ewald (1921): reálný prostor reciproký prostor E = f (L) E = f (1/L)
Software Hyperchem (Hypercube) Chem-X (Chemical design) AMBER (Kollman, U. California) CHARMM, CERIUS CHEMOFFICE (Cambridgesoft) MM, MM4 (Allinger, Univ. Georgia) ALCHEMY, SYBYL (Tripos) BOBY (Zefirov, MGU Moskva, Springer) MOLBLD (Boyd 1968, Pavelcik 1975)
Molekulová dynamika
1976-1985 dark ages Historie MD 1985-1994 free energy perturbation (FEP) ΔG před. r. 1995: MD simulace nukleových kyselin (vysoce nabité systémy, nutno správně pracovat s dlouhodosahovými elektrostatickými interakcemi) - nestabilní (zkroucení duplexu, zlomení párů bazí). Nedostatek výpočetní síly: Pro výpočet dlouhodosahových elektrostatických interakcí je užíván cutoff - useknutí interakcí - nestabilita. Neužívá se PME (známo od r. 1993) Pomalý vývoj silových polí - nemožnost kvalitních QM výpočtů Krátké simulace < 200ps
Historie MD 1995 - zvýšená počítačová síla (superpočítače) korektní zacházení s dlouhodosahovými nevazebnými interakcemi (elektrostatika, vdw) kvalitní QM výpočty na vyšší úrovni silové pole 2. generace - např. AMBER parm94.dat stabilní trajektorie 1998 - přesná interpretace struktur + ΔG MD simulace nukleových kyselin - DNA (duplex,..., kvadruplex), RNA (hairpin, ribozymy), modifikovaná DNA, RNA, protein/na interakce
Molekulová dynamika Termodynamika stav 1 stav 2 stav n Termodynamika: jaké stavy jsou možné? Kinetika: jak a jak rychle stavy konvertují?
Molekulová dynamika integrace Newtonových pohybových rovnic de dr i F i = m i a i dv i dt de dr i = m i d 2 r i dt 2 dr i dt
Algoritmus MD Síla působící na částici = vektorový součet interakcí s ostatními částicemi zrychlení F = m. a rychlost pozice v čase t + Δt
Algoritmus MD Síla působící na částici = vektorový součet interakcí s ostatními částicemi Aplikace termostatu: přeškálování rychlostí vzhledem k tepelné lázni nová pozice v čase t + Δt
Počáteční konfigurace pro MD z experimentu přiřazení počátečních rychlostí - náhodně podle Maxwell - Boltzman distribuce (Gaussova distribuce) Generátor (pseudo)náhodných čísel: produkuje čísla <0, 1 > rovnoměrně přepočet na čísla odpovídající gaussovské distribuci
Časový krok v MD příliš malý - MD pokrývá jen omezenou část konformačního prostoru příliš velký - nestabilita trajektorie, vysoká E Správný časový krok Δt : 1/10 nejkratšího vibračního pohybu C-H vazba vibruje s periodou 10fs integrační krok Δt = 1 fs Constraints na vazby obsahující H (SHAKE algoritmus) integrační krok Δt = 2 fs
Termostat napodobuje působení teploty na systém - působení makroskopických vibračních modů na dynamiku jednotlivých atomů = násobení každé rychlosti atomu faktorem, který tvoří požadovanou teplotu (každý krok nebo periodicky každých X kroků)
Simulované žíhání zahřátí na vysokou teplotu pomalé ochlazování Energie
Postup MD+solvent volba vstupní struktury (např. z RTG), úprava (doplnění chybějících residuí, vodíků), optimalizace doplněných částí. přidání iontů (neutralizace systému), solvatace - přidání molekul vody (solvatační box) ekvilibrace systému: minimalizace vody a iontů krátká MD vody a iontů
Ekvilibrace systému Minimalizace a dynamika solventu a iontů constraints na molekulu peptidu
Několikastupňová minimalizace s postupným uvolňováním peptidu restraints na molekulu peptidu (25 kcal/mol/a, 20, 15, 10, 5, 0)
Zahřívání systému Teplota 0 ps 2 ps Čas 20 ps Zahřívání 100 K 300 K během 20 ps start produkční fáze MD
Kontrola ekvilibrace
Produkční fáze MD 1 krok MD = 0.002 ps = 2 fs Frekvence ukládání snímků = 500 kroků... 0 ps 1 ps 2 ps Čas 2 ns 500 kroků 500 kroků... 1 snímek 1 snímek... MD trajektorie = soubor snímků
Trajektorie - snímky 0 ps 200 ps 400 ps 600 ps 800 ps 1000 ps 1200 ps 1400 ps 1600 ps 1800 ps
Průměrná struktura z poslední fáze MD (např. 0.5 ns)
Vázaná MD = MD s užitím restraints Restraints (vazné podmínky)... získány z NMR přiřazení signálů MD + restraints NMR vzdálenosti 3D struktura
Problémy simulací Energie? časová škála: cíl: μs - ms realita: ps - ns kvalita reprezentace: cíl: komplexní systém realita: molekulová mechanika