Molekulová mechanika empirické potenciály silová pole Michal Otyepka, PřF UP Olomouc
Proč, když máme QM? běžná malá molekula kvantový chemik jásá středně velká molekula kvantovému chemikovi tuhnou rysy a volí umírněné prostředky (často i HF/6-31G(d)) běžný protein kvantový chemik je v pasti, i když SCC-DFT-B, PM6-DH
Born-Oppenheimerova aproximace oddělení elektronického a jaderného pohybu kvantové elektrony vs. klasická jádra = f ( R) aparát klasické fyziky molekulová mechanika
Potenciální energie Deformace vazebné vzdálenosti zajímá nás chování okolo minima -10 vzdálenost 10 m 1.0.0 využijeme Taylorův rozvoj 0.74 = r0 vazebná vzdálenost elektronická energie () r = ( r ) ( r) = k o + 1 1! ( r r ) o ( r ) ( ) ( 0 ) 0 1 r r r + ( r r ) r 0! r 0 +...
Vazba jako pružina F = r r 0 r = x F = kx ( r r ) k ( r) = o ( r) = k( r r ) 0 síla výchylka z rovnovážné polohy Hookův zákon silová konstanta r ( r) = k tato aproximace nedovolí disociaci vazeb! r 0 r = ( ) a r ) 1 1 r D e ( 0 Morseho pot.
Různé vazby různé pružiny různé kovalentní vazby mají různou vazebnou vzdálenost silovou konstantu molekula H H 35 Cl H 79 Br H 17 I k / N m -1 r 0 / pm 510 74.1 478 17.5 408 141.4 91 160.9
Typy vazeb podobné vazby X Y se chovají ve všech molekulách podobně bez ohledu na okolí - parametry jsou přenositelné - transferabilita najít podobné vazby, přiřadit jim k a r 0 zavádí se atomové typy
Atomové typy - uhlík PARM99 for DNA,RNA,AA, organic molecules, TIP3P wat. C sp C carbonyl group CA sp C pure aromatic (benzene) CB sp aromatic C, 5&6 membered ring junction CC sp aromatic C, 5 memb. ring HIS CD sp C atom in the middle of: C=CD-CD=C CK sp C 5 memb.ring in purines CM sp C pyrimidines in pos. 5 & 6 CN sp C aromatic 5&6 memb.ring junct.(trp) CQ sp C in 5 mem.ring of purines between N CR sp arom as CQ but in HIS CT sp3 aliphatic C CV sp arom. 5 memb.ring w/1 N and 1 H (HIS) CW sp arom. 5 memb.ring w/1 N-H and 1 H (HIS) C* sp arom. 5 memb.ring w/1 subst. (TRP) CY nitrile C (Howard et al.jcc,16,43,1995) CZ sp C (Howard et al.jcc,16,43,1995) O O C H H CT N N H H HC CT HC H Ala HC
Vazebné typy k r 0 CT-CT 310.0 1.56 CT-HC 340.0 1.090 CT-H1 340.0 1.090 CT-H 340.0 1.090 CT-H3 340.0 1.090 CT-HP 340.0 1.090 CT-N* 337.0 1.475 CT-N 337.0 1.463 CT-OH 30.0 1.410 CT-OS 30.0 1.410 C*-HC 367.0 1.080 C*-CB 388.0 1.459 C*-CT 317.0 1.495 C*-CW 546.0 1.35 CB-CN 447.0 1.419 Org. molekuly: Allingerovo pole: MM/MM3/MM4 http://europa.chem.uga.edu/ databáze parametrů pole pole balíku AMBR
Jak získat parametry? z experimentů vazebné geometrie RTG a neutronová difrakce, NMR, rotační spektroskopie silové konstanty vibrační spektroskopie výpočtem ~ ν = 1 πc m eff fitováním energetických hyperploch vypočtených referenční QM metodou Struktury (free) Protein Data Bank (PDB) http://www.pdb.org IR data (free) NIST - http://webbook.nist.gov/chemistry/ k 1/ m m m m 1 = eff m + 1
Molekulová mechanika celková energie je funkcí vzájemné pozice jader ( ) = f R = covalent + noncovalent covalent = b + a + t noncovalent = c + vdw aditivní model efektivní párově aditivní model
Deformace úhlů ( θ θ ) = k θ 0 = 80 kcal/mol.deg k θ θ 0 = 1.9
Deformace torzí H H H H 0 60 10 180 40 300 360 H H H H H Degrees of Rotation θ H H H.9 kcal/mol n = 3 φ 0 = 180.0 k t =.9/*9 (IDIVF=1) k t =.9/ (IDIVF=9) kt = n ( 1+ cos( φ φ ) ki, t = i i i, 0 i ( 1+ cos( n φ φ ) 0
Konformační chování konformační chování biomakromolekul je do značné míry dáno paramaterizací torzní úhlů (a nevazebnými termy) parametrizace podle experimentálních dat (NMR, distribuce z databází) knowledge based CHARMM QM profily QM v gas phase není zcela vhodná, QM v solventu (ε r = 80) je lepší alternativa CMAP D dihedral energy correction map, CHARMM
C-C-C-C H-C-C-H Deformace torzí
Nepřímé torze např. pro popis vhodné geometrie aminoskupin AMBR -3-1-4 fáze 180 n = CHARMM ( ω ω ) = k ω 0
Nekovalentní interakce model párového potenciálu ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) j i rep j i atr j i j i j i N k j i k j i j i j i N u u u u U u u U R R R R R R R R R R R R R R R R R,,,,,...,...,,,,..., 1 1 + = = + + = < < < <
lektrostatická interakce popisuje interakci multipól-multipól v monopólovém rozvoji atomově centrované parciální náboje Coulombův zákon = 1 4πε 0 q i r q j
lektrostatika
Parciální náboje Mullikenovy nevhodné RSP náboje Restrained lectrostatic Potential fit dobře fitují elektrostatický potenciál molekuly HF/6-31G* - přecenění dip. momentů, částečná kompenzace elektrostatické indukce (parm99) B3LYP/cc-pVTZ/PCM(ε r =4) (ff03) polarizaci lze zavést dodatečně
RSP
RSP
Van der Waalsova interakce 0. 0.1 0 nergie (kj/mol) hloubka minima repulze popisuje disperzní a repulzní složku nekovalentní interakce výhodný je popis Lennard-Jonesovým potenciálem -0.1 vdw profil disperze -0. 3 4 5 6 7 8 9 10 vzdálenost (10-10 m)
Lennard-Jonesův potenciál 0. 0.1 0-0.1 u u () r σ 4ε = r 1 σ r ( ) ( ) 6 σ = 0, u σ = min = ε, σ / f(r 1 ) f(r 6 ) 6 σ ε = r vdw vdw 1 σ r vdw 6 van der Waalsův poloměr Proč je výhodný LJ potenciál 1-6? Počítač umí rychle počítat mocniny a r 1 = (r 6 ). Repulze však roste exponenciálně! -0. 3 4 5 6 7 8 9 10
Kompenzace chyb parm99 Minimum vdw komplex Závislost rozdílu jednotlivých příspěvků interakční energie, počítaných na úrovni MM s příspěvky, počítaných na úrovni SAPT, na vzdálenosti. elst elektrostatická energie, disp disperzní energie, exch repulzní energie, tot celková energie. Pro komplex ma+...moh a ff99.
Molekulová mechanika b = kr ( r r ) 0 t = k ( ) θ θ θ a 0 k ( 1+ cos( φ φ ) t = n 1 qi q c = 4πε 0 ε r r ij j 0 vdw σ ij = ε ij rij 6 σ ij + ε ij rij 1
Topologie molekuly definuje, které vazby, úhly, torze etc. se uplatňují v molekule ALA INT 1 CORR OMIT DU BG 0.00000 1 DUMM DU M 0-1 - 0.000 0.000 0.000 0.00000 H 7 H 9 DUMM DU M 1 0-1 1.449 0.000 0.000 0.00000 3 DUMM DU M 1 0 1.5 111.100 0.000 0.00000 4 N N M 3 1 1.335 116.600 180.000-0.41570 5 H H 4 3 1.010 119.800 0.000 0.7190 6 CA CT M 4 3 1.449 11.900 180.000 0.03370 7 HA H1 6 4 3 1.090 109.500 300.000 0.0830 8 CB CT 3 6 4 3 1.55 111.100 60.000-0.1850 9 HB1 HC 8 6 4 1.090 109.500 60.000 0.06030 13 O H 1 5 N 6 4 8 H 11 H Ala 10 10 HB HC 8 6 4 1.090 109.500 180.000 0.06030 11 HB3 HC 8 6 4 1.090 109.500 300.000 0.06030 1 C C M 6 4 3 1.5 111.100 180.000 0.59730 13 O O 1 6 4 1.9 10.500 0.000-0.56790 název at. typ konekt. vzdálenost úhel torze parc. náboj
Ne vše se počítá vazebné jen kovalentně vázaní sousedé vaz. úhel jen reálné vazebné úhly torze jen reálné torze coulomb 1-, 1-3 se nepočítají; 1-4 se škálují (.0), další všechny vdw 1- a 1-3 se nepočítají; 1-4 se škálují (1.), další všechny snížení počtu nekov. interakcí zavádí se cutoff 3 1 4
Ořezání (cutoff) počet nevazebných interakcí ~ N(N 1)/ pro 10.000 atomů (menší systém) ~10 8 párů vdw interakce velmi rychle vyhasíná se vzdáleností (r 6 ) vdw interakce v.4násobné vzdálenosti než odpovídá minimu je cca 100 menší než v minimu zavádí se cutoff pro vdw interakci; páry se vzdáleností nad r max se nepočítají problém: vnesení diskontinuity (může způsobovat problémy tam, kde se pracuje s derivacemi ) switch
Switching function Graph of van der Waals potential with and without the application of the switching function. With the switching function active, the potential is smoothly reduced to 0 at the cutoff distance. Without the switching function, there is a discontinuity where the potential is truncated.
Cutoff T. Sprik
Cutoff pro elektrostatiku? elektrostatická interakce dvou monopólů vyhasíná pomalu (r 1 ) na vzdálenosti 10r činí 10% vzhledem k interakci na vzdálenosti r při použití periodických okrajových podmínek (PBC) lze řešit waldovou sumací PM particle mesh wald Interakce dvou částic se sumuje v krátkých vzdálenostech přímo a v dlouhých vzdálenostech v Fourierově prostoru a využívá Fast Fourier Transform Φ ~ ~ ρ tot sr tr lr = = = ( k) i, j i, j k φ φ ( r r ) sr i ( r r ) i ~ ( k) ~ ρ( k) lr Φ j j = sr + Fourierův obraz potenciálu Hustota náboje lr
Další zjednodušení popis celých skupin (united atom) např. skupina CH 3 se bude popisovat jako jeden pseudoatom Coarse grained modely (CG) Studium velkých systémů Hrubá aproximace Aplikace: membrány, proteinové komplexy CGFF MARTINI http://troll.med.unc.edu/ifoldrna/ (RNA CG)
Coarse Grained MARTINI The forcefield has been parametrized in a systematic way, based on the reproduction of partitioning free energies between polar and apolar phases of a large number of chemical compounds. The model is based on a four-to-one mapping, i.e. on average four heavy atoms are represented by a single interaction center. In order to keep the model simple, only four main types of interaction sites are defined: polar (P), non-polar (N), apolar (C), and charged (Q). ach particle type has a number of subtypes, which allow for an accurate representation of the chemical nature of the underlying atomistic structure. Currently topologies are available for many lipids and surfactant molecules, including cholesterol, and for all amino acids. Scripts are furthermore available to build topologies for arbitrary peptides and proteins.
CG - MARTINI
CG - MARTINI
Běžná silová pole organické molekuly MM, MM3, CVFF... biomakromolekuly AMBR parm94, 98, ff03 CHARMM OPLS