LEKCE 6 - Statistické hodnoc regresních rovnic - Elektronové parametry, polární konstanty, Hammettova rovnice mesomérní a induktivní efekt kvantifikace experimentální veličiny jako elektronové parametry
Lineární regresní analýza Statistické hodnoc regresních rovnic Lineární regresní analýza biologická aktivita (závislá veličina) vyjádřena lineární kombinací vhodných parametrů (nezávislých veličin): log (1/C St ) = 0.319 ( 0.095) Sp + 0.591 ( 0.202) DpK a + 0.292 ( 0.123) E S + 0.280 ( 0.078) D + 2.190 ( 0.372) n = 30 r = 0.922 s = 0.137 F 0.005 = 35 Více než jeden parametr vícenásobná regresní analýza Nezbytné podmínky: a) číselné hodnoty všech veličin b) počet látek > počet proměnných Tzv. náhodné korelace: Minimum dat 6 látek na jeden parametr (Topliss) Předpoklady: - byly již diskutovány (BO jako funkce strukturních změn, vyjádřeny fyz.chem. veličinami, lineární vztah, aditivita) - chyby jsou pouze v hodnotách závisle proměnné (platí částečně)
Statistické hodnoc regresních rovnic Regresní analýza založena na metodě nejmenších čtverců při výpočtu regresních koeficientů platí minimalizační podmínka: S (Y exp - Y calc ) 2 je minimální (1) Výpočet regresních koeficientů: pomocí maticového počtu nezbytný počítač a vhodný program (STATGRAPH, SYSTAT) Nejjednodušší případ rovnice přímky: y = ax + b (2) Regresní koeficienty: a. směrnice přímky; b. úsek na ose y a = (Sxy 1/n SxSy) / [Sx 2 (Sx 2 /n)] (3) b = Sy/n - asx/n (4) Interpretace regresních koeficientů 1. určuje změnu závisle proměnné pro jednotkovou změnu příslušné nezávisle proměnné 2. velikost regresního koeficientu relativní vliv na závisle proměnnou (biologickou účinnost)
Statistické hodnoc regresních rovnic Ad 2. platí pouze tehdy, když: - - nezávisle proměnné (parametry) nejsou kolineární - - mají stejné numerické rozmezí použití normalizovaných dat Statistická kriteria r. koeficient vícenásobné korelace (korelační koeficient) Y i+ vypočtené hodnoty Y i. experimentální hodnoty Y f průměrná hodnota /r/.. hodnoty od 0 1 r = [S (Y i+ - Y f ) 2 / S (Y i - Y f ) 2 ] 1/2 (5) Nutno posuzovat vždy v souvislosti s počtem stupňů volnosti f: f = n p 1 (6) r 2. 100. % pravděpodobnosti, že biol. aktivita je vyjádřena příslušnou regresní rovnicí
Statistická kriteria s residuální standardní odchylka s = [S (Y i+ - Y i ) 2 / (n - p - 1)] 1/2 (7) s. chyba s jakou je závisle proměnná vypočtena regresní rovnicí je mírou rozptylu hodnot závisle proměnné kolem regresní funkce Odlehlý výsledek (outlier): Y i+ - Y i > 2s Kriteria statistické významnosti Potvrz neplatnosti tzv. nulové hypotézy: a 1 = a 2 =.. = a n = 0 Fischer-Snedecorovo kriterium F (pro celou rovnici): F = [r 2 (n-p-1)] / (1 r 2 ) p (8) Čím vyšší f a r a čím nižší p, tím je vyšší hodnota F Porovnání vypočtené hodnoty s tabulkovou hodnotou pro daný počet stupňů volnosti f a počet parametrů p určuje hladinu statistické významnosti a F(calc) F (tab). nulová hypotéza neplatí (a = 0.01 regresní rovnice vysvětluje závisle proměnnou s 90% pravděpodobností; a = 0.001.. pravděpodobnost je 99%)
Statistická kriteria Studentův t-test (statistická významnost a meze spolehlivosti regresních koeficientů): t i = a i /s i (9) a i... příslušný regresní koeficient s i... odpovídající standardní odchylka (její výpočet pro každý parametr je součástí statist. programu) Meze spolehlivosti: a i = ts i (10) hodnota t se nalezne v tabulce pro určitou hladinu statistické významnosti a a pro daný počet stupňů volnosti f aby byla splněna podmínka: a i a i (11)
log (1/C St ) = 0.319 Sp + 0.591 DpK a + 0.292 E S + 0.280 D + 2.190 n = 30 r = 0.922 s = 0.137 F 0.005 = 35 (F calc = 43) s 0.0309 0.0656 0.0400 0.0253 0.1208 počet stupňů volnosti.. 25 pro tento počet stupňů volnosti vyhledáme nejvyšší hodnotu t, splňující požadavek pro meze spolehlivosti všech regresních koeficientů a i : a i = ts i a i tato hodnota je 3.0782 (pro hladinu statist.významnosti 0.005) vypočítáme hodnoty a i pro všechny regresní koeficienty: a i.. 0.095 0.202 0.123 0.078 0.372 log (1/C St ) = 0.319 ( 0.095) Sp + 0.591 ( 0.202) DpK a + 0.292 ( 0.123) E S + + 0.280 ( 0.078) D + 2.190 ( 0.372) n = 30 r = 0.922 s = 0.137 F 0.005 = 35
Shrnutí: Hanschův model QSAR je charakterizován následujícími znaky: a) chování látky v biologickém systému je určováno její strukturou b) všechny substruktury přispívají k biol. aktivitě látky aditivním způsobem c) entropické změny jsou zanedbatelné nebo úměrné DH (biologická aktivita je lineární funkcí strukturních změn) d) strukturní změny jsou vyjádřeny odpovídajícími změnami fyzikálně chemických vlastností e) o transportu látky biologickým systémem rozhoduje její lipofilita (vyjádřena log P) f) závislost na lipofiltě má nelinerní průběh (parabolický a bilineární model) g) statistická významnost regresních rovnic je hodnocena souborem statistických kritérií log (1/C) = a log P - b (log P) 2 + c s + d E S + e x top + const
Hanschův model QSAR - obvykle je řešena účinnost, v níž figuruje pro všechny ligandy společné místo účinku - postačí interpretovat fyzikálně chemické vlastnosti těchto ligandů - vyjadřujeme je: a) vhodnými empirickými konstantami mají charakter substituentových konstant, vyjadřují změnu fyz.chem.vlastnosti způsobenou substituční obměnou základní struktury b) experimentálními veličinami
Elektronové parametry Hodnoc polárních efektů: a) empirickými konstantami b) experimentálními veličinami Aromatické sloučeniny: Hammettova rovnice (1941): log (k/k 0 ) = r. s Změna fyz.-chem. vlastnosti je úměrná změně struktury; pokud změna struktury je realizována změnou substituentu, můžeme každý substituent charakterizovat konstantou s Příklad LFER - předpoklady: 1. změna entropie je konstantní nebo platí lineární vztah DH vs. DS 2. stejný mechanismus definováno: Luis Plack Hammett (USA), 1894-1987 r = 1 pro disociaci benzoových kyselin; s = 0 pro H
Interpretace Hammettovy rovnice r... závisí na charakteru reakce, na typu substance, s... závisí na vlastnostech substituentu, jeho poloze k reakčnímu centru r s +... nukleofilní reakce _...elektrofilní reakce +... substituent přitahující elektrony (akceptory): NO 2, halogeny. - substituent odpuzující elektrony (donory): OH, NH 2
Druhy polárních konstant: (rozsáhle tabelovány: Hansch, Leo, Hoeckman: Exploring QSAR, ACS Publ., Washington, DC, 1995 Kuchař, Rejholec: Využití kvant.vztahů mezi strukturou a biol.aktivitou, Academia, Praha 1987) Základní konstanty: - odvozeny z pk hodnot benzoových kyselin.. s m, s p Duální konstanty: - při konjugaci s reakčním centrem s p- pro substituenty přitahující elektrony [NO 2, (CH 3 ) 3 N +, CN, COOH..] Odvoz: ve fenolech, anilinech nukleofilní reakce z disociačních konstant fenolů a anilinů O 2 N NH 2 NH 2 + - O 2 N
s p+ pro substituenty odpuzující elektrony (OCH 3, OH, alkyly, halogeny..) elektrofilní aromatické substituce, oxidační a radikálové reakce Odvoz: ze solvolýzy subst. kumylchloridů Příklady: R Inhibice komplementu v serii benzylpyridiniových solí (in vitro): X Cl N + Y log (1/C) = 0.18 ( 0.04) p X + 0.46 ( 0.14) p Y + 1.01 ( 0.28) s + X + 0.72 ( 0.12) D 1 + 2.50 ( 0.13) n = 69, r = 0.939, s = 0.198 platí i po rozšíř na 132 látek naznačuje, že se jedná o elektrofilní reakci na N atomu Hansch, Yoshimoto, Doll: J.Med.Chem. 1976, 19, 1089 R Br -- +
Příklady: Multivariační analýza cytostatického účinku aryl-n-yperitů (12 látek): - log ED 90 = 4.801 s - - 2.112 r = 0.997 - log LD 50 = 4.652 s - - 2.012 r = 0.960 log k = 1.025 s - - 2.747 r = 0.978 X ED 90. účinnost proti tumoru Walker 256 (potkan) LD 50. akutní toxicita k.. rychlostní konstanta reakce s 4-nitrobenzylpyridinem (nukleofilní reakce) Mager P.P. v knize: Drug Design (Ariens E.J., ed.), Vol. IX, Academic Press, New York 1979. N Cl Cl
Induktivní a mesomérní konstanty (elektron.hustota, polarizace vazeb): odpovídající efekty nejsou v konstantách s rozlišeny Experimentální odvoz pouze induktivní konstanty s I : a) pk 4-subst. bicyklo(2.2.2)oktankarboxylových kyselin (Taft) celkem 14 kyselin b) pk subst. octových kyselin c) posuny subst. fluorbenzenů v NMR Při stejném měřítku vztah mezi s a s I, s R : s p = 1.14 s I + s R (1) s m = s I + 0.33 s R (2) s R vypočteny ze s I a s p Obecně platná stupnice induktivního efektu; pro mesomérní efekt platí jen částečně Swainovy a Luptonovy konstanty F a R : Odvoz: Z rovnice (3) odvozené pro 14 substituentů a z definiční rovnice pro R : F = 2.26 s m - 0.62 s p - 0.01 n = 14, r = 0.990, s = 0.070 (3) R = s p 0.56 (4) Z těchto rovnic vypočteny F a R pro 42 substituentů Kuchař M. Výzkum a vývoj léčiv (skripta), VŠCHT 2008, str. 56, tab. 5.1
Vzájemné vztahy: F = 1.421 s I + 0.160 (1) n = 34, r = 0.990, s = 0.054 R = 0.953 s R + 0.082 (2) n = 30, r = 0.941, s = 0.098 F SL = 1.648 F H + 0.011 (3) n = 44, r = 0.996, s= 0.033 Příklad: esterolýza arylesterů methylsulfonamidoctové kyseliny: log (1/K m ) = 0.53( 0.23) MR + 0.37( 0.20) Ss + 1.88( 0.13) (4) n = 13, r = 0.935, s = 0.105 log (1/K m ) = 0.56( 0.22) MR + 0.51( 0.28) F 3,4 + 0.23( 0.27) R 4 + 1.79( 0.16) (5) n = 13, r = 0.949, s = 0.098 Hansch C, Calef D.F.: J.Med.Chem. 1976, 19, 1240. antibakteriální aktivita (S. aureus) derivátů nitrofuranu: log (1/IC 50 ) = -1.304( 0.42) s p + 3.427( 0.17) (6) n = 9, r = 0.941, s = 0.189, F 0.01 = 54.1 log (1/IC 50 ) = -0.8( 0.4) F 1.6( 0.7) R 1.0( 0.2) I ab + 3.3( 0.2) (7) n = 19, r = 0.970, s = 0.197, F 0.01 = 78.4 I ab indikátorová proměnná pro stérický efekt Pirés J.R. Giesbrecht A., Gomez S.L. et al in: Molecular Modeling and Prediction of Bioactivity, p. 290, Kluwer, New York 1999.
Gasteigerovy konstanty: (J.Am.Chem.Soc. 1984, 106, 6489) Polární efekty vyjádřeny dvěma parametry: zbytková elektronegativita p.. schopnost přitahovat elektrony efektivní polarizabilita a d.. ovlivňuje polarizaci vazeb Radikálové reakce: Konstanty E R.. schopnost stabilizovat nepárový elektron Odvoz: radikálová polymerace styrenu za katalýzy substituovaných kumenů (pouze pro 13 substituentů) Vztah ke konstantám s: E R = 0.546 s 2 + 0.630 n = 13, r = 0.936, s = 0.401 (1) Pozor na interpretaci s 2 : enzymová oxidace arylglycinů: log V max = -2.705 s 2 + 2.592 s + 0.170 n = 11, r = 0.966, s = 0.446 (2) log V max = -6.383 E R + 2.988 s + 0.541 n = 11, r = 0.986, s = 0.293 (3) oxidace aminokyselin doprovázena přítomností radikálů
Ortho-substituce: Neplatí Hammettův vztah působí ortho-efekt: a) přímé elektrostatické působ (field-effect) mezi substituentem a reakčním centrem; b) stérický efekt; c) vodíková vazba Parametrizace: - konstanty s o - omezené použití obvykle něny o stérické parametry - využití kvantově chemických veličin Příklad: hypotenzní účinek ortho-subst. derivátů klonidinu: X N HN log (1/ED 50 ) = -0.40( 0.12) (SE S ) 2 1.77( 0.56) SE S + 1.90( 1.09) SR + 5.13( 1.67) E HOMO + 6.77( 1.96) EE + 8.03 n = 27, r= 0.941, s = 0.326, F = 32.2, p = 0.01 E HOMO energie nejvyššího obsazeného orbitalu EE. excitační energie p-elektronů - použití experimentálních veličin úskalí: podobnost interakcí v obou modelech H N
Rozšíř Hammettova vztahu: Polysubstituce a heterocyklické systémy Polysubstituce: nenalezeny výraznější odchylky od aditivity obvykle platí: log (k/k 0 ) = r.ss (1) obecně: log (k/k 0 ) = Srs (2) substituenty pouze v jedné poloze ovlivňují aktivitu N-benzylpyridinium bromidy v inhibici komplementu: log (1/C) = 0.18 ( 0.04) p X + 0.46 ( 0.14) p Y + 1.01 ( 0.28) s + X + + 0.72 ( 0.12) D 1 + 2.50 ( 0.13) (3) n = 69, r = 0.939, s = 0.198 - pouze substituenty na pyridinovém jádře ovlivňují aktivitu elektronovým efektem.. duální konstanty pro substituenty odpuzující elektrony s + X Heterocyklické systémy: - pro jednotlivé heterocykly se odvozují konstanty s - využití různých aromatických konstant s
Polární konstanty v alifatických sloučeninách: R R O O O O R C + O R C + O O - O - H + OH - R C + O Předpoklad: kyselá hydrolýza řízena výhradně stérickými vlivy (Taft) stérický vliv: OH O - O OH H 2 O R O OH O + H 2 s* = [log (k/k 0 ) B log (k/k 0 ) A ] / 2.48 (1) E S = log (k/k 0 ) A (2) Použití: omezené - změny na alifatickém řetězci obvykle změna aktivního centra - obvykle: substituce různými alkyly (malé rozdíly v hodnotách s*, interkorelace mezi s* a E S ) Častá kombinace elektronového, stérického a hyperkonjugačního efektu: log k (log(1/c) = rs* + de S + nh + const (3) h. empirická konstanta n.. počet H-atomů na a-c atomu
Experimentální fyzikálně chemické veličiny: - pk hodnoty - rychlostní (rovnovážné) reakční konstanty - spektrální veličiny (IČ, NMR) Ideální případ: podobná povaha fyz.chemického a biologického procesu Pokud fyz.chemická veličina V f závisí na dvou parametrech: mohou nastat komplikace: a) biol. účinnost V b závislá pouze na jednom parametru falešná závislost na druhém parametru b) biol. účinnost V b závisí rovněž na obou parametrech avšak různým způsobem v regresní rovnici kromě experimentální veličiny zahrnut jeden z parametrů
Příklad: stabilizace membrány erythrocytů X log (1/C n ) = 0.316 Sp + 0.722 Ss + 0.689 E S + 0.286 D + 4.223 n = 30, r = 0.949, s = 0.144, F 0.01 = 52.2 DpK = 0.458 Ss + 0.414 E S n = 12, r = 0.988, s = 0.051 DpK.. pk H,H - pk X,R k 1 /k 1 = 1.57 k 2 /k 2 = 1.664 D počet atomů H na C alkylu R připojeném k dvojné vazbě N splněna předchozí podmínka proto při použití DpK je nutný i člen s E S log (1/C n ) = 0.326 Sp + 1.566 DpK + 0.280 D + 0.315 E S + 4.233 n = 30, r = 0.951, s = 0.141, F 0.01 = 58.5 log (1/C n ) = 0.245 Sp + 1.732 DpK + 0.177 D + 4.530 n = 30, r = 0.935, s = 0.158, F 0.01 = 60.5 Kuchař, Brůnová, Rejholec a spol. Coll.Czech.Chem.Commun 1975, 40, 3545. R O OH
Spektrální veličiny: I Chemické posuny 15 N v NMR spektrech závislost na s konstantách : Pro substance I: d N1 = -15.90 ( 0.89) s - 25.83 17 0.977 1.148 d N2 = - 4.87 ( 0.51) s + 68.58 17 0.928 0.649 d N3 = -14.19 ( 1.01) s - 224.72 17 0.964 1.296 Wilman D.E.V. in:qsar: Rational Approaches to Drug Design, p. 159, Elsevier, 1991 Chemické posuny 13 C v NMR spektrech: Blokátory dopamin D 2 receptorů: X X O O N H 5-9 X = Me, Et, n-pr, n-bu, hal, OMe, SMe, NH 2, NO 2,SO 2 NH 2 pk i = 0.254( 0.043) C 2 + 0.030( 0.009) C 3 + 0.083( 0.011) C 5 + 0.026( 0.007) SMR 46.05( 7.95) n = 18, r = 0.948, s = 0.308, F 0.01 = 28 El Tayar N et al. In: QSAR: Rational Approaches to Drug Design, p. 163, Elsevier, 1991 N N N N
CODESSA PRO project COmprehensive DEscriptors for Structural and Statistical Analysis Deskriptory: a) konstituční (8) b) topologické (12) c) geometrické (8) d) elektrostatické (14) e) valenční (9) f) kvantově chemické (18) g) termodynamické (7) Metody: 1) multilineární regresní analýza 2) výběr descriptorů 3) multivariační metody (PCA, faktorová analýza, PLS regresní analýza) University of Florida, 2001-2005
Electrostatic Descriptors Gasteiger-Marsili empirical atomic partial charges Zefirov s empirical atomic partial charges Mulliken atomic partial charges Minimum (most negative) and maximum (most positive) atomic partal charges Polarity parameters Dipole moment Molecular polarizability, Molecular hyperpolarizability, Average ionization energy Minimum electrostatic potential at the molecular surface Maximum electrostatic potential at the molecular surface Local polarity of molecule Total variance of the surface electrostatic potential Electrostatic balance parameter
Valenční deskriptory Highest occupied molecular orbital (HOMO) energy Lowest occupied molecular orbital (LUMO) energy Absolute hardness Activation hardness Fukui atomic nucleophilic reactivity index Fukui atomic electrophilic reactivity index Fukui atomic one-electron reactivity index Mulliken bond orders Free valence