《武汉工程大学学报》  2008年04期 42-45   出版日期:2008-04-30   ISSN:1674-2869   CN:42-1779/TQ
用分子连接性研究有机化合物溶解度的QSPR


分子连接性指数是一种拓扑指数,是根据分子结构计算出的非经验性参数.拓扑指数是分子结构数值化的一种方式,它通过对表征分子图的矩阵实施某种数字运算而获得.它是一种图的不变量,直接产生于分子结构,反映化合物分子中各骨架原子排列、连接方式等,即化合物的结构特征.拓扑指数有三个基本的要求:第一,拓扑指数应为一个或一组数据,即分子图拓扑不变量的数值化;第二,能充分反映分子图的连接信息和化学环境;第三,能有效地表达化合物结构与性质(活性)的关系.许多研究工作已经证明,分子连接性指数与物质的多种理化参数用来描述化学结构,并且与化合物的物理性质、热力学参数、化学性能、生物活性以及致癌性相关[1].分子结构与性质关系的拓扑指数法研究引起了化学家们的广泛兴趣[2].迄今已提出100 多种拓扑指数,其中得到广泛应用的是由Randic[3]提出、后经Kier等人[4]进一步发展的价连接性指数(mXv ). 余训民等[5]在36种卤代苯的溶解度lgSw研究中,采用零阶价连接性指数(0XV)建立QSPR方程,在他们的工作基础上,本文应用了Nagamann的研究方法[6],利用分子连接性指数与极化率(Ф)作为参数,对139种有机化合物的溶解度进行QSPR分析,预测结果好.1计算方法 1.1极化率(Ф)的计算极化率的计算方法是由Kestelar提出的[7],可用下面方程表示:Ф=A(H原子数)+B(C原子数)+C(Cl原子数)+D(Br原子数)+E(双键数)
其中,上式中的A~E均为常数,分别为:0.42、0.93、2.82、3.34、0.58.在此基础上,王连生先生对极化率公式进行了改进,得到的新方程[8]为:Ф=-0.963nCl-0.361nH-0.767n双键(nCl为Cl原子数,nH为H原子数,n双键为双键数)例:用上述新方程解苯的极化率Ф值.H原子数为6,Cl原子数为0,双键数为3.
Ф=-0.963×0-0.361×6-0.767×3=-4.47同理,计算了139种有机化合的极化率Ф值,结果如表1所示.由于极化率仅仅是有机化合物溶解度相关信息的一部分,因此有必要加入一个参数,即分子连接性指数.1.2分子连接性指数的计算分子连接性指数是用点价乘积平方根的倒数来表示.它是根据分子构型计算出来的常数,反映了分子的连接情况和分枝的多少.
1.2.1杂原子的点价计算Kier等在改进了Randic分枝指数的基础上提出了连接性指数mXv,其实质是采用了原子的核外电子总数Z、价电子数Zi和相连的氢原子数hi来定义新的原子点价δvi[10],即δvi=Zi-hiZ-Zi-1例:对氯代烃中的氯来说,核外电子总数Z为17,价电子数Zi为7,相连的氢原子数hi为0,则,原子点价δvi=7-017-7-1=0.78第4期吴桂玲,等:用分子连接性研究有机化合物溶解度的QSPR
武汉工程大学学报第30卷
表1化合物名称及水溶解度(logS)的实验值和预测值
Table 1List of compounds and their experimental and predicted water solubility (1ogS)
NOCompound nameФExp.
logSOLS models
Pred. Cal.NOCompound nameФExp.
logSOLSmodels
Pred.Cal.1benzene-4.47-0.75-1.240.4971perchloroethene-4.62-1.82-1.34-0.482toluene-5.19-1.29-1.530.24723chloroprop1ene-3.54-0.54-0.690.1531ethylbenzene-5.91-1.82-1.960.1473(Z)1,3dichloroprop1ene-4.14-1.00-1.010.014pxylene-5.91-1.73-1.880.1574perchloroprop1ene-6.55-2.77-2.970.205mxylene-5.91-1.79-1.880.0975perchlorobuta1,3diene-7.31-3.39-3.660.276oxylene-5.91-1.76-1.880.1276bromochloromethane-1.690.17-0.040.2171,2,3trimethylbenzene-6.63-2.13-2.280.1577bromomethane-1.080.180.33-0.1581,2,4trimethylbenzene-6.63-2.24-2.280.0478dibromomethane-0.720.060.020.049mesitylene-6.63-2.01-2.280.2779bromoform-0.36-0.51-0.590.08101propylbenzene-6.63-2.26-2.420.1680perbromomethane0.00-1.62-1.19-0.4311cumene-6.63-2.30-2.370.0781bromoethane-1.81-0.05-0.050.00121ethyl2methylbenzene-6.63-2.03-2.350.3282(Z)1,2dibromoethene-1.49-0.05-0.640.58131ethyl4methylbenzene-6.63-2.03-2.350.32831,2dibromoethane-1.44-0.38-0.410.03141butylbenzene-7.36-2.92-2.930.01841,1,2,2tetrabromoethane-0.72-1.17-1.890.72151isobutylbenzene-7.36-3.00-2.88-0.12851bromopropane-2.53-0.62-0.43-0.18161secbutylbenzene-7.36-2.77-2.880.11862bromopropane-2.53-0.51-0.29-0.22171tertbutylbenzene-7.36-2.47-2.820.35871,2dibromo3chloropropane-2.77-1.00-1.390.39181bromo2chlorobenzene-4.71-1.91-2.060.15881,2dibromopropane-4.09-0.85-0.72-0.13191bromo3chlorobenzene-4.71-1.93-2.060.13891bromobutane-3.25-1.27-0.85-0.42201bromo4chlorobenzene-4.71-2.35-2.06-0.29901bromo2methylpropane-3.25-1.29-0.71-0.58211bromobenzene-4.11-1.39-1.610.22911-bromo3methylbutane-3.97-1.70-1.30-0.40221,2dibromobenzene-3.75-2.13-2.200.0792butan1ol-3.250.860.94-0.08231,3dibromobenzene-3.75-2.17-2.200.02932methylpropan1ol-3.250.931.01-0.08241,4dibromobenzene-3.75-2.70-2.20-0.5094butan2ol-3.251.261.010.25251,2,3tribromobenzene-3.38-3.54-3.01-0.5295pentan1ol-3.970.330.54-0.20261,2,4tribromobenzene-3.38-3.00-3.010.01962methylbutan1ol-3.970.460.62-0.16271,3,5tribromobenzene-3.38-2.70-3.010.32973methylbutan1ol-3.970.430.62-0.19281,2,4,5tetrabromobenzene-3.02-4.30-4.09-0.22982,2dimethylpropan1ol-3.970.520.70-0.18291chlorobenzene-5.07-1.30-1.570.2799pentan2ol-3.970.630.620.01301,2dichlorobenzene-5.67-2.04-1.97-0.07100pentan3ol-3.970.700.620.08311,3dichlorobenzene-5.67-1.91-1.970.061013methylbutan2ol-3.970.730.680.05321,4dichlorobenzene-5.67-2.05-1.97-0.081022methylbutan2ol-3.971.030.700.33331,2,3trichlorobenzene-6.27-2.51-2.44-0.07103hexan1ol-4.69-0.230.11-0.35341,2,4trichlorobenzene-6.27-2.52-2.44-0.091042methylpentan1ol-4.69-0.100.18-0.28351,3,5trichlorobenzene-6.27-3.18-2.44-0.741054methylpentan1ol-4.69-0.130.18-0.31361,2,3,4tetrachlorobenzene-6.88-3.37-2.99-0.371062,2dimethylbutan1ol-4.69-0.030.26-0.29371,2,3,5tetrachlorobenzene-6.88-3.46-2.99-0.461073,3dimethylbutan1ol-4.690.510.260.25381,2,4,5tetrachlorobenzene-6.88-3.25-2.99-0.261082ethylbutan1ol-4.69-0.160.18-0.3439dichloromethane-2.650.12-0.100.21109hexan3ol-4.690.190.180.0140chloroform-3.25-0.10-0.410.301103methylpentan2ol-4.690.270.260.0141perchloromethane-3.85-1.10-0.76-0.341114methylpentan2ol-4.690.200.26-0.0642chloroethane-2.77-0.25-0.08-0.171122methylpentan3ol-4.690.300.260.04431,1dichloroethane-3.37-0.32-0.380.061133,3dimethylpentan2ol-4.690.370.320.05441,2dichloroethane-3.37-0.07-0.460.391142methylpentan2ol-4.690.500.260.24451,1,1trichloroethane-3.97-0.82-0.880.061153methylpentan3ol-4.690.620.260.36461,1,2trichloroethane-3.97-0.36-0.810.461162,3dimethylbutan2ol-4.690.600.320.28471,1,1,2tetrachloroethane-4.57-0.96-1.230.281172,4dimethylpentan2ol-5.420.10-0.170.28481,1,2,2tetrachloroethane-4.57-0.53-1.240.71118heptan1ol-5.42-0.77-0.34-0.43491,1,1,2,2pentachloroethane-5.18-1.30-1.740.441192,4dimethylpentan1ol-5.42-0.46-0.21-0.2550perchloroethane-5.78-2.30-2.29-0.011203,4dimethylpentan1ol-5.42-0.54-0.24-0.29511chloropropane-3.49-0.58-0.42-0.161214,4dimethylpentan1ol-5.42-0.49-0.21-0.28522chloropropane-3.49-0.53-0.35-0.18122heptan2ol-5.42-0.49-0.30-0.19531,2dichloropropane-4.09-0.53-0.780.25123heptan3ol-5.42-0.38-0.30-0.08541,3dichloropropane-4.09-0.57-0.840.27124heptan4ol-5.42-0.34-0.30-0.04551,2,3trichloropropane-4.69-0.72-1.260.541255methylhexan2ol-5.42-0.32-0.24-0.07561chlorobutane-4.21-1.22-0.81-0.411262methylhexan2ol-5.42-0.26-0.21-0.05572chlorobutane-4.21-1.00-0.74-0.261272,2dimethylpentan3ol-5.42-0.10-0.170.08581,2dichlorobutane-4.81-1.30-1.21-0.101282,4dimethylpentan3ol-5.42-0.17-0.180.01592,3dichlorobutane-4.81-1.48-1.16-0.321292methylhexan2ol-5.42-0.03-0.210.19601chloropentane-4.93-1.70-1.25-0.451303methylhexan3ol-5.42-0.06-0.210.15612chloropentane-4.93-1.60-1.17-0.431312,3dimethylpentan2ol-5.42-0.15-0.170.02623chloropentane-4.93-1.60-1.17-0.431322,3dimethylpentan3ol-5.420.20-0.170.38631chlorohexane-5.66-2.04-1.70-0.341333ethylpentan3ol-5.420.19-0.210.41641chloro2methylpropane-4.21-1.04-0.74-0.301342,3,3trimethylbutan2ol-5.420.34-0.090.43652chloro2methylbutane-4.93-1.48-1.10-0.38135octan1ol-6.14-1.26-0.85-0.41662,3dichloro2methylbutane-5.54-1.54-1.580.041362ethylhexan1ol-6.14-1.00-0.80-0.2067chloroethene-2.81-0.56-0.35-0.211373methylheptan2ol-6.14-0.61-0.750.14681,1dichloroethene-3.42-0.48-0.610.141383methylheptan3ol-6.14-0.49-0.740.2569(Z)1,2dichloroethene-3.42-0.46-0.640.181392,2,3trimethylpentan3ol-6.14-0.16-0.630.48701,1,2trichloroethene-4.02-0.96-0.960.00对溴代烃中的溴来讲,核外电子总数Z为35,价电子数Zi为7,相连的氢原子数hi为0,则,原子点价δvi=7-035-7-1=0.26
1.2.2分子连接性指数的定义零阶指数(0X)是各个顶点之点价平方根的倒数之和,表示为:0X=∑ (δi)-12;同理,零阶价指数(0Xv)表示为:0Xv=∑(δvi)-12 .以苯分子为例,计算其分子连接性指数为:333333
0X=∑(δ)-12=13+13+13+13+13+13
0XV=∑(δv)-12=13+13+13+13+13+
13=3.46再以1溴2氯苯为例,计算其分子连接性指数:333Br41Cl4130X=∑(δ)-12=1×21+1×43+1×24=5.30333Br40.26Cl40.783
0XV=∑(δV)-12=10.26+10.78+1×43+
1×24=6.40
计算出的Ф值,0X,0Xv ,(0Xv)2如表所示[其中0X,0Xv ,(0Xv)2受篇幅的限制略去].2结果与讨论有机化合物的溶解度与分子连接性指数和极化率具有相关性.水溶性是一个很有实用意义的物理常数.这里讨论的溶解性指溶剂是水,溶质是有机液体.溶解过程的影响因素很多,分子间作用力、解离或缔合等都有影响,这里排除溶质在溶剂中的解离或缔合作用以及含有多种杂原子有机物的情况.整个样本集139个化合物按其分子特征可分为五大类:取代苯(1~ 38,共38个),氯代烷烃(39~66,共28个),氯代烯烃(67~75,共9个),溴代烷烃(76~91,共16个),脂肪醇(92~139,共48个).有机化合物水溶解度实验数据来自文献[9],水溶解度实验值为log S(S为溶质溶解在水中的摩尔浓度,单位:mol·L-1),化合物名称及其实验值列于表1. 利用SPSS11.5软件,对139种有机化合物的溶解度(LogS)与其零阶指数(0X)、零阶价指数(0Xv)和极化率(Ф)进行相关性分析,其结果有良好的相关性且t检验(方程相应系数底下列出t值)都通过,得如下回归方程:
LogS=1.112+1.009Ф-0.8700Xv+1.6110X-0.034(0Xv)2(3.808 32.712 -7.27030.820-3.890)(n=139, R=0.991, R2=0.989, S=0.23, F=740)
以上方程对139个化合物的溶解度进行了预测,可看出具有四个变量的方程的预测值是比较好.结果如表1所示.从表中可以看出,对于这139个化合物来说,溶解度跨度为5个log单位.对于96.4%的化合物可以得到很好的解释,共有3.6%的化合物有些偏离.这表明建立的模型有好的可靠性和预测能力与文献中的类似工作相比[8],从相关系数来看R=0.991(n=139),比其R=0.960,n=38要好些.由上述进行如下讨论.a. 计算获得的分子连接性指数是从通过对化合物的拓扑结构的描述来研究物质的定量结构活性相关关系(QSPR).它代表了有机化合物溶解度相关信息的一部分,有良好的预测能力.溶解过程的推动力是熵的增加.如果在溶解过程中没有热效应,溶质和溶剂是混溶的;如果有焓的减小或有热量放出,则会增加溶解的推动力.尽管溶解过程很复杂,但它的主要特征为分子间作用力.由于分子连接性能表示色散或极化作用,因此,它能解决溶解度的问题.极化率与分子的平均偶极距有关.对于非极性分子,若极化率越大,则在外电场诱导出的偶极矩越大.极性分子具有永久偶极矩,它的极化率是原子极化、电子极化与定向极化的总和. 因此,本文引入极化率这个参数对五种类型的有机化合物的水溶解度进行了相关分析,建立了良好的数学模型.b. 从我们对建立回归模型的统计检验可以看出,所建立回归模型比较好.并从残差散点图(图1是以残差为纵坐标,因变量(LogS)为横坐标的对划图)和残差直方图(图2是以频率为纵坐标,残差为横坐标的对划图)可以明确看出样本点随机分布,并得到了满意的正态分布曲线.图1残差散点图
Fig.1Residual scatter diagram图2回归标准化残差直方
Fig.2Regression standardized residual histogramc. 有机化合物在水中的溶解度的数据对于化学工业,特别是石油化学工业的设计、科研、医药以及环保工作者极其重要.因此,进行有机物水溶解度的定量结构——性质关系研究非常重要.已有QSPR模型的研究对象通常是结构相似化合物或者是同种类型的化合物,所建模型往往不适用于结构各异化合物的预测.本文则对五种类型的有机化合物的水溶解度进行了相关分析,建立了良好的QSPR模型,并对结构各异化合物具有良好的预测性,因而对实际生产有良好的指导作用.综上所述,有机化合物的溶解度(logS)与其零阶指数(0X)、零阶价指数(0Xv)和极化率(Ф)之间有良好的相关性,利用本文得到QSPR模型可以预测取代苯,氯代烷烃,氯代烯烃,溴代烷烃,脂肪醇等五类有机化合物的水溶解度.