首页> 资源> 论文>正文

人工神经网络法预测多氯代二苯并对二噁英logKow值的研究

论文类型 技术与工程 发表日期 2001-11-01
来源 第二届环境模拟与污染控制学术研讨会
作者 黄俊,余刚,张彭义
摘要 黄俊 余刚 张彭义 (清华大学环境科学与工程系 环境模拟与污染控制国家重点实验室,北京 100084) 1 前言   氯代二苯并对二噁英(polychlorinated dibenzo-p-dioxins,简称PCDDs)是国际上首批列入控制的12种持久性有机污染物之一,同时也是很强的内分泌干扰物。因氯原子的取代数目及位 ...

黄俊 余刚 张彭义
(清华大学环境科学与工程系 环境模拟与污染控制国家重点实验室,北京 100084)

1 前言

  氯代二苯并对二噁英(polychlorinated dibenzo-p-dioxins,简称PCDDs)是国际上首批列入控制的12种持久性有机污染物之一,同时也是很强的内分泌干扰物。因氯原子的取代数目及位置的不同,PCDDs共有75种分子结构[1],其中2,3,7,8-TCDD被认为是已知化合物中毒性最强的物质,同时还是很强的多位点致癌物,动物实验证明,它易诱发肝、肺、粘膜和皮肤癌的发生,1997年国际癌症研究机构(IARC)将其确认为一级致癌物。
  logKow值即正辛醇是进行污染物环境风险评价时考察其环境行为的一个重要参数,由于单一PCDDs纯物质通常难以制备或购得,而且有些共存的PCDDs即使是用GC/MS方法中仍不容易分开,因此目前还有相当数量的PCDDs化合物难以获得logKow实验数据。在这种情况下,借助定量构效关系(QSAR)方法来预测logKow很有必要。从已发表的PCDDs的logKow定量模型看,主要有采用基团/原子贡献法的经验方法和热力学方法两类[2]。本文以单苯环氯取代指数作为分子结构描述符,采用人工神经网络思想建立数学模型,并用于尚未有实验值的PCDD分子的logKow的预测。

2 研究方法

  2.1 建模样本:本研究中利用了Rulle等[3]所收集整理的42种PCDDs及母体化合物二苯并对二噁英(Dibenzo-p-dioxin)共43种化合物构成建模样本,这是目前文献报道中最为完整的PCDDs的logKow实验数据集。
  2.2 分子结构描述:采用Liang等[4]在Hale等最先提出的单苯环取代描述规则基础上改进后的分子结构描述符,具体的取值规则参见文献[4]。对于一个PCDD分子,有G1~G10共10个算符来描述其结构。
  2.3 建模方法:采用目前应用最广泛、理论最完善的误差反向传播人工神经网络(BP-ANN),其建模算法及相应的程序参见文献[5-6]。首先计算43种分子的G1~G10描述符,并与其相应的logKow值组织成训练样本;然后采用带一个偏置节点的10-6-1体系进行样本学习,10个分子描述符加载到10个输入节点上,而logKow实验值则加载到输出节点上。向量均采用线性归一化方法,其中输入向量归一化至-2~2区间,输出向量归一化至0~1区间。学习步长η取为0.2,动量因子α取0.5。采用随机数矩阵进行权值矩阵的初始化,设置随机数发生器的区间为-3~-3,网络精度(目标误差)取为0.05。训练完毕后就得到了PCDDs分子结构与logKow值之间的定量模型,精度检验后对样本集外的33种PCDD的logKow值进行预测。

3 结果与讨论

  3.1 训练结果
  经过57585次迭代(在128M内存、Celeron 466微机上约耗时22秒),网络训练完毕,输出各项参数。模型值与实验值的相对误差绝对值的平均值为0.4%,最大值为3.1%,精度符合建模目标要求。相对误差的频数分布图如图1所示,以模型值对实验值所作的相关关系图如图2所示。从图1和图2可以看出,误差大多数集中在±0.5%之间(共36个样本,占样本总数的84%),明显地优于文献[3]中MOD模型的建模精度。模型值与实验值之间的相关性相当好,说明所建立的BP-ANN模型较好地反演了蕴含在PCDD分子结构与logKow之间的数学关系,可以用于预测。

  3.2 BP-ANN的预测结果
  利用上述模型,对尚未有实验值报道的其它33种PCDD分子的logKow值进行预测,结果列于表1中。

表1 样本集以外的33种PCDDs的logKow值预测 取代形式 预测值 取代形式 预测值 1,2 - 5.63 1,3,9 - 6.21 1,3 - 4.65 1,4,6 - 6.21 1,4 - 4.70 1,4,7 - 4.36 1,6 - 5.78 1,2,6,7 - 6.24 1,7 - 4.39 1,2,6,9 - 6.86 1,8 - 4.39 1,2,8,9 - 6.809 1,9 - 6.21 1,2,4,7,9 - 8.07 1,2,3 - 7.44 1,2,4,6,8 - 6.86 1,2,6 - 5.24 1,2,4,6,7 - 5.70 1,2,7 - 5.72 1,2,4,8,9 - 5.70 1,2,8 - 5.72 1,2,3,8,9 - 6.46 1,2,9 - 5.81 1,2,3,6,7,8 -
8.17 2,3,7 - 6.55 1,2,3,4,6,9 -
6.26 1,7,8 - 4.45 1,2,3,7,8,9 - 8.18 1,3,6 - 5.99 1,2,3,4,6,7 - 5.54 1,3,7 - 4.36 1,2,3,4,6,7,9 - 8.12 1,3,8 - 4.36

参 考 文 献

  1 郑明辉, 刘鹏岩, 包志成等. 科学通报, 1999, 44(5): 455-463
  2 黄俊, 余刚, 张彭义等. 计算机与应用化学, 2001, 18(4): 289-292
  3 Rulle P. Chemosphere, 2000, 40(5): 457-512
  4 Liang X., Wang, W. Wu W., et., al. Chemosphere, 2000, 41(6): 923-929
  5 黄俊, 周申范, 国振双等. 色谱, 2000,18(1): 1-4
  6 黄俊, 周申范, 唐婉莹. 环境科学研究, 2000, 13(2): 3-5

论文搜索

发表时间

论文投稿

很多时候您的文章总是无缘变成铅字。研究做到关键时,试验有了起色时,是不是想和同行探讨一下,工作中有了心得,您是不是很想与人分享,那么不要只是默默工作了,写下来吧!投稿时,请以附件形式发至 [email protected] ,请注明论文投稿。一旦采用,我们会为您增加100枚金币。