- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

Nat. Mach. Intel. | IBM RXN: 深度学习在化学反应分类上大放异彩

DrugAI 发表于 2021/07/15 00:51:20 2021/07/15

【摘要】   最近IBM和伯尔尼大学的研究人员利用基于自注意力机制的深度神经网络实现了对化学反应的分类，该项成果发布于Nature Machine Intelligence杂志上。化学反应的分类对化学家们有很高的价值，比如利用同类反应的相似成份推测最佳反应条件等。近年来，一些机器学习方法被用于化学反应的分类，但是都存在一定的局限。IBM和伯尔尼大学的研究...

最近IBM和伯尔尼大学的研究人员利用基于自注意力机制的深度神经网络实现了对化学反应的分类，该项成果发布于Nature Machine Intelligence杂志上。

化学反应的分类对化学家们有很高的价值，比如利用同类反应的相似成份推测最佳反应条件等。近年来，一些机器学习方法被用于化学反应的分类，但是都存在一定的局限。IBM和伯尔尼大学的研究人员提出使用BERT(Bidirectional Encoder Representations from Transformers)模型，该模型不同于由专家们根据经验编写大量规则的传统分类方法，而是通过化学反应方程式文本便能实现化学反应分类的预测。研究者在13.2万个化学反应上进行了测试，最高可达98.2%的分类精度，而传统方法仅为41％。此外，该模型使用注意力机制，相较于传统方式能更好的捕捉到对反应分类起关键作用的成份，该项工作有望开辟有机合成领域新的未来。

BERT模型基于“自注意力”机制，可以利用大规模的文本数据学习语言特征，研究者们首先将化学反应式转换为SMILES格式，相当于对化学反应式进行了语言描述，图1为两个化学反应式及其对应的SMILES 表示：

图1 化学反应式案例及其对应的SMILES representation

然后利用BERT模型进行语言学习，即经过若干个Tranformer神经网络结构，得到名为RXNFP的向量，然后基于此向量进行化学反应分类，具体过程如图2。

图2 BERT模型用于化学反应分类

BERT模型的注意力机制可以发现进行分类的关键作用成份，如图3，格图的纵轴对应BERT模型的不同层，横轴对应每一个反应成份，颜色越深表示不同层对某个成份的关注度越高。

图3 注意力权重解读

基于BERT模型，化学反应可以表示成一个固定维度的向量，研究者将不同化学反应描绘在一张图上，如图4，从图中可以观察到不同化学反应之间的关系。

图4 化学反应的向量可视化，不同颜色代表不同的化学反应，左下图为预训练网络结果，中间图为训练后的网络所得结果

RXN Chemistry demo

参考资料

Schwaller, P., Probst, D., Vaucher, A.C. et al. Mapping the space of chemical reactions using attention-based neural networks. Nat Mach Intell (2021). https://doi.org/10.1038/s42256-020-00284-w

https://www.ibm.com/blogs/research/2021/01/roborxn-designs-molecules/

文章来源: drugai.blog.csdn.net，作者：DrugAI，版权归原作者所有，如需转载，请联系作者。

原文链接：drugai.blog.csdn.net/article/details/113533452

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

Nat. Mach. Intel. | IBM RXN: 深度学习在化学反应分类上大放异彩

RXN Chemistry demo

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

Nat. Mach. Intel. | IBM RXN: 深度学习在化学反应分类上大放异彩

RXN Chemistry demo

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品