RDKit:化学指纹(Chemical Fingerprinting)

举报
DrugAI 发表于 2021/07/15 05:50:00 2021/07/15
【摘要】 化学指纹识别是一种将绘制的分子转换为0和1位的流的方法。旧指纹类型是MACCS密钥,由前MDL开发,作为在分子数据库中进行子结构筛选的快速方法。公共版本包含166个键,即166 0和1,其中每个键对应于特定的分子特征,例如存在羰基(键154:('[#6] = [#8]',0),RDkit中的#C  = O.实现).RDkit中可用的另一种指纹是摩根型指纹,它是一种圆...

化学指纹识别是一种将绘制的分子转换为0和1位的流的方法。旧指纹类型是MACCS密钥,由前MDL开发,作为在分子数据库中进行子结构筛选的快速方法。公共版本包含166个键,即166 0和1,其中每个键对应于特定的分子特征,例如存在羰基(键154:('[#6] = [#8]',0),RDkit中的#C  = O.实现).RDkit中可用的另一种指纹是摩根型指纹,它是一种圆形指纹。每个原子的环境和连通性被分析到给定的半径,并且每种可能性都被编码。通常使用散列算法将很多可能性压缩到预定长度,例如1024。因此,圆形指纹是原子类型和分子连通性的系统探索,而MACCS键依赖于要匹配的预定义分子特征。


  
  1. #!/usr/bin/python3
  2. # In[1]:
  3. from rdkit import Chem
  4. from rdkit.Chem import AllChem
  5. from rdkit.Chem import MACCSkeys
  6. from rdkit.Chem import DataStructs
  7. # In[2]:
  8. mol = Chem.MolFromSmiles('CCCN')
  9. mol2 = Chem.MolFromSmiles('CCCO')
  10. # In[3]:
  11. fp1 = MACCSkeys.GenMACCSKeys(mol)
  12. # In[4]:
  13. print (fp1.ToBitString())
  14. # out[4]:
  15. 00000000000000000000000000000000000000000000000000000000000000000000000000000000001010000000000000001000100000010011

文章来源: drugai.blog.csdn.net,作者:DrugAI,版权归原作者所有,如需转载,请联系作者。

原文链接:drugai.blog.csdn.net/article/details/81784517

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。