- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

Python脚本：聚类小分子数据集

DrugAI 发表于 2021/07/15 04:35:53 2021/07/15

【摘要】   聚类分子（Clustering molecules）聚类是一种有价值的化学信息学技术，用于将大型化合物数据集合细分为单个小组相似化合物。其中一个优点是处理非常大的小分子数据集时特别有用。通常用于分析高通量筛选结果、虚拟筛选或对接研究的分析。   基于RDKit的Python脚本用于聚类分子 #!/usr/bin/python3# codin...

聚类分子（Clustering molecules）

聚类是一种有价值的化学信息学技术，用于将大型化合物数据集合细分为单个小组相似化合物。其中一个优点是处理非常大的小分子数据集时特别有用。通常用于分析高通量筛选结果、虚拟筛选或对接研究的分析。

基于RDKit的Python脚本用于聚类分子


  
   
    
     
    
    
     
      #!/usr/bin/python3
     
    
   
    
     
    
    
     
      # coding: utf-8
     
    
   
    
     
    
    
     
      #http://www.rdkit.org/docs/Cookbook.html - - -Clustering molecules
     
    
   
    
     
    
    
     
      #AspirinCode.20180725
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      def ClusterFps(fps,cutoff=0.2):
     
    
   
    
     
    
    
      from rdkit import DataStructs
     
    
   
    
     
    
    
      from rdkit.ML.Cluster import Butina
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
      # first generate the distance matrix:
     
    
   
    
     
    
    
     
       dists = []
     
    
   
    
     
    
    
     
       nfps = len(fps)
     
    
   
    
     
    
    
      for i in range(1,nfps):
     
    
   
    
     
    
    
     
       sims = DataStructs.BulkTanimotoSimilarity(fps[i],fps[:i])
     
    
   
    
     
    
    
     
       dists.extend([1-x for x in sims])
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
      # now cluster the data:
     
    
   
    
     
    
    
     
       cs = Butina.ClusterData(dists,nfps,cutoff,isDistData=True)
     
    
   
    
     
    
    
      return cs
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      from rdkit import Chem
     
    
   
    
     
    
    
     
      from r

文章来源: drugai.blog.csdn.net，作者：DrugAI，版权归原作者所有，如需转载，请联系作者。

原文链接：drugai.blog.csdn.net/article/details/81202123

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

Python脚本：聚类小分子数据集

聚类分子（Clustering molecules）

基于RDKit的Python脚本用于聚类分子

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

Python脚本：聚类小分子数据集

聚类分子（Clustering molecules）

基于RDKit的Python脚本用于聚类分子

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品