RDKit | 基于随机森林(RF)的机器学习模型预测hERG阻断剂活性

举报
DrugAI 发表于 2021/07/15 04:15:15 2021/07/15
1.8k+ 0 0
【摘要】 从分子相似性评估到使用机器学习技术的定量构效关系分析各种建模方法已应用于不同大小和组成的数据集(阻断剂和非阻滞剂的数量)。本研究中使用从公共生物活性数据开发用于预测hERG阻断剂的稳健分类器。随机森林被用来开发使用不同分子描述符,活性阈值和训练集合成的预测模型。与先前提取数据集的研究报告相比,该模型在外部验证中表现出优异的性能。 #导入依赖库import pandas ...

从分子相似性评估到使用机器学习技术的定量构效关系分析各种建模方法已应用于不同大小和组成的数据集(阻断剂和非阻滞剂的数量)。本研究中使用从公共生物活性数据开发用于预测hERG阻断剂的稳健分类器。随机森林被用来开发使用不同分子描述符,活性阈值和训练集合成的预测模型。与先前提取数据集的研究报告相比,该模型在外部验证中表现出优异的性能。



      #导入依赖库
      import pandas as pd
      import numpy as np
      import warnings; warnings.simplefilter('ignore')
      from rdkit import Chem, DataStructs
      from rdkit.Chem.Draw import IPythonConsole
      from rdkit.Chem import PandasTools
      from rdkit.Chem import AllChem, Draw
      from sklearn.ensemble import RandomForestClassifier
      #from sklearn.model_selection import StratifiedKFold
      from imblearn.under_sampling import RandomUnderSampler
      from sklearn.metrics import recall_score, roc_auc_score
      from sklearn.model_selection import KFold, StratifiedKFold,StratifiedShuffleSplit
      from sklearn.model_selection import train_test_split
      from matplotlib import cm
      import math
      import pickle
      import os
  
 

文章来源: drugai.blog.csdn.net,作者:DrugAI,版权归原作者所有,如需转载,请联系作者。

原文链接:drugai.blog.csdn.net/article/details/89857801

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

作者其他文章

评论(0

抱歉,系统识别当前为高风险访问,暂不支持该操作

    全部回复

    上滑加载中

    设置昵称

    在此一键设置昵称,即可参与社区互动!

    *长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

    *长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。