RDKit | 基于随机森林(RF)的机器学习模型预测hERG阻断剂活性

举报
DrugAI 发表于 2021/07/15 04:15:15 2021/07/15
【摘要】 从分子相似性评估到使用机器学习技术的定量构效关系分析各种建模方法已应用于不同大小和组成的数据集(阻断剂和非阻滞剂的数量)。本研究中使用从公共生物活性数据开发用于预测hERG阻断剂的稳健分类器。随机森林被用来开发使用不同分子描述符,活性阈值和训练集合成的预测模型。与先前提取数据集的研究报告相比,该模型在外部验证中表现出优异的性能。 #导入依赖库import pandas ...

从分子相似性评估到使用机器学习技术的定量构效关系分析各种建模方法已应用于不同大小和组成的数据集(阻断剂和非阻滞剂的数量)。本研究中使用从公共生物活性数据开发用于预测hERG阻断剂的稳健分类器。随机森林被用来开发使用不同分子描述符,活性阈值和训练集合成的预测模型。与先前提取数据集的研究报告相比,该模型在外部验证中表现出优异的性能。



  
  1. #导入依赖库
  2. import pandas as pd
  3. import numpy as np
  4. import warnings; warnings.simplefilter('ignore')
  5. from rdkit import Chem, DataStructs
  6. from rdkit.Chem.Draw import IPythonConsole
  7. from rdkit.Chem import PandasTools
  8. from rdkit.Chem import AllChem, Draw
  9. from sklearn.ensemble import RandomForestClassifier
  10. #from sklearn.model_selection import StratifiedKFold
  11. from imblearn.under_sampling import RandomUnderSampler
  12. from sklearn.metrics import recall_score, roc_auc_score
  13. from sklearn.model_selection import KFold, StratifiedKFold,StratifiedShuffleSplit
  14. from sklearn.model_selection import train_test_split
  15. from matplotlib import cm
  16. import math
  17. import pickle
  18. import os

文章来源: drugai.blog.csdn.net,作者:DrugAI,版权归原作者所有,如需转载,请联系作者。

原文链接:drugai.blog.csdn.net/article/details/89857801

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。