RDKit | 基于随机森林的化合物活性二分类模型
【摘要】
基于随机森林算法的化合物二分类机器学习模型
代码示例
#导入依赖包import pandas as pdimport numpy as npfrom rdkit import Chem, DataStructsfrom rdkit.Chem import AllChemfrom rdkit.ML.Descriptors import MoleculeDes...
基于随机森林算法的化合物二分类机器学习模型
代码示例
-
#导入依赖包
-
import pandas as pd
-
import numpy as np
-
from rdkit import Chem, DataStructs
-
from rdkit.Chem import AllChem
-
from rdkit.ML.Descriptors import MoleculeDescriptors
-
from rdkit.Chem import Descriptors
-
from rdkit.Chem.EState import Fingerprinter
-
from rdkit.Chem import PandasTools
-
from sklearn.ensemble import RandomForestClassifier
-
from sklearn.utils import shuffle
-
from sklearn import metrics
-
from sklearn import model_selection
-
from sklearn.metrics import roc_curve, auc
-
import matplotlib.pyplot as plt
-
#定义化合物指纹计算函数
-
def get_fps(mol):
-
# 计算指纹 (clogP, PSA, etc etc)
-
calc=MoleculeDescriptors.MolecularDescriptorCalculator([x[0] for x in Descriptors._descList])
-
ds = np.asarray(calc.CalcDescriptors(mol))
-
arr=Fingerprinter.FingerprintMol(mol)[0]
-
return np.append(arr,ds)
文章来源: drugai.blog.csdn.net,作者:DrugAI,版权归原作者所有,如需转载,请联系作者。
原文链接:drugai.blog.csdn.net/article/details/105683688
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)