RDKit | 基于PCA探索化学空间
【摘要】 基于主成分分析和聚类探索化学空间
PCA :Principal Component Analysis
分析化合物数据库,发现它们之间的共享描述符(物理化学特性)。
1. 导入库
import osimpor...
基于主成分分析和聚类探索化学空间
PCA :Principal Component Analysis
分析化合物数据库,发现它们之间的共享描述符(物理化学特性)。
1. 导入库
-
import os
-
import pandas as pd
-
import numpy as np
-
import matplotlib.pyplot as plt
-
from matplotlib import gridspec
-
-
from rdkit import Chem, DataStructs
-
from rdkit.Chem import Descriptors,Crippen
-
-
from sklearn.decomposition import PCA
-
from sklearn.preprocessing import StandardScaler
-
-
import matplotlib.cm as cm
-
from sklearn.metrics import silhouette_samples, silhouette_score
-
from sklearn.cluster import KMeans
2. 载入分子数据
该库包含超过10 000 000个SMILES。 可以将.smiles文件作为文本文件读取,将10000个分子保存在pandas中。
文章来源: drugai.blog.csdn.net,作者:DrugAI,版权归原作者所有,如需转载,请联系作者。
原文链接:drugai.blog.csdn.net/article/details/100727712
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)