RDKit | 化合物库的相似性分析
【摘要】 展示一种小分子数据库的相似性分析策略。
实例中使用SMILES文件,该分析可以以相同的方式从分子的SDF或其他格式文件中加载数据,只需确保使用适当的方法将分子加载到RDKit中。
导入库
import osimport pandas as pdimport ...
展示一种小分子数据库的相似性分析策略。
实例中使用SMILES文件,该分析可以以相同的方式从分子的SDF或其他格式文件中加载数据,只需确保使用适当的方法将分子加载到RDKit中。
导入库
-
import os
-
import pandas as pd
-
import numpy as np
-
import matplotlib.pyplot as plt
-
from matplotlib import gridspec
-
-
from rdkit import Chem, DataStructs
-
from rdkit.Chem.Fingerprints import FingerprintMols
-
from rdkit.Chem import Draw
-
-
# clustering
-
from scipy.cluster.hierarchy import dendrogram, linkage
载入数据
该库包含超过8 000 000个SMILES。
-
database=[]
-
with open('mol_parent.smi','r') as file:
-
for index,line in enumerate(file):
-
if 0<index<=1: # 查看第一个smiles
文章来源: drugai.blog.csdn.net,作者:DrugAI,版权归原作者所有,如需转载,请联系作者。
原文链接:drugai.blog.csdn.net/article/details/100916060
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)