RDKit | 从ChEMBL数据库提取大分子HELM单体(XML转换为DataFrame并搜索部分结构)

举报
DrugAI 发表于 2021/07/15 02:09:51 2021/07/15
【摘要】 研究大分子的HELM表示。HELM具有分层结构,并结合了单体来代表聚合物(例如肽)。 HELM的特征是其表达的可扩展性,还可以通过将原始单体添加到单体库中来表达不自然的结构。 另一方面,由于HELM表达式使用缩写(ID),所以如果不共享单体库,则存在指定具有相同ID的不同单体的风险,因此了解单体库很重要。 找出什么样的单体信息存储在ChEMBL中,这是HELM也处理的熟...

研究大分子的HELM表示。HELM具有分层结构,并结合了单体来代表聚合物(例如肽)。

HELM的特征是其表达的可扩展性,还可以通过将原始单体添加到单体库中来表达不自然的结构。

另一方面,由于HELM表达式使用缩写(ID),所以如果不共享单体库,则存在指定具有相同ID的不同单体的风险,因此了解单体库很重要。

找出什么样的单体信息存储在ChEMBL中,这是HELM也处理的熟悉的数据库。

具体旨在读取XML文件中提供的单体库,并将其转换为Pandas DataFrame。

导入库


  
  1. import xml.etree.ElementTree as ET
  2. tree = ET.parse('chembl_27_monomer_library.xml')
  3. root = tree.getroo

文章来源: drugai.blog.csdn.net,作者:DrugAI,版权归原作者所有,如需转载,请联系作者。

原文链接:drugai.blog.csdn.net/article/details/110688039

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。