- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

基于LSTM的分子生成入门

DrugAI 发表于 2022/08/25 00:39:01 2022/08/25

【摘要】环境 Ubuntu18 RDKit2021.09.2 Python=3.7 数据集分子SMILES 字符串，将其转换为词汇数据，并将其转换为表示恒定字符串长度的张量。 import torch import pandas as pd from collections import Counter class Dat...

环境

Ubuntu18
RDKit2021.09.2
Python=3.7

数据集

分子SMILES 字符串，将其转换为词汇数据，并将其转换为表示恒定字符串长度的张量。

import torch
import pandas as pd
from collections import Counter

class Dataset(torch.utils.data.Dataset):
    def __init__(self, url, smiles_col, sequence_length=4):
        self.url = url
        self.smiles_col = smiles_col
        self.sequence_length = sequence_length
        self.smiles = []
        self.words = self.load_words()
        self.uniq_words = self.get_uniq_words()
        self.index_to_word = {index: word for index, word in enumerate(self.uniq_words)}
        self.word_to_index = {word: index for index, word in enumerate(self.uniq_words)}
        self.words_indexes = [self.word_to_index[w] for w in self

文章来源: drugai.blog.csdn.net，作者：DrugAI，版权归原作者所有，如需转载，请联系作者。

原文链接：drugai.blog.csdn.net/article/details/126485954

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

基于LSTM的分子生成入门

环境

数据集

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

基于LSTM的分子生成入门

环境

数据集

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品