基于LSTM的分子生成入门
【摘要】
环境
Ubuntu18
RDKit2021.09.2
Python=3.7
数据集
分子SMILES 字符串,将其转换为词汇数据,并将其转换为表示恒定字符串长度的张量。
import torch
import pandas as pd
from collections import Counter
class Dat...
环境
- Ubuntu18
- RDKit2021.09.2
- Python=3.7
数据集
分子SMILES 字符串,将其转换为词汇数据,并将其转换为表示恒定字符串长度的张量。
import torch
import pandas as pd
from collections import Counter
class Dataset(torch.utils.data.Dataset):
def __init__(self, url, smiles_col, sequence_length=4):
self.url = url
self.smiles_col = smiles_col
self.sequence_length = sequence_length
self.smiles = []
self.words = self.load_words()
self.uniq_words = self.get_uniq_words()
self.index_to_word = {index: word for index, word in enumerate(self.uniq_words)}
self.word_to_index = {word: index for index, word in enumerate(self.uniq_words)}
self.words_indexes = [self.word_to_index[w] for w in self
文章来源: drugai.blog.csdn.net,作者:DrugAI,版权归原作者所有,如需转载,请联系作者。
原文链接:drugai.blog.csdn.net/article/details/126485954
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)