AI Medicine阅读之modeling polypharmacy side sffects with graph conv

举报
AI Medicine 发表于 2022/03/29 10:01:16 2022/03/29
【摘要】 主要概述构建多向图蛋白蛋白interaction,药物蛋白target interaction药物药物之间的作用——polypharmarcy side effects不同类型的边Decagon可以处理这样的多向图,有多重边类型使用graph convolutional neural network for multirelational linke prediction 1.1 Prese...

主要概述

  1. 构建多向图
    1. 蛋白蛋白interaction
    2. 药物蛋白target interaction
    3. 药物药物之间的作用——polypharmarcy side effects
    1. 不同类型的边
  2. Decagon
    1. 可以处理这样的多向图,有多重边类型
    2. 使用graph convolutional neural network for multirelational linke prediction

1.1 Present study 讲述研究等,present study

  1. 研究思路等,
    1. 构建两层的图网络模型,根据这三种类型的网络,两种节点(drugs and proteins
    2. Multirelational edge prediction model:使用multimodal graph预测药物药物interaction以及他们的类型
    3. 模型是可以用于multirelational settingconvolutional graph neural network
  2. Decagon的不同
    1. 之前的方法是feature提取模型以及link预测模型分开,分别训练
    1. 发明了新的graph auto-encoder 方法,可以开发end to end的训练模型,可以用于预测
    2. 关键的不同是,multirelational link prediction 能力。可以捕捉不同边类型之间的相互依赖??以及可以辨别图中两个顶点的edge type
  3. 使用预测数据的合理性
  4. 方法与其他方法的不同,特点
  5. 对比结果等
  1. Datasets
  1. 数据库连接地址
    1. http://snap.stanford.edu/decagon
  2. Protein–protein and drug–protein interactions
    1. 使用PPI network, combined by 额外的PPI information
    2. 包括经过试验的physical interaction,例如metabolic enzyme coupled interactionsignaling interaction
    3. Unweighted and undirected 网络
    4. 19085 proteins and 719402 interaction
  3. Protein - drug作用
    1. 整个多种化学和蛋白网络
    1. STITCH 数据库
    2. 主要使用试验验证过的small chemical and target proteins
    3. 8083600 interaction between 8934 proteins and 519022 chemicals
  4. Drug–drug interaction and side effect data
    1. 286339 drug-side effect,覆盖超过1556drugs5868side effect
    1. 总体看,包括4651131drug combination side effect
    2. 我们重点福按住964共同发生的polypharmacy side offects,每一个副作用发生在至少500drug combinations
    1. SIDERside effect resource)数据库
    2. offsides database 整合
    3. 删除同义词,使用同样的词语表示
    4. 融合后,每个药物大约有159side effects
    5. TWOSIDES,包含1318副作用,超过63473个药物组合
  5. 最终的网络数据
    1. 645 durg 19085protein nodes
    2. 715612蛋白蛋白作用,4651131 drug-drug18596 drug-protein edges
  1. Data driven motivation for decagon
  1. 主要有三个观察,关于这个两层的多向图网络结构
  2. 第一,在大范围层次,这个side effect的发生频率
    1. 53%的联合用药副作用仅发生在小于3%的药物组合中
    2. 由于副作用相关的药物组合数量变化差异很大,因此能够独立预测不同side effect的数量有限
    3. 所以需要这个模型能够同时从所有side effect中学习信息
  3. 第二,side effect并非独立出现,表明联合多种类型side effect能够帮助预测
    1. 为了更好地理解其他side effect的分子机制,预测模型最好可以使用这个side effect的分子信息
  4. 第三,研究了蛋白(被一个药物靶向)与副作用的关系
    1. 计算jaccard 相似性,给定药物pair的靶向蛋白间
    1. Ti——durg i靶向的一系列蛋白
    2. 超过68%drug combination没有共同的靶向蛋白——使用PPI链接信息很重要
    3. 随机的药物组合的共同靶向蛋白额数量更少
    4. 考虑蛋白信息很重要
  1. Graph convolutional decagon approach
  1. 把组合用药的side effect看做multirelational link prediction problem on a multimodal graph模型
  2. 网络模型构建,考虑其中964中不同的side effects
  3. 在图G中,主要去预测drug nodes间的egde关系
  4. 方法
    1. An encoder:a graph convolutional network operating on G and producing embeddings for nodes in G
    2. An decoder:a tensor factorization model using these embeddings to model polypharmacy side effects
    1. Non-linear, multi-layer convolutional graph neural network——Decagon

4.1 Graph convolutional encoder

  1. Input: graph G and node feature vectors xi
  2. Output: 对每一个节点,产生一个d维的embedding zi
  3. Encoder模型
    1. 有效利用图的信息,对不同的relation type分别处理
    1. rrelation typew是对应rparameter matrix
    2. φ表示激活函数
    3. cnormalization常数,对称的
    4. 对每一个节点,通过如上公式进行操作,对每个节点得到一个encoderd维度的
    5. 每个节点的计算:根据不同的edge类型,分别计算并加和不同类型的节点(邻居)

4.2 Tensor factorization decoder

  1. Deconder的目标:通过学习到的node embedding 以及 根据edge type不同处理,构建G中边的类型
  2. 通过函数g,对一个(vi,r,vj)打分,分数意味着vivj通过side effect type r作用的可能性有多大
  3. 根据Encoder zizjdecoder通过一个factorized运算预测candidate edge(vi,r,vj)
  4. 对于durgproteins

 

 

  1. 两种case-1
    1. Dr modeling the importance of each dimension in zi towards side effect r
    1. Rglobal drug-drug interaction
    2. D: side effect specific diagonal factors,用于描述side effect间的variationimportance
    3. R:可以训练的参数矩阵,d*d,可以model side effectdrug-drug的相互作用
  2. 两种case-2
    1. 不全是drug
    2. Bilinear 形式decode
    3. M: a trainable parameter matrixd*d,表示zizj间的interaction
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。