scGEMA:基于单细胞多组学增强子的基因调控网络推断

举报
DrugAI 发表于 2022/09/24 23:38:23 2022/09/24
【摘要】 本文介绍由德国RWTH亚琛大学医学院的Ivan G Costa通讯发表在 bioRxiv 的研究成果:为了利用单细胞多组学数据定量表征基因调控,作者提出了scGEMA模型,一种基于单细胞多组学增强子的基因调控网络推断方法,通过结合单细胞基因表达和染色质可及性谱来推断基因调控网络。该模型能够研究动态生物过程的复杂基因调控机制,如细胞...

本文介绍由德国RWTH亚琛大学医学院的Ivan G Costa通讯发表在 bioRxiv 的研究成果:为了利用单细胞多组学数据定量表征基因调控,作者提出了scGEMA模型,一种基于单细胞多组学增强子的基因调控网络推断方法,通过结合单细胞基因表达和染色质可及性谱来推断基因调控网络。该模型能够研究动态生物过程的复杂基因调控机制,如细胞分化和疾病驱动的细胞重塑。作者还提供了一个控制人类心肌梗死中肌成纤维细胞激活的基因调控网络的案例研究。

3e4a6f71d0073e58380916be9f7283b8.png

1.简介

单细胞RNA测序(scRNA-seq)和ATAC-seq(scATAC-seq),通过捕获正交分子信息,即scRNA-seq的基因表达和scATAC-seq的调控元件和转录因子(TF)的活性,为在单细胞水平上理解基因调控提供了前所未有的机会。

目前,有两种计算工具,Pando和CellOracle,可用于基于单细胞多组学数据的GRN推断。然而,Pando侧重于识别仅限于TF-TF相互作用的调节网络,不提供模态整合或轨迹分析的方法。CellOracle需要首先基于参考scATAC-seq数据组装基本GRN结构,并且需要对scRNA-seq和scATAC序列分析进行几个预处理步骤,这也在一定程度上限制了CellOracle的使用。

因此,作者开发了scMEGA作为一个通用框架,通过将单细胞多组学特征作为输入来定量推断GRN。scMEGA支持对用于GRN推断的多组学数据进行端到端分析,包括模式整合、轨迹分析、增强子-启动子关联以及网络分析和可视化(图1)。scMEGA提供了新的功能,并结合了Seurat、ArchR、chromVAR和igraph等一些现有方法。ScMEGA可以通过R包实现,可以处理Seurat对象,可以与Seurat兼容。

7bc0acb20813aae1d5b5497694be14ce.png 图1 scMEGA概况

2.结果

scMEGA识别肌成纤维细胞分化的重要调节因子

作者整合了snRNA测序和snATAC测序数据,并鉴定了四个成纤维细胞亚群(补充图1a)。标记基因的检测表明,簇2高度表达SCARA5,根据最近的研究,其作为人类肾脏中肌成纤维细胞祖细胞的标记。簇1由POSTN、COL1A1和COL3A1标记,表明这些细胞是分化的肌成纤维细胞。基于这些,作者构建了从簇2到簇1的伪时间轨迹,以研究肌成纤维细胞分化过程。

接下来,作者选择了79个候选TF和2207个基因,用作推断GRN的输入。候选TFs的结合活性和候选基因的表达之间的相关性揭示了两个主要调节模块,每个模块对应于不同的成纤维细胞亚群。推断网络的可视化精确定位了肌成纤维细胞分化的调节因子(图2a)。例如,作者确定NR3C2是SCARA5+成纤维细胞(模块1-成纤维细胞祖细胞)的调节因子。NR3C2在临床上是阻止心力衰竭纤维化进展的重要靶点,作者观察到NR3C2的结合活性、TF表达和靶基因表达沿轨迹下降(图2b)。关于肌成纤维细胞,作者检测到一些纤维化相关TF,如TEAD和RUNX家族基因(图2b)。

作为EGRN下游特征的一个例子,作者提取了NR3C2和RUNX1的靶基因(调控体),并检查了TFs及其调控体在空间中的表达(图2c)。由于空间转录组学中这些TF的稀疏性和低表达值,作者无法检测到空间中TF的清晰表达模式(图2d)。通过探索NR3C2和RUNX1的调控体(靶基因),作者观察到在纤维化反应的定义心脏区域的梯度和互斥空间表达,突出了scMEGA在稀疏空间转录组学数据中描绘TF调控体表达的能力。

2a8f86b7d3544b8556b1d5123174e3a7.png 图2 肌成纤维细胞分化的案例研究

3.总结与讨论

在这项工作中,作者提出了scMEGA,这是一个综合性的、方便使用的分析框架,通过使用单细胞多组学数据作为输入来推断基于增强子的GRN。scMEGA基于几个流行的R包(如Seurat、Signac和ArchR)构建,用于单细胞数据分析。它使用户能够进行端到端的GRN推断,并对重要的TF和基因进行优先排序,以进行实验验证,并且可以用于空间转录组学的分析。作者举例说明了scMEGA在心肌梗死后人心脏成纤维细胞中的应用。scMEGA是一个重要且独特的框架,用于从单细胞多组学数据中了解各种生物过程的复杂基因调控机制。

参考资料

Zhijian Li, James S Nagai, Christoph Kuppe, Rafael Kramann, Ivan G Costa bioRxiv 2022.08.10.503335; doi: 

https://doi.org/10.1101/2022.08.10.503335

数据

https://zenodo.org/record/6623588

代码

https://github.com/CostaLab/scMEGA

文章来源: drugai.blog.csdn.net,作者:DrugAI,版权归原作者所有,如需转载,请联系作者。

原文链接:drugai.blog.csdn.net/article/details/126736945

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。