文献解读-遗传病-第三期|《Answer ALS,一种用于散发性……结合了来自诱导多能细胞系的临床和多组学数据》

举报
湾联科技 发表于 2024/06/03 10:31:53 2024/06/03
【摘要】 Answer ALS 是患者来源的诱导多能干 (iPS) 细胞系、来自 iPS 神经元的多组学数据以及来自 1,000 多名 ALS 患者的纵向临床和智能手机数据的生物学和临床资源。该资源提供人群水平的生物学和临床数据,可用于识别肌萎缩侧索硬化症(ALS)的临床-分子-生化亚型。采用基于智能手机的独特系统来收集深入的临床数据,包括精细运动活动、言语、呼吸和语言学/认知。

文献解读-Genetic Disease.png

关键词:应用遗传流行病学;群体测序;基因组变异检测;群体基因组;


文献简介

  • 标题(英文):Answer ALS, a large-scale resource for sporadic and familial ALS combining clinical and multi-omics data from induced pluripotent cell lines
  • 标题(中文):Answer ALS,一种用于散发性和家族性 ALS 的大规模资源,结合了来自诱导多能细胞系的临床和多组学数据
  • 发表期刊:Nature Neuroscience
  • 作者单位:Answer ALS联合研究组织
  • 发表年份:2022
  • 文章地址https://doi.org/10.1038/s41593-021-01006-0

文献解读1.png


图1 文献简介

The Answer ALS (AALS) program was conceived as a program to generate iPS cell lines from a large number of patients with ALS and apply well-established molecular, biochemical and imaging techniques to understand the heterogeneity of sALS in these patient-derived spinal neurons, to serve as a ‘biopsy-like’ equivalent. After ensuring that results were reproducible, we assembled comprehensive biological datasets from individual subject iPS cell lines and combined them with the longitudinal clinical data. In contrast to smaller previous iPS cell experiments, studies of iPS cells from a large population, like AALS, provide the first opportunity to explore biologically relevant subgroups of sALS. This resource program was designed with the core goals of providing large clinical and biological datasets in an open source-like application that affords researchers the proper tools to identify biological subgroups and an extensive collection of IPS cell lines with which to test ALS therapies and hypotheses about ALS pathogenesis.

Answer ALS 是患者来源的诱导多能干 (iPS) 细胞系、来自 iPS 神经元的多组学数据以及来自 1,000 多名 ALS 患者的纵向临床和智能手机数据的生物学和临床资源。该资源提供人群水平的生物学和临床数据,可用于识别肌萎缩侧索硬化症(ALS)的临床-分子-生化亚型。采用基于智能手机的独特系统来收集深入的临床数据,包括精细运动活动、言语、呼吸和语言学/认知。


测序流程


文献解读2.png


图2 临床入组和特征:所有 AALS 临床入组受试者在 40 个月内的 ALSFRS-R 进展曲线

该研究收集了~1000例ALS患者的样本,构建了包含散发ALS样本~850例及正常对照iPSC细胞系,合计~1200例。同时收集了大量的多组学数据,包括基因组、表观基因组、转录组、蛋白质组、ALS患者临床信息及智能设备采集数据等,并对这些数据进行了深入的计算分析和整合。


文献解读3.png


图3 Sentieon的作用

在全基因组数据分析部分,研究者使用Sentieon来为该队列(~1000例WGS)联合基因分析。由于Sentieon最大程度遵循了GATK最佳实践分析流程,因此在整个分析流程中可以保持GATK分析流程完美兼容,同时保证了分析的准确性和高效性。

Sentieon软件团队拥有丰富的软件开发及算法优化工程经验,致力于解决生物数据分析中的速度与准确度瓶颈,为来自于分子诊断、药物研发、临床医疗、人群队列、动植物等多个领域的合作伙伴提供高效精准的软件解决方案,共同推动基因技术的发展。

截至2023年3月份,Sentieon已经在全球范围内为1300+用户提供服务,被世界一级影响因子刊物如NEJM、Cell、Nature等广泛引用,引用次数超过700篇。此外,Sentieon连续数年摘得了Precision FDA、Dream Challenges等多个权威评比的桂冠,在业内获得广泛认可。


文献结论


文献解读4.png


图4 AALS队列变异汇总表

We used PCAto visualize the ancestry background of the AALS cohort and a set of 2,504 samples from the 1000 Genomes Project with well-defined ancestry. We find that most of the samples clustered with the NYGC’s European samples, although some were closer to the African group and a few clustered with the Asian group (Fig.4e), corroborating the NYGC ancestry results and probably consistent with the local recruiting clinics geographic locations (Extended Data Fig.1).


总结

在散发性ALS发病机制尚未探明并缺乏大规模人群组学数据的背景下,本文通过构建了~1000例ALS患者及正常对照iPSC细胞系及整合了基因组、转录组、表观遗传组、蛋白组、临床信息及智能设备采集数据等多维度数据,形成了目前为止关于ALS最全面的数据资源,并对已有数据进行了初步探索性分析。在全基因组数据整合过程中,Sentieon软件因高效的工程实现和最大程度忠于GATK最佳实践流程确保了数据分析的快速、准确及兼容性。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。