文献解读-遗传病-第三期|《Answer ALS,一种用于散发性……结合了来自诱导多能细胞系的临床和多组学数据》
关键词:应用遗传流行病学;群体测序;基因组变异检测;群体基因组;
文献简介
- 标题(英文):Answer ALS, a large-scale resource for sporadic and familial ALS combining clinical and multi-omics data from induced pluripotent cell lines
- 标题(中文):Answer ALS,一种用于散发性和家族性 ALS 的大规模资源,结合了来自诱导多能细胞系的临床和多组学数据
- 发表期刊:Nature Neuroscience
- 作者单位:Answer ALS联合研究组织
- 发表年份:2022
- 文章地址:https://doi.org/10.1038/s41593-021-01006-0
The Answer ALS (AALS) program was conceived as a program to generate iPS cell lines from a large number of patients with ALS and apply well-established molecular, biochemical and imaging techniques to understand the heterogeneity of sALS in these patient-derived spinal neurons, to serve as a ‘biopsy-like’ equivalent. After ensuring that results were reproducible, we assembled comprehensive biological datasets from individual subject iPS cell lines and combined them with the longitudinal clinical data. In contrast to smaller previous iPS cell experiments, studies of iPS cells from a large population, like AALS, provide the first opportunity to explore biologically relevant subgroups of sALS. This resource program was designed with the core goals of providing large clinical and biological datasets in an open source-like application that affords researchers the proper tools to identify biological subgroups and an extensive collection of IPS cell lines with which to test ALS therapies and hypotheses about ALS pathogenesis.
Answer ALS 是患者来源的诱导多能干 (iPS) 细胞系、来自 iPS 神经元的多组学数据以及来自 1,000 多名 ALS 患者的纵向临床和智能手机数据的生物学和临床资源。该资源提供人群水平的生物学和临床数据,可用于识别肌萎缩侧索硬化症(ALS)的临床-分子-生化亚型。采用基于智能手机的独特系统来收集深入的临床数据,包括精细运动活动、言语、呼吸和语言学/认知。
测序流程
该研究收集了~1000例ALS患者的样本,构建了包含散发ALS样本~850例及正常对照iPSC细胞系,合计~1200例。同时收集了大量的多组学数据,包括基因组、表观基因组、转录组、蛋白质组、ALS患者临床信息及智能设备采集数据等,并对这些数据进行了深入的计算分析和整合。
在全基因组数据分析部分,研究者使用Sentieon来为该队列(~1000例WGS)联合基因分析。由于Sentieon最大程度遵循了GATK最佳实践分析流程,因此在整个分析流程中可以保持GATK分析流程完美兼容,同时保证了分析的准确性和高效性。
Sentieon软件团队拥有丰富的软件开发及算法优化工程经验,致力于解决生物数据分析中的速度与准确度瓶颈,为来自于分子诊断、药物研发、临床医疗、人群队列、动植物等多个领域的合作伙伴提供高效精准的软件解决方案,共同推动基因技术的发展。
截至2023年3月份,Sentieon已经在全球范围内为1300+用户提供服务,被世界一级影响因子刊物如NEJM、Cell、Nature等广泛引用,引用次数超过700篇。此外,Sentieon连续数年摘得了Precision FDA、Dream Challenges等多个权威评比的桂冠,在业内获得广泛认可。
文献结论
We used PCAto visualize the ancestry background of the AALS cohort and a set of 2,504 samples from the 1000 Genomes Project with well-defined ancestry. We find that most of the samples clustered with the NYGC’s European samples, although some were closer to the African group and a few clustered with the Asian group (Fig.4e), corroborating the NYGC ancestry results and probably consistent with the local recruiting clinics geographic locations (Extended Data Fig.1).
总结
在散发性ALS发病机制尚未探明并缺乏大规模人群组学数据的背景下,本文通过构建了~1000例ALS患者及正常对照iPSC细胞系及整合了基因组、转录组、表观遗传组、蛋白组、临床信息及智能设备采集数据等多维度数据,形成了目前为止关于ALS最全面的数据资源,并对已有数据进行了初步探索性分析。在全基因组数据整合过程中,Sentieon软件因高效的工程实现和最大程度忠于GATK最佳实践流程确保了数据分析的快速、准确及兼容性。
- 点赞
- 收藏
- 关注作者
评论(0)