文献解读-基准与方法研究-第十五期|《不同 DNA 测序平台的标准化比较》
关键词:基准与方法研究;基因测序;结构变异检测;
文献简介
- 标题(英文):Standardized Comparison of Different DNA Sequencing Platforms
- 标题(中文):不同 DNA 测序平台的标准化比较
- 发表期刊:Clinical Chemistry
- 作者单位:美国德克萨斯大学西南医学中心病例系
- 发表年份:2022
- 文章地址:https://doi.org/10.1093/clinchem/hvac023
二代测序(NGS)已广泛应用于许多实验室的临床试验,并提供广泛的应用,从靶向肿瘤学组合到用于细菌分类的宏基因组测序,再到基于群体的全基因组测序。第三代测序技术可以对长度为数千个碱基对的长读长(LR)进行测序,也可以检测更大的结构变化(例如,易位,倒置,重复)。LR测序的一个优点是能够解析基因组中难以测序的区域,其中存在大量重复序列,这些区域可能难以与参考基因组进行正确比对。直到最近才在临床实验室测试的背景下对SR和LR技术进行大规模全面比较。
测序流程
生物分子资源设施协会最近发布了他们对DNA测序技术的基准评估。该研究在使用SR或LR的各种测序平台上对人和细菌DNA样品进行了测序,并将其性能与成熟的基因组重复区域进行了比较。目标是定义可重复的DNA测序基准测试工具,该工具可以深入了解每种仪器在许多基因组环境中的相对优势和劣势,从而更好地评估平台使用情况。
该研究对目前市面上流程的测序公司的几个主要平台进行了详细比较。包括Illumina 公司的 HiSeq(4000、2500、X10)、华大基因及子公司的 BGISEQ-500 和 MGISEQ-2000 、 GenapSys公司的 GS111、赛默飞世尔Ion Proton、Ion S5等以PacBio 的 PacBio CCS 和 ONT 的 PromethION(R9.4)等测序平台。生物信息学分析流程也会影响准确性,因此该研究还评估了算法在 SNP、InDel检测(DeepVarinat、GATK HaplotypeCaller、Sentieon Haplotyper、Strelka2、Clair2)和结构变异检测(Manta、Lumpy 和 Delly)上的准确度。
Sentieon软件团队拥有丰富的软件开发及算法优化工程经验,致力于解决生物数据分析中的速度与准确度瓶颈,为来自于分子诊断、药物研发、临床医疗、人群队列、动植物等多个领域的合作伙伴提供高效精准的软件解决方案,共同推动基因技术的发展。 截至2023年3月份,Sentieon已经在全球范围内为1300+用户提供服务,被世界一级影响因子刊物如NEJM、Cell、Nature等广泛引用,引用次数超过700篇。此外,Sentieon连续数年摘得了Precision FDA、Dream Challenges等多个权威评比的桂冠,在业内获得广泛认可。
文献讨论
关于细菌和宏基因组样品,不同细菌物种的GC含量变异性对读长图谱的影响最大,尽管SR和LR仪器仍然能够正确识别每个预期的分类单元。他们的研究结果还强调了改进细菌参考基因组的必要性,这些参考基因组低估了GC含量低或高的细菌分类群。
总结
该研究通过对不同测序平台测序数据及不同生信分析流程的比较,总结了不同平台的数据特点并分析了相应的原因。三代测序平台在重复区域和结构变异检测方面表现出色,但一些短读长测序平台如(HiSeq X10、4000)在重复区域的覆盖范围上具有较好的表现并在 SNP、InDel 检测的准确性上具有优势。在SNP、InDel 检测算法上,Sentieon 具有优秀表现。
- 点赞
- 收藏
- 关注作者
评论(0)