云时代需要怎样的生信人才,华为云基因容器联合生信技能树,告诉你答案
作为华为云基因容器服务(GCS)主要负责人,在了解到生信技能树将举办第一届生物信息学人才发展论坛,第一时间联系了曾健明博士(生信技能树负责人),并联合华为云市场营销,促成了本次合作。最终华为云基因容器服务(GCS)作为金牌赞助商身份出现在首届生信人才大会,并分享了一个议题。
其实华为云基因容器服务(GCS)与生信技能树的缘分已经持续两年了,一直保持良好的沟通,期间合作也是亲密无间。那现在就让我们一起回顾一下首届生信人才大会上华为云基因云容器服务(GCS)的分享议题吧。
由华为云基因容器服务(GCS)赞助的2019第一届《生物信息人才发展论坛》已经顺利的落下帷幕。该论坛是由生信技能树发起、医学中文网协办的聚焦生信人未来发展的大会。汇聚了国内基因领域各大厂商参展,包括华大基因、海普洛斯、古奥基因、微基因、艾吉泰康、基云惠康、精准家、烈冰生物、拓普基因、崭晴生物等齐聚珠海横琴.澳门创业谷。共同探讨生物信息学发展前沿与就业前景。
来自华为云基因容器服务(GCS)的产品经理与参会者分享了《云厂商眼中的生信发展趋势》议题,与大家探讨云时代生信人员需要关注的发展方向。这里再次与大家分享:
大家知道,二代测序的短读长,大片段的结构变异、微卫星串联重复以及单体型信息,在过去都是临床检测上的难点甚至盲点。而以PacBio和Oxford Nanopore为代表的三代测序技术在读长和测序速度上都占据优势,尤其是Oxford纳米孔测序仪,其读长甚至可以超过1Mb(一百万碱基对),并且在测序的过程中还能同时检测DNA的甲基化修饰。三代测序由于由于读长更长,它的出现将完美填补之前临床检测上的这些空白。目前已有多家基因容器的客户开始在云上运行三代测序业务,相信这会是一个比较明显的趋势信号。
然而,由于三代测序仪的限制,单碱基精度一直是最大的问题。如果没有特殊的算法处理,数据是很难用的。当前普遍的做法是在进数据分析之前,首先校正Reads本身的精度。一般实现是通过序列之间两两互相比较纠错来得到高可信度的Reads,这样一来,会大大的增加三代测序的数据计算量。整体而言,三代测序的计算量大约是二代测序的100~200倍。
这样一来,传统基因公司自建机房的方式将难以继续。你想,让IT人员管理50台服务器没问题,扩大100倍,到5000台服务器的时候,不是一个IT人员可以维护的。这只是最直接的原因,更深层次的是这么大的重资产投入,并不符合基因厂商的商业逻辑,而是应该更加地专注于业务开发。那么云计算就是一个不错的选择,新的问题是什么样的技术能够保持云上云下流程的一致性呢?答案就是Docker容器技术。
毫无疑问,生信领域的基础IT技术在向Docker容器靠拢,目前由GA4GH制定的工具标准也都是使用Docker镜像的。不仅如此,容器技术在整个IT领域,也是发展迅猛。据IDC最新云服务市场报告(2019年第一季度)显示,IaaS市场增速有所减缓,PaaS(容器)市场依然保持高增长,增速为101.9%。同时CNCF云原生基金会也正是迅速的壮大,围绕容器的生态圈也逐步完善。
Docker是一个开源引擎,可以自动将应用程序部署到容器中,同时又是独立于Host系统的。这样您就可以随时改变容器中的软件和执行的命令,而不用担心破坏主机系统。这是一个令人难以置信的轻量,快速和高效的环境,它可以方便的运行你的代码,这也是为什么Docker技术迅速火遍全球的原因。Docker已然是计算机科学家和开发人员的热门话题之一。它虽然刚刚开始被生物学领域使用,但它具有巨大的潜力。每一个跑生信分析的人都应该知道Docker技术。
华为云基因容器服务(GCS)将基因测序和容器技术完美地结合在了一起,为广大基因测序厂商提供了“更省、更快、更轻松”的云计算平台。GCS是一个三层架构,最底层是Docker层,这层主要解决基因测序相关软件的安装升级问题;中间层是Kubernetes层,主要解决在大规模集群中部署&运行Docker的问题;最上层是流程管理层,主要负责基因测序的流程控制,同时提供精细粒度的监控运维管理能力。
基因容器(GCS)在提供全容器化能力的同时,还支持一键创建SGE集群,并根据投递的任务控制sge队列的自动扩缩容,做到真正的Serverless+按需使用。此外基因容器(GCS)还支持Cromwell引擎,提供运行WDL流程的能力。基因容器服务(GCS)做到基因业务上云使用更灵活,性价比更高,运维更简单。如果有兴趣可以关注了解https://console.huaweicloud.com/gcs。
以上就是华为云基因容器服务(GCS)团队在第一届生信人才大会上和大家分享的《云厂商眼中的生信发展趋势》,谢谢大家关注。
- 点赞
- 收藏
- 关注作者
评论(0)