遇见西安丨基因检测与华为云结合,指导人们未来的生活

举报
鸽崽 发表于 2019/11/16 00:30:35 2019/11/16
【摘要】 科技以人为本,也因此,人类得以生生不息、繁衍壮大。陕西图灵生物科技有限公司CEO王超说,图灵基于华为云开发了Geno Stack平台生命数据处理全栈工具集,借助容器化设计来解决碎片化工具的问题,从而提升效率;结合华为云EI分析,为用户提供智能化建议;通过基因切片技术,可以针对用户的应用需求提供定制化的信息,真正做到让每个人用好自己的基因数据。

主讲人:陕西图灵生物科技有限公司CEO王超

  演讲目的:分享图灵和华为云在处理生物数据方面所用到的一些技术以及与华为云未来所做的一些联合创新。

1573815174703109.jpg

一、基因——碳基世界的中心法则

 

1573815234314729.jpg

(一)基因检测三十年——超摩尔定律

      图灵的核心业务,是利用一些先进的IT技术来处理和分析基因数据。人体大概有37.2亿个细胞,绝大部分细胞都有自己的遗传物质,而且除了这些细胞核内的遗传物质以外,人体内还有大量的线粒体DNA。这些DNA内的基因加起来大概有2.7万个,而实际上,人与人基因上的差别其实只有0.1%,就因为这一细微的差别,就决定了我们每个人的个性特质不一样。

      向前回顾30年,据总结,基因产业有两个非常显著的特点:

      首先,它是远超摩尔定律的。HGP(人类基因组计划)刚成立时,每个人基因测序的成本大概在十亿美金。而到了2011年,苹果公司创始人乔布斯和影星安吉丽娜·朱莉都曾希望采用基因测序方法抵御癌症的侵蚀,此时基因测序的成本已经下降到十万美金。到2014年的时候,整个基因测序的成本已经降至了1000美金之下。

      第二个特点,便是随着成本的下降、国家层面的推动,以及包括中国,美国在内的精准医疗计划的推动,基因测序的市场规模在逐年增加,因此,现在的普通大众消费者也有就会能去享受到基因测序带来一些益处。

(二)基因测序让生活更美好

      未来,每个人肯定都会有自己的基因数据,这一天肯定是快就会到来的。那么这些数据有哪些应用呢?其实它会在未来作为一个基础数据影响到我们生活的方方面面。如我们现在首要的应用场景——精准医疗。以前,人们做遗传病筛查的时候,应用的是唐筛(唐氏综合征筛查),羊水穿刺法,这种方法实际上是有一定风险的,有一定的流产率,而现在,通过脐带抽血,就可以测量婴儿的DNA,来发现孩子是否有遗传病。

      在电影《我不是药神》中,靶向用药的整个研发过程还有最终在用户当中的使用,实际上都会应用到基因数据。因为靶向用药在真正使用的时候,对每个人的情况是不太一样的,用量的多少、效果,都是根据每个人的基因序列来决定的。

      另一个重要的应用场景即是家庭场景。如怀孕周期:孕前,夫妻双方之间可以做一些隐性的遗传携带的检查,包括母亲在怀孕期间吃的叶酸(一种水溶性维生素,属于维生素B。可用于治疗由叶酸缺乏症引起的贫血,也是孕妇的营养补充品)用量,都是通过基因序列来决定的,每个人的情况都是不大一样的;在孕中,可以做一些类似于“唐筛”这样的基因筛查;产后,在新生儿出生时,便可立即对新生儿做一些基因检测。通过这种三级预防的方式,便可真正做到优生优育。

      日常生活当中,包括日常饮食、运动还有护肤等等这些与我们个性化生活相关的场景,其实都有用到基因数据,通过基因数据量身定制我们的一些生活习惯。众所周知,每日中午时分,大家都会面临一个“今天中午吃什么”的问题。未来,如果有了基因数据的帮助,便可通过IT技术,做一个智能推送,不仅可以告诉大家今天吃什么,而且可以根据大家的基因数据,告诉大家如何吃得更营养。

二、基因测序背后的故事

1573816206501507.jpg

基因数据是怎么来的

      随着技术的成熟,如今,我们不需要抽血,只需通过两毫升的唾液,便可完成DNA的检测。据王超先生所说,通过一支试管采集的两毫升唾液,他们就可以进入一个实验室的准备阶段,主要就是DNA提取和文库的制备。这些数据准备好以后就进行基因测序,基因测序得到的数据,并不可以直接使用,它要进行一个软件的分析,他们称之为一个“三级标准流程”。

      第一级流程为“质控”。由于基因检查所得结果质量可能会有些许问题,图灵科技应用一个与测序仪本身有比较强绑定的“质控”软件,这个不需过分关注。实际上,到二级、三级的时候,他们要做的一个生物数据流程,接着做解读、做大数据分析。图灵科技目前与华为云联合研发的技术,更关注于第二级第三级。随着基因检测流程的成本下降和标准化,未来基因产业的真正核心问题,将会转化成一个软件问题。

 

海量计算面临的资源挑战&碎片化的工具集

1573832629223317.png

陕西图灵生物科技有限公司CEO王超先生

 

      王超先生说到,之前,图灵科技在处理数据的时候,是有自己的数据中心的,包括本地的数据中心,高性能的一个集群。高性能的集群曾经面临的两个比较大的问题:

      第一,存储和计算资源。上文提到的基因数据在经过处理后,计算下来,每个人约有150GB的数据,如果再包括微生物的数据,加起来比这个数据更多。目前,图灵科技存储的弹性要面临的一个严峻问题是,买设备容易解决,但随着数据量的增加,所需的维护成本是非常高的。因为存储本身是需要定期去更换的,还要有定期的维护,这一部分的人工成本非常高。在之前,图灵科技已经把少量的易迁移的业务迁移到华为云了。目前,他们计划把90%以上的业务全部迁移到华为云。

      第二,便是生物行业比较具有特点的问题,即应用的工具是非常碎片化的。之所以说“碎片化”,是因为据统计,在整个数据处理的过程中所用到的工具中,其数目有5000多种,而且所用的工具还在逐渐增加。这些工具都有一个非常大的特点,就是其运营环境要求不尽相同,它对各种编程语言和运营环境等等有不同的要求。除了基因数据以外,还有人体的生理数据、我们的蛋白质组、微生物组,处理这些数据所用到的工具实际上是不太一样的。因此,图灵科技提出了一个名为“GenoStock”的平台,它主要是与华为联合,在整个平台从构建之初,便构建于华为云上,充分利用华为云的弹性计算资源、存储资源和网络资源来为实验室人员、生信(生物信息技术)人员甚至于未来的医生、营养师、精神管理师甚至科研领域的科学家,为他们提供一个统一、整合平台。通过整合各方的资源还有各方专家,最终为消费者提供基因方面的服务。

三、"GenoStock"平台的三个重要特性

1573832870430428.jpg

      第一,应用华为云的容器技术,可以解决工具碎片化和弹性计算资源的问题。通过容器,能够把使用到的各种生物工具进行整合、打包,然后利用已经研发的流水线工具,在此条件下,便可灵活组合各种生物工具。这样带来的一个好处便是,资源是弹性的。并且,随着样本量的增加,有了这个平台,便可以同时处理上万个、几十万个不同的样本,而且华为云上的资源是无限多的,这样,在未来便可以应用在大样本下的不同场景。

      第二,图灵科技与华为做了一些联合创新。如华为的EI技术。图灵科技之所以使用“云”,并且选择了华为云,主要原因是华为云上有一个很大的好处,打开网站便有很多已经做好的服务和工具,无需思考研发问题,便可供直接使用,使得基因数据处理工作变得十分便捷。另一个好处便是,华为云的技术实力、软件的研发能力非常强大,版本的更新速度也很快,也即我们可以很快享受到先进技术带来的服务。对于基因领域来说,有一个创新的地方是,基因数据是个性化、个体化的数据,例如,喝牛奶与乳糖不耐受、喝咖啡与咖啡 因代谢情况,还有未来会根据运动情况,如在健身过程中一个名为“最大吸氧量”的指标等等,通过一些对数据比较个性化的采集和分析,再与华为云EI的人工智能的结合,利用研发的智能的推荐系统,在各个场景下自动根据大家的各种数据“量体裁衣”,为大家提供一些个性化的智能推荐,来指导我们的日常生活,如现存的饮食指南、运动指南以及大家比较关注的养生指南等等。

1573832950231936.jpg

      另外,图灵科技提出的名为“基因切片”的技术,与华为之前所提出的5G的“网络切片”概念有些类似。如上文所提到的,基因数据本身是非常长的,DNA中大概有64亿个碱基对,27000个基因。但实际上,在包括饮食、运动还有用药等应用场景下,并不需要用到所有的基因。事实上,从测出基因数据到真正落地使用的过程中,中间环节还需要一些人员参与,如营养数据检测出来后,还需要一些营养师的指导;把基因数据查出来后,在用药时还需要一些医生的指导。中间还是有一个“Gap”(缺口)需要不同人员去填补的。而图灵科技所做的,就是把这些基因“切”下来整理,把所用到的数据,包括我们的营养数据库、运动数据库甚至于未来的疾病数据库进行整合,整合到“GenoStock”这个平台中,为垂直领域的一些专业人士提供工具。未来,云本身会是场景化的,王超先生表示,他希望在未来,基因也是场景化的,在不同场景下,都能为垂直领域的专家提供工具,最终为消费者提供服务。

  【结语】数据融合 让每个人用好自己的基因数据

      如标题所说:连接碳基与硅基。人、生命是以“碳”为核心的,芯片的核心材料是沙子,即实际原材料是“硅”。我们对未来有一个愿景,即除了基因数据这一核心以外,还希望把人体的蛋白质组、代谢甚至于未来的微生物组做一个整合,把这些数据和华为云进行更深度的联合分析,最终使人体的数据数字化。王超先生表示,未来的5G到来后,有物联网,与物联网类似,人,作为一个最大的“物”,其数据量也是非常庞大的,并且仍有很多值得挖掘的地方。

 

 

 

 演讲视频链接:http://live.bizconfstreaming.cn/campaign/calendar/xian

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。