从图引擎平台技术,看华为云EI的决心和野心

举报
mr.FangYang 发表于 2018/08/21 22:54:42 2018/08/21
【摘要】 图是抽象能力很强的模型,能用来建模各种场景。在Facebook和Twitter这类社交网络中,以个体为单位的社会关系构成了盘根错节的一张网。如果将这张网看作为图(这里的图指代的是通过图来组织数据,做关系计算),那么其构造中「点」就是人,「边」即为人与人之间的关系。

图是抽象能力很强的模型,能用来建模各种场景。在Facebook和Twitter这类社交网络中,以个体为单位的社会关系构成了盘根错节的一张网。如果将这张网看作为图(这里的图指代的是通过图来组织数据,做关系计算),那么其构造中「点」就是人,「边」即为人与人之间的关系。

华为云EI图引擎首席架构师X博开篇即解释道,华为内部有大量的网络规划需求,同时外部面向的电商、金融等行业也有广泛的图上建模及分析查询需求,这就使图计算工具的诞生成为了必然。此外,整个图计算领域可进一步细分为查询分析、计算引擎、存储管理、可视化等子方向,但截至目前并没有一种高效涵盖所有子方向的图引擎。所以,图引擎平台的产生之意也是为了让普通用户、开发者和ISV能快速建模、高效计算,从而提升图分析与计算的质效和速度。

EYWA提供了从底层图存储和管理、核心的高性能计算引擎,到面向上层的图分析、图查询这样一整套解决方案。在华为云EI整体战略中,图引擎是基础平台服务之一,主要为之上的通用服务和行业服务提供基础的建模和计算能力。

随着业界对图分析及计算的重视加深,X博也相信不久的将来,图的查询语言或许会做到统一,计算模型也会得以不断发展;从主流的BSP、GAS到MEGA model,计算框架会逐渐被优化;硬件上对GPU、SSD等的探索也会使计算性能进一步提升。

华为云AI的两个重要方向一是视觉,一是语音。当视觉、语音被结构化成数据和数组之后,后面就是向量,向量的也可以利用图的技术来处理。因此可见,图引擎或许是华为云EI战略中非常重要的一枚棋子,成与败,或皆由这匹马车拉动。

抛砖引玉:从图引擎平台技术创新谈「EI」

EYWA的底层为图存储和管理模块,负责数据的「接入」;中间层是负责数据「运算」的核心的高性能计算引擎以及负责数据「处理」的面向上层应用的图分析和图查询模块;最上面是通过标准接口输出负责数据结果「呈现」。

121936vxjfx5zteqrazlgo.png

结合目前图计算领域的特性和需求来看,平台可用性和易用性的关键点或许在于四点:
1. 支持大规模的超大图计算和查询;
2. 兼顾图计算和图查询的高并发、低延时要求;
3. 能对接标准的查询接口和查询语言;
4. 可集成实现计算、查询、存储等一体化需求(例如,Neo4j、Titan等擅长于图数据的实时查询,但并不能高效地对图数据进行离线分析;Turi、GraphX侧重图数据的离线分析和挖掘,却不能对属性图进行管理,且不支持实时查询)。

正如上文所说,图计算领域目前要想实现集计算、查询、存储等于一体的平台也并非易事。华为云曾挑选、测试了几款主流的图计算平台及图数据库,并详细分析了它们的优劣势:例如Neo4j、Titan等具备数据持久化能力,但在数据量大的情况下性能剧烈退化且分析功能较弱,Pregel、Powergraph和GraphX又不能有效支持在线分析和查询扩展。

实际上,图引擎的这种诞生和创新很大程度上反映了华为云的AI战略。

对照而言,图引擎基础平台更多的是解决规则不太确定的问题,无论是借助图模型关系分析制定决策也好,还是为行业图计算发展提供新的解决方案也好,EYWA对应的终归是空间和规则的不确定性,基于对图的分析计算与建模,用于指导研发设计、运维运营等。而这,也为华为云EI两条落地方向敲下一记重锤。


追本溯源:图引擎的迭代勾勒着「EI」的难与痛

另外,企业级AI对于解决方案完备性具有更高要求,可以看到,无论BAT还是科大讯飞,都在快速铺建围绕自身技术的生态和产业链。同样,同一平台解决方案的完备性对产品走向市场而言具有重要价值。

采访中,X博为我们讲述了EYWA一共经历的三次迭代,我们或许可以管中窥豹,看出EI实现的不易与艰难:

第二次迭代:此后,团队开始重构图切分、计算框架等核心模块,将整个平台服务化。这个过程中又遇到了分布式编程困难(进程同步、数据一致等),开发调试过程漫长等困难。期间,图引擎团队摸索和总结了PSW框架、边集流组织等创新技术,而这时的系统性能也已比开源系统性能提速了数倍。

例如,当前图计算领域巨大数据量的情况下,实现高效高并发的查询是一大难点。于是,EYWA开启了一项通过扩线查询模拟对社交网络节点的ego-net的探索。为测试探索结果,华为云用全球计算机排名Graph500提供的Kronecker代码在对该数据集进行扩展,形成了具有2.5亿点110亿边的大图和5.2亿点和1011亿边的超大图,优化后的实验结果显示在百亿边图100并发下的3跳扩线查询总响应时间基本维持在0.1秒以内。


图引擎的落地与展望:怎么看EI的未来

为何要以内部落地来举例,根源在于华为自身是其EI应用的天然场景之一。华为供应链每年都需要处理大量的单据或用技术支撑物流等业务的发展。它也将EI服务能力延展到了多个行业场景中,千亿规模图数据复杂计算与处理就是其中重要一项。

他说,未来EYWA计划加入更多的智能技术,其中包括:

  • 具有半监督/无监督学习的ML能力(Google有团队在此方向上发力);

  • 高阶图算法,图嵌入,影响力模型;

  • 概率图模型,对推理、故障定界、异常检测、行为检查都有用。

技术演进层面上,EYWA下一步的努力方向是提供更好的图切分、更快的数据加载等;优化任务并行和任务调度;进行系统性能优化和架构升级以及探索GPU、FPGA对计算加速的帮助。


【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。