作者小头像 Lv.1
16 成长值

个人介绍

这个人很懒,什么都没有留下

感兴趣或擅长的领域

暂无数据
个人勋章
TA还没获得勋章~
成长雷达
10
6
0
0
0

个人资料

个人介绍

这个人很懒,什么都没有留下

感兴趣或擅长的领域

暂无数据

达成规则

他的回复:
1. 讲讲你生活中有哪些数据是典型的图(关系)数据结构?除了生活中常见的社交、链路引用关系、知识图谱、路网管网、组织结构等,另外生物中:生物谱系、亲缘关系医学中:大脑连接、病理病因因果图,蛋白质相互作用图化学中:高分子结构等等这些都是图数据结构。注,图片来源网络 2. 讲讲你所接触过的或听说过的图计算的典型应用场景?节点分析:网页、人物、论文等重要性排名,关系分析:社交、电商等场景下:层次关系查询, 好友、商品推荐                 故障诊断、根因分析                 知识图谱中:知识推理、知识消歧图层面的分析:社群分析、蛋白质高分子分类、3D视觉分类等等 同时,由于图的本身强大的表达能力、高效快速的计算模式,对于现实生活存在的数据高纬稀疏、数据异构、数据量庞大、数据动态变化等场景,相较于一般常用分析技术手段具有天然强大的优势,同时可解释型强。引用自MIT林肯实验室论文注: BLAS:Basic Linear Algebra Set基本线性代数集        GraphBLAS:基于图的Basic Linear Algebra Set 3. 讲讲你所知道的,相比于关系型数据库,图计算技术在处理关系数据上的优点。 表达能力上:图计算  (N:N的关系表达) VS关系数据库 (1:1或1:N的关系表达)                         图计算擅长表达多种复杂关系、支持丰富语义,支持异构、稀疏型、时空等复杂性数据表达,表达能力强,使用场景丰富分析能力上:图计算(多层潜在关系查询、关系推理、时空分析、知识图谱,具备节点、关系、图等多层面上的分析能力)  VS 关系数据库(简单的查询...)                     数据更新能力上:图计算(实时增减点边关系能力)VS 传统关系数据库(多表的Join,新增类型重新设计)                                图计算更新便捷、支持实时的数据更新           性能上:图计算具备快速的多层潜在关联关系查询能力、图形并行计算能力,在大数据量下可以做到实时分析,快速高效4. 讲讲你所用过的图数据库或者图引擎,以及对TA不满意的地方? 本人使用比较多的图计算工具,如PowerGraph、igraph等,只能进行单纯的计算,不支持属性图查询管理,采用“一次load图进行一次分析”的离线式分析方法,无法进行在线分析,不具备查询分析一体化能力,交互能力弱。华为图引擎服务GES提供的EYWA图计算引擎是目前少有的能够同时支持图查询与图计算分析、支持标准查询接口和gremlin标准查询语言,具备比较好的可视化、交互能力,大规模图计算性能较好的图计算引擎(如果你正在纠结选择哪一种图计算产品,华为的Eywa图计算引擎道是不错的选择)图计算领域专家夏应龙曾经在”从图引擎平台技术,看华为云EI的决心和野心”一文中,结合华为图引擎平台EYWA的选型诞生历程,从多角度客观分析了目前主流的图计算优劣,这里摘选部分,整理如下:Neo4j、Titan等:擅长于图数据的实时查询,但并不能高效地对图数据进行离线分析;                             具备数据持久化能力,但在数据量大的情况下性能剧烈退化且分析功能较弱Turi、GraphX:侧重图数据的离线分析和挖掘,却不能对属性图进行管理,且不支持实时查询Pregel、Powergraph和GraphX:不能有效支持在线分析和查询扩展。 华为云图引擎在技术上做了如下创新及优化:分布式优化Parallel Sliding Window(PSW)的图计算框架,高效加载图数据,以满足业务大规模的计算需要;兼顾图计算与点查询效率,开发基于边集流(edge-set)的块状数据组织以合理组织数据;通过边集合的prefetch策略来隐藏磁盘的IO操作以及松弛的BSP模型来隐藏通信IO,从而提升性能; 同时,夏应龙专家指出“技术演进层面上,EYWA下一步的努力方向是提供更好的图切分、更快的数据加载等;优化任务并行和任务调度;进行系统性能优化和架构升级以及探索GPU、FPGA对计算加速的帮助”,值得期待!!!