华为云 - 边缘AI研发落地生态挑战调研报告

边缘云创新实验室 发表于 2021/12/21 15:47:12 2021/12/21
【摘要】 随着边缘设备的广泛使用和性能提升,将机器学习相关的部分任务迁移到边缘,也即边缘AI技术,已成为必然趋势。但仅凭技术是不足够完成落地和产业转化的。近日我们启动了边缘AI研发落地生态挑战调研。我们发现,当前学界业界在落地过程已经遇到各式各样的困难,重点生态挑战包括数据集和配套算法难以获取、通用方案无法满足特定业务需求、缺乏商业成功案例等。

随着边缘设备的广泛使用和性能提升,将机器学习相关的部分任务迁移到边缘,也即边缘AI技术,已成为必然趋势,甚至能够同时结合云侧算力和边侧数据来完成机器学习任务。机器学习服务将边缘产生的数据转换为知识的过程中,需要在边缘快速响应并处理本地产生的数据。在落地过程中,我们发现,在连接海量边缘节点的边缘云时代,随着AI服务与边缘用户的距离缩短,通用AI原本部分挑战在边缘场景下变得更加尖锐

基于一些落地经验,华为云边缘云创新实验室(ECILEdge Cloud Innovation LabHuawei Cloud系列文章中曾介绍过数据异构等四大技术挑战。针对这些挑战,各个技术方案落地与成果转化到产业的进程正在紧锣密鼓地进行。但仅凭技术是不足够完成落地和产业转化的。当前学界业界很多团队已经遇到各式各样的困难,比如数据集难以获取、通用方案无法满足特定业务、缺乏商业成功案例等。

因此除了技术挑战外,华为云边缘云创新实验室一直密切关注边缘AI生态挑战*。为了让更多边缘AI领域的朋友多快好省地完成技术研发落地和商业闭环,华为云边缘云创新实验室启动了边缘AI研发落地生态挑战调研。本次调研通过问卷发放的方式,希望进一步了解边缘AI方案落地与产业落地过程中遇到的生态挑战。截至20211129日,已回收有效答卷175份,问卷开放选项采集到49条补充意见和8条补充建议。对答卷中共计20项量表题项进行分析,信度Cronbach.𝛼**0.975

根据调研结果,对边缘AI各角色而言,当前阻碍研发落地,首当其冲生态挑战分别是

   算法开发者:“真实业务数据集及其基线算法、预训练模型难以获取”

   服务开发者:“通用方案整体性能不一定满足特定业务需求”

   技术布道者:“缺乏商业成功案例”

具体调研报告结果请见下文。

*比如研发资源难获取、工具链不完备等主要依赖社区分工与共享的非技术挑战,在本文中定义为生态挑战

**信度指同一问卷对同一组对象重复测量时所得结果的一致性程度,用于测量样本回答结果是否可靠。如果在0.8以上,则该测验或量表的信度非常好;如果低于0.6,量表就需要重新设计题项。

 

1. 调研对象


调研对象职业主要是工业界从业者(53.45%),其次是在校学生(31.03%)和学术界研究者(25.86%)。

调研对象的技术方向主要是边缘AI及其应用(55.75%)、AI及其应用(49.43%)、边缘计算及其应用(42.53%)。也有约四分之一的方向为云计算及其应用(25.86%),以及少量的其它方向(13.22%)。

1.     边缘AI算法开发者

本问卷中,边缘AI算法开发者是指研发联邦学习、协同推理乃至深度学习调度等边缘AI典型算法的角色。有80.46%调研对象填写了边缘AI算法开发者相关问卷调研选项。对每个挑战的负面影响有四种选项,包括“不了解可跳过”“可维持现状“建议改进“亟需改进”。

本章先介绍答卷中关于各个算法开发生态挑战的不同维度调研结果,本章末尾将小结各不同维度的结论。

1.1.       平均分

若选择“不了解跳过”或“可维持现状”记为0分,“建议改进”记为5分,“亟需改进”记为10分,答卷中对边缘AI算法开发者各挑战的平均分值如下图所示。对比认为“还有其他重要挑战”的1.43分,问卷中所罗列的各挑战都超过了5分,可以认为各挑战都有改进的需求。


其中,平均分值最高(6.87分)的挑战是:

 “真实业务数据集及其基线算法、预训练模型难以获取”

在截尾均值* 6.09分以上的其它头部挑战还包括:

 “算法研发迭代中,重复部署整套端边云系统过于沉重”

 “缺乏AI工具,包括资源监控、节点仿真、标注工具等”

 “算法找不到对应业务场景,或很难得知实际业务落地性能”

*截尾均值指是指在一个数列中,去掉两端的极端值后所计算的算术平均数。在本问卷中用于屏蔽最后一个开放选项的影响,下同。

从“边缘AI及其应用”方向细分工业界、学术界和在校学生等不同职业调研对象(三者在调研对象中的比例大致为2:1:1),细化算法开发者各项挑战平均分:


“边缘AI及其应用”方向下各职业平均分值最高的算法开发挑战分别是:

  • 工业界:“缺乏AI工具,包括资源监控、节点仿真、标注工具等” (平均分7.5
  • 学术界:“缺乏真实业务及其研究需求的固定来源” (平均分7.14
  • 在校学生:“真实业务数据集及其基线算法、预训练模型难以获取”(平均分7.68

在截距均值以上的其它头部挑战还包括:

工业界(截距均值6.19):

  • “真实业务数据集及其基线算法、预训练模型难以获取”(平均分7.1
  • “算法研发迭代中,重复部署整套端边云系统过于沉重”(平均分7
  • “边缘AI系统部署等起步过程中缺乏指南文档”(平均分6.35

学术界(截距均值6.30

  • “真实业务数据集及其基线算法、预训练模型难以获取”(平均分6.96
  • “缺乏AI工具,包括资源监控、节点仿真、标注工具等”(平均分6.72

在校学生(截距均值6.77

  • “缺乏真实业务及其研究需求的固定来源”(平均分7.41
  • “算法找不到对应业务场景,或很难得知实际业务落地性能”(平均分7.59

2.2.       亟需改进

对于边缘AI算法开发者,问卷中提及的挑战被选为“亟需改进”的比例通常三分之一左右,高于“还有其他重要挑战”的6.36%,可以认为各个挑战都有相当的迫切需求。

其中被选为“亟需改进”的挑战中比例最高(42.77%)的是:

“真实业务数据集及其基线算法、预训练模型难以获取”

在截尾均值(33.33%)以上的其它头部挑战还包括:

“算法研发迭代中,重复部署整套端边云系统过于沉重”

“缺乏AI工具,包括资源监控、节点仿真、标注工具等”

“算法找不到对应业务场景,或很难得知实际业务落地性能”

“边缘AI系统部署等起步过程中缺乏指南文档”

可以看到,除了一个挑战,“亟需改进”和“平均分”头部挑战基本保持一致,这个有区别的挑战是:

“边缘AI系统部署等起步过程中缺乏指南文档”

但可以观察到,除了“亟需改进”维度,该挑战其实在“平均分”维度也是非常接近头部(距离截尾均值0.02),这说明其重要性。


2.3.       可改进

问卷中的绝大部分挑战都以较大比例(63.1% - 69.94% )被选为“建议改进”和“亟需改进”(下总称“可改进”),对比认为“有其他重要挑战”需改进的比例仅为13.87%,说明列举在问卷中相关挑战大部分都明显有改进的需求。

其中,被认为“可改进”的挑战中比例最高(69.94%)的是:

“真实业务数据集及其基线算法、预训练模型难以获取”

在截尾均值(67.06%)以上的其它头部挑战还包括:

“缺乏真实业务及其研究需求的固定来源”

“边缘AI系统部署等起步过程中缺乏指南文档”

 “缺乏AI工具,包括资源监控、节点仿真、标注工具等”

“算法研发迭代中,重复部署整套端边云系统过于沉重”

与“亟需改进”相比,“可改进”维度头部部分选项排名有变化。


1、在“可改进”维度头部选项中,比“亟需改进”排名更高的挑战,可以认为是有一定的重要性,但相对不那么紧急。这些可能看上去更“长远”的“重要不紧急”挑战包括:

“缺乏真实业务及其研究需求的固定来源”

“边缘AI系统部署等起步过程中缺乏指南文档”

第二个挑战也与“亟需改进”部分结论一致。


2、在“亟需改进”维度头部选项中,比“可改进”排名更高的挑战,可以认为是一定的重要性,但相对比较紧急,这些看上去更“紧迫”的“重要且紧急”挑战包括:

“算法研发迭代中,重复部署整套端边云系统过于沉重”

“缺乏AI工具,包括资源监控、节点仿真、标注工具等”


2.4.       小结

对边缘AI算法开发者有以下结论:

  • 平均分值最高(6.87分)的挑战是:“真实业务数据集及其基线算法、预训练模型难以获取”
  • 其它头部重要挑战中
  • “重要不紧急”头部重要挑战包括:“缺乏真实业务及其研究需求的固定来源”“边缘AI系统部署等起步过程中缺乏指南文档”
  • “重要且紧急”头部重要挑战包括:“算法研发迭代中,重复部署整套端边云系统过于沉重”“缺乏AI工具,包括资源监控、节点仿真、标注工具等”
  • “边缘AI及其应用”方向下算法开发各职业平均分值最高的生态挑战分别是:
  • 工业界:“缺乏AI工具,包括资源监控、节点仿真、标注工具等” (平均分7.5
  • 学术界:“缺乏真实业务及其研究需求的固定来源” (平均分7.14
  • 在校学生:“真实业务数据集及其基线算法、预训练模型难以获取”(平均分7.68

  

问卷中也尝试调研边缘AI算法开发其余重要挑战,调研结果词云如下所示,包括边缘AI概念与定义、硬件方案、人才协作、工具与文档、场景需求、AI效果24条意见,由于篇幅限制不一一阐述。

3.     边缘AI服务开发者

本问卷中,边缘AI服务开发者是指,在给定算法基础上开发工业、Re-ID、能源、机器人等边缘AI服务的角色。有74.90%的调研对象填写了边缘AI服务开发者相关问卷调研选项。对每个挑战的负面影响有四种选项,包括“不了解可跳过”“可维持现状“建议改进“亟需改进”。

本章先介绍答卷中关于各个算法开发生态挑战的不同维度调研结果,本章末尾将小结各不同维度的结论。

3.1.       平均分

若选择“不了解跳过”或“可维持现状”记为0分,“建议改进”记为5分,“亟需改进”记为10分,答卷中对边缘AI服务开发者各挑战的平均分值如下图所示。对比认为“还有其他重要挑战”的1.24分,问卷中所罗列的各挑战都超过了5分,可以认为各挑战都有改进的需求。

其中,平均分值最高(6.76分)的挑战是:

 “通用方案整体性能不一定满足特定业务需求”

在截尾均值6.09分以上的其它头部挑战还包括:

 “自研业务算法和系统方案周期长成本高”

 “方案效果复现困难或通用方案应用范围存疑”

从“边缘AI及其应用”方向细分工业界、学术界和在校学生等不同职业调研对象(三者在调研对象中的比例大致为2:1:1),细化服务开发者各项挑战平均分:

“边缘AI及其应用”方向下各职业平均分值最高的服务开发挑战完全一致:

  • 工业界:“通用方案整体性能不一定满足特定业务需求” (平均分7.1
  • 学术界:“通用方案整体性能不一定满足特定业务需求” (平均分7.8
  • 在校学生:“通用方案整体性能不一定满足特定业务需求”(平均分7.5

在截距均值以上的其它头部挑战还包括:

工业界(截距均值5.99):

  • “自研业务算法和系统方案周期长成本高”(平均分6.63
  • “方案效果复现困难或通用方案应用范围存疑”(平均分6.1

学术界(截距均值5.75):

  • 自研业务算法和系统方案周期长成本高”(平均分7.00
  • “方案效果复现困难或通用方案应用范围存疑”(平均分6.60

在校学生(截距均值5.84):

  • “方案效果复现困难或通用方案应用范围存疑”(平均分6.88
  • “自研业务算法和系统方案周期长成本高”(平均分6.46


3.2.       亟需改进

 

对于边缘AI服务开发者,问卷中提及的挑战被选为“亟需改进”的比例都在20%以上,高于“还有其他重要挑战”的6.36%,可以认为各个挑战都有一定的迫切需求。

其中被选为“亟需改进”的挑战中比例最高(36.78%)的是:

“通用方案整体性能不一定满足特定业务需求”

在截尾均值(25.57%)以上的其它头部挑战还包括:

“自研业务算法和系统方案周期长成本高”

“现场人员只会开关机,希望简化现场安装部署”

与“平均分”维度相比,“亟需改进”维度头部部分选项排名有变化。

1、在“亟需改进”维度才进入头部的挑战有一个,在“平均分”部分其实也是非常接近头部(距离截尾均值0.06),这可能说明该挑战比较重要,而且需求比较迫切,这个挑战是:

“现场人员只会开关机,希望简化现场安装部署”

2、在“平均分”维度有一个头部挑战在“亟需改进”维度排名下降,意味着其有一定的重要性,但相对紧急程度较低,可能是“重要不紧急”的、更为“长远”的需求,这个挑战是:

“方案效果复现困难或通用方案应用范围存疑”



3.3.       可改进

问卷中的绝大部分挑战都以较大比例(59.77% - 68.96% )被选为“建议改进”和“亟需改进”(下总称“可改进”),对比认为“有其他重要挑战”需改进的比例仅为10.92%,说明列举在问卷中相关挑战大部分都明显有改进的需求。

其中,被认为“可改进”的挑战中比例最高(68.96%)的是:

“通用方案整体性能不一定满足特定业务需求”

在截尾均值(61.78%)以上的其它头部挑战还包括:

“自研业务算法和系统方案周期长成本高”

“方案效果复现困难或通用方案应用范围存疑”

与“亟需改进”相比,“可改进”维度头部部分选项排名有变化。

1、在“可改进”维度头部选项中,比“亟需改进”排名更高的挑战,可以认为是有一定的重要性,但相对不那么紧急,看上去更“长远”的“重要不紧急”挑战包括:

“方案效果复现困难或通用方案应用范围存疑”

这与“亟需改进”章节结论一致。

2、在“亟需改进”维度头部选项中,比“可改进”排名更高的挑战,可以认为是一定的重要性,但相对比较紧急,这些看上去更“紧迫”的“重要且紧急”挑战包括:

“现场人员只会开关机,希望简化现场安装部署”

这与“亟需改进”章节结论一致。


3.4.       小结

对边缘AI服务开发者有以下结论:

  • 平均分值最高(6.76分)的挑战是:“通用方案整体性能不一定满足特定业务需求”
  • 其它头部重要挑战中
  • “重要不紧急”头部重要挑战包括:“方案效果复现困难或通用方案应用范围存疑”
  • “重要且紧急”头部重要挑战包括:“现场人员只会开关机,希望简化现场安装部署”
  • 头部重要挑战还包括:“自研业务算法和系统方案周期长成本高”
  • “边缘AI及其应用”方向下服务开发各职业平均分值最高的生态挑战完全一致:
  • 工业界:“通用方案整体性能不一定满足特定业务需求” (平均分7.1
  • 学术界:“通用方案整体性能不一定满足特定业务需求” (平均分7.8
  • 在校学生:“通用方案整体性能不一定满足特定业务需求”(平均分7.5

  

问卷中也尝试调研边缘AI服务开发其余重要挑战,调研结果词云如下所示。包括场景定制化、培训与指南、部署安装、硬件资源、技术方案等18条挑战,由于篇幅原因不一一阐述。

4.     边缘AI技术布道者

本问卷中,边缘AI技术布道者是指开展边缘AI技术演讲布道,推广甚至销售现有边缘AI技术与服务的角色。有69.94%调研对象填写了边缘AI技术布道者相关问卷调研选项。对每个挑战的负面影响有四种选项,包括“不了解可跳过”“可维持现状“建议改进“亟需改进”。

本章先介绍答卷中关于各个算法开发生态挑战的不同维度调研结果,本章末尾将小结各不同维度的结论。

 

4.1.        平均分

若选择“不了解跳过”或“可维持现状”记为0分,“建议改进”记为5分,“亟需改进”记为10分,答卷中对边缘AI技术布道者各挑战的平均分值如下图所示。对比认为“还有其他重要挑战”的0.73分,问卷中所罗列的各挑战都超过了5分,可以认为各挑战都有改进的需求。

其中,平均分值最高(6.61分)的挑战是:

 “缺乏商业成功案例”

在截尾均值5.77分以上的其它头部挑战还包括:

“缺乏与现有方案系统对比,包括成本、部署要求”

 “受众对边缘AI不了解”

从“边缘AI及其应用”方向细分工业界、学术界和在校学生等不同职业调研对象(三者在调研对象中的比例大致为2:1:1),细化技术布道者各项挑战平均分:

“边缘AI及其应用”方向下各职业平均分值最高的技术布道挑战分别是:

  • 工业界:“缺乏与现有方案系统对比,包括成本、部署要求” (平均分6.63
  • 学术界:“缺乏商业成功案例” (平均分6.59
  • 在校学生:“受众对边缘AI不了解”(平均分6.25

在截距均值以上的其它头部挑战还包括:

工业界(截距均值5.98):

  • “受众对边缘AI不了解”(平均分6.15
  • “缺乏商业成功案例”(平均分6.43

学术界(截距均值5.40

  • “受众对边缘AI不了解”(平均分5.91
  • “缺乏与现有方案系统对比,包括成本、部署要求”(平均分5.68

在校学生(截距均值5.46

  • “缺乏商业成功案例”(平均分6.05
  • “缺乏直观的UI界面和Demo”(平均分6.05

“缺乏与现有方案系统对比,包括成本、部署要求”(平均分5.53


4.2.       亟需改进


 

对于边缘AI技术布道者,问卷中提及的挑战被选为“亟需改进”的比例都在20%以上,高于“还有其他重要挑战”的1.72%,可以认为各个挑战都有一定的迫切需求。

其中被选为“亟需改进”的挑战中比例最高(32.18%)的是:

“缺乏商业成功案例”

在截尾均值(25.00%)以上的其它头部挑战还包括:

“缺乏与现有方案系统对比,包括成本、部署要求”

“缺乏直观的UI界面和DEMO

与“平均分”维度相比,“亟需改进”维度头部部分选项排名有变化。

1、在“亟需改进”维度才进入头部的挑战有一个,在“平均分”部分其实也是非常接近头部(距离截尾均值0.06),这可能说明该挑战比较重要,而且需求比较迫切。这个“重要且紧急”挑战是:

 “缺乏直观的UI界面和DEMO

2、在“平均分”维度有一个头部挑战在“亟需改进”维度排名下降,意味着其有一定的重要性,但相对紧急程度较低,更为“长远”的需求。这个“重要不紧急”挑战是:

“受众对边缘AI不了解”


4.3.       可改进


 

问卷中的绝大部分挑战都以较大比例(54.02% - 62.07%) 被选为“建议改进”和“亟需改进”(下总称“可改进”),对比认为“有其他重要挑战”需改进的比例仅为6.89%,说明列举在问卷中相关挑战大部分都明显有改进的需求。

其中,被认为“可改进”的挑战中比例最高(62.07%)的是:

“缺乏商业成功案例”

在截尾均值(57.61%)以上的其它头部挑战还包括:

“缺乏与现有方案系统对比,包括成本、部署要求”

“受众对边缘AI不了解”

与“亟需改进”相比,“可改进”维度头部部分选项排名有变化。

1、在“可改进”维度头部选项中,比“亟需改进”排名更高的挑战,可以认为是有一定的重要性,但相对不那么紧急,看上去更“长远”的挑战包括:

“受众对边缘AI不了解”

这与“亟需改进”章节结论一致。

2、在“亟需改进”维度头部选项中,比“可改进”排名更高的挑战,可以认为是一定的重要性,但相对比较紧急,这些看上去更“紧迫”的“重要且紧急”挑战包括:

“缺乏直观的UI界面和DEMO

这与“亟需改进”章节结论一致。


4.4.       小结 

对边缘AI技术布道者有以下结论:

  • 平均分值最高(6.61分)的挑战是: “缺乏商业成功案例”
  • 其它头部重要挑战中
  • “重要不紧急”头部重要挑战包括: “受众对边缘AI不了解”
  • “重要且紧急”头部重要挑战包括: “缺乏直观的UI界面和DEMO
  • 头部重要挑战还包括:“缺乏与现有方案系统对比,包括成本、部署要求”
  • “边缘AI及其应用”方向下技术布道各职业平均分值最高的生态挑战分别是:
  • 工业界:“缺乏与现有方案系统对比,包括成本、部署要求” (平均分6.63
  • 学术界:“缺乏商业成功案例” (平均分6.59
  • 在校学生:“受众对边缘AI不了解”(平均分6.25

 

问卷中也尝试调研边缘AI技术布道其余重要挑战,调研结果词云如下所示。包括边缘AI价值和方案配套等7条意见,由于篇幅原因不一一阐述


未来工作

作为KubeEdge社区SIG AI重要成员,华为云边缘云创新实验室将依据调研结果有针对性地向KubeEdge社区SIG AI持续贡献。KubeEdge是业界首个云原生边缘计算框架、当前云原生计算基金会内部唯一孵化级边缘计算开源项目。KubeEdge在全球已拥有800+贡献者和60+贡献组织,在Github获得4.6k+Stars1.3k+Forks。作为KubeEdge中唯一的AI特别兴趣小组(Special Interest Group),KubeEdge社区SIG AI致力于使能AI应用在边缘更好地运行,聚焦边缘AI技术讨论、API定义、参考架构、开源实现等。为全球开发者提供相关研发支持并孵化繁荣生态,当前已开源边缘AI平台Sedna包括其跨边云的协同推理、联邦学习、增量学习和终身学习特性。

作为信奉开源文化的社区,KubeEdge始终都强调“Best ideas win”,领域发展自然也不例外。为了交出一个更有竞争力和创意的提案,本次调研了解每位关注开源与边缘AI的朋友对相关方案落地过程遇到的困难,然后选取Best idea,对社区内容进行优化,以便为大家呈现一个体现开源开放精神的资源分享社区生态。

除了之前章节提及的内容,问卷中还包括调研对象的建议。其中“提供公开数据集、预处理和基线代码,构建Benchmark的建议无论在总览、还是在边缘AI方向的工业界、学术界和在校学生中票数均排名第一,比例分别为82.18%92.98%87.10%86.67%,并且显著高于其它建议,相信此建议需要重点关注。社区也可以根据上面的阐述细分相关职业需求,进一步优化边缘AI生态。

问卷也尝试调研其余重要建议。包括场景演示和研发支撑等8条建议:

场景演示

  • 增加demo展示
  • 深入了解行业落地痛点
  • 找准一个典型领域或场景进行全方案的落地测试,包括训练和推理结合实际业务形成一套端到端的解决方案
  • 光调研开发者不足够,并非方案用户,要落地还得调研边缘AI的最终客户需求

研发支撑

  • 最重要还是数据公开
  • 希望能提供更多的例子,示例怎么完成一个任务的训练和部署。联邦学习目前了解的人比较少,希望对它的优势和使用方法做更多介绍,降低系统使用门槛。
  • 需要对相关开源平台的了解,也可以搞合作
  • 提供更多的开发者使用模式,不局限于现在example

 

路遥共相伴,勠力同向前。特别感谢参与答卷的专家、学者和同学,本次调研的四大“意见领袖”与十佳“优秀意见”等各项评选正在有序进行,并将陆续发放报告和纪念品。结合行业关注的最新技术趋势,KubeEdge将集结当前SIG AI中30+单位的各供应商和开发者边缘AI算法开发者、服务开发者、技术布道者三种角色提供资源和平台帮助。这将包括数据集开源、预处理与范式算法开源、以及AI工具等行业内迫切需要的资源,为大家带来一场开源饕餮盛宴。相关内容将陆续到来!欢迎关注KubeEdge 社区https://github.com/kubeedge/ 、KubeEdge SIG AI及其项目Sedna https://github.com/kubeedge/sedna

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区),文章链接,文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件至:cloudbbs@huaweicloud.com进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容。
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。