建议使用以下浏览器,以获得最佳体验。 IE 9.0+以上版本 Chrome 31+ 谷歌浏览器 Firefox 30+ 火狐浏览器
请选择 进入手机版 | 继续访问电脑版
设置昵称

在此一键设置昵称,即可参与社区互动!

确定
我再想想
选择版块
标签
您还可以添加5个标签
  • 没有搜索到和“关键字”相关的标签
  • 云产品
  • 解决方案
  • 技术领域
  • 通用技术
  • 平台功能
取消

发问小达人

发帖: 2粉丝: 0

发消息 + 关注

发表于2021年01月07日 15:19:43 211 19
直达本楼层的链接
楼主
显示全部楼层
[问题求助] 昇腾功能是否具备这些功能

(1)一维卷积算子是否支持;
(2)运算速度,1080Ti
(3)是否便于C++开发,或者融合,是否支持cuda
(4)对于一般卷积,滤波,FFT是否有加速效果(C++,Arrayfire

(5)系统只支持Ubuntu么?只能在服务器上运行么?或者说对运行设备有什么要求

举报
分享

分享文章到朋友圈

分享文章到微博

苏打水

发帖: 9粉丝: 9

发消息 + 关注

发表于2021年01月07日 15:33:55
直达本楼层的链接
沙发
显示全部楼层

请问是推理还是训练业务,算力参考具体设备技术规格,设备有服务器有标卡,不同设备都有相关适配系统说明文档

评论
发问小达人 2021-1-8 09:36 评论

训练业务

... 查看全部
点赞 评论 引用 举报

Tianyi_Li

发帖: 347粉丝: 187

发消息 + 关注

发表于2021年01月07日 16:01:42
直达本楼层的链接
板凳
显示全部楼层

(2)运算速度,1080Ti
运算速度除了和本身的硬件算力有关,还和网络结构,优化程度以及网络与硬件的契合等多方面,很难直接说。

评论
发问小达人 2021-1-8 09:40 评论

军工单位,所以需要云下的物理设备有吗?

... 查看全部
点赞 评论 引用 举报

Tianyi_Li

发帖: 347粉丝: 187

发消息 + 关注

发表于2021年01月07日 16:02:34
直达本楼层的链接
地板
显示全部楼层

(3)是否便于C++开发,或者融合,是否支持cuda

支持C++开发,也支持Python开发。

底层架构与NVIDIA GPU不同,不支持CUDA

点赞 评论 引用 举报

Tianyi_Li

发帖: 347粉丝: 187

发消息 + 关注

发表于2021年01月07日 16:03:39
直达本楼层的链接
5#
显示全部楼层

(4)对于一般卷积,滤波,FFT是否有加速效果(C++,Arrayfire

具体应用场景是?

推理,还是训练?

如果能用算子实现,在Ascend处理器上实现,应该可以加速。

评论
发问小达人 2021-1-8 09:39 评论

一般如果语音要用到卷积都用conv1d吧

... 查看全部
点赞 评论 引用 举报

Tianyi_Li

发帖: 347粉丝: 187

发消息 + 关注

发表于2021年01月07日 16:04:15
直达本楼层的链接
6#
显示全部楼层

(5)系统只支持Ubuntu么?只能在服务器上运行么?或者说对运行设备有什么要求

这取决于具体设备形态,可参考具体使用的设备的手册。

评论
发问小达人 2021-1-8 09:38 评论

在官网好像只看到了鲲鹏的加速库,这个相当于CPU加速吧

... 查看全部
点赞 评论 引用 举报

Tianyi_Li

发帖: 347粉丝: 187

发消息 + 关注

发表于2021年01月08日 09:44:51
直达本楼层的链接
7#
显示全部楼层

回复:Tianyi_Li 发表于 2021-1-7 16:01 (2)运算速度,1080Ti运算速度除了和本身的硬件算力有关,还和网络结构,优化程度以及网络与硬件的契合等多方面,很难直接说。

请联系官方询问购买,比如这个就是一个训练服务器:https://e.huawei.com/cn/products/cloud-computing-dc/atlas/atlas-800-training-9000

点赞 评论 引用 举报

Tianyi_Li

发帖: 347粉丝: 187

发消息 + 关注

发表于2021年01月08日 09:45:59
直达本楼层的链接
8#
显示全部楼层

回复:Tianyi_Li 发表于 2021-1-7 16:04 (5)系统只支持Ubuntu么?只能在服务器上运行么?或者说对运行设备有什么要求这取决于具体设备形态,可参考具体使用的设备的手册。

昇腾处理器是NPU,使用它的话,直接就是加速了,比如CPU运行慢,所以人们选择GPU,NPU和GPU是一个道理,直接用就行。

评论
发问小达人 2021-1-8 10:14 评论

npu有类似cuda这样的加速库么

... 查看全部
点赞 评论 引用 举报

Tianyi_Li

发帖: 347粉丝: 187

发消息 + 关注

发表于2021年01月08日 10:16:42
直达本楼层的链接
9#
显示全部楼层

回复:Tianyi_Li 发表于 2021-1-8 09:45 昇腾处理器是NPU,使用它的话,直接就是加速了,比如CPU运行慢,所以人们选择GPU,NPU和GPU是一个道理,直接用就行。

有的,比如我们使用GPU训练,一般是用PyTorch这样的框架在上层编写,而PyTorch会自动基于CUDA计算,使用昇腾也是这样的,可以选择PyTorch、TensorFlow、MindSpore框架来编写代码,会自动调用昇腾下面类似CUDA的加速库进行加速的。

评论
发问小达人 2021-1-8 10:18 评论

对于大的矩阵乘法有加速效果么,几万乘以几万

... 查看全部
发问小达人 2021-1-8 10:20 评论

pytorch我看文档好像是把里面函数重新写了

... 查看全部
点赞 评论 引用 举报

Tianyi_Li

发帖: 347粉丝: 187

发消息 + 关注

发表于2021年01月08日 10:26:16
直达本楼层的链接
10#
显示全部楼层

昇腾处理器基于华为自研达芬奇架构,其中的计算核心AI Core采用Cube结构,是专门加速矩阵运算的,不过任何计算都有数据大小限制,如果过于庞大的话,可能要拆解一下,具体的要根据算法实现和硬件配置来确定,但对于矩阵运算加速这一点是肯定的。

评论
发问小达人 2021-1-8 10:33 评论

KML_FFT有没有这个,因为pytorch功能被阉割了太多

... 查看全部
点赞 评论 引用 举报

Tianyi_Li

发帖: 347粉丝: 187

发消息 + 关注

发表于2021年01月08日 10:27:52
直达本楼层的链接
11#
显示全部楼层

如果使用PyTorch的话,因为底层架构不同,所以底层算子需要对昇腾处理器做下适配,代码需要做下适配,如果可能,建议使用华为推出的MindSpore,对昇腾处理器有深度优化,速度更快,和PyTorch也比较像的。

评论
发问小达人 2021-1-8 10:37 评论

因为最后要嵌入软件里面可能用caffe比较方便吧

... 查看全部
点赞 评论 引用 举报

游客

富文本
Markdown
您需要登录后才可以回帖 登录 | 立即注册