建议使用以下浏览器,以获得最佳体验。 IE 9.0+以上版本 Chrome 31+ 谷歌浏览器 Firefox 30+ 火狐浏览器
请选择 进入手机版 | 继续访问电脑版
设置昵称

在此一键设置昵称,即可参与社区互动!

确定
我再想想
选择版块
直达楼层
标签
您还可以添加5个标签
  • 没有搜索到和“关键字”相关的标签
  • 云产品
  • 解决方案
  • 技术领域
  • 通用技术
  • 平台功能
取消

采纳成功

您已采纳当前回复为最佳回复

Lear

发帖: 5粉丝: 0

发消息 + 关注

发表于2021年04月21日 10:59:44 207 3
直达本楼层的链接
楼主
显示全部楼层
[执行问题] 【mindspore】【GPU性能】GPU上的Element-wise算子的性能很差

目前在GPU上训练一个调用了大量add、mul等element-wise算子的网络,速度比pytorch慢许多,profile一下发现是mindspore的element-wise算子出奇地慢,而pytorch的element-wise算子性能就比较正常,想请教一下可以如何优化?(没太看懂pytorch的实现细节)

举报
分享

分享文章到朋友圈

分享文章到微博

采纳成功

您已采纳当前回复为最佳回复

chengxiaoli

发帖: 238粉丝: 31

级别 : 版主,版块专家

发消息 + 关注

发表于2021年04月21日 11:30:02
直达本楼层的链接
沙发
显示全部楼层

用户您好,欢迎您的使用,问题已经收到,正在分析中,会尽快给您答复,谢谢支持

点赞 评论 引用 举报

采纳成功

您已采纳当前回复为最佳回复

梁成辉

发帖: 0粉丝: 1

发消息 + 关注

发表于2021年04月22日 14:59:40
直达本楼层的链接
板凳
显示全部楼层

麻烦提供一下性能差的算子名称以及其与pytorch对比的性能数据。

评论
Lear 2021-4-23 13:04 评论

具体数据在楼下,这是一个step的数据。两个软件生成的计算图不同,所以调用次数略有不同。不过可以保证两个网络的结构相同。

... 查看全部
点赞 评论 引用 举报

采纳成功

您已采纳当前回复为最佳回复

Lear

发帖: 5粉丝: 0

发消息 + 关注

发表于2021年04月23日 13:02:48
直达本楼层的链接
地板
显示全部楼层
软件
算子
总时间(ms)
平均时间(ms)
调用次数
mindspore
add
31.486016 0.21565764383561645 146
mul
32.036544 0.222476 144
pytorch
add
18.679 0.097798 191
mul
9.456 0.065214 145
评论
mindspore_cjj 2021-4-26 10:34 评论

Lear,你好,可以提供一下你的测试脚本吗?PyTorch和MindSpore的脚本,以及Profile的方法,谢谢

... 查看全部
点赞 评论 引用 举报

游客

富文本
Markdown
您需要登录后才可以回帖 登录 | 立即注册

邀请回答
您可以邀请3位专家

结贴

您对问题的回复是否满意?
满意度
非常满意 满意 一般 不满意
我要反馈
0/200