建议使用以下浏览器,以获得最佳体验。 IE 9.0+以上版本 Chrome 31+ 谷歌浏览器 Firefox 30+ 火狐浏览器
请选择 进入手机版 | 继续访问电脑版
设置昵称

在此一键设置昵称,即可参与社区互动!

确定
我再想想
选择版块
标签
您还可以添加5个标签
  • 没有搜索到和“关键字”相关的标签
  • 云产品
  • 解决方案
  • 技术领域
  • 通用技术
  • 平台功能
取消

free_style

发帖: 17粉丝: 0

发消息 + 关注

发表于2021年01月08日 10:04:28 126 12
直达本楼层的链接
楼主
显示全部楼层
[问题求助] 执行推理时概率性报错

你好, 请问推理的时候这个报错是什么原因呢? 已经编译好推理的程序, .om文件和输入数据也已准备好。(备注:不是每次都有报错, 多运行几次会有出错的情况)20210108-095442(WeLinkPC).png


/var/log/npu/slog/host-0  日志中有如下报错:

20210108-100113(WeLinkPC).png

举报
分享

分享文章到朋友圈

分享文章到微博

xiaoyifan6

发帖: 5粉丝: 25

发消息 + 关注

发表于2021年01月08日 10:08:59
直达本楼层的链接
沙发
显示全部楼层

多运行几次会出错? 意思是有时候运行是OK的,有时候是错误的?   两次运行中间时间间隔多长?

点赞 评论 引用 举报

free_style

发帖: 17粉丝: 0

发消息 + 关注

发表于2021年01月08日 10:32:06
直达本楼层的链接
板凳
显示全部楼层

回复:xiaoyifan6 发表于 2021-1-8 10:08 多运行几次会出错? 意思是有时候运行是OK的,有时候是错误的? 两次运行中间时间间隔多长?

基本没有间隔, 我是写了个循环自动运行的。

点赞 评论 引用 举报

free_style

发帖: 17粉丝: 0

发消息 + 关注

发表于2021年01月08日 10:52:20
直达本楼层的链接
地板
显示全部楼层

实际需求是,测试集有1w张图, 就算一个batch一次推256张, 也需要连续推理39次才能推理完这1w张图。 每次循环时只有数据是变得, 其他都是不变的。 但是这样有些会报错, 因此我把数据也弄成不变的, 只是重复的跑多次, 发现也有报错的。 

点赞 评论 引用 举报

yaphets

发帖: 21粉丝: 4

发消息 + 关注

发表于2021年01月08日 11:17:33
直达本楼层的链接
5#
显示全部楼层

log还有其他的error吗,runtime的error。不要硬件的error

点赞 评论 引用 举报

free_style

发帖: 17粉丝: 0

发消息 + 关注

发表于2021年01月08日 11:23:29
直达本楼层的链接
6#
显示全部楼层

回复:yaphets 发表于 2021-1-8 11:17 log还有其他的error吗,runtime的error。不要硬件的error

有RUNTIME报错。

20210108-112033(WeLinkPC).png

点赞 评论 引用 举报

free_style

发帖: 17粉丝: 0

发消息 + 关注

发表于2021年01月08日 14:13:53
直达本楼层的链接
7#
显示全部楼层

这个该怎么解决呢?

点赞 评论 引用 举报

yaphets

发帖: 21粉丝: 4

发消息 + 关注

发表于2021年01月11日 09:23:50
直达本楼层的链接
8#
显示全部楼层

log显示,加载new model,你再下次batch推理重新加载了模型吗?

点赞 评论 引用 举报

free_style

发帖: 17粉丝: 0

发消息 + 关注

发表于2021年01月11日 14:23:29
直达本楼层的链接
9#
显示全部楼层

回复:yaphets 发表于 2021-1-11 09:23 log显示,加载new model,你再下次batch推理重新加载了模型吗?

应该是加载了。 编译完程序之后得到可执行程序main。 然后每来一次数据都执行一下main程序, 只是把数据文件换了, 模型文件不换。 每次执行应该是独立的, 应该也会重新加载模型文件吧(虽然每次加载的都是同一个文件)。

点赞 评论 引用 举报

free_style

发帖: 17粉丝: 0

发消息 + 关注

发表于2021年01月11日 19:26:09
直达本楼层的链接
10#
显示全部楼层

回复:free_style 发表于 2021-1-11 14:23 应该是加载了。 编译完程序之后得到可执行程序main。 然后每来一次数据都执行一下main程序, 只是把数据文件换了, 模型文件不换。 每次执行应该是独立的,

这个问题应该怎么从根本上解决呢, 这样不太稳定呀, 偶尔就会有报错。

点赞 评论 引用 举报

yaphets

发帖: 21粉丝: 4

发消息 + 关注

更新于2021年01月12日 11:19:57
直达本楼层的链接
11#
显示全部楼层

回复:free_style 发表于 2021-1-11 14:23应该是加载了。 编译完程序之后得到可执行程序main。 然后每来一次数据都执行一下main程序, 只是把数据文件换了, 模型文件不换。 每次执行应该是独立的,

你的数据是动态的吗?还是有固定量的数据集?官方给的多batch推理样例,是按照固定量数据集。然后找到batch数量图片申请空间,满batch后整份推理。不涉及反复加载卸载模型。

https://support.huaweicloud.com/asdevg-c-cann/atlasdevelopment_01_0118.html

点赞 评论 引用 举报

游客

富文本
Markdown
您需要登录后才可以回帖 登录 | 立即注册