【功能模块】
atlas300执行图像分类(efficientnet )任务的推理
【操作步骤&问题现象】
1、使用dvpp模块进行decode和resize,对应接口是异步的
2、执行推理(execute)同步接口
目前在一张卡的一个device上执行上述任务,发现单batch情况下卡的利用率只有30%,多batch(batch_szie=32)情况下利用率只有60%,性能并没有达到最优。请问下,如果将推理改为异步,是否会提高卡的利用率呢,另外,由于解码使用的是dvpp中的异步接口,再使用异步推理的时候如何与异步解码的数据进行通信呢;这种需求应该是属于多stream情形吧,stream1(执行异步解码)、stream2(执行异步推理),请问是否有这种情形下的样例呢?
是Ascend中的吗,怎么用呢,能指导下不
... 查看全部