他的回复:
我现在项目中有使用多个模型同时进行推理,每个模型实例对应一个stream,而且 aclmdlExecuteAsync和aclrtSynchronizeStream 在不同线程中进行调用。但是sample中是多次调用aclmdlExecuteAsync后再aclrtSynchronizeStream,和我项目中场景不一样。sample中的方式是否是更高效的?如果我把所有的模型实例对应同一个stream,然后aclmdlExecuteAsync传同一个stream和不同的modelId,最后再aclrtSynchronizeStream会更好?