[问题求助]
TransData算子是什么功能的,能否优化性能
请问下,这个TransData是什么算子,将近占了训练总耗时的50%,我代码里并没有使用这个,文档上也查不到这个算子的信息
看到好多地方,BN算子等或者一些卷积,都调用了这个
有么有啥办法优化一下
在此一键设置昵称,即可参与社区互动!
发表于2021年02月23日 11:17:07
直达本楼层的链接
沙发
显示全部楼层
您好,欢迎您的提问。 正在定位问题原因,会尽快给您答复。 |
|
transdata算子出现的场景是:如果网络中相互连接的算子使用的数据格式不一致(如NC1HWC0),框架就会自动插入transdata算子使其转换成一致的数据格式,然后再进行计算。 可以考虑训练的时候用我们的amp做混合精度,这样能减少一些fp32的运算,应该能减少一些transdata算子的调用。 |
|