- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

【2023 · CANN训练营第一季】——模型推理时数据预处理方法及归一化参数计算

dayao 发表于 2023/03/31 00:46:53 2023/03/31

【摘要】对待推理图片执行模型推理前，需要对图片进行预处理，以满足模型的输入要求。我们可以通过阅读模型训练代码，查看预处理的方法。本文比较了OpenCV、AIPP、DVPP这三种方式的特点，实际应用中会混合使用，结合训练营的sample进行了分析。本文还介绍了AIPP做减均值/乘系数的参数时如何计算的

前言：

对待推理图片执行模型推理前，需要对图片进行预处理，以满足模型的输入要求。我们可以通过阅读模型训练代码，查看预处理的方法。在做基于Ascend CL模型推理时，通常使用的有OpenCV、AIPP、DVPP这三种方式，或者是它们的混合方式，本文比较了这三种方式的特点，并以Resnet50的pytorch模型为例，结合训练营提供的sample，说明了分别是如何实现预处理的。本文还介绍了AIPP做减均值/乘系数的参数是如何计算的。

一、查找模型训练时的预处理方式

这一步对我这样的新手有些难度，在训练营可以直接问授课老师，或者是无所不晓的老班（帅高），亦或是无所不能的小助手😊

以Resnet50的pytorch模型为例，这里模型需要的数据预处理方法，再讲述两种查找方法。

Resnet50模型，需要对待推理图片的数据预处理是：缩放到224*224；以RGB的顺序存放；对像素/255.0，变换到[0.0，1.0]范围内；再按三个通道，分别做减均值，乘系数的运算，三个通道的均值是[0.485, 0.456, 0.406]，对应系数分别是：[0.229, 0.224, 0.225]。

1、方法一：在昇腾官方的modelzoo去查。https://gitee.com/ascend/modelzoo

然后选择用于训练的模型PyTorch目录

在搜索框中，输入Resnet50，找到对应的模型文件

然后在modelarts / train_start.py里查到的处理代码如下：

2、方法二：到pytorch官网去查

https://pytorch.org/vision/stable/models/generated/torchvision.models.resnet50.html#torchvision.models.resnet50

二、数据预处理的方式

确定好了输入图片需要做哪些预处理，接下来就需要选择合适的实现方式。Ascend CL常用的有三种：Opencv、AIPP、DVPP。这三种方式的特点如下表所示：

本次训练营，勤劳的小虎老师贴心的给大家准备了三种方式，供大家学习和掌握。代码在：https://gitee.com/ascend/samples/tree/master/inference/modelInference。分别是：纯open CV；CV+AIPP；DVPP+AIPP。如下表所示：

1、CV方式：sampleResnetQuickStart

2、cv+AIPP方式：sampleResnetAIPP.cpp

3、DVPP+AIPP方式：sampleResnetDVPP

三、减均值/乘系数用AIPP实现的计算

Pytorch官方的计算方法：

1、将图像数据调整到[0.0, 1.0]之间，相当于（/255.0）——torchvision.transforms.ToTensor

2、将数据x = (x - mean(x))/std(x)——torchvision.transforms.Normalize

用数学公式表达：

pixel_out_chx(i)=[pixel_in_chx(i)/255 - mean_i]/std_i

=[pixel_in_ch(i) - mean_i*255]/(255*std_i) （公式一）

注：pixel_out_chx（i）：计算输出值；

pixel_in_chx(i)：原始像素值，取值范围[0, 255]；

mean_i：均值，3个颜色通道分别取：[0.485, 0.456, 0.406]

std_i：系数，3个颜色通道分别取：[0.229, 0.224, 0.225]

AIPP减均值乘系数的计算公式：

pixel_out_chx(i)=[pixel_in_chx(i)-mean_chn_i-min_chn_i]*var_reci_chn （公式二）

注：pixel_out_chx（i）：计算输出值；

pixel_in_chx(i)：原始像素值，取值范围[0, 255]；

mean_chn_i表示每个通道的均值；

min_chn_i表示每个通道的最小值；

var_reci_chn表示每个通道方差的倒数

mean_chn_i和min_chn_i可以任意使用1个，另一个为0。令mean_chn_i=0，

公式一和公式二的像素经过计算后的值相等，所以公式的右边也相等，计算可得出：

min_chn_i = mean_i*255

var_reci_chn = 1/(255*std_i)

三个通道的计算如下：

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

【2023 · CANN训练营第一季】——模型推理时数据预处理方法及归一化参数计算

前言：

一、查找模型训练时的预处理方式

二、数据预处理的方式

1、CV方式：sampleResnetQuickStart

2、cv+AIPP方式：sampleResnetAIPP.cpp​

3、DVPP+AIPP方式：sampleResnetDVPP

三、减均值/乘系数 用AIPP实现的计算

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

推荐阅读

相关产品

2、cv+AIPP方式：sampleResnetAIPP.cpp

三、减均值/乘系数用AIPP实现的计算