- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

PaddleOCR推理的昇腾迁移

FeiGe 发表于 2024/08/22 10:54:21 2024/08/22

【摘要】本文以PaddleOCR的模型推理为例，介绍如何将PaddleOCR模型的推理迁移至ModelArts的昇腾环境上，并部署成AI应用和在线服务。

实验背景

本文以PaddleOCR的模型推理为例，介绍如何将PaddleOCR模型的推理迁移至ModelArts的昇腾环境上，并部署成AI应用和在线服务。

任务一：环境准备

步骤1 进入ModelArts管理控制台

可以通过如下链接进入ModelArts管理控制台：https://console.huaweicloud.com/modelarts/?region=cn-southwest-2&locale=zh-cn#/dashboard。

此外，您也可以在控制台点击左上角“服务列表”，在“人工智能”服务下点击“ModelArts”进入ModelArts管理控制台。

进入到ModelArts管理控制台后，请确认区域是否为“贵阳一”，如果不是，请选择“西南-贵阳一”。

步骤2 创建Notebook

在ModelArts管理控制台左侧导航栏中选择“开发环境 > Notebook”，进入“Notebook”管理页面。

单击“创建”按钮，进入“创建Notebook”页面。

在创建notebook页面，按照如下参数进行配置（均为默认参数无需修改）：

名称：notebook-ppocr

自动停止：开启，1小时

镜像：“公共镜像”，选择“mindspore_2.2.0-cann_7.0.1-py_3.9-euler_2.10.7-aarch64-snt9b”

资源类型：公共资源池

类型：ASCEND

规格：Ascend: 1ascend-snt9b(32G)|ARM: 24核 192GB 或者 Ascend: 1ascend-snt9b1|ARM: 24核 192GB

存储配置：云硬盘EVS，5G

SSH远程开发：不开启

点击“立即创建”，确认产品规格后点击“提交”，并点击“立即返回”。

此时，notebook正在创建中，创建时长大约1分钟左右。待notebook状态变为“运行中”，点击该notebook实例右侧“打开”，即可进入到jupyterlab环境中。

步骤3 学习Notebook操作

进入Notebook页面后，在打开的notebook页面左上角点击“+”号，点击Notebook进行创建，双击下方新的的Untitled.ipynb文件，弹出代码开发界面，如下图：

在notebook内的一些基本操作，例如新建文件夹、从本地上传文件、刷新目录、新建terminal等：

任务二：PaddleOCR推理

OCR的推理流程：①对输入图片中的文本框进行检测；②对检测到的文本框进行方向分类并纠正；③对纠正过方向的文本框进行文字识别。因此一个完整的OCR pipeline包含了检测模型、分类器和识别模型。本实验中的检测模型使用 ch_PP-OCRv4_server_det，识别模型使用 ch_PP-OCRv4_server_rec，不使用方向分类模型。

步骤1 下载代码并安装依赖

在 /home/ma-user/work目录下，新建一个 jupyter代码环境，然后可以选择方式一或方式二准备代码
方式一：在notebook中执行如下代码，将拉取PaddleOCR的官方代码（大约耗时2分钟）

输入：

!git clone -b main https://gitee.com/paddlepaddle/PaddleOCR.git
%cd /home/ma-user/work/PaddleOCR
# 为确保一致的代码环境，可以切换到指定的commit-id
!git reset --hard 433677182

输出：

Cloning into 'PaddleOCR'...
remote: Enumerating objects: 50663, done.
remote: Counting objects: 100% (1887/1887), done.
remote: Compressing objects: 100% (1173/1173), done.
remote: Total 50663 (delta 826), reused 1668 (delta 673), pack-reused 48776
Receiving objects: 100% (50663/50663), 382.59 MiB | 679.00 KiB/s, done.
Resolving deltas: 100% (35192/35192), done.
Updating files: 100% (2448/2448), done.
/home/ma-user/work/PaddleOCR
HEAD is now at 43367718 fix opencv import error for numpy 2.0 (#13105)

方式二（推荐）：为避免下文对PaddleOCR的代码修改，也可以选择直接从OBS下载，在notebook中执行如下代码

输入：

import moxing as mox
mox.file.copy_parallel("obs://dtse-model-guiyangyi/course/paddle_ocr/PaddleOCR", "PaddleOCR")

输出：

INFO:root:Using MoXing-v2.2.3.2c7f2141-2c7f2141
INFO:root:Using OBS-Python-SDK-3.20.9.1
INFO:root:Using OBS-C-SDK-2.23.1
INFO:root:An exception occurred in function copy_parallel_c: /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages/moxing/framework/file/csrc/obs/lib/aarch64/libobs_cxx.so: cannot open shared object file: No such file or directory
INFO:root:load shared library failed, retry with copy parallel python
INFO:root:Multiprocessing connection patch for bpo-17560 not applied, not an applicable Python version: 3.9.10 | packaged by conda-forge | (main, Feb  1 2022, 21:53:27)
[GCC 9.4.0]
INFO:root:Listing OBS: 1000
INFO:root:Listing OBS: 2000
INFO:root:List OBS time cost: 4.35 seconds.
INFO:root:1000/1925
INFO:root:Copy parallel total time cost: 8.13 seconds.

PaddleOCR代码目录说明：
- 主要使用： tools/infer目录下的OCR推理文件，以及 doc目录下测试图片 imgs和字体文件 fonts

在notebook中执行如下命令，将安装第三方依赖

输入：

%cd /home/ma-user/work/PaddleOCR
!pip install -r requirements.txt
!pip install paddlepaddle==2.6.1 paddle2onnx==1.2.4

输出：

/home/ma-user/work/PaddleOCR
Looking in indexes: http://pip.modelarts.private.com:8888/repository/pypi/simple
Requirement already satisfied: shapely in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from -r requirements.txt (line 1)) (2.0.2)
Requirement already satisfied: scikit-image in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from -r requirements.txt (line 2)) (0.21.0)
Requirement already satisfied: imgaug in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from -r requirements.txt (line 3)) (0.4.0)
Collecting pyclipper
  Downloading http://pip.modelarts.private.com:8888/repository/pypi/packages/pyclipper/1.3.0.post5/pyclipper-1.3.0.post5-cp39-cp39-manylinux_2_17_aarch64.manylinux2014_aarch64.whl (925 kB)
     |████████████████████████████████| 925 kB 44.3 MB/s eta 0:00:01
Collecting lmdb
  Downloading http://pip.modelarts.private.com:8888/repository/pypi/packages/lmdb/1.5.1/lmdb-1.5.1.tar.gz (881 kB)
     |████████████████████████████████| 881 kB 61.6 MB/s eta 0:00:01
Requirement already satisfied: tqdm in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from -r requirements.txt (line 6)) (4.66.1)
Requirement already satisfied: numpy<2.0 in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from -r requirements.txt (line 7)) (1.22.0)
Collecting rapidfuzz
  Downloading http://pip.modelarts.private.com:8888/repository/pypi/packages/rapidfuzz/3.9.4/rapidfuzz-3.9.4-cp39-cp39-manylinux_2_17_aarch64.manylinux2014_aarch64.whl (1.6 MB)
     |████████████████████████████████| 1.6 MB 37.8 MB/s eta 0:00:01
Requirement already satisfied: opencv-python in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from -r requirements.txt (line 9)) (4.8.0.76)
Collecting opencv-contrib-python
  Downloading http://pip.modelarts.private.com:8888/repository/pypi/packages/opencv-contrib-python/4.10.0.84/opencv_contrib_python-4.10.0.84-cp37-abi3-manylinux_2_17_aarch64.manylinux2014_aarch64.whl (47.4 MB)
     |████████████████████████████████| 47.4 MB 56.7 MB/s eta 0:00:01
Requirement already satisfied: cython in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from -r requirements.txt (line 11)) (3.0.2)
Requirement already satisfied: Pillow in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from -r requirements.txt (line 12)) (10.0.1)
Requirement already satisfied: pyyaml in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from -r requirements.txt (line 13)) (6.0.1)
Requirement already satisfied: requests in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from -r requirements.txt (line 14)) (2.27.1)
Requirement already satisfied: imageio in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from imgaug->-r requirements.txt (line 3)) (2.33.1)
Requirement already satisfied: matplotlib in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from imgaug->-r requirements.txt (line 3)) (3.5.1)
Requirement already satisfied: six in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from imgaug->-r requirements.txt (line 3)) (1.16.0)
Requirement already satisfied: scipy in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from imgaug->-r requirements.txt (line 3)) (1.10.1)
Requirement already satisfied: lazy_loader>=0.2 in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from scikit-image->-r requirements.txt (line 2)) (0.3)
Requirement already satisfied: networkx>=2.8 in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from scikit-image->-r requirements.txt (line 2)) (3.2.1)
Requirement already satisfied: PyWavelets>=1.1.1 in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from scikit-image->-r requirements.txt (line 2)) (1.4.1)
Requirement already satisfied: tifffile>=2022.8.12 in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from scikit-image->-r requirements.txt (line 2)) (2023.12.9)
Requirement already satisfied: packaging>=21 in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from scikit-image->-r requirements.txt (line 2)) (23.2)
Requirement already satisfied: charset-normalizer~=2.0.0 in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from requests->-r requirements.txt (line 14)) (2.0.12)
Requirement already satisfied: idna<4,>=2.5 in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from requests->-r requirements.txt (line 14)) (2.10)
Requirement already satisfied: certifi>=2017.4.17 in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from requests->-r requirements.txt (line 14)) (2023.11.17)
Requirement already satisfied: urllib3<1.27,>=1.21.1 in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from requests->-r requirements.txt (line 14)) (1.26.7)
Requirement already satisfied: python-dateutil>=2.7 in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from matplotlib->imgaug->-r requirements.txt (line 3)) (2.8.2)
Requirement already satisfied: kiwisolver>=1.0.1 in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from matplotlib->imgaug->-r requirements.txt (line 3)) (1.4.5)
Requirement already satisfied: cycler>=0.10 in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from matplotlib->imgaug->-r requirements.txt (line 3)) (0.12.1)
Requirement already satisfied: fonttools>=4.22.0 in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from matplotlib->imgaug->-r requirements.txt (line 3)) (4.47.0)
Requirement already satisfied: pyparsing>=2.2.1 in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from matplotlib->imgaug->-r requirements.txt (line 3)) (3.1.1)
Building wheels for collected packages: lmdb
  Building wheel for lmdb (setup.py) ... done
  Created wheel for lmdb: filename=lmdb-1.5.1-cp39-cp39-linux_aarch64.whl size=119128 sha256=a8131b59f335ee2e8f1d72f88bdf002c82746032dfa458bad76fd8b654760ca9
  Stored in directory: /home/ma-user/.cache/pip/wheels/44/25/6a/3b016d67df9564aeec95808128a3230cf8fd8c88f0e94d77f3
Successfully built lmdb
Installing collected packages: rapidfuzz, pyclipper, opencv-contrib-python, lmdb
Successfully installed lmdb-1.5.1 opencv-contrib-python-4.10.0.84 pyclipper-1.3.0.post5 rapidfuzz-3.9.4
WARNING: You are using pip version 21.0.1; however, version 24.1.2 is available.
You should consider upgrading via the '/home/ma-user/anaconda3/envs/MindSpore/bin/python3.9 -m pip install --upgrade pip' command.
Looking in indexes: http://pip.modelarts.private.com:8888/repository/pypi/simple
Collecting paddlepaddle==2.6.1
  Downloading http://pip.modelarts.private.com:8888/repository/pypi/packages/paddlepaddle/2.6.1/paddlepaddle-2.6.1-cp39-cp39-manylinux2014_aarch64.whl (74.2 MB)
     |████████████████████████████████| 74.2 MB 43.3 MB/s eta 0:00:01    |█▊                              | 4.0 MB 43.3 MB/s eta 0:00:02     |████████                        | 18.7 MB 43.3 MB/s eta 0:00:02
Collecting paddle2onnx==1.2.4
  Downloading http://pip.modelarts.private.com:8888/repository/pypi/packages/paddle2onnx/1.2.4/paddle2onnx-1.2.4-cp39-cp39-manylinux_2_17_aarch64.manylinux2014_aarch64.whl (3.6 MB)
     |████████████████████████████████| 3.6 MB 34.7 MB/s eta 0:00:01
Requirement already satisfied: onnxruntime>=1.10.0 in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from paddle2onnx==1.2.4) (1.15.1)
Collecting opt-einsum==3.3.0
  Downloading http://pip.modelarts.private.com:8888/repository/pypi/packages/opt-einsum/3.3.0/opt_einsum-3.3.0-py3-none-any.whl (65 kB)
     |████████████████████████████████| 65 kB 44.2 MB/s eta 0:00:01
Requirement already satisfied: decorator in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from paddlepaddle==2.6.1) (4.4.1)
Requirement already satisfied: numpy>=1.13 in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from paddlepaddle==2.6.1) (1.22.0)
Collecting astor
  Downloading http://pip.modelarts.private.com:8888/repository/pypi/packages/astor/0.8.1/astor-0.8.1-py2.py3-none-any.whl (27 kB)
Requirement already satisfied: Pillow in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from paddlepaddle==2.6.1) (10.0.1)
Requirement already satisfied: httpx in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from paddlepaddle==2.6.1) (0.26.0)
Requirement already satisfied: protobuf>=3.20.2 in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from paddlepaddle==2.6.1) (3.20.2)
Requirement already satisfied: flatbuffers in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from onnxruntime>=1.10.0->paddle2onnx==1.2.4) (23.5.26)
Requirement already satisfied: coloredlogs in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from onnxruntime>=1.10.0->paddle2onnx==1.2.4) (15.0.1)
Requirement already satisfied: packaging in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from onnxruntime>=1.10.0->paddle2onnx==1.2.4) (23.2)
Requirement already satisfied: sympy in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from onnxruntime>=1.10.0->paddle2onnx==1.2.4) (1.4)
Requirement already satisfied: humanfriendly>=9.1 in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from coloredlogs->onnxruntime>=1.10.0->paddle2onnx==1.2.4) (10.0)
Requirement already satisfied: sniffio in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from httpx->paddlepaddle==2.6.1) (1.3.0)
Requirement already satisfied: idna in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from httpx->paddlepaddle==2.6.1) (2.10)
Requirement already satisfied: httpcore==1.* in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from httpx->paddlepaddle==2.6.1) (1.0.2)
Requirement already satisfied: certifi in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from httpx->paddlepaddle==2.6.1) (2023.11.17)
Requirement already satisfied: anyio in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from httpx->paddlepaddle==2.6.1) (4.2.0)
Requirement already satisfied: h11<0.15,>=0.13 in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from httpcore==1.*->httpx->paddlepaddle==2.6.1) (0.14.0)
Requirement already satisfied: typing-extensions>=4.1 in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from anyio->httpx->paddlepaddle==2.6.1) (4.9.0)
Requirement already satisfied: exceptiongroup>=1.0.2 in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from anyio->httpx->paddlepaddle==2.6.1) (1.2.0)
Requirement already satisfied: mpmath>=0.19 in /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages (from sympy->onnxruntime>=1.10.0->paddle2onnx==1.2.4) (1.3.0)
Installing collected packages: opt-einsum, astor, paddlepaddle, paddle2onnx
Successfully installed astor-0.8.1 opt-einsum-3.3.0 paddle2onnx-1.2.4 paddlepaddle-2.6.1
WARNING: You are using pip version 21.0.1; however, version 24.1.2 is available.
You should consider upgrading via the '/home/ma-user/anaconda3/envs/MindSpore/bin/python3.9 -m pip install --upgrade pip' command.

步骤2 准备推理模型

本步骤将下载原始的 *.pdmodel模型文件，先将其转换为 onnx模型，然后再转换为昇腾推理模型 mindir。

下载paddle模型

在notebook中新建一个cell，然后执行如下命令，将下载 *.pdmodel模型至 ~/work/inference目录下

输入：

!mkdir /home/ma-user/work/inference
%cd /home/ma-user/work/inference
!echo "Stage1 -- Downloading Inference Models ..."
!wget -nc https://paddleocr.bj.bcebos.com/PP-OCRv4/chinese/ch_PP-OCRv4_det_server_infer.tar
!tar -xf ch_PP-OCRv4_det_server_infer.tar

!wget -nc https://paddleocr.bj.bcebos.com/PP-OCRv4/chinese/ch_PP-OCRv4_rec_server_infer.tar
!tar -xf ch_PP-OCRv4_rec_server_infer.tar

输出：

/home/ma-user/work/inference
Stage1 -- Downloading Inference Models ...
--2024-07-29 17:40:26--  https://paddleocr.bj.bcebos.com/PP-OCRv4/chinese/ch_PP-OCRv4_det_server_infer.tar
Resolving proxy-notebook.modelarts.com (proxy-notebook.modelarts.com)... 192.168.0.33
Connecting to proxy-notebook.modelarts.com (proxy-notebook.modelarts.com)|192.168.0.33|:8083... connected.
Proxy request sent, awaiting response... 200 OK
Length: 113479680 (108M) [application/x-tar]
Saving to: ‘ch_PP-OCRv4_det_server_infer.tar’

ch_PP-OCRv4_det_ser 100%[===================>] 108.22M  9.41MB/s    in 11s

2024-07-29 17:40:38 (9.66 MB/s) - ‘ch_PP-OCRv4_det_server_infer.tar’ saved [113479680/113479680]

--2024-07-29 17:40:39--  https://paddleocr.bj.bcebos.com/PP-OCRv4/chinese/ch_PP-OCRv4_rec_server_infer.tar
Resolving proxy-notebook.modelarts.com (proxy-notebook.modelarts.com)... 192.168.0.33
Connecting to proxy-notebook.modelarts.com (proxy-notebook.modelarts.com)|192.168.0.33|:8083... connected.
Proxy request sent, awaiting response... 200 OK
Length: 92385280 (88M) [application/x-tar]
Saving to: ‘ch_PP-OCRv4_rec_server_infer.tar’

ch_PP-OCRv4_rec_ser 100%[===================>]  88.11M  9.00MB/s    in 11s

2024-07-29 17:40:50 (8.18 MB/s) - ‘ch_PP-OCRv4_rec_server_infer.tar’ saved [92385280/92385280]

paddle2onnx

参考：PaddleOCR/deploy/paddle2onnx/readme.md

在notebook中执行如下命令，将检测和识别的模型均转换为onnx模型，并保存在 ~/work/inference目录下

输入：

%cd /home/ma-user/work
!echo "Stage2 -- Convert Models to ONNX by \`paddle2onnx\`"
!paddle2onnx --model_dir inference/ch_PP-OCRv4_det_server_infer \
    --model_filename inference.pdmodel \
    --params_filename inference.pdiparams \
    --save_file inference/det/model.onnx \
    --opset_version 11 \
    --enable_onnx_checker True

!paddle2onnx --model_dir inference/ch_PP-OCRv4_rec_server_infer \
    --model_filename inference.pdmodel \
    --params_filename inference.pdiparams \
    --save_file inference/rec/model.onnx \
    --opset_version 11 \
    --enable_onnx_checker True

输出：

/home/ma-user/work
Stage2 -- Convert Models to ONNX by `paddle2onnx`
[Paddle2ONNX] Start to parse PaddlePaddle model...
[Paddle2ONNX] Model file path: inference/ch_PP-OCRv4_det_server_infer/inference.pdmodel
[Paddle2ONNX] Parameters file path: inference/ch_PP-OCRv4_det_server_infer/inference.pdiparams
[Paddle2ONNX] Start to parsing Paddle model...
[Paddle2ONNX] Use opset_version = 11 for ONNX export.
[Paddle2ONNX] PaddlePaddle model is exported as ONNX format now.
[Paddle2ONNX] Start to parse PaddlePaddle model...
[Paddle2ONNX] Model file path: inference/ch_PP-OCRv4_rec_server_infer/inference.pdmodel
[Paddle2ONNX] Parameters file path: inference/ch_PP-OCRv4_rec_server_infer/inference.pdiparams
[Paddle2ONNX] Start to parsing Paddle model...
[Paddle2ONNX] Use opset_version = 11 for ONNX export.
[Paddle2ONNX] PaddlePaddle model is exported as ONNX format now.

注意：这里 paddle2onnx命令转换的模型，默认输入为动态shape
- 例如，检测模型输入为 x:[-1,3,-1,-1]，识别模型输入为 x:[-1,3,48,-1]，表示输入名称为 x且同时支持动态batch和动态分辨率
- 如何重新指定模型的动态shape：①可以通过 paddle2onnx.optimize的 --input_shape_dict指定，②也可以在 onnx2mindir阶段，使用配置文件中 input_shape_range参数指定，见示例
示例①：paddle2onnx指定模型的动态shape（仅供参考无需运行）

python3 -m paddle2onnx.optimize \
    --input_model inference/det/model.onnx \
    --output_model inference/det/model_demo.onnx \
    --input_shape_dict "{'x': [1,3,640,-1]}"

onnx2mindir

本节主要使用 converter_lite工具将onnx推理模型转换为 mindir格式，它可以针对NPU或GPU做专门的优化从而提升推理性能。

参考官网文档：https://www.mindspore.cn/lite/docs/zh-CN/r2.3.0rc2/use/cloud_infer/converter_tool.html

在notebook中执行如下命令，将使用 converter_lite工具将检测和识别模型分别转换为 mindir格式（大约耗时10分钟）

输入：

%cd /home/ma-user/work
!echo "Stage3 -- Convert Models to MINDIR by \`converter_lite\`"
!converter_lite --fmk=ONNX \
    --saveType=MINDIR \
    --optimize=ascend_oriented \
    --modelFile=inference/det/model.onnx \
    --outputFile=inference/det/model

!converter_lite --fmk=ONNX \
    --saveType=MINDIR \
    --optimize=ascend_oriented \
    --modelFile=inference/rec/model.onnx \
    --outputFile=inference/rec/model

输出：

/home/ma-user/work
Stage3 -- Convert Models to MINDIR by `converter_lite`
[WARNING] LITE(23190,ffffab316010,converter_lite):2024-07-29-17:42:48.077.738 [mindspore/lite/build/tools/converter/parser/onnx/onnx_op_parser.cc:1409] GetConvChannel] not find node: conv2d_0.w_0
[WARNING] LITE(23190,ffffab316010,converter_lite):2024-07-29-17:42:48.077.927 [mindspore/lite/build/tools/converter/parser/onnx/onnx_op_parser.cc:1409] GetConvChannel] not find node: conv2d_1.w_0
...
[WARNING] LITE(23190,ffffab316010,converter_lite):2024-07-29-17:42:48.087.483 [mindspore/lite/build/tools/converter/parser/onnx/onnx_op_parser.cc:1409] GetConvChannel] not find node: conv2d_105.w_0
[WARNING] LITE(23190,ffffab316010,converter_lite):2024-07-29-17:42:48.087.589 [mindspore/lite/build/tools/converter/parser/onnx/onnx_op_parser.cc:1660] Parse] parsing of channelIn/Out is delayed.
[WARNING] LITE(23190,ffffab316010,converter_lite):2024-07-29-17:42:48.087.698 [mindspore/lite/build/tools/converter/parser/onnx/onnx_op_parser.cc:1660] Parse] parsing of channelIn/Out is delayed.
[WARNING] LITE(23190,ffffab316010,converter_lite):2024-07-29-17:42:48.087.821 [mindspore/lite/build/tools/converter/parser/onnx/onnx_op_parser.cc:1409] GetConvChannel] not find node: conv2d_107.w_0
[WARNING] LITE(23190,ffffab316010,converter_lite):2024-07-29-17:42:48.087.918 [mindspore/lite/build/tools/converter/parser/onnx/onnx_op_parser.cc:1409] GetConvChannel] not find node: conv2d_108.w_0
[WARNING] LITE(23190,ffffab316010,converter_lite):2024-07-29-17:42:49.243.821 [mindspore/lite/tools/converter/adapter/acl/mapper/primitive_mapper.cc:66] AttrAdjust] GlobalAveragePool has no attr kernel_size
...
/usr/local/Ascend/ascend-toolkit/latest/python/site-packages/tbe/dsl/unify_schedule/extract_image_patches_without_cbuf_schedule.py:317: SyntaxWarning: "is not" with a literal. Did you mean "!="?
  if _ is not 1:
...
/usr/local/Ascend/ascend-toolkit/latest/python/site-packages/tbe/dsl/unify_schedule/extract_image_patches_without_cbuf_schedule.py:317: SyntaxWarning: "is not" with a literal. Did you mean "!="?
  if _ is not 1:
CONVERT RESULT SUCCESS:0
[WARNING] LITE(35984,ffff81bca010,converter_lite):2024-07-29-17:45:47.372.823 [mindspore/lite/build/tools/converter/parser/onnx/onnx_op_parser.cc:1409] GetConvChannel] not find node: conv2d_0.w_0
[WARNING] LITE(35984,ffff81bca010,converter_lite):2024-07-29-17:45:47.373.004 [mindspore/lite/build/tools/converter/parser/onnx/onnx_op_parser.cc:1409] GetConvChannel] not find node: conv2d_1.w_0
...
[WARNING] LITE(35984,ffff81bca010,converter_lite):2024-07-29-17:45:48.347.334 [mindspore/lite/tools/converter/adapter/acl/mapper/primitive_mapper.cc:66] AttrAdjust] GlobalAveragePool has no attr kernel_size
[WARNING] LITE(35984,ffff81bca010,converter_lite):2024-07-29-17:45:48.348.056 [mindspore/lite/tools/converter/adapter/acl/mapper/primitive_mapper.cc:66] AttrAdjust] GlobalAveragePool has no attr kernel_size
...
/usr/local/Ascend/ascend-toolkit/latest/python/site-packages/tbe/dsl/unify_schedule/extract_image_patches_without_cbuf_schedule.py:317: SyntaxWarning: "is not" with a literal. Did you mean "!="?
  if _ is not 1:
...
/usr/local/Ascend/ascend-toolkit/latest/python/site-packages/tbe/dsl/unify_schedule/extract_image_patches_without_cbuf_schedule.py:317: SyntaxWarning: "is not" with a literal. Did you mean "!="?
  if _ is not 1:
Warning: set_tiling_params does not take effect because get_op_mode is dynamic
Warning: set_tiling_params does not take effect because get_op_mode is dynamic
Warning: set_tiling_params does not take effect because get_op_mode is dynamic
Warning: set_tiling_params does not take effect because get_op_mode is dynamic
CONVERT RESULT SUCCESS:0

出现 CONVERT RESULT SUCCESS:0，表示转换成功。转换之后的模型如下：

示例②：onnx2mindir指定模型的动态shape（仅供参考无需运行）

CONFIG_FILE=config_demo.conf
echo "[acl_build_options]" > $CONFIG_FILE
echo "input_format=NCHW" >> $CONFIG_FILE
echo "input_shape_range=x:[1,3,640,-1]" >> $CONFIG_FILE
converter_lite --fmk=ONNX --saveType=MINDIR \
    --optimize=ascend_oriented \
    --modelFile=inference/det/model.onnx \
    --outputFile=inference/det/model_demo \
    --configFile=$CONFIG_FILE

步骤3 适配推理代码

PaddleOCR原始代码不支持使用 mindir模型格式进行推理，本实验的推理适配复用了PaddleOCR的前处理和后处理逻辑，主要涉及 PaddleOCR/tools/infer目录下4个代码文件的修改：

注意：如果步骤1选择直接从OBS下载适配好的PaddleOCR代码，则跳过此步骤即可。

utility.py

在 init_args函数，新增 --use_mindir，用于指示开启mindir推理

parser.add_argument("--use_mindir", type=str2bool, default=False)

在 create_perdictor函数中，大约 214行的位置，新增mindir模型的初始化逻辑，这部分代码检测/识别/分类共用

if args.use_onnx:
    ...
elif args.use_mindir:  # for ascend inference
    import mindspore_lite as mslite

    model_file_path = model_dir
    if not os.path.exists(model_file_path):
        raise ValueError("not find model file path {}".format(model_file_path))

    # init context, and set target is ascend.
    context = mslite.Context()
    context.target = ["ascend"]     # cpu/gpu/ascend
    context.ascend.device_id = args.gpu_id  # default to 0
    # context.ascend.provider = "ge"
    model = mslite.Model()
    model.build_from_file(model_file_path, mslite.ModelType.MINDIR, context)
    return model, model.get_inputs(), None, None
else:
    ...

predict_det.py

在 __init__函数中，保存 args.use_mindir的值，即：

self.use_mindir = args.use_mindir

在 TextDetector -- predict函数中，大约 254行的位置，新增使用mindir模型推理的逻辑

if self.use_onnx:
    ...
elif self.use_mindir:   # for ascend inference
    self.predictor.resize(self.input_tensor, [img.shape])   # dynamic shape
    inputs = self.predictor.get_inputs()
    inputs[0].set_data_from_numpy(img)
    # execute inference
    outputs = self.predictor.predict(inputs)
    outputs = [o.get_data_to_numpy() for o in outputs]
else:
    self.input_tensor.copy_from_cpu(img)
    ...

predict_rec.py

在 __init__函数中，保存 args.use_mindir的值
在 TextRecognizer -- __call__函数中，大约 676行的位置，新增使用mindir模型推理的逻辑

if self.use_onnx:
    ...
elif self.use_mindir:   # for ascend inference
    self.predictor.resize(self.input_tensor, [norm_img_batch.shape])
    inputs = self.predictor.get_inputs()
    inputs[0].set_data_from_numpy(norm_img_batch)
    outputs = self.predictor.predict(inputs)
    outputs = [o.get_data_to_numpy() for o in outputs]
    preds = outputs[0]
else:
    self.input_tensor.copy_from_cpu(norm_img_batch)
    ...

predict_cls.py

在 __init__函数中，保存 args.use_mindir的值
在 TextClassifier -- __call__函数中，大约 112行的位置，新增使用mindir模型推理的逻辑

if self.use_onnx:
    ...
elif self.use_mindir:   # for ascend inference
    self.predictor.resize(self.input_tensor, [norm_img_batch.shape])
    inputs = self.predictor.get_inputs()
    inputs[0].set_data_from_numpy(norm_img_batch)
    outputs = self.predictor.predict(inputs)
    outputs = [o.get_data_to_numpy() for o in outputs]
    prob_out = outputs[0]
else:
    self.input_tensor.copy_from_cpu(norm_img_batch)
    ...

步骤4 测试推理pipeline

在notebook中执行如下命令，将对 PaddleOCR/doc/imags/11.jpg图片执行检测和识别，并将结果保存在 inference_results中

注意：--image_dir支持输入目录，对目录下的所有图片做OCR推理

输入：

%cd /home/ma-user/work
!python PaddleOCR/tools/infer/predict_system.py \
    --use_mindir True --gpu_id 0 \
    --image_dir PaddleOCR/doc/imgs/11.jpg \
    --det_model_dir inference/det/model.mindir \
    --rec_model_dir inference/rec/model.mindir \
    --rec_char_dict_path PaddleOCR/ppocr/utils/ppocr_keys_v1.txt \
    --use_angle_cls False \
    --vis_font_path PaddleOCR/doc/fonts/simfang.ttf

输出：

/home/ma-user/work
[2024-07-29 17:52:18,673] [ WARNING] model.py:109 - mslite ascendc custom kernel path not found
[2024-07-29 17:52:25,511] [ WARNING] model.py:109 - mslite ascendc custom kernel path not found
[2024/07/29 17:52:29] ppocr INFO: In PP-OCRv3, rec_image_shape parameter defaults to '3, 48, 320', if you are using recognition model with PP-OCRv2 or an older version, please set --rec_image_shape='3,32,320
[WARNING] ME(51741,ffff9f6470b0,python):2024-07-29-17:52:29.030.425 [mindspore/lite/src/extendrt/kernel/ascend/src/custom_ascend_kernel.cc:168] Resize] Invalid inputs or output shapes.
[2024/07/29 17:52:29] ppocr DEBUG: dt_boxes num : 16, elapsed : 0.06305480003356934
[WARNING] ME(51741,ffff9f6470b0,python):2024-07-29-17:52:29.082.780 [mindspore/lite/src/extendrt/kernel/ascend/src/custom_ascend_kernel.cc:168] Resize] Invalid inputs or output shapes.
[2024/07/29 17:52:29] ppocr DEBUG: rec_res num  : 16, elapsed : 0.23969674110412598
[2024/07/29 17:52:29] ppocr DEBUG: 0  Predict time of PaddleOCR/doc/imgs/11.jpg: 0.310s
[2024/07/29 17:52:29] ppocr DEBUG: 纯臻营养护发素, 0.995
[2024/07/29 17:52:29] ppocr DEBUG: 产品信息/参数, 0.993
[2024/07/29 17:52:29] ppocr DEBUG: （45元/每公斤，100公斤起订）, 0.964
[2024/07/29 17:52:29] ppocr DEBUG: 每瓶22元，1000瓶起订）, 0.996
[2024/07/29 17:52:29] ppocr DEBUG: 【品牌】：代加工方式/OEMODM, 0.985
[2024/07/29 17:52:29] ppocr DEBUG: 【品名】：纯臻营养护发素, 0.998
[2024/07/29 17:52:29] ppocr DEBUG: 【产品编号】：YM-X-3011, 0.989
[2024/07/29 17:52:29] ppocr DEBUG: ODMOEM, 0.995
[2024/07/29 17:52:29] ppocr DEBUG: 【净含量】：220ml, 0.991
[2024/07/29 17:52:29] ppocr DEBUG: 【适用人群】：适合所有肤质, 0.989
[2024/07/29 17:52:29] ppocr DEBUG: 【主要成分】：鲸蜡硬脂醇、燕麦β-葡聚, 0.977
[2024/07/29 17:52:29] ppocr DEBUG: 糖、椰油酰胺丙基甜菜碱、泛醒, 0.983
[2024/07/29 17:52:29] ppocr DEBUG: （成品包材）, 0.998
[2024/07/29 17:52:29] ppocr DEBUG: 【主要功能】：可紧致头发磷层，从而达到, 0.996
[2024/07/29 17:52:29] ppocr DEBUG: 即时持久改善头发光泽的效果，给干燥的头, 0.989
[2024/07/29 17:52:29] ppocr DEBUG: 发足够的滋养, 0.998
[2024/07/29 17:52:29] ppocr DEBUG: The visualized image saved in ./inference_results/11.jpg
[2024/07/29 17:52:29] ppocr INFO: The predict total time is 0.41288328170776367

识别效果如下图：

任务三：推理性能调优–固定/分档

任务二中的OCR推理模型默认为动态shape，此时的识别效果最优，但与此同时推理速度最慢。为了进一步提升OCR的推理性能，本任务中我们将探讨动态shape、固定shape和分档shape三种情况下，推理性能和识别效果的差异。

固定shape需要对模型的输入图片进行缩放，有可能造成失真，从而劣化识别性能，适合使用在输入是固定大小图片的测试场景。分档shape支持对多种大小的输入图片进行推理，同时维持了和固定shape同样的推理性能，提供了一种权衡识别准确率和推理性能的手段。因此，可以将固定shape理解为单档shape的场景。

Lite在Ascend上推理支持动态BatchSize和动态分辨率场景，在convert阶段通过congFile配置[ascend_context]中dynamic_dims动态参数，推理时使用model的Resize功能，改变输入shape。

参考官方文档：https://www.mindspore.cn/lite/docs/zh-CN/r2.0/use/cloud_infer/converter_tool_ascend.html

注意：OCR的输入图片可以是各种大小，因此识别准确率和推理性能不可兼得。

步骤1 下载数据集

在notebook中执行如下命令，将下载用于评估识别准确率的数据集，并将图片和标注文件分别放在 data/rctw_images和 data/rctw_gts目录下：

输入：

%cd /home/ma-user/work
import moxing as mox
mox.file.copy_parallel("obs://dtse-model-guiyangyi/course/paddle_ocr/data", "data")

输出：

INFO:root:An exception occurred in function copy_parallel_c: /home/ma-user/anaconda3/envs/MindSpore/lib/python3.9/site-packages/moxing/framework/file/csrc/obs/lib/aarch64/libobs_cxx.so: cannot open shared object file: No such file or directory
INFO:root:load shared library failed, retry with copy parallel python
INFO:root:Multiprocessing connection patch for bpo-17560 not applied, not an applicable Python version: 3.9.10 | packaged by conda-forge | (main, Feb  1 2022, 21:53:27)
[GCC 9.4.0]
INFO:root:List OBS time cost: 0.37 seconds.
INFO:root:Copy parallel total time cost: 0.59 seconds.

我们选择从ICDAR 2017 RCTW的训练集中挑选4个样本用于简单评估性能，样例如下：

步骤2 准备评估代码

为了评估OCR推理的识别性能，这里我们利用RCTW2017的数据集，分别评估检测模型和识别模型的性能。其中，检测模型使用 hmean指标评估，而识别模型则使用 acc和编辑距离指标评估。需要注意的是，识别模型使用了标注的 boxes去推理，而非检测模型输出的 boxes。

除新建评估代码 evaluate.py文件外，还需要额外修改 PaddleOCR/tools/infer目录下的推理文件，来支持固定shape和分档shape的推理，修改细节如下：

注意：如果“任务二步骤1”选择直接从OBS下载适配好的PaddleOCR代码，则只需要新建 evaluate.py文件，其他代码修改可跳过。

evaluate.py

在 /home/ma-user/work目录下，新建 evaluate.py文件，并输入如下内容：


import argparse
import copy
import glob
import json
import os
from typing import Dict, List, Tuple

import cv2
import numpy as np
from numpy import ndarray

os.sys.path.append(os.path.join(os.path.dirname(__file__), "PaddleOCR"))

from tools.infer.predict_det import TextDetector
from tools.infer.predict_rec import TextRecognizer
from tools.infer.predict_system import sorted_boxes
from tools.infer.utility import get_minarea_rect_crop, get_rotate_crop_image
from tools.infer.utility import init_args as ppocr_init_args

from ppocr.metrics.det_metric import DetMetric
from ppocr.metrics.rec_metric import RecMetric
class OCRTestDataset(object):
    def __init__(self, image_dir: str, annotation_dir: str) -> None:
        super(OCRTestDataset, self).__init__()
        self.image_dir = image_dir
        self.annotation_dir = annotation_dir
        self.data_list = glob.glob(os.path.join(image_dir, "*.jpg"))
        self.data_list.sort()
        self.label_list = []
        for image_file in self.data_list:
            f = os.path.basename(image_file)
            f = f.removesuffix(".jpg") + ".txt"
            self.label_list.append(os.path.join(annotation_dir, f))

    @classmethod
    def annotation2boxes(self, annotation: List[str]) -> ndarray:
        assert len(annotation) == 8, "[annotation] error boxes"
        try:
            flatten_boxes = list(map(float, annotation))
        except ValueError:
            print(annotation)
            exit(1)
        boxes = np.array(flatten_boxes).astype(np.float32).reshape(4, 2)
        return boxes

    def __getitem__(self, index: int) -> Tuple[str, Dict[str, List]]:
        image_file = self.data_list[index]
        annotation = {"gt_boxes": [], "gt_texts": [], "ignore_tags": []}
        with open(self.label_list[index], "r", encoding="utf8") as fout:
            lines = fout.readlines()
        for line in lines:
            elements = line.strip().split(",")
            boxes = self.annotation2boxes(elements[:8])
            diffculty = int(elements[8])
            text = elements[-1].replace("\"", "")
            ignore = "###" in text
            annotation["gt_boxes"].append(boxes)
            annotation["gt_texts"].append([text, None])     # text, score
            annotation["ignore_tags"].append(ignore)
        return image_file, annotation

    def __len__(self) -> int:
        return len(self.data_list)
class InferTextSystem:
    def __init__(self, det_model: str, rec_model: str, infer_type: str, **kwargs) -> None:
        args, unknown = ppocr_init_args().parse_known_args()
        args.use_mindir = True
        if infer_type in ["frozen_shape", "multi_gear"]:
            args.mindir_frozen_shape = (infer_type == "frozen_shape")
            args.mindir_multi_gear = not args.mindir_frozen_shape
        if args.mindir_multi_gear:
            args.rec_image_shape="3,48,-1"  # use the actual `max_wh_ratio`
        args.det_model_dir = det_model
        args.rec_model_dir = rec_model
        paddle_ocr_project_path = os.path.join(os.path.dirname(__file__), 'PaddleOCR')
        args.rec_char_dict_path = os.path.join(paddle_ocr_project_path, 'ppocr/utils/ppocr_keys_v1.txt')
        args.vis_font_path = os.path.join(paddle_ocr_project_path, 'doc/fonts/simfang.ttf')

        self.paddle_ocr_project_path = paddle_ocr_project_path
        self.text_detector = TextDetector(args)
        self.text_recognizer = TextRecognizer(args)
        self.det_box_type = args.det_box_type
        self.drop_score = args.drop_score

    def detect(self, image: ndarray) -> ndarray:
        dt_boxes, elapse = self.text_detector(image)
        dt_boxes = sorted_boxes(dt_boxes)
        return dt_boxes, elapse

    def recognize(self, image: ndarray, dt_boxes: ndarray) -> List[str]:
        img_crop_list = []
        for bno in range(len(dt_boxes)):
            tmp_box = copy.deepcopy(dt_boxes[bno])
            if self.det_box_type == "quad":
                img_crop = get_rotate_crop_image(image, tmp_box)
            else:
                img_crop = get_minarea_rect_crop(image, tmp_box)
            img_crop_list.append(img_crop)
        rec_res, elapse = self.text_recognizer(img_crop_list)
        return rec_res, elapse

    def __call__(self, image_file: str):
        image = cv2.imread(image_file)
        dt_boxes, dt_elapse = self.detect(image)
        rec_res, rec_elapse = self.recognize(image, dt_boxes)
        print(dt_elapse, rec_elapse)
        filter_boxes, filter_rec_res = [], []
        for box, rec_result in zip(dt_boxes, rec_res):
            text, score = rec_result[0], rec_result[1]
            if score >= self.drop_score:
                filter_boxes.append(box)
                filter_rec_res.append(rec_result)
        return filter_boxes, filter_rec_res
class Evaluator:
    def __init__(self):
        self.det_metric = DetMetric()
        self.rec_metric = RecMetric()

    def evaluate(self, dt_boxes: List[ndarray],
                 gt_boxes: List[ndarray],
                 ignore_tags: List[bool],
                 rec_texts: List[str],
                 gt_texts: List[str], **kwargs
    ) -> Dict[str, float]:
        metrics = {}
        # box_num = len(ignore_tags)
        # gt_boxes = [gt_boxes[i] for i in range(box_num) if not ignore_tags[i]]
        points = np.stack(dt_boxes) if dt_boxes else np.zeros((0, 4, 2), dtype=np.float32)
        self.det_metric(preds=[{"points": points}],
                        batch=[None, None,
                               np.expand_dims(np.stack(gt_boxes), axis=0),
                               np.expand_dims(np.stack(ignore_tags), axis=0)]
                        )
        det_metric_results_backup = self.det_metric.results
        self.det_metric.results = [det_metric_results_backup[-1]]
        out = self.det_metric.get_metric()
        self.det_metric.results = det_metric_results_backup
        metrics.update(out)

        box_num = len(ignore_tags)
        pred_texts = [rec_texts[i] for i in range(box_num) if not ignore_tags[i]]
        label_texts = [gt_texts[i] for i in range(box_num) if not ignore_tags[i]]
        metrics.update(
            self.rec_metric([pred_texts, label_texts])
        )
        return metrics

    def get(self) -> Dict[str, float]:
        metrics = {}
        metrics.update(self.det_metric.get_metric())
        metrics.update(self.rec_metric.get_metric())
        return metrics
def init_args():
    parser = argparse.ArgumentParser()
    parser.add_argument("--dset_image_dir", type=str, default="data/rctw_images")
    parser.add_argument("--dset_annotation_dir", type=str, default="data/rctw_gts")
    parser.add_argument("--det_model", type=str, default="inference/det/model.mindir")
    parser.add_argument("--rec_model", type=str, default="inference/rec/model.mindir")
    parser.add_argument("--infer_type", type=str, default="dynamic_shape",
                        choices=["dynamic_shape", "frozen_shape", "multi_gear"])
    args = parser.parse_args()
    return args
if __name__ == "__main__":
    args = init_args()
    testset = OCRTestDataset(args.dset_image_dir, args.dset_annotation_dir)
    infer_text_system = InferTextSystem(**vars(args))
    # infer_text_system("PaddleOCR/doc/imgs/00018069.jpg")
    evaluator = Evaluator()
    results = {}
    total_det_elapse = 0
    total_rec_elapse = 0
    for i in range(len(testset)):
        image_file, labels = testset[i]
        image = cv2.imread(image_file)
        dt_boxes, dt_elapse = infer_text_system.detect(image)
        rec_texts, rec_elapse = infer_text_system.recognize(image, labels["gt_boxes"])
        metrics = evaluator.evaluate(dt_boxes=dt_boxes, rec_texts=rec_texts, **labels)
        metrics.update({"det_elapse": dt_elapse, "rec_elapse": rec_elapse})
        total_det_elapse += dt_elapse
        total_rec_elapse += rec_elapse
        results[os.path.basename(image_file)] = metrics
    results["total"] = {**evaluator.get(),
                        "det_elapse": total_det_elapse / len(testset),
                        "rec_elapse": total_rec_elapse / len(testset),
                        }
    print(json.dumps(results, indent=2))

utility.py

在 init_args函数，新增 --mindir_frozen_shape用于指示开启固定shape推理；新增 --mindir_multi_gear用于指示开启多档shape推理

    parser.add_argument("--mindir_frozen_shape", type=str2bool, default=False)
    parser.add_argument("--mindir_multi_gear", type=str2bool, default=False)

predict_det.py

在 __init__函数中，保存 args.mindir_frozen_shape和 args.mindir_multi_gear的值

self.mindir_frozen_shape = args.mindir_frozen_shape
self.mindir_multi_gear = args.mindir_multi_gear
try:
    assert not (self.mindir_frozen_shape and self.mindir_multi_gear)
except AssertionError:
    logger.warn("`mindir_frozen_shape` and `mindir_multi_gear` are both enabled, \
                defaultly, set `mindir_frozen_shape=False` to prevent errors.")
    self.mindir_frozen_shape = False

在 __init__函数中，新增前处理初始化逻辑，分别针对固定shape和多档shape，示例如下：

if self.use_onnx:
    img_h, img_w = self.input_tensor.shape[2:]
    ...
elif self.use_mindir and self.mindir_frozen_shape:
    img_h, img_w = self.input_tensor[0].shape[2:]
    assert isinstance(img_h, int) and img_h > 0, "[mindir] error frozen shape -- img_h"
    assert isinstance(img_w, int) and img_w > 0, "[mindir] error frozen shape -- img_w"
    pre_process_list[0] = {
        "DetResizeForTest": {"image_shape": [img_h, img_w]}
    }
elif self.use_mindir and self.mindir_multi_gear:
    # img_h: 320, 480, 640
    # img_w: (wh_ratios, 0.5 -> 2.0)
    pre_process_list[0] = {
        "DetResizeForTest": {"image_shape": [640, -1],
                              "keep_ratio": True}
    }
self.preprocess_op = create_operators(pre_process_list)
...

在 TextDetector -- predict函数中，修改mindir模型的resize逻辑，最小示例如下：

if self.use_onnx:
    ...
elif self.use_mindir:   # for ascend inference
    if not self.mindir_frozen_shape:    # dynamic-shape or multi-gear
        self.predictor.resize(self.input_tensor, [img.shape])
    inputs = self.predictor.get_inputs()
    inputs[0].set_data_from_numpy(img)
    # execute inference
    outputs = self.predictor.predict(inputs)
    outputs = [o.get_data_to_numpy() for o in outputs]
else:
    self.input_tensor.copy_from_cpu(img)
    ...

predict_rec.py

在 __init__函数中，保存 args.mindir_frozen_shape和 args.mindir_multi_gear的值

self.mindir_frozen_shape = args.mindir_frozen_shape
self.mindir_multi_gear = args.mindir_multi_gear
try:
    assert not (self.mindir_frozen_shape and self.mindir_multi_gear)
except AssertionError:
    logger.warn("`mindir_frozen_shape` and `mindir_multi_gear` are both enabled, \
                defaultly, set `mindir_frozen_shape=False` to prevent errors.")
    self.mindir_frozen_shape = False

在 TextDetector -- resize_norm_img函数中，新增前处理初始化逻辑，分别针对固定shape和多档shape，示例如下：

if self.use_onnx:
    w = self.input_tensor.shape[3:][0]
    ...
elif self.use_mindir and self.mindir_frozen_shape:
    w = self.input_tensor[0].shape[3]
    assert isinstance(w, int) and w > 0, "[mindir] error fronzen shape -- w"
    imgW = w
elif self.use_mindir and self.mindir_multi_gear:
    # img_h=48, img_w: 32, ..., 960
    imgW = math.ceil(imgH * max_wh_ratio / 32) * 32
h, w = img.shape[:2]
...

在 TextRecognizer -- __call__函数中，大约 579行的位置，新增填充batch-size的逻辑

norm_img_batch = np.concatenate(norm_img_batch)
norm_img_batch = norm_img_batch.copy()
# padding batch-size ===> start
if self.mindir_frozen_shape or self.mindir_multi_gear:
    padding_img_batch_size = self.rec_batch_num - len(norm_img_batch)
    padding_img_shape = norm_img_batch.shape[1:]
    paddign_img_batch = np.zeros((padding_img_batch_size, *padding_img_shape),
                                  dtype=np.float32)
    norm_img_batch = np.concatenate([norm_img_batch, paddign_img_batch], axis=0)
# padding batch-size ===> end
if self.benchmark:
    self.autolog.times.stamp()

在 TextRecognizer -- __call__函数中，大约 700行的位置，修改mindir模型的resize逻辑，最小示例如下：

if self.use_onnx:
    ...
elif self.use_mindir:   # for ascend inference
    if not self.mindir_frozen_shape:    # dynamic-shape or multi-gear
        self.predictor.resize(self.input_tensor, [norm_img_batch.shape])
    inputs = self.predictor.get_inputs()
    inputs[0].set_data_from_numpy(norm_img_batch)
    outputs = self.predictor.predict(inputs)
    outputs = [o.get_data_to_numpy() for o in outputs]
    preds = outputs[0]
    # drop results of dummy-data
    if self.mindir_frozen_shape or self.mindir_multi_gear:
        vaild_img_batch_size = self.rec_batch_num - padding_img_batch_size
        preds = preds[:vaild_img_batch_size]
else:
    self.input_tensor.copy_from_cpu(norm_img_batch)
    ...

步骤3 动态shape评估

支持动态shape的模型已在任务一中生成： inference/det/model.mindir和 inference/rec/model.mindir
在notebook中执行如下命令，将评估动态shape下模型的识别性能和推理耗时：

输入：

%cd /home/ma-user/work/
!python evaluate.py --det_model inference/det/model.mindir \
                    --rec_model inference/rec/model.mindir \
                    --infer_type dynamic_shape

输出：

/home/ma-user/work
[2024-07-29 18:11:14,197] [ WARNING] model.py:109 - mslite ascendc custom kernel path not found
[2024-07-29 18:11:21,208] [ WARNING] model.py:109 - mslite ascendc custom kernel path not found
[WARNING] ME(75276,ffff833360b0,python):2024-07-29-18:11:25.078.141 [mindspore/lite/src/extendrt/kernel/ascend/src/custom_ascend_kernel.cc:168] Resize] Invalid inputs or output shapes.
[WARNING] ME(75276,ffff833360b0,python):2024-07-29-18:11:25.134.488 [mindspore/lite/src/extendrt/kernel/ascend/src/custom_ascend_kernel.cc:168] Resize] Invalid inputs or output shapes.
{
  "image_0.jpg": {
    "precision": 1.0,
    "recall": 0.7777777777777778,
    "hmean": 0.8750000000000001,
    "acc": 0.7777769135812072,
    "norm_edit_dis": 0.9444445061727709,
    "det_elapse": 0.08648085594177246,
    "rec_elapse": 0.17359185218811035
  },
  "image_1.jpg": {
    "precision": 1.0,
    "recall": 1.0,
    "hmean": 1.0,
    "acc": 0.9999985714306123,
    "norm_edit_dis": 1.0,
    "det_elapse": 0.07720947265625,
    "rec_elapse": 0.050136566162109375
  },
  "image_1013.jpg": {
    "precision": 1.0,
    "recall": 1.0,
    "hmean": 1.0,
    "acc": 0.9999950000249999,
    "norm_edit_dis": 1.0,
    "det_elapse": 0.047595977783203125,
    "rec_elapse": 0.01030421257019043
  },
  "image_1016.jpg": {
    "precision": 1.0,
    "recall": 1.0,
    "hmean": 1.0,
    "acc": 0.9999950000249999,
    "norm_edit_dis": 1.0,
    "det_elapse": 0.0553433895111084,
    "rec_elapse": 0.010103225708007812
  },
  "total": {
    "precision": 1.0,
    "recall": 0.9,
    "hmean": 0.9473684210526316,
    "acc": 0.899999550000225,
    "norm_edit_dis": 0.9750000124999938,
    "det_elapse": 0.0666574239730835,
    "rec_elapse": 0.06103396415710449
  }
}

步骤4 固定shape评估

首先使用 converter_lite工具，将onnx模型转换为支持固定shape的 mindir模型，输出 CONVERT RESULT SUCCESS:0即表示转换成功

%cd /home/ma-user/work/
!converter_lite --fmk=ONNX \
    --saveType=MINDIR \
    --optimize=ascend_oriented \
    --modelFile=inference/det/model.onnx \
    --outputFile=inference/det/model_frozen_shape \
    --inputShape=x:1,3,640,640
!converter_lite --fmk=ONNX \
    --saveType=MINDIR \
    --optimize=ascend_oriented \
    --modelFile=inference/rec/model.onnx \
    --outputFile=inference/rec/model_frozen_shape \
    --inputShape=x:6,3,48,320

然后在notebook中执行如下命令，将评估固定shape下模型的识别性能和推理耗时：

输入：

%cd /home/ma-user/work/
!python evaluate.py --det_model inference/det/model_frozen_shape.mindir \
                    --rec_model inference/rec/model_frozen_shape.mindir \
                    --infer_type frozen_shape

输出：

/home/ma-user/work
[2024-07-29 18:15:53,058] [ WARNING] model.py:109 - mslite ascendc custom kernel path not found
[2024-07-29 18:15:54,389] [ WARNING] model.py:109 - mslite ascendc custom kernel path not found
{
  "image_0.jpg": {
    "precision": 0.75,
    "recall": 0.6666666666666666,
    "hmean": 0.7058823529411765,
    "acc": 0.7777769135812072,
    "norm_edit_dis": 0.9500000555554938,
    "det_elapse": 0.054441213607788086,
    "rec_elapse": 0.05269813537597656
  },
  "image_1.jpg": {
    "precision": 0.8571428571428571,
    "recall": 0.8571428571428571,
    "hmean": 0.8571428571428571,
    "acc": 0.9999985714306123,
    "norm_edit_dis": 1.0,
    "det_elapse": 0.04184436798095703,
    "rec_elapse": 0.03612112998962402
  },
  "image_1013.jpg": {
    "precision": 1.0,
    "recall": 1.0,
    "hmean": 1.0,
    "acc": 0.9999950000249999,
    "norm_edit_dis": 1.0,
    "det_elapse": 0.034049034118652344,
    "rec_elapse": 0.01288747787475586
  },
  "image_1016.jpg": {
    "precision": 1.0,
    "recall": 1.0,
    "hmean": 1.0,
    "acc": 0.9999950000249999,
    "norm_edit_dis": 1.0,
    "det_elapse": 0.03696155548095703,
    "rec_elapse": 0.013694524765014648
  },
  "total": {
    "precision": 0.8421052631578947,
    "recall": 0.8,
    "hmean": 0.8205128205128205,
    "acc": 0.899999550000225,
    "norm_edit_dis": 0.9775000112499944,
    "det_elapse": 0.04182404279708862,
    "rec_elapse": 0.028850317001342773
  }
}

步骤5 多档shape评估

首先在 inference目录下，新建两个配置文件 config_det.conf和 config_rec.conf，并填入如下内容：

# inference/config_det.conf
[ascend_context]
input_format=NCHW
input_shape=x:[1,3,-1,-1]
dynamic_dims=[640,480],[640,640],[640,992]

# inference/config_rec.conf
[ascend_context]
input_format=NCHW
input_shape=x:[6,3,-1,-1]
dynamic_dims=[48,160],[48,288],[48,320],[48,352],[48,416],[48,512],[48,800]

注意：这里的dynamic_dims参数可以指定模型输入的shape，最高支持1000档。对于检测模型，我们先固定height=640，假定高宽比范围为[0.5, 2]，然后在保持高宽比的情况下，将宽缩放为最接近32的倍数。对于识别模型，我们固定batch-size=6，假定高宽比范围为[0.5, 20]，以32的步长设置输入图片的宽。
然后使用 converter_lite工具，将onnx模型转换为支持多档shape的 mindir模型，输出 CONVERT RESULT SUCCESS:0即表示转换成功

%cd /home/ma-user/work/
!converter_lite --fmk=ONNX \
    --saveType=MINDIR \
    --optimize=ascend_oriented \
    --modelFile=inference/det/model.onnx \
    --outputFile=inference/det/model_multi_gear \
    --configFile=inference/config_det.conf

!converter_lite --fmk=ONNX \
    --saveType=MINDIR \
    --optimize=ascend_oriented \
    --modelFile=inference/rec/model.onnx \
    --outputFile=inference/rec/model_multi_gear \
    --configFile=inference/config_rec.conf

最后在notebook中执行如下命令，评估多档shape下模型的识别性能和推理耗时：

输入：

%cd /home/ma-user/work/
!python evaluate.py --det_model inference/det/model_multi_gear.mindir \
                    --rec_model inference/rec/model_multi_gear.mindir \
                    --infer_type multi_gear

输出：

/home/ma-user/work
[2024-07-29 18:31:22,812] [ WARNING] model.py:109 - mslite ascendc custom kernel path not found
[2024-07-29 18:31:24,821] [ WARNING] model.py:109 - mslite ascendc custom kernel path not found
{
  "image_0.jpg": {
    "precision": 1.0,
    "recall": 0.6666666666666666,
    "hmean": 0.8,
    "acc": 0.7777769135812072,
    "norm_edit_dis": 0.9444445061727709,
    "det_elapse": 0.04750823974609375,
    "rec_elapse": 0.04743814468383789
  },
  "image_1.jpg": {
    "precision": 0.8571428571428571,
    "recall": 0.8571428571428571,
    "hmean": 0.8571428571428571,
    "acc": 0.9999985714306123,
    "norm_edit_dis": 1.0,
    "det_elapse": 0.042635202407836914,
    "rec_elapse": 0.05770230293273926
  },
  "image_1013.jpg": {
    "precision": 1.0,
    "recall": 1.0,
    "hmean": 1.0,
    "acc": 0.9999950000249999,
    "norm_edit_dis": 1.0,
    "det_elapse": 0.05117201805114746,
    "rec_elapse": 0.011896610260009766
  },
  "image_1016.jpg": {
    "precision": 1.0,
    "recall": 1.0,
    "hmean": 1.0,
    "acc": 0.9999950000249999,
    "norm_edit_dis": 1.0,
    "det_elapse": 0.030267953872680664,
    "rec_elapse": 0.013908863067626953
  },
  "total": {
    "precision": 0.9411764705882353,
    "recall": 0.8,
    "hmean": 0.8648648648648648,
    "acc": 0.899999550000225,
    "norm_edit_dis": 0.9750000124999938,
    "det_elapse": 0.0428958535194397,
    "rec_elapse": 0.03273648023605347
  }
}

步骤6 结果总览

	hmean	acc	norm_edit_dis	det_elapse	rec_elapse
动态shape	0.9473	90%	0.9750	66.7ms	61.0ms
固定shape	0.8205	90%	0.9775	41.8ms	28.9ms
多档shape	0.8649	90%	0.9750	42.9ms	32.7ms

由评估结果可知，动态shape性能最好而推理耗时最高，多档shape能够在维持固定shape推理速度的同时，提高识别性能。

(MindSpore) [ma-user work]$ll inference/det/
total 378724
-r-------- 1 ma-user ma-group  59014052 Jul 30 14:24 model_frozen_shape.mindir
-r-------- 1 ma-user ma-group 150020584 Jul 30 14:11 model.mindir
-r-------- 1 ma-user ma-group  65421312 Jul 30 14:30 model_multi_gear.mindir
-rw-r----- 1 ma-user ma-group 113352102 Jul 30 14:07 model.onnx
(MindSpore) [ma-user work]$ll inference/rec/
total 289676
-r-------- 1 ma-user ma-group 47409656 Jul 30 14:26 model_frozen_shape.mindir
-r-------- 1 ma-user ma-group 99480481 Jul 30 14:15 model.mindir
-r-------- 1 ma-user ma-group 59226954 Jul 30 14:34 model_multi_gear.mindir
-rw-r----- 1 ma-user ma-group 90504445 Jul 30 14:07 model.onnx

参考资料

converter_lite工具使用：https://www.mindspore.cn/lite/docs/zh-CN/r2.3.0rc2/use/cloud_infer/converter_tool.html

动态batch和动态分辨率：https://www.mindspore.cn/lite/docs/zh-CN/r2.0/use/cloud_infer/converter_tool_ascend.html

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

PaddleOCR推理的昇腾迁移

实验背景

任务一：环境准备

步骤1 进入ModelArts管理控制台

步骤2 创建Notebook

步骤3 学习Notebook操作

任务二：PaddleOCR推理

步骤1 下载代码并安装依赖

步骤2 准备推理模型

下载paddle模型

paddle2onnx

onnx2mindir

步骤3 适配推理代码

utility.py

predict_det.py

predict_rec.py

predict_cls.py

步骤4 测试推理pipeline

任务三：推理性能调优–固定/分档

步骤1 下载数据集

步骤2 准备评估代码

evaluate.py

utility.py

predict_det.py

predict_rec.py

步骤3 动态shape评估

步骤4 固定shape评估

步骤5 多档shape评估

步骤6 结果总览

参考资料

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

PaddleOCR推理的昇腾迁移

实验背景

任务一：环境准备

步骤1 进入ModelArts管理控制台

步骤2 创建Notebook

步骤3 学习Notebook操作

任务二：PaddleOCR推理

步骤1 下载代码并安装依赖

步骤2 准备推理模型

下载paddle模型

paddle2onnx

onnx2mindir

步骤3 适配推理代码

utility.py

predict_det.py

predict_rec.py

predict_cls.py

步骤4 测试推理pipeline

任务三：推理性能调优–固定/分档

步骤1 下载数据集

步骤2 准备评估代码

evaluate.py

utility.py

predict_det.py

predict_rec.py

步骤3 动态shape评估

步骤4 固定shape评估

步骤5 多档shape评估

步骤6 结果总览

参考资料

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

推荐阅读

相关产品