iflwx的论坛回复_云社区-华为云

华为云ID：iflwx_jan 第二阶段第二周笔记 # 第3章 AI模型开发-物体检测 ## 2.1 介绍物体检测是计算机视觉中目前应用最广泛的技术之一。物体检测是识别出一张图片中的物体类别，以及物体的位置。在计算机视觉领域，从图像分类到物体检测，语义分割，实例分割，技术的复杂度越来越高。目前业界最流行的方式，是用矩形框将物体框住。 ## 2.2 应用场景 - 自动驾驶检测道路上的各种物体：红绿灯、行人、斑马线、信号灯等。 - 工地安全帽检测 - 口罩识别以上2种，当检测到有人没有佩戴时，可以将人脸识别出来，进行提醒。 ## 2.3.开源数据集 - PASCAL VOC。[官网](#) 20个类别，约10万张图片。从05年到12年每年举办比赛。 - MSCOCO。[官网](#) 微软建立，包含80个类别，约12万图片。 ## 2.4.算法分为2个流派：一阶段检测(YOLO系列)和两阶段检测(RCNN系列)。 ### FasterRCNN算法 [FasterRCNN模型详细解读](https://github.com/huaweicloud/ModelArts-Lab/wiki/VGG模型解析) 两阶段检测是将物体检测分为2个子任务： 1. 使用RPN网络(Region Proposal Network)来生成只包含一个物体的候选框。 RPN网络是在图片的滑动窗口上生成多种尺寸的Anchor box，再根据ground truth(真实的标注信息)和Anchor box的重合度来判断哪些Anchor box是有目标的。最后挑选置信度高的一些Anchor box作为候选框，也就是proposals。 2. 用CNN(卷积神经网络)对候选框进行多分类，并用标注信息对候选框的坐标进行回归修正。实质上是将物体检测问题转换成**图像分类问题**来解决。 ### Yolo算法 [Yolo模型详细解读](#) 首先将输入图像划分为S x S个网格，如果某个物体的中心落在这个网格中，那么这个网格就会负责检测该物体。同时每个网格预测B个边界框(Bounding boxes)的位置和1个置信度(confidence)，每个边界框分别对应5个输出，分别是：边界框的中心坐标(x, y)、宽、高、置信度。 Yolo是用CNN将图像直接映射为边界框的位置与类别，每个网格还产生c个条件概率(表示边界框中物体类别的概率)，最后在推理阶段，如果一个物体被多个边界框框住，会用极大值抑制来去重。实际上是将物体检测问题转换成**回归问题**来解决。 ### FasterRCNN v.s. YoLoV3 | 对比点 | FasterRCNN | YoLoV3 | | -------- | -------------------------- | ----------------------------------------- | | 推理速度 | 慢 | 快 | | 推理精度 | 高 | Label精度相对较低，图像扭曲，无背景过滤。 | | 应用场景 | 自动驾驶等精度要求高的场景 | 实时检测场景 | | 算力要求 | 高 | 低 | 在算力较弱的终端中，YoLoV3应用更多。 ## 2.5 实战案例 ### 2.5.1 零代码人车检测模型开发 https://github.com/huaweicloud/ModelArts-Lab/blob/master/ExeML/ExeML_Car_And_Person_Detection/readme.md ### 2.5.2 使用FasterRCNN预置算法基于海量数据训练人车检测模型 https://github.com/huaweicloud/ModelArts-Lab/blob/master/train_inference/Car_And_Person_Detection_Builtin_Algorithm/readme.md ### 2.5.3 YoLoV3和FasterRCNN算法完成物体检测 https://github.com/huaweicloud/ModelArts-Lab/blob/master/notebook/DL_image_object_detection_faster/Faster-R-CNN.ipynb https://github.com/huaweicloud/ModelArts-Lab/blob/master/notebook/DL_image_object_detection_yolo/object_detection_yolo.ipynb

温馨提示

温馨提示

温馨提示

设置昵称

温馨提示

提示