- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

《OpenCV 4计算机视觉项目实战》

华章计算机发表于 2019/11/09 22:36:45 2019/11/09

【摘要】本节书摘来自华章计算机《OpenCV 4计算机视觉项目实战》一作者[西班牙]大卫·米兰·埃斯克里瓦（David Millán Escrivá）[西班牙]维尼休斯·G.门东萨（Vinícius G. Mendon。

智能系统与技术丛书

OpenCV 4计算机视觉项目实战

（原书第2版）

Learn OpenCV 4 By Building Projects, Second Edition

[西班牙]大卫·米兰·埃斯克里瓦（David Millán Escrivá）

[西班牙]维尼休斯·G.门东萨（Vinícius G. Mendon

Preface

前　　言

OpenCV是用于开发计算机视觉应用程序的最流行的库之一，它使我们能够实时运行许多不同的计算机视觉算法。它已存在很多年了，并且已经成为该领域的标准库。OpenCV的主要优势之一是它经过高度优化，几乎可以在所有平台上使用。

本书首先简要介绍计算机视觉的各个领域以及相关的OpenCV函数，这些函数均用C++编写。每章都包含实际的例子和代码示例，用于演示用例。这有助于你轻松掌握主题并了解如何在现实生活中应用它们。综上所述，这是一本实用的指导书，你将从中学会如何在C++中使用OpenCV并使用这个库构建各种应用程序。

本书目标读者

本书面向不熟悉OpenCV并希望在C++中使用OpenCV开发计算机视觉应用程序的开发人员。了解C++的基本知识将有助于理解本书。本书对于想要学习计算机视觉入门知识并理解基本概念的人也很有用。他们应该了解基本的数学概念，例如向量、矩阵和矩阵乘法，以便充分利用本书。在阅读本书的过程中，你将学会如何使用OpenCV从零开始构建各种计算机视觉应用程序。

本书涵盖内容

第1章介绍在各种操作系统上的安装步骤，并介绍人类视觉系统以及计算机视觉中的各种主题。

第2章讨论如何在OpenCV中读/写图像和视频，并解释如何使用CMake构建项目。

第3章介绍如何构建图形用户界面和鼠标事件检测器，以构建交互式应用程序。

第4章探讨直方图和滤波器，并展示如何对图像进行卡通化处理。

第5章描述各种图像预处理技术，如噪声消除、阈值处理和轮廓分析。

第6章处理目标识别和机器学习，以及如何使用支持向量机来构建目标分类系统。

第7章讨论人脸检测和Haar级联，然后解释这些方法如何用于检测人脸的各个部位。

第8章探讨背景减除、视频监控和形态图像处理，并且描述它们如何相互连接。

第9章介绍如何使用不同技术跟踪实时视频中的目标，例如，基于颜色和基于特征进行跟踪。

第10章讨论光学字符识别、文本分割，并介绍Tesseract OCR引擎。

第11章深入探究Tesseract OCR引擎，解释如何将其用于文本检测、提取和识别。

第12章探讨如何使用两种常用的深度学习架构在OpenCV中应用深度学习，在这两种架构中，YOLO v3用于目标检测，而单发探测器（Single Shot Detector）用于人脸检测。

如何充分利用本书

了解C++的基本知识将有助于理解本书内容。这些例子使用以下技术进行构建：OpenCV 4.0、CMake 3.3.x或更新版本、Tesseract、Leptonica（依赖于Tesseract）、Qt（可选）和OpenGL（可选）。

相关章节提供了详细的安装说明。

下载示例代码

本书的示例代码可以从http://www.packtpub.com通过个人账号下载，也可以访问华章图书官网http://www.hzbook.com，通过注册并登录个人账号下载。

本书的代码包还托管在GitHub上，如果代码有更新，会在现有的GitHub库上更新：https://github.com/PacktPublishing/Learn-OpenCV-4-By-Building-Projects-Second-Edition。

下载彩***像

本书提供了一个PDF文件，其中包含书中使用的屏幕截图/图表的彩***像：https://www.packtpub.com/sites/default/files/downloads/9781789341225_ColorImages.pdf。

About the authors

作者简介

大卫·米兰·埃斯克里瓦（David Millán Escrivá）8岁时用BASIC语言在8086 PC上编写了他的第一个程序。他在瓦伦西亚政治大学（Universitat Politécnica de Valencia）完成了他的IT学习，并在由使用OpenCV（v0.96）的计算机视觉技术所支持的人机交互领域取得了优异的成绩。他拥有人工智能、计算机图形学和模式识别硕士学位，专注于模式识别和计算机视觉。他还拥有超过9年的计算机视觉、计算机图形和模式识别经验。他是Damiles Blog的作者，在上面发表关于OpenCV、计算机视觉和光学字符识别算法的文章与教程。

我要感谢我的妻子Izaskun、女儿Eider和儿子Pau，他们始终保持无限的耐心并坚定地支持我。他们改变了我的生活，让我的每一天都变得很棒。我爱你们。

我要感谢OpenCV团队和社区给予我们这个精彩的库。我还要感谢我的合著者，感谢Packt出版社支持并帮助我完成本书。

维尼休斯·G.门东萨（Vinícius G. Mendon是巴拉那天主教大学（PUCPR）的计算机图形专业教授。他于1998年开始使用C++进行编程，并于2006年进入计算机游戏和计算机图形领域。他目前是巴西Apple开发者学院（Apple Developer Academy）的导师，从事用于移动设备的金属、机器学习和计算机视觉方面的教学工作。他曾担任其他Packt图书的审校者，包括《OpenNI Cookbook》和《Mastering OpenCV and Computer Vision with OpenCV 3 and Qt5》。在他的研究中，使用了Kinect、OpenNI和OpenCV来识别巴西手语手势。他感兴趣的领域包括移动电话、OpenGL、图像处理、计算机视觉和项目管理。

我要感谢我的妻子Thais A. L. Mendon

普拉蒂克·乔希（Prateek Joshi）是一位人工智能研究员、8本书的作者，还是一位TEDx演讲者。他的著作曾入选Forbes 30 Under 30、CNBC、TechCrunch、Silicon Valley Business Journal等多部出版物。他是Pluto AI的创始人，Pluto AI是一家由风投资助的硅谷初创公司，为水利设施建立智能平台。他毕业于南加州大学，获得人工智能专业硕士学位。他之前曾就职于NVIDIA和Microsoft Research。

Brief introduction of reviser

审校者简介

Marc Amberg是一位经验丰富的机器学习和计算机视觉工程师，拥有在IT和服务行业工作的成功经验。他擅长Python、C/C++、OpenGL、3D重建和Java。他是一名优秀的工程专家，在里尔科学与技术大学（里尔一世）（Université des Sciences et Technologies de Lille （Lille I））获得了计算机科学（图像、视觉和交互）硕士学位。

Vincent Kok目前是英特尔运输工业部门的一名软件平台应用工程师。他毕业于马来西亚理科大学（USM），获得了电子工程学位。目前，他正在USM攻读嵌入式系统工程硕士学位。Vincent积极参与开发者社区，并定期参加在世界各地举办的Maker Faire活动。他喜欢设计电子硬件套件，并在业余时间为初学者提供焊接/Arduino课程。