- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

《深度学习之图像识别：核心技术与案例实战》

华章计算机发表于 2020/02/23 10:35:05 2020/02/23

【摘要】本节书摘来自华章计算机《深度学习之图像识别：核心技术与案例实战》 ——作者是言有三　　。

深度学习之图像识别

核心技术与案例实战

言有三著

前言

　　机器学习、深度学习、人工智能，这些关键词在最近几年“声名鹊起”。以深度学习为代表的无监督机器学习技术在图像处理、语音识别和自然语言处理等领域里频频取得新的突破。但深度学习其实并不是一门全新的学科，其历史可以追溯到20世纪40年代。

　　深度学习背后的核心技术包括神经网络的结构设计和最优化方法等，其理论体系虽然有一定进展但是尚不完备。可以说，当前的主流深度学习技术是一门应用性极强的工程技术，这种尚不完备的理论加上具有较高门槛的应用工程特点，对于初学者来说具有一定的困难。如何系统性地了解理论知识，又能够紧随理论进行全面的实践，成为一名合格的图像处理领域的深度学习算法工程师，这是本书所要解决的问题。

　　笔者有超过6年的图像行业背景，最近几年也多以深度学习技术为基础进行相关项目的开发，在多年的知识积累和项目实践中，总结出了大量的经验，浓缩成了这本书。本书从深度学习的背景和基础理论开始讲起，然后介绍了深度学习中的数据及图像处理中的几大重要方向，并介绍了神经网络的可视化、优化目标、模型的优化和模型的线上部署。

　　本书内容由浅入深，讲解图文并茂，紧随工业界和学术界的最新发展，理论和实践紧密结合，给出了大量的图表与案例分析。本书抛开了过多的数学理论，完整地剖析了深度学习在图像处理领域中各个维度的重要技术，而不是只停留于理论的阐述和简单的结果展示，更是从夯实理论到完成实战一气呵成。相信读者跟随着本书进行学习，将会对深度学习领域的图像处理技术和其在实际开发中的应用有更深的理解。

本书特色

　　1．内容全面，紧跟最新技术发展

　　本书内容涵盖了深度学习的理论知识、数据获取与增强，以及深度学习在图像分类、分割和检测这三大基础研究领域中的发展、数据与模型的可视化、优化目标、模型压缩与部署等相关知识，基本上囊括了深度学习在图像开发中所必须要掌握的大部分基础知识。

　　2．深度与广度兼具

　　本书在讲解每个知识点时力求详尽，而且紧密结合了学术界与工业界相关技术的最新发展。这样的安排既注重知识的广度，也兼具知识的深度，可以为图像处理领域中的从业者提供系统性的学习指导。

　　3．理论与实践案例紧密结合

　　本书不仅对理论知识进行了阐述，而且还给出了大量的实践内容，以帮助读者提高实际的动手能力。除了第1、2章主要介绍了深度学习的基础理论外，后续章节则大多采用了先系统介绍该章涉及知识的发展现状，然后有针对性地设计了一到两个实践案例带领读者学习，有较好的学习效果。

　　4．参考了不同层次学习者的意见

　　本书若干内容的简化版本已在笔者运营的公众号平台上接受了不同层次读者的反馈，力求知识的完备性和准确性；另外，本书有多位编写者参与，他们或理论见长，或善于动手，让本书从不同层面得到了广泛的意见，可以满足不同人群的学习需求。

本书内容

　　第1章神经网络基础，首先介绍了神经网络的生物基础与数学模型，然后介绍了卷积神经网络的基础知识，这也是当前深度学习模型的基础。

　　第2章深度学习优化基础，首先介绍了深度学习主流开源框架，如Caffe、TensorFlow、Pytorch和Theano等，并对其特点与性能做了对比；然后介绍了网络优化参数，包括激活函数、正则化方法和归一化方法等。本章旨在让大家对深度卷积神经网络有一个较为全面的认识，给后续章节的学习打好基础。

　　第3章深度学习中的数据，首先介绍了深度学习发展过程中的几个数据集，给读者展示了数据集对深度学习的重要性；然后介绍了几大重要发展方向中的数据集；接着讲述了数据增强的方法；最后讲述了数据的收集、整理及标注等相关问题。

　　第4章图像分类，首先介绍了图像分类的基础、基于深度学习的图像分类研究方法及发展现状，以及图像分类任务中的挑战；然后以一个移动端的基准模型为例，展示了图像分类任务的实践流程；最后介绍了一个细粒度级别的图像分类任务，以一个较高的基准模型，展示了较难的图像分类任务训练参数的调试技巧。

　　第5章图像分割，首先介绍了从阈值法到活动轮廓模型的传统图像分割方法；然后介绍了基于深度学习的图像分割方法的基本原理与核心技术；接着讲述了一个移动端的实时图像分割任务，该任务以MobileNet为基准模型，展示了图像硬分割任务实践的完整流程；最后介绍了一个更加复杂的肖像换背景的任务，展示了图像软分割任务的基本流程和应用场景。

　　第6章目标检测，首先介绍了目标检测的基础和基本流程，并讲述了一个经典的V-J目标检测框架；然后介绍了基于深度学习的目标检测任务的研究方法与发展现状，并分析了目标检测中的核心技术；最后给出了一个目标检测任务实例，通过分析faster rcnn的源代码，使用该框架自带的VGG CNN 1024网络完成训练和测试，并总结目标检测中的难点。

　　第7章数据与模型可视化，首先对包括低维与高维数据的可视化做了简单介绍；然后对深度学习中的模型可视化做了详细介绍，包括模型的结构和权重可视化；最后介绍了一个基于Tensorflow和Tensorboard的完整案例。

　　第8章模型压缩，首先详细介绍了模型压缩的方法，然后以一个典型的模型压缩实战案例来阐述项目中的模型压缩上线。

　　第9章损失函数，首先介绍了分类任务的损失函数；然后介绍了回归任务的损失函数；最后介绍了这些损失函数在几大经典图像任务中的使用。

　　第10章模型部署与上线，依托微信小程序平台从3个方面介绍了模型部署的问题。首先介绍了微信小程序的前端开发，然后介绍了微信小程序的服务端开发，最后介绍了Caffe的环境配置。

本书配套资源获取方式

　　本书涉及的源代码文件及其他资料需要读者自行下载。请登录华章公司网站www.hzbook.com，在该网站上搜索到本书，然后单击“资料下载”按钮即可在页面上找到“配书资源”下载链接。

本书读者对象

* 图像处理技术人员；

* 深度学习技术人员；

* 深度学习技术爱好者；

* 深度学习技术研究人员；

* 相关院校的学生和老师；

* 相关培训机构的学生和老师。

本书作者

　　本书作者龙鹏，笔名言有三，运营微信公众号《有三AI》。本书的第1章和第2章的深度学习理论知识，由华中科技大学的在读博士生徐冰瑢主笔，展示出了作者扎实的深度学习理论知识功底和细致的写作水平；鲍琦琦、陶玉龙及杨皓博参与了第3、6、10章部分内容的写作与校对工作；另外，在本书成书前，从中国科学技术大学毕业3年的硕士研究生胡郡郡参与了全书的阅读和反馈。再次对他们表示感谢！

　　由于作者水平所限，加之写作时间较为仓促，书中可能还存在一些疏漏和不足之处，敬请各位读者批评指正。联系我们请发电子邮件到hzbook2017@163.com。

作者

《深度学习之图像识别：核心技术与案例实战》

深度学习之图像识别

核心技术与案例实战

言有三著

前言

本书特色

本书内容

本书配套资源获取方式

本书读者对象

本书作者

目录

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

《深度学习之图像识别：核心技术与案例实战》

深度学习之图像识别

核心技术与案例实战

言有三 著

前言

本书特色

本书内容

本书配套资源获取方式

本书读者对象

本书作者

目录

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

推荐阅读

相关产品

言有三著