探索人工智能人脸识别原理及应用(上)
1.机器是如何图像分类的
人工智能最具有应用前景的方向就是图像视觉领域,那么如何才能让机器识别世界万世万物呢?
比如让机器识别一支猫?
识别一朵花?
识别一架飞机?
2.机器如何识别图片
图片不像前面我们讲到的机器学习那样,可以很容易的根据数据值的分布,字段的含义去提取相应的特征,因为图像是一种非结构化数据,我们人类很难提取到它的特征,如果一定要通过观察的方式,采用人为的标注的方式提取特征,这里有一个鸢尾花的图像例子,植物学家可以测量花瓣和花萼的长和宽,然后用结构化的表格数据进行记录统计,再利用利用机器学习的方法进行分类。
测量花瓣和花萼的长和宽
收集长和宽,并标记结果值
利用机器学习将鸢尾花的测量数据进行学习与分类
3.图像的特征提取
特征工程是一项十分繁琐、耗费很多人力物力的工作,怎样才能让机器找到抽象事物的特征?
首先我们看看机器眼中的图片是什么样子,在机器“眼”里,图片就是由红绿蓝三个通道组成的数组。
其中灰度图片可以用单通道的数组表示
既然图片是由矩阵数字组成,那么科学家可以发明一些矩阵算法,将原始图像进行计算处理,比如:灰度转换、均衡图像、图像过滤、边缘检测、角点检测等算法,通过边缘检测算法可以提取图像的轮廓特征:
深度学习初探
2006年,Hinton在《Science》和相关期刊上发表了论文,首次提出了“深度信念网络”的概念。与传统的训练方式不同,“深度信念网络”有一个“预训练”(pre-training)的过程,这可以方便的让神经网络中的权值找到一个接近最优解的值,之后再使用“微调”(fine-tuning)技术来对整个网络进行优化训练。这两个技术的运用大幅度减少了训练多层神经网络的时间。他给多层神经网络相关的学习方法赋予了一个新名词--“深度学习”。
深度学习是机器学习的一个子领域,其中受我们大脑工作方式启发的模型以数学方式表达,深度学习是全球人工智能技术的关键推动力,外部刺激通过神经末梢,转化为电信号,转导到神经细胞(又叫神经元),无数神经元构成神经中枢,神经中枢综合各种信号,做出判断,人体根据神经中枢的指令,对外部刺激做出反应。
既然思考的基础是神经元,如果能够"人造神经元"(artificial neuron),就能组成人工神经网络,模拟思考。上个世纪六十年代,提出了最早的"人造神经元"模型,叫做"感知器"(perceptron),直到今天还在用。
目前常见的神经网络模型有:
深度神经网络(DNN)
一个深度神经网络通常由多个顺序连接的层组成。第一层一般以图像为输入,通过特定的运算从图像中提取特征。接下来每一层以前一层提出的特征作为输入,对其进行特定形式的变换,便可以得到更复杂的一些特征。
神经网络:卷积神经网络结构(CNN)
卷积运算在图像处理中应用十分广泛,许多图像特征的提取方法都会用到卷积。以灰度图为例,我们知道在计算机中一幅灰度图像被表示为一个整数的矩陈,如果我们用一个形状较小的矩陈和这个图像 的矩陈做卷积运算,就可以得到一个新的矩陈,这个新的矩陈可以看作是一幅新的图像。换句话说,通过卷积运算,我们可以将原图像变化为一幅新图像。这幅新图像有时候比原图像更清楚地表示了某些性质,我们就可以把它当作原图像的一个特征。这里用到的小矩陈就称为卷积核。
神经网络:循环神经网络结(RNN)
总结:深度学习的优点
深度神经网络的出现降低了人工智能系统的复杂度,将特征提取与分类两个独立的步骤集成在一起,我们只需要将一张图片输入给神经网络 ,就可以直接得出对图片的类别的预测,不需要分步完成特征的提取与分类。从这个角度来讲,深度神经网络并不是对传统模式分类系统的颠覆,而是对传统系统的改进与增强。
详细内容可以结合华为云享直播学习
直播地址:http://zhibo.huaweicloud.com/watch/2693280
作者:刘毅超 WeChat:yichao233
版权声名:部分图片素材来源网络,如有侵仅及时联系本人
转载请注明来源
- 点赞
- 收藏
- 关注作者
评论(0)