AI八大热门领域——2023那个合适您
目录
AI八大热门领域1、图像分类
图像分类,是指判断图像中的物体属于什么类别。
ImageNet用的比较多。咱们来看看百度的说明:
ImageNet项目是一个用于视觉对象识别软件研究的大型可视化数据库。超过1400万的图像URL被ImageNet手动注释,以指示图片中的对象;在至少一百万个图像中,还提供了边界框。ImageNet包含2万多个类别; 一个典型的类别,如“气球”或“草莓”,包含数百个图像。第三方图像URL的注释数据库可以直接从ImageNet免费获得;但是,实际的图像不属于ImageNet。自2010年以来,ImageNet项目每年举办一次软件比赛,即ImageNet大规模视觉识别挑战赛(ILSVRC),软件程序竞相正确分类检测物体和场景。 ImageNet挑战使用了一个“修剪”的1000个非重叠类的列表。2012年在解决ImageNet挑战方面取得了巨大的突破,被广泛认为是2010年的深度学习革命的开始。
ImageNet简介:
ImageNet就像一个网络一样,拥有多个Node(节点)。每一个node相当于一个item或者subcategory。据官网消息,一个node含有至少500个对应物体的可供训练的图片/图像。它实际上就是一个巨大的可供图像/视觉训练的图片库。
ImageNet的结构基本上是金字塔型:目录->子目录->图片集。
AI八大热门领域——2物体检测
物体检测,是要找到图像中物体的位置,并判断该物体所属的类别。
其实很多的时候都是英文标注的,但是我相信国内的AI领域的博主多了之后就会出现纯中文的备注方案。
AI八大热门领域——3图像分割
在计算机视觉领域,从图像分类,到物体检测,语义分割、实例分割,任务的复 杂度是依次提高。
分类任务
检测出对象的位置和类别
不对同类型不同对象做出区别
目标检测
将图片中的对象分别检测出来并检测其类别
语义分割
将图片进行像素级分割
不对同类型的不同对象进行区分
实例分割
同样对图片进行像素级分割
将不同的对象分别识别出来
AI八大热门领域——4人脸识别
人脸识别,也称人脸比对,是指识别当前摄像头:中的人脸所属的身份,是否和数据库中的某个人身份一致。
多用于安防场景
- 机场、客运站、火车站等安检
- 核对身份证信息
- 对比黑名单信息
- 寻找失踪人员
- 银行人脸识别
- 信息验证
AI八大热门领域——5OCR
文字识别(Optical Character Recognition),就是将图片或扫描件中的文字识别成可编辑的文本。
能代替人工的录入,提升业务效率,是企业应用最广泛的AI产品之一。
AI八大热门领域——6视频分析
视频分析的研究方向有:视频分类、视频物体分割、视频恢复与增强、视频指纹、视频结构化、视频摘要、视频生成。
AI八大热门领域——7自然语言处理
自然语言通常是指一种自然地随文化演化的人类语言,不是大自然的语言,也不是动物的语言。
AI八大热门领域——8语音识别
语音识别,指的是将语音信号转化为文字序列。
声学模型,用于建模语音信号与音素之间的关系。音素分为元音与辅音两大类。如汉语音节啊(a) 只有一个音素,爱(ai) 有两个音素。
语言模型,用于建模音素与字词之间的对应关系。由于语音信号的时变性、噪声和其它- -些不稳定因素, 音素信息可能不准确。
总结
八个方向,根据自身的爱好选择自己的方向,当然也可以都搞一搞,但是不建议啊,毕竟精力有限,祝大家在新的一年能选好自己的路。
- 点赞
- 收藏
- 关注作者
评论(0)