【愚公系列】《人工智能70年》034-计算机视觉大放异彩(计算机视觉前史)

举报
愚公搬代码 发表于 2025/11/01 23:24:31 2025/11/01
【摘要】 💎【行业认证·权威头衔】✔ 华为云天团核心成员:特约编辑/云享专家/开发者专家/产品云测专家✔ 开发者社区全满贯:CSDN博客&商业化双料专家/阿里云签约作者/腾讯云内容共创官/掘金&亚马逊&51CTO顶级博主✔ 技术生态共建先锋:横跨鸿蒙、云计算、AI等前沿领域的技术布道者🏆【荣誉殿堂】🎖 连续三年蝉联"华为云十佳博主"(2022-2024)🎖 双冠加冕CSDN"年度博客之星TOP...

image.png

💎【行业认证·权威头衔】
✔ 华为云天团核心成员:特约编辑/云享专家/开发者专家/产品云测专家
✔ 开发者社区全满贯:CSDN博客&商业化双料专家/阿里云签约作者/腾讯云内容共创官/掘金&亚马逊&51CTO顶级博主
✔ 技术生态共建先锋:横跨鸿蒙、云计算、AI等前沿领域的技术布道者

🏆【荣誉殿堂】
🎖 连续三年蝉联"华为云十佳博主"(2022-2024)
🎖 双冠加冕CSDN"年度博客之星TOP2"(2022&2023)
🎖 十余个技术社区年度杰出贡献奖得主

📚【知识宝库】
覆盖全栈技术矩阵:
◾ 编程语言:.NET/Java/Python/Go/Node…
◾ 移动生态:HarmonyOS/iOS/Android/小程序
◾ 前沿领域:物联网/网络安全/大数据/AI/元宇宙
◾ 游戏开发:Unity3D引擎深度解析

🚀前言

计算机视觉技术的应用,远远不止在体育运动中。
image.png

🚀一、计算机视觉前史

计算机视觉(Computer Vision, CV)是人工智能中的一个重要交叉学科,通常也被称为机器视觉(Machine Vision, MV)。这两个术语虽然含义相同,但常用于不同的应用场景:一般图像和视频的采集、识别、分析与处理多被称为“计算机视觉”;而在工业自动化或机器人等特定领域中,则更多使用“机器视觉”这一表述。

长期以来,计算机视觉的核心目标是让机器学会“看”。正如人类通过眼睛和耳朵感知世界,计算机语音技术实现了“耳聪”,计算机视觉则致力于实现“目明”。该学科研究如何利用摄像机等视觉传感器替代人眼,对物体进行识别、跟踪与测量,并由计算机处理这些视觉信息,最终达到类似人类水平的感知与认知能力。简而言之,计算机视觉是一门关于“看”的科学,堪称人类的“第二双眼睛”。

与我们熟悉的语音技术不仅包括识别还有合成类似,计算机视觉近年来的发展也呈现出从“识别”向“生成”扩展的趋势。它不仅关注如何理解图像与视频,还越来越多地涉及合成与生成视觉内容的技术。

人类从外界获取的信息中有80%来自视觉,视觉信息不仅最丰富,也最为复杂。尽管人类凭借长期进化的生理机制能够轻松识别并理解周围环境,但让计算机处理视觉信息却异常困难。正因如此,与其他人工智能分支相比,计算机视觉的起步相对较晚。

早在20世纪50年代,计算机已开始用于分析二维图像,如光学字符识别、显微图像和航空图像处理等,这类工作被归类于“模式识别”范畴。而模式识别自身作为一门学科,直到20世纪60年代才逐渐独立出来。至今,计算机视觉与模式识别仍保持着紧密的学科联系。

到了20世纪60年代,MIT的拉里·罗伯茨(Larry Roberts)开始利用计算机程序分析诸如三角体、立方体等简单物体。尽管研究对象仅是辨识度较高的白色积木玩具,这一研究却将计算机视觉推入了三维空间。这一时期也因此被许多人称为计算机视觉的“积木时代”。

【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。