- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

机器学习入门介绍

川川菜鸟发表于 2022/06/03 22:58:51 2022/06/03

1.5k+ 0 0

【摘要】开始系统学习一下机器学习了，本专栏是个人笔记，如有不当之处，还请谅解。机器学习是一项不断发展的技术，它使计算机能够从过去的数据中自动学习。机器学习使用各种算法来构建数学模型并使用历史数据或信息进行预测...

开始系统学习一下机器学习了，本专栏是个人笔记，如有不当之处，还请谅解。

机器学习是一项不断发展的技术，它使计算机能够从过去的数据中自动学习。机器学习使用各种算法来构建数学模型并使用历史数据或信息进行预测。目前，它被用于各种任务，例如图像识别、语音识别、电子邮件过滤、Facebook 自动标记、推荐系统等等。

一、什么是机器学习？

在现实生活中，我们人，可以通过自己的学习能力，从别人身上学习他们的经验（包括能力等）。但是机器也能像人类一样从经验或过去的数据中学习吗？所以机器学习的作用就来了。

机器学习被称为人工智能的一个子集，主要关注算法的开发，这些算法允许计算机自行从数据和过去的经验中学习。机器学习一词由Arthur Samuel在1959 年首次提出。我们可以概括地定义为：

机器学习使机器能够自动从数据中学习，从经验中提高性能，并在没有明确编程的情况下预测事物。

在样本历史数据（称为训练数据）的帮助下，机器学习算法构建了一个数学模型，该模型有助于做出预测或决策，而无需明确编程。机器学习将计算机科学和统计学结合在一起，用于创建预测模型。机器学习构建或使用从历史数据中学习的算法。我们提供的信息越多，性能就越高。

机器学习能力取决于它是否可以获取更多数据来提高其性能。

二、机器学习如何工作？

机器学习系统从历史数据中学习，构建预测模型，并在收到新数据时预测其输出。预测输出的准确性取决于数据量，因为大量数据有助于构建更好的模型，从而更准确地预测输出。
假设我们有一个复杂的问题，我们需要执行一些预测，所以我们不需要为它编写代码，只需将数据提供给通用算法，在这些算法的帮助下，机器按照数据并预测输出。机器学习改变了我们思考问题的方式。下面的框图解释了机器学习算法的工作原理：

三、机器学习的特点

机器学习从给定的数据去检测新的数据。
它可以从过去的数据中学习并自动改进。
机器学习与数据挖掘非常相似，因为它也处理大量数据。

四、机器学习的需求

对机器学习的需求与日俱增。之所以需要机器学习，是因为它能够完成过于复杂而无法直接执行的任务。作为人，我们有一些限制，因为我们无法手动访问大量数据，所以为此，我们需要一些计算机系统，而机器学习可以让我们轻松应对。

我们可以通过向机器学习算法提供大量数据来训练它们，并让它们自动探索数据、构建模型并预测所需的输出。机器学习算法的性能取决于数据量，可以由成本函数决定。在机器学习的帮助下，我们可以节省时间和金钱。

机器学习的重要性可以通过它的用例很容易理解，目前机器学习被用于自动驾驶汽车、网络欺诈检测、人脸识别、Facebook 的好友推荐等。淘宝，拼多多，京东等多家司都有构建使用大量数据的机器学习模型来分析用户兴趣并相应地推荐产品。

机器学习重要性的一些关键点：

数据生产的快速增长
解决人们难以解决的复杂问题
包括金融在内的各个部门的决策
发现隐藏的模式并从数据中提取有用的信息

五、机器学习的分类

在广义上，机器学习可以分为三种类型：

监督学习
无监督学习
强化学习

5.1 监督学习

监督学习是一种机器学习方法，我们向机器学习系统提供样本标记数据（打上标签的数据）以对其进行训练，并在此基础上预测输出。

系统使用标记数据创建模型来理解数据集并了解每个数据，完成训练和处理后，我们就会通过提供样本数据来测试模型，以检查它是否预测了准确的输出。

监督学习的目标是将输入数据与输出数据进行映射。监督学习是基于监督的，就像学生在老师的监督下学习一样。监督学习的例子是垃圾邮件过滤。

监督学习可以进一步分为两类算法：

分类
回归

5.2 无监督学习

无监督学习是一种机器在没有任何监督的情况下学习的学习方法。使用未标记、分类或分类的数据集向机器提供训练，并且算法需要在没有任何监督的情况下对该数据进行操作。无监督学习的目标是将输入数据重构为新特征或具有相似模式的一组对象。

在无监督学习中，我们没有预先确定的结果。机器试图从大量数据中找到有用的结果。它可以进一步分为两类算法：

聚类
关联

5.3 强化学习

强化学习是一种基于反馈的学习方法，其中学习代理对每个正确的动作都获得奖励，并为每个错误的动作获得惩罚。代理会根据这些反馈自动学习并提高其性能。在强化学习中，代理与环境交互并对其进行探索。代理的目标是获得最多的奖励积分，从而提高其性能。

5.4 目前的机器学习

现在机器学习的研究有了很大的进步，它无处不在，比如自动驾驶汽车、亚马逊Alexa、Catboats、推荐系统等等。它包括有监督、无监督和强化学习，包括聚类、分类、决策树、SVM 算法等。

现代机器学习模型可用于进行各种预测，包括天气预报、疾病预测、股市分析等。

六、机器学习先决条件

概率和线性代数的基础知识。
使用任何计算机语言编码的能力，尤其是 Python 语言。
微积分知识，尤其是单变量和多变量函数的导数。

基础很重要，推荐免费刷题网站：牛客网

文章来源: chuanchuan.blog.csdn.net，作者：川川菜鸟，版权归原作者所有，如需转载，请联系作者。

原文链接：chuanchuan.blog.csdn.net/article/details/125089928

点赞
收藏
关注作者

作者其他文章

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

开发者空间

了解空间

工作台

开发平台

实战案例

空间活动

空间论坛

开发平台

软件开发生产线 CodeArts

AI平台ModelArts

数据治理中心 DataArts Studio

数字内容生产线 MetaStudio

精选服务

云数据库 GaussDB

云数据库 RDS for MySQL

MapReduce服务 MRS

数据仓库服务 DWS

分布式缓存服务Redis版

分布式消息服务 DMS

华为云实时音视频 SparkRTC

媒体处理 MPC

主机迁移服务 SMS

对象存储迁移服务 OMS

云消息服务 KooMessage

云手机服务 KooPhone

企业搜索服务 KooSearch

云地图服务 KooMap

更多开放能力

开发工具

API生态

CodeArts API

API Explorer

Terraform Explorer

KooCLI

API 中心

SDK 中心

开发服务

Codelabs

DevStar

低代码平台Astro

CodeArts IDE

Huawei Cloud Toolkit

Classroom

开发资源

开源镜像站

开源资源

开发语言

开发实践

入门精选

分发资源

企业应用中心

企业通用专区

教育专区

华为应用专区

政务云专区

硬件云服务商城

医疗健康专区

跳蚤市场

华为云开发者日

直播专区

开发者精品活动

DTSE Tech Talk

加入HCDE

加入HCDG

加入HCSD

加入HCWD

鲁班会

沃土云创计划·企业

沃土云创计划·高校

沃土云创计划·个人

沃土云创计划·开源共创

博客

论坛

专题

开发者榜单

学习路径

在线课程

动手实验

考试认证

培训服务