机器学习入门介绍
开始系统学习一下机器学习了,本专栏是个人笔记,如有不当之处,还请谅解。
机器学习是一项不断发展的技术,它使计算机能够从过去的数据中自动学习。机器学习使用各种算法来构建数学模型并使用历史数据或信息进行预测。目前,它被用于各种任务,例如图像识别、语音识别、电子邮件过滤、Facebook 自动标记、推荐系统等等。
一、什么是机器学习?
在现实生活中,我们人,可以通过自己的学习能力,从别人身上学习他们的经验(包括能力等)。但是机器也能像人类一样从经验或过去的数据中学习吗?所以机器学习的作用就来了。
机器学习被称为人工智能的一个子集,主要关注算法的开发,这些算法允许计算机自行从数据和过去的经验中学习。机器学习一词由Arthur Samuel在1959 年首次提出。我们可以概括地定义为:
机器学习使机器能够自动从数据中学习,从经验中提高性能,并在没有明确编程的情况下预测事物。
在样本历史数据(称为训练数据)的帮助下,机器学习算法构建了一个数学模型,该模型有助于做出预测或决策,而无需明确编程。机器学习将计算机科学和统计学结合在一起,用于创建预测模型。机器学习构建或使用从历史数据中学习的算法。我们提供的信息越多,性能就越高。
机器学习能力取决于它是否可以获取更多数据来提高其性能。
二、机器学习如何工作?
机器学习系统从历史数据中学习,构建预测模型,并在收到新数据时预测其输出。预测输出的准确性取决于数据量,因为大量数据有助于构建更好的模型,从而更准确地预测输出。
假设我们有一个复杂的问题,我们需要执行一些预测,所以我们不需要为它编写代码,只需将数据提供给通用算法,在这些算法的帮助下,机器按照数据并预测输出。机器学习改变了我们思考问题的方式。下面的框图解释了机器学习算法的工作原理:
三、机器学习的特点
- 机器学习从给定的数据去检测新的数据。
- 它可以从过去的数据中学习并自动改进。
- 机器学习与数据挖掘非常相似,因为它也处理大量数据。
四、机器学习的需求
对机器学习的需求与日俱增。之所以需要机器学习,是因为它能够完成过于复杂而无法直接执行的任务。作为人,我们有一些限制,因为我们无法手动访问大量数据,所以为此,我们需要一些计算机系统,而机器学习可以让我们轻松应对。
我们可以通过向机器学习算法提供大量数据来训练它们,并让它们自动探索数据、构建模型并预测所需的输出。机器学习算法的性能取决于数据量,可以由成本函数决定。在机器学习的帮助下,我们可以节省时间和金钱。
机器学习的重要性可以通过它的用例很容易理解,目前机器学习被用于自动驾驶汽车、网络欺诈检测、人脸识别、Facebook 的好友推荐等。淘宝,拼多多,京东等多家司都有构建使用大量数据的机器学习模型来分析用户兴趣并相应地推荐产品。
机器学习重要性的一些关键点:
- 数据生产的快速增长
- 解决人们难以解决的复杂问题
- 包括金融在内的各个部门的决策
- 发现隐藏的模式并从数据中提取有用的信息
五、机器学习的分类
在广义上,机器学习可以分为三种类型:
- 监督学习
- 无监督学习
- 强化学习
5.1 监督学习
监督学习是一种机器学习方法,我们向机器学习系统提供样本标记数据(打上标签的数据)以对其进行训练,并在此基础上预测输出。
系统使用标记数据创建模型来理解数据集并了解每个数据,完成训练和处理后,我们就会通过提供样本数据来测试模型,以检查它是否预测了准确的输出。
监督学习的目标是将输入数据与输出数据进行映射。监督学习是基于监督的,就像学生在老师的监督下学习一样。监督学习的例子是垃圾邮件过滤。
监督学习可以进一步分为两类算法:
- 分类
- 回归
5.2 无监督学习
无监督学习是一种机器在没有任何监督的情况下学习的学习方法。使用未标记、分类或分类的数据集向机器提供训练,并且算法需要在没有任何监督的情况下对该数据进行操作。无监督学习的目标是将输入数据重构为新特征或具有相似模式的一组对象。
在无监督学习中,我们没有预先确定的结果。机器试图从大量数据中找到有用的结果。它可以进一步分为两类算法:
- 聚类
- 关联
5.3 强化学习
强化学习是一种基于反馈的学习方法,其中学习代理对每个正确的动作都获得奖励,并为每个错误的动作获得惩罚。代理会根据这些反馈自动学习并提高其性能。在强化学习中,代理与环境交互并对其进行探索。代理的目标是获得最多的奖励积分,从而提高其性能。
5.4 目前的机器学习
现在机器学习的研究有了很大的进步,它无处不在,比如自动驾驶汽车、亚马逊Alexa、Catboats、推荐系统等等。它包括有监督、无监督和强化学习,包括聚类、分类、决策树、SVM 算法等。
现代机器学习模型可用于进行各种预测,包括天气预报、疾病预测、股市分析等。
六、机器学习先决条件
- 概率和线性代数的基础知识。
- 使用任何计算机语言编码的能力,尤其是 Python 语言。
- 微积分知识,尤其是单变量和多变量函数的导数。
基础很重要,推荐免费刷题网站:牛客网
文章来源: chuanchuan.blog.csdn.net,作者:川川菜鸟,版权归原作者所有,如需转载,请联系作者。
原文链接:chuanchuan.blog.csdn.net/article/details/125089928
- 点赞
- 收藏
- 关注作者
评论(0)