- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

机器学习3-训练与损失

一颗小树x 发表于 2021/06/18 21:21:56 2021/06/18

【摘要】训练模型表示通过有标签样本学习模型中所有权重w和偏差b的最优值。在监督学习中，机器学习算法通过以下方式构建模型：检查多个样本并尝试找出可最大限度地减少模型的损失；这一过程称为经验风险最小化。

前言

训练模型表示通过有标签样本学习模型中所有权重w和偏差b的最优值。在监督学习中，机器学习算法通过以下方式构建模型：检查多个样本并尝试找出可最大限度地减少模型的损失；这一过程称为经验风险最小化。

损失是对糟糕预测的惩罚；损失是之歌数值，表示对个单个样本而言模型预测的准确程度。如果模型的预测完成准确，则损失为零，否则损失会较大。

训练模型

训练模型的目标是从所有样本中找到一组平均损失“较少”的权值和偏差。

红色箭头表示损失；蓝线表示预测。左侧曲线图中的红色箭头比右侧曲线图中的对应红色箭头长得多；即实际点和模型预测相差的距离比较远，差异更大。

左侧显示的是损失较大的模型；右侧显示的是损失较小的模型。

损失函数

平方损失是一种常见的损失函数。线性回归模型使用的是一种称为平方损失（又称 $L_{2}$ 损失）的损失函数。单个样本的平方损失如下：

  = the square of the difference between the label and the prediction
  = (observation - prediction(x))2
  = (y - y')2

均方误差（MSE）是指每个样本的平均平方损失。计算MSE，需要求出各个样本的所有平方损失之和，然后除以样本数量：

$MSE = \frac{1}{n}\sum_{(x,y)\epsilon D)}^{}(y - prediction(x))^{2}$

其中：

(x,y)是指样本；x是指模型进行预测时使用的特征集（比如：温度、年龄等）y是指样本的标签（比如：蟋蟀每分钟的鸣叫次数）
prediction（x）是指权重和偏差与特征集x结合的函数。
D是指包含多个有标签样本的数据集。
n是指D中的样本数量。

MSE常用语回归任务中；分类任务常用交叉熵损失函数。

参考：https://developers.google.cn/machine-learning/crash-course/descending-into-ml/training-and-loss

关键词

经验风险最小化（ERM，empirical risk minimization），用于选择函数，选择基于训练集的损失降至最低的函数。与结构风险最小化相对。

均方误差（MSE，Mean Squared Error），每个样本的平均平方损失。MSE的计算方法是平方损失除以样本数。

平方损失函数（squared loss）在线性回归中使用的损失函数（也称为L2损失函数）。改行可计算模型为有标签样本预测的值，和标签的真实值之差的平方。由于取平方值，该损失函数会放大不佳预测的影响。与L1损失函数相对，平方损失函数对离群值的反应更强烈。

训练（training）构建模型的理想参数的过程。

损失（Loss）一种衡量指标，用于衡量模型的预测偏离其标签程度。要确定此值，模型需要定义损失函数。例如：线性回归模型参与均方误差MAS损失函数，分类模型采用交叉熵损失函数。

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

机器学习3-训练与损失

前言

训练模型

损失函数

关键词

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

机器学习3-训练与损失

​前言

训练模型

损失函数

关键词

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品

前言