机器学习2-线性回归

一颗小树x 发表于 2021/06/18 21:19:12 2021/06/18
【摘要】 线性回归;本案例观察蟋蟀鸣叫的规律,训练一个模型,预测鸣叫与温度的关系。

前言

本案例观察蟋蟀鸣叫的规律,训练一个模型,预测鸣叫与温度的关系。

蟋蟀在较为炎热的天气里鸣叫更为频繁,数十年来,专业和业余昆虫学者已将每分钟的喵叫和温度方面的数据编入目录。

 

温度与蟋蟀鸣叫的数据,先了解数据的分布情况:

上图表示每分钟的鸣叫与温度的关系。

此曲线图中能看到随着温度的升,蟋蟀鸣叫次数特增加。鸣叫声与温度之间的关系是线性关系。

可以绘制一条直线来近视地表示这种关系,如下图所示:

虽然图中的每个点不是完全分布在直线上,但基本都在直线附近;线性关系用公式表示如下:

y = mx + b

其中:

  • y是指温度,是预测的值;
  • m是指直线的斜率;
  • x是指每分钟的鸣叫声次数,即输入特征的值。
  • b是指y轴截距。

 

按照机器学习的方式,写一个模型方程式:

y^{'} = b + w_{1} x_{1}

其中:

  • y^{'}是指预测的标签(输出值)
  • b是指偏差(对应y轴截距),一些机器学习文档中,称为w_{0}
  • w1是指特征1的权重。权重与上文中用m表示“斜率”的概念相同。
  • x_{1}是指特征。(输出向)

要根据新的每分钟的鸣叫声值x_{1}推断(预测)温度y^{'},只需将x_{1}值代入此模型即可。

下标(例如w1x_{1})预示着可以用多个特征来表示更复杂的模型。例如,具有三个特征的模型可以采用以下方程式:

y^{'} = b + w_{1}x_{1} + w_{2}x_{2} + w_{3}x_{3}

 

参考:https://developers.google.cn/machine-learning/crash-course/descending-into-ml/linear-regression

 

关键词

偏差(bias),距离原点的截距或偏移。偏差(也称为偏差项)在机器学习模型中用b或w_{0}表示。例如,在下面的公式中,偏差为b:y^{'} = b + w_{1} x_{1} +w_{2} x_{2} +.......w_{n} x_{n}

推断(inference),在机器学习中,推断通常指以下过程:通过将训练过的模型应用于无标签样本来做出雨雪。在统计学中,推断是指在某些观察数据条件下拟合分布参数的过程。(请参阅维基百科中有关统计学推断的文章。)

线性回归(linear regression),一种回归模型,通过将输入特征进行线性组合输出连续值。

权重(weight),模型中特征的系数,或深度网络中的边。训练模型的目标是确定每个特征的理想权重。如果权重为0,则相应的特征对模型来说没有任何影响。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区),文章链接,文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件至:cloudbbs@huaweicloud.com进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容。
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。