机器学习2-线性回归
前言
本案例观察蟋蟀鸣叫的规律,训练一个模型,预测鸣叫与温度的关系。
蟋蟀在较为炎热的天气里鸣叫更为频繁,数十年来,专业和业余昆虫学者已将每分钟的喵叫和温度方面的数据编入目录。
温度与蟋蟀鸣叫的数据,先了解数据的分布情况:
上图表示每分钟的鸣叫与温度的关系。
此曲线图中能看到随着温度的升,蟋蟀鸣叫次数特增加。鸣叫声与温度之间的关系是线性关系。
可以绘制一条直线来近视地表示这种关系,如下图所示:
虽然图中的每个点不是完全分布在直线上,但基本都在直线附近;线性关系用公式表示如下:
其中:
- y是指温度,是预测的值;
- m是指直线的斜率;
- x是指每分钟的鸣叫声次数,即输入特征的值。
- b是指y轴截距。
按照机器学习的方式,写一个模型方程式:
其中:
- 是指预测的标签(输出值)
- b是指偏差(对应y轴截距),一些机器学习文档中,称为
- 是指特征1的权重。权重与上文中用m表示“斜率”的概念相同。
- 是指特征。(输出向)
要根据新的每分钟的鸣叫声值
推断(预测)温度 ,只需将 值代入此模型即可。下标(例如
和 )预示着可以用多个特征来表示更复杂的模型。例如,具有三个特征的模型可以采用以下方程式:
参考:https://developers.google.cn/machine-learning/crash-course/descending-into-ml/linear-regression
关键词
偏差(bias),距离原点的截距或偏移。偏差(也称为偏差项)在机器学习模型中用b或
表示。例如,在下面的公式中,偏差为b:推断(inference),在机器学习中,推断通常指以下过程:通过将训练过的模型应用于无标签样本来做出雨雪。在统计学中,推断是指在某些观察数据条件下拟合分布参数的过程。(请参阅维基百科中有关统计学推断的文章。)
线性回归(linear regression),一种回归模型,通过将输入特征进行线性组合输出连续值。
权重(weight),模型中特征的系数,或深度网络中的边。训练模型的目标是确定每个特征的理想权重。如果权重为0,则相应的特征对模型来说没有任何影响。
- 点赞
- 收藏
- 关注作者
评论(0)