Machine Learning笔记——Logistics回归算法

举报
Soler索莱尔HO 发表于 2018/12/20 20:06:48 2018/12/20
【摘要】 Logistic回归算法 关于分类问题的例子: 垃圾邮件分类问题 分类网上交易 对肿瘤的分析辨别预测 logistic回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。 基本思想: 1.寻找合适的假设函数,即分类函数,用以预测输入数据的判断结果;构造代价函数,即损失函数,...

关于分类问题的例子:

垃圾邮件分类问题

分类网上交易

对肿瘤的分析辨别预测

 

logistic回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。

 

基本思想:

1.寻找合适的假设函数,即分类函数,用以预测输入数据的判断结果;构造代价函数,即损失函数,用以表2.示预测的输出结果与训练数据的实际类别之间的偏差;

3.最小化代价函数,从而获取最优的模型参数。

 

假设函数(分类函数)修改得到:

 65.PNG

其中g函数是Sigmoid函数或者是逻辑函数。

 

Sigmoid函数图像:

66.png

从图像观察可以得到g(z)函数的值一直都在0~1之间,所以就可以推断得出h(x)的值也一定是在0~1之间。


所以假设函数和逻辑函数结合就得到:

67.PNG

关于肿瘤预测问题的例子:

 68.png

决策界限

69.png

假设我们有一个训练集如图:(假设我们都已经拟合了这些数据spacer.gif

线性边界:

70.png

 

非线性边界:

71.png

 

决策边界不是训练集的属性,而是假设本身及其参数的属性。

只要给定了参数向量spacer.gif,对应的图像也会随之确定。

 

hθ(x)函数的值表示结果取1的概率,因此对于输入x分类结果为类别1和类别0的概率分别为:spacer.gif

 

72.jpg

 

代价函数:

 

73.PNG

 

 

 

当y=1的时候:

74.png

 

当y=0的时候:

75.png

等价于:

76.PNGspacer.gif

 

代入代价函数,得:

77.png

其中的Cost函数和J函数都是基于最大似然估计法推导得到的。【关于最大似然估计法后续笔记会详细提到】

 

为了能够拟合函数,我们要找出让J函数取得最小值的参数spacer.gif,最小化代价函数的方法,是使用梯度下降法。

 

如果说想要获得代价函数J的最小值,重复spacer.gif的更新过程:

78.PNG

 

求偏导得:

79.png

 

最后得过程可以改写为:

80.png

 

 

多元分类:一对多

原理:

假如我们由一个训练集(如图),包含着三个类别:三角形表示y=1,正方形表示y=2,叉表示y=3

通常得解决方式就是:将这个训练集转化为三个独立得二元分类问题。

81.png


【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。