- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

Machine Learning笔记——Logistics回归算法

举报

Soler索莱尔HO 发表于 2018/12/20 20:06:48 2018/12/20

【摘要】 Logistic回归算法关于分类问题的例子：垃圾邮件分类问题分类网上交易对肿瘤的分析辨别预测 logistic回归又称logistic回归分析，是一种广义的线性回归分析模型，常用于数据挖掘，疾病自动诊断，经济预测等领域。基本思想： 1.寻找合适的假设函数，即分类函数，用以预测输入数据的判断结果；构造代价函数，即损失函数，...

关于分类问题的例子：

垃圾邮件分类问题

分类网上交易

对肿瘤的分析辨别预测

logistic回归又称logistic回归分析，是一种广义的线性回归分析模型，常用于数据挖掘，疾病自动诊断，经济预测等领域。

基本思想：

1.寻找合适的假设函数，即分类函数，用以预测输入数据的判断结果；构造代价函数，即损失函数，用以表2.示预测的输出结果与训练数据的实际类别之间的偏差；

3.最小化代价函数，从而获取最优的模型参数。

假设函数（分类函数）修改得到：

其中g函数是Sigmoid函数或者是逻辑函数。

Sigmoid函数图像：

从图像观察可以得到g（z）函数的值一直都在0~1之间，所以就可以推断得出h（x）的值也一定是在0~1之间。

所以假设函数和逻辑函数结合就得到：

关于肿瘤预测问题的例子：

决策界限

假设我们有一个训练集如图：（假设我们都已经拟合了这些数据）

线性边界：

非线性边界：

决策边界不是训练集的属性，而是假设本身及其参数的属性。

只要给定了参数向量，对应的图像也会随之确定。

hθ(x)函数的值表示结果取1的概率，因此对于输入x分类结果为类别1和类别0的概率分别为：

代价函数：

当y=1的时候：

当y=0的时候：

等价于：

代入代价函数，得：

其中的Cost函数和J函数都是基于最大似然估计法推导得到的。【关于最大似然估计法后续笔记会详细提到】

为了能够拟合函数，我们要找出让J函数取得最小值的参数，最小化代价函数的方法，是使用梯度下降法。

如果说想要获得代价函数J的最小值，重复的更新过程：

求偏导得：

最后得过程可以改写为：

多元分类：一对多

原理：

假如我们由一个训练集（如图），包含着三个类别：三角形表示y=1，正方形表示y=2，叉表示y=3

通常得解决方式就是：将这个训练集转化为三个独立得二元分类问题。

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

评论（0）

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长