【机器学习基础】逻辑回归模型

举报
Micker 发表于 2020/06/30 22:14:35 2020/06/30
【摘要】 逻辑回归模型  Logit(逻辑回归)模型(Logit model,也译作“评定模型”,“分类评定模型”,又作Logistic regression,“逻辑回归”)是离散选择法模型之一,Logit模型是最早的离散选择模型,也是目前应用最广的模型。是社会学、生物统计学、临床、数量心理学、计量经济学、市场营销等统计实证分析的常用方法。1.逻辑回归模型  Logit模型是最早的离散选择模型,也是目...

逻辑回归模型

  Logit(逻辑回归)模型(Logit model,也译作“评定模型”,“分类评定模型”,又作Logistic regression,“逻辑回归”)是离散选择法模型之一,Logit模型是最早的离散选择模型,也是目前应用最广的模型。是社会学、生物统计学、临床、数量心理学、计量经济学、市场营销等统计实证分析的常用方法。

1.逻辑回归模型
  Logit模型是最早的离散选择模型,也是目前应用最广的模型。Logit模型是Luce(1959)根据IIA特性首次导出的;Marschark(1960)证明了Logit模型与最大效用理论的一致性;Marley(1965)研究了模型的形式和效用非确定项的分布之间的关系,证明了极值分布可以推导出Logit形式的模型;McFadden(1974)反过来证明了具有Logit形式的模型效用非确定项一定服从极值分布。
  此后Logit模型在心理学、社会学、经济学及交通领域得到了广泛的应用,并衍生发展出了其他离散选择模型,形成了完整的离散选择模型体系,如Probit模型、NL模型(Nest Logit model)、Mixed Logit模型等。模型假设个人n对选择枝j的效用由效用确定项和随机项两部分构成:
  Logit模型的应用广泛性的原因主要是因为其概率表达式的显性特点,模型的求解速度快,应用方便。当模型选择集没有发生变化,而仅仅是当各变量的水平发生变化时(如出行时间发生变化),可以方便的求解各选择枝在新环境下的各选择枝的被选概率。根据Logit模型的IIA特性,选择枝的减少或者增加不影响其他各选择之间被选概率比值的大小,因此,可以直接将需要去掉的选择枝从模型中去掉,也可将新加入的选择枝添加到模型中直接用于预测。
  Logit模型这种应用的方便性是其他模型所不具有的,也是模型被广泛应用的主原因之一。

2.什么是逻辑回归
  逻辑回归是一种分类的算法,它用给定的输入变量(X)来预测二元的结果(Y)(1/0,是/不是,真/假)。我们一般用虚拟变量来表示二元/类别结果。你可以把逻辑回归看成一种特殊的线性回归,只是因为最后的结果是类别变量,所以我们需要用胜算比取对数来作为因变量(Dependent Variable)。简单来说,逻辑回归是利用logit 函数拟合数据来预测某一个事件发生的概率的。

3.逻辑回归模型的优缺点
  Logit模型的优点
  (1)模型考察了对两种货币危机定义情况下发生货币危机的可能性,即利率调整引起的汇率大幅度贬值和货币的贬值幅度超过了以往的水平的情形,而以往的模型只考虑一种情况;
  (2)该模型不仅可以在样本内进行预测,还可以对样本外的数据进行预测;
  (3)模型可以对预测的结果进行比较和检验,克服了以往模型只能解释货币危机的局限。

  Logit模型的缺点
  逻辑回归需要大样本量,因为最大似然估计在低样本量的情况下不如最小二乘法有效。防止过拟合和欠拟合,应该让模型构建的变量是显著的;
  对模型中自变量多重共线性较为敏感,需要对自变量进行相关性分析,剔除线性相关的变量。

4.逻辑回归模型的适用场景
  用于分类场景, 尤其是因变量是二分类, 比如垃圾邮件判断(是/否垃圾邮件),是否患某种疾病(是/否), 广告是否点击等场景。



【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。