RDkit&mol2vec :基于逻辑回归的靶标抑制剂活性二分类对比

举报
DrugAI 发表于 2021/07/15 04:08:04 2021/07/15
【摘要】 逻辑回归(logistics regression)         逻辑回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。逻辑回归从本质来说属于二分类问题。         二分类问题是指预测的y值只有两个取值(0或1),二分类问题...

逻辑回归(logistics regression)

        逻辑回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。逻辑回归从本质来说属于二分类问题。

        二分类问题是指预测的y值只有两个取值(0或1),二分类问题可以扩展到多分类问题。例如:我们要做一个垃圾邮件过滤系统,x是邮件的特征,预测的y值就是邮件的类别,是垃圾邮件还是正常邮件。对于类别我们通常称为正类(positive class)和负类(negative class),垃圾邮件的例子中,正类就是正常邮件,负类就是垃圾邮件。

为什么要用逻辑回归

既然已经有了线性回归模型,我们为什么还要使用逻辑回归。如下图所示:在线性回归中使用0.5作为阈值来判断正例和负例的依据,但是在下图中,如果继续使用0.5作为阈值就不合适了,会导致错误的样本分类。二逻辑回归可以将预测范围从实数域压缩到(0,1)范围内,进而提升预测准曲率。

逻辑回归的优点和缺点

优点:

  1. 预测结果是介于0和1之间的概率ÿ

文章来源: drugai.blog.csdn.net,作者:DrugAI,版权归原作者所有,如需转载,请联系作者。

原文链接:drugai.blog.csdn.net/article/details/92801149

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。