Softmax到AMSoftmax(附可视化代码和实现代码)

举报
风吹稻花香 发表于 2021/06/04 22:29:21 2021/06/04
【摘要】 Softmax   个人理解:在训练的时候,加上角度margin,把预测出来的值减小,往0那里挤压,离标注距离更大,减少训练得分,加大loss,增加训练收敛难度。 不明白的有个问题?减去m后,如果出现负数怎么办?     以下有的内容参考: https://zhuanlan.zhihu.com/p/97475133 softmax...

Softmax

 

个人理解:在训练的时候,加上角度margin,把预测出来的值减小,往0那里挤压,离标注距离更大,减少训练得分,加大loss,增加训练收敛难度。

不明白的有个问题?减去m后,如果出现负数怎么办?

 

 

以下有的内容参考:

https://zhuanlan.zhihu.com/p/97475133

softmax是归一化指数函数。首先,它是一个归一化函数,因为它的分母是  ;再次,它是指数函数,因为有函数  。所以我们使用Softmax的作用有两点:
一. 将所有值的范围归纳到[0, 1]之间;
二. 通过指数函数可以扩大分布间的差异性,即达到“马太效应”——强者越强,弱者越弱。

softmax公式如下:

 

下图1是线性函数 yi=xiwj  (红线)和Softmax函数

文章来源: blog.csdn.net,作者:网奇,版权归原作者所有,如需转载,请联系作者。

原文链接:blog.csdn.net/jacke121/article/details/117219150

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。