- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

学习笔记|最大熵模型的学习

举报

darkpard 发表于 2021/11/17 22:47:23 2021/11/17

【摘要】定义（最大熵模型）假设满足所有约束条件的模型集合为定义在条件概率分布P(Y|X)上的条件熵为最大熵模型的学习过程就是求解最大熵模型的过程。最大熵模型的学习可以形式化为约束最大化问题。按照最优化问题的习惯，将求最大值问题改写为等价的求最小值问题：求解上述约束最优化问题所得的解就是最大熵模型学习的解。具体推导过程如下：这里，将约束最优化的原始问题转换为无约束最优化的对偶问题。通过求解对偶问题求...

定义（最大熵模型） 假设满足所有约束条件的模型集合为

定义在条件概率分布P(Y|X)上的条件熵为

最大熵模型的学习过程就是求解最大熵模型的过程。最大熵模型的学习可以形式化为约束最大化问题。

按照最优化问题的习惯，将求最大值问题改写为等价的求最小值问题：

求解上述约束最优化问题所得的解就是最大熵模型学习的解。具体推导过程如下：

这里，将约束最优化的原始问题转换为无约束最优化的对偶问题。通过求解对偶问题求解原始问题。

最优化的原始问题是

对偶问题是

由于拉格朗日函数L(P,ω)是P的凸函数，原始问题的解与对偶问题的解是等价的。

ψ(ω)称为对偶函数。同时，将其解记作

具体地，求L(P,ω)对P(y|x)的偏导数

令

则

之后，求解对偶问题外部的极大化问题

参考文献

【1】统计学习方法（第2版），李航著，清华大学出版社

【版权声明】本文为华为云社区用户转载文章，如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

评论（0）

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长