学习笔记|拟牛顿法

举报
darkpard 发表于 2022/01/20 19:13:53 2022/01/20
【摘要】 由于牛顿法对目标函数具有很高的要求。它要求目标函数必须是二阶可导。并且,牛顿法的每一次迭代都需要计算Hessian矩阵及其逆矩阵,计算量比较大,甚至可能由于逆矩阵不存在而无法计算。拟牛顿法就是牛顿法的近似解法,学习笔记|线性可分支持向量机学习的间隔最大算法、学习笔记|最大熵模型学习的拟牛顿法、学习笔记|logistic回归等处都有涉及。1. 拟牛顿条件对x求偏导可得记那么进一步令则有这就是拟...

由于牛顿法对目标函数具有很高的要求。它要求目标函数必须是二阶可导。并且,牛顿法的每一次迭代都需要计算Hessian矩阵及其逆矩阵,计算量比较大,甚至可能由于逆矩阵不存在而无法计算。拟牛顿法就是牛顿法的近似解法,学习笔记|线性可分支持向量机学习的间隔最大算法学习笔记|最大熵模型学习的拟牛顿法学习笔记|logistic回归等处都有涉及。

1. 拟牛顿条件

对x求偏导可得

那么

进一步令

则有

这就是拟牛顿条件,根据构造逼近矩阵的不同,拟牛顿法又分DFP法、BFGS法等。

2. DFP法

DFP法的核心思想在于通过迭代的方法,逐步逼近Hessian矩阵。在DFP矩阵中,逼近Hessian矩阵的矩阵记为D,它的迭代公式为

其中,向量u、v为待定向量。

由于的维度是

为了简便,令

于是

再令

DFP算法流程:

令:

6)k=k+1,转第2)步。

3. BFGS法

在BFGS法中,用B表示Hessian矩阵的近似矩阵,它的迭代公式

于是

同样令

于是有

再令

根据Sherman-Morrison公式

BFGS算法流程:

3)解方程组

令:

7)k=k+1,转第3)步。

BFGS算法流程也可以参见学习笔记|最大熵模型学习的拟牛顿法)。

参考文献

1.https://blog.csdn.net/songbinxu/article/details/79677948
2.https://www.cnblogs.com/liuwu265/p/4714396.html

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。