数值优化
创始人
2024-05-31 19:23:53
Steepest Gradient Descent:
  • constant step size : \(\tau = c\) 固定梯度大小
  • Diminishing step size: \(\tau = c/k\) 每次迭代后,梯度都减小
  • Exact line search \(\tau = \arg \mathop{\min}\limits_{\alpha} f(x^{k} + \alpha d)\)
  • Inexact line search \(\tau \in { \alpha | f(x^{k}) - f(x^{k} + \alpha d) \geq -c \cdot \alpha d^{T} \bigtriangledown f(x^{k}) }\)

Inexact line search:

Newton's Method:


用泰勒展开到Hessian矩阵,这是一个二次型函数,最低点位置就是下次迭代的点。

问题:

  1. 需要计算Hessian的逆
  2. Hessian一定是正定的,如果是半正定的,会有奇异值是有零的,没法求逆。如果是不定的,那有可能会往增大的方向迭代
  3. 原函数、一阶导和二阶导都要是连续的
Practical Newton's Method:修正阻尼牛顿法,为了解决牛顿法非凸函数的不稳定性

  1. 寻找一个严格正定的M,去接近Hessian矩阵
  2. 求d的时候,可以用dM = f(x),线性求解出d。
  3. 不需要求解Hessian矩阵

怎么求M:

  • 如果函数是凸的:
  1. 那Hessian一定是正定的。选择 M = Hessian + 很小的I矩阵
  2. \([\bigtriangledown ^{2} f(x)]d = - \bigtriangledown f(x)\)
  3. \(Md = - \bigtriangledown f(x), M = LL^{T}\), 用Cholesky分解将M分解为上三角和下三角的形式,可以很快的将d求解出来
  • 如果函数是非凸的,那么Hessian是不定的:
  1. \(Md = - \bigtriangledown f(x), M = LBL^{T}\) B是一个对角矩阵
  2. B可以由b1,b2,b3...构成; b可能由一个常数(正的)或\(R^{2*2}\)的矩阵,这个矩阵一定有2个特征值,一正一负。
  3. Bunch-Kaufman Factorization
Quasi Newton's Method:拟牛顿法,省去Hession逆矩阵求解,仍然需要函数是凸的

思路依然是找一个M矩阵去贴近Hession矩阵\(\triangle x = x^{k+1} - x^{k}\)\(\triangle g = \bigtriangledown f(x^{k+1}) - \bigtriangledown f (x^{k})\)
构建公式:\(\triangle g \approx M^{k+1} \triangle x\)\(\triangle x \approx B^{k+1} \triangle g, M^{K+1} B^{k+1} = I\)

怎么挑选B

相关内容

热门资讯

卡塔尔代表团抵达伊朗,讨论双边... 据伊朗方面消息,当地时间6月10日,一个卡塔尔代表团抵达伊朗德黑兰,讨论双边关系和地区局势。据了解,...
【哈尔滨新闻】聚焦“东北超” ... (来源:哈尔滨新闻眼)      今天,征战2026 东北地区城市足球联赛的呼和浩特队一行顺利抵达哈...
2026年浙江高考顺利落幕 成... 中新网杭州6月10日电(曹丹)6月10日下午,随着地理选考结束铃声响起,2026年浙江高考顺利收官。...
广东高院发布12项“粤法护企”... 中新网广州6月10日电 (方伟彬 马卓尔 徐华磊)广东省高级人民法院10日发布司法服务保障民营经济高...
深圳液冷展直击 | 乔锋智能:... (来源:乔锋智能)展会直击乔锋智能硬核亮相液冷赋算力 智铣启未来  聚焦液冷赛道,聚力智造新程!6月...