最优化方法总结——梯度下降法、最速下降法、牛顿法、高斯牛顿法、LM法、拟牛顿法
创始人
2024-05-25 23:03:20
0

目录

1 最优化方法的结构

2 常用最优化方法对比分析

3 相关计算公式


1 最优化方法的结构

        最优化问题的一般形式为:

min f(x)
s.t. x\in X

其中x为决策变量,f(x)是目标函数,X为约束集或可行域。特别地,如果X=R^n,则最优化问题成为无约束最优化问题。

        最优化方法通常采用迭代法求它的最优解,其基本思想是:给定一个初始点x_0,按照某一迭代规则产品一个点列{x_n},使得当{x_n}是有穷点列时,其最后一个点是最优化模型问题的最优解。迭代规则由迭代公式决定,迭代公式的基本表示形式如下:

x_{k+1}=x_k+\alpha _kd_k

        式中,\alpha _k为步长因子,d_k为搜索方向。在最优化算法中,搜索方向d_kfx_k点处的下降方向,即:

f(x_k+\alpha _kd_k)<f(x_k)​​​​​​​

        最优化方法的基本结构如下:

  • 给定初始点x_0
  • 确定搜索方向d_k,即按照一定规则,构造 fx_k点处的下降方向作为搜索方向;
  • 确定步长因子\alpha _k,使目标函数有某种意义的下降;
  • 令 x_{k+1}=x_k+\alpha _kd_k,若x_{k+1}满足某种终止条件,则停止迭代,得到近似最优解x_{k+1}.否则,重复以上步骤。

2 常用最优化方法对比分析

        从迭代公式可知,最优化方法求解时的关键就是构造搜索方向d_k和步长因子\alpha _k。不同的搜索方向和不同的步长因子构成了不同的方法,常见的最优化方法有梯度下降法、最速下降法、牛顿法、高斯牛顿法、LM法、拟牛顿法,对应的迭代公式总结如下表:

迭代公式
梯度下降法x^{k+1}=x^k- \alpha \triangledown f(x^k)
最速下降法x^{k+1}=x^k- \alpha_k \triangledown f(x^k)
牛顿法x^{k+1}=x^k- \alpha_kH(x^k)^{-1} \triangledown f(x^k)
高斯牛顿法x^{k+1}=x^k- \alpha_kG(x^k)^{-1} \triangledown f(x^k)
LM法x^{k+1}=x^k- \alpha_kJ(x^k)^{-1} \triangledown f(x^k)
拟牛顿法x^{k+1}=x^k- \alpha_kB(x^k)^{-1} \triangledown f(x^k)

对比分析:

梯度下降法最速下降法牛顿法高斯牛顿法LM法拟牛顿法
步长因子\alpha\alpha _k\alpha _k\alpha _k

 \alpha _k

 \alpha _k

搜索方向-\triangledown f(x^k)-\triangledown f(x^k)-H(x^k)^{-1}\triangledown f(x^k)-G(x^k)^{-1}\triangledown f(x^k)-J(x^k)^{-1}\triangledown f(x^k)-B(x^k)^{-1}\triangledown f(x^k)
参数说明

 ① 步长因子\alpha为一个固定值,工程师预先设定;② 搜索方向为梯度方向 \triangledown f(x^k)的反方向

步长因子是一个变化的常数\alpha _k,每一次迭代需要重新计算。通过一位搜索算法得到H为二阶偏导矩阵,即海塞矩阵

G矩阵用来近似替代H矩阵,G=\triangledown f\triangledown f^T

J矩阵替代G矩阵,J=G+uI,u为常数,I为单位矩阵B矩阵用来近似替代H矩阵,B矩阵的形式有多种
目的求解最优化问题的基本方法梯度下降法的一种具体的实现方式提高收敛速度减小计算量解决G矩阵不正定的问题减小计算量以及H矩阵不正定的问题

 几种算法之间的关系总结如下:

  • 最速下降法是梯度下降法的一种具体实现方式。梯度下降法的步长因子是固定值,最速下降法的步长因子 是一个变化的常数\alpha _k ,即由一位搜索得到步长因子\alpha _k,使得

f(x_k+\alpha _kd_k)=minf(x_k+\beta d_k),\alpha >0

  • 牛顿法可以看成相对于梯度下降法的改进,提高了收敛速度。梯度下降法/最速下降法在确定搜索方向的时候,只用到了一阶导数,因此它的收敛速度是一阶收敛,收敛速度较慢。而牛顿法用到了二阶偏导,它的收敛速度是二阶收敛,收敛速度比梯度下降法快。
  • 高斯牛顿法是相对于牛顿法改进,简化了计算。牛顿法中的H矩阵需要计算目标函数的二阶偏导,计算量巨大,高斯牛顿法采用G矩阵替代H矩阵,大大减小了计算量。
  • LM法是相对于高斯牛顿法的改进,解决G矩阵正定问题。高斯-牛顿法的逼近步长由矩阵G的逆矩阵决定,如果矩阵G非正定,那么其逆矩阵不一定存在,即使存在逆矩阵,也会导致逼近方向出现偏差,严重影响优化方向。LM法正是为了解决矩阵G的正定问题而提出的,其将矩阵G加上单位矩阵I的倍数来解决正定问题。
  • LM法相当于最速下降法和高斯牛顿法的结合体。当u很小时,矩阵J接近矩阵G,其相当于高斯-牛顿法,此时迭代收敛速度快,当u很大时,其相当于梯度下降法,此时迭代收敛速度慢。因此LM算法即具有高斯-牛顿法收敛速度快、不容易陷入局部极值的优点,也具有梯度下降法稳定逼近最优解的特点。
  • 拟牛顿法是相对于牛顿法的改进。牛顿法虽然收敛速度快,但是需要计算海塞矩阵的逆矩阵 H^{-1} ,而且有时目标函数的海塞矩阵无法保持正定,从而使得牛顿法失效。为了克服这两个问题,人们提出了拟牛顿法。这个方法的基本思想是:不用二阶偏导数而构造出可以近似海塞矩阵(或海塞矩阵的逆)的正定对称阵。不同的构造方法就产生了不同的拟牛顿法,常用的拟牛顿算法有:DFP算法、BFGS算法、L-BFGS算法。严格意义上讲高斯牛顿法和LM法都属于拟牛顿法。

3 相关计算公式

参考链接:

最优化算法之牛顿法、高斯-牛顿法、LM算法_萌萌哒程序猴的博客-CSDN博客

梯度下降法和最速下降法的细微差别_TimingSpace的博客-CSDN博客_最速下降法

相关内容

热门资讯

因存在安全隐患 福特公司召回约... 央视记者当地时间5月14日获悉,福特汽车公司宣布,由于存在可能导致车辆在行驶过程中丧失制动功能、增加...
“流动的博物馆”进校园传薪火 本报讯(记者 宁亚琴 摄影报道)当满载文物知识的流动展板进入校园,一场跨越时空的文化对话就此开启。5...
泽连斯基:基辅已准备好进行“任... 转自:财联社【泽连斯基:基辅已准备好进行“任何形式的谈判”以结束与俄罗斯的冲突】财联社5月15日电,...
公益金赋能伊春市青少年冰雪赛事 黑龙江省伊春市地处小兴安岭腹地,作为北方知名的森林生态旅游城市,冰雪旅游一直是“林都”伊春最亮眼的名...
“当时我还以为方向盘失控了” ... 平面示意图 “晚上经过这里变道,车身都要剧烈振动一下,好影响行车安全哦。”近日,有读者向重庆晨报反映...
“青春同行,公益筑梦”爱心传递... 与此同时,一场非凡的公益之旅也在同步进行。“青春同行,公益筑梦”活动,于5月6日至31日在28省市火...
阿尼玛卿黄河水源涵养地科学考察... 本报讯(记者 师晓琼)5月13日,由三江源生态保护基金会、三江源国家公园管理局、五矿国际信托有限公司...
抽签结果出炉 北京时间5月14日,2027年男篮世界杯预选赛抽签仪式在卡塔尔多哈举行,中国男篮最终被分在B组。和中...
欧洲三大股指收盘小幅下跌 德国... 转自:财联社【欧洲三大股指收盘小幅下跌 德国DAX指数跌0.47%】财联社5月15日电,欧洲三大股指...
36岁宋轶现身央视端午晚会录制... 5月14日晚,根据录制现场的路透信息,目前确定参与的艺人包括宋轶(白旗袍古典造型获赞)、刘宇(国风舞...
特朗普中东行 “绕不开”以色列 美国总统唐纳德·特朗普5月13日至16日访问沙特阿拉伯、卡塔尔和阿拉伯联合酋长国三国,此行将不会到访...
频繁的器材变革让国乒遭遇“多哈... 2025多哈世乒赛开幕进入倒计时,中国乒乓球队已经抵达多哈,提前进行适应性训练。澳门世界杯男单丢冠之...
这场家风主题活动上,近500岁... 转自:上观新闻奉贤区南桥镇吴塘村的“明代牡丹苑”内有一株距今近500年的古牡丹。据史料记载,明代书画...
评论丨如何把握美国通胀当前走势...   孙长忠(清华大学全球私募股权研究院研究员)  美国劳工部5月13日公布4月CPI通胀数据显示:4...
俄罗斯库尔斯克州发生交通事故 ... 当地时间5月14日,俄罗斯库尔斯克州州长发布消息称,该州一地发生了严重交通事故,客车与轿车相撞,已致...
美元预测:周四零售销售数据会将...   来源:汇通网  周三(5月14日)欧盘时段,美元指数(DXY)盘中跌至100.58,下跌0.40...
欧洲债市:意大利与德国国债利差...   意大利与德国国债利差一度跌破100个基点,为2021年9月以来首次出现,反映风险偏好改善。  意...
朝阳无限社区邻里节暖心启幕 转自:劳动午报 近日,朝阳区八里庄街道朝阳无限社区举办“爱满无限 睦邻同心 共筑美好”主题邻里节,通...
马来西亚18岁中国留学生绑架案... 5月13日,两名中国留学生在马来西亚伪造绑架,骗取父母500万元赎金,被警方逮捕。5月14日,曾协助...
健康证不“健康” 不是小事 转自:劳动午报 我们日常生活中接触到的厨师、外卖配送员、护工、月嫂等从业人员,每年都至少要进行一次相...