收敛速度

由算法A产生的迭代序列${x^{k}$在某种意义下收敛到$x}$即$\lim_{k \to \infty} \left | x^k-x \right | =0$，且存在常数$\alpha>0,q>0$
$$
s.t.\lim_{k \to \infty} \frac{\left | x^{k+1}-x* \right | }{\left | x^k-x* \right | ^{\alpha}} =q
$$
则称算法A产生的点列${x^k}$具有$\alpha$阶的收敛速度或称算法A是$\alpha$阶收敛的

$\alpha=1,且0<q\le1$,算法A线性收敛
$1<\alpha<2,且q>0/\alpha=1,q=0$,算法A超线性收敛
$\alpha=2$,算法A二阶收敛

最速下降法

选择$x^{k$处的负梯度作为搜索方向$d}k=-\grad f(x^k)$,步长$\alpha_k$是$\phi (\alpha)=f(x^k+\alpha d^k)$中的精确最小点，${\phi }' (\alpha)=0$
$$
{\phi }' (\alpha)=\grad f(x^k+\alpha d^k)=-\grad f(x^{k+1})T\grad f(x^k)=0
$$
特点：

简单直观
收敛
搜索方向只要计算$\grad f(x^k)$

缺点：

收敛速度慢（线性收敛）
Zigzag现象
不具备二次中止性（在有限步内求得凸二次函数最优解）

最速下降法

牛顿法

基本思想：在当前$x^{k$处选择$d}k=-[\grad^2f(xk)]^{-1}\grad f(x^k)$

理解：对$x^k$处的二次逼近函数进行最小化
$$
\min (f(x^k)+\grad f(x^k)T(x-x^k)+\frac{1}{2} (x-x^k)T\grad f(x^k)(x-xk))\
x^{k+1}=xk-[\grad^2f(xk)]^{-1}\grad f(x^k)\
所以d^k=-[\grad2f(x^k)]\grad f(x^k),步长\alpha_k=1
$$
步骤：

step0：$x^0,\varepsilon ,k:=0$
step1:$\left | \grad f(x^k) \right | \le \varepsilon $?
step2:计算$d^k$
step3:$x^{k+1}=xk+d^k,k:=k+1$go to step1

优点：

初始点$x^{0$取得比较接近收敛点$x}*$，且$\grad^2f(x)$满足比较好的性质时二阶收敛，具有二阶中止性

缺点：

计算量大，要计算Hesse矩阵
适用范围窄

牛顿法

阻尼/修正牛顿法

对牛顿法的方向和步长进行修正

修正$\alpha_k$：

$\alpha_k=1$时能否让目标函数充分下降
如果否，用线搜索重新确定$\alpha_k$

修正方向$d^k$:$dk=-B_k^{-1}\grad f(x^k)$

若$\grad^2f(xk)>0$，则$B_k:=\grad^2f(xk)>0$
否则修正方法：
- 1.$B_k:=\grad^2f(xk)+\lambda E,\lambda 为适当正数保证B_k正交$
- 2.考虑特征值分解
  
  $\grad^2f(xk)=Q^T\Lambda Q,其中\Lambda=diag{\lambda_1 \cdots\lambda_n}$
  
  $B_k=Q^Tdiag(\tau _i) Q,\tau _i=\left{\begin{matrix}
  \lambda_i ,\ \ \ if \lambda_i \ge \delta \
  \delta,\ \ \ \ \ \ \ otherwise
  \end{matrix}\right.(\delta为适当正数)$

拟牛顿法

考虑$f(x)$在当前点$x^k$的二次近似函数
$$
m_k(x):=f(x^k)+\grad f(x^k)T(x-x^{k)+\frac{1}{2}(x-x}k)^TB_k(x-xk)\
B_k>0,并且不仅要体现一些二次信息，还要容易获取\
利用\min m_k(x)得d^k=-B_k \grad f(x^k)
$$
步骤：

step0: $x^0 ,\varepsilon,k:=0,B_0=\grad^2f(x0)+\lambda E $
step1: if $\left | \grad f(x^*) \right | \le \varepsilon $?
step2:算$d^k=-B_k \grad f(x^k)$
step3:确定步长$\alpha_k$（采用线搜索）
step4:$x^{k+1}=xk+\alpha_kd^k$确定$B_{k+1},k:=k+1$ go to step1

拟牛顿法是一类方法
$$
B_{k+1}矩阵得确定，拟牛顿法的基本要求\
\grad f(x^{k+1})-\grad f(x^k)=B_{k+1}(x-x^k)\
y_k=\grad f(x^{k+1})-\grad f(x^k);s_k=x-x^k\
y_k =B_{k+1}s_k\
B_{k+1}:n\times n;所以\frac{n(n+1)}{2}个变量，n个方程
$$

$$
H_{k+1}=B_{k+1}^{-1}\
所以Bs_k=y_k \to Hy_k=s_k\
$$

几种方法:

DFP方法(秩2)

$$
H_{k+1}=H_{k}-\frac{H_k y_k y_k^TH_k}{y_kTH_k y_k}+\frac{s_k s_k^T}{y_kTs_k}
$$

BFGS方法（秩2）

$$
B_{k+1}=B_k-\frac{B_k s_k s_k^TB_k}{s_kTB_k s_k}+\frac{y_k y_k^T}{y_kTs_k}
$$

被认为是最有效的拟牛顿法，超线性收敛

SR-1(秩1)

$$
B_{k+1}=B_k+\frac{(y_k-B_ks_k)(y_k-B_ks_k)^{T}{(y_k-B_ks_k)}Ts_k}
$$

迭代公式更简单，但不保证正定性

适当条件下达到n步超线性收敛$\lim_{k \to \infty} \frac{\left | x^{k+1+n}-x* \right | }{\left | x^k-x* \right | ^{\alpha}} =0$

标签：xk,right,frac,grad,无约束,问题,alpha,收敛,优化
From： https://www.cnblogs.com/zzylovemath/p/18462719

函数递归之青蛙跳台阶问题
一、题目：一个青蛙一次只能向上跳一级或者跳两级台阶问：这个青蛙跳上n级台阶有多少种跳法二、解题：分析：我们将跳法的个数叫做F(n)，不妨从n比较下的时候寻找一下规律nF(n)1122334558613721往下列举不难发现每一项都是其前面两项的和，所以这个问题就可以看作从第二项开始的......
【话题】ChatGPT的局限性及其在处理复杂或偏门问题时的表现
ChatGPT作为一种基于人工智能技术的语言模型，其设计目的是为生成类似人类的文本，并且能够对广泛的话题提供信息和帮助。尽管它拥有强大的自然语言处理能力，但依然存在一些固有的局限性，尤其是在面对非常复杂或偏门的问题时。局限性的来源局限性来源描述训练数据限......
高性能计算学习笔记-优化(2)
一、Loop循环优化有以下几种循环合并：两个循环合并到一个循环中循环展开：循环内的并行技术循环交换：改变多维数组的空间访问顺序，改善空间局部性，提高cache命中率循环分布：将一个循环拆分为多个循环，使编译器可以进行向量化优化循环不变：循环中不发生变化的量提到循环外面，避免重......
基于牛顿拉夫逊算法优化长短期记忆网络结合注意力机制(NRBO-LSTM-Attention)（多输入多
文章目录效果一览文章概述部分源码参考资料效果一览文章概述基于牛顿拉夫逊算法优化长短期记忆网络结合注意力机制(NRBO-LSTM-Attention)（多输入多输出）（多输入多输出）MATLAB完整源码和数据纯手工制作，代码质量极高，注释清晰，excel数据，方便替换1.data为数据集，10个......
java中HashMap扩容机制详解（扩容的背景、触发条件、扩容的过程、扩容前后的对比、性能
在Java中，HashMap是一个非常常用的数据结构，基于哈希表实现，它通过键值对的形式存储数据。为了保证其操作的效率，HashMap采用了一种动态扩容机制。当HashMap中元素数量增长到一定程度时，会自动进行扩容。本文将详细讲解HashMap的扩容机制，包括其触发条件、过程、及扩容过程中可能......
销售团队管理过程常见问题
一、招聘与选拔在竞争激烈的市场环境中，寻找并选拔出既有能力又符合企业文化的销售人才是企业面临的首要挑战。优秀销售人才的稀缺性加剧了这一难题，而仅凭面试难以全面评估候选人的销售潜力和坚韧精神。因此，设计一套高效、多维度的招聘流程与评估标准显得尤为关键。这包括背景调查......
VUE:子组件的mounted中获取不到props中的值问题
现象：mounted读取list为空断点放过去，界面却显示数据正常处理：props:{list:{type:Array}},watch:{list:{handler(newVal,oldVal){console.log('initfinish:',newVal)//后续待处理写在这里......
【核心复现】基于合作博弈的综合能源系统电-热-气协同优化运行策略（Matlab代码实现）
......
【分布式能源选址与定容】光伏、储能双层优化配置接入配电网研究（Matlab代码实现）
......
【鲁棒优化、大M法、C&CG算法】计及风、光、负荷不确定性两阶段鲁棒优化（Matlab代码实
......

无约束优化问题

收敛速度

最速下降法

牛顿法

阻尼/修正牛顿法

拟牛顿法

DFP方法(秩2)

BFGS方法（秩2）

SR-1(秩1)

相关文章

赞助商

阅读排行