在场景应用中,要求我们的函数计算结果尽可能的逼近实际测量结果,可转化计算结果与测量结果的残差,通过最小化残差,便可求出最优的结果。但使用最小二乘等方法来计算时,常常会使迭代的结果显然局部最优点而导致结算错误。
差分进化原理
差分进化(Differential Evolution,DE)
是一种基于群体差异的进化算法,其计算思想主要包括以下几个方面:
一、初始化种群
首先,随机生成一个初始种群。这个种群由若干个个体组成,每个个体代表问题的一个潜在解。在实际应用中,个体通常是一个向量,其维度取决于问题的变量个数。例如,对于一个二维优化问题,个体可能是一个包含两个元素的向量。
二、变异操作
差分进化的核心是变异操作。对于每个个体,通过以下方式生成一个变异个体:
- 随机选择三个不同的个体 x r 1 x_r1 xr1、 x r 2 x_r2 xr2 和 x r 3 x_r3 xr3 从当前种群中。
- 计算差分向量 d = x r 2 − x r 3 d = x_r2 - x_r3 d=xr2−xr3。
- 然后,通过将当前个体 x i x_i xi 与差分向量进行加权组合来生成变异个体 v i v_i vi,即 v i = x i + F ⋅ d v_i = x_i + F \cdot d vi=xi+F⋅d,其中 F F F 是变异因子,通常是一个在 0 到 2 之间的常数。
变异操作的目的是引入新的基因组合,增加种群的多样性,从而探索搜索空间的不同区域。
三、交叉操作
接下来,进行交叉操作,将变异个体与当前个体进行交叉,生成一个试验个体。交叉操作的方式有多种,常见的是二项式交叉。具体步骤如下:
- 对于每个维度 j j j,随机生成一个在 0 到 1 之间的数 r j r_j rj。
- 如果 r j r_j rj 小于交叉概率 C R CR CR(通常在 0 到 1 之间)或者 j j j 等于随机选择的一个维度索引,那么试验个体的第 j j j 个维度的值从变异个体中获取,即 u i j = v i j u_{ij}=v_{ij} uij=vij;否则,试验个体的第 j j j 个维度的值从当前个体中获取,即 u i j = x i j u_{ij}=x_{ij} uij=xij。
交叉操作的目的是在保持一定多样性的同时,继承当前个体中的一些优良基因。
四、选择操作
最后,进行选择操作,确定是否用试验个体替换当前个体。选择操作通常基于目标函数值进行。如果试验个体的目标函数值优于当前个体的目标函数值,那么就用试验个体替换当前个体;否则,保持当前个体不变。
五、迭代过程
重复上述变异、交叉和选择操作,直到满足停止条件。停止条件可以是达到最大迭代次数、目标函数值达到一定精度或者在一定迭代次数内目标函数值没有明显改进等。
调用参数详解
scipy.optimize.differential_evolution
是SciPy
库中用于求解全局优化问题的一个非常强大的算法。这个算法基于遗传算法的原理,通过不断地迭代来寻找问题的最优解。下面,我将详细解释 differential_evolution
函数的主要参数、可选的求解方法、返回值以及调用经验。
(function) def differential_evolution(
func: Any,
bounds: Any,
args: Any = (),
strategy: str = 'best1bin',
maxiter: int = 1000,
popsize: int = 15,
tol: float = 0.01,
mutation: Any = (0.5, 1),
recombination: float = 0.7,
seed: Any | None = None,
callback: Any | None = None,
disp: bool = False,
polish: bool = True,
init: str = 'latinhypercube',
atol: int = 0,
updating: str = 'immediate',
workers: int = 1,
constraints: Any = (),
x0: Any | None = None,
*,
integrality: Any | None = None,
vectorized: bool = False
) -> OptimizeResult
scipy.optimize.differential_evolution中的参数设置
以下是对scipy.optimize.differential_evolution
函数的详细解释:
-
func
:- 含义:要最小化的目标函数。
- 这个函数应该接受一个一维数组作为输入,并返回一个标量值,表示目标函数在该点的值。例如:
def objective_function(x): return x[0]**2 + x[1]**2
。
-
bounds
:- 含义:一个序列的元组,每个元组代表一个变量的边界。例如,对于一个二维问题,
bounds=[(0, 10), (-5, 5)]
表示第一个变量的范围是 0 到 10,第二个变量的范围是 -5 到 5。 - 确保边界设置合理,以包含可能的最优解。如果边界设置过窄,可能会错过最优解;如果边界设置过宽,可能会增加计算时间。
- 含义:一个序列的元组,每个元组代表一个变量的边界。例如,对于一个二维问题,
-
args
:- 含义:可选参数,目标函数的额外参数。如果目标函数需要除了输入变量之外的其他参数,可以通过这个参数传递。
- 例如,如果目标函数是
def objective_function(x, a, b): return (x[0] - a)**2 + (x[1] - b)**2
,那么可以通过differential_evolution(objective_function, bounds, args=(2, 3))
来调用,这里的(2, 3)
就是传递给目标函数的额外参数a
和b
。
-
strategy
:- 含义:差分进化策略。可选的值有:‘best1bin’、‘best1exp’、‘rand1exp’、‘randtobest1exp’、‘currenttobest1exp’、‘best2exp’、‘rand2exp’、‘randtobest1bin’、‘currenttobest1bin’、‘best2bin’、‘rand2bin’、‘rand1bin’。
- 不同的策略在不同类型的问题上可能表现不同。一般来说,'best1bin’和’rand1bin’是比较常用的策略。可以尝试不同的策略,看哪个在特定问题上表现最好。
-
maxiter
:- 含义:最大迭代次数。
- 根据问题的复杂度和计算资源来设置。如果问题比较复杂,可以设置较大的迭代次数,但这也会增加计算时间。如果计算资源有限,可以适当减少迭代次数。
-
popsize
:- 含义:种群大小。
- 一般来说,较大的种群大小可以增加算法找到全局最优解的可能性,但也会增加计算时间。可以根据问题的复杂度和计算资源来调整种群大小。
-
tol
:- 含义:收敛容忍度。当目标函数的改进小于这个值时,算法停止。
- 较小的容忍度可以确保算法更接近全局最优解,但可能会增加计算时间。需要在精度和计算时间之间进行权衡。
-
mutation
:- 含义:变异因子,控制差分向量的缩放。
- 通常在 0.5 到 1 之间取值。较大的变异因子可以增加算法的探索能力,但可能会降低收敛速度。较小的变异因子可以提高收敛速度,但可能会陷入局部最优解。
-
recombination
:- 含义:交叉概率,控制个体之间的基因交换。
- 通常在 0 到 1 之间取值。较大的交叉概率可以增加算法的多样性,但可能会破坏好的解。较小的交叉概率可以保持好的解,但可能会降低算法的探索能力。
-
seed
:- 含义:随机数种子,用于可重复的结果。
- 如果需要可重复的结果,可以设置一个固定的种子值。如果不需要可重复的结果,可以不设置这个参数,让算法使用随机种子。
-
callback
:- 含义:回调函数,在每次迭代后调用。
- 可以定义一个回调函数,在每次迭代后执行一些特定的操作,例如记录优化过程中的中间结果、检查是否满足某些条件等。
-
disp
:- 含义:是否打印优化过程的信息。
- 如果设置为
True
,会打印每一代的最佳适应度值等信息。如果不需要打印信息,可以设置为False
。
-
polish
:- 含义:是否在优化结束后使用局部优化方法进行精化。
- 如果设置为
True
,会在差分进化算法找到的最优解附近使用局部优化方法(如 BFGS)进行精化,以提高解的精度。但这也会增加计算时间。如果对解的精度要求不高,可以设置为False
。
scipy.optimize.differential_evolution中的返回值
该函数返回一个OptimizeResult
对象,包含以下属性:
x
:最优解的数组。fun
:最优解对应的目标函数值。nfev
:目标函数的评估次数。nit
:实际迭代次数。message
:优化结果的消息,例如“Maximum number of iterations reached”。
调用经验总结
- 在使用
differential_evolution
函数时,首先要确定目标函数和变量的边界。目标函数应该能够准确地反映问题的优化目标,边界应该合理地限制变量的取值范围。 - 根据问题的复杂度和计算资源,选择合适的参数值。例如,对于复杂的问题,可以设置较大的迭代次数和种群大小,但要注意计算时间。对于简单的问题,可以适当减少这些参数值,以提高计算效率。
- 尝试不同的差分进化策略,看哪个在特定问题上表现最好。可以从常用的策略开始尝试,如’best1bin’和’rand1bin’。
- 调整变异因子和交叉概率,以平衡算法的探索能力和收敛速度。可以通过实验来确定合适的参数值。
- 如果需要可重复的结果,可以设置随机数种子。如果需要打印优化过程的信息,可以设置
disp=True
。 - 在优化结束后,可以考虑使用局部优化方法进行精化,以提高解的精度。但要注意计算时间的增加。
- 可以使用回调函数来记录优化过程中的中间结果或执行其他特定的操作。