首页 > 其他分享 >【scipy 基础】--最优化

【scipy 基础】--最优化

时间:2023-11-18 10:45:58浏览次数:35  
标签:plt 函数 -- optimize scipy ax data 最优化

SciPy库的optimize模块主要用于执行各种优化任务。
优化是寻找特定函数的最小值或最大值的过程,通常用于机器学习、数据分析、工程和其他领域。

scipy.optimize提供了多种优化算法,包括梯度下降法、牛顿法、最小二乘法等,可以解决各种复杂的优化问题。
该模块还包含一些特定的函数,用于解决某些特定类型的优化问题,如多维非线性优化、约束优化、最小二乘问题等。
此外,scipy.optimize还提供了一些工具,如多线程支持、边界条件处理、数值稳定性措施等,以提高优化的效率和准确性。

1. 主要功能

最优化是数学学科中的一个重要研究领域,optimize模块包含的各类函数能够帮助我们节省大量的计算时间和精力。

类别 说明
优化 包含标量函数优化,局部优化,全局优化等各类方法
最小二乘法和曲线拟合 包含求解最小二乘法问题,各种拟合曲线的方法
求根 包含多种求根的方法,比如布伦特方法,牛顿-拉夫森方法等10来种求根方法
线性规划 内置多种线性规划算法以及混合整数线性规划计算等
分配问题 解决线性和分配问题,包括二次分配和图匹配问题的近似解等
工具函数 包含一些通用的计算方法,比如有限差分近似,海森近似,线搜索等计算函数
遗留函数 即将被淘汰的一些函数,不建议再继续使用

下面通过曲线拟合非线性方程组求解两个示例演示optimize模块的使用。

2. 曲线拟合示例

所谓曲线拟合,其实就是找到一个函数,能够尽可能的经过或接近一系列离散的点。
然后就可以用这个函数来预测离散点的变化趋势。

2.1. 最小二乘法

optimize模块的最小二乘法拟合曲线需要定义一个目标函数和一个残差函数
最小二乘法通过迭代寻找目标函数中参数的最优值,
残差函数是用来计算目标函数的返回值实际值之间的误差的。

首先,加载需要拟合的离散数据。

import pandas as pd

data = pd.read_csv("d:/share/data/A0A01.csv")
data = data[data["zb"] == "A0A0101"]
data = data.sort_values("sj")
data.head()

image.png
数据来源:https://databook.top/nation/A0A (其中的A0A01.csv

然后,依据其中1978年~2022年居民人均可支配收入绘制散点图。

from matplotlib.ticker import MultipleLocator
import matplotlib.pyplot as plt

ax = plt.subplot()
ax.scatter(data["sjCN"], data["value"], marker='*', color='r')
ax.xaxis.set_major_locator(MultipleLocator(4))
ax.set_title("居民人均可支配收入(元)")

plt.xticks(rotation=45)
plt.show()

image.png

最后,用optimize模块提供的最小二乘法拟合居民人均可支配收入的变化曲线。

from scipy.optimize import least_squares

# 目标函数
def target_func(p, x):
    return p[0]*np.exp(p[1]*x) + p[2]

# 残差函数
def residual(p, x, dy):
    return target_func(p, x) - dy

p0 = [1, 1, 0]
x = range(len(data))
y = data["value"]
# 最小二乘法迭代目标函数的参数
result = least_squares(residual, p0, args=(x, y))

ax = plt.subplot()
ax.xaxis.set_major_locator(MultipleLocator(4))
ax.set_title("居民人均可支配收入(元)")

ax.scatter(data["sjCN"], data["value"], marker='*', color='r')
# 这里的result.x就是迭代后的最优参数
ax.plot(x, target_func(result.x, x), color='g')

plt.xticks(rotation=45)
plt.show()

image.png
图中绿色的曲线就是拟合的曲线,根据拟合出的曲线和目标函数,
就可以预测以后的居民人均可支配收入的变化情况。

2.2. curve_fit方法

最小二乘法需要定义目标函数残差函数,使用起来有些繁琐,optimize模块中还提供了一个curve_fit函数。
可以简化曲线拟合的过程。

from scipy.optimize import curve_fit

# 目标函数
def curve_fit_func(x, p0, p1, p2):
    return p0*np.exp(p1*x) + p2

# fitp 就是计算出的目标函数的最优参数
fitp, _ = curve_fit(curve_fit_func, x, y, [1, 1, 0])

ax = plt.subplot()
ax.xaxis.set_major_locator(MultipleLocator(4))
ax.set_title("居民人均可支配收入(元)")

ax.scatter(data["sjCN"], data["value"], marker='*', color='r')
ax.plot(x, curve_fit_func(x, *fitp), color='b')

plt.xticks(rotation=45)
plt.show()

image.png
蓝色的线就是拟合曲线,拟合结果和使用最小二乘法拟合出的是一样的,只是代码可以简化一些。

3. 非线性方程组求解示例

众所周知,手工求解非线性方程是非常困难的,如果经常遇到求解非线性方程的情况,optimize模块绝对能成为你的一个称手工具。

3.1. 非线性方程

使用optimize模块求解非线性方程非常简单。
比如方程:\(2^x+sin(x)-x^3=0\)

from scipy.optimize import root

f = lambda x: 2**x + np.sin(x) - x**3

result = root(f, [1, 1], method='hybr') 

# result.x 是方程的解
result.x
# 运行结果:
array([1.58829918, 1.58829918])

实际使用时,将变量f对应的方程换成你的方程即可。
注意,求解方程的 root 方法的参数method,这个参数支持多种求解方程的方法,可以根据方程的特点选择不同的method

支持的method列表可参考官方文档:https://docs.scipy.org/doc/scipy/reference/optimize.html#multidimensional

3.2. 非线性方程组

对于方程组,求解的方法如下:
比如方程组:\(\begin{cases} \begin{align*} x^2 +y-3 & =0 \\ (x-2)^2+y-1 & =0 \end{align*} \end{cases}\)

fs = lambda x: np.array(
    [
        x[0] ** 2 + x[1] - 3,
        (x[0] - 2) ** 2 + x[1] - 1,
    ]
)

result = root(fs, [1, 1], method="hybr")
result.x
# 运行结果:
array([1.5 , 0.75])

方程组中方程个数多的话,直接添加到变量fs的数组中即可。

4. 总结

总的来说,scipy.optimize是一个强大且易用的优化工具箱,用于解决各种复杂的优化问题。
它对于需要优化算法的许多科学和工程领域都具有重要价值。
通过使用这个模块,用户可以节省大量时间和精力,同时还能保证优化的质量和准确性。

标签:plt,函数,--,optimize,scipy,ax,data,最优化
From: https://www.cnblogs.com/wang_yb/p/17840165.html

相关文章

  • 2342
    给你一个下标从 0 开始的数组 nums ,数组中的元素都是 正 整数。请你选出两个下标 i 和 j(i!=j),且 nums[i] 的数位和与  nums[j] 的数位和相等。请你找出所有满足条件的下标 i 和 j ,找出并返回 nums[i]+nums[j] 可以得到的 最大值 。 示例1:输入:nums......
  • Vue多页面和单页面的场景
    开发分类实现方式页面性能开发效率用户体验学习成本首屏加载SEO单页一个html页面按需更新性能高高非常好高慢差多页多个html页面整页更新性能低中等一般中等快优场景单页面应用系统类网站内部网站文档类网站移动端站点多页面应用公......
  • 191-昨天写的
    编写一个函数,输入是一个无符号整数(以二进制串的形式),返回其二进制表达式中数字位数为'1'的个数(也被称为汉明重量)。 提示:请注意,在某些语言(如Java)中,没有无符号整数类型。在这种情况下,输入和输出都将被指定为有符号整数类型,并且不应影响您的实现,因为无论整数是有符号的还是无......
  • Conda常用命令
    查看所有环境列表condainfo--envs*是指当前所处的环境创建新环境condacreate--nametest切换环境condaactivatetest不写名字,会切回base环境删除环境condaremove--nametest--all如果当前在test环境,需要切换其他环境才能删这个环境,不能删当前环境......
  • linux学习-5
    文件查找、打包压缩及解压文件查找Which:在环境变量PATH设置的目录中查找符合条件的命令文件,可查看其是否存在以及执行的位置。Locate:让用户快速查找到所需要的文件或目录。它不搜索全部数据信息,而是搜索数据库/var/lib/mlocate/mlocate.db。(该数据库包含本地系统内所有文件名......
  • CentOS7下的绑核操作记录(未完待续)
    一、具体操作查看物理CPU个数cat/proc/cpuinfo|grep"physicalid"|sort|uniq|wc-l查看每个物理CPU中core的个数(即核数)cat/proc/cpuinfo|grep"cpucores"|uniq查看逻辑CPU的个数cat/proc/cpuinfo|grep"processor"|wc-l查看cpucores数量:grep"......
  • vs2022安装dev控件工具箱不显示
    我的vs版本是2022的,然后第一次安装dev控件我下的是20.2版本的。安装完了之后工具箱中一直没有显示dev相关控件。然后我尝试过修复,还是没有达到目的。试过网上的办法“ToolboxCreator.exe/ini:toolboxcreator.ini”,还是没用。我以为版本太新了,然后我网上找了个15.2的安装。安装完......
  • 创建顺序表(C++)
    include<stdio.h>defineMaxSize10 //定义最大长度//创建顺序表typedefstruct{intdata[MaxSize]; //创建数组data用来储存数据元素,并将data的长度设置为MaxSizeintlength; //顺序表的当前长度}SqList;//初始化顺序表voidInitList(SqList&L){for(inti=0;i<......
  • Angular 应用实现 Lazy Load(懒加载)的项目实战经验分享
    笔者之前两篇掘金社区文章,分别介绍了企业级Angular应用开启PWA特性和服务器端渲染,从而提升用户体验的两种设计思路:Angular应用支持PWA(ProgressiveWebApplication)特性的开发步骤分享基于AngularUniversal引擎进行服务器端渲染的前端应用StateTransfer故障排查......
  • 4.6 Windows驱动开发:内核遍历进程VAD结构体
    在上一篇文章《内核中实现Dump进程转储》中我们实现了ARK工具的转存功能,本篇文章继续以内存为出发点介绍VAD结构,该结构的全程是VirtualAddressDescriptor即虚拟地址描述符,VAD是一个AVL自平衡二叉树,树的每一个节点代表一段虚拟地址空间。程序中的代码段,数据段,堆段都会各种占用一......