首页 > 其他分享 >线性可分支持向量机的原理推导【补充知识部分】9-10最大化函数max α,β L(x,α,β)关于x的函数 公式解析

线性可分支持向量机的原理推导【补充知识部分】9-10最大化函数max α,β L(x,α,β)关于x的函数 公式解析

时间:2024-10-19 18:52:51浏览次数:3  
标签:最大化 10 函数 拉格朗 max beta alpha

本文是将文章《线性可分支持向量机的原理推导》中的公式单独拿出来做一个详细的解析,便于初学者更好的理解。在主文章中,有一个部分是关于补充拉格朗日对偶性的相关知识,此公式即为这部分里的内容。


公式 9-10 是基于公式 9-9 的进一步引申,它通过引入拉格朗日乘子,将约束优化问题转化为无约束问题,并为后续的对偶问题构造奠定基础。具体地,公式 9-10 定义了一个函数 θ p ( x ) \theta_p(x) θp​(x),它是拉格朗日函数 L ( x , α , β ) L(x, \alpha, \beta) L(x,α,β) 对拉格朗日乘子 α \alpha α 和 β \beta β 取最大值的结果。公式 9-10 的表达式如下:
θ p ( x ) = max ⁡ α , β L ( x , α , β ) \theta_p(x) = \max_{\alpha, \beta} L(x, \alpha, \beta) θp​(x)=α,βmax​L(x,α,β)

1. 公式 9-10 的含义

公式 9-10 定义了一个新的函数 θ p ( x ) \theta_p(x) θp​(x),它表示在给定 x x x 的情况下,拉格朗日函数 L ( x , α , β ) L(x, \alpha, \beta) L(x,α,β) 相对于拉格朗日乘子 α \alpha α 和 β \beta β 的最大值。换句话说,对于每一个 x x x,我们通过调整 α \alpha α 和 β \beta β 来找到拉格朗日函数的最大值,得到的就是 θ p ( x ) \theta_p(x) θp​(x)。

直观理解:
  • L ( x , α , β ) L(x, \alpha, \beta) L(x,α,β) 是拉格朗日函数,结合了目标函数和约束条件。
  • α ≥ 0 \alpha \geq 0 α≥0 和 β \beta β 是拉格朗日乘子,它们控制着不等式和等式约束对优化问题的影响。
  • 最大化拉格朗日函数:通过最大化拉格朗日函数,我们能够得到当前 x x x 下的“最坏情况”,即当约束条件对目标函数施加的影响最大时的情况。

换句话说,公式 9-10 描述了在不同的 α \alpha α 和 β \beta β 值下,如何找到使得拉格朗日函数 L ( x , α , β ) L(x, \alpha, \beta) L(x,α,β) 达到最大值的拉格朗日乘子组合。

2. 为什么最大化拉格朗日函数?

公式 9-10 的最大化操作目的是为了找到一个 α \alpha α 和 β \beta β 的组合,使得在给定 x x x 下,拉格朗日函数值最大化。这反映了约束条件对优化问题的最大影响。

  • 对于不等式约束 c i ( x ) ≤ 0 c_i(x) \leq 0 ci​(x)≤0,当 c i ( x ) c_i(x) ci​(x) 违反约束时(即 c i ( x ) > 0 c_i(x) > 0 ci​(x)>0), α i c i ( x ) \alpha_i c_i(x) αi​ci​(x) 会对拉格朗日函数施加惩罚。通过最大化 α i \alpha_i αi​,我们确保这个惩罚的效果被充分考虑。
  • 对于等式约束 h j ( x ) = 0 h_j(x) = 0 hj​(x)=0,拉格朗日乘子 β j \beta_j βj​ 的作用是对违反等式约束的情况进行修正。最大化 β j \beta_j βj​ 的效果是确保等式约束的违反情况得到最大处理。

通过最大化 α \alpha α 和 β \beta β,公式 9-10 实现了一个“最坏情况下”的优化效果,也就是找到拉格朗日函数可能取得的最大值。

3. 公式 9-10 的推导背景

在拉格朗日对偶理论中,原始问题的目标是最小化目标函数 f ( x ) f(x) f(x) ,同时满足约束条件 c i ( x ) ≤ 0 c_i(x) \leq 0 ci​(x)≤0 和 h j ( x ) = 0 h_j(x) = 0 hj​(x)=0。通过引入拉格朗日乘子,我们将这些约束条件转化为拉格朗日函数的一部分。

公式 9-10 是对拉格朗日函数的最大化操作,它实际上为我们提供了一种方法来处理原始问题的约束。通过对拉格朗日乘子进行最大化,我们能够找到约束对目标函数的最大影响,从而确保我们可以在最大化约束惩罚的条件下继续最小化目标函数。

4. 对偶问题的构造

公式 9-10 为后续的对偶问题奠定了基础。我们通过最大化拉格朗日函数来构造出对偶问题。在对偶问题中,拉格朗日乘子成为主要的优化变量,而不是原始问题中的 x x x。这样可以简化问题的求解。

对偶问题的优化目标:

公式 9-10 中的最大化是对拉格朗日乘子进行的。通过最大化拉格朗日函数,我们可以找到一个关于 x x x 的最优解,从而定义对偶问题。在接下来的公式中,我们将通过对 x x x 进行最小化,构造出完整的优化问题。

5. 几何直观

几何上,公式 9-10 可以被理解为找到在约束条件的影响下目标函数的“最坏情况”。当我们在优化过程中发现 x x x 违反了某些约束,通过最大化拉格朗日乘子(即加大违反约束的惩罚),我们能够确保优化过程被引导回满足约束的区域。

6. 总结

公式 9-10 的核心是通过对拉格朗日函数中的拉格朗日乘子 α \alpha α 和 β \beta β 进行最大化操作,找到在给定 x x x 下,拉格朗日函数的最大值。这个最大化操作反映了约束条件对优化目标的最大影响,确保了在“最坏情况下”,优化过程能够考虑到约束条件的影响。

标签:最大化,10,函数,拉格朗,max,beta,alpha
From: https://blog.csdn.net/u013172930/article/details/143081336

相关文章

  • Delphi10.3 RadioGroup1 组件基本用法
    https://www.cnblogs.com/jijm123/p/14237063.html1]添加Radio项目 也可用代码添加RadioGroup1.Items.Add('Delphi7');RadioGroup1.Items.Add('Delphi10.3');而不是添加RadioButton11.RadioGroup的主要属性(1)Columns:属性属性Columns:用于设置单选按钮组中按......
  • 2024.10.19总结
    本文于github博客同步更新。A:考虑随便取一个数\(v\),用一次询问问出\(t=\log_gv\)。我们希望找到一个\(x\)使得\(v^x\equivg\pmodp\),也即\(g^{tx}\equivg\pmodp\ifftx\equiv1\pmod{p-1}\)。于是,我们希望找到的\(v\)使得\(t\)与\(p-1\)互质即可。由原根的......
  • 10.19
    别样的\(\text{NOI}\)模拟赛。\(A\)十几分钟能写完的随机化都放过去了,\(B\)题面的代码\(CE\)了,\(C\)边分治的思路仅闪过一瞬就忘了。A.离散猜数你说得对,但是若答案正确,且你的代码使用的询问次数为\(x\),std使用的询问次数为\(y\),计算\(c=\dfrac{x}{y}\)。若\(c\l......
  • 10.18
    A.钢琴教室线段树二分板子题,对于\(a_i<i\)的将\([a_i+1,i]\)区间加一,查询的话线段树上二分即可。B.丰雪千里祥音颂[PA2019]Terytoria,今年终于会写了。钦定某一条边必走,这样状态都确定了,枚举这条边,线段树维护最大值个数即可。C.不连续子串所有非空子序列的非空子序列个......
  • Leecode热题100-101.对称二叉树
    给你一个二叉树的根节点 root ,检查它是否轴对称。示例1:输入:root=[1,2,2,3,4,4,3]输出:true示例2:输入:root=[1,2,2,null,3,null,3]输出:false提示:树中节点数目在范围 [1,1000] 内-100<=Node.val<=100进阶:你可以运用递归和迭代两种方法解决这个问......
  • 1020 周总结
    之前一天联考一篇查找一个题太史了,按月merge了一下。现在在这里:https://www.cnblogs.com/Nityacke/p/18475669CF1474F首先仿照划艇的做法,把值域离散化,然后考虑dp,我们表示在第\(i\)个段,填值域\(j\),的情况\(f_{i,j}\),然后转移可以组合数计算,时间复杂度\(O(n^5)\)。CF180......
  • 720和1080p区别
    720和1080p内容和尺寸大小没有区别,只是在像素上面有区别。720p的分辨率低于1080p的分辨率。1080P是指分辨率达到1920X1080,720p是指分辨率为1280X720。720P又叫半高清,或者叫标准高清,是高清的最低标准,只有达到了720P这个标准才能叫高清视频。一、720和1080p区别720和1080p内容......
  • access数据库中的round函数是什么意思
    access数据库中的round函数是内置的四舍五入的函数,主要应用于对带小数位的数据字段进行格式化处理。Round函数的语法如下:Round(number,[numdecimalplaces]),其中,number是要进行四舍五入的数字;numdecimalplaces是可选参数,用于指定要保留的小数位数,如果省略,则默认为0。一、acces......
  • SS241019B. 染色(color)
    SS241019B.染色(color)思路首先观察结果序列长什么样子,且思考如何去重。结果序列是若干段长度若干的颜色拼成的,满足颜色序列是原序列的一个子序列,如111555334可以是123453345的一个合法结果,对应的颜色序列是1534。为了去重,要求颜色序列不存在两个相邻的颜色。发现可以转换......
  • LeetCode热题100|买卖股票的最佳时机(贪心)
    简述题意省流版:在一个序列里找到max(a[i]-a[k])且i>k。解题思路:  遍历这个序列,i表示当前遍历到了第i个元素,min1表示1到i这个范围内最小的元素,max1表示1到i这个范围内最大的【max(a[i]-a[k])】。max1=max(max1,第i个元素的值-min1)代码如下:classSolution{public:intm......