首页 > 其他分享 >1.5 - 支持向量积SVM

1.5 - 支持向量积SVM

时间:2024-04-03 15:14:12浏览次数:28  
标签:1.5 SVM 间隔 分类 拟合 线性 向量

1. 模型理念

  在Logistic回归模型中,决策边界一旦能够将数据完全正确的分类,优化过程(梯段下降过程)就会立刻停止,因为在这个时候损失函数已经取得了最小值。而SVM则是求得所有正确解中的最优解。

  支持向量积:以决策边界为中心,向两个方向做平行面直到两个平行面都恰好与两个类别的支持向量相交。两个平行面之间的距离最大的对应的决策面即 最佳决策面。

2.模型构建

2.1 目标函数

  推理过程见笔记。  注意,考虑到异常点:硬间隔 =》软间隔,对应有惩罚因子C,C越大表示对异常点的惩罚越大,分类越精确但是泛化性不好,C越小表示对异常点越容忍,分类不精确但是泛化性比较好。

2.2 优化方法

  原约束极限问题 =》 对偶问题 =》KTT条件,SMO算法求解。

2.3 SVM:线性可分到非线性可分

  对于线性不可分问题,可以利用升维的思想,如同多项式扩展,本来线性不可分的问题转换为线性可分问题。理论上讲,如果将数据特征升高到无穷维,任何问题都将变得线性可分

  核函数:在低纬空间的计算量可以实现 目标函数中两个无穷维向量点积的运算结果。

    线性核、多项式核、高斯核、tanh核,不同的核函数有不同的超参数。【多个最佳超参数组合的训练可以用网格搜索实现

3. 引发过拟合和欠拟合的因素以及改进措施

3.1 欠拟合

  不论是SVM分类还是回归,对于惩罚因子C,当C趋近于无穷大时,软间隔将退化成硬间隔,C的大小决定了间隔的软硬程度。当惩罚因子过小,模型无法很好的学习到支持向量的特征,间隔过软出现欠拟合,应 调大C。

3.2 过拟合

  惩罚因子C比较大时,模型对异常点的容忍比较小,模型会更贴合数据集,更容易受到异常点的影响,间隔过硬出现过拟合。应 调小C。

4. 使用场景以及模型特性

4.1 SVM特性

  对最终SVM影响较大的其实是数据集中的支持向量,也既:分类问题中的边界点。

  SVM对噪音比较敏感,因为噪音点经常出现在分类边界位置与支持向量混在一起,随着数据集样本数量的增加,噪音出现的可能性变大,因此,SVM更适合小批量数据集。

4.2 SVM解决回归问题

  目标函数仍然是:最宽街道中间的决策边界,因为回归问题实际样本标签会在理想值上下浮动,最宽街道的最中间的决策边界最可能拟合回归问题的理想值。

  约束条件:由分类的 ≥ 1,变成了 ≤ exp,exp是比较小的值,表示真实标签值不能偏离理想值太远,相当于分类问题中的 松弛因子ξ 。

5. 完整可运行的代码

 

标签:1.5,SVM,间隔,分类,拟合,线性,向量
From: https://www.cnblogs.com/zhangzhenw/p/18112491

相关文章

  • 面向量产的多传感器标定,统一传感器「世界观」
    智能驾驶系统主要通过多个传感器来实现对真实世界的感知。而传感器的标定也决定了感知能力上限:传感器数据的坐标(图像、点云等)与真实世界物体的坐标存在对应的转换关系,对于坐标转换模型公式中的传感器参数调整,就是标定。传感器标定主要分为内参标定和外参标定。内参标定的目的......
  • 【系统结构】向量A和B长度为8,进行点积运算A·B
    向量A和B长度为8,进行点积运算A·B,计算(1)(2)两种结构处理完成全部结果的最少时钟拍数。设处理机中每个部件输出的结果均可直接送到任何部件的输入端或存人缓冲器中,其间的传输正时不计,指令和令源操作数均能连续提供。(1)处理机有一个乘一加双功能静态流水线,乘、加均由5个流水段构成......
  • 1.5 - Numpy的方法中,axis参数的理解
    1.5.1Numpy常用方法在Numpy常用方法如:sum,argmin等方法中,经常出现参数axis。【axis表示维度,从0开始,含义是:如果设置axis=i,则计算会沿着i变化的方向操作。】示例:importsysimportnumpyasnpa=np.arange(1,7).reshape(2,3)print(a)print(np.sum(a,axis=0).sh......
  • 使用支持向量机算法解决手写体识别问题
    文章目录支持向量机导入图片测试算法fromgoogle.colabimportdrivedrive.mount("/content/drive")Drivealreadymountedat/content/drive;toattempttoforciblyremount,calldrive.mount("/content/drive",force_remount=True).支持向量机fromnumpy......
  • KernelMemory如何操作向量数据库
    使用QdrantMemory官方其实给出了使用案例,参考Qdrant.TestApplication的Program类就可以获取基本的操作方法,这里我主要补充的几点注意事项。CreateIndexAsync:创建一个长度固定的Index空间,且向量长度必须大于0。UpsertAsync:插入或更新向量记录-插入的向量长度必须和创建时一致......
  • Cortex-M7中断向量表的重定向
    1前言    系统上电后,PC会指向复位向量,即向量表中的Reset_Handler,而系统就是通过VectorTableOffsetRegister(VTOR)的值加上4字节来找到复位向量的入口的。        因为地址0处应该存储引导代码,所以它通常映射到Flash或者是ROM器件,并且它们的值不......
  • RTOS--异常向量和中断向量
    目录1异常向量2中断向量3示例说明RTOS(实时操作系统)中的异常和中断向量是操作系统处理异常事件和中断请求的关键机制。这些向量是预定义的内存地址,当特定事件发生时,处理器会跳转到这些地址执行相应的处理程序。下面将详细介绍RTOS中的异常和中断向量,并通过示例来说明它......
  • 32万7950=假设一个120kw的直流充电桩,请问根据常规使用率和电价,一年之内它能赚取多少收
    为了估算一个120kW直流充电桩一年的收入,我们需要做一些假设。以下是一些可能的假设值:充电费率:假设每千瓦时(kWh)电能的价格为0.5元至1.5元不等,具体取决于地区和电力供应商。常规使用率:假设充电桩每天工作10小时,即一年工作天数为365天。运营时间:假设充电桩全年无休,每天24......
  • 基于SVM支持向量机的数据预测matlab仿真
    1.算法运行效果图预览  2.算法运行软件版本matlab2022a 3.算法理论概述      支持向量机是一种监督学习方法,主要用于分类和回归分析。它基于结构风险最小化原则构建最优超平面以实现最大间隔分类,并且在处理非线性问题时通过核函数映射到高维特征空间来实现......
  • openGauss 行存转向量化
    行存转向量化可获得性本特性自openGauss3.0.0版本开始引入。特性简介将行存表的查询转换为向量化执行计划执行,提升复杂查询的执行性能。客户价值由于行存执行引擎在执行包含较多表达式或者关联操作的复杂查询时,性能表现不佳;而向量化执行引擎在执行复杂查询时具有优异的性能......