首页 > 其他分享 >统计学习方法(第二版) 第七章 支持向量机(第一节)

统计学习方法(第二版) 第七章 支持向量机(第一节)

时间:2025-01-12 17:30:40浏览次数:3  
标签:函数 间隔 第一节 支持 超平面 第七章 线性 向量

本章主要介绍线性可分支持向量机与硬间隔最大化。

前提知识:

统计学习方法(第二版) 第七章 拉格朗日对偶性-CSDN博客

目录

前言

问题引出与思考回顾

1.回顾感知机

2.回顾逻辑回归

3.寻找更好的超平面

一、线性可分支持向量机与硬间隔最大化

1.线性可分支持向量机

2.函数间隔与几何间隔

3.间隔最大化

4.最大间隔分离超平面存在唯一性

5.支持向量与间隔边界

6.求支持向量例题

7.学习的对偶算法

8.利用对偶函数来求线性可分支持向量机

总结


前言

        支持向量机是传统的机器学习方法,在接触到机器学习时,它对我的印象特别深刻,但当时由于时间和能力的有限,只是简单的学习了一下,只是大致了解支持向量机表层是如何工作的,并没有深入了解,今天在以数学的视角再来学习,希望自己能有所收获。

        支持向量机(support vector machine),简称SVM,是一种二分类模型。它的基本模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使它有别于感知机;支持向量机还包括核技巧,这使它成为实质上的非线性分类器。支持向量机的学习策略就是间隔最大化,可形式化为求解凸二次规划的问题,也等价于正则化的合页损失函数的最小化问题。支持向量机的学习算法是求解凸二次规划的最优化算法。

        支持向量机的学习方法包含构建由简至繁的模型,接下来会一点点的介绍。


问题引出与思考回顾

1.回顾感知机

感知机是对于线性可分的数据集来说,就是寻找一个超平面,将正例和负例区分开来,建立感知的损失函数应用随机梯度下降法,求解参数,进而求出超平面。我们知道所求出的超平面是不唯一的,最终结果取决于参数的初值选取和误分类点的选取顺序。对于线性可分的问题,肯定有一个超平面能最好的区分,那这超平面怎么求呢?

对于一个线性可分的数据集来说,让训练误差为零的决策边界有无数条。

2.回顾逻辑回归

逻辑回归在我的个人理解就是寻找一个超平面,经过逻辑斯蒂分布的映射,进而获得概率模型,又回归到寻找一个超平面了,那么还是哪个超平面最好呢?

3.寻找更好的超平面

这里以二维空间来举例子,方便理解。

寻找更好的超平面,以将正例和负例分的开的程度来衡量,超平面分的越开,表示模型的泛化能力比较好,比如下面的例子。

从图中我们可以看到很明显第二个直线将数据集分的更开,因为将数据分开的距离最大。

注意:在橙色线上的数据点为支持向量。后面又支持向量的定义。

一、线性可分支持向量机与硬间隔最大化

1.线性可分支持向量机

线性可分,存在无穷个分离超平面,利用线性可分支持向量机利用间隔最大化,得出最优超平面。

2.函数间隔与几何间隔

函数间隔:顾名思义就是以函数直接来计算出的间隔。

几何间隔:顾名思义就是点到直线距离公式。

3.间隔最大化

寻找几何间隔最大化的超平面。

这里不好理解的就是为什么函数间隔,对目标函数的优化没有影响呢?

        我们知道当给定一个超平面时,可能对应无穷个(w,b),这些(w,b)成倍数关系,但一个超平面所确定的支持向量是确定的,那么我们就可能能通过(w,b)到(aw,ab)使得所有支持向量到超平面的函数间隔为1,而对于原来的几何间隔没有变,也就是说对目标函数的优化也没有影响。

        这里不理解的好好回到上面再看一下函数间隔与几何间隔。

4.最大间隔分离超平面存在唯一性

最大间隔分离超平面存在唯一性的证明,了解即可。

5.支持向量与间隔边界

6.求支持向量例题

首先构建约束条件。

求解w,b求出超平面,函数间隔等于1的点(数据)为支持向量。

求解约束问题的方法就不具体介绍了,可以用拉格朗日乘数法。

7.学习的对偶算法

通过求解原问题的对偶问题的解来求原问题的解是常用的方法,经过前面的学习多少对对偶问题有了解,凸优化问题的求解。

统计学习方法(第二版) 第七章 拉格朗日对偶性-CSDN博客

8.利用对偶函数来求线性可分支持向量机


总结

        熟悉函数间隔和几何间隔,并理解间隔最大化,与原问题的提出,学会利用拉格朗日对偶性来通过对偶函数求解原问题的解,熟悉支持向量,求解支持向量,通过学习的对偶算法来求解超平面。

标签:函数,间隔,第一节,支持,超平面,第七章,线性,向量
From: https://blog.csdn.net/qq_55383558/article/details/145080180

相关文章

  • 统计学习方法(第二版) 第七章 拉格朗日对偶性
            在约束最优化问题中,常常利用拉格朗日对偶性(Lagrangeduality)将原始问题转换为对偶问题,通过解对偶问题而得到原始问题的解。该方法应用在许多统计学习方法中,例如,最大熵模型与支持向量机。这里简要叙述拉格朗日对偶性的主要概念和结果。    这里就......
  • Elasticsearch:向量数据库基础设施类别的兴衰
    过去几年,我一直在观察嵌入技术如何从大型科技公司的“秘密武器”转变为日常开发人员工具。接下来发生的事情——向量数据库淘金热、RAG炒作周期以及最终的修正——教会了我们关于新技术如何在更广泛的生态系统中找到一席之地的宝贵经验。更多有关向量搜索及结合传统搜......
  • 软考~系统规划与管理师考试——记忆篇——第七章—— IT 服务持续改进
    文章目录1、IT服务持续改进内容:2、IT服务持续改进的方法过程:3、服务测量关键成功因素4、服务测量测量指标类型:5、服务测量活动6、服务改进活动:7、服务改进成功因素:8、服务回顾活动→与客户回顾的内容1、IT服务持续改进内容:服务测量,服务回顾,服务改进改两回(既然......
  • 使用 Chroma 启动你的向量存储
    1.技术背景介绍Chroma是一个专注于开发者生产力和幸福感的AI原生开源向量数据库。它是Apache2.0许可的,并且无缝集成了LangChain,使得大规模文本处理和检索变得简单高效。无论是简单的文本嵌入还是复杂的检索任务,Chroma都能轻松应对。本篇文章将带您从安装到高级使......
  • 向量空间 Vector Spaces
    向量空间VectorSpaces​ 在GilbertStrang教授的书中,提到了导数的转置(TheTransposeofaDerivative)。在正式的向量空间内容之前,可以先了解一下导数与矩阵转置的联系。​ 考虑将矩阵看做一个运算符(或者说,算子),对于函数\(x(t)\)的线性代数。假设\(\symbfit{A}=\mathrm{d}/\mat......
  • 函数视为无穷维空间中的无穷维向量,有振动的地方就有特征值
    线性代数,即有限维空间的泛函分析二阶微分算子,满足可加性和齐次性(homogeneity),无穷维空间中的线性变换函数,就是无穷维空间中的向量,所谓向量,就是可以进行加法和数乘运算的元素,无穷维空间中可以使用傅里叶级数、勒让德多项式、泰勒级数等下面是我和chatgpt的回答问题:如何理解函......
  • 基于FPGA的SVM支持向量机二分类系统实现之Verilog编程设计
    实现基于FPGA的SVM(支持向量机)二分类系统是一项复杂而有前景的任务,尤其是在需要快速决策和低功耗的场景中。以下是对此主题的详细介绍。1.简介支持向量机(SVM)是一种常用于分类和回归分析的监督学习模型。通过使用核函数,SVM可以有效地处理线性不可分问题。在FPGA上实现SVM二......
  • Transformer、编码器、解码器、全连接FFN、自注意力机制、嵌入向量、残差连接层归一化
    一.提出背景Transformer最早是Google在2017年的AttentionIsAllYouNeed论文中提出,用于解决解决传统的序列到序列(Seq2Seq)模型在处理可变长序列时遇到的问题。(序列到序列:指的是模型的输入是一段序列,模型输出也是序列;比如语音识别中给模型一段中文语音序列,让模型给出中文文字序列......
  • Java中将特征向量转换为矩阵的实现
    哈喽,各位小伙伴们,你们好呀,我是喵手。运营社区:C站/掘金/腾讯云/阿里云/华为云/51CTO;欢迎大家常来逛逛  今天我要给大家分享一些自己日常学习到的一些知识点,并以文字的形式跟大家一起交流,互相学习,一个人虽可以走的更快,但一群人可以走的更远。  我是一名后端开发爱好者......
  • 位向量系统函数
    1基本概念$countbits( expression , list_of_control_bits )$countones( expression )$onehot( expression )$onehot0( expression )$isunknown( expression )2示例1$countbits        Thefunction $countbits countsthenumberofbi......