首页 > 其他分享 >神经网络章节感知机部分 误分类点到线性分割超平面的距离公式 解释说明

神经网络章节感知机部分 误分类点到线性分割超平面的距离公式 解释说明

时间:2024-10-10 17:17:32浏览次数:19  
标签:yi xi cdot 样本 距离 感知机 神经网络 超平面

公式 8-4 的内容如下:
S = − 1 ∣ ∣ w ∣ ∣ y i ( w ⋅ x i + b ) S = -\frac{1}{||w||} y_i (w \cdot x_i + b) S=−∣∣w∣∣1​yi​(w⋅xi​+b)

公式 8-4 的详细解释:

该公式描述了在感知机算法中,误分类样本到超平面的距离,其中:

  • w w w 是权重向量。
  • b b b 是偏置项。
  • x i x_i xi​ 是误分类的样本点。
  • y i y_i yi​ 是样本点 x i x_i xi​ 的标签,取值为 + 1 +1 +1 或 − 1 -1 −1。
  • ∣ ∣ w ∣ ∣ ||w|| ∣∣w∣∣ 是权重向量 w w w 的欧几里得长度(L2 范数)。
  • w ⋅ x i + b w \cdot x_i + b w⋅xi​+b 是点 x i x_i xi​ 相对于超平面的距离(未标准化的带符号距离)。

解释步骤:

  1. y i ( w ⋅ x i + b ) y_i (w \cdot x_i + b) yi​(w⋅xi​+b)

    • 这个部分代表样本 x i x_i xi​ 的带符号的距离,它根据标签 y i y_i yi​ 来调整符号。
    • 如果样本 x i x_i xi​ 被正确分类,那么 y i ( w ⋅ x i + b ) > 0 y_i (w \cdot x_i + b) > 0 yi​(w⋅xi​+b)>0,否则 y i ( w ⋅ x i + b ) < 0 y_i (w \cdot x_i + b) < 0 yi​(w⋅xi​+b)<0 表示该点被误分类。
    • 这是一个带符号的距离,因为它不仅给出点到超平面的距离,还表明该点是否在分类超平面的正确侧。
  2. 误分类样本的符号

    • 对于误分类的点, y i ( w ⋅ x i + b ) y_i (w \cdot x_i + b) yi​(w⋅xi​+b) 会小于 0。这意味着公式 8-4 中的负号 − 1 ∣ ∣ w ∣ ∣ -\frac{1}{||w||} −∣∣w∣∣1​ 将使最终结果变成正值,从而表示点到超平面的绝对距离,而不是带符号的距离。
  3. 1 ∣ ∣ w ∣ ∣ \frac{1}{||w||} ∣∣w∣∣1​

    • 这个部分用于标准化距离。由于 w w w 是权重向量,它控制着超平面的方向和大小。通过除以 ∣ ∣ w ∣ ∣ ||w|| ∣∣w∣∣,我们确保计算的是点 x i x_i xi​ 到超平面的垂直距离,而不是其他斜向的距离。
    • 换句话说,这个标准化步骤将未标准化的点积 w ⋅ x i + b w \cdot x_i + b w⋅xi​+b 转换为真实的几何距离。
  4. 负号的作用

    • 负号 − 1 ∣ ∣ w ∣ ∣ -\frac{1}{||w||} −∣∣w∣∣1​ 的作用是为了将误分类样本的签名距离转为正值,因为 y i ( w ⋅ x i + b ) y_i (w \cdot x_i + b) yi​(w⋅xi​+b) 对于误分类点是负的(因为它在错误的一侧)。通过负号,最终计算出的距离是非负的,表示误分类样本到超平面的实际距离

几何解释:

  • 在感知机模型中,超平面 w ⋅ x + b = 0 w \cdot x + b = 0 w⋅x+b=0 用于分隔不同类别的数据点。对于正确分类的点, y i ( w ⋅ x i + b ) y_i (w \cdot x_i + b) yi​(w⋅xi​+b) 应该是正值,表示该点在超平面的正确一侧。对于误分类的点, y i ( w ⋅ x i + b ) y_i (w \cdot x_i + b) yi​(w⋅xi​+b) 是负值,表示该点在超平面的错误一侧。

  • 公式 8-4 计算的是这些误分类样本到超平面的垂直距离。我们需要将误分类样本“推回”到超平面的另一侧,这个距离表示了模型需要调整的程度。

举例说明:

假设我们有一个误分类样本 x i x_i xi​,其标签为 y i = 1 y_i = 1 yi​=1,且 w ⋅ x i + b = − 2 w \cdot x_i + b = -2 w⋅xi​+b=−2。那么根据公式 8-4,误分类样本到超平面的距离为:
S = − 1 ∣ ∣ w ∣ ∣ × 1 × ( − 2 ) = 2 ∣ ∣ w ∣ ∣ S = -\frac{1}{||w||} \times 1 \times (-2) = \frac{2}{||w||} S=−∣∣w∣∣1​×1×(−2)=∣∣w∣∣2​

这个结果表示样本到超平面的距离是 2 ∣ ∣ w ∣ ∣ \frac{2}{||w||} ∣∣w∣∣2​。这里,负号起到了反转作用,使得结果为正,表示几何意义上的绝对距离。

总结:

公式 8-4 表示的是误分类样本到分类超平面的垂直距离,该距离的计算通过标准化(除以 ∣ ∣ w ∣ ∣ ||w|| ∣∣w∣∣)来确保结果是垂直距离。负号用于将误分类样本的带符号距离转换为正值,表示真实的几何距离。

这个公式对理解感知机训练和误分类样本的调整至关重要,因为它为模型提供了优化的方向和大小。

标签:yi,xi,cdot,样本,距离,感知机,神经网络,超平面
From: https://blog.csdn.net/u013172930/article/details/142827466

相关文章

  • 机器学习之神经网络Neural Network
    第一部分:基本含义神经网络(NeuralNetwork)是一种模仿人脑神经元连接方式的机器学习模型,用于处理复杂的非线性问题。通过大量的参数和层级结构,神经网络可以学习数据中的特征,应用于分类、回归等任务。机器学习和人类实现人生巅峰的例子对比:如果把人比作神经网络,一次次摔倒就是......
  • 深度学习:循环神经网络RNN
    目录一、神经网络的历程1.传统神经网络存在的问题2.提出一种新的神经网络二、RNN基本结构1.RNN基本结构2.RNN的独特结构3.RNN的局限性一、神经网络的历程1.传统神经网络存在的问题无法训练出具有顺序的数据。模型搭建时没有考虑数据上下之间的关系。因为传统神经网......
  • 霍普菲尔德(Hopfield)神经网络求解旅行商问题TSP,提供完整MATLAB代码,复制粘贴即可运行
    Hopfield神经网络是以美国物理学家约翰·霍普菲尔德(JohnHopfield)的名字命名的。他在1982年提出了这种类型的神经网络模型,因此通常被称为Hopfield网络。旅行商问题(TravelingSalesmanProblem,TSP)是一个经典的组合优化问题,即在给定一组城市及城市之间的距离,找到一条遍历所有......
  • CNN Explainer: 交互式可视化学习卷积神经网络
    cnn-explainerCNNExplainer简介卷积神经网络(ConvolutionalNeuralNetworks,CNNs)是深度学习领域最重要的模型之一,在计算机视觉等领域取得了巨大成功。然而,由于CNN的复杂结构和抽象概念,对于初学者和非专业人士来说,理解CNN的工作原理往往存在较大困难。为了解决这个问题,......
  • 《神经网络》—— 循环神经网络RNN(Recurrent Neural Network)
    文章目录一、RNN简单介绍二、RNN基本结构1.隐藏中的计算2.输出层的计算3.循环三、RNN优缺点1.优点2.缺点一、RNN简单介绍循环神经网络(RecurrentNeuralNetwork,RNN)是一种用于处理序列数据的神经网络架构。与传统的前馈神经网络(FeedforwardNeuralNetwork......
  • RNN(循环神经网络)简介及应用
    一、引言在深度学习领域,神经网络被广泛应用于各种任务,从图像识别到语音合成。但对于序列数据处理的任务,如自然语言处理(NLP)、语音识别或时间序列预测等,传统的前馈神经网络(FeedforwardNeuralNetworks)显得力不从心。这是因为序列数据中存在着时间上的依赖关系,即序列中的每个元......
  • SRGNN 基于图神经网络的会话推荐 推荐系统经典文章阅读
    本文主要介绍推荐系统中会话推荐经典的文章Session-basedRecommendationwithGraphNeuralNetworks,发布在2019年的AAAI上。前置知识会话推荐:基于当前基于用户当前会话(如浏览历史或点击序列)进行个性化推荐的技术,旨在为用户实时提供相关建议,尤其在缺乏长期用户信息的情况......