首页 > 其他分享 >机器学习 - 常用的损失函数(交叉熵、Hinge)

机器学习 - 常用的损失函数(交叉熵、Hinge)

时间:2025-01-13 16:57:13浏览次数:3  
标签:预测 交叉 分类 损失 Hinge 函数

损失函数是一个非负实数函数,用来量化模型预测和真实标签之间的差异.

上一篇文章介绍了2种常用的损失函数,下面介绍另外2种常用的损失函数.

一、Hinge 损失函数

Hinge 损失函数是一种常用于分类任务(尤其是支持向量机,SVM)的损失函数。它衡量的是分类模型的预测结果与真实标签之间的差异,并鼓励模型不仅做出正确的分类,还要有足够的置信度。Hinge 损失函数的定义如下:

对于一个样本 (x,y),假设:

  • x 是输入特征。
  • y∈{−1,+1}是真实标签(通常取二分类问题的标签为 −1 或 +1)。
  • y^=f(x)是模型预测的值。

Hinge 损失的公式为:

其中:

Hinge 损失的几何解释

  1. 分类边界与间隔

    • 支持向量机的目标是找到一个超平面,将数据集中的不同类别尽可能分开,同时最大化分类边界的间隔。
    • Hinge 损失不仅要求预测正确,还要求样本点距离超平面有一定的间隔(至少为 1)。这种间隔约束可以增强分类器的泛化能力。

Hinge 损失与其他损失函数的比较

总结

Hinge 损失函数的核心思想是通过惩罚分类错误和间隔不足的样本,提高分类器的泛化能力。它是支持向量机的理论基础,在二分类问题中表现优异。尽管它对异常值敏感,但其凸性和间隔最大化的特点使得它在实践中被广泛应用。

二、交叉熵损失函数

交叉熵损失函数(Cross-Entropy Loss)是分类问题中常用的损失函数,尤其是在神经网络和逻辑回归中表现优异。其核心思想是衡量模型预测的概率分布与真实类别分布之间的差异,通常用于多分类和二分类任务。

公式定义

交叉熵损失的直观理解

  1. 概率匹配

    • 交叉熵损失函数惩罚模型预测分布与真实分布之间的差异。
    • 如果模型将最大概率分配给正确类别:损失趋近于 0。
    • 如果模型错误地分配较高概率给错误类别,损失会增大。
  2. 信息论解释

    • 交叉熵来自信息论中的熵概念,表示预测分布对真实分布的编码效率。
    • 当预测分布与真实分布相同,交叉熵达到最小值。
    • 当预测分布远离真实分布,交叉熵增大,表示更多的信息需要传递来纠正预测。

交叉熵损失在二分类问题中的形式

对于二分类问题:

交叉熵损失在多分类问题中的形式

对于多分类问题(使用 softmax 激活函数):

交叉熵损失的优点和缺点

优点
  1. 概率解释
    • 交叉熵直接优化模型的概率输出,使其预测值可以解释为概率。
  2. 对错误分类敏感
    • 对错误分类的预测施加较大惩罚,能够快速修正分类错误。
  3. 广泛适用
    • 无论是二分类还是多分类任务,交叉熵损失都能很好地适配。
缺点
  1. 对异常值敏感
    • 如果真实标签或预测概率接近 0,可能导致梯度过大或损失值爆炸。
  2. 数值不稳定性
    • 当 y^很接近 0 或 1 时,log⁡(y^)可能导致数值计算不稳定。

总结

交叉熵损失函数通过衡量预测分布和真实分布之间的差异,在分类任务中表现出色。它以概率为核心优化目标,具有直观的统计和信息论解释。同时,交叉熵损失具有广泛的适用性,尤其在深度学习和逻辑回归等场景中是不可或缺的工具。

标签:预测,交叉,分类,损失,Hinge,函数
From: https://blog.csdn.net/liruiqiang05/article/details/145118954

相关文章

  • STM32 HAL库函数入门指南:从原理到实践
    1STM32HAL库概述STM32HAL(HardwareAbstractionLayer)库是ST公司专门为STM32系列微控制器开发的一套硬件抽象层函数库。它的核心设计理念是在应用层与硬件层之间建立一个抽象层,这个抽象层屏蔽了底层硬件的具体实现细节,为开发者提供了一套统一的、标准化的应用程序接口(API)......
  • 【AI中数学-概率论】 概率质量函数:离散世界的概率指南
    第四章概率论第5节概率质量函数:离散世界的概率指南概率质量函数(ProbabilityMassFunction,简称PMF)是离散型随机变量的重要工具,用于描述随机变量在各个可能取值上的概率分布。PMF不仅在概率论中占据核心地位,更在人工智能、机器学习和数据科学等领域发挥着关键作用。通过深入......
  • 深入探讨聚合函数(COUNT, SUM, AVG, MAX, MIN):分析和总结数据的新视野
    title:深入探讨聚合函数(COUNT,SUM,AVG,MAX,MIN):分析和总结数据的新视野date:2025/1/13updated:2025/1/13author:cmdragonexcerpt:在数据分析和数据库管理领域,聚合函数(AggregateFunctions)是获取数据总结和统计信息的关键工具。聚合函数如COUNT、SUM、AVG、M......
  • 深入探讨聚合函数(COUNT, SUM, AVG, MAX, MIN):分析和总结数据的新视野
    title:深入探讨聚合函数(COUNT,SUM,AVG,MAX,MIN):分析和总结数据的新视野date:2025/1/13updated:2025/1/13author:cmdragonexcerpt:在数据分析和数据库管理领域,聚合函数(AggregateFunctions)是获取数据总结和统计信息的关键工具。聚合函数如COUNT、SUM、AVG、M......
  • Python函数
    Python函数是编程中的基本构建块,它们允许你将代码组织成可重用的模块。在这篇博客中,我们将探讨Python函数的基础知识、如何定义和调用函数、以及一些高级用法。什么是Python函数?在Python中,函数是一个封装了一段代码的独立单元,它可以接受输入参数并返回输出结果。函数有助于提......
  • SQL函数大集锦
    SQL提供了很多不同类型的函数,用于在查询中处理和操作数据。SQL函数通常可以分为以下几类:聚合函数(AggregateFunctions)字符串函数(StringFunctions)数值函数(NumericFunctions)日期和时间函数(DateandTimeFunctions)条件函数(ConditionalFunctions)转换函数(ConversionFunction......
  • GBase DATE(expr) 函数详解
    DATE(expr) 是一个用于从日期或日期时间表达式中提取日期部分的日期和时间函数。它在数据分析、报告生成、数据清洗、时间序列处理以及各种需要处理和转换日期数据的场景中非常实用。通过 DATE 函数,用户可以轻松地获取日期部分,忽略时间部分,从而简化日期相关的计算和比较。1. ......
  • Microsoft Sql Server 2019 函数理解
    说到函数,首先和存储过程作个比较吧,两者有一个共同点都是预编译优化后存储在磁盘中,所以效率要比T-SQL高一点点。值得注意的是,存储过程可以创建或访问临时表,而函数不可以;同时函数不可以修改表中的数据,或调用产生副作用的函数,比如rand,newid,getdate(当然这并不是绝对的);但是函......
  • Gbase CURTIME() 函数详解
    CURTIME() 是一个用于获取当前系统时间的日期和时间函数。它在数据分析、报告生成、时间序列处理、事件调度以及各种需要动态时间获取的场景中非常实用。通过 CURTIME() 函数,用户可以轻松地获取系统的当前时间,以实现时间的动态计算和管理。1. CURTIME() 函数的基本语法CURT......
  • 【C++】find() 函数全解
    博客主页:[小ᶻ☡꙳ᵃⁱᵍᶜ꙳]本文专栏:C++文章目录......