INSIDE: LLMS’ INTERNAL STATES RETAIN THE POWER OF HALLUCINATION DETECTION

时间：2024-09-04 19:53:20浏览次数：16

标签：POWER LLMS 检测 INSIDE 语义 DETECTION LLM 幻觉

本文是LLM系列文章，针对《INSIDE: LLMS’ INTERNAL STATES RETAIN THE POWER OF HALLUCINATION DETECTION》的翻译。

INSIDE：LLMS的内部状态保留了幻觉检测的力量

摘要
1 引言
2 幻觉检查的背景
3 方法
4 实验
5 相关工作
6 结论

摘要

知识幻觉引起了人们对部署的LLM的安全性和可靠性的广泛关注。之前在检测幻觉方面的努力已被用于logit级不确定性估计或语言级自一致性评估，在这些评估中，语义信息在标记解码过程中不可避免地会丢失。因此，我们建议探索LLM内部状态中保留的密集语义信息，以进行特征检测（INSIDE）。特别是，提出了一种简单而有效的特征分数度量来更好地评估响应的自一致性，该度量利用响应协方差矩阵的特征值来衡量密集嵌入空间中的语义一致性/多样性。此外，从自洽幻觉检测的角度来看，探索了一种测试时间特征裁剪方法来截断内部状态中的极端激活，这减少了过度自信的产生，并可能有利于过度自信幻觉的检测。对几种流行的LLM和问答（QA）基准进行了广泛的实验和消融研究，表明了我们的建议的有效性。

1 引言

2 幻觉检查的背景

3 方法

4 实验

5 相关工作

6 结论

标签：POWER,LLMS,检测,INSIDE,语义,DETECTION,LLM,幻觉
From： https://blog.csdn.net/c_cpp_csharp/article/details/141861173

一款好用的录屏软件：ApowerREC
ApowerREC是一款录屏软件。该录屏工具可以录屏幕任何区域及编辑视频,支持任务录制,可根据需要设置开始与停止录制时间,创建计划任务后,录屏将在特定时间自动录制电脑屏幕或摄像头。该版本已内置注册码，可以免费使用全部功能。软件截图：使用说明：1、将压缩文件解压到某固定位......
计算机Power电源状态
在计算机电源管理中，S1,S2,S3,S4代表不同的电源状态或睡眠状态。了解这些状态，对计算机设备理解功耗及工作状态有很大帮助。最近公司开会，系统同事有讲S3状态功耗很低，我猜和电脑的睡眠、息屏有关。。。emmm，不懂就要学查找资料，以下是这些状态的详细说明：S1状态（低电量等待状态，又称“......
Power BI Desktop突然自动关闭，如何恢复未保存的开发内容？
故事背景：今天有位同事在用PowerBIDesktop开发报告的时候，PowerBIDesktop软件突然自动关闭时，更让同事郁闷的是开发了两个小时的报告内容还未点击保存！同事非常担心会丢失未保存的报告开发内容，找我寻求帮助如何恢复未保存的开发内容。那我们如何解决呢？解决方案：其实PowerBIDe......
【新书】掌握大语言模型：高级技术、应用、尖端方法和顶尖LLMs
主要特性探索自然语言处理（NLP）基础和大语言模型基本原理，包括基础知识、挑战和模型类型。学习数据处理和预处理技术，以实现高效的数据管理。了解神经网络概述，包括神经网络基础、循环神经网络（RNNs）、卷积神经网络（CNNs）和变压器模型。利用大语言模型的策略和示例。描述通过强大的大语言模......
DINO: DETR with Improved DeNoising Anchor Boxes for End-to-End Object Detection
AbstractWepresentDINO(DETRwithImproveddeNoisinganchOrboxes),astate-of-the-artend-to-endobjectdetector.DINOimprovesoverpreviousDETR-likemodelsinperformanceandefficiencybyusingacontrastivewayfordenoisingtraining,amixedqu......
Grounding DINO: Marrying DINO with Grounded Pre-Training for Open-Set Object Det
AbstractInthispaper,wepresentanopen-setobjectdetector,calledGroundingDINO,bymarryingTransformer-baseddetectorDINOwithgroundedpre-training,whichcandetectarbitraryobjectswithhumaninputssuchascategorynamesorreferringexpre......
在私有化过程中不要忽视LLMs的双重逻辑能力：医学领域的数据密集型分析
链接：https://arxiv.org/abs/2309.04198原标题：Don’tIgnoreDualLogicAbilityofLLMswhilePrivatizing:AData-IntensiveAnalysisinMedicalDomain日期：Submittedon8Sep2023摘要大量的研究致力于通过喂养特定领域的数据，将通用领域的LargeLanguageModels......
探索 Power BI Desktop：数据分析的超级英雄
目录前言什么是PowerBIDesktop？PowerBIDesktop的关键特性1.多种数据源连接2.强大的数据转换和建模功能3.丰富的数据可视化组件4.互动和钻取功能5.与PowerBI服务集成PowerBIDesktop的使用场景商业分析数据科学教育和培训如何开始使用PowerBIDe......
CyberLink PowerDVD v23 激活版下载及安装教程
前言CyberLinkPowerDVD是一款全球专业蓝光影音播放软件，新版全新64位播放引擎，改进了8K超清视频播放、更高分辨率高清视频处理，同时4K视频后期处理还新增了色彩校正、对比度增强、HDR等。另外，新版支持HEIC/HEIF图像格式，播放HDR视频时不再影响桌面HDR控制，改进了VRHMD播放规范，360度......
PowerDesigner反向生成数据库模型
PowerDesigner反向生成数据库模型目录1.安装32位JDK2.安装ODBC3.配置ODBC4.更改当前DBMS5.导出数据库模型6.将Name改为Comment安装32位JDKPowerDesigner只支持32位JDK安装ODBC下载地址：https://cdn.mysql.com//Downloads/Connector-ODBC/8.0/mys......