Calibrating Large Language Models Using Their Generations Only

时间：2024-07-06 17:00:04浏览次数：24

标签：置信度语言 Language 校准 Models Calibrating 模型 LLM 方法

本文是LLM系列文章，针对《Calibrating Large Language Models Using Their Generations Only》的翻译。

仅使用它们的生成来校准大型语言模型

摘要
1 引言
2 相关工作
3 方法
4 实验
5 讨论
6 结论

摘要

随着大型语言模型（LLM）越来越多地部署在面向用户的应用程序中，通过准确量化模型对其预测的信心来建立信任和维护安全变得更加重要。然而，找到有效的方法来校准LLM——尤其是当模型的唯一接口是它们生成的文本时——仍然是一个挑战。我们提出了APRICOT（置信目标的辅助预测）：一种设置置信目标并训练额外模型的方法，该模型仅基于LLM的文本输入和输出来预测LLM的置信度。这种方法有几个优点：它在概念上很简单，不需要访问超出其输出的目标模型，不干扰语言生成，并且有多种潜在用途，例如通过描述预测的置信度或根据置信度调整给定答案。我们展示了我们的方法在闭卷问答中白盒和黑盒LLM的校准误差方面如何具有竞争力，以检测不正确的LLM答案。

1 引言

2 相关工作

3 方法

4 实验

5 讨论

6 结论

我们提出了APRICOT，这是一种从任何语言模型中单独获得输入和文本输出的置信度分数的通用方法。我们证明了通过问题嵌入的聚类来计算校准目标是可能的。通过随后对较小的语言模型进行微调，我们在不同的模型和数据集上以具有竞争力的校准分数，胜过其他方法来区分错误答案和正确答案。虽然我们在这项工作中只提出了第一个更基本的版本——这种方法，但它很自然地适用于旨在改进预训练语言模型校准的整个研究。最后，未来的研究还

标签：置信度,语言,Language,校准,Models,Calibrating,模型,LLM,方法
From： https://blog.csdn.net/c_cpp_csharp/article/details/140231838

BADEDIT: BACKDOORING LARGE LANGUAGE MODELS BY MODEL EDITING
本文是LLM系列文章，针对《BADEDIT:BACKDOORINGLARGELANGUAGEMODELSBYMODELEDITING》的翻译。BADEDIT：通过模型编辑后门攻击大型语言模型摘要1引言2背景和相关工作3后门攻击的轻量级编辑4BADEDIT5实验6结论摘要主流后门攻击方法通常需要大量的中......
Mean teacher are better role models-论文笔记
论文笔记资料1.代码地址2.论文地址https://arxiv.org/pdf/1703.017803.数据集地址CIFAR-10https://www.cs.utoronto.ca/~kriz/cifar.html论文摘要的翻译最近提出的TemporalEnsembling方法在几个半监督学习基准中取得了最先进的结果。它维护每个训练样本的标签预测......
Exploring Large Language Models and Hierarchical Frameworks for Classification o
本文是LLM系列文章，针对《ExploringLargeLanguageModelsandHierarchicalFrameworksforClassificationofLargeUnstructuredLegalDocuments》的翻译。探索大型非结构化法律文件分类的大型语言模型和层次框架摘要1引言2相关工作3方法：分类框架（MESc）4结......
What Makes Quantization for Large Language Models Hard？
本文是LLM系列文章，针对《WhatMakesQuantizationforLargeLanguageModelsHard?AnEmpiricalStudyfromtheLensofPerturbation》的翻译。是什么让大型语言模型的量化变得困难？微扰透镜的经验研究摘要1引言2相关工作3前言4从微扰的角度看LLM量子化5......
FOODGPT: A LARGE LANGUAGE MODEL IN FOOD TESTING DOMAIN WITH INCREMENTAL PRE-TRAI
文章目录题目摘要方法题目食品测试的大型语言模型论文地址：https://arxiv.org/abs/2308.10173摘要目前，特定领域的大型语言模型的构建是通过在基础模型上进行微调来完成的。有些模型还包含知识库，无需预先训练。这是因为基础模型在预训练过程中已经包......
django models对应的mysql类型
Django模型字段类型与MySQL数据库类型的对应关系如下：Django模型字段类型MySQL数据库类型AutoFieldBIGINTUNSIGNEDCharFieldVARCHARIntegerFieldINTDecimalFieldDECIMALDateFieldDATEDateTimeFieldDATETIMEFileField,ImageFieldVARCHAR(用于文件路径)BooleanFieldBOOL(如......
5、Django-模型-models
概念：基本模板：模板其实就是我们使用的HTML写好的页面--先在应用的目录下创建模板文件夹templates、然后在templates中创建模板文件、如html--最后在views.py中去渲染模板、使用render函数将模板返回给用户：returnrender(request,'.html') 定义模板：--模板里就是要对......
12、 Django-模型models的基本操作-增删改查
一般的数据库操作流程:1、创建数据库，设计表结构和字段2、连接Mysq1数据库，并编写数据访问层代码3.业务逻辑层去调用数据访问层执行数据库操作Diango通过Mode1操作数据库，不管你数据库的类型是MySql或者Sqlite，Django自动帮你生成相应数据库类型的SQL语句，所以不需要关注SQL语句......
11、 Django-模型基础-models-ORM框架-管理器对象
#概述django根据属性的类型确定以下信息当前选择的数据库支持字段的类型渲染管理表单时使用的默认htm1控件在管理站点最低限度的验证django会为表增加自动增长的主键列，每个模型只能有一个主键列，如果使用选项设置某属性为主键列后则django不会再生成默认的主键列#属性命......
Apple - Core Image Kernel Language Reference
本文翻译整理自：CoreImageKernelLanguageReference（更新日期：2015-01-12https://developer.apple.com/library/archive/documentation/GraphicsImaging/Reference/CIKernelLangRef/Introduction/Introduction.html#//apple_ref/doc/uid/TP40004397-CH1-SW1文章目录一......