支持大模型的小模型

时间：2024-09-04 21:03:05浏览次数：2

https://www.arxiv.org/pdf/2408.12748 （SLM Meets LLM: Balancing Latency, Interpretability and Consistency in Hallucination Detection ）

平衡会话 AI 幻觉检测中的延迟、可解释性和一致性

介绍

大型语言模型(llm)在实时任务(如同步的会话 ui)中与延迟作斗争。

当额外的开销增加时，比如检查幻觉，那么这个问题就会加剧。因此，微软研究院提出了一个框架，利用小语言模型(SLM)作为初始检测器， LLM 作为约束推理器，为任何检测到的幻觉生成详细的解释。目的是通过引入将 llm 生成的解释与 SLM 决策相结合的提示技术，优化实时、可解释的幻觉检测。

考虑到上图，它展示了用 LLM 作为约束推理器的幻觉检测……

初始检测:将grounding sources和假设对输入到小型语言模型(SLM)分类器中。

无幻觉:如果未检测到幻觉，则直接将“无幻觉”结果发送给客户端。

检测到幻觉:如果 SLM 检测到幻觉，基于 llm 的约束推理器会介入来解释 SLM 的决定。

一致性检查:如果推理者同意 SLM 的幻觉检测，则此信息连同原始假设一起发送给客户。

差异:如果存在分歧，可能存在问题的假设要么被过滤掉，要么被用作改进 SLM 的反馈。

更多关于微软的方法

鉴于在实际使用中很少出现幻觉，使用llm对幻觉文本进行推理的平均时间和成本是可控的。

这种方法利用了llm现有的推理和解释能力，消除了对大量特定领域数据和昂贵的微调的需要。

虽然llm传统上被用作端到端解决方案，但最近的方法已经探索了它们通过潜在特征解释小分类器的能力。

SLM 和 LLM 协议

这种实现的一个挑战是 SLM 的决定和 LLM 的解释之间可能存在差异。

• 这项工作引入了一种用于幻觉检测的约束推理器，平衡了延迟性和可解释性。

• 提供对上下游一致性的全面分析。

• 提供切实可行的解决方案，以提高检测和解释之间的一致性。

• 展示了在多个开源数据集上的有效性。

总之

• 这项研究的重点是为会话 ui 引入护栏和检查。

• 当与真实用户交互时，结合人在循环的方法有助于通过审查对话进行数据注释和持续改进。

• 它还增加了发现、观察和解释的元素，提供了对幻觉检测有效性的见解。

• 本研究中呈现的架构提供了对未来的一瞥，展示了一种更加协调的方法，其中多个模型协同工作。

• 该研究还解决了当前的挑战，如成本、延迟以及对任何额外开销进行批判性评估的需求。

• 使用小型语言模型是有利的，因为它允许使用开源模型，从而降低了成本，提供了托管灵活性，并提供了其他好处。

• 此外，这种架构可以异步应用，框架在对话发生后对其进行审查。然后，这些人工监督的审查可用于微调 SLM 或执行系统更新.

标签：LLM,检测,模型,支持,SLM,llm,幻觉
From： https://www.cnblogs.com/little-horse/p/18397344

深入浅出视觉分割大模型SAM（原理解析+代码实践）
深入浅出视觉分割大模型SAM（原理解析+代码实践）视频地址：视觉分割大模型SAM（原理解析+代码实践）_哔哩哔哩_bilibili大家好，这里是肆十二，近两年来大模型的成果在一些领域的应用已经深入人心，由于我本人主要感兴趣的方向为计算机视觉，所以今天我们来一起看下计算机视觉领域中这个......
简单聊一聊大模型微调技术-LoRA
简单聊一聊大模型微调技术-LoRAB站：肆十二-的个人空间-肆十二-个人主页-哔哩哔哩视频(bilibili.com)博客：肆十二-CSDN博客问答：(10封私信/72条消息)肆十二-知乎(zhihu.com)LoRA（Low-RankAdaptation）模型是一种用于减少深度学习模型训练中参数数量和计算资源消耗......
本地ollama的LLM模型运行微软GraphRAG
pipinstallgraphragpipinstallollama1、ollama安装直接从modelscope下载ollama安装包modelscopedownload--model=modelscope/ollama-linux--local_dir./ollama-linux#运行ollama安装脚本sudochmod777./ollama-linux/ollama-modelscope-install.shsh./ollam......
数据库系统------数据模型
数据模型数据模型是用于描述的概念性工具的集合，我感觉就和UML差不多吧，就是为了让数据库的定义、设计更规范比如说：关系模型:使用表格结构描述数据，以行和列的形式存储数据，强调数据之间的关系实体-关系数据模型面向对象数据模型对象关系数据模型半结构化数据模型网络模......
【大模型】使用 Xinference 部署本地模型，从GPU服务器到本地知识库搭建Dify【LLM大语言
基本介绍基础信息GPU服务器获取基础安装基础信息安装显卡驱动配置显卡检查下载禁用nouveau系统自带驱动显卡驱动安装安装nvidia-docker下载配置验证Xinference部署docker部署官方文档模型下载glm-4-9b-chatEmbedding（向量）模型Rerank模型模型部署Embedding（向量）模型......
CareGPT：开源驱动的医疗大语言模型
CareGPT：医疗AI的新篇章在人工智能快速发展的今天，医疗领域正迎来一场革命性的变革。CareGPT作为一个开源的医疗大语言模型项目，正站在这场变革的前沿，为医疗AI的未来描绘出令人振奋的蓝图。什么是CareGPT？CareGPT，全称"关怀GPT"，是一个专注于医疗领域的大语言模型。它不仅仅是一......
中国大模型大全 · 爆肝干货整理 · 244 个
中国大模型大全，全面收集有明确来源的大模型情况，包括机构、来源信息和分类等。序号公司大模型省市类别官网说明1百度文心一言北京......
无限上头！扩散模型竟然也是实时游戏引擎！谷歌团队首推神经模型驱动的游戏引擎，马斯克：特斯
你没有听错！一提到游戏引擎，你肯定会联想到虚幻5（不自主地再提一次《黑神话：悟空》），Unity，Cocos，但你会想到用来生成图像的扩散模型也被认为是一种游戏引擎吗？图片昨晚，谷歌DeepMind发布了一款GameNGen的神经模型，给出的生成效果，让人们惊呼：世界模型要来了！据介绍，GameNGen，是首个完全......
子比主题美化 – 自助售卡/发卡插件源码 | WordPress插件，完美支持
插件功能支持自由添加卡密支持查看卡密库存邮箱自动发送卡密信息后台卡密库存不足提醒如何使用:在后台新建一篇文章，然后选择自动售卡。设置相关价格(不支持将价格设置为0)。移动到已编辑文章的底部(添加密码信息)直接发布文章以显示文章销售卡。安装方法:在Wordpress后......
AI大模型入门指南：从基础到实践的系统学习路径
如何系统的入门大模型？本篇文章默认面向对大模型领域感兴趣的程序员。看一下围绕大模型的应用场景和人才需求：**Prompt工程：**基于提示词对大模型的使用，会问问题就行。**基于大模型的应用：在大模型生态之上做业务层产品。AI主播、AINPC、AI小助手。。。之前是会调API就行。......

支持大模型的小模型

相关文章

赞助商

阅读排行