幻觉

2025-01-20大模型的幻觉太严重了，姑且作为参考。
假设：输入（中文）："我有一本书"目标（英文）："Ihaveabook"一，训练阶段：在训练阶段，我们希望训练模型从源语言（中文）生成目标语言（英文）。在这个过程中，解码器依赖于编码器的输出，并通过与目标序列进行比较来计算损失，并优化模型参数。#1.输入序列（中文）：输入句子为中文“我有一本书”，它将
2025-01-15解决 AI 幻觉：AutoGen 与 GraphRAG 如何重塑可靠 AI
解决AI幻觉：AutoGen与GraphRAG如何重塑可靠AI生成式人工智能（GenAI）正在各行各业引发变革，但一个严峻挑战却频繁出现：大型语言模型（LLM）中的幻觉现象。想象一下，你的人工智能自信满满地输出错误信息，这就是幻觉。当你依靠人工智能做商业决策时，这可是个大问题。在这篇文章中，我们将剖析两种
2025-01-02Agentic方法减少LLM幻觉：深度解析与实践（文末含代码）
在人工智能领域，尤其是大型语言模型（LLM）的应用中，幻觉（Hallucination）现象一直是影响模型可靠性和准确性的关键问题。幻觉（如何消除大型语言模型（LLM）中的幻觉现象）指的是LLM生成的文本要么毫无意义，要么与输入数据相矛盾。这不仅降低了用户体验，还可能导致严重的误解和错误决策。为了应对
2024-12-26如何消除大型语言模型（LLM）中的幻觉现象
大型语言模型（LargeLanguageModels，简称LLM）已逐渐成为自然语言处理领域的重要基石。它们能够生成连贯、有逻辑的文本，甚至在某些情况下展现出令人惊叹的创造力。然而，LLM的“幻觉”（hallucinations）(LLM幻觉：现象剖析、影响与应对策略)问题一直是AI开发者们面临的巨大挑战。幻觉现
2024-12-09基于验证链（Chain of Verification）的大语言模型幻觉问题解决方案
LLM(SEALONG：LLM（LargeLanguageModel）在长上下文推理任务中的自我改进)在生成内容时往往会遭遇一个棘手的问题——幻觉（Hallucination）。模型自信地输出虚假或误导性信息，对依赖其准确输出的开发者、工程师及用户构成了实质性的挑战。为解决这一问题，研究者提出了ChainofVerificat
2024-11-23积硅步-Nov24
1.靓女同事报障说她电脑上的压缩包怎么打不开了，想着这不是小tip一件，到其电脑上一看，rar压缩包的默认打开方式变成了edge，右键->打开方式，咦，怎么只有打开一次的按钮，始终使用那个按钮消失了，这怎么难倒我呢，再右键->属性，咦，怎么属性的打开方式也不见了呢，也就这样，VOIT了，怎么难倒我呢，控制面
2024-09-27大模型还能产生幻觉？一文讲清楚原理和解决方法
“像我们这样相信物理学的人都知道，过去、现在和未来之间的区别只是一种顽固执着的幻觉。换句话说，时间是一种幻觉。”——波尔幻觉，即一种看似真，实为假的感受。最近接触到了一个概念：大模型幻觉。有点好奇，大模型还能产生幻觉？于是查找了一些资料，开始了解。一、大模型幻觉，像你身边那个爱
2024-09-26吉利：通过怀疑建模减轻LLM的幻觉
2024-09-25微软宣称其新工具可纠正人工智能幻觉但专家依然对此表示怀疑
人工智能经常胡言乱语，微软现在说它有办法解决这个问题，但我们有理由对此持怀疑态度。微软今天发布了一项名为"更正"（Correction）的服务，它可以自动修改人工智能生成的与事实不符的文本。Correction首先会标记出可能存在错误的文本–例如，公司季度财报电话会议的摘要可能存在错误
2024-09-19通过CLIP引导解码减轻大型视觉-语言模型中的幻觉问题
人工智能咨询培训老师叶梓转载标明出处大型视觉-语言模型（LVLMs）因其在视觉推理方面的能力而备受瞩目，被视为实现自主操作智能体的重要里程碑。但它在生成文本时容易出现对象幻觉问题，即描述中包含不存在的对象，这严重限制了它们的可靠性和实用性。标题为了解决这一
2024-09-17ANAH: Analytical Annotation of Hallucinations in Large Language Models
本文是LLM系列文章，针对《ANAH:AnalyticalAnnotationofHallucinationsinLargeLanguageModels》的翻译。ANAH：大型语言模型中幻觉的分析注释摘要1引言2数据集构造3幻觉注释器4实验5相关工作6结论和未来工作7局限性摘要减少大型语言模型（LLM）的
2024-09-13Google 发布 DataGemma 技术减少 AI 生成错误信息 (即幻觉)
Google推出了DataGemma，这是基于真实世界数据的两个新Gemma模型版本，旨在减少AI生成中的“幻觉”问题。DataGemma通过利用GoogleDataCommons中超过2400亿个来自可信来源的统计数据，显著提高了模型在处理数值和统计数据时的准确性。DataGemma采用了两种关键技术：检索
2024-09-04INSIDE: LLMS’ INTERNAL STATES RETAIN THE POWER OF HALLUCINATION DETECTION
本文是LLM系列文章，针对《INSIDE:LLMS’INTERNALSTATESRETAINTHEPOWEROFHALLUCINATIONDETECTION》的翻译。INSIDE：LLMS的内部状态保留了幻觉检测的力量摘要1引言2幻觉检查的背景3方法4实验5相关工作6结论摘要知识幻觉引起了人们对部署的LLM的
2024-09-04搞了一年多的RAG，在业务上落地还是很有挑战
现在提到大模型落地，目之所及所有公司都在做RAG。RAG通过利用外部数据库来增强大模型，很大程度上解决了模型幻觉问题，以及知识更新和数据安全等问题。如果在企业内落地大模型应用，还得从技术侧和业务侧共同入手。技术层面上，大模型的出现带来基于自然语言就能实现的逻辑分析能
2024-09-01PoLLMgraph: Unraveling Hallucinations in Large Language Models via State Transition Dynamics
本文是LLM系列文章，针对《PoLLMgraph:UnravelingHallucinationsinLargeLanguageModelsviaStateTransitionDynamics》的翻译。PoLLMgraph：通过状态转换动力学揭示大型语言模型中的幻觉摘要1引言2相关工作3PoLLMgraph4实验5结论局限性摘要尽管近
2024-08-29AI 网关零代码解决 AI 幻觉问题
作者：邢云阳，HigressContributor前言什么是AIAgent随着大模型技术的快速发展，越来越多的公司在实际业务中落地了大模型应用。但是人们逐渐发现了大模型能力的不足。例如：由于大模型的训练数据是有限的，因此一些垂直领域的知识，如金融，医疗等等，大模型无法回答，或者容易出现幻觉。并且
2024-08-14缓解大语言模型(LLM)幻觉方法
一、提示工程(PromptEngineering)方法1.1检索增强生成(RetrievalAugmentedGeneration,RAG)技术利用外部权威知识库来增强LLM的响应,提高输出的准确性和时效性。1.2自我优化反馈和推理技术使LLM能够自我纠正和提高可靠性。1.3提示微调技术微调提示以提高
2024-08-14多模态大模型中的幻觉问题及其解决方案
人工智能咨询培训老师叶梓转载标明出处多模态大模型在实际应用中面临着一个普遍的挑战——幻觉问题（hallucination），主要表现为模型在接收到用户提供的图像和提示时，可能会产生与图像内容不符的描述，例如错误地识别颜色、数量或位置等。这种误判可能对实际应用造成严重影响，如在自
2024-08-03AI 海洋中的塞壬之歌：大型语言模型中的幻觉现象综述
Siren’sSongintheAIOcean:ASurveyonHallucinationinLargeLanguageModels原文链接：https://ar5iv.labs.arxiv.org/html/2309.01219幻觉是什么？LLMs取偶尔会产生看似合理却偏离用户输入、先前生成内容或事实知识的输出——这一现象通常被称为幻觉。幻觉有什么分类？
2024-07-18Datawhale AI 夏令营——CPU部署大模型(LLM天池挑战赛)——Task2与3学习笔记
Task2的任务是组队+寻找灵感，这里不作阐述；Task3的任务是实现RAG应用，阅读文档并观看卢哥的直播后，结合个人经验做个分享。运行大语言模型，对LLM使用的加深，我们发现，在使用过程中，大模型会有很多幻觉出现。为了解决幻觉，科研人员提出了各种各样的方案
2024-07-16TaD+RAG-缓解大模型“幻觉”的组合新疗法
TaD：任务感知解码技术（Task-awareDecoding，简称TaD），京东联合清华大学针对大语言模型幻觉问题提出的一项技术，成果收录于IJCAI2024。RAG：检索增强生成技术（Retrieval-augmentedGeneration，简称RAG），是业内解决LLM幻觉问题最有效的系统性方案。1.背景介绍近来，以ChatGPT为代表的生成式大
2024-07-14Lookback Lens：用注意力图检测和减轻llm的幻觉
在总结文章或回答给定段落的问题时，大语言模型可能会产生幻觉，并会根据给定的上下文回答不准确或未经证实的细节，这也被称为情境幻觉。为了解决这个问题，这篇论文的作者提出了一个简单的幻觉检测模型，其输入特征由上下文的注意力权重与新生成的令牌(每个注意头)的比例给出。它被