首页 > 其他分享 >什么是人工智能幻觉?为什么AI会编造答案?丨曼孚科技

什么是人工智能幻觉?为什么AI会编造答案?丨曼孚科技

时间:2024-01-05 20:12:04浏览次数:24  
标签:AI 模型 生成式 曼孚 人工智能 ChatGPT 文本 数据

当我们欣赏由AI生成的艺术作品时,往往会被其美感和独特性所吸引,它以令人惊叹的创造力和智能对话能力,在艺术、写作、音乐等领域展现出巨大潜力,仿佛具备了人类的创作天赋。

然而,近期的一些事件引发了人们对AI系统输出准确性和可信度方面的关注,即“它自信地给出了看似正确实则错误的答案。

有用户反映ChatGPT给出的一份关于社会认知理论的顶级书单(10本)中,有4本书并不存在;谷歌技术与社会高级副总裁詹姆斯·曼尼卡在一个演示中向生成式AI询问通货膨胀问题时,AI推荐了5本不存在但听起来可能存在的书。

我们不得不面对一个问题:生成式AI的输出是否会存在虚假的“幻觉”?为什么会出现这样的事情?

 

什么是人工智能幻觉?

人工智能幻觉是一个比喻,用于描述AI作出的不符合其训练数据的自信断言,即使这些断言可能与实际情况有显著差异。

该词汇借鉴了人类心理学中对于感知错误的描述,强调AI在处理数据时可能出现的误读。如同人脑错将光影误认为实物的幻觉一样,AI也会在无意识中进行错误地预测。

语言模型擅长编造与现实无关的事实,但这并非出于它们的主观意图,因为AI无法主观感知,而是由算法层面决定。例如,AI在接收到与训练集中相似的输入数据时,会依据先前经验准确地输出,即便这些内容在新文本中不再适用。

过去数月里,像ChatGPT这样的聊天机器人已经吸引了全世界的注意力,但这也为社会治安带来一个隐患:生成式AI可以轻易地提供令人信服的虚假信息,使之成为不可靠的信息来源和潜在的诽谤策源地。

 

为什么AI会编造答案?

关于AI编造答案的问题探讨须从搜索引擎与聊天机器人的演进讲起,搜索引擎的主要代表为谷歌,聊天机器人的主要代表为Chatgpt。

在早期的互联网时代,搜索引擎主要起到了信息检索的作用,用户在搜索框输入关键词,谷歌反馈出相应的网页链接,这一过程是基于关键词与网页内容之间的匹配。

可以说,通过用广告“点缀”其搜索结果,谷歌建立了一个帝国,它的防线似乎坚不可摧,然而它有一个潜在的弱点:如果一个竞争对手能够给用户提供答案,而不是那些可能含有答案的网站链接,那么谷歌就遇到了大麻烦。

不幸的是,ChatGPT就是这样的对手。它是2022年11月由OpenAI推出的尖端聊天机器人。ChatGPT可以用清晰、简单的句子生成新内容,而不仅是一串互联网链接。它可以从头开始创作,包括商业计划书、年终总结、博客主题与代码编写。

但ChatGPT也有一个潜在弱点,它不能区分真假。原因有其二:

首先,ChatGPT是无意识的模仿者,并不理解自身在说什么,它只是从二手信息中拼凑出听起来非常权威的答案,输出读起来很好、听起来很聪明的文本,让用户认为它已经验证了所给出答案的准确性,但无法保证文本的完整性、准确性,甚至可能是一本正经的胡说八道。

其次,这些语言模型无一不是从开放网络上刮取的大量文本中训练出来的。GPT模型的原始数据集中并不存在任何东西能够将事实与虚构分开。当ChatGPT开始虚构时,其实是在找寻数据集中不存在的信息,并用完善的组句来填补空缺。

由于ChatGPT拥有惊人的数据量,所以它特别善于编造事情,而且它组织单词上下文的能力非常好,这有助于它将错误的信息无缝地放入文本中,生成让人信服的错误答案。

因此,现阶段的生成式AI还难以取代维基百科或传统搜索引擎。

 

原始材料的重要性——训练数据

本质上说,模型在学习和推理过程中的局限性、训练数据的不完备性或算法的不完善性是出现这种事件的根因。其中,原始材料的准确性尤其重要

正如特德·姜在《ChatGPT是网上所有文本的模糊图像》中所写,“要构成一个值得信赖的搜索替代品,LLM(生成式大模型)需要在高质量的数据上进行训练。” 且如果一个模型只在非常有限的数据集上进行训练,它也无法准确推广至未见过的情境。此外,如果训练数据本身包含偏差或噪音,模型也可能学习到这些错误或偏见,并在未来的决策中复现它们。

因此,拥有一个既精确又全面的数据集对于打造高效的AI系统至关紧要。正出于这个理解,数据标注的重要性被推至前所未有的高度。

数据标注是将信息分类和标签化的过程,标注的数据可以帮助模型识别特定的模式和参数,从而在输入数据时更为精确和高效。这个过程包括识别图像中的对象、翻译语音或文本、以及标记文本数据中的情感或主题等。

高质量的数据标注对于创建准确的机器学习模型至关重要,一个经过仔细标注的数据集能够极大地提高模型性能,这是AI系统在输出信息时更为精准和高效的关键。

 

总结

在这个以数据驱动的时代里,AI生成的内容已经变得无处不在,人类享受AI带来的便捷同时,也必须保持警惕,对于AI呈现的信息持有审慎的态度。

AI模型像任何其他技术一样,不是完美无缺的,其性能更多地依赖于训练数据的质量及人类对其结果的持续验证。

随着生成式AI模型的进一步发展,AI系统将变得更加智能和准确,但在那一天到来之前,人类还需保持警惕,用批判性思维来评估AI提供的每一条信息。

可以说,AI的未来充满了无限可能,但是铸就这一未来的每一步都需要我们用智慧和责任心来共同塑造。

 

标签:AI,模型,生成式,曼孚,人工智能,ChatGPT,文本,数据
From: https://www.cnblogs.com/manfukeji/p/17947996

相关文章

  • 蚂蚁集团持续探索生成式AI,20篇论文入选AI顶会NeurlPS
    当地时间12月10日,为期一周的全球AI顶级会议NeurlPS在美国路易斯安那州新奥尔良市举办。NeurlPS官方数据显示,本届会议共有12343篇有效论文投稿,接收率为26.1%。蚂蚁集团20篇论文被收录。据了解,蚂蚁此次入选的论文,覆盖计算机视觉、自然语言处理、图神经网络、图像处理等多个人工智能和......
  • optical strain(python)
    利用pythonopencv计算opticalstrainimportcv2importnumpyasnpclassOptFlowStrain:def__init__(self):self.TVL1=cv2.optflow.DualTVL1OpticalFlow_create()defrun(self,img0,img1):returnself.cal_opt_flow(img0,img1)def......
  • wsl2 通过桥接实现 局域网访问,docker 远程连接执行testcontainer
    为了不想在本地安装docker运行testcontainer容器测试,需要wsl2的所有端口,局域网都可以访问,折腾了3天,最后在https://zhuanlan.zhihu.com/p/659074950这篇文章的指引下才实现 首先打开控制面板点击程序 点击启用或关闭Window功能   确保开启虚拟化然后打开......
  • CES 2024前瞻:PC迈入AI时代
    备受瞩目的2024年消费电子展(CES)将于美国西部时间1月9日在拉斯维加斯开幕,即将登场的大量突破性技术进步令人期待不已。尤其是在今年,AI人工智能当仁不让地成为焦点,由AI赋能的各类产品将覆盖人们生活的方方面面。根据已有消息,包括华硕、戴尔、NVIDIA、三星、英特尔、AMD、海信、......
  • Python爬虫JS解密-baidu翻译
    请求分析参数构造流程这种提交数据得到响应的的请求,往往参数比较麻烦,所以参数的构造是得到完整请求的关键.首先我们要明确目标,爬取这个网站的目的是什么,那我们的目的就是模拟浏览器发送请求,完成翻译的功能,明确了目标之后我们再定位到相关的URL就比较容易了。现在先打开chrome的调......
  • 美国13岁少年通关原版俄罗斯方块:历史首人,此前仅AI可完成
    美国13岁少年通关原版俄罗斯方块:历史首人,此前仅AI可完成投递人 itwriter 发布于 2024-01-0417:00 评论(0) 有233人阅读 原文链接 [收藏] « »俄罗斯方块这款经典游戏想必大家都玩过,但能将其通关的人此前从未出现。近日,这一空白终于被打破。美国一名13岁......
  • AI小蜜批量写作助手:多级指令,插件,GPTs满足不同写作需求
    为什么会开发这个脚本?爆文项目的核心是矩阵怼量具体怎么做这里介绍很清楚了:AI爆文撸流量主保姆级教程3.0+脚本写作教程(解放双手)我在刚做爆文项目时候,都是手动操作,复制指令,组合指令,粘贴,AI生成内容,然后发布。整个过程流程简单,全部重复劳动。但凡没点耐心,很容易就放弃了。重复......
  • 【服务器数据恢复】服务器raid5崩溃导致上层分区无法访问的数据恢复案例
    服务器数据恢复环境:北京某教育机构一台服务器中有一组由3块磁盘组建的raid5阵列,服务器安装的windowsserver操作系统。服务器故障:该服务器在运行过程中突然瘫痪,无法正常工作。北亚企安数据恢复工程师去现场对故障服务器进行了检测,发现故障服务器raid5阵列中有一块硬盘由于未知原......
  • 谷歌被曝或再次大裁员!3万员工面临被AI取代
    据报道,继1.2万大裁员之后,谷歌又计划重组广告销售部门——这将导致3万名员工面临裁员的风险。这一年的科技行业,可以说是从年头裁到了年尾,还越裁越多了。而这次谷歌的部门重组计划,让打工人们发现,除了面临经济下行、就业艰难之外,还可能由于自己性价比不如AI,而被取代。在不久前的一次部......
  • OpenAI换血大震动始末:“ChatGPT之父”奥特曼,缘何被“扫地出门”?
    近期,AI业界发生了一场“大地震”。作为聊天机器人ChatGPT的开发者,OpenAI无疑是最受关注的人工智能公司之一。就是这家公司的联合创始人、CEO、有“ChatGPT之父”之称的阿尔特曼在“疯狂的5天”里,经历了被闪电免职、加入微软、最终又官复原职的戏剧性反转。ChatGPT:我是ChatGPT,一个由......