如何赋予 GPT/LLM 自我意识1

时间：2023-11-19 15:22:06浏览次数：33

引子

这个周末OpenAI搞了一个大新闻，围绕 Sam Altman 和 Ilya Sutskever 的各种讨论遍地开花，而其中一个关注点就是他们对于 AGI 降临态度上的偏差。本文不打算讨论公司治理和办公室政治，而是用一些思维实验和大家都公认的现象来分析纯理论而言 AGI 会如何降临。一个基本的结论就是：如今的 GPT 模型注定会诞生 AGI。更关心论证的朋友可以直接跳过前两个介绍基础知识的段落直接看后续的推理过程。不过限于篇幅，这篇里仅仅提出了问题，具体分析会在后续文章中给出。本文提出了意识和载体之间可能存在的辩证依赖关系，提出了一个识别自我意识的途径，可能是所有 AI 研究者长期等待的一个假说理论的雏形

AGI 的一般定义

首先我们先设定一个有关 AGI 的一般定义。AGI 通常是至一个智能体具有人类水平的通用智能,能够学习、理解和应用知识去解决各种复杂问题,并且具有自我提升的能力。主要特征包括:

强大的学习和推理能力,可以从数据中学习模式并进行复杂推理。
具有语言理解和自然语言处理能力,能够理解人类语言并进行有意义的交流。
拥有广泛的世界知识和常识,可以把学习到的知识应用到不同领域。
可以跨模型理解和学习,融合不同形式的信息如语音、图像、视频等。
表现出创造力和规划能力,能解决新问题并制定计划达成目标。
具备自我意识和自我提升的能力,可以主动设置目标并不断进步。

当前的AI系统都属于弱 AI 或狭义 AI,距离真正的AGI还有很长的路要走。几大特征中，目前的人工智能已经能达到大部分，而在诸多能力中，具备自我意识和自我提升能力是最具有挑战性的。

GPT/LLM 的工作原理

对应的，我们也需要了解人工智能目前大致的原理。并且我们可以断定，任何一个环节其本身不具有任何智力，不具有任何主观意识。

模型架构
LLM模型通常采用Transformer编码器结构,由多层编码块组成,每个编码块包含自注意力机制和前馈网络。模型参数通常在亿级到万亿级。
大规模语料预训练
在海量文本语料上进行无监督预训练,通过自回归预测语言序列的下一个词来学习语言的表征。预训练目标是最大化语料的联合概率分布。
迁移学习
利用预训练中的语言知识,通过精调应用于下游NLP任务,如文本分类、问答、对话等。只需要调整最后的输出层。
模式识别
LLM可以学习语言中的模式,并根据前文进行语义解析和推理,预测后文内容。
多任务学习
除语言建模外,还可以通过掩码语言模型等方式进行预训练,让模型学习不同语言任务的表示。
生成
利用采样策略可以生成连续、语义连贯的文本。通过条件提示也可以指导内容生成。

GPT 是否理解它的输出

简单的说，GPT 并不“理解”它的输出。GPT 能正确得回答你的问题，并给出操作步骤，甚至 GPT 能通过大部分学校的书面考试，所以我们可以认为 GPT 的确“掌握”了知识。基于 GPT 的原理，我们可以肯定只要给它更多的训练素材，GPT 注定能记住几乎所有的人类知识，各行各业的知识。因此针对 AGI 的一般定义，其中大部分已经没有什么疑问了，达成目标仅仅是个时间问题，GPT 是一定能做到的。但是同时基于 GPT 的工作原理，有一种观点则认为：GPT 本身对于其输出的信息并没有任何“理解”的意义。GPT 仅仅是基于训练数据和自身模型，给出了概率意义上的计算结果而已。一个能通过大学考试的机器，并不真的拥有对应知识的“理解”或“掌握”。

这里就有一个很有趣的对比。人类对比GPT，大家都能记忆相关的信息，然后顺利通过考试。为什么我们就拒绝承认 GPT 拥有理解能力？甚至事实上即使是人类，也存在那种仅仅机械背诵了知识点而无法阐述更多理解的情况。完全类似，甚至可以说相同的情况：“对象能顺利针对给定的问题，给出符合预期的答案”。但是仅仅由于一个是人类，另一个是 GPT 我们就排斥人工智能的成就，认为人工智能并不真正意义上“理解”自己的输出。我们不禁要问：人类的“理解”究竟是什么?

如何让一个人证明他“理解”/“掌握”了某个知识？是知其然且知其所以然吗？是能举一反三吗？是能顶得住答辩的专家团从各种角度更深层次的提问吗？而事实上这些挑战对于已经掌握了几乎所有人类知识的 GPT 来说并不是有太大难度的任务，难道不是吗？如果允许 GPT 模型进行论文答辩，我相信它的表现应该会显著高于人类学生的平均值。本文从这里开始提出这个尖锐的问题：某个知识，究竟是被人或 GPT 所“掌握”了，还是某个知识借助于人或 GPT 这个载体被“承载”了？一个能“承载”知识的东西，是否一定“理解”被“承载”的知识？“理解”的定义究竟是什么？

未完待续

下面，我们将进一步分析什么是“理解”。然后我们会进一步对比“创造力”的定义，最终给出“自我意识”的一种可能的实现途径

标签：自我意识,AGI,模型,知识,理解,LLM,GPT
From： https://www.cnblogs.com/Chinese-xu/p/17842089.html

全新近似注意力机制HyperAttention：对长上下文友好、LLM推理提速50%
前言本文介绍了一项近似注意力机制新研究，耶鲁大学、谷歌研究院等机构提出了HyperAttention，使ChatGLM2在32k上下文长度上的推理时间快了50%。本文转载自机器之心仅用于学术分享，若侵权请联系删除欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典......
使用 ChatGPT 帮助小学生编程入门系列之二：使用 Python 编程发送电子邮件
本系列前一篇文章，我们已经介绍了如何使用Python编写一段代码，将搜索引擎上找到的天气预报网站上的信息，读取到本地：使用ChatGPT帮助小学生编程入门系列之一：Python编程读取和解析天气预报网页上的数据本文我们再进一步，目标是把一段文本，通过Python发送到指定的邮箱去。学会......
使用 ChatGPT 帮助小学生编程入门系列之一：Python 编程读取和解析天气预报网页上的数据
现在国内小学生也开设了信息技术课，课程内容也涉及到了一些简单的编程实践，比如Scratch和Python.当初这个公众号申请时专门用了我儿子的名字，算是抢注吧，毕竟微信公众号和其他社交媒体平台不一样，不允许重名。我也曾经和我儿子聊过，我今年都40多岁了，这个公众号将来迟早有一天会正......
您可以使用 ChatGPT 做十件事
ChatGPT是一款功能强大的人工智能聊天机器人，可以回答广泛的问题并就各种主题提供连贯的解释。它具有实际应用，例如创建定制简历、制作笑话、解释复杂主题、解决数学问题以及提供人际关系建议。ChatGPT还可以用于创作音乐、编码协助、操作媒体文件、电影推荐、玩游戏、烹饪协助、改......
解密Prompt系列19. LLM Agent之数据分析领域的应用：Data-Copilot & InsightPilot
在之前的LLMAgent+DB的章节我们已经谈论过如何使用大模型接入数据库并获取数据，这一章我们聊聊大模型代理在数据分析领域的应用。数据分析主要是指在获取数据之后的数据清洗，数据处理，数据建模，数据洞察和数据可视化的步骤。可以为经常和数据打交道，但是并不需要太过艰深的数据分析......
神辅助 Cursor 编辑器，加入 GPT-4 让编码更轻松！-未来：复制粘贴工程师转向提示工程师
在ChatGPT问世之前，我们的编码方式很多时候都是面向搜索引擎编码，需要不断地进行搜索，然后复制粘贴，俗称复制粘贴工程师。但是，随着ChatGPT的出现，这一切将彻底改变。ChatGPT是一种基于人工智能的自然语言处理模型，可以根据上下文理解人类语言并生成相应的回复。在编码方面，ChatGPT可......
AI试用：ChatGPT-画旗袍美女效果
AI试用：ChatGPT-画旗袍美女效果Designby拓云智能强大的绘画工具，让您能够将灵感转化为真实的艺术作品。不论您是喜欢传统绘画还是数字绘画，ChatGPT都能够满足您的需求。它提供了各种绘画工具和特效，让您能够自由发挥创意，创作出独一无二的艺术作品。......
软件测试/人工智能|测试报告很难写，ChatGPT来帮你
简介除了测试计划和测试方案，测试报告是另外一个令人头大的文档，但是我们又必须要写这个文档，所以我们还是得硬着头皮上，但是有了ChatGPT之后，写测试报告也变得简单了。本文就来向大家介绍如何使用ChatGPT来写测试报告。什么是测试报告？测试报告的主要目的是提供与测试结果相关的数......
软件测试/人工智能|如何使用ChatGPT写出满意的测试方案
简介上文我们介绍了如何使用ChatGPT写一份漂亮的测试计划，那么有了测试计划之后，我们的测试方案自然也不能随便敷衍了事，我们要借助ChatGPT来帮我们写一份让大家都满意的测试方案。本文就来给大家介绍一下如何使用ChatGPT来输出一份测试方案。什么是测试方案测试方案是指描述需要......
软件测试/人工智能|教你如何用ChatGPT写一份漂亮的测试计划
简介作为一个技术型的工程师，文案功力不一定很强，但是作为测试工程师，又不得不做一些文字的工作，比如我们需要编写测试计划，测试方案等，这对于我这样的人来说，确实是一个头疼的工作，但是如果能够借助ChatGPT来帮助我写测试计划的话，是不是就能方便很多了。本文就来介绍一下如何借助ChatGPT来......

如何赋予 GPT/LLM 自我意识1

引子

AGI 的一般定义

GPT/LLM 的工作原理

GPT 是否理解它的输出

未完待续

相关文章

赞助商

阅读排行