首页 > 其他分享 >《花雕学AI》人类推理能力对AI来说是什么?用ChatGPT来检验一下

《花雕学AI》人类推理能力对AI来说是什么?用ChatGPT来检验一下

时间:2023-05-18 16:12:15浏览次数:41  
标签:花雕 AI 能力 生成 人类 ChatGPT 推理

”这里有一本书、九个鸡蛋、一台笔记本电脑、一个瓶子和一个钉子,请告诉我如何把它们稳定地堆叠在一起?“

这是去年提出的一道测试推理能力的题目,当微软的计算机科学家开始试验一种新的AI系统时,他们要求AI解决这个难题,这个难题本应该需要对现实的物理世界有直觉性地理解。

凤凰网科技讯 《AI前哨》北京时间5月17日消息,通用人工智能(AGI)的时代尚未到来,但是AI的推理能力似乎正在逐步得到展现。微软称,最新研究表明,新的AI系统展示出了其具备人类推理能力的迹象。这一言论在业内引发了争议。微软的新研究基于对OpenAI的最新模型GPT-4的测试,该模型能够解决一些需要对物理世界有直觉性理解的难题,例如如何把一些物品稳定地堆叠在一起。微软认为,这是AI系统迈向“通用人工智能(AGI)”的第一步。

但是,一些AI专家认为,微软的这篇论文是一种投机取巧的行为,目的是对一项没有人能完全理解的技术作出大胆声明。他们认为,通用智能需要熟悉物理世界,而GPT-4理论上不具备这一点。他们还质疑GPT-4生成的文本是否真的反映了人类逻辑或常识,而不是简单地模仿人类的语言。

 

今天我用了半天时间,尝试利用手头上的ChatGPT资源,来实际看看现在的AI推理的能力,组合实验情况汇集如下:

 


后来,我把题目调整为:“有什么特点?主要困难度是什么?其难度级别大概是?请详细评价这个推理项目:这里有一本书、九个鸡蛋、一台笔记本电脑、一个瓶子和一个钉子,请告诉我如何把它们稳定地堆叠在一起?”

AI的一个评价
这个推理项目是一种典型的逻辑思维题,需要考虑物品的形状、重量和平衡性,以及如何在不断增加高度和重量的情况下保持稳定。这个问题的主要困难度在于需要仔细考虑每个物品的位置和角度,以确保整个结构的稳定性和平衡性。此外,还需要在保持物品稳定的同时,注意不要让它们掉落或破坏周围环境。

这个推理项目的难度级别可以被认为是中等到高级,因为它需要一定的空间想象力和物理直觉,同时需要考虑多个因素的影响,如物品的重量、形状、位置和角度等。此外,这个问题还需要一定的创造性思维,因为可能有多种不同的解决方案,需要考虑哪个方案最稳定和最有效。

这个推理项目的一个特点是它可以锻炼人们的逻辑思维和问题解决能力,以及空间感知能力和手眼协调能力。同时,它还可以激发人们的好奇心和探索精神,使人们更加了解物理世界和物体之间的相互作用。此外,这个问题还可以促进人们的创造性思维,使人们能够尝试多种不同的解决方案,培养创新精神和团队合作能力。

总的来说,这个推理项目是一种非常有趣和具有挑战性的思维难题,可以帮助人们开发他们的逻辑思维和问题解决能力,同时也可以促进创造性思维和团队合作能力。

 


附录:
人类推理能力的概念和重要性
1、人类推理能力是指人类能够根据已知的事实、规律或原则,推导出新的结论、判断或假设的能力1。这种能力是人类智能的重要组成部分,也是人类区别于其他动物的显著特征。
2、人类推理能力有多种形式,如归纳推理、演绎推理、类比推理等,它们在不同的领域和场景中发挥着重要的作用。例如,在数学、物理、化学等科学领域,人类通过推理能力发现了许多定理、定律和原理;在日常生活中,人类通过推理能力解决了许多问题,如破案、拼图、下棋等。
3、人类推理能力的重要性不言而喻。它是人类认识世界、创造文化、发展科技、提高生活质量的基础和动力。没有推理能力,人类就无法从个别的经验中抽象出一般的规律,也无法从一般的规律中推导出个别的结论,更无法从已知的事物中想象出未知的事物。没有推理能力,人类就无法进行有效的沟通、交流和合作,也无法进行有说服力的论证或反驳,更无法进行创新和发明。
因此,探索和研究人类推理能力的本质、机制和发展规律,对于提高人类智能水平、促进社会进步和文明发展具有重要意义。

AI领域的主流方法和模型
是基于深度学习的大型语言模型(large language model, LLM),如ChatGPT,它们通过在海量的文本数据上进行预训练和微调,实现了强大的自然语言理解和生成能力。ChatGPT是OpenAI发布的对话生成预训练模型,它基于GPT-4体系结构,具有1750亿个参数,采用了代码预训练、指令微调和基于人类反馈的强化学习等技术,展现了多种涌现能力,如高质量对话、复杂推理、思维链、零/少样本学习、跨任务泛化、代码理解/生成等 。

ChatGPT是一个由OpenAI开发的大型语言模型(LLM)
它基于GPT-3(生成性预训练转换器)架构,经过训练可以生成类似人类的文本2。它是在一个大型的文本数据集上训练的,该数据集被称为普通爬行数据集,这使得它能够学习人类书写的文本的模式和结构。ChatGPT可以在特定的任务上进行微调,如聊天机器人、语言翻译、文本总结、代码调试等。它可以理解和回应自然语言查询,并像人类一样有效地遵循它们。它还可以根据它从训练过的数据中学习到的模式和关系来生成新的文本,如故事、诗歌、歌词等。

ChatGPT被认为是目前最先进的语言模型之一,它在一些标准测试中取得了优异的成绩,如GLUE(自然语言理解评估基准)、SQuAD(阅读理解数据集)、LAMBADA(语言建模分析数据集)等。它也在一些非标准测试中展示了惊人的推理能力,如数学解题、形式化定理证明等。

ChatGPT在不同任务上的表现和局限性如下
1、在对话生成任务上,ChatGPT可以生成符合用户意图的多轮回复,捕捉以前的对话背景,拒绝不当请求,挑战错误前提,并承认自己错误。它还可以在考虑到道德和政治因素的情况下,善于拒绝不安全的问题或生成安全的回答。然而,ChatGPT也存在一些局限性,如无法保证回答的正确性和一致性,无法处理多模态输入和输出,无法记住用户的个性化信息和偏好等。
2、在创造性写作任务上,ChatGPT在头脑风暴任务、故事/诗歌生成、演讲生成等方面表现出色,甚至可以一步步打磨其作品。它还可以通过一些示例生成推理过程本身,从而提高回答问题的准确性。然而,ChatGPT也存在一些局限性,如无法保证作品的原创性和质量,无法适应不同风格和主题的要求,无法进行有效的修改和评价等。
3、在代码理解/生成任务上,ChatGPT可以利用代码预训练提升代码理解和生成的能力,并带来思维链推理的新兴能力。它还可以通过指令微调和基于人类反馈的强化学习学习跨任务泛化,并与人类反馈相一致。然而,ChatGPT也存在一些局限性,如无法保证代码的正确性和可执行性,无法处理复杂的编程逻辑和算法,无法与其他编程工具和环境兼容等。

 

【花雕学AI】是一个普通人学习AI的专栏(于2023年3月29日开设),由驴友花雕撰写,主要介绍了人工智能领域的多维度学习和广泛尝试,目前已包含七十多篇文章,分别介绍了ChatGPT、New Bing和Leonardo AI等人工智能应用和技术的过程和成果。本专栏通过实际案例和故事,分享了花雕在人工智能领域的探索和体验,旨在激发更多人对人工智能的兴趣和热情。了解更多,请使用谷歌、必应、百度或者今日头条等引擎搜索【花雕学AI】。

标签:花雕,AI,能力,生成,人类,ChatGPT,推理
From: https://www.cnblogs.com/eagler8/p/17412262.html

相关文章

  • YAML Ain't Markup Language
    YML(或YAML)是一种轻量级的标记语言,它是一种易于阅读且易于编写的数据序列化格式。YML的全称是YAMLAin'tMarkupLanguage,也就是说它的作者并不希望它被视为一种标记语言,而更多地是一种“人类可读的数据序列化格式”。YML的语法简洁明了,它使用缩进表示层级结构,可以用于描述键值对......
  • 使用details和summary元素实现树形展示
    1.先看效果2.默认是关闭的,并且父级关闭后,子级的开关状态会被保留,再次展开时,可恢复;3.需要对details元素增加一个padding-left或margin-left,否则展开后,子级和父级是左对齐的,视觉效果不好;4.一般是details元素套一个summary元素和一个展开后要展示的内容,如果details中没有sum......
  • AI 绘画 - 0 成本在线体验 AI 绘画的魅力
    合集-StableDiffusion(3) 1.AI绘画咒语入门-StableDiffusionPrompt语法指南【成为初级魔导士吧!】04-222.AI绘画基础-细数StableDiffusion中的各种常用模型【......
  • ChatGPT访问互联网,不神秘了
    我测试了一下,它其实调用了微软必应的api,搜索了关键词而已比如我问它:https://twitter.com/elonmusk马斯克最近在忙什么它的回答是:近期,马斯克在做的一些事情包括:在2023年的特斯拉年度股东大会上,他预告了两款新的电动车型,并表示特斯拉已经在制造其中的一款1。马斯克也在Twitte......
  • 关于int main(int argc, const char * argv[])的理解
    命令行参数前面一个是int值,理论上后面一个char型的指针数组,每个字符型的指针都存贮一个字符串(很像shell命令,$#输出所有命令行参数个数,不包括命令本身,$*,输出所有命令行参数)argc命令行执行时输入字符串的个数,argv输出字符串的内容(输入都默认字符串类型)所以下面这个程序输入......
  • AI+视频智能应用在文明城市创建中的关键性作用
    行业背景目前,我国正处于加快推进现代化的历史阶段。文明城市是反映一个地区现代文明程度、城市综合竞争实力的重要标志,很多城市动员上下力量,争相创建文明城市。然而,仅靠人力动员无法见行见效。想要立竿见影,则必须依靠科技的力量,为创建文明城市赋能附效。方案简介基于AI智能分析网关......
  • 医学AI又一突破,微软开源生物医学NLP基准:BLURB
    By超神经内容概要:微软团队发布生物医学领域NLP基准,命名为BLURB,已在arxiv.org中发布相关论文,并将其开源。关键词:生物医学 自然语言处理 基准微软的研究团队近日在arxiv.org发布了论文:《Domain-SpecificLanguageModelPretrainingforBiomedicalNaturalLanguageProce......
  • GitHub创建Github Action流水线来定时发送天气预报给email
     1、基本原理curlwttr.incurlwttr.in/Shanghaicurlwttr.in/wuhan   2、参考文章基于GITHUBACTION的定时任务,真香!https://blog.csdn.net/qq_40748336/article/details/110749375上文参考的文章GitHubActions入门教程_阮一峰http://www.ruanyifeng.com/blo......
  • BFT 最前线 | WPS AI接入四大办公软件;OpenAI准备开源新模型;OpenAI CEO首次出证国会;百
    原创|文BFT机器人AI视界TECHNOLOGYNEWS01WPSAI宣布接入文字、表格、PPT、PDF四大办公软件,AI能力大升级5月16日,金山办公旗下人工智能应用WPSAI,宣布四大办公组件全面升级:包括文字、表格、PPT和PDF,相比4月只有文字组件升级,这次升级涵盖了更广范围,并展示了WPSAI在阅读理解和人......
  • AI 绘画 - 如何 0 成本在线体验 AI 绘画的魅力
    要想体验AI绘画,比较流行的三种方式是Midjourney、OpenAI的DALL·E2以及StableDiffusion。而Midjourney已经停止免费试用,且使用价格不太便宜,DALL·E2也是一样价格不菲。只有StableDiffusion作为一款开源模型可以自建,也有各种白嫖的方式比如Google的Colab,阿里云......