首页 > 其他分享 >GPT也会玩《黑神话》?胜率还远超人类?全靠大模型实力!

GPT也会玩《黑神话》?胜率还远超人类?全靠大模型实力!

时间:2024-09-27 21:19:42浏览次数:11  
标签:引导 游戏 动作 AI 胜率 远超 人类 GPT

导语

《黑神话:悟空》这款游戏,以其独特的东方魅力和引人入胜的剧情,在玩家和业界中引发了巨大的热潮。它不仅在界内十分火爆,更是火出了圈,可以在各处看见他的身影,包括奶茶店、咖啡店、商场超市等。这款游戏凭借其精致的画面和深入人心的角色塑造,无疑将为中国游戏产业注入新的活力,让人们看见了中华文化的博大精深,不禁感叹:祖宗优选才是好货!

然而,最近小鲨竟然发现:AI也能直面天命!GPT可以玩《黑神话·悟空》!

AI竟然在《黑神话:悟空》中打败了人类玩家!这可不是什么小打小闹,而是完完全全的大招! 它不仅赢了,还赢得超级漂亮,特别是在对抗鸦香客和牯护院时,简直像开了挂一样! 而且,这全靠一个大模型,没有使用强化学习!

阿里巴巴的研究人员们真的太牛了,他们提出了一种新型的VARP智能体框架。这个框架可以直接分析游戏截图,然后通过视觉语言模型推理,生成Python代码形式的动作来操作游戏。在《黑神话·悟空》中,这个智能体在90%的简单和中等水平的战斗场景中取得了胜利!

GPT-4o、Claude 3.5都不缺席挑战

研究人员以《黑神话·悟空》为研究平台,一共定义了12个任务,75%与战斗有关。

他们构建了一个包含1000条有效数据的人类操作数据集,这些数据囊括了键鼠操作和游戏截图。每个操作都是由一系列原子命令组成的,比如轻攻、闪避、重攻击和回血等。

他们提出了VARP智能体框架,主要包括动作规划系统和人类引导轨迹系统。

动作规划系统由情境库、动作库和人类引导库组成,使用VLMs进行动作推理和生成,并引入辅助模块以分解特定任务以及自我优化的动作生成模块。

人类引导轨迹系统则利用人类操作数据提升智能体性能,针对复杂任务,通过查询人类引导库获取相似截图和操作,生成新的引导动作。

同时,VARP还包括三个库:情景库、动作库和人工引导库。

这些库存储了智能体自我学习和人类指导的内容,能够进行检索和更新。动作库中,“def new_func_a()”表示动作规划系统生成的新动作,“def new_func_h()”代表人导轨迹系统生成的动作,而“def pre_func()”则是预定义的动作。

动作案例研究和相关游戏截图中,第一行和第二行的操作是预定义函数,第三行的动作由人工引导轨迹系统生成。SOAG会在每次玩家角色与敌人战斗互动后,总结第四行和第五行中的新动作,并将其存储在动作库中。

框架分别使用了GPT-4o(2024-0513版本)、Claude 3.5 Sonnet和Gemini 1.5 Pro。

对比人类和AI的表现结果发现,在小怪部分,AI的表现达到了人类玩家的水平。然而,当进入牯护院时,Claude 3.5 Sonnet表现不佳,而GPT-4o的胜率最高。

但对于新手玩家普遍感到棘手的幽魂,AI们也无能为力。

还有研究指出,由于VLMs的推理速度限制,它无法实时处理每一帧画面,只能间隔输入关键帧,这可能导致AI错过boss攻击的关键信息。此外,由于游戏缺乏明确的道路引导且存在许多空气墙,智能体在没有人类指导的情况下也无法找到正确的路线。这项研究由阿里团队的五位作者完成。

后续相关代码和数据集有发布计划,感兴趣的朋友可以蹲下。

最后

我想说,AI的潜力是无限的,欢迎关注我的公众号:AI小鲨,持续为您带来最新AIGC资讯!

参考文章:GPT也会玩《黑神话》?胜率还远超人类?全靠大模型实力! | AI小鲨

标签:引导,游戏,动作,AI,胜率,远超,人类,GPT
From: https://blog.csdn.net/AIPioneerShark/article/details/142446471

相关文章

  • 讯飞星火 VS chatgpt (366)
    引言随着人工智能和机器学习的飞速发展,回归预测在各个领域得到了广泛应用。回归模型用于预测连续变量的值,如金融市场的价格走势、气象预报中的温度变化等。本文提出了一种基于饥饿游戏搜索(HungerGamesSearch,HGS)优化随机森林(RandomForest,RF)的回归预测模型,简称HGS-RF。我......
  • 文心一言 VS 讯飞星火 VS chatgpt (356)-- 算法导论24.2 2题
    二、假定将DAG-SHORTEST-PATHS的第3行改为:3forthefirst|V|-1vertices,takenintopologicallysortedorder。证明:该算法的正确性保持不变。如果要写代码,请用go语言。文心一言:首先,我们来证明将DAG-SHORTEST-PATHS算法的第3行从遍历所有顶点改为仅遍历拓扑排序后的前|V|-......
  • 亲测好用,吐血整理 ChatGPT 3.5/4.0新手使用手册~
    都知道ChatGPT很强大,聊聊天、写论文、搞翻译、写代码、写文案、审合同等等,无所不能~那么到底怎么使用呢?其实很简单了,国内AI产品发展也很快,很多都很好用了~我一直在用,建议收藏下来~  有最先进、最新的GPT模型,还有很多其他效率工具都是在各自领域,绝对领先地位的产品~①......
  • 吐血整理 ChatGPT 3.5/4.0 新手使用手册~ 【亲测好用】
    以前我也是通过官网使用,但是经常被封号,就非常不方便,后来有朋友推荐国内工具,用了一阵之后,发现:稳定方便,用着也挺好的。最新的GPT-4o、4omini,可搭配使用~1、 最新模型科普:现在人工智能很强大,聊聊天、写论文、搞翻译、写代码、写文案、审合同、情感陪伴等,真是无所不能~本......
  • 吐血整理(最全论文指令手册),还有 ChatGPT 3.5/4.0 新手使用手册~ 【亲测好用】
    今天给大家分享下论文润色、降重、写作的GPT指令提示词,按论文步骤整理让你的文章更加有逻辑且通顺,助力快速完成论文,相信对你有帮助~一、论文写作润色指令1、写作选题指令①确定研究对象我是一名【XXXXX】,请从以下素材内容中,结合【XXXXX】相关知识,提炼出可供参考的学术......
  • ChatGPT结合ArcGIS,制图只需30秒,太强了!
    在数字化和智能化的浪潮中,GIS(地理信息系统)和GPT(生成式预训练模型)的结合正日益成为推动科研、城市规划、环境监测等领域发展的关键技术。GIS以其强大的空间数据处理、先进的空间分析工具、灵活的地图制作与可视化能力、广泛的扩展性和定制性,成为地理信息科学的核心工具。它在多......
  • 【AIGC】国内ChatGPT-4o中文镜像网站整理汇总
      一、中文镜像站① yixiaai.com 支持GPT4、4o以及o1,支持MJ绘画② chat.lify.vip 支持通用全模型,支持文件读取、插件、绘画、AIPPT③ AIChat 支持GPT3.5/4,4o以及MJ绘画二、模型知识1、模型基础信息GPT-3.5Turbo:官方已经计划下线,现在已经全面被gpt-4o-mini替代......
  • 如何使用 ChatGPT 生成万字长文?
    要使用ChatGPT生成万字长文,可以采用以下方法,以保证文章结构清晰,内容充实:1.确定主题和大纲明确主题:先确定文章的中心主题,例如技术、文学、历史、哲学等领域的具体问题。细化大纲:将主题细分为多个子主题或章节。例如,万字长文可以有10-15个章节,每章约600-1000字。2.逐步生......
  • 9月持续更新|国内ChatGPT-4中文镜像网站整理汇总
    一、GPT镜像中文网站1.yixiaai.comChatgpt的中文版,支持GPT4以及4o、o1,支持MJ绘画2.chat.lify.vip GPT官网复刻,体验感超高3.ai.lansejingyu.com支持GPT3.5/4以及4o4.lanjing.ai支持GPT3.5\4.0以及4o二、超好用论文写作指令1、写作选题指令①确定研究对象     ......
  • 文心一言 VS 讯飞星火 VS chatgpt (355)-- 算法导论24.2 1题
    一、请在图24-5上运行DAG-SHORTEST-PATHS,使用结点r作为源结点。如果要写代码,请用go语言。文心一言:在Go语言中实现一个DAG(有向无环图)上的最短路径算法(例如,DAG-SHORTEST-PATHS,这通常可以通过简单的拓扑排序加动态规划或者简单的迭代方法来实现,因为DAG中没有环)并不复杂。但......