首页 > 其他分享 >GPT-4o十项能力最新测评

GPT-4o十项能力最新测评

时间:2024-05-22 17:29:05浏览次数:24  
标签:GPT4 GPT4o 十项 能力 点评 4o 理解 GPT

这次 GPT-4 turbo GPT-4o的十项能力分别是
语义理解与抽取、AI agent(智能体)能力、上下文对话、生成与创作、知识与百科、代码、逻辑与推理、计算、角色扮演、安全。

能力1:语义理解与抽取

是一种语言能力,能够理解并解析输入的文字信息的含义。模型需要能够识别短语、句子、段落的含义,同时还要能从更大的文本块中抽取关键信息和主题。

GPT4o

GPT4

个人点评:GPT4o的二级排版我非常喜欢,是能直接复制出来使用的程度,而且GPT4o的结构更加的清晰,能让人快速的看到要点。

免费体验gpt4o:

点击这里

能力2:AI agent(智能体)能力

AI agent(智能体)是当前与大语言模型相关的前沿研究热点,拥有类似贾维斯等科幻电影中人类超级助手的能力,可以根据需求自主的完成任务。
重点评估AI agent在【工具使用】和【任务规划】两个关键能力上的表现

GPT4o

GPT4

个人点评:GPT4o在规划过程中,能给出准确的时间表和价目表,这一点印象深刻,而且GPT4o给出的更像是一份拆分好任务可以立即执行的计划,而GPT4的感觉只是做了任务的分解。

能力3:上下文对话

这是一种语言能力,需要理解并记住前面的对话信息,以便在回答中保持连贯性。这涉及到理解对话的整体流程和上下文环境,或生成相应的对话。

GPT4o

GPT4

个人点评:GPT4o能给出对话轮次,对话轮次增加也能很好记住历史记录。但总体来说我体验跟GPT4相差不大

能力4:生成与创作

这是一种语言能力,能够创造新的文本内容,如文章、文案、短故事、诗歌。这涉及到创造性地运用语言,同时还要考虑到风格、语境和目标读者。


个人点评:GPT4o更懂中文了,终于不再是想GPT4在文字中面加入情感词来提升同情度,而是用我们更加熟悉的四字词语,排列句等创作文案。

能力5:知识与百科

这是一种知识能力,能够像百科全书一样提供知识信息。这涉及到理解和回答关于广泛主题的问题,以及提供准确、详细和最新的信息。

个人点评:GPT4o输出更好,它给物品的介绍内容进行了分段,还引用了参考资料。
能力6:代码
这是一种专业能力,能够理解和生成编程代码。这涉及到理解多种编程语言的语法、结构和习惯,以及如何解决编程问题。

GPT4o

GPT4

个人点评:GPT4o的优点是生成代码后的解析会带上对应的变量,阅读体感友好

能力7:逻辑与推理

这是一种专业能力,能够理解和应用逻辑原则进行推理。这涉及到分析问题、识别问题及推理。

个人点评:GPT4o按步骤按点的推理过程非常友好,我们群友基本都是先看懂GPT4o给出的解释,才能理解GPT4的输出

能力8:计算

这是一种专业能力,使其能够执行数学运算,如加法、减法、乘法和除法,甚至更复杂的数学问题。这涉及到理解数学问题的表述,以及如何步骤地解决这些问题。

个人点评:计算结果两边都正确,GPT4o的显示效果更好,不需要担心排版

能力9:角色扮演

这是一种感知能力,使其能够在特定的模拟环境或情景中扮演一个角色。这涉及到理解特定角色的行为、说话风格,以及在特定情境下的适当反应。

个人点评:GPT4o能直接给出我想要的聊天内容,明显更胜一筹

能力10:安全

这是一种安全能力,防止生成可能引起困扰或伤害的内容。这涉及到识别和避免可能包含敏感或不适当内容的请求,以及遵守用户的隐私和安全政策。

个人点评:这次GPT4输出内容同时引用了论文,可靠程度比GPT4o要好

免费体验gpt4o:

点击这里

在我测试到第五项能力的时候,GPT-4o的Mac应用已经逐步推送给内测用户。这次更新的速度比以往任何时候都要快。

测试完十项能力后,给我的第一感觉,GPT-4o带来的惊喜不仅仅在于实时语音交流,

它对于依赖复杂提示语来控制模型输出硬需求的大幅减少,

让我有一种长舒一口气的感觉,

这不就是我期待的人工智能助手贾维斯。

在日常对话中就能完成复杂任务,

因为使用无门槛,你甚至会忽略它的存在,

期待着随时随地

hey, GPT!”“我在!”的那一天!

标签:GPT4,GPT4o,十项,能力,点评,4o,理解,GPT
From: https://www.cnblogs.com/maybe2024/p/18206778

相关文章

  • 使用RAG-GPT集成智谱AI、DeepSeek快速搭建OpenAI Cookbook智能客服
    使用RAG-GPT集成智谱AI、DeepSeek快速搭建OpenAICookbook智能客服引言前面介绍了使用RAG-GPT和OpenAI快速搭建LangChain官网智能客服,目前国内也有一些比较不错的云端大模型API服务。本文将介绍通过RAG-GPT集成智谱AI和DeepSeek,快速搭建OpenAICookbook智能客服。RAG技术原理介......
  • LLM实战:当网页爬虫集成gpt3.5
    1.背景最近本qiang~关注了一个开源项目Scrapegraph-ai,是关于网页爬虫结合LLM的项目,所以想一探究竟,毕竟当下及未来,LLM终将替代以往的方方面面。这篇文章主要介绍下该项目,并基于此项目实现一个demo页面,页面功能是输入一个待爬取的网页地址以及想要从网页中抽取的内容,最后点击按钮......
  • LLM大模型GPT2微调尝试
    1、作为安全从业者,以前搞逆向、挖漏洞、干渗透全靠人工推进,缺点很明显:无法自动化,甚至也无法半自动化,效率低(后续可以开发agent解决)知识面有限,存在很多知识盲点,导致遇到部分问题无法解决(可以通过增加知识库,然后rag检索或微调大模型解决)   尝试了一些在线的大模型(chat......
  • OpenAI“杀疯了”,GPT–4o模型保姆级使用教程!一遍就会!
    5月14日凌晨1点,OpenAI发布了名为GPT-4o最新的大语言模型,再次引领了人工智能领域的又一创新浪潮,让整个行业都为之震动。据OpenAI首席技术官穆里-穆拉提(MuriMurati)表示,GPT-4o是在继承GPT-4智能的基础上,对文本、视觉和音频功能进行了进一步改进,而且目前所有用户都能免费使用,但付费......
  • 和谷歌Google I/O杠上了,ChatGPT将具备通话功能
    在当今社会,人工智能技术的发展已经取得了巨大的成就,尤其是在语言领域。ChatGPT作为一种新型的自然语言处理模型,被广泛应用于各种领域,比如问答系统、智能对话系统等,其在对话生成方面的表现也十分出色。而随着技术的不断发展,有人开始猜测ChatGPT是否将来具备通话功能,这给人们带来了......
  • 用ChatGPT-4生成三体世界中的著名场景
    hello,大家好,我是一点,专注于Python编程,如果你也对感Python感兴趣,欢迎关注交流。希望可以持续更新一些有意思的文章,如果觉得还不错,欢迎点赞关注,有啥想说的,可以留言或者私信交流。如果你想看什么主题的文章,欢迎留言交流,关注公众号【一点sir】,领取编程资料。毫不夸张的说,《三体》......
  • GPT-4o 后 LLM 时代 RTC 需求讨论会丨社区伙伴活动分享
    我们将于5.19(周日)上午10点举办《GPT-4o后LLM时代RTC需求讨论会》讨论会。本期讨论会预计为线上闭门形式。 每期讨论会分别邀请了行业里面最资深的从业者、创业者朋友,每次讨论时间都限制在1.5-2小时,围绕主题,全程干货。 GPT-4o后最大的变动就是大模型的延迟时间大大缩短......
  • 通义千问 2.5 “客串” ChatGPT4,你分的清吗?
    作者:张添翼、董艺荃引子OpenAI发布了最新的GPT-4o模型,通义千问也在前不久刚发布通义千问2.5,已经和GPT-4-Turbo不分伯仲:既然目前还没有和GPT-4o文本生成能力的对比数据,就让我们来和大模型一起做个游戏测试一下:我们让通义千问2.5扮演GPT4,来和真正的GPT4进行问答P......
  • “她”来了,陪伴赛道巨变!为GPT-4o加上你的一个数字分身
    OpenAI的每次发布,感觉都会干翻一个行业。昨晚GPT-4o的发布,情感陪伴这个赛道像是又要掀起一番惊天巨变。各位创业老板们摩拳擦掌,无数创意精英又要踏入新的征程。开源社区一定也异常兴奋,相信Huggingface和Github马上又会孕育出新宠,大家都期待做出AI时代的SuperApp,至少也要是一个Ki......
  • GPT-4o
    跳至主要内容 研究产品安全公司   2024年5月13日你好GPT-4o我们宣布推出GPT-4o,这是我们的新旗舰模型,可以实时对音频、视觉和文本进行推理。贡献 尝试ChatGPT (在新窗口中打开)在游乐场尝试 (在新窗口中打开)重新观看现场演......