首页 > 其他分享 >OpenAI o1模型:偏科的理科生

OpenAI o1模型:偏科的理科生

时间:2024-09-14 18:22:43浏览次数:11  
标签:CoT 模型 能力 OpenAI o1 逻辑推理 preview 偏科

LLM需要增强的地方

大模型的三大基础能力:

  • • 语言理解和表达能力:GPT-3 已解决
  • • 世界知识存储:GPT-4已经解决了不少
  • • 逻辑推理能力:是最薄弱的环节,o1模型在这方面有明显的进步。

原理

o1模型增强逻辑推理能力的思路是:收到问题后,自动生成CoT,再生成答案。避免人类写基于于CoT的Prompt。

如果让o1获取自动生成CoT的能力,通过强化学习提升模型自动找到正确推理路径的能力。

新的范式?

OpenAI发现:在强化学习的训练和推理过程中,随着计算能力的增加,模型推理效果(如找到正确CoT路径的概率)也会提高。这可能找到RL Scaling。可能不断增强计算能力,有可能进一步增强模型的逻辑推理能力。这可能是一种新的范式。

目标场景

由于增强了逻辑推理能力,o1模型适合编程、数学、物理等场景。但写文章可能反而会差点。有点像偏科的理科生。

我的感觉,o1模型与sonnet 3.5模型在编程上,没有拉开明显的差距。

一系列的模型

  • • o1模型:未开放,能力最强
  • • o1-preview:ChatGPT(会员)和API(需要消费1000美元以上的土豪)才能访问
  • • o1-mini:相比o1-preview,少了很多世界知识,适合不需要大量世界知识的场景,例如编程和数学,而且响应速度也快。

OpenAI应该是会推出一系列“逻辑推理能力更强,更偏科”的模型。

不成熟的模型

o1系列模型还没完全产品化,不支持视觉,不支持流式输出,不支持Function Call等。因此才叫preview。

更贵

o1-preview价格是GPT-4o的4倍。

另外,推理过程中,产生的隐藏Prompt(CoT)也要占用Token。这也会变相增加成本。

模型

输入价格 (每百万 tokens)

输出价格 (每百万 tokens)

o1-preview

$15

$60

o1-mini

$3

$12

GPT-4o

$5

$15


标签:CoT,模型,能力,OpenAI,o1,逻辑推理,preview,偏科
From: https://blog.51cto.com/u_9942799/12018229

相关文章

  • OpenAI 的 o1 与 GPT-4o:深入探究 AI 的推理革命
    简介在不断发展的人工智能领域,OpenAI再次凭借其最新产品突破界限:o1模型和GPT-4o。作为一名几十年来一直报道科技的人,我见过不少伪装成革命的增量更新。但这个?这不一样。让我们拨开炒作的迷雾,看看这些新模型到底带来了什么。推荐文章《AI交通管理系列之使用Python......
  • OpenAI 的 GPT-o1(GPT5)详细评论 OpenAI 的 Strawberry 项目具有博士级智能
    简介OpenAI的GPT-5又名Strawberry项目,又名GPT-o1,又名博士级LLM现已推出。几个月来一直备受关注,从结果来看,它不负众望。OpenAI-o1是一系列模型,旨在增强科学、编码和数学等复杂领域的问题解决能力。推荐文章《AI交通管理系列之使用Python进行现代路线优化最......
  • Hume AI 推出 EVI 2 情感模型;OpenAI o1 模型问世,模拟人类思考问题 丨 RTE 开发者日报
       开发者朋友们大家好: 这里是「RTE开发者日报」,每天和大家一起看新闻、聊八卦。 我们的社区编辑团队会整理分享RTE(Real-TimeEngagement)领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个......
  • ChatGPT实战100例 - (21) 搞定汉字新解,o1-mini 在李继刚老师这扳回一局
    文章目录搞定汉字新解,o1-mini在李继刚老师这扳回一局翻车开车飙车出图福利在这福利+1搞定汉字新解,o1-mini在李继刚老师这扳回一局昨天朋友圈刷爆了李继刚老师的汉字新解,废话不说,上prompt;;作者:李继刚;;版本:0.1;;模型:ClaudeSonnet;;......
  • AI新时代揭幕 会“思考解题逻辑”的OpenAI推理大模型登场
    北京时间周五凌晨1时许,AI时代迎来崭新的起点——能够进行通用复杂推理的大模型终于走到台前。OpenAI在官网发布公告称,开始向全体订阅用户开始推送OpenAIo1预览模型——也就是此前被广泛期待的“草莓”大模型。OpenAI表示,对于复杂推理任务而言,新模型代表着人工智能能力的崭......
  • 突发:ChatGPT最新模型【 o1 】草莓终于上线了!
    OpenAI-o1的首次总结在阅读了OpenAI的出版物后,我对其本质特点进行了总结,并得出了以下结论:1.复杂问题的推理能力显著提升:OpenAI-o1在处理复杂问题时表现出色,尤其在逻辑任务方面。2.定期更新和改进:通过不断的训练,模型学会完善自己的思维过程,尝试不同的策略,并识别和纠正......
  • OpenAI 推出专门用于解决复杂问题的模型 OpenAI o1
    2024年9月12日(当地时间),北京时间9月13日凌晨,OpenAI推出了OpenAIo1,这是一系列致力于解决复杂问题的新型AI模型。据说,这些模型在科学、编码和数学等领域的表现比以前的模型更好。本文将详细介绍OpenAIo1的功能、价格和使用方法。OpenAIo1是什么?OpenAIo......
  • OpenAI使用AI编程给出了数数问题的解决方案 —— 如何解决ChatGPT不会数数的问题
    总所周知的一个问题,那就是ChatGPT不会数数,不过今天突然发现OpenAI给出了一个神奇的解决方法,那就是AI编程。问题案例如下:Thetextprovidedwillbeanalyzedtocalculatethewordcount.text="""Therehasbeenrapidlygrowinginterestinmeta-learningasamet......
  • arraybag1arrayBagDemo1
    /**  AtestoftheconstructorsandthemethodsaddandtoArray,  asdefinedinthefirstdraftoftheclassArrayBag.  @authorFrankM.Carrano  @version4.0*/publicclassArrayBagDemo1{  publicstaticvoidmain(String[]args)  { ......
  • Azure web app has no access to openai private endpoint in virtual network
    题意:"AzureWeb应用无法访问虚拟网络中的OpenAI私有端点。"问题背景:IamtryingtohostawebapplicationsimilartoaprivateChatGPTinstancewithinasecludedvirtualnetwork,ensuringthatthere'snoexternalinternetaccess."我正在尝试在一个隔离的......