OpenAI o1模型：偏科的理科生

时间：2024-09-14 18:22:43浏览次数：22

标签：CoT 模型能力 OpenAI o1 逻辑推理 preview 偏科

LLM需要增强的地方

大模型的三大基础能力：

• 语言理解和表达能力：GPT-3 已解决
• 世界知识存储：GPT-4已经解决了不少
• 逻辑推理能力：是最薄弱的环节，o1模型在这方面有明显的进步。

原理

o1模型增强逻辑推理能力的思路是：收到问题后，自动生成CoT，再生成答案。避免人类写基于于CoT的Prompt。

如果让o1获取自动生成CoT的能力，通过强化学习提升模型自动找到正确推理路径的能力。

新的范式？

OpenAI发现：在强化学习的训练和推理过程中，随着计算能力的增加，模型推理效果（如找到正确CoT路径的概率）也会提高。这可能找到RL Scaling。可能不断增强计算能力，有可能进一步增强模型的逻辑推理能力。这可能是一种新的范式。

目标场景

由于增强了逻辑推理能力，o1模型适合编程、数学、物理等场景。但写文章可能反而会差点。有点像偏科的理科生。

我的感觉，o1模型与sonnet 3.5模型在编程上，没有拉开明显的差距。

一系列的模型

• o1模型：未开放，能力最强
• o1-preview：ChatGPT（会员）和API（需要消费1000美元以上的土豪）才能访问
• o1-mini：相比o1-preview，少了很多世界知识，适合不需要大量世界知识的场景，例如编程和数学，而且响应速度也快。

OpenAI应该是会推出一系列“逻辑推理能力更强，更偏科”的模型。

不成熟的模型

o1系列模型还没完全产品化，不支持视觉，不支持流式输出，不支持Function Call等。因此才叫preview。

更贵

o1-preview价格是GPT-4o的4倍。

另外，推理过程中，产生的隐藏Prompt（CoT）也要占用Token。这也会变相增加成本。

模型	输入价格 (每百万 tokens)	输出价格 (每百万 tokens)
o1-preview	$15	$60
o1-mini	$3	$12
GPT-4o	$5	$15

标签：CoT,模型,能力,OpenAI,o1,逻辑推理,preview,偏科
From： https://blog.51cto.com/u_9942799/12018229

OpenAI 的 o1 与 GPT-4o：深入探究 AI 的推理革命
简介在不断发展的人工智能领域，OpenAI再次凭借其最新产品突破界限：o1模型和GPT-4o。作为一名几十年来一直报道科技的人，我见过不少伪装成革命的增量更新。但这个？这不一样。让我们拨开炒作的迷雾，看看这些新模型到底带来了什么。推荐文章《AI交通管理系列之使用Python......
OpenAI 的 GPT-o1（GPT5）详细评论 OpenAI 的 Strawberry 项目具有博士级智能
简介OpenAI的GPT-5又名Strawberry项目，又名GPT-o1，又名博士级LLM现已推出。几个月来一直备受关注，从结果来看，它不负众望。OpenAI-o1是一系列模型，旨在增强科学、编码和数学等复杂领域的问题解决能力。推荐文章《AI交通管理系列之使用Python进行现代路线优化最......
Hume AI 推出 EVI 2 情感模型；OpenAI o1 模型问世，模拟人类思考问题丨 RTE 开发者日报
开发者朋友们大家好：这里是「RTE开发者日报」，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE（Real-TimeEngagement）领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」，但内容仅代表编辑的个......
ChatGPT实战100例 - (21) 搞定汉字新解，o1-mini 在李继刚老师这扳回一局
文章目录搞定汉字新解，o1-mini在李继刚老师这扳回一局翻车开车飙车出图福利在这福利+1搞定汉字新解，o1-mini在李继刚老师这扳回一局昨天朋友圈刷爆了李继刚老师的汉字新解，废话不说，上prompt;;作者:李继刚;;版本:0.1;;模型:ClaudeSonnet;;......
AI新时代揭幕会“思考解题逻辑”的OpenAI推理大模型登场
北京时间周五凌晨1时许，AI时代迎来崭新的起点——能够进行通用复杂推理的大模型终于走到台前。OpenAI在官网发布公告称，开始向全体订阅用户开始推送OpenAIo1预览模型——也就是此前被广泛期待的“草莓”大模型。OpenAI表示，对于复杂推理任务而言，新模型代表着人工智能能力的崭......
突发：ChatGPT最新模型【 o1 】草莓终于上线了！
OpenAI-o1的首次总结在阅读了OpenAI的出版物后，我对其本质特点进行了总结，并得出了以下结论：1.复杂问题的推理能力显著提升：OpenAI-o1在处理复杂问题时表现出色，尤其在逻辑任务方面。2.定期更新和改进：通过不断的训练，模型学会完善自己的思维过程，尝试不同的策略，并识别和纠正......
OpenAI 推出专门用于解决复杂问题的模型 OpenAI o1
2024年9月12日(当地时间)，北京时间9月13日凌晨，OpenAI推出了OpenAIo1，这是一系列致力于解决复杂问题的新型AI模型。据说，这些模型在科学、编码和数学等领域的表现比以前的模型更好。本文将详细介绍OpenAIo1的功能、价格和使用方法。OpenAIo1是什么？OpenAIo......
OpenAI使用AI编程给出了数数问题的解决方案 —— 如何解决ChatGPT不会数数的问题
总所周知的一个问题，那就是ChatGPT不会数数，不过今天突然发现OpenAI给出了一个神奇的解决方法，那就是AI编程。问题案例如下：Thetextprovidedwillbeanalyzedtocalculatethewordcount.text="""Therehasbeenrapidlygrowinginterestinmeta-learningasamet......
arraybag1arrayBagDemo1
/** AtestoftheconstructorsandthemethodsaddandtoArray, asdefinedinthefirstdraftoftheclassArrayBag. @authorFrankM.Carrano @version4.0*/publicclassArrayBagDemo1{ publicstaticvoidmain(String[]args) { ......
Azure web app has no access to openai private endpoint in virtual network
题意："AzureWeb应用无法访问虚拟网络中的OpenAI私有端点。"问题背景：IamtryingtohostawebapplicationsimilartoaprivateChatGPTinstancewithinasecludedvirtualnetwork,ensuringthatthere'snoexternalinternetaccess."我正在尝试在一个隔离的......