此次o1发布,很多人达成的一个共识:o1模型是一个超强的理科生。
来自加州大学欧文分校(UCI)的物理学博士Kyle Kabasares,实测o1 preview+mini后发现:
o1模型已经强到,能够直出博士论文代码了! 使用方法放文末了。
2022年,物理学博士Kabasares在《天体物理学杂志》上发表了一篇论文,探讨了利用天文数据建模来测量黑洞质量的方法。 实现这段代码是Kabasares博士研究中的一个关键突破。
o1模型在1小时内生成的Python代码。虽然基于合成数据,但其功能与Kabasares的实际代码非常相似。
o1在最新门萨智商测试中,IQ水平竟超过了120分。35个智商题,答对了25道,把其他模型甩出好几条街。
同时数学大神陶哲轩也分享了他对于o1模型的测评。
“他向o1模型提出一个措辞模糊的数学问题,发现它竟然能成功识别出克莱姆定理。”而且答案是“完全令人满意的”那种。
全面测评o1模型
此次o1-preview 和 o1-mini模型最突出的能力就是数学和编程能力。我们分别进行三轮测试,数学真题、编程塔防游戏、经典疑难杂症题。 首先将数学竞赛的真题发给它,思考56秒后就给出正确答案。
同时,我们让它做一个塔防游戏,o1-mini也能给出相应的意见。
不过9.11和9.8依旧分不出谁更大,而且连续两次都回答错误。不过可以区分出“Strawberry“有多少个r了。
总的来说,此次OpenAI推出的o1-preview 和 o1-mini模型整体表现很强,大家有条件的可以去尝试一下,不过注意使用次数。o1 预览版目前每周限量提供30条,o1-mini 每周限量提供50条。
国内可用OpenAI o1方法
这里给大家推荐2233.ai这个工具。也可以体验最新版的 o1-preview 和 o1-mini 模型,像是之前的 GPT4o 的语音通话功能、绘画功能、上传文件功能、对话功能。ChatGPT所具有的功能这里全都有。
我使用了这么长时间,确实就原生版本体验。
最后真的先说一下,o1模型的发布代表这大模型迈向了新的台阶,如果有人工智能的奥斯卡奖,那么o1模型一定能获得这次的奖项。
它不仅仅是一个模型,是技术的巅峰,真的不敢想象把最新的o1模型放到机器人上会是一副什么样的场景。
标签:mini,模型,OpenAI,Kabasares,preview,o1 From: https://blog.csdn.net/xiaofeitunAI/article/details/142581495