首页 > 其他分享 >OpenAI最新模型GPT4o十个牛逼的应用场景!

OpenAI最新模型GPT4o十个牛逼的应用场景!

时间:2024-05-14 17:42:40浏览次数:24  
标签:场景 演示 GPT4o 可以 OpenAI GPT 模型

OpenAI真是要压着谷歌打么?哈哈! 直接赶在谷歌之前开了一个新品发布会。       今天凌晨直播,早上一起来就发现已经可以体验新模型了。         从录播内容来看,并没有传言的GPT5,也没有所谓的搜索功能。 但是,这次更新依旧出彩。 其实奥特曼在X上早就说了,不是gpt5,也不是搜索,但对他来说像魔法一般。       整个发布会看下来,也是有一种未来已来的感觉。 很明显,ChatGPT早已不再是一个文字模型了。 它可以感知外界的声音和画面,甚至你说话的情绪,并且给你相应情绪的反馈。 这很容易,让人联想到科幻电影《Her》。       很明显,Sam也是朝着这个目标去的。她在7个小时前发了一条推,上面只有一个单词“her”。         《Her她》是一部讲述在不远的未来人与人工智能相爱的科幻爱情电影。电影中男主的云端情人(人工智能系统OS1)由性感女神斯嘉丽·约翰逊配音。 寡姐是多少男人的梦中情人啊,有这样一个AI,还要啥女朋友? 说得有点远了,回归到GPT4o, HER显然还是一个目标,而不是现实。 但是确实值得来说一说,也许今天,已经在创造历史了。 我还没有仔细对比宣传视频和实际使用的差距,但是看到X上有人(@minchoi)概括和演示了GPT4o的十种使用场景,有点意思,和大家分享一下。 通过一些实际的使用场景,也可以更好地理解这个模型。 1.实时视觉助手       这应该是最惊艳演示了,就是你看到了什么,可以直接和GPT4o进行讨论,它能实时理解你看到的东西。 这个关于鸭子的演示,也很有意思,曾经谷歌也做过,但是后来大家发现谷歌是靠剪辑做的实时交互,GPT4o似乎可以通过摄像头直接实时交互。 我还没体验到,但是官方演示视频中也有演示这个功能。   2. 辅助学习         视频演示了GPT4o直接读 IPAD中给出的题目,并可以和家长和孩子,通过语音实时互动。 这简直就是学渣和学渣家长的福音啊。 GPT应该是一个不错的老师,至少不会像我这样暴跳如雷吧~~哈哈! 辅导过孩子作业的都知道,这个过程是有多崩溃。很快,也许GPT就能接过这个事情了,对我而言,这是刚需。   3. 实时翻译         实时翻译功能,可以让GPT充当你的个人翻译,可以让两个说不同语言的人流畅沟通。 你只要和GPT约定好规则,你可以直接说中文,它立马翻译成日语,对方说日语,立马可以翻译成汉语。 你们想想看,这又是多少人的刚需啊。 学了几十年的英语,还是个渣渣,最终还是得靠科技啊~~   4.会议助手         我不喜欢开会,这个介绍跳过,你们可以自己想象一下。比如有人帮你录音,做会议纪要,做会议总结。   5. 实时中断并改变情绪         用过老版本GPT4语音通话的人,肯定有一点点崩溃的感觉。GPT4的语音反馈非常非常慢。 它必须先把你的语音转换成文字,然后在交给后端处理,处理完成之后又要把文本转换成语音,所以整个过程非常煎熬。 现在好了,新版GPT4o可以随时打断,随时插嘴了。 而且反馈速度也非常快,好像可以在几百毫米内作出反馈。这是一个巨大的实用性上的进步。 除了可以随时说话随时打断之外,还具有了通过声音理解和表达情绪的能力。 这句话的意思就是,她能从过你的声音感受到你的喜怒哀乐,你也可以让它用不同情绪来和你说话。 比如,“嗨,GPT来撒个娇” ,“请用无比兴奋的语气说,come on,baby” 哈哈哈~~   6. 把文字添加到图片中         这个功能不需要多解释啊,图片演示得很直观。不用P图了,直接生成。可以看到文字添加到图片后,和图片融合得天衣无缝。   7. 多人会议记录         可以通过会议录音,直接提问“录音中有多少人,说了什么”。 回答说“有四个人,听起来像是一个项目管理的会议,马克正在介绍他自己....” 然后会把谁,说了什么,用文字的形式展现出来。 这种功能不算惊艳,但是很实用。   8. 3D物体合成       现在不光可以生成图片,还可以生成3D动画了么?   7. 海报制作       添加图片注释,不超过 140 字(可选)   输入两个人的照片,制作一张大片的海报。好基友,共进退!   8. 制作风格化的照片       上传一张照片,添加一段描述,就能生成风格化的照片了。 这个功能并不新鲜,很多传统软件也有,只是现在可以通过统一的对话窗口,通过对话来完成了。 这颗痣保留得不错! 感觉GPT可以吞噬一切APP。   9. 定位精准的高阶P图       给出一个openai的logo,给出一个没有品牌标识的杯垫。 通过描述,把openai的标志和文字刻到上面。 注意,不是贴上去的感觉,而是有刻上的感觉。 融合得非常自然。   10.生成特殊字体的文字       通过描述“字母 KLM NOP QRS 显示在三行中,像在字帖中展示字体一样。这是一种超未来的字体,是人工智能G命的标志” 来生成特殊字体。 十个场景说完了,前面几个比较宏大,后面的比较细致。 “机械组”要加油了,赶紧制造出一个逼真的身体吧! 上面是通过应用场景来感受GPT4o,下面是官方给出的基准测试。       添加图片注释,不超过 140 字(可选)   不能说遥遥领先,也是保持了基本的领先。 另外也从侧面反映,OpenAI的对手们也咬得很紧。 Claude有点势均力敌的感觉, 谷歌也没有想象中的弱, Llama3 400B在openai的测试中居然也这么强~~。 openai怎么不把国产模型也放在里面测一测呢? 是看不起李彦宏,还是看不起百度么? 哈哈,好大的胆子! What's your problem!(请脑补画面) 当然,上面的测评只是基于文本的特定指标的基准测试,而这次最大的更新应该是基于视觉和声音,这两方面OpenAI应该属于“遥遥领先” ! 从通用大模型的角度来说,OpenAI整体实力确实强,比较讨厌的是不开源,不好抄

标签:场景,演示,GPT4o,可以,OpenAI,GPT,模型
From: https://www.cnblogs.com/wangpg/p/18191822

相关文章

  • OpenAI 发布全新生成式模型 GPT-4o;字节收购音频设备公司 Oladance丨 RTE 开发者日报 V
      开发者朋友们大家好: 这里是「RTE开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE(RealTimeEngagement)领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑......
  • MultiPromptChain--场景切换
    fromlangchain_community.llmsimportOllamafromlangchain.chains.routerimportMultiPromptChainfromlangchain.chainsimportConversationChainfromlangchain.chains.llmimportLLMChainfromlangchain.promptsimportPromptTemplatellm=Ollama(base_url='htt......
  • 基于角色的访问控制并根据不同的场景显示不同的反馈信息
    要实现基于角色的访问控制(RBAC),并根据不同的场景(如菜单项、页面、组件)显示不同的反馈信息(如隐藏、禁用、提示等),可以设计一套完整的解决方案。这个方案需要结合权限管理、上下文、路由控制和条件渲染等多个方面。以下是一个详细的实现方案:1.设置角色和权限首先,定义你的角色和权限......
  • OpenAI 或将推出多模态人工智能数字助理;研究发现部分 AI 系统已学会「说谎」丨 RTE 开
      这里是「RTE开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE(RealTimeEngagement)领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言......
  • 云效 Pipeline as Code 来了!这些场景,用好它效率翻倍!
    从可视化编排到支持YAML编排云效流水线Flow是开箱即用的企业级持续集成和持续交付工具,支持丰富的代码源、构建、自动化测试工具、多种部署类型和部署方式,与阿里云深度集成,还提供多种企业级特性,助力企业高效完成从开发到上线CICD过程。在业界,流水线产品通常有2种使用方式......
  • 云效 Pipeline as Code 来了!这些场景,用好它效率翻倍!
    从可视化编排到支持YAML编排云效流水线Flow是开箱即用的企业级持续集成和持续交付工具,支持丰富的代码源、构建、自动化测试工具、多种部署类型和部署方式,与阿里云深度集成,还提供多种企业级特性,助力企业高效完成从开发到上线CICD过程。在业界,流水线产品通常有2种使用方式......
  • 全双工与半双工技术解析及其应用场景
    随着信息技术的迅猛发展,通信系统的性能要求日益提高。在数据传输中,双工模式的选择对于提高系统效率、降低通信延迟具有重要意义。本文将对全双工和半双工两种双工模式进行详细解析,并探讨它们各自的优缺点及适用场景。一、全双工模式全双工模式允许数据在通信链路的两个方向上同......
  • 准实时数仓搭建指南:以仓储式会员商超为模拟场景
    在电商和新零售持续冲击传统零售商超的今天,仓储式会员店反而成功逃脱曾经的“水土不服”预测,业绩一路向好。与此同时,随着人工智能、大数据、智慧物流等技术的不断革新,零售批发的消费场景也进一步拓展,对数据分析的要求也越发迫切。本文将以巴基斯坦Metro的数仓项目为例,以操作指......
  • Copilot - OpenAI与GitHub联合出品的自动代码生成AI+VirtualLCD - 可用于 GUI 移植的
    1、AntOS-适用8051的超轻量级实时操作系统AntOS是一款超轻量级实时操作系统,抢占式调度极简内核,专门为小型家电及轻量型物联网终端设计,适合在8051为内核的MCU上运行。项目主页: https://gitee.com/zeweni/ant-osAntOS提供层级服务,可以进行任意裁剪。内核层包含两个子系......
  • 苹果再失资深设计师,Jony Ive 团队基本离开;OpenAI 或于下周发布 AI 搜索丨 RTE 开发者
      这里是「RTE开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE(RealTimeEngagement)领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言......