首页 > 其他分享 >OpenAI 向部分用户开放 GPT-4o 高级语音模式;AI 视频生成工具 Vidu 全球上线丨 RTE 开发者日报

OpenAI 向部分用户开放 GPT-4o 高级语音模式;AI 视频生成工具 Vidu 全球上线丨 RTE 开发者日报

时间:2024-07-31 17:30:15浏览次数:15  
标签:RTE 视频 AI 模型 用户 4o 开发者 Vidu

 

 

 

开发者朋友们大家好:

 

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

 

本期编辑:@JLT,@鲍勃

01有话题的新闻

1、OpenAI 向部分付费订阅用户开放 GPT-4o 高级语音模式,可提供更自然实时对话

 

当地时间 30 日,OpenAI 宣布即日起向部分 ChatGPT Plus 用户推出全新高级语音模式的 Alpha 版本,并将于今年秋季逐步推广至所有 ChatGPT Plus 订阅用户。GPT-4o 高级语音模式具有快速反应、允许用户随时进行打断、声音堪比真人等特征,OpenAI 更称 GPT-4o 高级语音模式可以感知语音中的情感语调,包括悲伤、兴奋或歌唱。

 

OpenAI 发言人林赛・麦卡勒姆(Lindsay McCallum)表示:「ChatGPT 不能假冒他人的声音,包括个人和公众人物的声音,并且会阻止与预设声音不同的输出。」(@IT 之家)

 

此外,X 用户 TestingCatalog News 还透露了拥有视觉能力的高级语音模式的界面。

 

2、Vidu 视频模型开放 Sora 架构,可模仿真实物理世界

 

AI 初创企业生数科技宣布,旗下 AI 视频生成工具 Vidu 全球上线,可通过 Web 端 www.vidu.studio 访问。

 

Vidu 介绍,模型最快推理速度为 30 秒,提供两大核心功能:文生视频、图生视频,分辨率最高达 1080P。免费版可生成 4 秒视频,支持超清和一个并行任务;收费版可生成 4 秒和 8 秒视频,支持超清、商用、超清后去除水印,支持两个并行任务。

 

Vidu 除了能实现常见的写实等多元风格外,还新增动漫风格选项,并显著提高了画面的稳定性。Vidu 声称,能够生成影视级别的特效画面,如烟雾、炫光效果、CG 特效等等。(@爱范儿)

 

3、Runway Gen 3 Alpha 模型图生视频功能正式上线

 

 

昨日,Runway 宣布旗下模型 Gen 3 Alpha 上线图生视频功能。据悉,用户可以使用任何图片作为 Gen 3 Alpha 生成视频的首帧,既可以单独使用图片作为提示,也可以辅以额外的文字。免费用户可以使用 Gen 3 Alpha 生成 5 秒钟的视频,而订阅用户可以生成 10 秒钟的视频。

 

官方表示,该模型会自动检测上传的图片,并阻止用户使用露骨或者和政客相关的图片创建视频。(@爱范儿)

 

4、苹果 Apple Intelligence 为用户提供详细的隐私报告,供用户查看 AI 调用情况

 

苹果公司于周一发布了 iOS 18.1 和 macOS Sequoia 15.1 的首个测试版,推出了 Apple Intelligence 功能。该功能包含了基于 AI 的新特性,如重述文本和总结信息或邮件。

 

同时为了保障用户隐私,苹果使用了私人计算模块(PCC),利用其自有芯片进行端到端加密处理,并在处理完成后永久删除所有数据。而且用户还可以在隐私设置中查看导出 Apple Intelligence 报告,以查看 AI 都请求处理你的哪些数据。

 

由于报告可能包含敏感数据,用户需要通过面部识别或指纹识别验证身份才能查看。苹果默认生成这份报告,并在设备上保留 15 分钟,用户可以更改设置将保留时间延长至 7 天或完全关闭。(@小互 AI)

 

5、开源项目 Ollama,简化多系统大型语言模型操作与定制

 

ollama 是一个开源项目,旨在帮助用户轻松启动和运行包括 Llama 3.1、Mistral、Gemma 2 在内的大型语言模型。该项目支持多种操作系统,包括 macOS、Windows 和 Linux,并提供了 Docker 镜像 ollama。用户可以通过简单的命令行操作来下载、创建、运行和管理模型。项目还提供了一系列的库,如 ollama-python 和 ollama-js,以及详细的文档和示例,帮助开发者集成和定制模型。

 

此外,ollama 支持从 GGUF、PyTorch 或 Safetensors 格式导入模型,并允许用户通过编写 Modelfile 来自定义模型的参数和提示。该项目的安装和使用说明都非常清晰,适合各种技术水平的用户。(@AI 科技评论)

02有态度的观点

1、黄仁勋与扎克伯格探讨 AI 未来,强调智能体与开源模型

 

黄仁勋与扎克伯格在 SIGGRAPH 大会上深入讨论了 AI 的未来。扎克伯格认为 AI 将彻底改变社交媒体,使 Facebook 和 Instagram 成为一个统一的 AI 模型,提供个性化体验。他强调了智能体作为 AI 产品的未来形态,并支持开放生态系统以促进技术标准形成。扎克伯格还讨论了智能眼镜和混合现实设备的前景,认为 AI+眼镜是元宇宙的新方向。

 

黄仁勋则强调了 AI 在模拟和计算平台中的作用,特别是 NVIDIA 在 AI 领域的贡献。两人一致认为,开源 AI 模型如 Llama 3.1 将推动行业发展,支持企业和研究者构建专用 AI。他们还探讨了 AI 在不同领域的应用,包括计算机视觉和机器人技术。(@腾讯科技)

 

写在最后:

 

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

 

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

 

 

素材来源官方媒体/网络新闻

标签:RTE,视频,AI,模型,用户,4o,开发者,Vidu
From: https://www.cnblogs.com/Agora/p/18335079

相关文章

  • 高效透明|AIRIOT智慧供应链管理解决方案
    智慧供应链管理作为现代企业转型升级的核心驱动力,正逐步重塑供应链管理的面貌,使之更加高效、透明且灵活。在全球经济深度融合与快速迭代的背景下,消费者需求的多元化、市场环境的瞬息万变,以及技术创新的不断涌现,对传统供应链管理模式提出了前所未有的挑战,传统供应链管理存在的诸......
  • OpenAI发布PVG:用小模型验证大模型输出解决“黑盒”难题,韩国团队拆分Transformer注意力
    OpenAI发布PVG:用小模型验证大模型输出解决“黑盒”难题,韩国团队拆分Transformer注意力让大模型解码提速20倍,微软、OpenAI、英特尔、谷歌、英伟达,成立开源大模型安全联盟。在今年的7月11日,全球著名开源大模型分享平台HuggingFace与专业数学大模型平台Numina合作,共同角逐AI......
  • AI产品经理的时间管理秘籍:掌握五个关键技巧,确保项目按时交付”
    产品经理在AI项目中要怎么做好时间把控?这篇文章里,作者结合实例,列出了AI项目时间把控中需要注意的5个环节,一起来看看吧。随着李一舟的AI课程话题的讨论火热,可以看出大家对AI行业的关注,记得李一舟的广告词里说产品经理一定要学AI!!!那产品经理该学AI的什么内容呢,本系列内容将为......
  • 零门槛AI 绘图:教你为客户定制 ComfyUI Serverless API 应用
    作者:鸥弋、筱姜2023年下半年,ComfyUI以其快速、流畅的图像生成能力,结合多样的自定义节点,迅速在创作者中流行起来。ComfyUI的亮点就是能够批量化生成图像,一键加载大量工作流,让用户可以轻松实现人像生成、背景替换、风格迁移和图像动画化等功能。越来越多的企业及个人开发者希望借......
  • springboot自学(5)自定义starter
      测试文件可以删除掉了,配置文件改一下后缀修改pom业务代码开发添加自动配置类,并且加上spring.factories到此为止就初步完成了,install到本地的maven仓库然后在使用的项目里加上依赖就行了导入项目,并调用定时任务报表开发先做个表格的打印方法表格......
  • AI创作商业系统软件源码(SparkAi系统) AI换脸/智能体GPTs应用/AI视频生成AI绘画/文档分
    AI创作商业系统软件源码(SparkAi系统)AI换脸/智能体GPTs应用/AI视频生成AI绘画/文档分析/GPT4.0模型支持目录一、人工智能SparkAi创作系统二、功能模块介绍系统快速体验三、系统功能模块3.1AI全模型支持/插件系统AI模型提问AI智能体文档分析多模态识图理解TTS&......
  • 2024 年过半,AI 大模型在各行业的落地实践走到哪了?
    转眼之间,2024年已经过半,AI大模型的热度从去年的技术探索转向落地实践,肉眼可见的是,各行各业都纷纷在这场热潮中寻找新的业务创新点和行业增长点。“大模型的出现带来了变革,它实现了知识平权,为我们提供了技术条件,使得我们能够参与到AI的应用中来。”宁德核电人工智能实验......
  • 【转型必看】Java到AI,程序员的逆袭秘籍,转行人工智能不再是梦!
    ​随着技术的不断进步,人工智能(AI)已经成为当今科技领域最热门的话题之一。许多开发者开始考虑从传统的软件开发领域,如Java,转向人工智能领域,今天小编和大家一起来探讨Java开发者是否可以转型到人工智能,转型的优势,薪资对比,以及转型所需的知识和学习路线等。01 Java开发者能否转型......
  • docker 拉取镜像超时:error pulling image configuration: download failed after atte
    之前是正常的,今天就罢工了,可能原因是国外镜像不稳定,被针对了吧。errorpullingimageconfiguration:downloadfailedafterattempts=6:dialtcp168.143.171.189:443:i/otimeout那就改为国内镜像:1.创建/etc/docker目录(已有的跳过)sudomkdir-p/etc/docker 2.修改......
  • 如何在 Kubernetes 里部署 JMX Exporter
    本文会通过一个Java应用,演示PrometheusJMXExporter在Kubernetes里的部署和配置方式。为了更好地理解JMXExporter,我们将使用SpringBootJava应用程序并将所有JMX指标导出给Prometheus。在本指南结束时,您将学习:使用Java应用镜像启动JMXExporter将JMX指标导......