首页 > 其他分享 >在 GPT-4o 释放完整能力前,听听实时多模态 AI 创业者的一手经验 | 编码人声

在 GPT-4o 释放完整能力前,听听实时多模态 AI 创业者的一手经验 | 编码人声

时间:2024-05-28 17:23:49浏览次数:18  
标签:RTE 社区 AI 实时 4o 开发者 GPT

 

 

「编码人声」是由「RTE开发者社区」策划的一档播客节目,关注行业发展变革、开发者职涯发展、技术突破以及创业创新,由开发者来分享开发者眼中的工作与生活。

 

5 月中旬 GPT-4o 的发布,让人与 AI 的交互,从对话框的文本交流加速推进到了音视频多模态的实时互动。

 

本期节目,我们邀请到实时互动 AI 创业者史业民。他结合了自己的一手研发经验,深度分析了 GPT-4o 在多模态、实时交互、情感语音的新能力和能力边界,分享了 GPT-4o 正在催生的潜在场景和新机会。史业民还从开发者视角,提出了面向开发者的 GPT-4o 和面向用户的 ChatGPT 能力可能存在区别的提醒,以及在开发多模态 AI 产品时需要注意到的技术细节。

 

从对话框到音视频,多模态的实时互动 AI 已成趋势。希望本期节目能对你有所启发。

 

 

本期主播与嘉宾

  • 史业民:实时互动 AI 创业者,前智源研究院研究员。

  • 朱峰:「津津乐道播客网络」创始人,产品及技术专家。

相关信息

  • 史业民团队最新项目:Pandora,一个可通过语言交互控制的生成视频世界模型。https://world-model.ai

  • 一起探索人和 AI 的新连接方式!RTE 开发者社区将在 6 月 22 日、23 日,联合 Founder Park 在北京举办线下的 AGI Playground 活动,边玩边探索 AGI 和 RTE 实时互动的新可能。加入社区微信群,还可以提前获取活动消息,抽免费活动门票。关注「RTE 开发者社区」微信公众号,在后台回复「小助手」即可入群。

制作团队

  • 后期 / 卷圈

  • 监制 / 姝琦

  • 产品统筹 / bobo

  • 联合制作 / RTE开发者社区

关于「编码人声」

「编码人声」是由「RTE开发者社区」策划的一档播客节目,关注行业发展变革、开发者职涯发展、技术突破以及创业创新,由开发者来分享开发者眼中的工作与生活。

 

录制嘉宾覆盖信通院 & 科委专家、国内外资深投资人、VR/AR & 虚拟人 & AIGC 等新兴技术领域头部创业者、一线网红 & 硬核开发者、跨界画家 & 作家 & 酿酒师等。

 

RTE 开发者社区是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流,我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源,我们将陪跑开发者,共享、共建、共成长。

 

社区于2023年底正式启动了「主理人+工作组」的运营机制,并确认了社区的 3 位联合主理人 ——

 

· 零一万物 01.AI 开源负责人 @林旅强 Richard

· FreeSWITCH 中文社区创始人 @杜金房

· 小红书音视频架构负责人 @陈靖

 

本节目由津津乐道播客网络与 RTE 开发者社区联合制作播出。

 

 

标签:RTE,社区,AI,实时,4o,开发者,GPT
From: https://www.cnblogs.com/Agora/p/18218473

相关文章

  • pnpm安装依赖出现ELIFECYCLE  Command failed with exit code 1 Build failed
    这种情况一般是安装了nvm的情况下会出现,错误提示一般如下Progress:resolved1713,reused1633,downloaded0,added1632,donenode_modules/.pnpm/[email protected]/node_modules/core-js:Runningpostinstallscript,donein118msnode_modules/.pnpm/[email protected]/nod......
  • Typora流程图--Mermaid语法
    在Typora中生成流程图(Flowchart)可以使用Markdown的扩展语法,特别是支持Mermaid语法来绘制流程图。以下是具体步骤:步骤1:安装Typora首先,请确保你已经安装了Typora。步骤2:开启Mermaid支持Typora支持多种图表绘制,包括Mermaid。你需要确保Mermaid支持已经启用。打开Typora......
  • 2024最新ChatGPT网站源码+AI绘画系统源码,详细图文搭建教程/支持ChatGPT4.0/GPT-4o文档
    一、文章前言SparkAi创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。本期针对源码系统整测试下来非常完美,那么如何搭建部署AI创作系统呢?小编这里写一个详细图文教程吧。支持GPT-4o大模型、GPTs应用、GPT语音对话、联......
  • 效率翻倍!超好用的AI+写作API接口汇总
    在过去几年里,人工智能(AI)技术经过众多科技公司和科研人员的不懈努力取得了巨大进步,吸引了大众的广泛关注。这些AI技术在应用领域的新闻报道也逐渐走入人们的视野,引发了对其具体应用的浓厚兴趣。今天,我们将聊一聊AI与写作文案的结合。在传统观念中,AI技术通常被限制在有明确定义任务......
  • 7款优秀的AI搜索引擎工具推荐
    AI搜索引擎不仅能够理解复杂的查询语句,还能够通过学习用户的搜索习惯和偏好,提供更加个性化的搜索结果。本篇文章将介绍7款在这一领域表现出色的AI搜索引擎工具,它们各有特色,但都致力于为用户提供更加智能、高效和精准的搜索体验。传统的搜索引擎在处理模糊或多义性强的查询时往往......
  • ChatGPT结合ArcGIS,快速实现空间分析+制图+遥感数据处理
    在数字化和智能化的浪潮中,GIS(地理信息系统)和GPT(生成式预训练模型)的结合正日益成为推动科研、城市规划、环境监测等领域发展的关键技术。GIS以其强大的空间数据处理、先进的空间分析工具、灵活的地图制作与可视化能力、广泛的扩展性和定制性,成为地理信息科学的核心工具。它在多......
  • 【GPT应用】Python-GEE遥感大数据分析
    随着航空、航天、近地空间遥感平台的持续发展,遥感技术近年来取得显著进步。遥感数据的空间、时间、光谱分辨率及数据量均大幅提升,呈现出大数据特征。这为相关研究带来了新机遇,但同时也带来巨大挑战。传统的工作站和服务器已无法满足大区域、多尺度海量遥感数据处理需求。为解......
  • Rust语言实现的去中心化AI网络节点
    一、概述去中心化和人工智能(AI)是两个极具潜力的发展方向。Gaia项目正是将这两者结合起来,创造了一个去中心化的AI网络节点。本文将深入探讨Gaia项目的技术细节,通过丰富的示例和详细描述,帮助读者全面理解并掌握该技术。二、什么是Gaia?Gaia是一个去中心化的人工智能网络,它旨......
  • 关于报错:npm下载时出现node_modules\.pnpm\[email protected]\node_modules\node-s
    关于npminstall出现Failedin911msatF:\Sert-Vue-master\vue\node_modules\.pnpm\[email protected]\node_modules\node-sass ELIFECYCLE Commandfailedwithexitcode1. 最开始从GitHub拉了一个项目,然后npmi的时候出现了报错npmERR!gypERR!stackError:`......
  • AI绘画整合包最新Stable Diffusion安装包+教程+模型+插件+动作来了(纯教学)
    首先了解一下AI绘画工具,介绍一下什么是StableDiffusion,模型的主要功能和作用StableDiffusion(简称SD),是一种先进的人工智能技术。这项技术的核心能力在于,它能够根据用户提供的文字描述,生成丰富且细致的图像内容。不仅如此,SD还能够处理图像修补、扩展以及基于文本指导的图像转......