NVIDIA 开发者关系副总裁,媒体和娱乐业务主管RICHARD KERRIS说不久之后,几乎所有人都能够成为开发者。以前的开发者必须掌握并熟练使用特定的开发语言才能开发应用或服务。随着计算基础设施越来越多地在软件开发语言上训练,任何人都将能够提示机器创建应用、服务、设备支持等。
企业将继续雇用开发人员构建和训练 AI 模型及其他专业应用,同时其他具备相关技能的人士也都将获得更多构建定制产品和服务的机会。在文本输入或语音提示的帮助下,他们与计算机的交互将变得像口述指令一样简单。
电影和音乐将迎来新的时代:正如 Fab Four “新创作”的 AI 增强歌曲引发了新一波的披头士热潮一样,第一部长篇生成式 AI 电影的诞生也将在电影业掀起轩然大波。
比如,电影制片人在使用 35 毫米胶片摄影机拍摄后,可以通过生成式 AI 技术,将所拍摄的内容快速转换成 70 毫米格式。这将降低制作 IMAX 电影所需的巨额成本,并让更多导演参与其中。
创作者将使用文字、图像或视频来提示计算机把精美的图像和视频转化成新类型和新形式的娱乐内容。一些专业人士担心这会抢了他们的“饭碗”,但由于生成式 AI 能够通过特定任务的训练而日益完善,这些问题也会逐渐消失,反而使专业人士有时间去处理其他任务,并为他们提供界面对艺术家友好的新工具。
Runway,一家应用人工智能研究公司,联合创始人兼首席技术官Anastasis Germanidis表示正在塑造艺术、娱乐和人类创造力的下一个时代。
Anastasis Germanidis预见到视频生成和AI新界面将是2024年的主要发展趋势。他预测AI将在视频内容的生成上取得显著进步,包括提高生成视频的质量、通用性和可控性。此外,他还指出,随着AI模型的发展,我们将看到更多创新的用户界面和产品出现,这些新的界面和产品将超越传统的交互模式,提供更加丰富的用户体验。
视频生成技术的发展:预计在AI视频生成方面,我们将见证视频质量和创作自由度的显著提升。
用户界面和产品的创新:随着AI技术的进步,新的用户界面和产品将推动我们与AI的互动方式发生革命性变化。
AI在内容创作中的作用:强调了AI在帮助创造多媒体内容,如视频、图像和音频,方面的潜力。
A16Z GAMES团队合作伙伴Troy kirwin:如果2023年是我们与人工智能聊天的一年,那么明年,这些关系将通过我们实时口头交谈的3D化身变得栩栩如生。像Character AI这样的人工智能伴侣应用已经看到了数百万活跃用户与虚拟埃隆·马斯克、超级马里奥或心理学家等聊天机器人互动。在即将到来的这一年,这些对话将像FaceTime通话一样自然。得益于较低的延迟响应、语音到语音技术的进步以及音频驱动的面部动画,我们与AI伴侣的对话将变得越来越敏锐、专注和个性化。娱乐将继续从被动体验转向主动体验,线性电视和互动游戏之间的界限将变得模糊。
A16Z GAMES团队合伙人Joshua Lu说不断提高的制作预算和玩家期望使得游戏开发者的成功变得困难。然而,新的用户生成内容(UGC)平台和AI驱动的创作工具显示出打破这些障碍的潜力。
2023年第一季度,Roblox开发者收入达到1.82亿美元,同比增长约17%。Epic也开始为Fortnite Creative开发者提供经济支持,预计2023年的支付金额将超过1亿美元。随着UGC平台之间的竞争加剧,开发者将受益于更大的激励措施。值得注意的是,Meta的Horizon Worlds已于2023年扩展到移动端。
与此同时,得益于生成式AI驱动的强大工具,UGC游戏开发者现在也获得了更强大的支持。(Epic已经公开支持这种技术,而Roblox已经宣布了一些生成式AI工具。)结合这两个因素,明年有望释放数百万新创作者。
NVIDIA 嵌入式和边缘计算副总裁DEEPU TALLA表示LLM 将为机器人工程师的工作带来迅速的改观。生成式 AI 将为机器人开发代码并创建新的模拟环境以测试和训练它们。
LLM 将自动创建 3D 场景、构建环境并根据输入的数据生成资产,从而加快模拟开发速度。生成的模拟资产将成为合成数据生成、机器人技能训练和机器人应用测试等工作流的关键。
除了帮助机器人开发者外,LLM 背后的引擎 —— Transformer AI 模型将使机器人变得更加智能,使其能够更好地理解复杂的环境,并更有效地在这些环境中执行各种技能。
为了扩大机器人产业的规模,机器人必须变得更加通用。也就是说,它们需要能够更快掌握技能或将技能应用于新的环境中。在模拟中训练和测试的生成式 AI 模型将成为使机器人变得更加强大、灵活且易用的关键。
标签:视频,机器人,AI,生成式,生成,2024,开发者,互动 From: https://blog.51cto.com/u_16417045/9294245