首页 > 其他分享 >北大&港中文&腾讯提出ViewCrafter:一张图像就可以制作影视特效和游戏画面!

北大&港中文&腾讯提出ViewCrafter:一张图像就可以制作影视特效和游戏画面!

时间:2024-09-18 16:24:44浏览次数:3  
标签:特效 合成 视图 生成 腾讯 点云 ViewCrafter 3D


北大和港中文联合腾讯人工智能实验室提出了 ViewCrafter,这是一种利用视频扩散模型的先验从单个或稀疏图像合成一般场景的高保真新视图的新方法。

可以简单理解为将复杂的图像转换成新角度的图像版本。首先,它会使用特殊的算法来读取一张或几张图像,创建一个三维的"模型",这就像是把镜头给移动了一样。然后,使用一种叫做视频扩散的技术,从这个模型生成多个角度的图像,确保生成出来的新图像清晰且自然。该方法有望能够在多种应用中有效使用,比如制作游戏画面或者影视特效等。

相关链接

论文地址:http://arxiv.org/abs/2409.02048v1

项目地址:https://drexubery.github.io/ViewCrafter/

论文阅读

北大&港中文&腾讯提出ViewCrafter:一张图像就可以制作影视特效和游戏画面!_3D

ViewCrafter:驯服视频传播模型以实现高保真新颖视图合成

摘要

尽管神经 3D 重建最近取得了进展,但对密集多视图捕获的依赖限制了它们的广泛适用性。在这项工作中,我们提出了ViewCrafter,这是一种利用视频扩散模型的先验从单个或稀疏图像合成一般场景的高保真新视图的新方法。我们的方法利用视频扩散模型强大的生成能力和基于点的表示提供的粗略 3D 线索,通过精确的相机姿势控制生成高质量的视频帧。

为了进一步扩大新视图的生成范围,我们定制了一种迭代视图合成策略和相机轨迹规划算法,以逐步扩展 3D 线索和新视图覆盖的区域。借助 ViewCrafter,我们可以促进各种应用,例如通过使用重建的 3D 点和生成的新视图有效优化 3D-GS 表示来实现实时渲染的沉浸式体验,以及场景级文本到 3D 生成以创作更具想象力的内容。在不同数据集上进行的大量实验证明了我们的方法在合成高保真和一致的新观点方面具有强大的泛化能力和卓越的性能。

方法

北大&港中文&腾讯提出ViewCrafter:一张图像就可以制作影视特效和游戏画面!_新视图_02

给定单个参考图像或稀疏图像集,我们首先使用密集立体模型构建其点云表示,这使得能够精确移动摄像机进行自由视图渲染。随后,为了解决点云渲染结果中出现的大量缺失区域、几何失真和点云伪影,我们训练了一个点条件视频扩散模型作为增强渲染器,促进基于粗点云渲染的高保真和一致的新视图生成。为了实现远程新视图合成,我们采用了一种迭代视图合成策略,该策略涉及迭代移动摄像机、生成新视图和更新点云,从而实现更完整的点云重建并有利于 3D-GS 优化等下游任务。

北大&港中文&腾讯提出ViewCrafter:一张图像就可以制作影视特效和游戏画面!_3D_03

为了实现更一致的 3D-GS 优化,我们利用迭代视图合成策略逐步完成初始点云并使用 ViewCrafter 合成新视图。然后,我们使用完成的密集点云初始化 3D-GS,并使用合成的新视图来监督 3D-GS 训练。

实验

零样本新视图合成结果(单视图)

上图为摄像机轨迹,下图为沿摄像机轨迹生成的新视图视频。

北大&港中文&腾讯提出ViewCrafter:一张图像就可以制作影视特效和游戏画面!_3D_04

北大&港中文&腾讯提出ViewCrafter:一张图像就可以制作影视特效和游戏画面!_游戏_05

北大&港中文&腾讯提出ViewCrafter:一张图像就可以制作影视特效和游戏画面!_游戏_06

北大&港中文&腾讯提出ViewCrafter:一张图像就可以制作影视特效和游戏画面!_新视图_07

北大&港中文&腾讯提出ViewCrafter:一张图像就可以制作影视特效和游戏画面!_3D_08

北大&港中文&腾讯提出ViewCrafter:一张图像就可以制作影视特效和游戏画面!_点云_09

零样本新视图合成结果 (2 次浏览)

北大&港中文&腾讯提出ViewCrafter:一张图像就可以制作影视特效和游戏画面!_点云_10

北大&港中文&腾讯提出ViewCrafter:一张图像就可以制作影视特效和游戏画面!_点云_11

3D 重建结果(单一视图)

北大&港中文&腾讯提出ViewCrafter:一张图像就可以制作影视特效和游戏画面!_点云_12

文本到 3D 生成结果

北大&港中文&腾讯提出ViewCrafter:一张图像就可以制作影视特效和游戏画面!_点云_13

北大&港中文&腾讯提出ViewCrafter:一张图像就可以制作影视特效和游戏画面!_3D_14

点云渲染结果的可视化

第一行显示点云渲染结果,第二行显示ViewCrafter生成的相应新视图。ViewCrafter不仅可以填充点云中的遮挡,还可以处理不正确的几何图形。

北大&港中文&腾讯提出ViewCrafter:一张图像就可以制作影视特效和游戏画面!_点云_15

结论

本研究提出了 ViewCrafter,这是一种新颖的视图合成框架,它结合了视频扩散模型和点云先验,可实现高保真和准确的新颖视图合成。我们的方法克服了现有方法的局限性,为各种场景类型提供了泛化能力,并为单个和稀疏图像输入提供了适应性,同时保持了新颖视图质量的一致性和准确性。此外,我们引入了一种迭代视图合成方法和自适应相机轨迹规划程序,可促进远程新颖视图合成和针对不同场景的自动相机轨迹生成。除了新颖视图合成之外,我们还探索了 3D-GS 表示的有效优化,以实现实时、高帧率的新颖视图渲染,并调整我们的框架以进行文本到 3D 的生成。

局限性。 尽管我们的方法有其优点,但仍有几个局限性。首先,在有限的 3D 线索下,它可能在合成具有非常大视野范围的新视图时遇到挑战,例如仅从后视图像生成前视图像。此外,我们利用点云作为显式先验,并验证了我们的方法对低质量点云的鲁棒性。然而,在条件点云明显不准确的场景中,挑战可能仍然存在。此外,作为视频扩散模型,我们的方法需要在推理过程中进行多步去噪,这需要相对较高的计算成本。

标签:特效,合成,视图,生成,腾讯,点云,ViewCrafter,3D
From: https://blog.51cto.com/u_16658015/12047102

相关文章

  • PyQt / PySide + Pywin32 + ctypes 自定义标题栏窗口 + 完全还原 Windows 原生窗口边
    项目地址:GitHub-github201014/PyQt-NativeWindow:AclassofwindowincludenativeEvent,usePySideorPyQtandPywin32andctypesAclassofwindowincludenativeEvent,usePySideorPyQtandPywin32andctypes-github201014/PyQt-NativeWindowhttps://githu......
  • 用 CSS 实现流动边框特效
    《用CSS实现流动边框特效》在网页设计中,独特的视觉效果能够吸引用户的注意力并提升用户体验。其中,流动边框特效是一种令人眼前一亮的设计元素,可以为网页增添动感和活力。本文将介绍如何使用CSS来创建一个流动的框特效。一、准备工作首先,我们需要一个HTML元素作为应用特效的目......
  • 【生日视频制作】奔驰梅赛德斯大奔提车交车仪式感视频拍照AE模板修改文字软件一键生成
    生日视频制作教程奔驰梅赛德斯大奔提车交车仪式感视频拍照AE模板修改文字特效广告生成神器素材祝福玩法AE模板工程AE模板套用改图文教程↓↓:怎么如何做的【生日视频制作】奔驰梅赛德斯大奔提车交车仪式感视频拍照AE模板修改文字软件一键生成器教程特效素材【AE模板】......
  • 【生日视频制作】劳斯莱斯提车交车仪式感视频拍照AE模板修改文字软件一键生成器教程特
    生日视频制作教程劳斯莱斯提车交车仪式感视频拍照AE模板修改文字特效广告生成神器素材祝福玩法AE模板工程怎么如何做的【生日视频制作】劳斯莱斯提车交车仪式感视频拍照AE模板修改文字软件一键生成器教程特效素材【AE模板】生日视频制作步骤:下载AE模板安装AE软件......
  • 腾讯公众号都有哪些类型?
    腾讯公众号主要分为四种类型:订阅号、服务号、小程序和企业微信(原企业号)。为了更深入理解腾讯公众号的各个类型及其具体应用,下面从几个方面进行探讨:腾讯公众号都有哪些类型?订阅号主要用途:主要用于传达资讯和信息传播,适合媒体和个人使用。群发限制:每天只能群发一条消息,这些消......
  • 曾经的王者-腾讯公众号为什么不火了呢?
    微信公众号,曾经是图文内容创作者的天堂,如今却似乎风光不再。随着短视频和直播等新型媒体形式的崛起,公众号的打开率连年下滑,粉丝负增长甚至成为一些账号的常态。为何曾一度被誉为“图文类博主巅峰”的公众号会陷入如此境地?具体分析如下:外部竞争加剧短视频的冲击:短视频平台如抖......
  • 腾讯云2024年数字生态大会开发者嘉年华(数据库动手实验)来康康TDSQL-C的黑科技
    9月5日,以“智启新机云驱增长”为主题的盛会将于深圳国际会展中心盛大启幕。1.参会有感在此次大会中,我收获颇丰,也有诸多体验。在当下这个几乎人人都要提及AI的时代,腾讯云并未只是夸夸其谈,而是将想法落实到了行动上。同时,腾讯云在云计算领域的发展也十分领先。在会场,我体......
  • 文心智能体平台、Coze、腾讯元器、ModelScopeGPT和星火大模型的比较,你选哪个?
    平台文心智能体平台(百度)Coze(字节跳动)腾讯元器(腾讯)ModelScopeGPT(阿里云)星火大模型(科大讯飞)背景与开发方百度,中国领先的搜索引擎和AI公司字节跳动,全球知名的互联网科技公司腾讯,中国领先的互联网综合服务提供商阿里云,阿里巴巴集团旗下的云计算服务提供商科大讯飞,中国领先......
  • 腾讯云升级多个云存储解决方案 以智能化存储助力企业增长
    9月6日,在腾讯数字生态大会腾讯云储存专场上,腾讯云升级多个存储解决方案:DataPlatform数据平台解决方案重磅发布,数据加速器GooseFS、数据处理平台数据万象、日志服务CLS、高性能并行文件存储CFSTurbo等多产品全新升级,能够为企业在AI时代提供更安全、高效的数据基础服务。......
  • 【生日视频制作】直升机飞机侧身AE模板修改文字软件生成器教程特效素材【AE模板】
    生日视频制作教程直升机飞机侧身AE模板修改文字特效广告生成神器素材祝福玩法AE模板工程AE模板套用改图文教程↓↓:怎么如何做的【生日视频制作】直升机飞机侧身AE模板修改文字软件生成器教程特效素材【AE模板】生日视频制作步骤:下载AE模板安装AE软件把AE模板导入......