新火种AI | Stable Video Diffusion来了！普通人拍大片指日可待

时间：2023-11-25 22:33:21浏览次数：37

作者：小岩

随着技术的不断进步，AI领域取得了巨大的突破。特别是在图片生成这个赛道，AI目前能做到的成绩超乎想象。或许就在1年以前，很多人，特别是一些专业从业者对AI绘画的印象还停留在“元素要靠东拼西凑”“废图率太高”“成品无法直接使用”等方面，但如今，高质量AI绘图软件的表现完全可以颠覆你的固有认知。

而Stable Diffusion便是其中的典型代表。用Stable Diffusion完成的AI绘图，不仅能够精准地呈现人体姿态和画面层次感，还拥有复杂的三维结构，更支持用户对图片细节进行调整。

新火种AI | Stable Video Diffusion来了！普通人拍大片指日可待_ide

如今，Stable Diffusion的官方Stability AI走得更远了。不仅在AI绘画领域表现优秀，还推出了Stable Video Diffusion，这款技术不仅具有强大的3D合成功能，更可以为视频制作带来巨大的变革。也就是说，它的出现大大降低了视频拍摄的门槛，让普通人也可以轻松拍大片。

什么是Stable Video Diffusion？

Stable Video Diffusion是一种先进的视频合成技术，它能够将真实场景与虚拟物体完美地融合在一起，呈现出非常逼真的效果。这种技术可以应用于电影制作，游戏开发，广告创意等多个领域，从而为视频制作带来更多的可能性和创造性。

与传统的视频合成技术相比，Stable Video Diffusion最大的优势显然是物美价廉。先说“物美”，因为AI软件本身采用了深度学习的方法，对大量数据进行训练，使得合成的视频更加真实，自然。同时，这一AI技术还可以实现对细节的完美还原，例如物体的纹理、光线和阴影等等，可以说是十分逼真。再来说“价廉”，以前需要耗费大量人力物力来完成的视频制作工作，如今可能只需要通过Stable Video Diffusion就可以了，这就大大降低了成本。

Stable Video Diffusion的另一个重要特点是能够实现3D合成。通过这项技术，制作人员可以创建出各种神奇的场景和效果，例如将现实中的物体搬到虚拟场景中，或者将多个虚拟物体组合在一起。这为电影制作带来了更多的创意空间和可能性。

除了电影制作和游戏开发外，Stable Video Diffusion还很有可能在广告创意领域发挥重要的作用。广告商可以利用这项技术创造出各种独特的场景和效果，吸引消费者的注意力。

3D合成引发关注，网友纷纷表示：进步太快！

根据Stable Video Diffusion官方网站Stability AI显示的信息，全新SVD（简称）支持文本到视频，图像到视频的生成；支持物体从单一视角到多视角的转化，也就是大家所期待的3D合成。

尽管Stable Video Diffusion目前只是发布了基础模型，但已经受到了外界的广泛关注和好评，网友们普遍表示“进步太快”。官方透露，“正计划继续扩展，建立类似于Stable Diffusion的生态系统”。不过，对于官方发布的Demo，很多网友并不觉得有多惊艳，甚至认为其中存在缺陷，诸如光影不对；帧与帧之间有闪烁等等。

以下就是官方所发布的Demo，大家自行感受一下。

新火种AI | Stable Video Diffusion来了！普通人拍大片指日可待_3D_02

新火种AI | Stable Video Diffusion来了！普通人拍大片指日可待_3D_03

新火种AI | Stable Video Diffusion来了！普通人拍大片指日可待_AI生成_04

目前，Stable Video Diffusion的论文代码权重已经上线。根据介绍，SVD基于Stable Diffusion 2.1，使用了约6亿个样本的视频数据集预训练了基础模型。它可以轻松适应各种下游任务，包括通过对多视图数据集进行微调从单个图像进行多视图合成。

需要说明的是，Stability AI官方明确表示，Stable Video Diffusion仅限于研究，不适用于实际或商业应用。所以，它还不具备被大规模应用的条件。不过，官方已经开放了用户候补名单注册，这意味着我们普通小白也可以使用上这项技术，过一过“一键拍大片”的瘾。

视频生成迎来大爆发，谁会成为最后的赢家？

最近一段时间，视频生成领域呈现出一种“混战”的局面，各种优秀产品冒头，大有百家争鸣的势头。

前有PikaLabs开发的文生视频AI。

新火种AI | Stable Video Diffusion来了！普通人拍大片指日可待_AI生成_05

之后Moonvalley推出了自己的作品，它素有“史上最强大的视频生成AI”。

新火种AI | Stable Video Diffusion来了！普通人拍大片指日可待_ide_06

最近Gen-2的推出了“运动笔刷”功能，轻松实现“指哪画哪”。

新火种AI | Stable Video Diffusion来了！普通人拍大片指日可待_ide_07

再加上如今惊艳亮相的Stable Video Diffusion，我们可以预见，AI视频生成领域竞争十分领域，大家卷的如火如荼，很难说谁会成为最后的赢家。

视频生成领域隶属于生成式AI技术的范畴。随着AI技术的不断发展，生成式AI行业正在逐渐崛起。目前，该行业处于高速发展的阶段，市场规模不断扩大，预计未来依旧会继续保持快速增长的速度。根据市场研究机构的数据显示，预计到2029年，行业的市场规模将达到100亿美元。

这会是一块肉眼可见的，极其美味的大蛋糕。

标签：Diffusion,视频,AI,合成,Video,Stable
From： https://blog.51cto.com/u_13213861/8562524

近期 OpenAI 惊现 ChatGPT 3.5 用户可以越权使用 ChatGPT 4 的漏洞
ChatGPT4.0每个月20美元的订阅费用，让不少想尝试的朋友们有点犹豫不决。昨晚(2023年11月16日)睡觉之前我刷到这样一条新闻，ChatGPT3.5的用户，可以通过url里拼接参数的方式，直接使用ChatGPTGizmo模型。看具体的效果吧。下面部分截图，来自掘金社区这篇帖子。ChatGPT3.5......
中伟视界：AI盒子智能分析算法解决油气管道长无人场景下的人车监测问题
在油气管道长又无人的场景下，人和车的监测问题一直是一个难题。传统的监测手段往往存在盲区和误报问题，给管道运行安全带来了一定的隐患。然而，随着人工智能技术的不断发展，利用AI盒子的智能分析算法可以有效解决这一问题。AI盒子可以通过视频监控系统实时检测管道周边的人......
中伟视界：AI算法模型自训练平台技术难点及解决方法
搭建AI算法模型自训练平台是当今人工智能领域的热门话题，但是其中存在着许多技术难点需要克服。自训练平台需要具备高效的算法模型，这就要求能够处理庞大的数据量并进行高速计算。平台需要具备强大的数据管理及存储能力，以满足训练过程中的数据需求。再者，平台还需要考虑如何进行模型的......
.net 6 async await 取消Task任务
引言在用await执行方法时，方法有时候会执行特别长时间，在执行过程中想中断方法，需要使用到CancellationToken类。控制台程序中取消Task任务一、创建一个执行需要很长时间的方法staticasyncTaskDownloadAsync(stringurl,intn, CancellationTokencancellationToken){......
AI创作工具：Claude2注册保姆级教程
最近软件打算多接入几个AI写作平台，包括讯飞星火，百度文心，Claude2，这样就能给用户提供更多的写作选择经过半天的调研，讯飞星火，百度文心一言，接入都比较简单，毕竟是国内的。在调研Claude2的时候，发现自己之前注册的账号被封了。于是打算重新注册一个账号，结果犯了难。下面开始正式教程......
pip install报错"Can't connect to HTTPS URL because the SSL module is not availab
一、故障现象[root@jenkins/data/package/openssl-1.1.1n]#pip3installemojiWARNING:pipisconfiguredwithlocationsthatrequireTLS/SSL,howeverthesslmoduleinPythonisnotavailable.WARNING:Retrying(Retry(total=4,connect=None,read=None,redirect......
Docker启动失败,提示"iptables: No chain/target/match by that name"
一、问题现象docker容器报错:docker:Errorresponsefromdaemon:driverfailedprogrammingexternalconnectivityonendpointetlmysql(12ccdbcef942bef6f32dbfc157dd1b49319ee2df4d68bf7b9a9b9ea88b5bd4fa):(iptablesfailed:iptables--wait-tnat-ADOCKER-ptc......
什么是 Web 应用性能参数中的 First Contentful Paint
"FirstContentfulPaint"（简称FCP）是一个非常重要的性能指标，用于测量我们的网页在用户的设备上渲染出第一片有意义内容的时间点。这个指标是Web性能用户体验的关键部分，因为它直接关系到用户对网站加载速度的第一印象。在互联网世界中，每一毫秒的延迟都可能影响用户的满意度，甚至影......
浏览器关于 Largest Contentful Paint (LCP) 的计算机制
LargestContentfulPaint(LCP)是一种用户体验的性能指标，旨在帮助开发者了解用户在浏览网页时视觉渲染的速度。LCP主要衡量的是视觉上最大的页面元素何时出现在屏幕上，这包括图像元素、视频元素或者包含文本的元素（如段落或列表项）。如果LCP时间较长，用户可能会感觉到页面加载速......
超实用:通过文字就可以操纵这款AI表格
公众号「架构成长指南」，专注于生产实践、云原生、分布式系统、大数据技术分享。工具介绍今天给大家分享超实用的AI表格ChatExcel，这个工具是由北大团队在2022年3月开始开发的AI表格处理神器，上传你的表格后，只需要用文字描述你的需求，不需要你懂excel函数，AI就会自动帮你搞定。Cha......

新火种AI | Stable Video Diffusion来了！普通人拍大片指日可待

相关文章

赞助商

阅读排行