中国版Sora：Vidu发布“主体参照”功能，支持让任意主体保持一致

时间：2024-09-13 15:24:28浏览次数：15

标签：主体视频功能 AI 生成 Sora Vidu

OpenAI发布Sora模型后，掀起了AI视频生成热潮，一段60秒的视频不仅让ai领域的从业者兴奋不已，也让全世界的资本聚集在了这个领域上。

国内玩家在这个赛道也是卷了又卷。字节跳动的即梦AI，快手的可灵AI，智谱AI的CogVideoX一一走上了牌桌。9月11日，由生数科技和清华大学联合研发的国产自研原创视频大模型Vidu也迎来升级更新，上线了“主体参照”（Subject Consistency）功能，在其官网中名为“参考生视频”。

中国版Sora：Vidu发布“主体参照”功能，支持让任意主体保持一致_人工智能

据生数科技的相关负责人说，该功能能够实现对任意主体的一致性生成，目的是让视频生成更加稳定、可控。

“主体参照”的主要功能包括：

单一主体一致性：确保单一角色或物体在生成的图像中保持一致；

角色控制：支持真人、动物等各种类型角色的一致性；

同时支持不同的艺术风格（如写实、2D、3D等）的控制；

身体控制：该功能还提供角色面容、半身和全身图像的一致性控制；

支持商业广告场景的应用。

Bulu测试了用真人、动画人物、二次元人物都测试了一下这个功能，展示下部分的生成视频：

中国版Sora：Vidu发布“主体参照”功能，支持让任意主体保持一致_vidu_02

中国版Sora：Vidu发布“主体参照”功能，支持让任意主体保持一致_vidu_03

用上图“关羽”作为主体，提示词：关羽在成都春熙路跳舞。生成的视频以下⬇️

中国版Sora：Vidu发布“主体参照”功能，支持让任意主体保持一致_人工智能_04

中国版Sora：Vidu发布“主体参照”功能，支持让任意主体保持一致_AI视频生成_05

中国版Sora：Vidu发布“主体参照”功能，支持让任意主体保持一致_人工智能_06

用上图“林黛玉”作主体，提示词：林黛玉穿职业装，在咖啡馆喝咖啡。生成的视频以下⬇️

中国版Sora：Vidu发布“主体参照”功能，支持让任意主体保持一致_OpenAI_07

用二次元人物作为主体，提示词：樱花树下，银发紫眸的二次元帅哥突然出现，对我轻轻弹唱。生成的视频以下⬇️

中国版Sora：Vidu发布“主体参照”功能，支持让任意主体保持一致_人工智能_08

整体使用感受还不错：

生成速度比较快，生成4秒视频时间不超过30秒；

摒弃了传统的分镜头画面生成步骤，通过“上传主体图片+输入场景描述词”的方式，直接生成视频素材；

对提示词理解能力还不错，生成结果比较精准；

另外，对动漫风格优化的会好一些，能保持风格的一致性，写实的效果相对差一点。

话说回来，目前市场上大部分视频模型在生成视频时不稳定。比如：有时候主体、场景或者风格不能保持一致，特别是在需要进行复杂互动的时候这个问题更突出。另外，这些模型生成的结果往往带有很大的随机性，这意味着用户可能需要多次尝试才能得到满意的结果，并且对于像镜头运动、光影效果这样的细节，还不能做到精确控制。

不得不说，Vidu针对上述提到的这个痛点上做了优化。在“主体参照”功能下，用户只需上传一张任意主体的图片，就可以锁定该主体的形象，并通过输入不同的描述词来变换场景，从而生成主体形象一致的视频。

据官方说，此功能不仅限于单一人物，还可以应用于动物、商品、动漫角色以及虚构对象等各种不同的主体。感兴趣的朋友，可以去尝试下。

使用步骤

登陆Vidu官网：https://www.vidu.studio

中国版Sora：Vidu发布“主体参照”功能，支持让任意主体保持一致_OpenAI_09

用邮箱或手机号注册

中国版Sora：Vidu发布“主体参照”功能，支持让任意主体保持一致_AI视频生成_10

新用户注册有80个积分，生成1个视频消耗4积分，也就是可以免费生成20个4秒的视频邮箱

点击“创作视频”，进入创作页面

中国版Sora：Vidu发布“主体参照”功能，支持让任意主体保持一致_人工智能_11

如上图所示，Vidu目前有三个功能：图生视频、参考生视频、文生视频。

操作界面比较简单，输入提示词点击创作，等待一会，就可以得到生成的视频。

标签：主体,视频,功能,AI,生成,Sora,Vidu
From： https://blog.51cto.com/u_16915900/12001468

市场主体登记
市场主体登记服务4.0 tomcat部署与安装[root@VM-4-9-centos~]#mkdir/data/soft/[root@VM-4-9-centos~]#tar-zxvfapache-tomcat-9.0.68.tar.gz[root@top164ftpdir]#tar-zxvfapache-tomcat-9.0.68.tar.gz[root@top164soft]#cp-acp-aapache-tomcat-9.......
“食神”主体破产，商标拍卖近123万成交！
近期珠海一家公司破产，名下三个商标被拍得近123万成交，普推知产老杨发现都是43类的餐饮商标，两个“食神”的汉字，一个是图形加食神的拼音。许多公司破产后最有价值的东西可能就是商标，企业申请注册一个好的商标，在企业运营时可以用，不运营时可以把闲置的商标转让掉，有时......
Sora原理详解
重磅推荐专栏：《大模型AIGC》《课程大纲》《知识星球》本专栏致力于探索和讨论当今最前沿的技术趋势和应用领域，包括但不限于ChatGPT和StableDiffusion等。我们将深入研究大型模型的开发和应用，以及与之相关的人工智能生成内容（AIGC）技术。通过深入的技术解析和实践经验......
自我主体意识构建与形成
人是如何构建出自我主体意识，形成“自我”的？依慧心理根据柏拉图的哲学理论，他将这个世界分为里三个部分：理念世界、现实世界、模仿世界。简单的来理解，就是当我们提到猫的时候，我们脑子中首先是有一个猫的概念，它是有毛、有爪子、会卖萌的大眼睛、拉屎还很臭，一个完美的理念方式......
【SCI复现】基于纳什博弈和ADMM的多微网主体能源共享研究（Matlab代码实现）
......
Stable Diffusion 3震撼发布，采用Sora同源技术，文字终于不乱码了
StableDiffusion3和Sora一样采用了diffusiontransformer架构。继OpenAI的Sora连续一周霸屏后，昨晚，生成式AI顶级技术公司StabilityAI也放了一个大招——StableDiffusion3。该公司表示，这是他们最强大的文生图模型。与之前的版本相比，StableDiffusion......
主体与特殊主体-法硕5轮背诵觉晓
刑法学法硕联考笔记：精神病人刑事责任的专业解读在刑法学法硕联考的广阔领域里，精神病人的刑事责任是一个既复杂又充满人文关怀的话题。今天，我们就来深入探讨一下这一专业领域，看看我国刑法是如何对精神病人的刑事责任进行界定的。......
Midjourney、Sora和硅谷机密-《分析模式》漫谈15
DDD领域驱动设计批评文集做强化自测题获得“软件方法建模师”称号《软件方法》各章合集“AnalysisPatterns”的Preface（前言）有这么一句：KentBeck,WardCunningham,andJimCopleinencouragedmetogetinvolvedwiththecommunityandto developmyideasaspatte......
最新观念---建设工程未经验收实际使用的，免除承包人除主体和基础外的保修责任
该观念均为2022、2023年最高院权威出版书籍、判例中的观念，与2020年新司法解释理解与适用统一因该要旨有别于前期司法实践，现将判例及评析予以记录，以便于学习1. （2016）最高法民申2097号例案一：嫩江县宝宏置业发展有限公司、黑河正亿房地产开发有限公司与中冶建设高新工程技术有......
Android开发 - (适配器)Adapter类中CursorAdapter实现类详细解析
作用将Cursor对象中的数据与AdapterView组件（如ListView、GridView等）进行绑定。以下是CursorAdapter的主要作用：1.数据源绑定数据源连接：CursorAdapter通过Cursor对象作为数据源，实现了从数据库或其他数据源（如ContentResolver查询结果）中读取数据的功能。这使得开发者能够轻松地......

中国版Sora：Vidu发布“主体参照”功能，支持让任意主体保持一致

相关文章

赞助商

阅读排行

​中国版Sora：Vidu发布“主体参照”功能，支持让任意主体保持一致

相关文章

赞助商

阅读排行

中国版Sora：Vidu发布“主体参照”功能，支持让任意主体保持一致