首页 > 其他分享 >​中国版Sora:Vidu发布“主体参照”功能,支持让任意主体保持一致

​中国版Sora:Vidu发布“主体参照”功能,支持让任意主体保持一致

时间:2024-09-13 15:24:28浏览次数:3  
标签:主体 视频 功能 AI 生成 Sora Vidu

OpenAI发布Sora模型后,掀起了AI视频生成热潮,一段60秒的视频不仅让ai领域的从业者兴奋不已,也让全世界的资本聚集在了这个领域上。


国内玩家在这个赛道也是卷了又卷。字节跳动的即梦AI,快手的可灵AI,智谱AI的CogVideoX一一走上了牌桌。9月11日,由生数科技和清华大学联合研发的国产自研原创视频大模型Vidu也迎来升级更新,上线了“主体参照”(Subject Consistency)功能,在其官网中名为“参考生视频”。

​中国版Sora:Vidu发布“主体参照”功能,支持让任意主体保持一致_人工智能


据生数科技的相关负责人说,该功能能够实现对任意主体的一致性生成,目的是让视频生成更加稳定、可控。


“主体参照”的主要功能包括:


单一主体一致性:确保单一角色或物体在生成的图像中保持一致;

角色控制:支持真人、动物等各种类型角色的一致性;

同时支持不同的艺术风格(如写实、2D、3D等)的控制;

身体控制:该功能还提供角色面容、半身和全身图像的一致性控制;

支持商业广告场景的应用。


Bulu测试了用真人、动画人物、二次元人物都测试了一下这个功能,展示下部分的生成视频:

​中国版Sora:Vidu发布“主体参照”功能,支持让任意主体保持一致_vidu_02

​中国版Sora:Vidu发布“主体参照”功能,支持让任意主体保持一致_vidu_03

用上图“关羽”作为主体,提示词:关羽在成都春熙路跳舞。生成的视频以下⬇️

​中国版Sora:Vidu发布“主体参照”功能,支持让任意主体保持一致_人工智能_04

​中国版Sora:Vidu发布“主体参照”功能,支持让任意主体保持一致_AI视频生成_05

​中国版Sora:Vidu发布“主体参照”功能,支持让任意主体保持一致_人工智能_06

用上图“林黛玉”作主体,提示词:林黛玉穿职业装,在咖啡馆喝咖啡。生成的视频以下⬇️

​中国版Sora:Vidu发布“主体参照”功能,支持让任意主体保持一致_OpenAI_07


用二次元人物作为主体,提示词:樱花树下,银发紫眸的二次元帅哥突然出现,对我轻轻弹唱。生成的视频以下⬇️

​中国版Sora:Vidu发布“主体参照”功能,支持让任意主体保持一致_人工智能_08

整体使用感受还不错:


生成速度比较快,生成4秒视频时间不超过30秒;


摒弃了传统的分镜头画面生成步骤,通过“上传主体图片+输入场景描述词”的方式,直接生成视频素材;


对提示词理解能力还不错,生成结果比较精准;


另外,对动漫风格优化的会好一些,能保持风格的一致性,写实的效果相对差一点。


话说回来,目前市场上大部分视频模型在生成视频时不稳定。比如:有时候主体、场景或者风格不能保持一致,特别是在需要进行复杂互动的时候这个问题更突出。另外,这些模型生成的结果往往带有很大的随机性,这意味着用户可能需要多次尝试才能得到满意的结果,并且对于像镜头运动、光影效果这样的细节,还不能做到精确控制。


不得不说,Vidu针对上述提到的这个痛点上做了优化。在“主体参照”功能下,用户只需上传一张任意主体的图片,就可以锁定该主体的形象,并通过输入不同的描述词来变换场景,从而生成主体形象一致的视频。


据官方说,此功能不仅限于单一人物,还可以应用于动物、商品、动漫角色以及虚构对象等各种不同的主体。感兴趣的朋友,可以去尝试下。


使用步骤


1

登陆Vidu官网:https://www.vidu.studio

​中国版Sora:Vidu发布“主体参照”功能,支持让任意主体保持一致_OpenAI_09


2

用邮箱或手机号注册

​中国版Sora:Vidu发布“主体参照”功能,支持让任意主体保持一致_AI视频生成_10

新用户注册有80个积分,生成1个视频消耗4积分,也就是可以免费生成20个4秒的视频邮箱


3

点击“创作视频”,进入创作页面

​中国版Sora:Vidu发布“主体参照”功能,支持让任意主体保持一致_人工智能_11


如上图所示,Vidu目前有三个功能:图生视频、参考生视频、文生视频。


操作界面比较简单,输入提示词点击创作,等待一会,就可以得到生成的视频。

标签:主体,视频,功能,AI,生成,Sora,Vidu
From: https://blog.51cto.com/u_16915900/12001468

相关文章

  • 市场主体登记
    市场主体登记服务4.0  tomcat部署与安装[root@VM-4-9-centos~]#mkdir/data/soft/[root@VM-4-9-centos~]#tar-zxvfapache-tomcat-9.0.68.tar.gz[root@top164ftpdir]#tar-zxvfapache-tomcat-9.0.68.tar.gz[root@top164soft]#cp-acp-aapache-tomcat-9.......
  • “食神”主体破产,商标拍卖近123万成交!
    近期珠海一家公司破产,名下三个商标被拍得近123万成交,普推知产老杨发现都是43类的餐饮商标,两个“食神”的汉字,一个是图形加食神的拼音。    许多公司破产后最有价值的东西可能就是商标,企业申请注册一个好的商标,在企业运营时可以用,不运营时可以把闲置的商标转让掉,有时......
  • Sora原理详解
    重磅推荐专栏:《大模型AIGC》《课程大纲》《知识星球》本专栏致力于探索和讨论当今最前沿的技术趋势和应用领域,包括但不限于ChatGPT和StableDiffusion等。我们将深入研究大型模型的开发和应用,以及与之相关的人工智能生成内容(AIGC)技术。通过深入的技术解析和实践经验......
  • 自我主体意识构建与形成
    人是如何构建出自我主体意识,形成“自我”的?依慧心理根据柏拉图的哲学理论,他将这个世界分为里三个部分:理念世界、现实世界、模仿世界。简单的来理解,就是当我们提到猫的时候,我们脑子中首先是有一个猫的概念,它是有毛、有爪子、会卖萌的大眼睛、拉屎还很臭,一个完美的理念方式......
  • 【SCI复现】基于纳什博弈和ADMM的多微网主体能源共享研究(Matlab代码实现)
    ......
  • Stable Diffusion 3震撼发布,采用Sora同源技术,文字终于不乱码了
    StableDiffusion3和Sora一样采用了diffusiontransformer架构。继OpenAI的Sora连续一周霸屏后,昨晚,生成式AI顶级技术公司StabilityAI也放了一个大招——StableDiffusion3。该公司表示,这是他们最强大的文生图模型。与之前的版本相比,StableDiffusion......
  • 主体与特殊主体-法硕5轮背诵觉晓
    刑法学法硕联考笔记:精神病人刑事责任的专业解读在刑法学法硕联考的广阔领域里,精神病人的刑事责任是一个既复杂又充满人文关怀的话题。今天,我们就来深入探讨一下这一专业领域,看看我国刑法是如何对精神病人的刑事责任进行界定的。......
  • Midjourney、Sora和硅谷机密-《分析模式》漫谈15
    DDD领域驱动设计批评文集做强化自测题获得“软件方法建模师”称号《软件方法》各章合集“AnalysisPatterns”的Preface(前言)有这么一句:KentBeck,WardCunningham,andJimCopleinencouragedmetogetinvolvedwiththecommunityandto developmyideasaspatte......
  • 最新观念---建设工程未经验收实际使用的,免除承包人除主体和基础外的保修责任
    该观念均为2022、2023年最高院权威出版书籍、判例中的观念,与2020年新司法解释理解与适用统一因该要旨有别于前期司法实践,现将判例及评析予以记录,以便于学习1. (2016)最高法民申2097号  例案一:嫩江县宝宏置业发展有限公司、黑河正亿房地产开发有限公司与中冶建设高新工程技术有......
  • Android开发 - (适配器)Adapter类中CursorAdapter实现类详细解析
    作用将Cursor对象中的数据与AdapterView组件(如ListView、GridView等)进行绑定。以下是CursorAdapter的主要作用:1.数据源绑定数据源连接:CursorAdapter通过Cursor对象作为数据源,实现了从数据库或其他数据源(如ContentResolver查询结果)中读取数据的功能。这使得开发者能够轻松地......