首页 > 其他分享 >智影AI故事转视频创作神器!快速开启AI绘画小说推文之旅

智影AI故事转视频创作神器!快速开启AI绘画小说推文之旅

时间:2024-05-28 21:57:33浏览次数:14  
标签:视频 角色 AI 分镜 生成 智影 推文 图片

1.前言

1.1 生成内容形式

    生成内容形式主要包含三种,PGC(Professionally Generated Content)、UGC(User Generated Content)、AIGC(Artificially Intelligent Generated Content)。也可以简单理解为生成内容形式的三个发展阶段。

  • PGC 专业生成内容

    专业生成内容是由专业人士创作编辑发布内容。

    简单来说是文章要由作者创作,新闻要由记者创作,专业的人创作内容。

    该形式起源于传统媒体时代,例如报纸、杂志、电视、电影等。

  • UGC 用户生成内容

    用户生成内容是由普通用户创作编辑发布内容。

    简单来说就是每个人都可以创作内容,通过互联网发布文字、视频、音频等内容。

    是互联网趋势下的一种内容生成方式,对传统营销、广告、媒体等产业产生了重大影响。比如自媒体博主等。 优点是创作门槛低,内容更加个性化,缺点是信息泛滥,质量不一,监管难度大等。

  • AIGC 人工智能生成内容

    人工智能生成内容是AI创作生成内容。

    简单来说就是已经发展到我们看到的内容可能就是AI制作的。

    是人工智能发展阶段下的一种新型内容生成方式。利用自然语言处理技术与AI技术来生成内容。比如ChatGPT、PiKa、Sora、文心一言等。

    应用范围广泛,发展到今天,已经支持多模态AI,允许输入文本、图片、视频等多种媒体素材,经由AIGC处理输出生成想要的文本、图片、视频、音频等内容。

1.2 小说推文说明

    2021年起,市场开始探索小说推文,通过爆火小说,借助抖音、小红书、bilibili等平台发布小说推文视频,推流达到吸粉,引导付费的模式实现盈利,逐步发展趋于稳定盈利。

    2023年是小说推文的爆发期,加上火爆的ChatGPT、Midjounery、TTSMAKER、剪映等平台支撑,形成了一套完善的生成式AI链路。极大的降低了小说推文制作门槛,且据统计当时随便制作一个推文视频,播放量基本上在20W左右。

    2024年Sora发布的文生视频大模型,给国内外带来了极大震撼,时长接近1分钟,视频画质接近电影级。让人感叹AI已经发展到,快要不易区分人工制作内容和AI制作内容。同时也让国内感受到和国外在人工智能领域的差距。

2.产品介绍

    本期说下国内小说推文工具,不是那种素材混剪的工具,而是借助多模态生成式AI,具备文生图、图生视频、文生视频能力的工具。

    比如腾讯动态漫画、AI剧本、瓦兔推文、极虎漫剪、推文助手、智影AI等工具。

    这些工具大都支持文生图能力,但支持图生视频能力仅腾讯动态漫画、智影AI。动态漫画生成分镜图片后,有个一键动效功能,允许将图片生成2s时长的视频。智影AI有一个动态视频功能,允许将图片生成4s的视频。

2.1 产品说明

    智影AI官方地址,点击体验

    一款小白也能轻松制作故事转视频的AI创作神器。

2.2 功能说明

  • 拆分文案

    产品能够对故事文案进行拆分镜头,提取故事中的角色和场景;并自动绑定角色/场景和分镜镜头,达到角色场景一致性。

    借助ChatGPT分析文案拆分分镜,提取角色场景。

  • 角色/场景创建

    角色/场景支持新建编辑;支持调整角色描述重新生成角色图片。

  • 分镜管理

    支持对分镜批量绑定关联角色/场景;镜头支持新建编辑;支持修改分镜描述重新生成分镜图片;支持分镜图片生成4s的动态视频。

    借助Fooocus(已支持)、Midjounery(规划中)文生图能力,根据文本描述AI绘图。

    借助Stable Diffusion Video(已支持)、PiKa(规划中)图生视频能力,根据分镜图片AI生成视频。

  • 合成视频

    允许选择背景音乐,解说音色,解说语速等;允许对字幕、标题调整字号、粗体、下划线等、支持配置花字效果。

    借助剪映、阿里云视频合成,拼接音频、字幕、视频、图片制作视频

3.推文视频制作

3.1 新建小说

    填写小说名称、选择画面风格、小说类型,点击确定新建小说。

    一组镜头可以合成一个视频。这一组镜头构成一个作品。多个作品构成一个小说。

3.2 新建作品

    填写作品名称、选择分辨率、选择是否开启动态视频,默认不开启,点击确定新建作品。

3.3 拆分文案

    粘贴复制过来故事文案,此处是通过文心一言生成的300字左右的故事文案。点击拆分文案拆分分镜,自动提取角色场景,并自动绑定角色场景到分镜。

3.4 角色/场景创建

    智影AI会自动提取角色场景,如果AI提取存在漏提或误提的情况,可以手工维护角色/场景,新建或重新生成角色图片。

    确认角色场景后,可以点击下一步,提示是否跳过一键生图。不跳过则自动生成分镜图片。跳过则不自动生成分镜图片,手工生成。此处点击确定,使用一键生图功能,希望自动生图。

3.5 分镜管理

    上一步不跳过一键生图,会自动对分镜提交生成图片任务。

    如果上一步跳过一键生图,也可以进入到分镜管理步骤后,维护好分镜信息,再点击一键生图按钮即可。或者手工对单个镜头右侧编辑区域,点击重新生成图片按钮重新生图。

    待图片任务全部生成完成,可以点击合成视频进入下一步。

3.6 合成视频

    合成视频可以选择背景音乐、解说音色、字幕标题等配置,点击合成视频等待视频合成。

    在小说作品列表可以查看作品合成视频效果。

4.高阶功能说明

4.1 角色/场景一致性

    角色一致性,对于以上示例,因为用的形象是蝙蝠侠,AI对蝙蝠侠其实是有很多知识存储的,所以在角色一致性上表现良好。

    对于AI不知道的角色,通过AI工具实现角色一致性就比较困难了。同样的文案描述,在多次生成结果上无法保证角色形象一致,场景一致。

    此处提供角色场景绑定功能,来间接实现角色场景一致性。

    在分镜管理下,允许对单个镜头进行角色场景绑定。也提供了批量操作,对于分镜较多的作品,避免重复操作提升效率。

4.2 重新生图

  • 重新生图

    对于一键生图效果不好的情况下,或者重新调整关联角色场景后的分镜,可以修改分镜描述重新生图。

  • 生成相似图

    生成相似图,利用以图生图能力,生成相近效果的图片,可以用作微调。

  • 上传分镜图片

    开放了上传分镜图片的功能,更加的灵活,允许设计师上传自己做的图片,如果认为AI绘图效果不好,或者根据AI绘图本地调优后,可以上传覆盖。

  • 替换当前图片

    历史图片可以看到生成过的图片,多次生图可以选择效果较好的一张,替换当前图片作为分镜图片。

  • 放大1.5倍、放大2倍

    支持放大1.5、放大2倍,使得图片分辨率清晰度更高。可以在选定分镜图片后,放大图片质量用于合成视频,保证视频质量。

4.3 合成视频

  • 转场、特效、音色

    支持对分镜配置转场特效,也可以配置全局默认转场特效。单分镜支持配置多情感音色,间接实现了多角色多音色功能。

  • 上传背景音乐

    系统提供的背景音乐无法满足所有用户的真实需求,允许上传个性化的背景音乐。

  • 字幕标题花字效果

    字幕标题支持花字、字号、粗体、斜体等配置。标题非必填。

4.4 动态视频

    启用动态视频,支持将分镜图片转换为视频内容。

    对于开启动态视频能力的作品,在分镜图片调整完成后,点击一键生成视频,可以对分镜图片生成4s的视频。

    允许调试图生视频参数,与图片的一致性、运动强度、种子等参数,重新生成视频。

    开启动态视频能力的作品,在合成视频时,将采用分镜视频素材代替分镜图片素材来合成视频,合成推文视频效果更佳。传统的图片就是PPT播放效果,动态视频就是真正意义上的视频了。

扩展:Sora、PiKa、Runway、SVD等AI视频能力,也是未来AI电影、AI广告、AI新闻等产业的发展方向。
Sora官网:openai.com/sora
PiKa官网:pika.art
Runway官网:runwayml.com
Stable Video官网:stablevideo.com
Fooocus官网:fooocus.cc
MidJounery官网:midjourney.com

标签:视频,角色,AI,分镜,生成,智影,推文,图片
From: https://www.cnblogs.com/niaonao/p/18218999

相关文章

  • 飞凌OKMX8MP-C开发板AI项目分享-搭建YOLO环境
    本文基于在飞凌OKMX8MP-C开发板已经移植好ubuntu进行,编译环境搭建和移植过程可参考前两片文章飞凌OKMX8MP-C开发板AI项目分享-开箱及WSL2编译环境搭建飞凌OKMX8MP-C开发板AI项目分享-移植Ubuntu20.04文件系统体验需要在开发板上安装依赖包,需要保证开发板已经连接到网络,本实......
  • sleep() 和 wait() 有什么区别?
    sleep是线程类(Thread)的方法,导致此线程暂停执行指定时间,给执行机会给其他线程,但是监控状态依然保持,到时后会自动恢复。调用sleep不会释放对象锁。wait是Object类的方法,对此对象调用wait方法导致本线程放弃对象锁,进入等待此对象的等待锁定池,只有针对此对象发出notify方法(或noti......
  • 普通程序员深度学习教程(fastai及PyTorch)1深度学习快速入门-1简介
    1深度学习快速入门本章介绍深度学习背后的关键概念,并在不同的任务中训练我们的第一个模型。如果你不是技术或数学专业出身,也没有关系,我们从工程应用的角度入手,而不是数学科学。1.1深度学习没那么难多数深度学习不需要:高深的数据基础,实际高中数学已经够用大量数据:实际最低小......
  • 二次元ai绘画图片软件哪个好?试试这些图片创作利器
    画画一直是许多人的爱好。可对于没有学过的人来说,将想象中的画面呈现出来并不容易。长时间的绘画练习让很多人望而却步,直到ai绘画功能的出现,让人们有了新的途径。即使是没有基础的人,也可以轻松地将自己的想象转化为美丽的画作,这激发了更多人对于绘画的热情。想知道这种ai绘画......
  • 揭秘丨文字游侠AI工具:一键生成高质量爆文赚米,提升20倍写作效率,附上渠道和实操教程!
    在这个信息泛滥的时代,内容创作者们不断寻求更高效、更创新的方法,以便在众多竞争者中脱颖而出。虽然平台如今日头条为他们提供了展示才华和获取收益的舞台,但如何在激烈的竞争中站稳脚跟,仍是他们需要面对的挑战。然而,现在一款全新的AI工具正在引领一场革命,为创作者们带来了前所......
  • ALL IN AI | 第六届金蝶云·苍穹追光者开发大赛正式启动报名!
    2024年5月,第六届金蝶云·苍穹追光者开发大赛x第十三届“中国软件杯”金蝶赛道正式启动报名!当下,人工智能正以其空前的速度、广度和深度,引领着新一轮科技革命和产业变革,重塑着经济社会的发展模式,为各行各业注入新动能。2024年政府工作报告中提到,深化大数据、人工智能等研发应用,开......
  • OpenAI用26分钟改变世界!免费版GPT-4震撼登场,视频语音交互迈向科幻片级别
    一场长达26分钟的发布会,再次掀起了AI行业的风浪,将深刻改变我们未来的生活,也将让无数AI初创公司感到焦虑不安。这并非标题党,因为这次发布会由OpenAI主办。就在刚刚,OpenAI正式发布了GPT-4o。这个“o”代表“omni”,即全面、全能的意思。这一模型不仅拥有文本处理能力,还能处理图......
  • 踩坑记录: nohup: failed to run command ‘java‘: No such file or directory
    执行一个shell脚本直接在终端可以执行但是在云效流水线上就会出现这个问题 先查看一下java-version 已经安装好了的话还是出现这个问题解决方案1:在执行Java包的前面加上这个 source/etc/profile还是不可以的话 解决方案2:先查看自己的jdk安装路径 which......
  • 在 GPT-4o 释放完整能力前,听听实时多模态 AI 创业者的一手经验 | 编码人声
      「编码人声」是由「RTE开发者社区」策划的一档播客节目,关注行业发展变革、开发者职涯发展、技术突破以及创业创新,由开发者来分享开发者眼中的工作与生活。 5月中旬GPT-4o的发布,让人与AI的交互,从对话框的文本交流加速推进到了音视频多模态的实时互动。 本期节目,......
  • pnpm安装依赖出现ELIFECYCLE  Command failed with exit code 1 Build failed
    这种情况一般是安装了nvm的情况下会出现,错误提示一般如下Progress:resolved1713,reused1633,downloaded0,added1632,donenode_modules/.pnpm/[email protected]/node_modules/core-js:Runningpostinstallscript,donein118msnode_modules/.pnpm/[email protected]/nod......