首页 > 其他分享 >MoneyPrinterPlus:AI自动短视频生成工具-阿里云配置详解

MoneyPrinterPlus:AI自动短视频生成工具-阿里云配置详解

时间:2024-06-20 17:23:04浏览次数:10  
标签:MoneyPrinterPlus 视频 AI 配置 生成 点击 详解 语音

MoneyPrinterPlus是一个很好的自动短视频生成工具,虽然是一个非常好的工具,但是有些小伙伴可能不太清楚具体应该如何配置才能让它跑起来。

因为MoneyPrinterPlus依赖一些具体的配置信息,所以还是很有必要给大家讲解清楚如何进行配置。

项目已开源,代码地址:https://github.com/ddean2009/MoneyPrinterPlus

阿里云的具体配置

MoneyPrinterPlus在生成视频过程中需要进行一些语音合成和语音识别工作。

为了保证最后生成视频的质量,所以我们会用到一些云厂商提供的语音合成和语音识别服务。

这里以阿里云为例,来讲解如何进行阿里云语音的配置。

获取阿里云的access key和Secret

首先我们到阿里云的官网上去注册一个账号,在右上角主账号的下方,会有一个accessKey管理。

image-20240616212456323

点击这个accesskey管理,会进入一个管理页面:

image-20240620164930498

点击创建accessKey就创建好了accesskey和Secret。

大家把这两个数据保存下来。我们后面在MoneyPrinterPlus中会用到这两个值。

开通智能语音服务

然后我们通过下面的链接进入到阿里云的智能语音服务页面:

https://nls-portal.console.aliyun.com/

如果没有开通的话,可以点击开通。

现在里面大部分的服务都是免费试用的。

当然,如果收费的话应该也不是很贵。

在全部项目中,点击创建项目:

image-20240620165258320

创建一个新的项目,记住这个项目的appkey。我们在后面的配置中需要用到这个值。

接下来点击左边的服务管理与开通,在语音识别tab中选择录音文件识别(极速版),右边操作---》升级为商用版。

因为录音文件识别(极速版)没有免费试用版本,所以这里一定要升级成商用版本。否则后面使用可能会报错。

image-20240620165407063

在语音合成tab页面,需要开通语音合成和长文本语音合成功能。

因为阿里云基础的语音合成服务只能合成小于300字的语音,如果大于300字,则需要用到长文本语音合成服务。

image-20240620165541480

上面三项一定需要开通。切记切记。

在MoneyPrinterPlus中配置

启动我们的项目,在web页面点击最左边的基础配置,找到右边的配置音频库信息,选择Ali。

填入我们之前保存的Access Key ID ,Access Key Secret和App Key。

回车后,这样我们的配置就保存了。

image-20240620165818526

其他的配置

资源库

资源库指的是我们从哪里获取视频或者图片信息,这里目前提供了两个资源提供方,分别是pexels和pixabay。

大家任意选择一个即可。

以pexels为例,我们登入pexels官网 https://www.pexels.com/zh-cn/ ,注册一个账号。

在图片和视频API里面,可以查看自己的api密钥。

image-20240616211609578

查看自己的API密钥:

image-20240616211719443

把这个API密钥记下来,拷贝到MoneyPrinterPlus的配置即可。

![image-20240620170029227](/Users/wayne/Library/Application Support/typora-user-images/image-20240620170029227.png)

大模型配置

目前支持Moonshot,openAI,Azure openAI,Baidu Qianfan, Baichuan,Tongyi Qwen, DeepSeek这些。

国内要用的话推荐Moonshot(最近发现moonshot不太稳定,大家可以考虑Baichuan或者DeepSeek)。

同样的到Moonshot开发者平台上注册一个key:https://platform.moonshot.cn/ 填入对应的配置即可。

image-20240616212642905

AI短视频生成

有了基础配置之后,就可以点击左边的AI视频进入AI视频生成页面。

  1. LLM视频文案生成

在视频主题区输入你需要生成的视频主题,然后点击生成视频文案。

程序会自动使用大模型生成对应的视频文案和视频文案关键字:

image-20240616220713534

如果你对视频文案或者关键字不满意,可以手动进行修改。

  1. 视频配音区

在视频配音区可以选择配音语言和对应的配音语言,目前支持100+配音语言。

还可以选择不同的配音语速,以支持不同使用场景。

image-20240616220840076

如果你对配音不太确定,可以点击试听声音试听对应的配音语音。

  1. 背景音乐

背景音乐放在项目下的bgmusic目录下面,你可以自行添加背景音乐文件到该文件夹下面。

image-20240616221041774

可以选择是否开启背景音乐,和默认的背景音乐音量。

  1. 视频配置区

视频配置区可以选择视频布局:竖屏,横屏或者方形。

可以选择视频帧率,视频的尺寸。

还可以选择每个视频片段的最小长度和最大长度。

最最重要的,还可以开启视频转场特效。目前支持30+视频转场特效。

image-20240616221116997

  1. 字幕配置

如果你需要字幕,那么可以点击开启字幕选项,可以设置字幕字体,字幕字体的大小和字幕颜色等。

如果你不知道怎么设置,选择默认即可。

image-20240616221242812

  1. 最后的视频生成

最后点击生成视频按钮即可生成视频。

页面会有相应的进度提醒。

image-20240616221712173

最后生成的视频会展示在页面最下面,大家可以自行播放。

点我查看更多精彩内容:www.flydean.com

标签:MoneyPrinterPlus,视频,AI,配置,生成,点击,详解,语音
From: https://www.cnblogs.com/flydean/p/18259059

相关文章

  • 聚焦AIoT最后一公里:EasyCVR+AI视频技术在各领域的创新应用
    随着5G、AI、边缘计算、物联网(IoT)、云计算等技术的快速发展,万物互联已经从概念逐渐转变为现实,全新的行业生态AIoT正在开启新时代。巨大的市场潜力与AI等新兴技术不断融合形成的庞大市场缺口,深度场景化应用落地诉求不断攀升。视频技术,作为信息传输和交互的重要手段,正逐渐展现出其在......
  • 智慧城市低空+AI视频智能监控:构建新时代安全防线
    随着科技的飞速发展,智能监控技术已经广泛应用于各个领域,从城市治理到工业生产,从公共安全到环境监测,都发挥着越来越重要的作用。而在低空领域,AI视频智能监控方案的建设更是成为了一个热点话题。一、低空AI视频智能监控方案的特点低空AI视频智能监控方案的核心在于结合无人机、摄......
  • TCP与UDP详解:层次、区别及应用场景
    TCP和UDP的层次及区别详解所属层次TCP(TransmissionControlProtocol,传输控制协议)和UDP(UserDatagramProtocol,用户数据报协议)都属于OSI模型中的传输层(第四层)。在传输层,协议的主要作用是为端到端的通信提供逻辑通信,并确保数据在网络上传输的可靠性和顺序。TCP和UDP的区别......
  • 使用Ollama+OpenWebUI本地部署阿里通义千问Qwen2 AI大模型
    ......
  • DAI功能简介
    Catalyst交换机上启用DHCPSnooping以及DAI(DynamicARPInspection)功能,目的是防止出现DHCP假冒以及ARP欺骗攻击。其中,DAI功能的实现需要借助DHCPSnooping建立的IP与MAC地址的绑定表。启用该功能后,发现交换机的某些端口每天不定时的发出大量ARP检测告警,告警发生时,相关联的PC无法......
  • 揭秘AI无人直播的核心功能 到底是割韭菜还是未来的核心竞争力呢
    AI无人直播平台具备以下核心功能:直播监控:借助先进的人工智能技术,平台能够实时、精细地监控直播画面,及时响应并处理异常情况,确保直播的流畅与稳定。不论是网络延迟、媒体传输问题还是用户投诉等,平台都能快速检测并采取相应措施,保障用户体验。无人直播咨询:yp2200227直播互动:平......
  • 【数据结构与算法】二叉树的性质 详解
    在二叉树的第i层上至多有多少个结点。在二叉树的第i层上至多有2i−1......
  • 【数据结构与算法】树,二叉树 详解
    给出树的不同的几种表示形式。邻接矩阵:这是一种二维数组,其中的元素表示两个节点之间是否存在边。这种表示形式适用于稠密图,但对于稀疏图可能会浪费很多空间。邻接表:这是一种数组和链表的组合结构。数组的每个元素都是一个链表,链表中的元素表示与该节点相连的其他节点。这种......
  • 远光全栈AIGC数字创新平台入选“大模型行业应用十大典范案例”
    6月4日至7日,由数字产业创新研究中心主办的2024中国数字企业峰会举行,远光软件自主研发的《全栈AIGC数字创新平台YG-JTGPT》凭借其卓越的AIGC技术创新实力与创新推广应用,成功入选“大模型行业应用十大典范案例”榜单。 本届峰会以“AI+数据x向未来”为主题,聚焦AI+融合创新......
  • 详解Web应用安全系列(1)注入漏洞之SQL注入
    注入漏洞通常是指在可输入参数的地方,通过构造恶意代码,进而威胁应用安全和数据库安全。常见的注入漏洞包括:SQL注入和XSS跨站脚本攻击。这篇文章我们主要讲SQL注入,SQL注入即是指web应用程序对用户输入数据的合法性没有判断或过滤不严,攻击者可以在web应用程序中事先定义好的查......