首页 > 其他分享 >再升级!MoneyPrinterPlus集成GPT_SoVITS

再升级!MoneyPrinterPlus集成GPT_SoVITS

时间:2024-08-14 13:26:41浏览次数:13  
标签:MoneyPrinterPlus TTS 音频 SoVITS 语音 GPT

最近有很多优秀的语音合成TTS工具,目前MoneyPrinterPlus已经集成了ChatTTS和fasterWhisper。应朋友们的要求,最近MoneyPrinterPlus也集成了GPT_SoVITS这个优秀的语音合成工具。

今天给大家详细讲解一下,如何在MoneyPrinterPlus中使用GPT_SoVITS。

软件准备

当然,前提条件就是你需要下载MoneyPrinterPlus软件啦。

下载地址: https://github.com/ddean2009/MoneyPrinterPlus

用得好的朋友,不妨给个star支持一下。 在软件v4.4版本之后,MoneyPrinterPlus已经支持GPT_SoVITS本地TTS语音服务啦。

启动GPT_SoVITS

GPT_SoVITS这个工具怎么安装这里就不多讲了。

我们讲下如何跟MoneyPrinterPlus进行合作配置。

GPT_SoVITS有很多功能,包括语音训练,模型微调,TTS语音推理,变声等功能。

这里我们使用的是GPT_SoVITS的核心TTS语音推理功能。

首先我们启动GPT_SoVITS:

在1-GPT-SoVITS-TTS ---》 1C推理 ---》 开启TTS推理webUI

image-20240814101451460

然后你就可以看到这样的TTS推理界面:

image-20240814103843764

你可以选择参考音频,参考文本,参考音频的语言。

然后可以输入要合成的文本,合成语音的类别,语速,top_k, top_p和temperature。

当然,上面的都不重要,我们不需要通过webUI来调用GPT_SoVITS,我们需要的是通过API来和GPT_SoVITS进行交互。

API启动GPT_SoVITS

如果下载的是GPT_SoVITS的集合包,那么可以直接执行下面的命令来启动GPT_SoVITS的API:

启动api: runtime\python.exe api.py 

启动之后,你会看到下面的内容:

image-20240814002404640

上面的启动是最简单的启动,没有指定参考音频,如果你想指定参考音频的话,可以执行下面的命令:

python api.py -dr "123.wav" -dt "一二三。" -dl "zh" 

当然,还有其他的一些启动参数如下:

`-dr` - `默认参考音频路径`
`-dt` - `默认参考音频文本`
`-dl` - `默认参考音频语种, "中文","英文","日文","韩文","粤语,"zh","en","ja","ko","yue"`

`-d` - `推理设备, "cuda","cpu"`
`-a` - `绑定地址, 默认"127.0.0.1"`
`-p` - `绑定端口, 默认9880, 可在 config.py 中指定`
`-fp` - `覆盖 config.py 使用全精度`
`-hp` - `覆盖 config.py 使用半精度`
`-sm` - `流式返回模式, 默认不启用, "close","c", "normal","n", "keepalive","k"`
·-mt` - `返回的音频编码格式, 流式默认ogg, 非流式默认wav, "wav", "ogg", "aac"`
·-cp` - `文本切分符号设定, 默认为空, 以",.,。"字符串的方式传入`

`-hb` - `cnhubert路径`
`-b` - `bert路径`

大家可以根据需要自行选择。

默认情况下API会启动在9880端口,我们可以使用下面的命令来测试API的启动效果:

使用执行参数指定的参考音频:
GET:
    `http://127.0.0.1:9880?text=先帝创业未半而中道崩殂,今天下三分,益州疲弊,此诚危急存亡之秋也。&text_language=zh`
POST:
```json
{
    "text": "先帝创业未半而中道崩殂,今天下三分,益州疲弊,此诚危急存亡之秋也。",
    "text_language": "zh"
}
```

配置MoneyPrinterPlus

好了,回到我们的MoneyPrinterPlus页面。

在基本配置页面,本地语音TTS,我们选择GPTSoVITS, 然后输入GPTSoVITS的地址。

image-20240814105434708

在AI视频或者视频混剪区,在视频TTS语音合成区,我们选择本地服务。

image-20240814002245394

这里列出来GPTsoVITS所需要的大部分参数。

你可以使用参考音频,参考音频文本,参考音频语音。

然后可以条件temperature,top_P, top_K等信息。

image-20240814002312805

点击试听声音,如果你听到合成的声音,那么恭喜你,你的配置成功了。

同时,在GPTsoVITS服务的日志文件中,你可以看到一些语音合成的进度。

image-20240814001906393

总结

GPTsoVITS是一个非常强大的服务,和MoneyPrinterPlus结合起来使用,你将会无往不利。
点我查看更多精彩内容:www.flydean.com

标签:MoneyPrinterPlus,TTS,音频,SoVITS,语音,GPT
From: https://www.cnblogs.com/flydean/p/18358780

相关文章

  • 不用再找了,吐血整理ChatGPT 新手使用手册~
    现在人工智能很强大,聊聊天、写论文、搞翻译、写代码、写文案、审合同、情感陪伴等,真是无所不能~本来以为ChatGPT早已普及了,没想到仍然有很多小伙伴还没用上。。。其实使用很简单,可以选通义、智谱、Deepseek等“83分”的国产大模型~国产大模型,平均80分左右~也可选国内的......
  • STM32 H7系列 全中文HAL&LL库使用手册 中英双语对照 GPT机翻 共4020页、约152万字
    STM32H7系列全中文HAL_LL库使用手册,中英文双语对照阅读。内容、格式对照官方原文,含标签导航及目录跳转。全文GPT机翻,除人工翻译外,相对更加贴合原文原意,双语版防止翻译错误方便对照。全文:4020页,约152万字,2022年12月版本,当前官网最新版。 *******下有更多展示图片********......
  • ChatGPT 大模型核心算法深度分析 2024
    在分析核心算法之前,我们先了解chatGPT相关技术发展进程首先介绍自然语言处理、大规模预训练语言模型以及ChatGPT技术的发展历程,接着就ChatGPT的技术优点和不足进行分析,然后讨论核心算法。1.1自然语言处理的发展历史人类语言(又称自然语言)具有无处不在的歧义性、高度......
  • 案例分析:GPT系列 - Transformer教程
    大家好,今天我们来聊一聊目前大热的GPT系列模型,以及它背后的核心技术——Transformer。通过这个案例分析,希望能帮助大家更好地理解这一领域的前沿技术。首先,我们需要明白什么是GPT系列模型。GPT,全称为GenerativePre-trainedTransformer,是由OpenAI推出的一系列语言模型。这......
  • 不用再找了,吐血整理ChatGPT 4o/4o mini 新手使用手册~
     现在人工智能很强大,聊聊天、写论文、搞翻译、写代码、写文案、审合同、情感陪伴等,真是无所不能~本来以为ChatGPT早已普及了,没想到仍然有很多小伙伴还没用上。。。其实使用很简单,可以选通义、智谱、Deepseek等“83分”的国产大模型~国产大模型,平均80分左右~也可选国内......
  • 黑匣子被打开了!能玩的Transformer可视化解释工具,本地运行GPT-2、还可实时推理
    原文链接:https://blog.csdn.net/m0_46163918/article/details/141113273都2024年,还有人不了解Transformer工作原理吗?快来试一试这个交互式工具吧。2017年,谷歌在论文《Attentionisallyouneed》中提出了Transformer,成为了深度学习领域的重大突破。该论文的引用数已经......
  • 开发者福音!ChatGPT 输出现支持预定义!
    ChatGPT输出可以更加可控了,OpenAI昨天发布了一款工具,该工具将以用户指定的精确格式返回查询结果。OpenAI首席执行官SamAltman表示,这是使用AI技术的开发人员提出最多的请求。1.OpenAI今年的重点:DevTools自2022年11月首次亮相以来,ChatGPT服务已被无数应用程序开......
  • 第九期 写一个自己的AutoGpt
    一:先了解AutoGpthttps://zhuanlan.zhihu.com/p/629909493?utm_id=0二:实现自己的AutoGpt之一:prmpt模板处理思路prompt与代码分离编写reason(理由)&Act(行为)的prompt模板基于langchain编写AutoGpt框架设计长时和短时Memory封装自己的tools运行AutoGpt......
  • 谷歌终于赢了OpenAI一回:实验版本Gemini 1.5 Pro超越GPT-4o
    近两日,谷歌在不断发布最新研究。继昨日放出最强端侧Gemma22B小模型后,刚刚,Gemini1.5Pro实验版本(0801)已经推出。用户可以通过GoogleAIStudio和GeminiAPI进行测试和反馈。既然免费,那我们帮大家测试一下最近比较火的比大小问题。当我们问Gemini1.5Pro(0801......
  • chatgpt这么火,现在AI搜索引擎有哪些呢?
    常用国外的AI搜索引擎:ChatGPT(OpenAI):一个基于自然语言处理的AI助手,能够回答问题、生成文本内容并执行多种语言任务。GoogleBard:Google的AI驱动搜索引擎,集成了自然语言处理技术,旨在提供更加智能和个性化的搜索体验。MicrosoftBing(AI-Powered):微软将OpenAI的GPT模型集成到......