首页 > 其他分享 >基于函数计算部署GPT-Sovits语音生成模型实现AI克隆声音

基于函数计算部署GPT-Sovits语音生成模型实现AI克隆声音

时间:2024-06-07 14:45:05浏览次数:6  
标签:单击 AI 模型 NAS Sovits 语音 GPT

GPT-Sovits是一个热门的文本生成语音的大模型,只需要少量样本的声音数据源,就可以实现高度相似的仿真效果。通过函数计算部署GPT-Sovits模型,您无需关心GPU服务器维护和环境配置,即可快速部署和体验模型,同时,可以充分利用函数计算按量付费,弹性伸缩等优势,高效地为用户提供基于GPT-Sovits模型的文本到语音生成服务。

方案概览


本方案的技术架构包括以下基础设施和云服务:

  • 函数计算:用于提供GPT-Sovits模型的应用服务。
  • 文件存储 NAS:用于存放预训练的GPT-Sovits模型。
  • 专有网络 VPC:用于配置专有网络,方便函数计算访问文件存储 NAS。

重要

  1. 阿里云不对第三方模型的合法性、安全性、准确性进行任何保证,阿里云不对由此引发的任何损害承担责任。
  2. 您应自觉遵守第三方模型的用户协议、使用规范和相关法律法规,并就使用第三方模型的合法性、合规性自行承担相关责任。

部署GPT-Sovits模型

1.登录函数计算3.0控制台

2.请确认访问的控制台是函数计算3.0,否则您需要在右上角单击体验函数计算3.0
image.png

3.在左侧导航栏,单击应用

4.(可选)在应用页面,单击创建应用
说明:如果您之前未使用过应用中心,请跳过本步骤,可直接进入下一步。
image.png

5.在应用页面,选择人工智能>语音克隆生成GPT-SoVITS,单击立即创建
image.png

6.在创建应用页面,部署类型选择直接部署角色名称请确认所需要的权限均已获取(若缺失权限请按照页面引导进行操作),服务状态请确认函数计算FC和文件存储NAS已开通,其他配置保持默认即可,然后单击创建应用。
image.png

7.在活动应用创建提醒对话框中,选中函数计算FC和文件存储NAS两个收费项,选中我已经了解上面的内容,并同意上述描述,单击同意并进行部署
image.png

8.等待约1分钟,部署状态变为部署成功,表示应用部署成功,并生成访问域名,单击访问域名后的链接开始体验应用。

***.devsapp.net域名是CNCF SandBox项目Serverless Devs社区所提供,仅供学习和测试使用,不可用于任何生产使用;社区会对该域名进行不定期地拨测,并在域名下发30天后进行回收,强烈建议您绑定自定义域名以获得更好的使用体验
image.png

快速体验

部署完成后,您可以使用已经准备好的DEMO声音样例,进行声音的合成和体验。
我们准备了一些童年经典动画片的台词,您可以合成试试:

  • 既然你诚心诚意的发问了,我们就大发慈悲的告诉你,为了防止世界被破坏,为了守护世界的和平,贯彻爱与真实的邪恶,可爱又迷人的反派角色,武藏、小次郎!我们是穿梭在银河的火箭队,白洞,白色的明天在等着我们! ——《小精灵》
  • 成为全国第一是我从小的梦想,我不会放弃,这点小伤根本不能让我放弃。 ——《灌篮高手》
  • 舒克舒克舒克舒克开飞机的舒克,贝塔贝塔贝塔贝塔开坦克的贝塔。——《舒克和贝塔》

合成操作步骤

1.选择默认语音模板,输入需要生成的文本,单击合成语音
image.png

2.等待语音合成之后,可以单击播放。
image.png

声音训练

您可以通过声音源文件微调GPT-Sovits大模型,生成您期望的声音。在微调训练过程中,训练步骤的所有中间产物将置于NAS的output文件夹下。训练将使用默认的UVR5和ASR模型。若需要使用其他的UVR5和ASR模型,可根据官方README下载,并分别置于NAS的tools/asr/models和tools/uvr5/uvr5_weights目录下。

1.数据预处理。准备一个较长的您需要克隆的原始声音,单击数据预处理,输入您需要上传的语音文件,单击开始数据预处理
image.png

2.微调文本。单击训练语音文本校对,调整原始文本的内容。
image.png

3.开始训练,单击模型微调,开启SoVITS训练和GPT训练。训练后的模型将存储在NAS下的GPT_weights和SoVITS_weights文件夹内。

image.png

4.训练完之后,在语音克隆&&推流页签,刷新和选择自己训练的模型,再体验合成语音。
image.png

清理资源

您部署GPT-Sovits会使用函数计算FC产品,您创建模型管理器使用了文件存储NAS产品。如果您后续不再使用GPT-Sovits可以删除以下两个部分,函数计算不调用不会计费,文件存储NAS只要有模型存储即会付费,因此请您注意删除相关资源。如果您需要长期使用,请忽略此步骤,并随时注意账号扣费情况。

删除GPT-Sovits使用的FC。

1.前往函数计算应用页面

2.在应用页面,找到您部署的应用,单击右侧操作列下的删除,根据页面提示删除该应用。
image.png

删除模型管理器使用的NAS。

1.登录文件存储控制台,在文件系统列表页面,切换到华东1(杭州)地域,找Alibab-Fc开头到目标文件系统,在操作列,选择image.png>删除

说明
本实验文件存储NAS实例所在地域为华东1(杭州)。
image.png

2.在删除文件系统面板,移除挂载点及生效策略,然后单击删除
image.png
image.png

更多内容关注 Serverless 微信公众号(ID:serverlessdevs),汇集 Serverless 技术最全内容,定期举办 Serverless 活动、直播,用户最佳实践。

标签:单击,AI,模型,NAS,Sovits,语音,GPT
From: https://www.cnblogs.com/Serverless/p/18237174

相关文章

  • AI预测平台处理思路
    AI预测平台处理思路配置:1.创建模型2.配置方案(设置训练周期与粒度)3.配置算法(设置算法)4.配置有效特征数据(影响因素)数据:1.历史数据2.特征数据(影响因素)数据取数:1.sql获取、灵活配置出参入参2.excel导入数据预测思路:根据历史数据,结合特征数据(影响因素),使用设置的算法......
  • AI 绘画零基础如何学习?AIGC绘画设计入门教学
    AI作画入门到是不难,有手就行。我们先从最简单的开始。完成这件事,只有一个步骤:找到一个能画画的AI工具,输入动机。这个工具叫做DiscoDiffusion。它只认识英文,不过这不是问题,你找个翻译软件把中文翻译成英文就行。如果你会科学上网,那么你打开这个网址,点击里面的"openincola......
  • 一文搞懂DevOps、DataOps、MLOps、AIOps:所有“Ops”的比较
    引言近年来,“Ops”一词在IT运维领域的使用迅速增加。IT运维正在向自动化过程转变,以改善客户交付。传统的应用程序开发采用DevOps实施持续集成(CI)和持续部署(CD)。但对于数据密集型的机器学习和人工智能(AI)应用,精确的交付和部署过程可能并不适用。本文将定义不同的“Ops”并解释......
  • AIGC绘画入门知识之AI绘画有哪些好用的关键词?
    AI绘画目前的主流软件有Midjourney和StableDiffusion两种Midjourney需要付费订阅,隐私性和图像可控性相对较低,但是对硬件条件没有要求。而StableDiffusion是免费开源的软件,图片都是在本地电脑生成,隐私性好,采用Controlnet后图像可控性高,但对硬件要求也高。如果想要进阶学习A......
  • 本地配置离线的llama3大模型实现chatgpt对话详细教程
    参考:Llama3本地部署及API接口本地调试,15分钟搞定最新MetaAI开源大模型本地Windows电脑部署_llama3本地部署-CSDN博客 正在下载-----importrequestsimportjsonurl="http://localhost:11434/api/generate"data={&......
  • 自媒体必用的50 个最佳 ChatGPT 社交媒体帖子提示prompt通用模板教程
    在这个信息爆炸的时代,社交媒体已经成为我们生活中不可或缺的一部分。无论是品牌宣传、个人展示,还是日常交流,我们都离不开它。然而,要在众多信息中脱颖而出,吸引大家的关注并不容易。这时候,ChatGPT这样的AI写作工具就显得特别有用了。ChatGPT不仅能帮你快速生成高质量的内容,还能给你......
  • LangChain实战技巧之五:让模型“自动生成”Prompt(提示词)的两种方式
    预备知识with_structured_outputbind_tools对这两种方式不了解的朋友,可以翻阅我的这篇文章找到用法哈LangChain实战技巧之三:关于Tool的一点拓展实现方法方法一步骤一#首先,新建一个提示词抽取器prompt_extractor=ChatPromptTemplate.from_template(template="""......
  • Foxmail邮箱使用方法
    Foxmail是一款由腾讯公司开发的电子邮件客户端软件,以其简洁、高效、易用而著称,深受广大用户喜爱。本文将详细介绍如何使用Foxmail进行邮箱管理,包括安装与配置、基本功能操作、高级功能使用、常见问题解决等。一、Foxmail的安装与配置1.1安装Foxmail下载Foxmail安装包:首......
  • 怎么能通过chatgpt-on-wechat获取全部的微信聊天信息
    要通过chatgpt-on-wechat工具获取全部的微信聊天信息,你可以按照以下步骤操作:安装并配置itchat库:itchat是一个开源的微信个人号接口,可以帮助你获取微信群聊信息。pipinstallitchat登录微信:使用itchat登录微信,获取群聊列表并监听群消息。importitchat#......
  • 超级用户营销策略与多企业AI智能名片O2O商城系统小程序
    摘要:在移动互联网时代,超级用户(即高价值、高活跃度的用户)对于企业的拓客和复购贡献巨大。本文通过分析超级用户的特性,结合一个具体的行业案例,探讨如何通过多企业AI智能名片O2O商城系统小程序实施针对超级用户的营销策略,以实现用户价值的最大化。关键词:超级用户;营销策略;多企业A......