首页 > 其他分享 >开源语音合成库 coqui TTS 使用记录

开源语音合成库 coqui TTS 使用记录

时间:2024-07-31 22:41:02浏览次数:12  
标签:TTS tts 开源 mypath file coqui wav

1 介绍

功能:可以克隆声音;可以转换声音。支持多语言。

GitHub https://github.com/coqui-ai/TTS

在线试玩(效果不如本地demo) https://huggingface.co/spaces/coqui/xtts

2 本地搭建demo

搭建环境

conda create -n coqui python=3.10

conda activate coqui

pip install TTS (可以自动安装需要的依赖包,也可以根据requirements.txt逐个安装依赖包)

运行时其他缺的包直接pip即可(貌似就只有一个)

下载源代码和模型

GitHub https://github.com/coqui-ai/TTS 版本dbf1a08

模型地址 https://huggingface.co/coqui/XTTS-v2/tree/main

测试脚本

import torch
from TTS.api import TTS

## 查看模型列表
# for name in TTS().list_models().list_models():
#     print(name)

## Init TTS 初始化,传入模型和配置文件路径
device = "cuda" if torch.cuda.is_available() else "cpu"  # Get device
tts = TTS(model_path="/home/ze/coqui/mypath/models/model.pth", 
          config_path="/home/ze/coqui/mypath/models/config.json", 
          progress_bar=True).to(device)

## Text to speech to a file
# ## 英文
# tts.tts_to_file(text="A short story is a piece of prose fiction. It can typically be read in a single sitting and focuses on a self-contained incident or series of linked incidents, with the intent of evoking a single effect or mood.", 
#                 speaker_wav="mypath/audio/samples_en_sample.wav", 
#                 language="en", 
#                 file_path="output.wav")
# ## 中文
# tts.tts_to_file(text="龙能大能小,能升能隐;大则兴云吐雾,小则隐介藏形;升则飞腾于宇宙之间,隐则潜伏于波涛之内。方今春深,龙乘时变化,犹人得志而纵横四海。", 
#                 speaker_wav="mypath/audio/samples_zh-cn-sample.wav", 
#                 language="zh-cn", 
#                 file_path="output.wav")
## 指定中文音色,输出英文
tts.tts_to_file(text="A short story is a piece of prose fiction. It can typically be read in a single sitting and focuses on a self-contained incident or series of linked incidents, with the intent of evoking a single effect or mood.", 
                speaker_wav="mypath/audio/dragon.wav", 
                language="en", 
                file_path="output.wav")

遇到问题

报错 NotADirectoryError: [Errno 20] Not a directory: '/home/ze/coqui/mypath/models/model.pth/model.pth’

原因:代码接口存在bug,在/home/ze/coqui/TTS-dev/TTS/utils/synthesizer.py line192加载模型时没有按照接口定义。

解决:将home/ze/coqui/TTS-dev/TTS/utils/synthesizer.py line192调用语句self.tts_model.load_checkpoint()中参数tts_checkpoint改为模型所在路径,比如"/home/ze/coqui/mypath/models”

标签:TTS,tts,开源,mypath,file,coqui,wav
From: https://www.cnblogs.com/inchbyinch/p/18335636

相关文章

  • OpenAI发布PVG:用小模型验证大模型输出解决“黑盒”难题,韩国团队拆分Transformer注意力
    OpenAI发布PVG:用小模型验证大模型输出解决“黑盒”难题,韩国团队拆分Transformer注意力让大模型解码提速20倍,微软、OpenAI、英特尔、谷歌、英伟达,成立开源大模型安全联盟。在今年的7月11日,全球著名开源大模型分享平台HuggingFace与专业数学大模型平台Numina合作,共同角逐AI......
  • .NET 开源的数据库文档查询和生成工具
    前言在实际项目开发中,需求变更和项目迭代是常态。要求我们能够迅速响应,对数据库结构进行相应的调整,如添加新表、更新现有表结构或增加字段等。为了确保团队成员之间的信息同步,实时更新和维护数据库文档变得至关重要。这不仅提升了数据库的可读性,也极大提高了开发效率和团队协作......
  • 图像识别的开源项目列举
    当涉及到图像识别的开源项目和示例代码时,以下是一些适合初学者快速提升能力的项目:TensorFlowModels:TensorFlowModels是一个由TensorFlow团队维护的开源项目,提供了许多经典的图像识别模型的实现代码。你可以从中学习和理解各种图像分类、目标检测和图像分割等任务的实现方式......
  • 【JAVA】TestNG 开源测试框架
    创建maven项目https://www.cnblogs.com/phoenixy/p/16850747.htmlpom.xml<?xmlversion="1.0"encoding="UTF-8"?><projectxmlns="http://maven.apache.org/POM/4.0.0"xmlns:xsi="http://www.w3.org/2001/XMLSche......
  • .NET 开源快捷的数据库文档查询和生成工具
    前言在实际项目开发中,需求变更和项目迭代是常态。要求我们能够迅速响应,对数据库结构进行相应的调整,如添加新表、更新现有表结构或增加字段等。为了确保团队成员之间的信息同步,实时更新和维护数据库文档变得至关重要。这不仅提升了数据库的可读性,也极大提高了开发效率和团队协作......
  • 接私活神器:免费云数据库+免费开源模板!!!
    在当今快节奏的数字时代,独立开发者接私活已经成为一种常见的职业选择。作为一名独立开发者,如何高效地完成项目,快速交付高质量的应用,是一个重要的挑战。今天,我要向大家推荐一款接私活的超级神器——MemFireCloud。这款工具不仅提供免费云数据库,还附带大量开源模板,让你的开发......
  • 这本vue3编译原理开源电子书,初中级前端竟然都能看懂
    前言众所周知vue提供了很多黑魔法,比如单文件组件(SFC)、指令、宏函数、cssscoped等。这些都是vue提供的开箱即用的功能,大家平时用这些黑魔法的时候有没有疑惑过一些疑问呢。我们每天写的vue代码一般都是写在*.vue文件中,但是浏览器却只认识html、css、js等文件类型,明显是不认......
  • Anaconda常见命令及常见开源镜像汇总
    1、linux命令查看显卡状态nvidia-smi退出top命令键入q即可或按ctrlc解压缩命令unzip删除虚拟环境condaremove-nenv_name--all创建虚拟环境condacreate-nyour_env_namepython=x.x关闭虚拟环境condadeactivate打开虚拟环境condaactivateenv_name创建一......
  • 借助流程表单设计器开源为流程化办公赋能
    在经济高速发展的今天,想要实现流程化办公和数字化转型,需要利用更优质的平台为其加油助力。低代码技术平台、流程表单设计器开源为各行各业流程化办公高效赋能,一起摆脱信息孤岛、部门沟通不协调等各种尖锐问题,借助流程表单设计器做好数据管理工作,为行业发展贡献整套低代码技术平台......
  • 运维系列之CMS:最值得推荐的开源 PHP CMS 系统有哪些
    最值得推荐的开源PHPCMS系统有哪些前言最值得推荐的开源PHPCMS系统有哪些一、DRUPAL二、WORDPRESS三、JOOMLA!四、TYPO3前言有一些CMS是有搭建成本(需要大量时间研究)的,如果不是专业运维或者没有得到专业指导的情况下,建议直接用docker或者云服务器......