首页 > 其他分享 >最最简单的稳定生成语音教程ChatTTS稳定语音

最最简单的稳定生成语音教程ChatTTS稳定语音

时间:2024-10-31 14:17:57浏览次数:7  
标签:稳定 ChatTTS pt 文件 音色 seed 语音

最最简单的稳定生成语音教程ChatTTS

踩了很多坑探索出来的。

一、简介

ChatTTS是一个开源的中文语音合成项目,通过使用预训练的声音嵌入文件(.pt文件),我们可以实现固定音色的语音合成。

二、音色固定的步骤

1. 初始尝试

pip install chattts-fork
chattts "测试文本" --seed 222 -o output.wav

使用默认seed值生成的音色可能不够理想。声音控制不稳定。

2. 获取优质音色文件

前往 ChatTTS Speaker 下载评分较高的.pt音色文件。
在这里插入图片描述
在这里插入图片描述

3. 使用Python代码加载音色文件

标签:稳定,ChatTTS,pt,文件,音色,seed,语音
From: https://blog.csdn.net/qq_31531909/article/details/143392439

相关文章

  • 【AIGC】AI文本转语音+语音转文本,构建专属领域转文本模型
    AI文本转语音+语音转文本1.引言2.实例2.1文本转语音2.2文字合成语音2.3语音转文字2.4使用热词库2.5完整代码3.总结1.引言在AI领域,文本转语音和语音转文本技术已经取得了显著的进展。这些技术在许多领域都有广泛的应用,如语音助手、实时弹幕、通话检测等。本文我们使......
  • N9300-S16语音芯片:提升电梯播报体验,实现导航声音播报提示
    随着科技的不断进步与人们日常生活紧密相关的电梯行业也迎来了智能化升级的新篇章。N9300语音芯片,作为这一变革中的重要一环,正以其卓越的性能和多样化的功能,显著提升着电梯播报体验,让每一次乘坐都变得更加便捷与舒适。该芯片采用先进的音频处理技术,能够清晰、准确地传达电梯的到站......
  • 基于python的语音识别与蓝牙通信的温控系统
    基于python的语音识别与蓝牙通信的温控系统大家好我是小俊学长,混迹在java圈的辛苦码农。今天要和大家聊的是一款基于python的语音识别与蓝牙通信的温控系统。项目源码以及部署相关请联系小俊学长,文末附上联系信息。......
  • 最新宝塔安装教程:Linux 稳定版 9.0 宝塔面板+免费SSL证书解析
    在本教程中,我们将详细介绍如何在Linux服务器上安装宝塔面板的最新稳定版9.0,并为您的网站添加免费的SSL证书。此教程适合初学者和有一定经验的用户。通过SSH连接至VPS服务器后,您将能够顺利完成宝塔安装和初步设置,这篇文章将为您提供简单易懂的操作指南,帮助您在几分钟内完成服务......
  • 最新宝塔安装教程:Linux 稳定版 9.0 宝塔面板+免费SSL证书解析
    在本教程中,我们将详细介绍如何在Linux服务器上安装宝塔面板的最新稳定版9.0,并为您的网站添加免费的SSL证书。此教程适合初学者和有一定经验的用户。通过SSH连接至VPS服务器后,您将能够顺利完成宝塔安装和初步设置,这篇文章将为您提供简单易懂的操作指南,帮助您在几分钟内完成服务......
  • 实时语音转写技术:思通数科AI多模态平台赋能法庭审理,为庭审记录带来新体验
    一、系统介绍系统具备强大的特征提取和语音处理能力,利用美尔频谱系数(MFCCs)等算法进行高精度声学建模,并结合语言模型确保转写内容的上下文完整性。支持多语种识别、讲话人辨识、实时记录等功能,为多语言法庭环境及国际化庭审提供技术支持。平台还结合了Bert算法进行特征深度提取和......
  • 易基因:Aging Cell/IF8:卵巢发育和衰老的m6A 甲基化揭示RNA稳定性和染色质状态调控
    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。卵巢是女性重要的生殖器官,也是最早表现出衰老迹象的器官之一,通常在35岁左右开始,卵巢衰老(ovarianaging,OA)是导致与年龄相关的不孕问题的重要因素,包括卵泡数量和卵子质量的逐渐下降,对女性生育能力构成威胁。m6A是一种普......
  • 纯前端实现微信小程序录音后自动将语音转文字的同声传译功能
     本文将手把手教你如何借助微信官方提供的微信同声传译插件,不依赖后端接口,纯前端实现微信小程序录音后自动将语音转文字功能。我们需要依赖微信官方提供的微信同声传译插件。首先,需要进入微信公众平台添加插件。一、登录微信公众平台 ,进入账号设置二、进入第三方设置,添加......
  • MaskGCT,AI语音克隆大模型本地部署(Windows11),基于Python3.11,TTS,文字转语音
    前几天,又一款非自回归的文字转语音的AI模型:MaskGCT,开放了源码,和同样非自回归的F5-TTS模型一样,MaskGCT模型也是基于10万小时数据集Emilia训练而来的,精通中英日韩法德6种语言的跨语种合成。数据集Emilia是全球最大且最为多样的高质量多语种语音数据集之一。本次分享一下如何在本地......
  • 点阵数显驱动芯片/数码管显示屏驱动VK1620 SOP20适用于高稳定LED驱动
    VK1620B是一种数码管或点阵LED驱动控制专用芯片,内部集成有3线串行接口、数据锁存器、LED驱动等电路。SEG脚接LED阳极,GRID脚接LED阴极,可支持10SEGx4GRID、9SEGx5GRID、8SEGx6GRID的点阵LED显示面板。适用于要求可靠、稳定和抗干扰能力强的产品。采用SOP20的封装形式。LJQ3036......