chattts最强对手-实时流库PaddleSpeech的最新落地经验总结（不看后悔）

时间：2024-06-07 09:01:34浏览次数：30

标签：chattts PaddleSpeech paddlespeech python 语音流库 install pip 安装

PaddleSpeech 是由百度飞桨（PaddlePaddle）团队开发的一个开源的语音技术框架，支持音频分类、语音翻译、语音识别、语音合成、声纹识别等任务，可以做到工业级端到端的流式ASR和TTS服务。开源github地址：https://github.com/PaddlePaddle/PaddleSpeech。

一、环境安装

1、python环境：为了兼容paddlepaddle、paddleaudio等库的依赖环境，建议安装python版本在3.8以上3.10以下。

2、conda环境依赖安装：为了安装支持paddlespeech以及c++的环境，我们首先执行以下命令：

conda install -y -c conda-forge sox libsndfile swig bzip2

conda install -y -c gcc_linux-64=8.4.0 gxx_linux-64=8.4.0

3、pip包依赖安装：需要安装paddlepaddle、pytest-runner以及paddlespeech。

paddle根据不同硬件的支持安装对应的版本，建议安装2.5.1版本，cpu版本命令为：

pip install paddlepaddle==2.5.1 -i https://mirror.baidu.com/pypi/simple

而gpu版本命令为：

pip install paddlepaddle-gpu==2.5.1 -i https://mirror.baidu.com/pypi/simple

为了paddlespeech以及后续开发测试代码，需要安装pytest-runner库，命令如下：

pip install pytest-runner

最后，我们安装paddlespeech，这个会有两种方式，如果为了快速使用可以直接pip安装，如果为了更深入的开发并有修改源代码的需求，我们可以通过编译源代码进行安装。

paddlespeech的pip安装命令如下：

pip install paddlespeech==2.4.1 -i https://pypi.tuna.tsinghua.edu.cn/simple

paddlespeech的源代码安装命令如下：

git clone https://github.com/PaddlePaddle/PaddleSpeech.git

cd PaddleSpeech

pip install .  -i https://pypi.tuna.tsinghua.edu.cn/simple

二、功能测试

为了验证paddlespeech功能是否安装成功，我们可以通过测试语音识别、语音合成、声音分类等功能进行验证。Paddlespeech官网推荐会有命令行和python接口调用方法，这里都以中文语言测试为例。

通过lang参数决定用哪个语言，zh表示中文，en表示英文，mix表示中英混合。

1、ASR语音识别功能测试

（1）命令行方式：

paddlespeech asr --lang zh --input test.wav

（2）python接口调用方式:

from paddlespeech.cli.asr.infer import ASRExecutor

asr = ASRExecutor()

result = asr(audio_file="test.wav")

print(result)

2、TTS语音合成功能测试

（1）命令行方式：

paddlespeech tts --input "你好，这是语音合成功能测试的示例。" --output output.wav

（2）python接口调用方式:

from paddlespeech.cli.tts.infer import TTSExecutor

tts = TTSExecutor()

tts(text="你好，这是语音合成功能测试的示例。", output="output.wav")

三、问题总结

paddlespeech库的环境搭建并不容易，看官网讨论还有人搭建了几天才搭建好，本人第一次搭建也搭建了好几个小时，因为官方已经不再怎么维护了，还多安装问题我们需要自己根据遇到的问题进行自行解决。

我们这里会总结一下安装过程中所遇到的问题，如果大家搭建过程还遇到其他问题，大家都可以留言进行讨论。

1、运行paddlespeech_server服务报错ModuleNotFoundError: No module named 'paddle.nn.layer.layers'。

第一，python版本要安装python3.8到3.10，太高太低都不太兼容安装paddlespeech的兼容库。

第二，paddlepaddle版本要安装2.5.1以上，paddlespeech要安装1.4.1以上，这个兼容性问题才能解决。

2、遇到linux报错glibc库报错ImportError: /lib/x86_64-linux-gnu/libc.so.6: version `GLIBC_2.32' not found。

虽然可以升级glibc库也可以解决，但可能会导致其他linux环境库出问题，建议还是修改opencc版本为0.1.6，通过命令安装：pip install opencc-python-reimplemented==0.1.6。

3、修改speed、volume这些参数的时候会报错，xmalloc: out of memory。

没有安装相应的库，首先linux需要安装相应库，执行命令：apt-get install sox libsox-dev libsox-fmt-all

然后pip方式安装，命令：pip install soxbindings。

4、执行流式的asr或tts服务时候，执行命令报错。

要确定protocol协议方式是一致明确的，要确定是websocket的还是http的。

欢迎关注公众号：杰哥新技术

标签：chattts,PaddleSpeech,paddlespeech,python,语音,流库,install,pip,安装
From： https://blog.csdn.net/m0_71062934/article/details/139510373

突破开源天花板！最强文本转语音工具ChatTTS：对话式高可控的语音合成模型
ChatTTS一夜爆火，极速出圈，3天就斩获9k的Star量，截止2024.06.04，已经19.3k的star，极速接近GPT-soVITs当天的26.2k的star数。什么是ChatTTS？TTS全称：TextToSpeech（也就是文本转语音模型）。ChatTTS是专为对话场景设计的语音生成模型，特别适用于大型语言模型(LLM......
星海算力云：【ChatTTS】无需部署，一键云启动
镜像介绍ChatTTS：革新对话式文本转语音技术ChatTTS是由2noise团队开发的一款专为对话场景设计的文本转语音（TTS）模型。它不仅支持英文和中文两种语言，而且经过了超过10万小时的中英文数据训练，表现出色。ChatTTS的亮点在于其对话式TTS的优化，它能够生成自然流畅的语音并支持多......
【手把手教学】最新ChatTTS语音合成项目使用指南AI变声器chatTTS教程来了！5S夺走你的卧
像这种充满语气充满感情色彩的人声，再搭配一段自拍图，是由最近大火的AI项目chatTTS生成的，ChatTTS是专门为对话场景设计的文本转语音模型，例如LLM助手对话任务。它支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练。在HuggingFace中开源的版本为4万小......
最像真人的语音转文本ChatTTS本地部署+Colab部署+跳坑指南
1.WindowsChatTTSUI:https://github.com/jianchang512/ChatTTS-ui/releases/tag/v0.85v0.85完整包下载(2.7G含模型)百度网盘下载： https://pan.baidu.com/s/1RntYLT6UNd8_ew2osy8d1A?pwd=by14123网盘下载：https://www.123pan.com/s/03Sxjv-oEyB3.htmlhuggingfacelink: h......
ChatTTS 如何安装可视化操作
可视化一键安装下载地址：百度网盘DownloadfromGitHub从GitHub下载代码。gitclonehttps://github.com/2noise/ChatTTS下载地址InstallDependencies在开始之前，请确保已安装必要的软件包。如果您尚未安装它们，可以使用pip进行安装：pipinstalltorchChatTTSIm......
一键云部署：资源编排 ROS 轻松部署文本转语音系统 ChatTTS
ChatTTS是专门为对话场景设计的文本转语音模型，例如LLM助手对话任务。它支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练。ChatTTSwebUI&API为ChatTTS提供了网页界面和API服务。资源编排服务（ResourceOrchestrationService,ROS）是阿里云提供基......
【部署ChatTTS】
部署ChatTTS出错WARNING:ChatTTS.core:PackageWeTextProcessingnotfound!加载模型时报错生成时报错安装时报错（没解决）安装anaconda解决加载模型时报错加载模型chat=ChatTTS.Chat()chat.load_models()报错Anerrorhappenedwhiletryingtolocatethefil......
ChatTTS,语气韵律媲美真人的开源TTS模型,文字转语音界的新魁首,对标微软Azure-tts
前两天2noise团队开源了ChatTTS项目，并且释出了相关的音色模型权重，效果确实非常惊艳，让人一听难忘，即使摆在微软的商业级项目Azure-tts面前，也是毫不逊色的。ChatTTS是专门为对话场景设计的文本转语音模型，例如大语言助手对话任务。它支持英文和中文两种语言。最大的模型使用了10万......
Google使用AI改进了 Sheets；开源视觉语言模型llama3v；开源情绪语音模型ChatTTS；
✨1:GooglehasimprovedSheetswithAI.Google使用AI改进了Sheets您可以使用Gemini处理您的数据并将其变成老师。优化您的数据Gemini了解您的数据并提出改进建议。例如，它可以将重复数据转换为更实用的下拉框。解释数据通过单击双子座图标，您可以自动获......
飞桨paddlespeech语音唤醒推理C INT8 定点实现
前面的文章（飞桨paddlespeech语音唤醒推理C定点实现）讲了INT16的定点实现。因为目前商用的语音唤醒方案推理几乎都是INT8的定点实现，于是我又做了INT8的定点实现。实现前做了一番调研。量化主要包括权重值量化和激活值量化。权重值由于较小且均匀，还是用最大值非饱和量化。最大值......

chattts最强对手-实时流库PaddleSpeech的最新落地经验总结（不看后悔）

一、环境安装

二、功能测试

三、问题总结

相关文章

赞助商

阅读排行