i人的福音！一个强大开源的文本转语音工具！

时间：2024-07-22 09:52:47浏览次数：16

标签：合成开源语音 EmotiVoice 工具文本福音

大家好，我是 Java陈序员。

现在的自媒体可谓是十分火热，各个视频剪辑软件提供了文本生成语音的功能，但大多都是千篇一律的音色，比如“这个男人叫小帅”。

如果你想做自媒体，既不想录制自己的语音，又想自己的视频配音与他人不同，可以考虑使用大模型来训练生成自己的语音。

今天，给大家介绍一个开源免费的文本转语音工具，支持十几种语言生成！

关注微信公众号：【Java陈序员】，获取开源项目分享、AI副业分享、超200本经典计算机电子书籍等。

项目介绍

EmotiVoice —— 一个强大的开源 TTS 引擎（Text To Speech，即文本转语音），完全免费开源！

EmotiVoice 供了一个易于使用的 Web 界面用于文本转语音，支持中英文双语，包含 2000 多种不同的音色，以及特色的情感合成功能，支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。

此外，EmotiVoice 还提供了用于批量生成结果的 API 接口。

项目使用

启动工具

EmotiVoice 的使用方法十分简单，在 Windows 环境下，解压软件压缩包后，双击运行 start.bat 即可启动。

双击运行 start.bat 后，将会在 CMD 命令窗口中运行服务：

并在浏览器中自动打开 Web 界面：

单句合成

1、选择说话人，工具提供了十几种不同的男女音色供选择

2、选择情绪，工具提供了普通、生气、开心、惊讶、悲伤、厌恶、恐惧等语音情绪

3、输入合成文本

4、点击合成

5、合成的音频可以进行在线播放和下载，或者在合成时勾选生成音频后直接保存在wav_file目录下

故事剧本多人合成

EmotiVoice 除了提供单句合成，还提供了故事剧本多人合成的功能。

1、输入角色和文本

2、为角色选定声音情感

3、为角色选定配音员

4、点击合成音频

快速上手

完整安装

conda create -n EmotiVoice python=3.8 -y
conda activate EmotiVoice
pip install torch torchaudio
pip install numpy numba scipy transformers soundfile yacs g2p_en jieba pypinyin pypinyin_dict

更多的模型训练，可参考项目文档。

Docker 部署

尝试 EmotiVoice 最简单的方法是运行 Docker 镜像，需要一台带有 NVidia GPU 的机器！

docker run -dp 127.0.0.1:8501:8501 syq163/emoti-voice:latest

容器启动成功后，访问：

http://localhost:8501/

EmotiVoice 作为一款 TTS 引擎，可以说功能十分强大，而且开源免费，大家快去围观体验吧~

项目地址：https://github.com/netease-youdao/EmotiVoice

最后

推荐的开源项目已经收录到 GitHub 项目，欢迎 Star：

https://github.com/chenyl8848/great-open-source-project

或者访问网站，进行在线浏览：

https://chencoding.top:8090/#/

大家的点赞、收藏和评论都是对作者的支持，如文章对你有帮助还请点赞转发支持下，谢谢！

标签：合成,开源,语音,EmotiVoice,工具,文本,福音
From： https://www.cnblogs.com/codechen8848/p/18314420

ML.NET：一个.NET开源、免费、跨平台的机器学习框架
前言今天大姚给大家分享一个.NET开源、免费、跨平台（支持Windows、Linux、macOS多个操作系统）的机器学习框架：ML.NET。并且本文将会带你快速使用ML.NET训练一个属于自己的图像分类模型，对图像进行分类。ML.NET框架介绍ML.NET允许开发人员在其.NET应用程序中轻松构建、训练......
如何使用 LSTM 改进法语文本生成模型？
我正在用Python开发生成式人工智能，使用LSTM模型来处理与法语法律文本相关的查询。我面临输出问题，因为它们要么没有用法语正确处理，要么不准确。我尝试添加更多LSTM层，仅保留最小化作为预处理，但我生成的输出缺乏质量和准确性，您可以在下面的屏幕截图。对于改进我的文本......
Ansible 是一个强大的开源自动化工具，用于自动化应用程序的部署、配置管理和任务自动化
Ansible是一个强大的开源自动化工具，用于自动化应用程序的部署、配置管理和任务自动化。它是由RedHat公司开发和维护的，提供了简单易用的方式来自动化IT环境中的复杂任务。主要特点和优势：简单易用：Ansible使用基于YAML的语法（称为Playbooks），易于理解和编写，无需编写复杂的......
Milvus 实践(1) --- 文本-图片交互式search搭建及原理
目录背景训练素材downloadtorchvision简介python代码执行结果模型训练模型训练参数训练模型注意事项模型加载录入vectorDB使用预加载的模型参数对图片进行编码录入milvus查询效果查询编码milvussearch模型适用列表总结背景应该说Milvus在2.4以上版......
文本搜索工具grep
grep 是一个强大的文本搜索工具，广泛用于Unix和Linux系统中，用于搜索包含指定模式的行。它支持多种参数，可以帮助你定制搜索行为。以下是一些常用的 grep 参数：###基本参数-**-i**：忽略大小写。-**-v**：反向匹配，显示不匹配的行。-**-c**：计数匹配行的数量，而不是显示匹配的......
基于图形界面 vs. 基于文本的工具
基于图形界面（GUI）和基于文本工具（如命令行工具和脚本）的区别基于图形界面限制：图形界面提供的功能通常受限于设计者预先定义的按钮、滑条和输入框等元素。用户只能执行这些界面上明确提供的操作。直观性：图形界面对初学者友好，操作直观，易于上手。复杂度：对于复杂的任务和自动化需求，......
第2节课：文本内容与格式化——HTML中的文本处理技巧
目录文本内容与格式化：段落和标题：构建文本基础段落`<p>`标题`<h1>`到`<h6>`格式化：强调和样式加粗`<b>`斜体`<i>`下划线`<u>`列表：组织内容无序列表`<ul>`有序列表`<ol>`定义列表`<dl>`实践：创建一个内容丰富的网页结语文本内容与格式化：在网页设计中，文本是......
C++文件操作-文本文件-读文件
第一种#include<iostream>//1、包含头文件fstream#include<fstream>usingnamespacestd;voidtest01(){ //2、创建流对象 ifstreamifs; //3、打开文件并且判断是否打开成功 ifs.open("test.txt",ios::in); if(!ifs.is_open()) { cout<<"文件打开失......
vue2-常用富文本编辑器使用介绍
mavon-editor安装命令[email protected]全局配置修改main.js文件，添加如下配置importmavonEditorfrom'mavon-editor'import'mavon-editor/dist/css/index.css'Vue.use(mavonEditor)组件使用不含视频上传功能<el-row><......
Autopsy Forensic Browser 是一个开源的数字取证工具，主要用于分析电脑文件系统和存储
AutopsyForensicBrowser是一个开源的数字取证工具，主要用于分析电脑文件系统和存储设备，帮助调查人员识别和恢复可能的证据。它设计用于在调查和法医实验室中使用，支持各种操作系统，包括Windows、Linux和macOS。该工具的主要特点和功能包括：文件系统分析：可以深入分析和检查存储......