首页 > 其他分享 >更简易、高效的微软Edge-tts库实时详细的经验分享

更简易、高效的微软Edge-tts库实时详细的经验分享

时间:2024-06-17 21:57:12浏览次数:23  
标签:ch 微软 tts text edge -- Edge test

Edge-tts是一个利用微软 Azure Cognitive Services 的在线文本转语音服务的 Python 库。

它允许开发者在 Python 代码中使用该服务,而无需安装 Microsoft Edge 浏览器、Windows 操作系统或使用 API 密钥。

这个Edge-tts库通过调用微软 Edge 浏览器的文本朗读相关 API 实现文本转语音功能,不需要本地部署模型,使用简单,声音效果好。

github项目地址:https://github.com/rany2/edge-tts。

一、环境安装

1、python环境:建议安装python版本在3.8以上。

2、pip包安装命令

​
pip install edge-tts -i https://mirror.baidu.com/pypi/simple

、功能测试

1、命令行测试

安装成功后,我们通过命令行edge-tts来验证

我们只需要通过edge-tts的一行指令来实现基本的文本转语音的功能。

比如将“hello,everyone!"转化为mp3音频,命令如下:

edge-tts --text "hello,everyone!" --write-media hello.mp3

如果想播放带有字幕的内容,需注意要安装mpv命令行播放器,可以通过edge-playback命令执行:

edge-playback --text "hello,everyone!"

edge-tts可以选择300多种声音,支持中文、英语、法语、日语等40多种语言。

如果我们还想使用不同的声音来合成音频,通过命令行edge-tts --list-voices

根据上面的查询结果,我们可以看到Name表示声音的名字,其中zh表示中文,CN表示中国地区,en表示英文,EG表示埃及地区。

我们可以用一个中国的中文女音来合成一个音频,下面是运行命令:

edge-tts --voice zh-CN-shaanxi-XiaoniNeural --text "你好,这是中文语音库的测试案例。" --write-media test-female-ch-1.mp3 --write-subtitles test-female-ch-1.vtt

如果我们还想调整音量、语速和音调,我们可以通过下面的命令进行调试,比如,降低50%的音量,命令如下:

edge-tts --volume=-50% --voice zh-CN-shaanxi-XiaoniNeural --text "你好,这是中文语音库的测试案例。" --write-media test-female-ch-2.mp3 --write-subtitles test-female-ch-2.vtt

降低50%的语速,命令如下:

edge-tts --rate=-50% --voice zh-CN-shaanxi-XiaoniNeural --text "你好,这是中文语音库的测试案例。" --write-media test-female-ch-3.mp3 --write-subtitles test-female-ch-3.vtt

降低50%的音调,命令如下:

edge-tts --pitch=-50Hz --voice zh-CN-shaanxi-XiaoniNeural --text "你好,这是中文语音库的测试案例。" --write-media test-female-ch-4.mp3 --write-subtitles test-female-ch-4.vtt

2、python接口调用方式:

我们除了命令,还可以通过python接口进行读取文件内容转语音。

import edge_tts

import asyncio

text= ""

with open('test-ch.txt', 'rb') as f:

data = f.read()

text = data.decode('utf-8')

print(“text: ”, text)

voice = 'zh-CN-shaanxi-XiaoniNeural'

output_result = 'test.mp3'

rate = '-50%'

volume = '-50%'

pitch = '-50Hz'

async def my_function():

tts = edge_tts.Communicate(text=TEXT, voice=voice, rate=rate, volume=volume, pitch=pitch )

await tts.save(output_result )



if __name__ == "__main__":

    asyncio.run(my_function())

、总结

Edge-tts作为一个便捷高效的文本转语音解决方案,打破了传统TTS服务的限制,以零成本的方式为开发者提供了强大且易用的语音合成工具。

无论是进行快速原型验证、构建多语言应用,还是提升用户体验的多媒体内容创作,Edge-TTS都展现了其独特价值。

Edge-tts不仅可以作为一个独立的工具使用,还可以成为构建更复杂系统的一部分,为各种应用提供强大的语音合成能力。
 

未完......

更多详细的欢迎关注:杰哥新技术
 

标签:ch,微软,tts,text,edge,--,Edge,test
From: https://blog.csdn.net/m0_71062934/article/details/139755345

相关文章

  • 部署hyperledger fabric的简单生产网络
    步骤一:搭建TLS-CA服务器证书颁发机构配置。作为整体决策的一部分,你必须决定你的peer节点(有多少,每个通道有多少等等)和你的排序服务(有多少节点,谁将拥有它们),你还必须决定你的组织的CA(译者注:证书颁发机构,下同)节点如何被部署。生产网络应该使用传输层安全性(TLS),这将需要设置......
  • 知识库的创建(1) - KnowledgeFile文件加载和分割
    文章目录前言一、类的初始化方法`__init__`1.参数解析2.初始化步骤二、方法`file2docs`1.功能2.参数3.步骤三、方法`docs2texts`1.功能2.参数3.步骤四、方法`file2text`1.功能2.参数3.步骤五、方法`file_exist`1.功能2.返回3.方法`get_mtim......
  • 硬核解读KubeEdge基于大模型边云协同的机器人语义分割算法
    本文分享自华为云社区《KubeEdge:基于大模型边云协同的机器人语义分割算法》,作者:云容器大未来。近年来快速发展的视觉大模型(例如SAM)在促进高精度的智能感知方面具有很大的潜力。然而,边缘环境中的资源限制往往会限制这种视觉大模型在本地部署,从而产生相当大的推理延迟,导致难以......
  • 论文阅读:《Chinese Relation Extraction with Multi-Grained Information and Externa
    LiZ,DingN,LiuZ,etal.Chineserelationextractionwithmulti-grainedinformationandexternallinguisticknowledge[C]//Proceedingsofthe57thAnnualMeetingoftheAssociationforComputationalLinguistics.2019:4377-4386.该方法的github实现引言针......
  • 微软OneDrive简介:特点、应用场景、使用方法、注意事项
    还是大剑师兰特:曾是美国某知名大学计算机专业研究生,现为航空航海领域高级前端工程师;CSDN知名博主,GIS领域优质创作者,深耕openlayers、leaflet、mapbox、cesium,canvas,webgl,echarts等技术开发,欢迎加底部微信(gis-dajianshi),一起交流。No.内容链接1Openlayers【入门教程】-......
  • 微软Windows 10系统安全标识符(SID)与Sysprep使用指南
    一、了解SID在Windows操作系统中,安全标识符(SID)是用于唯一标识安全主体(如用户账户、计算机账户等)的字符串。对于域环境中的计算机和用户,SID的生成具有特定的规则。在域中,对象的SID由域范围的SID和具有唯一性的相对标识符(RID)组成,其中RID由域中的RIDMaster分配。工作组计算机和用户......
  • 大模型的忠诚度,字节开发seed-tts,提示词攻击介绍
    一支烟花官网:https://agifun.love智源社区《管理世界》黄甄魏娜梁正丨从三十余年纵向变迁看跨部门数据共享效果的动态演变机制点击阅读原文来源:http://mp.weixin.qq.com/s?__biz=MzU4MzYxOTIwOQ==&mid=2247510245&idx=1&sn=7942001e12be958e8b21a0d2c9de7723&chksm=f......
  • chatTTS系列之-apiServer
    文章目录背景技术方案方案实现安装FastAPI编写一个入口逻辑实现全局只维护一个chat对象生成随机音色合成一个完整音频返回结果总结背景在之前文章中我们对chattts有了一个大致的了解并对webui进行了一定的优化。然而,还有很多情况下我们还需要进行api调用。gradio......
  • 提醒:网站使用微软雅黑字体的三种方式,两种侵权,一种不侵权。
    大家都知道微软雅黑是windows系统的默认字体,但是不知道微软雅黑的版权归属方正字体,而且方正字体仅仅授权了微软在windows系统中使用该字体,脱离了windows使用,那是极易中招的,网页字体使用是前端开发的工作之一,贝格前端工场带领大家看看如何正确使用微软雅黑字体。一、微软雅黑......
  • 视频生成模型 Dream Machine 开放试用;微软将停止 Copilot GPTs丨 RTE 开发者日报 Vol.
       开发者朋友们大家好: 这里是「RTE开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE(Real-TimeEngagement)领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编......