首页 > 其他分享 >Tacotron2语音合成

Tacotron2语音合成

时间:2024-02-16 19:44:06浏览次数:37  
标签:Tacotron2 layer 语音 合成 py Tacotron

Tacotron2语音合成

   

 

 

Tacotron2是由Google Brain提出来的一个语音合成框架.

模型架构:
在这里插入图片描述
机器环境:

在Ubuntu16.04 Ubuntu16.04 GPU GeForce RTX 2080(单个GPU)
TensorFlow1.15 cuda10.0 cudnn7.6.3下完成.

github上有一个Tacotron-2的Tensorflow实现,地址
https://github.com/Rayhane-mamah/Tacotron-2
用上面的开源代码跑Ljspeech数据集,tacotron_train_steps跑了 100000,wavenet_train_steps只跑了130000(默认是500000),声码器用的WaveNet.

 

 

由于机器内存不够跑了几次出现OOM,后来把hparams.py文件里面的参数max_mel_frames由900改为500,tacotron_batch_size由32改成16,outputs_per_step由1改成3,由于tensorflow版本原因,需要将modules.py文件里面的
self._track_checkpointable(layer,name=‘layer’)改成
self._track_trackable(layer,name=‘layer’),否则会报错.
跑了好几天才跑完.

执行命令
python synthesize.py --model ='Tacotron-2’合成语音.

标签:Tacotron2,layer,语音,合成,py,Tacotron
From: https://www.cnblogs.com/wcxia1985/p/18017405

相关文章

  • pytorch深度学习入门(8)之-Torchaudio使用Tacotron2 文本转语音
    https://blog.csdn.net/ajunbin859/article/details/134380417?ops_request_misc=&request_id=&biz_id=102&utm_term=pytorch%E7%89%88%E6%9C%AC%E7%9A%84tacotron%E8%AF%A6%E7%BB%86%E5%AE%89%E8%A3%85%E6%95%99%E7%A8%8B&utm_medium=distribute.pc_search_r......
  • Tacotron2 Inference教程
    https://www.dandelioncloud.cn/article/details/1601780566695559170目录结构本教程实验环境为GoogleColab,文件目录结构如下ALL└──tacotron2├──audio_processing.py├──checkpoint_269000├──data_utils.py├──demo.wav├──distributed.py......
  • Tacotron2(NVIDIA版)训练笔记
    https://blog.csdn.net/qq_44951010/article/details/124828260 Tacotron2项目地址:https://github.com/NVIDIA/tacotron2Tacotron2中文训练笔记:https://blog.csdn.net/qq_44951010/article/details/124830538从科大讯飞爬取音频数据:https://blog.csdn.net/qq_44951010/article/......
  • 成功实现FaceTime语音,FaceTime视频,FaceTime数据筛选,检测手机号是否开通FaceTime的
    FaceTime是苹果公司iOS和macOS(以前称MacOSX或OSX)内置的一款视频通话软件,通过Wi-Fi或者蜂窝数据接入互联网,在两个装有FaceTime的设备之间实现视频通话。其要求通话双方均具有装有FaceTime的苹果设备,苹果ID以及可接入互联网的3G/4G/5G或者Wi-Fi网络。 一、Windows电脑上部署苹......
  • 力扣递归 两道简单题合成一道中等题之148. 排序链表
    递归归并排序,先找到终点,再合并两个链表 给你链表的头结点 head ,请将其按升序排列并返回排序后的链表。 示例1:输入:head=[4,2,1,3]输出:[1,2,3,4]示例2:输入:head=[-1,5,3,4,0]输出:[-1,0,3,4,5]示例3:输入:head=[]输出:[]/** *Definitionforsingl......
  • 完全免费,文字转语音、AI语音合成,视频配音就用这两款软件!
    最近又有不少小伙伴找我要文字转语音、配音软件,刚好最近我也找了两款还比较不错的免费软件,今天就来分享给大家。最后还推荐了一款我自己一直在用的软件,建议认真看看! 01-Vpot-FREE(电脑)它是一款永久免费的文字转语音软件,由B站大佬开发的,无需安装,解压后找到如图文件,双击即可打......
  • 问题:下列关于氨合成的描述正确的是
    问题:下列关于氨合成的描述正确的是A.体积减小的反应B.需要催化剂才可以进行C.反应为可逆反应D.反应为放热反应参考答案如图所示......
  • 问题:糖原合成的关键酶是(),糖原分解的关键酶是()
    问题:糖原合成的关键酶是(),糖原分解的关键酶是()参考答案如图所示......
  • Python文本转语音库:pyttsx3 初识
    1.安装pipinstallpyttsx32.示例#coding=utf-8importpyttsx3text="""在这个例子中,使用三引号可以创建多行字符串,换行符会自动包含在字符串中。请注意,在这些方法中,字符串的换行拼接可以根据需要进行布局,以增强代码的可读性和可维护性。"""engine=pyttsx3.init()......
  • flutter3+dart3聊天室|Flutter3跨平台仿微信App语音聊天/朋友圈
    全新研发flutter3+dart3+photo_view跨多端仿微信App界面聊天Flutter3-Chat。flutter3-chat基于最新跨全平台技术flutter3+dart3+material-design+shared_preferences+easy_refresh构建的仿微信APP界面聊天实例项目。实现发送图文表情消息/gif大图、长按仿微信语音操作面板、图片......