首页 > 其他分享 >kaldi训练模型的过程

kaldi训练模型的过程

时间:2022-10-09 14:44:46浏览次数:61  
标签:训练 egs 创建 模型 kaldi XX 文件夹 trunk

整理一下训练新模型的过程:
1.进 入 到 kaldi-trunk/egs目录下创建XX(看你心情随便命名)文件夹,然后在文件夹里创建一个audio文件夹,在audio文件夹内在创建两个文件夹train和test。然后把所有的音频文件(.wav文件)放到train和test内(根据你的需求选择测试集和训练集,我是两个文件夹里面都是放的一样的)
2.在XX文件夹下面创建一个文件夹data,在data里面建立test和train文件夹。然后分别在文件夹里面构建以下几个文档:
1)spk2gender 这个文档表明说话人的性别
2)wav.scp
3)test
4)utt2spk
(注意,在train和test里面都要有这些文件)
3.在data文件夹下面创建另外一个文件夹local,在local文件夹创建一个文件corpus.txt
这几个文件的作用还有例子在百度搜索“在kaldi工具包使用小数字语料库创建一个简单的ASR系统”这篇文章可以看到,这里就不在赘述。我的这些文档是在windows下整理的,如果有时间,再整理一个文档来进行说明。
4.在local文件夹下创建一个新的文件夹‘dict’.在dict下创建文件:
1)lexicon.txt
2)nonsilence_phones.txt(你工程中所有的非静音因素)
3)silence_phones.txt(这里面是静音音素)
4)optional.txt
这几个文件的创建方法也在上面说的文章里面有介绍。1)2)两个需要按照你工程实际需要的音素表来写,需要自己生成音素表。
5.在 kaldi-trunk/egs/wsj/s5 目录下拷贝出两个文件夹(注意拷贝所有内
容):‘utils’和‘steps’,并把它们放在你的 kaldi-trunk/egs/XX 目录下
6.安装srilm(这个自行百度就行)
7.在目录 kaldi-trunk/egs/XX 目录下创建一个名为‘conf’的文件夹。
在 kaldi-trunk/egs/XX/conf 目录下创建两个文件:
1)decode.config
2)mfcc.conf(这个文件需要根据你的需要加一些,我这次加了一句采样率的 --sample-frequency=16000)
8. 在 kaldi-trunk/egs/XX目录下创建 3 个脚本:
1)cmd.sh
2)path.sh
3)run.sh
脚本根据实际情况来修改吧,主要是修改一些路径的问题,最后就是运行脚本了。
我相信,没有几个能一次就运行成功的,总是会出现一些莫名其妙的错误。
如果,你和我一样,是在windows下面整理的数据直接拷贝过来的。那么,你要注意对因素表里面的内容进行排序。排序之后会生成一个空行,需要删除。把所有拷贝过来的文档都要另存为unix/linux格式的。一定要特别注意路径的问题,各个地方的路径问题,只要不是你手动输入的,都要注意。
如果运行脚本之后有错误,可以到exp下的log文件夹中去查看错误,然后针对性的修改。
————————————————
版权声明:本文为CSDN博主「Championvas」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/Championvas/article/details/81169785

标签:训练,egs,创建,模型,kaldi,XX,文件夹,trunk
From: https://www.cnblogs.com/wcxia1985/p/16772043.html

相关文章

  • 中文语义相似度匹配模型
       zhaogaofeng611/TextMatch:基于Pytorch的,中文语义相似度匹配模型(ABCNN、Albert、Bert、BIMPM、DecomposableAttention、DistilBert、ESIM、RE2、Roberta、SiaGRU......
  • NET中数据模型Model和数据传输对象DTO的区别
    数据模型Model主要处理业务逻辑,不可以用于数据传递使用数据模型的缺点:直接向前端返回数据模型,会暴露系统的业务核心。而使用dto的时候可以屏蔽我们不希望暴露的核心业......
  • 插件化编程之WebAPI统一返回模型
    WebApi返回数据我们一般包裹在一个公共的模型下面的,而不是直接返回最终数据,在返回参数中,显示出当前请求的时间戳,是否请求成功,如果错误那么错误的消息是什么,状态码(根据业务......
  • C# EF 模型转DataTable
    1///<summary>2///EF模型转换为Datatable3///</summary>4///<typeparamname="T"></typeparam>5///<paramname="list"></param>6///<returns></r......
  • 国内外AI绘画『文生图』大模型效果对比
     最近AI作画确实很火,在DALL-E和Imagen崭露头角之后,ERNIE-ViLG、Stable-Diffusion(SD)、Disco-Diffusion相继开源开放,涌现出丰富多彩的AI作画作品。本次通过一个开源工具来整......
  • 模型文件pt/pth/plk的区别
    参考链接:https://zhuanlan.zhihu.com/p/422797058https://blog.csdn.net/qq_27009517/article/details/111272115......
  • 插件化编程之WebAPI统一返回模型
      WebApi返回数据我们一般包裹在一个公共的模型下面的,而不是直接返回最终数据,在返回参数中,显示出当前请求的时间戳,是否请求成功,如果错误那么错误的消息是什么,状态码(根......
  • 数字经济总体框架模型
    ,即以新型基础设施为底座,以数字产业化和产业数字化为核心,以数字化治理为保障,以数据价值化为引领。......
  • 深度探索C++对象模型 pdf
    高清扫描版下载链接:https://pan.baidu.com/s/1lcioBQey_wZamaRo8WLLhA点击这里获取提取码 ......
  • java内存模型分析
    通过代码分析java内存模型,执行代码:publicclassPerson{Stringname;intage;publicvoidshow(){System.out.println(name);}pu......