首页 > 其他分享 >语音识别—kaldi常用文件查看指令

语音识别—kaldi常用文件查看指令

时间:2024-03-20 15:45:50浏览次数:21  
标签:src copy -- kaldi 指令 ark 语音 txt

https://blog.csdn.net/weixin_44885180/article/details/115212173?ops_request_misc=&request_id=&biz_id=102&utm_term=copy-feats:%20command%20not%20found&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduweb~default-1-115212173.142^v99^pc_search_result_base1&spm=1018.2226.3001.4187

1. ark特征文件
copy-feats 可以用来改变特征数据的格式,因此可以转换ark格式文件为txt格式:
用法: copy-feats [options]

例子:
先查找copy-feats的目录(每个人可能不一样):

`find /home/speech.AI/kaldi/ -name` `copy-feats`
1
得到copy-feats的目录:

/home/speech.AI/kaldi/src/featbin/copy-feats
1
然后执行指令:
~/kaldi/src/featbin/copy-feats ark:foo.ark ark,t:foo.txt
ark存的是二进制文件,该指令为复制ark文件至txt文件下。

2. FST文件
查找fstprint的目录(每个人可能不一样):find /home/speech.AI/kaldi/ -name fstprint
得到fstprint所在目录:

/home/speech.AI/kaldi/tools/openfst-1.6.7/src/bin/.libs/fstprint
/home/speech.AI/kaldi/tools/openfst-1.6.7/src/bin/fstprint
/home/speech.AI/kaldi/tools/openfst-1.6.7/bin/fstprint
1
2
3
使用fstprint打印fst为文本格式:
~/kaldi/tools/openfst-1.6.7/bin/fstprint --isymbols=phones.txt --osymbols=words.txt L.fst L.txt

同理可以查看pdf格式的图:

fstdraw [--isymbols=phones.txt --osymbols=words.txt] L.fst | dot –Tps | ps2pdf – L.pdf
1
例子:

~/kaldi/tools/openfst-1.6.7/bin/fstdraw --isymbols=phones.txt --osymbols=words.txt HCLG.fst
1
3. mdl模型文件
**gmm模型查看指令: **gmm-copy [options]
如:gmm-copy --binary=false 1.mdl 1.txt

实例:
查找gmm-copy的目录:find /home/speech.AI/kaldi/ -name gmm-copy
得到gmm-copy所在目录(每个人可能不一样):/home/speech.AI/kaldi/src/gmmbin/gmm-copy

~/kaldi/src/gmmbin/gmm-copy --binary=false final.mdl final.txt
1
dnn模型查看用nnet-copy:

~/kaldi/src/nnetbin/nnet-copy --binary=false 0.mdl final.txt
1
4. 决策树文件
转化为文本格式指令为:copy-tree [--binary=false] <tree-in> <tree-out>
如:

copy-tree [--binary=false] tree tree.txt>
1
转化为图形格式指令为:draw-tree [options] <phone-symbols> <tree>
如:

draw-tree phones.txt tree | dot -Gsize=8,10.5 -Tps | ps2pdf - tree.pdf
1
5. ali.gz对齐文件
对齐文件可以通过copy-int-vector查看:

copy-int-vector [options] (vector-in-rspecifier) (vector-out-wspecifier)
1
实例:

~/kaldi/src/bin/copy-int-vector "ark:gunzip -c ali.1.gz|" ark,t:ali.txt
1
也可以先解压,然后用show-alignments查看 :

show-alignments [options] <phone-syms> <model> <alignments-rspecifier>
1
实例:

~/kaldi/src/bin/show-alignments phones.txt final.mdl ark:ali.1 > ali.1.txt
1
类似的有: ali-to-phones, copy-int-vector

查看phone级别的
ali-to-phones --per-frame=true final.mdl ‘ark:gunzip -c ali.1.gz|’ ark,t:- | /opt/kaldi/egs/wsj/s5/utils/int2sym.pl -f 2- phones.txt > ali.1.gz.phone.frame

参考:https://blog.csdn.net/chinatelecom08/article/details/81252140
————————————————

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

原文链接:https://blog.csdn.net/weixin_44885180/article/details/115212173

标签:src,copy,--,kaldi,指令,ark,语音,txt
From: https://www.cnblogs.com/wcxia1985/p/18085378

相关文章

  • linux常见操作指令
    free-查看内存使用使用概况-m以MB的形式-h以GB的形式df-查看磁盘空间-h以可读性良好的方式显示大小pwd-打印当前路径cp-复制指令mv-移动指令mkdir-创建目录/文件夹rmdir-删除文件夹(只能是空文件夹)rm-删除文档-rf删除文件夹to......
  • [BX]和loop指令
    文章目录[BX]和loop指令1[bx]2Loop指令3在Debug中跟踪用loop指令实现的循环程序4Debug和汇编编译器Masm对指令的不同处理5loop和[bx]的联合应用6段前缀7一段安全的空间8段前缀的使用[BX]和loop指令1[bx]我们用[bx]表示一个内存单元,它的段地址默认在ds中,它......
  • Vue2(五):收集表单数据、过滤器、自定义指令、Vue的生命周期
    一、收集表单数据爱好:学习<inputtype="checkbox"value="study"v-model="hobby">打游戏<inputtype="checkbox"value="games"v-model="hobby">吃饭<inputtype="checkbo......
  • 【工程应用九】再谈基于离散夹角余弦相似度指标的形状匹配优化(十六角度量化+指令集加
    继去年上半年一鼓作气研究了几种不同的模版匹配算法后,这个方面的工作基本停滞了有七八个月没有去碰了,因为感觉已经遇到了瓶颈,无论是速度还是效率方面,以当时的理解感觉都到了顶了。年初,公司业务惨淡,也无心向佛,总要找点事情做一做,充实下自己,这里选择了前期一直想继续研究的基于......
  • Redis第三弹,定时删除1.优先级队列(堆)2.基于时间轮实现的定时器​编辑Type指令(返回key对
    目录定时删除1.优先级队列(堆)2.基于时间轮实现的定时器​编辑Type指令(返回key对应的数据类型)redis的数据类型hsetkeyfieldvalue(这里是使用hash作为数据结构)小结定时删除redis并未实现定时器的方式,实现定时器的方式,实现过期key删除,若多个key过期,也可通过一个......
  • linux 系统指令
    linux系统指令常识~用户家路径/盘符路径查询指令pwd #当前工作目录ps #当前进程ls #显示当前目录下的文件列表ls-a #显示隐藏目录ls-R #递归显示目录中的内容ls-t #显示当前目录下的文件列表,按时间排序ls-l #显示详细信息ls-F #显示......
  • Linux基础指令学习(ubunt)
            现如今,Linux系统在服务器、嵌入式系统、移动设备等领域得到广泛应用,掌握Linux技能可以让你在各种领域都有发展机会。而且Linux系统是开源的,拥有庞大的开发者社区支持,学习Linux可以让你接触到开源文化,获取更多的资源和支持,在一套硬件上只能同时运行一个操作系......
  • 数字人解决方案— SadTalker语音驱动图像生成视频原理与源码部署
    简介随着数字人物概念的兴起和生成技术的不断发展,将照片中的人物与音频输入进行同步变得越来越容易。然而,目前仍存在一些问题,比如头部运动不自然、面部表情扭曲以及图片和视频中人物面部的差异等。为了解决这些问题,来自西安交通大学等机构的研究人员提出了SadTalker模型......
  • 指令系统
    流水线时间计算流水线周期:指令分成不同执行段,用时最长的就是流水线周期流水线执行时间:1条指令执行总时间+(总指令条数-1)*流水线周期流水线吞吐率计算:指令条数/流水线时间流水线加速比计算:不使用流水线执行时间/使用流水线执行时间(肯定大于1)1s=10^3ms=1......
  • Linux 解压指令
    zip/unzip常见格式-ddir:指定解压缩后的目标目录-l:列出zip文件中的内容,但不解压缩(List)-q:安静模式,不显示解压缩过程(Quiet)-o:覆盖已存在的文件而不询问(Overwrite)-n:不覆盖已存在的文件(Neveroverwrite)-x:排除某一文件(eXclude)查看内容unzip-lroot.zip #列出压缩包......