数据集的标注如下
./baker_waves/000001.wav|sil k a2 #0 ^ er2 #0 p u3 #0 p ei2 #0 ^ uai4 #0 s uen1 #0 ^ uan2 #0 h ua2 #0 t i1 #0 sil eos
./baker_waves/000002.wav|sil j ia2 #0 ^ v3 #0 c uen1 #0 ^ ian2 #0 sp b ie2 #0 z ai4 #0 ^ iong1 #0 b ao4 #0 ^ uo3 #0 sil eos
可见,每一条数据以 sil 开始,以 sil eos结束。每一个字以 #0 结束,短暂停顿用 sp。
元音后面标注声调。
元音辅音分开,例如 “外孙”标注为了“uai4 #0 s uen #0”、“雨村”标注为“v3 #0 c uen1 #0”
w 改为 u ,“玩”标注为 “uan2”,“我”标注为“uo3”.
yu改为 v:“雨”标注为了 “v3”。
y改为 i:“言”标注为了“ian2”、“拥”标注为“iong1”。
标签:16k,标贝,eos,v3,uen1,sil,心得,标注 From: https://www.cnblogs.com/zhaoke271828/p/17046284.html