首页 > 其他分享 >干货贴|免费AI数据标注工具-多功能语音音频标注软件

干货贴|免费AI数据标注工具-多功能语音音频标注软件

时间:2023-09-07 11:38:28浏览次数:31  
标签:文件 AI Praat TextGrid 干货 语音 软件 标注

图像标注实际应用比较广泛,因此前几期我们分享了不少图像标注的内容,不过大家也有反馈希望对文本标注、语音标注有一些学习,小A那么宠粉,必须安排起来。


工欲善其事,必先利其器。

标注工具是数据标注行业的基础,一款好用的标注工具是提升标注效率与产出高质量标注数据的关键。


之前我也分享过图像标注的工具,今天呢,就给大家介绍一款非常好用的语音处理分析软件--Praat。不管是做语音识别的小伙伴还是做标注的小伙伴都可以学习一下,非常好用。


Praat语音学软件

Praat 语音学软件,原名Praat: doing phonetics by computer,通常简称 Praat,是一款跨平台的多功能语音学专业软件,主要用于对数字化的语音信号进行分析、标注、处理及合成等实验,同时生成各种语图和文字报表。


该软件可以跨多个平台使用,在标Windows、Macintosh、 Linux、FreeBSD、Solaris、Chromebook等不同的操作系统。它可以对语音信号进行采集、分析及标注,还可以对其进行滤波和转换。目前,Praat已经成为世界上实验语音学、语言学、语言调查、语言处理等相关领域的研究人员普遍使用的软件。

干货贴|免费AI数据标注工具-多功能语音音频标注软件_干货

标注窗口


Praat可以做哪些事情?

1.频谱分析

2.基频分析

3.强度分析

4.共振峰分析

5.语音标注

6.语音参数调整和合成

7.提前语音数据

8.语音数据的统计分析


是不是非常牛?今天主要是介绍标注语音时的工具使用,所以这里只介绍第五个语音标注。


Praat语音学软件使用


* 导入语音文件

点击 praat —>open —> read from file —> 找到你打开的文件 —> 打开,文件被添加在了praat 中;

干货贴|免费AI数据标注工具-多功能语音音频标注软件_人工智能_02


* 生成 TextGrid 文件


利用Praat进行语音数据标注生成的标注对象是一个后级名为“TextGrid”的文件,它是一种“分段”文件,详细记录了语音的总时长、每一个标注层内所有标注区间的时长及标注内容等信息。


选中要转写的语音文件 —> annotate - —> To TextGrid... —>语音文件分层(三层)如下图—>点击 OK 生成 TextGrid 文件;

干货贴|免费AI数据标注工具-多功能语音音频标注软件_干货_03

干货贴|免费AI数据标注工具-多功能语音音频标注软件_语音_04


* 编辑语音和 TextGrid 文件

按Ctr同时选择wav和对应TextGrid, —> 选择View & Edit开始标注;

同时选中语音文件和 TextGrid 文件View & Edit;如图

干货贴|免费AI数据标注工具-多功能语音音频标注软件_人工智能_05

干货贴|免费AI数据标注工具-多功能语音音频标注软件_数据_06

* TextGrid标注设置

在弹出的TextGrid窗口中,选择File->Preferences,将Show IPA chart给去掉勾选,这样右边不会显示字符表。


Praat标注技巧


· 认识语图上的几个主要特征

如果看不到基频线,共振峰线或者音强线,使用上菜单上的show pitch, show formant, show intersity即可

干货贴|免费AI数据标注工具-多功能语音音频标注软件_语音_07


· 播放音频

【1】按Tab键可以播放音频,Esc键取消

【2】或按下方的灰色时间段也可以播放音频


· 标注分界线

干货贴|免费AI数据标注工具-多功能语音音频标注软件_人工智能_08


·给边界区域添加文字

干货贴|免费AI数据标注工具-多功能语音音频标注软件_人工智能_09

讲到这里也有人说了,全是英文版的,不好理解,标注起来可能会乱的,没关系,Praat也有汉化版,接下来我们就从标注方面看看汉化版的一个操作。


利用Praat做语音标注

干货贴|免费AI数据标注工具-多功能语音音频标注软件_标注_10

干货贴|免费AI数据标注工具-多功能语音音频标注软件_标注_11

干货贴|免费AI数据标注工具-多功能语音音频标注软件_标注_12


干货贴|免费AI数据标注工具-多功能语音音频标注软件_干货_13


注:这里提示一下,软件会有很多快捷键,可以在使用的时候方便大家进行标注。


以上就是Praat在数据标注过程中比较重要的应用及技巧,虽然Praat软件提供了一种语音数据标注的方法,但在标注多段落的长语音时仍存在很大局限性。

另外,对于说话人角色、性别以及语音是否有效等属性,只能通过新建多个标注层来完成对语音的详细标注,这无疑大大降低了工作效率,总而言之,Praat软件可以实现语音数据标注的基本功能,但在处理复杂场景的语音数据标注任务时仍有不足,后面小编会继续给大家介绍其他的免费标注工具。



联系我们

微信公众号:云图智创人工智能产业应用研究院



人工智能产业应用研究院

用场景定义AI·生态推进产业落地,以适应行业、产业结构,社会发展需求趋势和人才紧缺需求变化,打造集产教融合、产业应用人才培养、应用场景开发、产业生态培育、产业项目孵化创投于一体的国际化人工智能应用型产业培育基地。通过搭建人工智能产业链生态平台,推动人工智能技术形成应用于多元化业务场景的行业应用标准,以更完善的 AI产业链生态来促进和推动人工智能产业落地。

标签:文件,AI,Praat,TextGrid,干货,语音,软件,标注
From: https://blog.51cto.com/u_15939388/7395259

相关文章

  • ChatGPT玩法(二):AI玩转Excel表格处理
    前言在线体验智能问答:https://www.topgpt.one你是否还在为记不住Excel的繁琐函数和公式而苦恼?如果是这样,那么不妨试试ChatExcel。即使你对函数一窍不通,也能轻松处理表格。只要你能清楚地描述你的需求,它就可以帮你搞定。此外,ChatExcel的作者还制作了一张工作流程对比图,一眼就能明白......
  • 网易Airtest全新推出:小型便携式集群解决方案!
    此文章来源于项目官方公众号:“AirtestProject”版权声明:允许转载,但转载必须保留原链接;请勿用作商业或者非法用途1.新旧版小型便携式集群大PK先前我们针对中小型企业、工作室等,有推出过一款便携式机柜解决方案,业务同学只需要拎着一个像手提箱那么大的机柜,就可以在各个地方进......
  • ​​if __name__ == '__main__':​​
    if__name__=='__main__':是Python中一个常用的语句块,它的主要作用是在一个Python文件中定义一些代码,这些代码只有在该文件被直接运行时才会被执行,而不会在该文件被作为模块导入到其他文件时执行。这个语句块通常用于定义脚本的入口点。让我们通过一个简单的例子来解释其用......
  • 【JAVA】java.lang.IllegalStateException: Failed to get nested archive for entry
    无脑看:解压后,替换lib里的jar,在本窗口用命令:jar-xvf ***.jar进行打包就行了。 一、背景:替换jar包中lib里的jar包1、在经过360压缩软件打开后进行了替换,运行报错 (PS.有时候不显示日志的时候可以在bat最后加一个pause)2、在经过WINRAR压缩软件进行存储(stor......
  • OperationError: Failed to execute 'setLocalDescription' on 'RTCPeerConnection':
    webRTC报“OperationError:Failedtoexecute'setLocalDescription'on'RTCPeerConnection':Failedtosetlocaloffersdp:Calledinwrongstate:have-remote-offer”异常 翻译过来的意思不应该have-remote-offer状态去设置setLocalDescription。定位到错误的地方,我是......
  • CF1852C Ina of the Mountain
    *2400https://codeforces.com/problemset/problem/1852/C如果没有\(\modk\)的限制的话,我们都会做,因为都是正数,那么\(\sum_i^nd_i>0\),因此,答案即为\(\sum[d_i>0]d_i\)。但是现在多了一个操作,即为区间加\(k\),那么转到差分数组就是\(d_l+k,d_r-k\),且该操作不花费。观察,差......
  • 1360C - Similar Pairs
    C.SimilarPairshttps://codeforces.com/problemset/problem/1360/C"""思路:1.因为n为偶数,所以偶数如果有偶数个的话,那么奇数也有偶数个,正好可以两两配对2.如果偶数为奇数个,那么奇数也是有奇数个,内部消化后多一个奇数和偶数3.剩下的奇数和偶数按相差是1计算,如......
  • ChatGPT驱动下,网站AI客服该如何进步和创新
    在ChatGPT这个AI智能的驱动下,网站AI客服在进步和创新方面有很多潜力。由于GPT模型的强大语言处理能力和智能对话技巧,使得网站AI客服能够更准确和流畅地与用户交互。looklook今天总结了一些网站AI客服智能的进步和创新方向,以供大家参考。网站AI客服进步创新方向1.自然语言理解和生成......
  • 安防监控/视频汇聚/云存储/AI视频智能算法引擎:遛狗AI检测算法详解
    根据最新修订发布的《中华人民共和国动物防疫法》规定:遛狗不栓绳,养狗不办证、未定期接种疫苗等行为都是违法行为。作为一个合格的“铲屎官"出门遛狗一定要牵好狗绳,保护他人和爱犬的安全。但就算法律明文规定,还是有很多人无视法律法规,在外遛狗不牵绳,任其自由活动。在日常管理中,遛狗......
  • 安防监控/视频汇聚/视频云存储EasyCVR平台v3.3版本AI智能分析网关V3接入教程2.0
    TSINGSEE的边缘计算硬件智能分析网关V3内置多种AI算法模型,包括人脸、人体、车辆、车牌、行为分析、烟火、入侵、聚集、安全帽、反光衣等等,可应用在安全生产、通用园区、智慧食安、智慧城管、智慧煤矿等场景中。将网关硬件结合TSINGSEE青犀的视频汇聚/安防监控/视频融合平台EasyCVR......