整理一些工具,方便学习使用
doccano
主要是进行文本处理的
label-studio
比较强大的工具,支持多种数据处理,目前迭代升级也比较快速
audino
进行声音标注的工具,目前不是很活跃了,好久没新的提交信息了
abel-studio-converter
label-studio 提供的通用数据转换服务,可以方便用来快速使用现有的模型
DarkLabel
用来处理视频以及图片标注的,目前不是很活跃,这个工具在老外一个学习视频中有介绍
labelImg
用来进行图片标注的,目前已经合并到label-studio 中了
universal-data-tool
很不错的工具,但是目前维护似乎不是很积极了,支持的数据格式是比较多的
SMART
方便在资源有限的环境进行数据的处理,目前还在维护中,就是star不是很多
说明
同时HumanSignal 团队也在github 上提供了一个方便的集合,整理了不少数据标注工具awesome-data-labeling 很值得看看,
整体来说label-studio 是一个很不错的选择,选择上可以结合自己的业务场景(文件,视频,音频,图片。。。)
参考资料
https://github.com/HumanSignal/awesome-data-labeling
https://github.com/doccano/doccano
https://github.com/HumanSignal/label-studio
https://github.com/midas-research/audino
https://github.com/HumanSignal/label-studio-converter
https://github.com/doccano/awesome-annotation-tools
https://github.com/darkpgmr/DarkLabel
https://github.com/HumanSignal/labelImg
https://github.com/UniversalDataTool/universal-data-tool
https://github.com/RTIInternational/SMART