首页 > 系统相关 >CentOS中部署UniASR-中文方言模型

CentOS中部署UniASR-中文方言模型

时间:2024-06-14 11:01:32浏览次数:12  
标签:中文 cn CentOS modelscope gcc UniASR 语音 识别

一、UniASR语音识别-中文方言-通用-16k-离线(模型部署运行)

根据ModelScope的官方指导文件,ModelScope仅仅支持Python3.7和Python3.8的版本

备注:一开始由于不了解ModelScope的属性,一直是在3.10的虚拟环境下使用,当执行文件时报错需要执行命令行pip install modelscope[audio] -f https://modelscope.oss-cn-beijing.aliyuncs.com/releases/repo.html下载,但是执行下载后一直报错显示包冲突。并且这种报错没办法调和。

1.1、下载UniASR语音识别-中文方言-通用-16k-离线

UniASR(Unified Automatic Speech Recognition)和FunASR(Function-Driven Automatic Speech Recognition)是两种不同的自动语音识别(ASR)系统。

UniASR:统一的ASR系统:UniASR旨在提供一种统一的ASR解决方案,可以适用于多种不同的语音识别任务和应用场景;端到端模型:UniASR可能采用端到端的深度学习模型,能够直接从音频流中识别文本,而无需人为定义特征或中间表示;集成多种技术:可能集成了多种技术,如深度学习、语言模型和声学模型等,以实现更准确和高效的语音识别。

FunASR:功能驱动的ASR系统:FunASR可能更加注重功能的定制和优化,以满足特定的应用需求。它可能根据具体的任务和场景设计不同的功能;灵活的架构:FunASR可能采用更加灵活的架构,允许用户根据需要定制和调整各种功能模块,以实现最佳的性能;针对特定应用场景:FunASR可能专注于某些特定的应用场景,如语音助手、语音搜索、语音识别游戏等,因此它的设计和优化可能更加贴近这些场景的需求。

总的来说,UniASR和FunASR都是用于自动语音识别的系统,但它们的设计理念、架构和应用重点可能有所不同,用户可以根据具体的需求选择适合自己的系统
原文地址:https://modelscope.cn/models/iic/speech_UniASR_asr_2pass-cn-dialect-16k-vocab8358-tensorflow1-offline/summary

根据地址下载对应的模型文件

UniASR 支持CPU和CPU+GPU运行的。

纯CPU运行:UniASR 可能提供基于 CPU 的运行模式,这意味着它可以在没有 GPU 的情况下运行,依靠 CPU 处理器执行语音识别任务。这种模式通常适用于资源受限或无法访问 GPU 的环境,性能可能会受到一定限制。

CPU+GPU运行:UniASR 也可能支持利用 GPU 加速进行运行,从而提高语音识别的速度和性能。通过利用 GPU 的并行计算能力,UniASR 可能会在支持 GPU 的系统上实现更高的吞吐量和更低的延迟。

1.1.1、下载模型文件

获取 UniASR 软件包:

git clone https://www.modelscope.cn/iic/speech_UniASR_asr_2pass-cn-dialect-16k-vocab8358-tensorflow1-offline.git。

model.pb需要手动下载后上传。下载完成后将文件上传到镜像中

环境安装的说明:https://www.modelscope.cn/docs/环境安装

1、创建虚拟环境并激活

conda create -n myj38 python=3.8

conda activate myj38

1.1.2、基于ModelScope进行推理和微调

版本信息:

numpy                    1.24.4

torch                    2.3.1

funasr                   0.8.7

modelscope               1.9.4

1、要安装FunASR可能要安装gcc

安装gcc编译器和相关工具。在CentOS上,gcc通常包含在Development Tools组中,你可以通过命令安装该组:sudo yum groupinstall "Development Tools"(有时需要检查yum是否是最新的sudo yum update,该步骤时间较长,如果安装失败时再执行更新)

等待安装完成后,验证gcc是否成功安装。运行以下命令检查gcc版本:gcc --version

如果安装成功,你应该能看到gcc的版本信息。

2、在语音识别过程中,我们还需要用到CT-Transformer标点-中文-通用-实时模型

iic/punc_ct-transformer_zh-cn-common-vad_realtime-vocab272727

3、创建py文件

from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks
# 定义解码模式
decoding_model = "fast"
# 音频文件路径
audio_file_path = "/home/myj/jiangxi1.wav"
# 创建处理管道,并指定音频文件路径
inference_pipeline = pipeline(
    task=Tasks.auto_speech_recognition,
    model='/home/myj/speech_UniASR_asr_2pass-cn-dialect-16k-vocab8358-tensorflow1-online',
    param_dict={"model": decoding_model, "audio_file_path": audio_file_path}
)
# 执行语音识别,并将结果输出到控制台
transcription = inference_pipeline()
print("Transcription:", transcription)

5、执行结果对比:

江西南昌方言

原语言:乘客你好,欢迎乘坐南昌地铁,上车的乘客请往里走,长得漂亮的,请给小孩、孕妇、老人让座。本次列车开往双港站,The destination double gang,下一站 彭家桥。we’re arriving at Pang ga qiao。下车的乘客请抓紧时间下车。

UNIASR识别结果:

秦康您好,风音沉着南充地铁,送车的乘客强猛都送走,撞了天机狗,抢给细伢子、婆兔狗、还有公公婆婆娘错,本次例子啊开往宋宫在,这个意DABOGONH,AIDANPANGATGERHALHAGHENG,扎西准备。

东北方言

原语言:咱这疙儿眼瞅要降温了,大家出门多注意啊,别杨了二正的到处撒磨,跩一跤,埋了八汰的。工作上也别老突鲁反仗,半拉咔叽的,有点敬业精神。虽说这年头挣点钱都不容易,但也别老买那便宜娄搜的破玩意儿,对自己好点儿。家里头家务活也多干点,别总整得屋里屋外皮儿片儿的,墙上也魂儿画儿的。

UNIASR识别结果:

咱们这里眼看就要降温了,大家出门时候多注意啊,别总到处看,不小心摔倒了会很脏的。工作上呢也别老反复无常的,有一点敬业精神。虽然说大家这个年头赚点钱都不容易,但也对自己好一点儿,买一些贵的好东西。家里头家务活呢也帮忙多干点,别打别总把屋子里弄得很乱墙上也很脏。

咱们这边眼丑就要降温了大家出门多注意啊别着眼泪儿扔了到处撒嘛坐在脚埋了吧台的工作上别老涂了反正八大科技的有点经济竞赛所以说我这年头挣的钱都不容易但你别老买那便宜露头的破板上对自己好点家里头家务活也也多干点别总整那屋里屋里无外皮片的墙上干活画的

音频文件无法上传上去,江西话和东北话是在抖音上找的然后用格式工厂转为wav音频最后上传到服务器上执行的

标签:中文,cn,CentOS,modelscope,gcc,UniASR,语音,识别
From: https://blog.csdn.net/weixin_72954236/article/details/139674575

相关文章

  • 让AI知识触手可及——欢迎访问AIDOCZH.COM AI工具中文文档网站!
    让AI知识触手可及——欢迎访问AIDOCZH.COMAI工具中文文档网站!文章目录让AI知识触手可及——欢迎访问AIDOCZH.COMAI工具中文文档网站!一、网址二、已有工具1、LangChain2、Ollama3、DSPy4、Milvus5、Pycaret6、CrewAI三、后续计划四、建站起因无、展望未来在......
  • 发布中文文档类资源仓库-ChineseDocumentPDF
    引言今天中午,排队打饭间隙,刷到新闻,说是:360AILAB-NLP团队开源了中文论文、研报文档场景的轻量化版式分析模型360LayoutAnalysis。面向中文论文及研报两个场景的轻量化版式分析模型已经开源:Github地址:https://github.com/360AILAB-NLP/360LayoutAnalysis,模型权重huggingface地......
  • 【centos 7设置默认启动方式为无桌面版】
    文章目录步骤1、查看当前启动模式2、更改启动模式为命令行模式3、重启验证设置注意事项:步骤在CentOS7中,设置默认启动方式为无桌面版(即命令行模式)可以通过以下步骤完成:1、查看当前启动模式首先,你可以使用systemctlget-default命令来查看当前的默认启动目标。这......
  • centos7.9部署k8s的几种方式
    目录一、常见的k8s部署方式1、使用kubeadm工具部署2、基于二进制文件的部署方式3、云服务提供商的托管Kubernetes服务4、使用容器镜像部署或自动化部署工具二、使用kubeadm工具部署1、硬件准备(虚拟主机)2、环境准备2.1、所有机器关闭防火墙2.2、所有机器关闭selinux2.3、所有机器......
  • 将 Visual Studio .net 代码注释 英文转为中文
    转化之前:  转换之后 1.官方文档有详细讲解 https://learn.microsoft.com/zh-cn/dotnet/core/install/localized-intellisense2.汉化包下载: https://dotnet.microsoft.com/zh-cn/download/intellisense 3.下载后解压:  4. 导航到.NETIntellisense文件夹......
  • 关于centos6以下yum源失效的问题
    今天偶尔启动了以下长时间未用的云服务器,使用yum安装某些软件,发现报网络延迟的错误Errorsduringdownloadingmetadataforrepository'docker-ce-stable':-Curlerror(28):Timeoutwasreachedforhttps://download.docker.com/linux/centos/8/x86_64/stable/repodata/......
  • DevExpress WPF中文教程:Grid - 如何完成列和编辑器配置(设计时)?
    DevExpressWPF拥有120+个控件和库,将帮助您交付满足甚至超出企业需求的高性能业务应用程序。通过DevExpressWPF能创建有着强大互动功能的XAML基础应用程序,这些应用程序专注于当代客户的需求和构建未来新一代支持触摸的解决方案。无论是Office办公软件的衍伸产品,还是以数据为中心......
  • CP AUTOSAR标准中文文档链接索引(更新中)
    AUTOSAR标准的核心组件包括通信、诊断、安全等,这些组件通过模块化结构进行组织。系统被划分为多个模块,每个模块负责特定的功能。模块之间通过接口进行通信,接口定义了模块之间的交互规则。AUTOSAR标准支持模块的配置,可以根据不同的需求进行定制和优化。应用程序接口通信驱......
  • 【WEEK16】 【DAY2】Dubbo和Zookeeper集成第二部分【中文版】
    2024.6.11Tuesday接上文【WEEK15】【DAY4】Dubbo和Zookeeper集成第一部分【中文版】目录18.Dubbo和Zookeeper集成18.3.测试环境搭建18.3.4.Windows下安装dubbo-admin18.3.4.1.下载dubbo-admin18.3.4.2.解压进入目录18.3.4.3.在项目目录下打包dubbo-admin18.3.4.4.执......
  • 关于IDEA控制台中文乱码问题
    最近我正在尝试把JDK8升级到JDK21。我新建了一个SpingBoot3.3.0的项目,SDK设置为OracleOpenJDK21.0.2,并在main方法中写了一个简单的System.out.println(“你好,世界”),运行后得到一串乱码。按照JDK8的经验,我检查了IDEA的相关配置:1.File->Settings有关encoding的选项已经......