首页 > 编程语言 >基于funasr+pyaudio实现电脑本地麦克风实时语音识别项目语音转文本python实现

基于funasr+pyaudio实现电脑本地麦克风实时语音识别项目语音转文本python实现

时间:2024-07-29 14:00:11浏览次数:19  
标签:麦克风 python pyaudio 实时 语音 识别 FunASR 音频

【框架地址】

https://github.com/modelscope/FunASR

【简单介绍】

FunASR是一个功能全面的语音识别工具包,支持多种预训练模型的推理和微调,提供高精度和高效能的语音识别服务。结合PyAudio库,可以实现电脑本地麦克风实时语音识别项目。

该项目首先通过PyAudio库捕获麦克风输入的音频数据,PyAudio是一个跨平台的音频I/O库,可以方便地访问麦克风等音频设备。捕获的音频数据经过预处理,包括降噪、去除回声等,以提高识别准确率。

随后,使用FunASR中的实时语音识别模型(如Paraformer-zh-streaming)对预处理后的音频数据进行处理。这些模型能够实时地将音频数据转换为文本信息,支持中文等多语言识别。

在识别过程中,FunASR还提供了语音端点检测(VAD)功能,自动检测语音片段的开始和结束,以提高识别效率。同时,还可以添加标点恢复(PR)功能,为识别结果添加标点符号,提升可读性。

最终,识别结果会实时显示在界面上,用户可以通过界面实时查看和编辑识别结果。整个项目流程简洁高效,为实时语音识别应用提供了有力支持。

【测试环境】

anaconda3+python3.9

torch==2.0.1+cu117

funasr==1.1.4

modelscope==1.16.1

PyAudio ==0.2.14

【调用代码】

from FunasrManager import *
fm = FunasrManager()
fm.start()
while True:
    time.sleep(0.2)

【视频演示】

基于funasr+pyaudio实现电脑本地麦克风实时语音识别项目语音转文本python实现_哔哩哔哩_bilibili【测试环境】anaconda3+python3.9torch==2.0.1+cu117funasr==1.1.4modelscope==1.16.1PyAudio ==0.2.14更多信息参考:https://blog.csdn.net/FL1623863129/article/details/140764071, 视频播放量 1、弹幕量 0、点赞数 0、投硬币枚数 0、收藏人数 0、转发人数 0, 视频作者 未来自主研究中心, 作者简介 未来自主研究中心,相关视频:和阿宝去黑子家玩儿咯,【全站最全SD教程】零基础入门到精通SD教程 附带秋叶大神Stable Diffusion安装包 人工智能AIGC绘图 AI绘图 一键出,开源免费的FunASR实时语音识别模型,手把手教你部署和使用,yolox+bytetrack+pyqt5实现目标追踪结果演示,基于yolo-nas+deepsort实现目标追踪视频演示,跪了!GitHub标星122K!!百星仓库—程序界的封神之作 project based learning,自学编程学习指南!,基于tkinter的GUI选择图片选择视频选择摄像头,将yolov8封装成一个类几行代码完成语义分割任务,[暑假大作战]永久免费的云电脑,使用yolov7的onnx模型部署在C#的winform界面开发程序上icon-default.png?t=N7T8https://www.bilibili.com/video/BV1Pb42177Bw/?vd_source=989ae2b903ea1b5acebbe2c4c4a635ee 【源码下载】

https://download.csdn.net/download/FL1623863129/89593855

标签:麦克风,python,pyaudio,实时,语音,识别,FunASR,音频
From: https://blog.csdn.net/FL1623863129/article/details/140764071

相关文章

  • 从Python中的数据框中删除不必要的数据
    所以我这里有一个dat文件,我正在使用Python来读取它。在整个文件中,有一些不必要的行,例如BEGIN等,而我真正想开始阅读的部分是从数据帧开始。因此,我想检查在Python中执行此操作的最佳方法是什么,并且只阅读数据框何时开始?谢谢!以下是使用Python从数据......
  • Python拟合曲线
    拟合曲线多项式拟合np.ployfit(x,y,deg)importmatplotlib.pyplotaspltimportnumpyasnpx=[1,1.5,2,2.5,3,3.5,4,4.5,5,5.5,6,6.5,7,7.5,8]y=[33.40,79.50,122.65,159.05,189.15,214.15,238.65,252.2,267.55,280.50,296.65,301.65,310.......
  • 12个Python数据类型转换实战演练
    文末赠免费精品编程资料~~在Python编程中,数据类型转换是处理数据时必不可少的技能。掌握如何灵活地在不同类型之间转换,能让你的代码更加高效和灵活。下面,我们将通过一系列实战演练,学习并实践12种常见的Python数据类型转换。1.整数转字符串实战案例:将年龄转换为字符串......
  • Python全套教程,小白零基础入门必备!
    Python是一种语法简单、功能强大的编程语言,它注重的是如何高效解决问题。【教程领取方式在文末!!】正是这种简单实用的特性,让Python成为近年来最热门的编程语言之一。Python具有广泛的应用场景,包括:Web开发、数据分析、机器学习、网络爬虫、人工智能、量化交易等众多领......
  • BP神经网络及其Python和MATLAB实现预测
    BP神经网络及其Python和MATLAB实现预测引言BP神经网络(BackPropagationNeuralNetwork),即反向传播神经网络,是一种通过反向传播算法进行监督学习的多层前馈网络。这种网络能够通过不断地调整和改变神经元的连接权重,达到对特定任务的学习和优化。由于其高度的灵活性和适应性......
  • 为什么Python要对引用非容器类型的类型实现循环GC
    检查文档:支持循环垃圾收集Python对检测和收集涉及循环引用的垃圾的支持需要对象类型的支持,这些对象类型是其他对象的“容器”,这些对象也可能是容器不存储对其他对象的引用或仅存储对原子类型(例如数字或字符串)的引用的类型不需要为垃圾收集提供任何显......
  • 如何在 Visual Studio Code 中降级终端中的 python?
    我有一段代码需要运行,但它仅与tensorflow1.3、1.4和1.5兼容。我想我需要降级python才能运行它,但是终端有python3.10我尝试创建虚拟环境失败,但终端仍然说它正在使用python3.10,所以我仍然无法运行代码有什么我可以做的吗?是对的,创建虚拟环境是运行不同Python版本代......
  • python-小李帮老师改错(赛氪OJ)
    [题目描述]老师给小理发了一封电子邮件,任务如下。写一个程序,给你 n 个数,输出 X。X=num1p1​​+num2p2​​+⋯+numnpn​​。                 num1​,num2​,⋯⋯,numn​ 都是整数,p1​,p2​,⋯⋯pn​ 都是一位数。但是出现了一些玄学错误,......
  • 保护从 py2exe python 生成的二进制文件
    我的项目需要将我的python文件转换为py2exe。公平地说,我的py2exe正在工作。假设我的二进制文件名为“test.exe”。我知道我的test.exe包含我的python文件的所有pyc文件。我想要做的是,保护我的text.exe,这样我的源代码就不会被看到,换句话说,我不希望它被反编译回来,我该怎......
  • 从流读取时,PyAudio Stream 导致 Windows 堆损坏(-1073740940 (0xC0000374))
    我在尝试读取PyAudio的Stream时遇到了问题。它因退出代码而崩溃-1073740940这是一个Windows堆损坏错误0xC0000374它发生在我从PyAudio流读取的行中,如下所示:stream.read(chunk_size)我也看到它崩溃了-1073741819ACCESS_VIOLATION_......