使用vosk模型进行语音识别

时间：2024-12-26 16:56:38浏览次数：6

标签：wf 0.22 vosk result 语音 rec model 识别

import wave
import sys
import json

from vosk import Model, KaldiRecognizer, SetLogLevel

# You can set log level to -1 to disable debug messages
SetLogLevel(-1)

wf = wave.open(sys.argv[1], "rb")
if wf.getnchannels() != 1 or wf.getsampwidth() != 2 or wf.getcomptype() != "NONE":
    print("Audio file must be WAV format mono PCM.")

    sys.exit(1)

# model = Model(lang="en-us")
# You can also init model by name or with a folder path
# model = Model(model_name="vosk-model-en-us-0.21")
# 设置模型所在路径，刚刚4.1中解压出来的路径   《《《《
# model = Model("model") 
model = Model("../Downloads/vosk-model-small-cn-0.22")

rec = KaldiRecognizer(model, wf.getframerate())
rec.SetWords(True)
# rec.SetPartialWords(True)   # 注释这行   《《《《

str_ret = ""

while True:
    data = wf.readframes(4000)
    if len(data) == 0:
        break
    if rec.AcceptWaveform(data):
        result = rec.Result()
        # print(result)

        result = json.loads(result)
        if 'text' in result:
            str_ret += result['text'] + ' '
    # else:
    #     print(rec.PartialResult())

result = json.loads(rec.FinalResult())
if 'text' in result:
    str_ret += result['text']

print(str_ret)

wf.close()

模型分享：

通过网盘分享的文件：vosk-model-small-cn-0.22.zip
链接: https://pan.baidu.com/s/1FEH1xwDucdC3cEZSAyDOwQ?pwd=k8p5 提取码: k8p5

通过网盘分享的文件：vosk-model-cn-0.22.zip
链接: https://pan.baidu.com/s/1dISCahVsWppnS-bbvyLWEA?pwd=ymgp 提取码: ymgp

通过网盘分享的文件：vosk-model-en-us-0.22.zip
链接: https://pan.baidu.com/s/1z-d1A8wHvBs7m2dpMjYjXQ?pwd=8hg9 提取码: 8hg9

通过网盘分享的文件：vosk-model-ja-0.22.zip
链接: https://pan.baidu.com/s/1eQCEzNvdjnbyLILdu56RDw?pwd=8nhv 提取码: 8nhv

模型下载自https://alphacephei.com/vosk/models

创建于2412261646，修改于2412261646

标签：wf,0.22,vosk,result,语音,rec,model,识别
From： https://www.cnblogs.com/tellw/p/18633496

摄像头挪动角度识别智慧矿山一体机关于智慧矿山系统在全球矿业中的应用情况如何？
随着科技的不断进步，全球矿业正经历着一场智能化的革命。智慧矿山系统的应用，不仅提高了矿业的效率和安全性，还推动了整个行业的可持续发展。本文将探讨智慧矿山系统在全球矿业中的应用情况，并深入分析其技术特点和发展趋势。一、智慧矿山系统在全球矿业中的应用情况如何1、发达国......
HuntBack(反击狩猎)：用于攻防演练中，防守方对恶意ip进行web指纹扫描与识别
#溯源#攻防演练HuntBack(反击狩猎)，用于攻防演练中，防守方对恶意ip进行web指纹扫描与识别应用场景在蓝队职守中，安全设备爆出恶意攻击ip地址，如果对方使用的是自己的服务器，并且搭建了一些安全业务，可使用本工具对目前已知工具进行探测。功能1.红队指纹识别2.ipwhois3.域名whois......
营销场景中，如何让你的短信不被识别为垃圾短信
作者：京东科技贾玉龙摘要：本调研旨在深入研究手机自动识别垃圾短信的逻辑，以便为营销短信不被误判为垃圾短信提供策略。通过分析垃圾短信的特征、现有识别技术和算法，结合用户接受度等因素，探讨如何优化营销短信的内容和发送方式，在合法合规的前提下提高其被用户看到的几率。 ......
水位监测识别摄像机
水位监测识别摄像机是一种利用人工智能技术进行水位监测的智能设备，其作用是监测水体的水位变化并识别潜在的水灾危险，以提供准确数据和及时预警，帮助保护人民生命财产安全。这种摄像机通过高清摄像头实时捕捉水体的图像，然后利用AI算法对水位的变化、波动等进行分析和识别，为防汛救灾......
AI边坡监测识别摄像机
AI边坡监测识别摄像机是一种利用人工智能技术进行边坡监测的智能设备，其作用是及时监测边坡变化并识别潜在的滑坡、崩塌等危险情况，以提供及时预警和采取必要的安全措施。这种摄像机通过高清摄像头实时捕捉边坡的图像，并利用AI算法对边坡的形态、位移等进行分析和识别，有助于减少地质......
AI基坑监测识别摄像机
AI基坑监测识别摄像机是一种利用人工智能技术进行基坑监测的智能设备，其作用是监测基坑工程施工过程中的变化，并识别潜在的风险因素，以提供准确数据和及时预警，确保基坑工程的安全进行。这种摄像机通过高清摄像头实时捕捉基坑工程的图像，然后利用AI算法对基坑的土体稳定性、工程进度等......
【数据集】【YOLO】【目标检测】灭火器识别数据集 3261 张，YOLO灭火器识别算法实战训练
一、数据集介绍【数据集】灭火器识别数据集3261张，目标检测，包含YOLO/VOC格式标注。数据集中包含1种分类：names:['extinguisher']，表示"灭火器"。数据集图片来自国内外网站、网络爬虫、监控采集等；可用于监控和移动设备灭火器识别。检测场景为工业园区、办公大楼、居民楼......
Halcon 0 识别图像的步骤
Halcon识别图像的步骤①基本步骤：图像预处理------》区域分割------》区域筛选------》特征分析、有用信息提取等②图像预处理：图像去噪、图像基本变化、图像增强、图像位置变化等。③区域分割：将感兴趣的区域从原图像中分割出来。包括基于阈值的分割、聚类的分割等等。......
皮带危险区域人员违规闯入识别智慧矿山一体机小知识：如何提升现有监控系统的性能？
随着科技的不断进步，监控系统已成为保障安全、提高效率的关键工具。特别是在矿山等高风险行业，监控系统的性能直接关系到人员安全和生产效率。为了进一步提升现有监控系统的性能，确保其在复杂多变的环境中稳定运行，我们可以从多个维度进行优化和升级。以下是对提升监控系统性能的综合......
发生火灾监测识别摄像机
发生火灾是一种极具破坏性的灾难事件，及时发现火源并迅速扑灭火势对于减少火灾造成的损失至关重要。而发生火灾监测识别摄像机作为一种新型的技术手段，可以通过摄像头和智能识别算法实时监测火灾的发生，对火灾进行准确识别和定位。这种技术在火灾防控、城市安全管理等领域具有广泛的......

使用vosk模型进行语音识别

相关文章

赞助商

阅读排行