首页 > 其他分享 >OpenAI的离线音频转文本模型 Whisper 的.NET封装项目

OpenAI的离线音频转文本模型 Whisper 的.NET封装项目

时间:2023-04-24 10:24:27浏览次数:53  
标签:语音 Whisper 模型 离线 OpenAI https whisper 文本

whisper介绍

Open AI在2022年9月21日开源了号称其英文语音辨识能力已达到人类水准的Whisper神经网络,且它亦支持其它98种语言的自动语音辨识。 Whisper系统所提供的自动语音辨识(Automatic Speech Recognition,ASR)模型是被训练来运行语音辨识与翻译任务的,它们能将各种语言的语音变成文本,也能将这些文本翻译成英文。

whisper的核心功能语音识别,对于大部分人来说,可以帮助我们更快捷的将会议、讲座、课堂录音整理成文字稿;对于影视爱好者,可以将无字幕的资源自动生成字幕,不用再苦苦等待各大字幕组的字幕资源;对于外语口语学习者,使用whisper翻译你的发音练习录音,可以很好的检验你的口语发音水平。 当然,各大云平台都提供语音识别服务,但是基本都是联网运行,个人隐私安全总是有隐患,而whisper完全不同,whisper完全在本地运行,无需联网,充分保障了个人隐私,且whisper识别准确率相当高。


语言模型文件:https://huggingface.co/ggerganov/whisper.cpp 或者 https://github.com/ggerganov/whisper.cpp

image

ggml-*.bin则中英文都可以翻译,根据自己对文字的精确要求选择模型,small、medium基本够用。高要求可以使用large,但耗时会多一点。

这么好的一个模型在.NET 社区有很多封装的项目:


下面我们体验一下这个开箱即用的工具Whisper,从https://github.com/Const-me/Whisper 下周最新的版本:

1682301496791

运行起来,从Hugging Face 下载模型,

image

选择转化的语言、音频路径、文本类型、文本保存位置,运行一段时间后,打开后就可以看到文本内容了


 image

实测medium模型:20min音频,大致耗时20~30min,这个效果是很不错了。

image

可以很容易将这个模型集成到自己开发的系统里。

标签:语音,Whisper,模型,离线,OpenAI,https,whisper,文本
From: https://www.cnblogs.com/shanyou/p/17348602.html

相关文章

  • OpenAI的子词标记化神器--tiktoken 以及 .NET 支持库SharpToken
    经过Tokenize之后,一串文本就变成了一串整数组成的向量。OpenAI的 Tiktoken 是更高级的Tokenizer,编码效率更高、支持更大的词汇表、计算性能也更高。OpenAI在其官方GitHub上公开了一个开源Python库:tiktoken,这个库主要是用力做字节编码对的。字节编码对(BytePairEncoder......
  • 离线询问
    -https://ac.nowcoder.com/acm/contest/54877/D观察题目,以猫猫的友善值为横坐标,与猫猫期望的友善值为纵坐标,则人类的友善值为纵坐标,期待的友善值为横坐标问题就转换为了求猫猫坐标左上角的最左上的人类坐标点对猫猫以坐标形式排个序,遍历每个猫猫,在遍历过程中维护最左上角的人......
  • DataX-阿里开源离线同步工具在Windows上实现Sqlserver到Mysql全量同步和增量同步
    场景Kettle-开源的ETL工具集-实现SqlServer到Mysql表的数据同步并部署在Windows服务器上:https://blog.csdn.net/BADAO_LIUMANG_QIZHI/article/details/119891674上面讲过Kettle的使用,下面记录下阿里开源异构数据源同步工具DataXDataXDataX是一个异构数据源离线同步工具,致力......
  • VS2019离线下载安装
    移步https://learn.microsoft.com/en-us/visualstudio/install/create-a-network-installation-of-visual-studio?view=vs-2019#download-the-visual-studio-bootstrapper-to-create-the-network-layout安装步骤......
  • mac elasticsearch tar.gz 离线安装
    1、解压elasticsearch-8.6.2-darwin-x86_64.tar.gz2、需要高版本jdk,大于jdk8,我装的是jdk173、进入解压文件夹bin目录,双击elasticsearch文件,或者bin目录下命令行之行 elasticsearch4、稍微等待,显示 5、浏览器访问https://localhost:9200/ 上图elastic和zqi4S2s80n7bzdgZZ......
  • 冰橙GPT提供开放接口 。提供与OPENAI官方一致的体验效果(同步返回数据,同时支持流式及非
    冰橙GPTchatGPT开放接口使用说明 【接入了腾讯云内容安全检测】冰橙GPT稳定提供API接口服务定时有人进行问题排查处理1小时内问题响应接入了腾讯云的内容安全检测有任何疑问请加入QQ交流群:310872519           1.请求地址:https://gpt.bcwhkj.cn/a......
  • Centos7 离线安装指定版本 redis
    1、本次安装redis7,官方网站 https://redis.io/download/2、安装gccyuminstall-ygcc3、解压tarzxvfredis-7.0.11.tar.gz-C/usr/local/4、编译cd/usr/local/redis-7.0.11/make5、测试,然后安装maketestmakeinstallprefix=/usr/local/redis 6、环境变......
  • centos7 离线安装infuxdb 2.4
    1、influxdb官网下载 https://mirrors.tuna.tsinghua.edu.cn/influxdata/yum/el7-x86_64/2、安装rpm包yuminstall-yinfluxdb2-2.4.0.x86_64.rpm3、启动systemctlenableinfluxdb&&systemctlstartinfluxdb 4、在当前版本中,influx客户端从influxdb的安装包中分......
  • 我的OpenAI库发布了!!!
    chatGPT正式发布已经有段时间了,这段时间我也深度体验了chatGPT的魅力。OpenAI除了提供网页版的chatGPT,还通过api的形式提供了很多其它服务,包括文字纠错、图片生成、音频转换等等。作为程序员,即使有现成的openai库,但还是免不了想自己造轮子,所以就有这个openai库。当前这个库刚刚......
  • Windows 离线安装Microsoft Store中的应用
    准备工作这个地址主要是用于下载Microsoft应用的离线安装包https://store.rg-adguard.net/微软应用商店地址https://apps.microsoft.com/store/apps以TranslucentTB为例子https://apps.microsoft.com/store/detail/translucent-tb%E6%B1%89%E5%8C%96/9P16GBJP9L6Z?hl=zh-......