首页 > 其他分享 >音频转文字

音频转文字

时间:2023-09-26 15:33:52浏览次数:39  
标签:文字 git install whisper 音频 https pip ffmpeg

项目地址#https://github.com/openai/whisper

安装环境

# on Ubuntu or Debian
sudo apt update && sudo apt install ffmpeg

# on Arch Linux
sudo pacman -S ffmpeg

# on MacOS using Homebrew (https://brew.sh/)
brew install ffmpeg

# on Windows using Chocolatey (https://chocolatey.org/)
choco install ffmpeg

# on Windows using Scoop (https://scoop.sh/)
scoop install ffmpeg
pip install -U openai-whisper
pip install git+https://github.com/openai/whisper.git 
pip install --upgrade --no-deps --force-reinstall git+https://github.com/openai/whisper.git
pip install setuptools-rust

示例代码

import whisper
model = whisper.load_model("large")
prompt = f'提示内容'
result = model.transcribe(audio_save_path, initial_prompt=prompt)
print("result:",result["text"])

标签:文字,git,install,whisper,音频,https,pip,ffmpeg
From: https://www.cnblogs.com/pythonywy/p/17730215.html

相关文章

  • 在线直播系统源码,取CTreeCtrl控件选中节点的文字
    在线直播系统源码,取CTreeCtrl控件选中节点的文字 voidCAboutDlg::OnSelchangedTree1(NMHDR*pNMHDR,LRESULT*pResult) {NM_TREEVIEW*pNMTreeView=(NM_TREEVIEW*)pNMHDR;//TODO:Addyourcontrolnotificationhandlercodehere    MessageBox(m_tree1.GetIte......
  • 【ElementUI】ElementUI Tooltip 根据内容判断是否显示、文字提示自定义样式
    【ElementUI】ElementUITooltip根据内容判断是否显示、文字提示自定义样式封装组件自定义内容<template><spanv-if="['',null,undefined].indexOf(content)===-1"><el-tooltip:content="content"effect="light"placement="bot......
  • python+Tesseract OCR实现截屏识别文字
    文章目录一、tesseract-ocr下载安装1、下载2、安装tesseract-ocr(1)选择语言(2)开始安装(3)同意许可(4)选择安装的用户(5)选择附带要安装的语言包(6)安装位置(7)开始安装(8)安装完成3、安装语言包(1)下载安装(2)测试二、python截屏识别文字1、安装必须的包2、截屏识别文字3、准确度参考资料一、tesser......
  • 小星星直播去重播放器更新至V1.14版本,新增片头设置和视频倍速播放设置,搭配本身的视频
    小星星去重播放器更新V1.14版本,增加倍速播放,片头10秒静音以及片头60秒0.8倍速慢放,优化左箭头重新播放,优化鼠标隐藏,让你的直播间更稳定,下面是小星星的详细介绍!1、视频设置,在播放列表里面打开预览窗口(注意预览窗口只支持MP4格式的视频,其余格式需要设置完成以后打开视频播放窗口)(1)......
  • 355_OCR识别文字,这款小工具免费又快速,还有更多功能
    这是一篇原发布于2020-02-0412:32:00得益小站的文章,备份在此处。前言你是不是遇到过这样的问题?想复制文库资料却提示需要vip软件报错却只能手打提示来百度想要复制图片里的图片,想要提取PDF里的某段文字,想要...这些问题今天只需要一个小工具即可解决,一起来看看。......
  • For The Music为音乐而生!——音频世家索尼举办2023分享交流会
    9月22日,“2023索尼音频分享交流会”在上海BEACHNO.11音乐艺术空间完美落幕。这是一场融合索尼工匠精神、业内领先的索尼黑科技及解密产品研发背后故事的交流盛宴,同时展示了索尼在音乐生态领域的综合实力——从创作、录制制作、到版权发行、播放聆听——浸润音乐领域已经有70余年历......
  • Win11用微软拼音输入法,打出繁体中文字
    Win11用微软拼音输入法,打出繁体中文字https://www.bilibili.com/video/BV1yS4y1i7C5/?vd_source=9bfc54d2ed901f1eab04708cc346c2f5......
  • 从安卓模拟器中获取 expo-av 库录音得到的音频文件 file:///data/user/0/mo.com.nccl.
    在使用expo-av录制音频时,录制结束通过recording.getURI()可以获取得到的音频文件的地址。想要获取该文件可以通过发送请求的方式:consturi=recording.getURI();letresponse=awaitfetch(uri);letblob=awaitresponse.blob();如果想直接根据文件路径找到这个文......
  • 请问为什么加载标签文字的时候,导致页面上出现卡顿?
    加载标签文字导致页面卡顿的问题可能与多种因素有关。这些因素可能包括页面结构、网络请求、浏览器性能、脚本执行等。以下是一些可能导致页面卡顿的原因以及解决方法:大量DOM元素:如果页面包含大量的DOM元素,加载和渲染这些元素可能导致页面卡顿。解决方法包括减少DOM元素数量,使用虚......
  • 第5天 结构体、文字显示与GDT
    结构体获取启动信息我们需要获取我们之前使用ashead.asm设置的启动信息,以便于我们之后的开发这些启动信息我们利用指针,定义指针,根据指针地址就能获取到定义的值,如下所示:char*Scrnx=0x0ff4;char*Scrny=0xff6;char*vram=0x0ff8;试用结构体但是这......