音频转文字

音频转文字

时间：2023-09-26 15:33:52浏览次数：44

标签：文字 git install whisper 音频 https pip ffmpeg

安装环境

# on Ubuntu or Debian
sudo apt update && sudo apt install ffmpeg

# on Arch Linux
sudo pacman -S ffmpeg

# on MacOS using Homebrew (https://brew.sh/)
brew install ffmpeg

# on Windows using Chocolatey (https://chocolatey.org/)
choco install ffmpeg

# on Windows using Scoop (https://scoop.sh/)
scoop install ffmpeg

pip install -U openai-whisper
pip install git+https://github.com/openai/whisper.git 
pip install --upgrade --no-deps --force-reinstall git+https://github.com/openai/whisper.git
pip install setuptools-rust

示例代码

import whisper
model = whisper.load_model("large")
prompt = f'提示内容'
result = model.transcribe(audio_save_path, initial_prompt=prompt)
print("result:",result["text"])

标签：文字,git,install,whisper,音频,https,pip,ffmpeg
From： https://www.cnblogs.com/pythonywy/p/17730215.html

在线直播系统源码，取CTreeCtrl控件选中节点的文字
在线直播系统源码，取CTreeCtrl控件选中节点的文字 voidCAboutDlg::OnSelchangedTree1(NMHDR*pNMHDR,LRESULT*pResult) {NM_TREEVIEW*pNMTreeView=(NM_TREEVIEW*)pNMHDR;//TODO:Addyourcontrolnotificationhandlercodehere MessageBox(m_tree1.GetIte......
【ElementUI】ElementUI Tooltip 根据内容判断是否显示、文字提示自定义样式
【ElementUI】ElementUITooltip根据内容判断是否显示、文字提示自定义样式封装组件自定义内容<template><spanv-if="['',null,undefined].indexOf(content)===-1"><el-tooltip:content="content"effect="light"placement="bot......
python+Tesseract OCR实现截屏识别文字
文章目录一、tesseract-ocr下载安装1、下载2、安装tesseract-ocr（1）选择语言（2）开始安装（3）同意许可（4）选择安装的用户（5）选择附带要安装的语言包（6）安装位置（7）开始安装（8）安装完成3、安装语言包（1）下载安装（2）测试二、python截屏识别文字1、安装必须的包2、截屏识别文字3、准确度参考资料一、tesser......
小星星直播去重播放器更新至V1.14版本，新增片头设置和视频倍速播放设置，搭配本身的视频
小星星去重播放器更新V1.14版本，增加倍速播放，片头10秒静音以及片头60秒0.8倍速慢放，优化左箭头重新播放，优化鼠标隐藏，让你的直播间更稳定，下面是小星星的详细介绍！1、视频设置，在播放列表里面打开预览窗口（注意预览窗口只支持MP4格式的视频，其余格式需要设置完成以后打开视频播放窗口）（1）......
355_OCR识别文字，这款小工具免费又快速，还有更多功能
这是一篇原发布于2020-02-0412:32:00得益小站的文章，备份在此处。前言你是不是遇到过这样的问题？想复制文库资料却提示需要vip软件报错却只能手打提示来百度想要复制图片里的图片，想要提取PDF里的某段文字，想要...这些问题今天只需要一个小工具即可解决，一起来看看。......
For The Music为音乐而生！——音频世家索尼举办2023分享交流会
9月22日，“2023索尼音频分享交流会”在上海BEACHNO.11音乐艺术空间完美落幕。这是一场融合索尼工匠精神、业内领先的索尼黑科技及解密产品研发背后故事的交流盛宴，同时展示了索尼在音乐生态领域的综合实力——从创作、录制制作、到版权发行、播放聆听——浸润音乐领域已经有70余年历......
Win11用微软拼音输入法，打出繁体中文字
Win11用微软拼音输入法，打出繁体中文字https://www.bilibili.com/video/BV1yS4y1i7C5/?vd_source=9bfc54d2ed901f1eab04708cc346c2f5......
从安卓模拟器中获取 expo-av 库录音得到的音频文件 file:///data/user/0/mo.com.nccl.
在使用expo-av录制音频时，录制结束通过recording.getURI()可以获取得到的音频文件的地址。想要获取该文件可以通过发送请求的方式：consturi=recording.getURI();letresponse=awaitfetch(uri);letblob=awaitresponse.blob();如果想直接根据文件路径找到这个文......
请问为什么加载标签文字的时候，导致页面上出现卡顿？
加载标签文字导致页面卡顿的问题可能与多种因素有关。这些因素可能包括页面结构、网络请求、浏览器性能、脚本执行等。以下是一些可能导致页面卡顿的原因以及解决方法：大量DOM元素：如果页面包含大量的DOM元素，加载和渲染这些元素可能导致页面卡顿。解决方法包括减少DOM元素数量，使用虚......
第5天结构体、文字显示与GDT
结构体获取启动信息我们需要获取我们之前使用ashead.asm设置的启动信息，以便于我们之后的开发这些启动信息我们利用指针，定义指针,根据指针地址就能获取到定义的值，如下所示:char*Scrnx=0x0ff4;char*Scrny=0xff6;char*vram=0x0ff8;试用结构体但是这......

安装环境

示例代码

相关文章

赞助商

阅读排行