Whisper

2025-01-10python系列：python whisper语音转文本
pythonwhisper语音转文本pythonwhisper语音转文本PythonWhisper语音转文本实现流程1.准备工作2.导入必要的库3.将语音文件转换为适合识别的格式4.语音转文本整体流程示意图状态图代码解释总结pythonwhisper语音转文本PythonWhisper语
2025-01-08通过whisper制作批量语音数据集
importsubprocessimportosimportwhisperimportzhconvimportjsondeftime2ffmpeg_time(ti):h=int(ti//3600)ti%=3600m=int(ti//60)ti%=60s=int(ti)ms=f'{ti:.2f}'[-2:]returnf'{h:02d}:{m:02d}:{s:02d}.{ms}�
2025-01-07PotPlayer播放器创建有声字幕以及实时字幕翻译
文章目录环境步骤准备创建有声字幕实时字幕翻译参考环境Windows11家庭中文版PotPlayer241216步骤注意：本文中有多个视频截图，虽然是同一时间点，但每次修改了PotPlayer播放器配置后，实际上可能需要重启播放器。使用同一时间点只是为了方便比较。准备下载、安装Pot
2024-12-20GPT 论文作者 Alec Radford 离开 OpenAI，曾参与开发 Whisper；闪极 AI 拍照眼镜支持全天候记录
开发者朋友们大家好：这里是「RTE开发者日报」，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE（Real-TimeEngagement）领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」，但内容仅代表
2024-12-20whisper实时语音转文字
importwhisperimportosdefcheck_file_exists(file_path):ifnotos.path.exists(file_path):raiseFileNotFoundError(f"音频文件不存在:{file_path}")#音频文件路径audio_path=r"D:\视频\temp_audio.wav"#检查文件是否存在check_file_exist
2024-12-09whisper v3 finetune 中文乱码问题的解决方案
最近学习了一下whisper的微调，主要是参考了github上的夜雨飘零大神项目。但是在操作中遇到了微调中文的时候出现了乱码的情况。以下是我这边对于微调过程中中文出现乱码情况的解决方案。出现情况如下图所示：系统环境NAME="CentOSLinux"VERSION="7(Core)"ID="centos"ID_LIKE
2024-12-0812月3日笔记
Al⾳频⼯具4.1Al语⾳转⽂字/⽂字转语⾳通义听悟：Al会议转录和总结⼯具，⽀持⼀键⾼亮要点、智能提炼总结、⾼效记录、整理和共享⾳视频内容。多种字幕，⾃动区分发⾔⼈，总结关键词，议程、摘要、代待事项和问题。通义听悟讯⻜智作：AI⽂字转语⾳、语⾳合成、智能配⾳、Al
2024-12-06.netcore-实现列表数据导出PDF功能
安装Nuget包QuestPDF核心代码publicstaticstringExportPdf(List<LogLoginListDto>list){TextStyletitleStyle=TextStyle.Default.FontSize(36).SemiBold().FontColor(Colors.Blue.Medium);stringfileName=string.Concat("LogLogin-",DateT
2024-12-06数字化基础知识培训（118页PPT）
方案介绍：在当今快速发展的数字化时代，掌握数字化基础知识已成为各行各业从业者不可或缺的技能。为了帮助企业及个人适应这一变革，提升工作效率与竞争力，数字化基础知识培训应运而生。以下是对此类培训的全面简介。随着信息技术的飞速发展，数字化转型已成为企业转型升级的关键路
2024-09-14`ModuleNotFoundError: No module named ‘whisper‘`
/home/shgbitai/pythonworkspace/ai-accompany/venv/bin/python/home/shgbitai/pythonworkspace/ai-accompany/main.pyTraceback(mostrecentcalllast):File"/home/shgbitai/pythonworkspace/ai-accompany/main.py",line3,in<module>impor
2024-09-13Whisper 模型在实时语音转录中有哪些具体的应用场景？
关注我，持续分享逻辑思维&管理思维&面试题；可提供大厂面试辅导、及定制化求职/在职/管理/架构辅导；推荐专栏《10天学会使用asp.net编程AI大模型》，目前已完成所有内容。一顿烧烤不到的费用，让人能紧跟时代的浪潮。从普通网站，到公众号、小程序，再到AI大模型网站。干货满满。学成后可
2024-09-12Whisper技术：引领语音交互新时代
在当今这个数字化时代，人们对于高效、便捷的交互方式的需求日益增长。其中，语音交互作为一种自然、无障碍的沟通方式，正逐渐成为科技发展的前沿领域。而Whisper技术，正是这一领域中的一颗璀璨明星，引领着语音交互迈向新的高度。一、Whisper技术简介Whisper技术是一种基于深度学习的语音
2024-09-06如何本地搭建Whisper语音识别模型
要在本地搭建Whisper语音识别模型，你需要遵循以下步骤，注意Whisper模型是由OpenAI发布的，但基于你的要求，这里将尽可能提供详细的指导：环境准备：首先，确保你的计算机安装了Python，推荐版本为Python3.7或更高。安装必要的深度学习框架，如PyTorch。你可以通过命令行输入以下命令来安
2024-09-04【AIGC】Whisper语音识别模型概述，应用场景和具体实例及如何本地搭建Whisper语音识别模型？
2024-09-03本地搭建 Whisper 语音识别模型实现实时语音识别研究
目录摘要关键词1.引言2.Whisper模型简介3.环境准备4.系统架构与实现4.1模型加载4.2实时音频输入处理4.3实时转录处理4.4程序实现的框架4.5代码实现5.实验与结果6.讨论7.结论参考文献摘要语音识别技术近年来发展迅速，广泛应用于智能家居、智能客
2024-09-02Python Poetry fails to add openai-whisper due to triton installation error
题意：PythonPoetry因Triton安装错误而无法添加openai-whisper。问题背景：soimtryingtouseopenai-whisper.i'musingpoetryasmyenvanddependecymanager.butkeepgettingerrorswhentryingtodownloadit.theerrorigetis,Installingtriton(2.0.
2024-08-29如何本地搭建Whisper语音识别模型
如何本地搭建Whisper语音识别模型如何本地搭建Whisper语音识别模型1.引言Whisper模型简介本地搭建的意义和应用场景应用场景包括但不限于：2.环境准备系统要求Python环境安装依赖库安装3.安装Whisper模型使用pip安装Whisper依赖工具安装（如FFmpeg）权限和兼容性问题处理
2024-08-26如何本地搭建 Whisper 语音识别模型？一文解决
Whisper是OpenAI开发的强大语音识别模型，适用于多种语言的语音转文字任务。要在本地搭建Whisper模型，需要完成以下几个步骤，确保模型在你的设备上顺利运行。1.准备环境首先，确保你的系统上安装了Python（版本3.8到3.11之间）。此外，还需要安装PyTorch，这是Whisper依赖
2024-08-14动手研发实时口译系统
重磅推荐专栏：《大模型AIGC》《课程大纲》《知识星球》本专栏致力于探索和讨论当今最前沿的技术趋势和应用领域，包括但不限于ChatGPT和StableDiffusion等。我们将深入研究大型模型的开发和应用，以及与之相关的人工智能生成内容（AIGC）技术。通过深入的技术解析和实践经验
2024-08-06python 音频处理（2)——提取PPG特征之whisper库的使用（2.1）
提取PPG特征之——whisper库的使用（2.1）1安装对应的包方法一（自用）：直接pip即可：pipinstallopenai-whisper成功后如下图所示方法二：当时用了他这个方法环境直接崩了，已老实condainstall-cconda-forgeffmpegcondainstall-cconda-forgepoetrypoetryinitpoetry
2024-08-01faster whisper部署
我下载的模型是Systran/faster-whisper-large-v3 BTW：V3在huggingface上托管者是systran，而前面的都是GuillaumeKlein然后我看了下这个大佬的github，是苹果法国巴黎工程师，同时是systran的成员，主要贡献是开发了CTranslate2 ，一个用于加速transformers模型推理的组件以下为
2024-07-24fasterWhisper和MoneyPrinterPlus无缝集成
MoneyPrinterPlus之前使用的是各种云厂商的语音识别服务来进行语音的视频和字幕的识别工作。但是很多小伙伴说云服务用不起。那么没办法，MoneyPrinterPlus上线最新版本，支持fasterWhisper本地语音识别模型。赶紧来体验吧。软件准备当然，前提条件就是你需要下载MoneyPrinterPlus
2024-07-17whisper-api语音识别语音翻译高性能兼容openai接口协议的开源项目
whisper-api介绍使用openai的开源项目winsper语音识别开源模型封装成openaichatgpt兼容接口软件架构使用uvicorn、fastapi、openai-whisper等开源库实现高性能接口更多介绍[https://blog.csdn.net/weixin_40986713/article/details/138712293](https://blog.csdn.net