首页 > 其他分享 >98秒转录2.5小时音频,最强音频翻译神器IFW下载部署

98秒转录2.5小时音频,最强音频翻译神器IFW下载部署

时间:2023-12-29 14:33:06浏览次数:38  
标签:翻译 IFW 语言 音频 选择 98 转录

IFW是一款功能强大的音频翻译工具,具备高速转录能力,能在短时间内完成大量音频处理,提高工作效率

以下是IFW在 Nvidia A100 - 80GB 上运行的一些基准测试:

 

最新中文版:https://pan.baidu.com/s/1E_gcymuUT7FsHWq51dlhSQ?pwd=r0p4

 

核心特性

1、自动转录,可快速将长音频文件转录为文本,无需手动逐字逐句

2、支持说话人分割和区分,识别不同说话人,有助于分析和整理多人音频

3、按词或片段生成时间戳文本,方便字幕制作

4、支持100种语言的转录(含粤语)或者翻译成英文

底层框架

Whisper-Large-v3:OpenAI推出的一种用于自动语音识别(ASR)和语音翻译的预训练模型,经过168万小时的标记数据训练,显示出强大的能力,可以在不需要微调的情况下推广到许多数据集和领域

Transformers+Torch+Pyannote:加速转录和语音分段

 

功能说明

 

1、选择操作系统,windows或者苹果系统

2、选择音频文件,不能是视频文件

3、选择输出路径,转录或翻译完成后会生成output.json文件

4、选择音频语言,程序会识别语言也可以手动选择语言,选择与音频不同的语言,生成的结果是选择后的语言

5、输出选择后的语言或翻译成英文

6、选择处理速度,这个值并不是越大越好,博主GTX1660的显卡设置成1最为合适,配置好可以适当调大

7、记录音频形式,按词或片段记录音频,根据自己的需要选择,文件末尾会输出完整的文本

 

 

点击开始按钮,控制台会打印时间进度,程序执行完毕会给出output.json文件的生成路径

 

 

标签:翻译,IFW,语言,音频,选择,98,转录
From: https://www.cnblogs.com/laoaiaishijie/p/17934821.html

相关文章

  • Apple Logic Pro 10.8 - 专业音乐制作 (音频编辑)
    AppleLogicPro10.8-专业音乐制作(音频编辑)LogicPro10.8+MainStage3.6.5(Universal)作者主页:sysin.orgApple升级LogicPro,推出强大工具,提升Mac与iPad音乐创作体验Mac版新功能包括MasteringAssistant、32-bit录音、SampleAlchemy和BeatBreaker,iPad版新......
  • android蓝牙取sbc音频数据
    https://blog.csdn.net/u010481276/article/details/86545272两种方法:方法1:dumpaudio数据Bluedroid协议栈中把bt_target.h中的宏DUMP_PCM_DATA打开,发送到bluetoothHAL层的pcm数据被保存在手机的/data/misc/bluedroid/output_sample.pcm格式。可以用cooleditpro工具分析PCM......
  • Cisco Catalyst 9800 Wireless Controller, IOS XE Release IOSXE-17.13.01 ED
    CiscoCatalyst9800WirelessController,IOSXEReleaseIOSXE-17.13.01EDCatalyst9800系列无线控制器软件请访问原文链接:https://sysin.org/blog/cisco-catalyst-9800/,查看最新版。原创作品,转载请保留出处。作者主页:sysin.orgCatalyst9800系列无线控制器将最佳射频......
  • Cisco Catalyst 9800-CL Wireless Controller for Cloud, Release IOSXE-17.13.01 ED
    CiscoCatalyst9800-CLWirelessControllerforCloud,ReleaseIOSXE-17.13.01ED面向云的思科Catalyst9800-CL无线控制器,专为基于意图的网络全新打造请访问原文链接:https://sysin.org/blog/cisco-catalyst-9800-cl/,查看最新版。原创作品,转载请保留出处。作者主页:sysin.o......
  • P1010 [NOIP1998 普及组] 幂次方(十进制转二进制)(递归)
    P1010[NOIP1998普及组]幂次方个人感想终于能真正自主解决一道纯递归题目了,完成前面那次P1928外星密码的遗憾了十进制转化二进制再处理也顺利搞定(之前洛谷月赛就有相似题目,当时觉得很难就没写,太亏了)十进制转二进制样例:inta[]while(n!=0){ if(n%2==1){ a......
  • 98. 验证二叉搜索树
    给你一个二叉树的根节点 root ,判断其是否是一个有效的二叉搜索树。有效 二叉搜索树定义如下:节点的左子树只包含 小于 当前节点的数。节点的右子树只包含 大于 当前节点的数。所有左子树和右子树自身必须也是二叉搜索树。 示例1:输入:root=[2,1,3]输出:true示例2:输入:root......
  • 《安富莱嵌入式周报》第329期:圣诞前夕,各种软件井喷式更新,开源600Wh的UPS低压电源,各种
    周报汇总地址:http://www.armbbs.cn/forum.php?mod=forumdisplay&fid=12&filter=typeid&typeid=104 圣诞前夕,各种软件井喷式发布新版本视频版:https://www.bilibili.com/video/BV19Q4y1u7Es 1、开源600Wh的UPS低压电源https://pop.fsck.pl/projects/secondlife-ups-Mk......
  • CF983E
    题目传送门解题思路:倍增+树剖+树状数组对于每次询问,我们可以看成是两个点都不断往上跳(如果一个点是另一个点的祖先则是只有一个跳),有一个很明显的贪心策略:每次都跳到能跳到的深度最小的点。然而一次一次往上跳可能被极端数据卡掉,所以要用倍增维护跳\(2^i\)次能跳到哪里。然而......
  • 【工作流记录】音频修复+修音+干音处理
    说明近期比较完整的一条工作流的全程记录,遵循互联网开源精神公开分享,仅对个人有效,不保证在另外机器和项目上也有相同效果。所使用到的软件:唧唧Down:哔哩哔哩视频下载;UltimateVocalRemover:自动音频分离软件;RipXDAW:手动音频分离软件;AdobeAudition:音频处理;FLStudio:音频处......
  • just_audio音频播放器
    代码import'package:flutter/material.dart';import'package:just_audio/just_audio.dart';voidmain(){runApp(MyApp1());}classMyApp1extendsStatelessWidget{finalAudioPlayeraudioPlayer=AudioPlayer();@overrideWidge......