- 2024-09-03torchaudio
Torchaudio处理音频数据的PyTorch库,提供了对音频数据的加载、处理、转换等功能,并且与PyTorch深度学习框架紧密集成,可以很方便地将音频数据与神经网络模型结合使用。安装Torchaudio//需要先安装PyTorchpipinstalltorchpipinstalltorchaudio//当出现Couldn’tfind
- 2024-07-30QCustomPlot绘制热力图
绘制的热力图类似以下,后面代码可以直接去使用。//在QCustomPlot中创建图像QCustomPlot*myCustomPlot=newQCustomPlot();ui->verticalLayout->addWidget(myCustomPlot);//向量大小为3787*6132intxMax=6132;intyMax=3787;Ei
- 2024-07-02开源语音转文本 Speech-to-Text 大模型实战之Whisper篇
前言随着深度学习技术的不断发展,语音转文本(Speech-to-Text,STT)技术取得了显著的进步。开源社区涌现了许多高效的STT大模型,为开发者提供了强大的工具。本文将以OpenAI推出的Whisper模型为例,详细介绍如何使用该模型进行语音转文本的实战应用,从模型简介、环境搭建、数据准备到模型
- 2023-10-07Verdi 学习-折叠波形
波形折叠只关注某一段波形可以使用Verdi的波形折叠的功能:Waveform窗口,点击CompressTimeRange输入需要折叠的时间段例:这里折叠2000*100ps至6000*100ps点击insert,添加折叠波形段可以在Waveform中看到如下被折叠的波形如果想要展开,点击加号
- 2023-09-23TorchAudio 2.0.1学习
对于函数而言,在将张量参数传递给函数之前,请将其移到CUDA设备上。例如:cuda=torch.device("cuda")waveform=waveform.to(cuda)spectrogram=torchaudio.functional.spectrogram(waveform)支持CUDA的类是通过torch.nn.Module()实现的。在传递CUDA张量之前,也需要将实例移动
- 2023-08-08windows api录音pcm
pcm.h#pragmaonce#include<cstdio>#include<cstdint>#include<Windows.h>#pragmacomment(lib,"winmm.lib")classpcm{public: pcm(); ~pcm(); voidstartRecording(); voidendRecording();private: structWavPCMFileHead