Waveform

2024-09-03torchaudio
Torchaudio处理音频数据的PyTorch库，提供了对音频数据的加载、处理、转换等功能，并且与PyTorch深度学习框架紧密集成，可以很方便地将音频数据与神经网络模型结合使用。安装Torchaudio//需要先安装PyTorchpipinstalltorchpipinstalltorchaudio//当出现Couldn’tfind
2024-07-30QCustomPlot绘制热力图
绘制的热力图类似以下，后面代码可以直接去使用。//在QCustomPlot中创建图像QCustomPlot*myCustomPlot=newQCustomPlot();ui->verticalLayout->addWidget(myCustomPlot);//向量大小为3787*6132intxMax=6132;intyMax=3787;Ei
2024-07-02开源语音转文本 Speech-to-Text 大模型实战之Whisper篇
前言随着深度学习技术的不断发展，语音转文本（Speech-to-Text，STT）技术取得了显著的进步。开源社区涌现了许多高效的STT大模型，为开发者提供了强大的工具。本文将以OpenAI推出的Whisper模型为例，详细介绍如何使用该模型进行语音转文本的实战应用，从模型简介、环境搭建、数据准备到模型
2023-10-07Verdi 学习-折叠波形
波形折叠只关注某一段波形可以使用Verdi的波形折叠的功能：Waveform窗口，点击CompressTimeRange输入需要折叠的时间段例：这里折叠2000*100ps至6000*100ps点击insert，添加折叠波形段可以在Waveform中看到如下被折叠的波形如果想要展开，点击加号
2023-09-23TorchAudio 2.0.1学习
对于函数而言，在将张量参数传递给函数之前，请将其移到CUDA设备上。例如：cuda=torch.device("cuda")waveform=waveform.to(cuda)spectrogram=torchaudio.functional.spectrogram(waveform)支持CUDA的类是通过torch.nn.Module()实现的。在传递CUDA张量之前，也需要将实例移动
2023-08-08windows api录音pcm
pcm.h#pragmaonce#include<cstdio>#include<cstdint>#include<Windows.h>#pragmacomment(lib,"winmm.lib")classpcm{public: pcm(); ~pcm(); voidstartRecording(); voidendRecording();private: structWavPCMFileHead