首页 > 其他分享 >音视频入门基础:PCM专题(3)——使用Audacity工具分析PCM音频文件

音视频入门基础:PCM专题(3)——使用Audacity工具分析PCM音频文件

时间:2024-07-24 19:24:54浏览次数:18  
标签:响度 音视频 波形图 Audacity PCM 音调 音频文件

 =================================================================

音视频入门基础:PCM专题系列文章:

音视频入门基础:PCM专题(1)——使用FFmpeg命令生成PCM音频文件并播放

音视频入门基础:PCM专题(2)——使用Qt播放PCM音频文件

音视频入门基础:PCM专题(3)——使用Audacity工具分析PCM音频文件

=================================================================

一、引言

音频编辑录音器Audacity是一款开源免费的跨平台(包括Linux、Windows、Mac OS X)音频编辑器。可以使用它来录音,播放,输入输出PCM、WAV、AIFF、Ogg Vorbis和MP3等格式的音频文件。它还支持大部份常用的操作,如剪裁、贴上、混音、升/降音以及变音特效等功能。本文介绍通过Audacity工具打开、分析PCM音频文件的方法。

二、Windows平台安装Audacity工具

Audacity工具是开源的,其源码可以从github: https://github.com/audacity/audacity  下载。

在它的官网:https://support.audacityteam.org/  有提供文档讲解怎样下载和安装本工具。

根据官网上的文章:https://support.audacityteam.org/basics/downloading-and-installing-audacity

按照上面的提示操作,即可成功安装Audacity工具。

 

三、使用Audacity工具导入PCM音频文件

Audacity工具中,“文件” -> “导入” -> “原始数据”:

选择根据文章《音视频入门基础:PCM专题(1)——使用FFmpeg命令生成PCM音频文件并播放》中介绍的方法,生成的PCM音频文件:

填写该PCM音频文件的参数。因为PCM文件仅包含原始的无压缩的PCM音频数据,它没有文件头,也不包含任何采样频率、通道数、采样位数等信息,所以打开和播放的时候得指定这些参数。填写完成后点击“导入”按钮,即可成功导入:

打开后通过“暂停”和“播放”按钮即可实现暂停或者播放该PCM音频文件:

由于我们打开的PCM音频文件有2声道(立体声),所以显示了上下两个声音波形图:

四、音色、音调和响度的概念

这里先简单讲解一下声音的三个主要的主观属性,即音量(响度)、音调、音色(也称音品)。

1、响度。声音的强弱叫做响度。响度是感觉判断的声音强弱,即声音响亮的程度,根据它可以把声音排成由轻到响的序列。

2、音调。声音的高低叫做音调,频率决定音调。物体振动的快,发出声音的音调就高。振动的慢,发出声音的音调就低。

3、音色。音色指不同声音表现在波形方面总是有与众不同的特性,不同的物体振动都有不同的特点。

五、通过Audacity中的声音波形图分析音色、音调和响度

声音波形图指:将声波转换为电信号存起来,并以图展示出来。默认情况下,Audacity中的声音波形图的X轴是时间,Y轴是Amplitude(也就是声音的振幅,Audacity中可以通过修改配置,改成以分贝为单位)。

1.波形图的多少即波形的疏密程度(相同时间内振动的快慢)指音调;

2.波形图的高低即波形图的最高点和最低点的垂直距离(振幅大小)指响度;

3.波形图的形状即波形图上细小的波形差距指音色。

根据上面条件,我们可以判断出来,由于“区域2”比“区域1”的波形更密而且最高点和最低点的平均垂直距离更大,所以“区域2”比“区域1”的声音音调更高,响度更大:

六、参考文章

如何利用波形图区分音调音色和响度-巧妙区分声音的三大特点

声音波形图怎么看音调和响度

标签:响度,音视频,波形图,Audacity,PCM,音调,音频文件
From: https://blog.csdn.net/u014552102/article/details/140663209

相关文章

  • iOS开发基础137-音视频编解码简介
    音视频编解码是iOS开发中一个高级且复杂的领域,涉及到大量的API和涉及音视频数据处理的知识。在iOS中,通常使用AVFoundation框架进行音视频处理,而对于编解码,可以利用VideoToolbox和AudioToolbox来实现。下面将分别介绍音频和视频的编解码过程,并提供一些基本的封装。视频编解码编码......
  • 数字音频基础­­­­­-从PCM说起
    首先问一个问题——一首歌大概几MB?AI回答一首歌的大小大约为40MB。‌这个估算基于WAV格式的音乐文件,‌这种格式由微软发明,‌以PCM编码为主,‌是多媒体音频中最广泛的格式之一。‌WAV文件的三个主要参数包括采样位数、‌采样频率和声道数。‌通常,‌以PCM编码的WAV文件采样位数是1......
  • 音视频同步原理及实现(转载)
    #音视频同步原理及实现本文主要描述音视频同步原理,及常见的音视频同步方案,并以代码示例,展示如何以音频的播放时长为基准,将视频同步到音频上以实现视音频的同步播放。内容如下:*1.音视频同步简单介绍*2.DTS和PTS简介*2.1I/P/B帧*2.2时间戳DTS、PTS*3.常用同步策略*4.音视......
  • 抖音视频图文根据ID获得评论信息网站源码
    抖音视频图文根据ID获得评论信息单页源码,id是视频的id,可以自定义第几条评论开始,不填默认为0,评论数量最大数量50,默认是20。 接口返回参数:"comments":评论信息集合{"uid":评论者用户uid,"reply_to_reply_id":被回复的回复的评论id,"sec_id":评论者用户secid,"create......
  • 音视频开发—使用FFmpeg从纯H264码流中提取图片 C语言实现
    文章目录1.H264码流文件解码流程关键流程详细解码流程详细步骤解析2.JPEG编码流程详细编码流程详细步骤解析3.完整示例代码4.效果展示从纯H.264码流中提取图片的过程包括解码和JPEG编码两个主要步骤,以下是详细阐述1.H264码流文件解码流程关键流程查找编解码器......
  • 音视频开发基础知识
    视频解码解复用(Demux):解复用也可叫解封装。这里有一个概念叫封装格式,封装格式指的是音视频的组合格式,常见的有mp4、flv、mkv等。通俗来讲,封装是将音频流、视频流、字幕流以及其他附件按一定规则组合成一个封装的产物。而解封装起着与封装相反的作用,将一个流媒体文件拆解成音频......
  • 音频demo:使用opencore-amr将PCM数据与AMR-NB数据进行相互编解码
    1、READMEa.编译编译demo由于提供的.a静态库是在x86_64的机器上编译的,所以仅支持该架构的主机上编译运行。$make编译opencore-amr如果想要在其他架构的CPU上编译运行,可以使用以下命令(脚本)编译opencore-amr[下载地址]得到相应的库文件进行替换:#!/bin/bashtarxzf......
  • Qt/C++音视频开发78-获取本地摄像头支持的分辨率/帧率/格式等信息/mjpeg/yuyv/h264
    一、前言上一篇文章讲到用ffmpeg命令方式执行打印到日志输出,可以拿到本地摄像头设备信息,顺藤摸瓜,发现可以通过执行ffmpeg-fdshow-list_optionstrue-ivideo="Webcam"命令获取指定摄像头设备的分辨率帧率格式等信息,会有很多条。那为什么需要这个功能呢?现场大量应用下来,尽管......
  • MAX98357、MAX98357A、MAX98357B小巧、低成本、PCM D类IIS放大器,具有AB类性能中文说明
    前言:MAX98357A支持标准I2S数据,MAX98357B支持左对齐数字音频数据。两个版本均支持8通道TDM音频数据。IIS数字功放MAX98357开发板/评估系统MAX98357WLP-9(1.347x1.437mm)封装的外观和丝印AKMMAX98357TQFN-16-EP(3x3mm)封装的外观和丝印AKK引脚说明WLP......
  • 音视频同步的关键:深入解析PTS和DTS
    ......