音视频入门基础：PCM专题（3）——使用Audacity工具分析PCM音频文件

时间：2024-07-24 19:24:54浏览次数：18

标签：响度音视频波形图 Audacity PCM 音调音频文件

=================================================================

音视频入门基础：PCM专题系列文章：

音视频入门基础：PCM专题（1）——使用FFmpeg命令生成PCM音频文件并播放

音视频入门基础：PCM专题（2）——使用Qt播放PCM音频文件

音视频入门基础：PCM专题（3）——使用Audacity工具分析PCM音频文件

=================================================================

一、引言

音频编辑录音器Audacity是一款开源免费的跨平台（包括Linux、Windows、Mac OS X）音频编辑器。可以使用它来录音，播放，输入输出PCM、WAV、AIFF、Ogg Vorbis和MP3等格式的音频文件。它还支持大部份常用的操作，如剪裁、贴上、混音、升/降音以及变音特效等功能。本文介绍通过Audacity工具打开、分析PCM音频文件的方法。

二、Windows平台安装Audacity工具

Audacity工具是开源的，其源码可以从github： https://github.com/audacity/audacity 下载。

在它的官网：https://support.audacityteam.org/ 有提供文档讲解怎样下载和安装本工具。

根据官网上的文章：https://support.audacityteam.org/basics/downloading-and-installing-audacity

按照上面的提示操作，即可成功安装Audacity工具。

三、使用Audacity工具导入PCM音频文件

Audacity工具中，“文件” -> “导入” -> “原始数据”：

选择根据文章《音视频入门基础：PCM专题（1）——使用FFmpeg命令生成PCM音频文件并播放》中介绍的方法，生成的PCM音频文件：

填写该PCM音频文件的参数。因为PCM文件仅包含原始的无压缩的PCM音频数据，它没有文件头，也不包含任何采样频率、通道数、采样位数等信息，所以打开和播放的时候得指定这些参数。填写完成后点击“导入”按钮，即可成功导入：

打开后通过“暂停”和“播放”按钮即可实现暂停或者播放该PCM音频文件：

由于我们打开的PCM音频文件有2声道（立体声），所以显示了上下两个声音波形图：

四、音色、音调和响度的概念

这里先简单讲解一下声音的三个主要的主观属性，即音量（响度）、音调、音色（也称音品）。

1、响度。声音的强弱叫做响度。响度是感觉判断的声音强弱，即声音响亮的程度，根据它可以把声音排成由轻到响的序列。

2、音调。声音的高低叫做音调，频率决定音调。物体振动的快，发出声音的音调就高。振动的慢，发出声音的音调就低。

3、音色。音色指不同声音表现在波形方面总是有与众不同的特性，不同的物体振动都有不同的特点。

五、通过Audacity中的声音波形图分析音色、音调和响度

声音波形图指：将声波转换为电信号存起来，并以图展示出来。默认情况下，Audacity中的声音波形图的X轴是时间，Y轴是Amplitude（也就是声音的振幅，Audacity中可以通过修改配置，改成以分贝为单位）。

1.波形图的多少即波形的疏密程度（相同时间内振动的快慢）指音调；

2.波形图的高低即波形图的最高点和最低点的垂直距离（振幅大小）指响度；

3.波形图的形状即波形图上细小的波形差距指音色。

根据上面条件，我们可以判断出来，由于“区域2”比“区域1”的波形更密而且最高点和最低点的平均垂直距离更大，所以“区域2”比“区域1”的声音音调更高，响度更大：

六、参考文章

《如何利用波形图区分音调音色和响度-巧妙区分声音的三大特点》

《声音波形图怎么看音调和响度》

标签：响度,音视频,波形图,Audacity,PCM,音调,音频文件
From： https://blog.csdn.net/u014552102/article/details/140663209

iOS开发基础137-音视频编解码简介
音视频编解码是iOS开发中一个高级且复杂的领域，涉及到大量的API和涉及音视频数据处理的知识。在iOS中，通常使用AVFoundation框架进行音视频处理，而对于编解码，可以利用VideoToolbox和AudioToolbox来实现。下面将分别介绍音频和视频的编解码过程，并提供一些基本的封装。视频编解码编码......
数字音频基础－从PCM说起
首先问一个问题——一首歌大概几MB？AI回答一首歌的大小大约为40MB。‌这个估算基于WAV格式的音乐文件，‌这种格式由微软发明，‌以PCM编码为主，‌是多媒体音频中最广泛的格式之一。‌WAV文件的三个主要参数包括采样位数、‌采样频率和声道数。‌通常，‌以PCM编码的WAV文件采样位数是1......
音视频同步原理及实现(转载)
#音视频同步原理及实现本文主要描述音视频同步原理，及常见的音视频同步方案，并以代码示例，展示如何以音频的播放时长为基准，将视频同步到音频上以实现视音频的同步播放。内容如下：*1.音视频同步简单介绍*2.DTS和PTS简介*2.1I/P/B帧*2.2时间戳DTS、PTS*3.常用同步策略*4.音视......
抖音视频图文根据ID获得评论信息网站源码
抖音视频图文根据ID获得评论信息单页源码，id是视频的id，可以自定义第几条评论开始，不填默认为0，评论数量最大数量50，默认是20。接口返回参数："comments":评论信息集合{"uid":评论者用户uid,"reply_to_reply_id":被回复的回复的评论id,"sec_id":评论者用户secid,"create......
音视频开发—使用FFmpeg从纯H264码流中提取图片 C语言实现
文章目录1.H264码流文件解码流程关键流程详细解码流程详细步骤解析2.JPEG编码流程详细编码流程详细步骤解析3.完整示例代码4.效果展示从纯H.264码流中提取图片的过程包括解码和JPEG编码两个主要步骤，以下是详细阐述1.H264码流文件解码流程关键流程查找编解码器......
音视频开发基础知识
视频解码解复用（Demux）：解复用也可叫解封装。这里有一个概念叫封装格式，封装格式指的是音视频的组合格式，常见的有mp4、flv、mkv等。通俗来讲，封装是将音频流、视频流、字幕流以及其他附件按一定规则组合成一个封装的产物。而解封装起着与封装相反的作用，将一个流媒体文件拆解成音频......
音频demo：使用opencore-amr将PCM数据与AMR-NB数据进行相互编解码
1、READMEa.编译编译demo由于提供的.a静态库是在x86_64的机器上编译的，所以仅支持该架构的主机上编译运行。$make编译opencore-amr如果想要在其他架构的CPU上编译运行，可以使用以下命令（脚本）编译opencore-amr[下载地址]得到相应的库文件进行替换：#!/bin/bashtarxzf......
Qt/C++音视频开发78-获取本地摄像头支持的分辨率/帧率/格式等信息/mjpeg/yuyv/h264
一、前言上一篇文章讲到用ffmpeg命令方式执行打印到日志输出，可以拿到本地摄像头设备信息，顺藤摸瓜，发现可以通过执行ffmpeg-fdshow-list_optionstrue-ivideo="Webcam"命令获取指定摄像头设备的分辨率帧率格式等信息，会有很多条。那为什么需要这个功能呢？现场大量应用下来，尽管......
MAX98357、MAX98357A、MAX98357B小巧、低成本、PCM D类IIS放大器，具有AB类性能中文说明
前言：MAX98357A支持标准I2S数据，MAX98357B支持左对齐数字音频数据。两个版本均支持8通道TDM音频数据。IIS数字功放MAX98357开发板/评估系统MAX98357WLP-9(1.347x1.437mm)封装的外观和丝印AKMMAX98357TQFN-16-EP(3x3mm)封装的外观和丝印AKK引脚说明WLP......
音视频同步的关键：深入解析PTS和DTS
......

音视频入门基础：PCM专题（3）——使用Audacity工具分析PCM音频文件

一、引言

二、Windows平台安装Audacity工具

三、使用Audacity工具导入PCM音频文件

四、音色、音调和响度的概念

五、通过Audacity中的声音波形图分析音色、音调和响度

六、参考文章

相关文章

赞助商

阅读排行