PCM与WAV

PCM与WAV

时间：2024-07-28 12:50:54浏览次数：17

标签：采样率音频 PCM 位数量化 WAV

PCM (Pulse Code Modulation)

原理与工作机制
模拟信号采样：PCM 的工作流程始于对模拟信号的采样。在固定的时间间隔内，对模拟信号的幅度进行测量，这个过程称为采样。采样的频率称为采样率。
量化：将每个采样点的幅度值转化为一个离散的数字值。量化过程中会引入一定的误差，称为量化误差。量化位数越高，误差越小。
编码：将量化后的值转换为二进制码，以便进行存储或传输。
详细要素
采样率（Sample Rate）：

44.1kHz：常用于CD音质，每秒钟采样44100次。
48kHz：常用于专业音频和视频制作。
96kHz及以上：用于高分辨率音频，提供更高的音质细节。
量化位数（Bit Depth）：

8位：每个样本使用8个二进制位，动态范围有限。
16位：每个样本使用16个二进制位，提供CD质量的音频。
24位及以上：每个样本使用24个或更多的二进制位，用于专业音频制作，动态范围更大。
声道数（Channels）：

单声道（Mono）：只有一个声道。
立体声（Stereo）：有两个声道（左声道和右声道）。
多声道（Surround Sound）：用于家庭影院和环绕声系统，有更多的声道，如5.1、7.1等。
PCM的应用
音频CD：CD音频通常使用44.1kHz采样率和16位量化。
专业音频设备：录音设备和数字音频工作站（DAW）通常使用更高的采样率和量化位数。
传输协议：如电话系统中的PCM编码，通常使用8kHz采样率和8位量化。

WAV（Waveform Audio File Format）

详细结构
WAV 文件是一种基于RIFF（资源互换文件格式）的文件结构，包含多个块（chunks），每个块都有特定的功能和数据。

RIFF头：

ChunkID：标识为 "RIFF"。
ChunkSize：整个文件的大小减去8字节（不包括ChunkID和ChunkSize本身）。
Format：标识为 "WAVE"。
格式块（fmt chunk）：

Subchunk1ID：标识为 "fmt "。
Subchunk1Size：16字节（PCM格式）。
AudioFormat：音频格式代码，1表示PCM。
NumChannels：声道数（1=单声道，2=立体声）。
SampleRate：采样率（如44100）。
ByteRate：每秒钟传输的字节数（SampleRate * NumChannels * BitsPerSample/8）。
BlockAlign：每个采样块的字节数（NumChannels * BitsPerSample/8）。
BitsPerSample：每个样本的位数（如16）。
数据块（data chunk）：

Subchunk2ID：标识为 "data"。
Subchunk2Size：音频数据的大小（文件总大小减去44字节）。
Data：实际的音频样本数据。
WAV文件的优缺点
优点：

高质量：由于通常存储未压缩的PCM音频数据，音质极高。
简单的结构：容易解析和处理，兼容性强。
灵活性：可以存储不同采样率和量化位数的音频数据。
缺点：

文件大：未压缩的PCM数据导致文件非常大，不适合网络传输或便携设备存储。
不适合长时间录音：大文件尺寸不适合长时间的音频录制和存储。
实际应用示例

CD音频格式
采样率：44.1kHz
量化位数：16位
声道数：立体声
专业录音
采样率：96kHz或192kHz
量化位数：24位或32位
声道数：立体声或多声道
语音通话
采样率：8kHz
量化位数：8位
声道数：单声道

结论

PCM和WAV在音频技术中扮演着重要角色。PCM是基础的数字音频编码技术，提供了高质量的音频表示方法，而WAV是广泛使用的音频文件格式，利用PCM技术存储音频数据，具有高音质和兼容性的优点。两者的结合在许多音频应用中广泛使用，从音乐制作到语音通话，都能见到它们的身影。

标签：采样率,音频,PCM,位数,量化,WAV
From： https://www.cnblogs.com/mxh010211/p/18328103

音视频入门基础：WAV专题（2）——WAV格式简介
注：本文有部分内容引用了维基百科：https://zh.wikipedia.org/wiki/WAV一、引言WaveformAudioFileFormat（缩写WAVE或WAV）是微软与IBM公司所开发在个人电脑存储音频流的编码格式，在Windows平台的应用软件受到广泛的支持。此格式属于资源交换文件格式(RIFF)的应用之一（关于RIFF格......
音视频入门基础：PCM专题（3）——使用Audacity工具分析PCM音频文件
=================================================================音视频入门基础：PCM专题系列文章：音视频入门基础：PCM专题（1）——使用FFmpeg命令生成PCM音频文件并播放音视频入门基础：PCM专题（2）——使用Qt播放PCM音频文件音视频入门基础：PCM专题（3）——使用Audacity工具分析PC......
数字音频基础－从PCM说起
首先问一个问题——一首歌大概几MB？AI回答一首歌的大小大约为40MB。‌这个估算基于WAV格式的音乐文件，‌这种格式由微软发明，‌以PCM编码为主，‌是多媒体音频中最广泛的格式之一。‌WAV文件的三个主要参数包括采样位数、‌采样频率和声道数。‌通常，‌以PCM编码的WAV文件采样位数是1......
【射频器件供应】 Marki Microwave
射频、微波和毫米波组件裸片、表面贴装、连接器和波导直流至Sub-THzMarkiMicrowave通过创建强大的性能突破性射频和微波组件产品组合，解决了业界最棘手的技术问题。MarkiMicrowave成立于1991年，以开发业内最好的混频器为目标，如今已成为高性能宽带微波产品的单一来......
音频demo：使用opencore-amr将PCM数据与AMR-NB数据进行相互编解码
1、READMEa.编译编译demo由于提供的.a静态库是在x86_64的机器上编译的，所以仅支持该架构的主机上编译运行。$make编译opencore-amr如果想要在其他架构的CPU上编译运行，可以使用以下命令（脚本）编译opencore-amr[下载地址]得到相应的库文件进行替换：#!/bin/bashtarxzf......
MAX98357、MAX98357A、MAX98357B小巧、低成本、PCM D类IIS放大器，具有AB类性能中文说明
前言：MAX98357A支持标准I2S数据，MAX98357B支持左对齐数字音频数据。两个版本均支持8通道TDM音频数据。IIS数字功放MAX98357开发板/评估系统MAX98357WLP-9(1.347x1.437mm)封装的外观和丝印AKMMAX98357TQFN-16-EP(3x3mm)封装的外观和丝印AKK引脚说明WLP......
24位PCM采样数据和16位相互转换算法实例解析
一概念1.24bit音频:24bit指使用3个字节记录振幅值，意味可以记录16,777,216种声音振幅的变化，动态范围可达144dB（人耳听觉的动态范围是120dB，超过120dB人耳会痛，所以120dB又称痛阀）。下面是三种常见的音频采样比对表： 2.24位一般是采样深度的概念，还有一......
音频---查看声卡和pcm设备
目录查看声卡和pcm设备一.查看声卡和PCM设备的信息相关指令二.音频设备命名规则查看声卡和pcm设备声卡和pcm设备的关系：https://blog.csdn.net/Ciellee/article/details/101752604一.查看声卡和PCM设备的信息相关指令1.查看当前的声卡：cat/proc/asound/cards2.查看pcm设......
把采集的PCM音频数据填充到AVFrame中
目录1.AVFrame结构体中部分音频参数说明2.和实际录音时音频属性的对应关系1.AVFrame结构体中部分音频参数说明typedefstructAVFrame{#defineAV_NUM_DATA_POINTERS8uint8_t*data[AV_NUM_DATA_POINTERS];//指向音频数据的指针数组intlinesize[AV_NUM_DATA_POI......
开源语音转文本Speech-to-Text大模型实战之Wav2Vec篇
前言近年来，语音转文本（Speech-to-Text,STT）技术取得了长足的进步，广泛应用于各种领域，如语音助手、自动字幕生成、智能客服等。本文将详细介绍如何利用开源语音转文本大模型进行实战，从模型选择、环境搭建、模型训练到实际应用，带您一步步实现语音转文本功能。一、模型选择目前，市......

PCM (Pulse Code Modulation)

WAV（Waveform Audio File Format）

结论

相关文章

赞助商

阅读排行