PCM (Pulse Code Modulation)
原理与工作机制
模拟信号采样:PCM 的工作流程始于对模拟信号的采样。在固定的时间间隔内,对模拟信号的幅度进行测量,这个过程称为采样。采样的频率称为采样率。
量化:将每个采样点的幅度值转化为一个离散的数字值。量化过程中会引入一定的误差,称为量化误差。量化位数越高,误差越小。
编码:将量化后的值转换为二进制码,以便进行存储或传输。
详细要素
采样率(Sample Rate):
44.1kHz:常用于CD音质,每秒钟采样44100次。
48kHz:常用于专业音频和视频制作。
96kHz及以上:用于高分辨率音频,提供更高的音质细节。
量化位数(Bit Depth):
8位:每个样本使用8个二进制位,动态范围有限。
16位:每个样本使用16个二进制位,提供CD质量的音频。
24位及以上:每个样本使用24个或更多的二进制位,用于专业音频制作,动态范围更大。
声道数(Channels):
单声道(Mono):只有一个声道。
立体声(Stereo):有两个声道(左声道和右声道)。
多声道(Surround Sound):用于家庭影院和环绕声系统,有更多的声道,如5.1、7.1等。
PCM的应用
音频CD:CD音频通常使用44.1kHz采样率和16位量化。
专业音频设备:录音设备和数字音频工作站(DAW)通常使用更高的采样率和量化位数。
传输协议:如电话系统中的PCM编码,通常使用8kHz采样率和8位量化。
WAV(Waveform Audio File Format)
详细结构
WAV 文件是一种基于RIFF(资源互换文件格式)的文件结构,包含多个块(chunks),每个块都有特定的功能和数据。
RIFF头:
ChunkID:标识为 "RIFF"。
ChunkSize:整个文件的大小减去8字节(不包括ChunkID和ChunkSize本身)。
Format:标识为 "WAVE"。
格式块(fmt chunk):
Subchunk1ID:标识为 "fmt "。
Subchunk1Size:16字节(PCM格式)。
AudioFormat:音频格式代码,1表示PCM。
NumChannels:声道数(1=单声道,2=立体声)。
SampleRate:采样率(如44100)。
ByteRate:每秒钟传输的字节数(SampleRate * NumChannels * BitsPerSample/8)。
BlockAlign:每个采样块的字节数(NumChannels * BitsPerSample/8)。
BitsPerSample:每个样本的位数(如16)。
数据块(data chunk):
Subchunk2ID:标识为 "data"。
Subchunk2Size:音频数据的大小(文件总大小减去44字节)。
Data:实际的音频样本数据。
WAV文件的优缺点
优点:
高质量:由于通常存储未压缩的PCM音频数据,音质极高。
简单的结构:容易解析和处理,兼容性强。
灵活性:可以存储不同采样率和量化位数的音频数据。
缺点:
文件大:未压缩的PCM数据导致文件非常大,不适合网络传输或便携设备存储。
不适合长时间录音:大文件尺寸不适合长时间的音频录制和存储。
实际应用示例
- CD音频格式
采样率:44.1kHz
量化位数:16位
声道数:立体声 - 专业录音
采样率:96kHz或192kHz
量化位数:24位或32位
声道数:立体声或多声道 - 语音通话
采样率:8kHz
量化位数:8位
声道数:单声道
结论
PCM和WAV在音频技术中扮演着重要角色。PCM是基础的数字音频编码技术,提供了高质量的音频表示方法,而WAV是广泛使用的音频文件格式,利用PCM技术存储音频数据,具有高音质和兼容性的优点。两者的结合在许多音频应用中广泛使用,从音乐制作到语音通话,都能见到它们的身影。
标签:采样率,音频,PCM,位数,量化,WAV From: https://www.cnblogs.com/mxh010211/p/18328103