首页 > 其他分享 >PCM与WAV

PCM与WAV

时间:2024-07-28 12:50:54浏览次数:10  
标签:采样率 音频 PCM 位数 量化 WAV

PCM (Pulse Code Modulation)

原理与工作机制
模拟信号采样:PCM 的工作流程始于对模拟信号的采样。在固定的时间间隔内,对模拟信号的幅度进行测量,这个过程称为采样。采样的频率称为采样率。
量化:将每个采样点的幅度值转化为一个离散的数字值。量化过程中会引入一定的误差,称为量化误差。量化位数越高,误差越小。
编码:将量化后的值转换为二进制码,以便进行存储或传输。
详细要素
采样率(Sample Rate):

44.1kHz:常用于CD音质,每秒钟采样44100次。
48kHz:常用于专业音频和视频制作。
96kHz及以上:用于高分辨率音频,提供更高的音质细节。
量化位数(Bit Depth):

8位:每个样本使用8个二进制位,动态范围有限。
16位:每个样本使用16个二进制位,提供CD质量的音频。
24位及以上:每个样本使用24个或更多的二进制位,用于专业音频制作,动态范围更大。
声道数(Channels):

单声道(Mono):只有一个声道。
立体声(Stereo):有两个声道(左声道和右声道)。
多声道(Surround Sound):用于家庭影院和环绕声系统,有更多的声道,如5.1、7.1等。
PCM的应用
音频CD:CD音频通常使用44.1kHz采样率和16位量化。
专业音频设备:录音设备和数字音频工作站(DAW)通常使用更高的采样率和量化位数。
传输协议:如电话系统中的PCM编码,通常使用8kHz采样率和8位量化。

WAV(Waveform Audio File Format)

详细结构
WAV 文件是一种基于RIFF(资源互换文件格式)的文件结构,包含多个块(chunks),每个块都有特定的功能和数据。

RIFF头:

ChunkID:标识为 "RIFF"。
ChunkSize:整个文件的大小减去8字节(不包括ChunkID和ChunkSize本身)。
Format:标识为 "WAVE"。
格式块(fmt chunk):

Subchunk1ID:标识为 "fmt "。
Subchunk1Size:16字节(PCM格式)。
AudioFormat:音频格式代码,1表示PCM。
NumChannels:声道数(1=单声道,2=立体声)。
SampleRate:采样率(如44100)。
ByteRate:每秒钟传输的字节数(SampleRate * NumChannels * BitsPerSample/8)。
BlockAlign:每个采样块的字节数(NumChannels * BitsPerSample/8)。
BitsPerSample:每个样本的位数(如16)。
数据块(data chunk):

Subchunk2ID:标识为 "data"。
Subchunk2Size:音频数据的大小(文件总大小减去44字节)。
Data:实际的音频样本数据。
WAV文件的优缺点
优点:

高质量:由于通常存储未压缩的PCM音频数据,音质极高。
简单的结构:容易解析和处理,兼容性强。
灵活性:可以存储不同采样率和量化位数的音频数据。
缺点:

文件大:未压缩的PCM数据导致文件非常大,不适合网络传输或便携设备存储。
不适合长时间录音:大文件尺寸不适合长时间的音频录制和存储。
实际应用示例

  1. CD音频格式
    采样率:44.1kHz
    量化位数:16位
    声道数:立体声
  2. 专业录音
    采样率:96kHz或192kHz
    量化位数:24位或32位
    声道数:立体声或多声道
  3. 语音通话
    采样率:8kHz
    量化位数:8位
    声道数:单声道

结论

PCM和WAV在音频技术中扮演着重要角色。PCM是基础的数字音频编码技术,提供了高质量的音频表示方法,而WAV是广泛使用的音频文件格式,利用PCM技术存储音频数据,具有高音质和兼容性的优点。两者的结合在许多音频应用中广泛使用,从音乐制作到语音通话,都能见到它们的身影。

标签:采样率,音频,PCM,位数,量化,WAV
From: https://www.cnblogs.com/mxh010211/p/18328103

相关文章

  • 音视频入门基础:WAV专题(2)——WAV格式简介
    注:本文有部分内容引用了维基百科:https://zh.wikipedia.org/wiki/WAV一、引言WaveformAudioFileFormat(缩写WAVE或WAV)是微软与IBM公司所开发在个人电脑存储音频流的编码格式,在Windows平台的应用软件受到广泛的支持。此格式属于资源交换文件格式(RIFF)的应用之一(关于RIFF格......
  • 音视频入门基础:PCM专题(3)——使用Audacity工具分析PCM音频文件
     =================================================================音视频入门基础:PCM专题系列文章:音视频入门基础:PCM专题(1)——使用FFmpeg命令生成PCM音频文件并播放音视频入门基础:PCM专题(2)——使用Qt播放PCM音频文件音视频入门基础:PCM专题(3)——使用Audacity工具分析PC......
  • 数字音频基础­­­­­-从PCM说起
    首先问一个问题——一首歌大概几MB?AI回答一首歌的大小大约为40MB。‌这个估算基于WAV格式的音乐文件,‌这种格式由微软发明,‌以PCM编码为主,‌是多媒体音频中最广泛的格式之一。‌WAV文件的三个主要参数包括采样位数、‌采样频率和声道数。‌通常,‌以PCM编码的WAV文件采样位数是1......
  • 【射频器件供应】 Marki Microwave
    射频、微波和毫米波组件裸片、表面贴装、连接器和波导直流至Sub-THzMarkiMicrowave通过创建强大的性能突破性射频和微波组件产品组合,解决了业界最棘手的技术问题。MarkiMicrowave成立于1991年,以开发业内最好的混频器为目标,如今已成为高性能宽带微波产品的单一来......
  • 音频demo:使用opencore-amr将PCM数据与AMR-NB数据进行相互编解码
    1、READMEa.编译编译demo由于提供的.a静态库是在x86_64的机器上编译的,所以仅支持该架构的主机上编译运行。$make编译opencore-amr如果想要在其他架构的CPU上编译运行,可以使用以下命令(脚本)编译opencore-amr[下载地址]得到相应的库文件进行替换:#!/bin/bashtarxzf......
  • MAX98357、MAX98357A、MAX98357B小巧、低成本、PCM D类IIS放大器,具有AB类性能中文说明
    前言:MAX98357A支持标准I2S数据,MAX98357B支持左对齐数字音频数据。两个版本均支持8通道TDM音频数据。IIS数字功放MAX98357开发板/评估系统MAX98357WLP-9(1.347x1.437mm)封装的外观和丝印AKMMAX98357TQFN-16-EP(3x3mm)封装的外观和丝印AKK引脚说明WLP......
  • 24位PCM采样数据和16位相互转换算法实例解析
    一概念1.24bit音频:24bit指使用3个字节记录振幅值,意味可以记录16,777,216种声音振幅的变化,动态范围可达144dB(人耳听觉的动态范围是120dB,超过120dB人耳会痛,所以120dB又称痛阀)。下面是三种常见的音频采样比对表: 2.24位一般是采样深度的概念,还有一......
  • 音频---查看声卡和pcm设备
    目录查看声卡和pcm设备一.查看声卡和PCM设备的信息相关指令二.音频设备命名规则查看声卡和pcm设备声卡和pcm设备的关系:https://blog.csdn.net/Ciellee/article/details/101752604一.查看声卡和PCM设备的信息相关指令1.查看当前的声卡:cat/proc/asound/cards2.查看pcm设......
  • 把采集的PCM音频数据填充到AVFrame中
    目录1.AVFrame结构体中部分音频参数说明2.和实际录音时音频属性的对应关系1.AVFrame结构体中部分音频参数说明typedefstructAVFrame{#defineAV_NUM_DATA_POINTERS8uint8_t*data[AV_NUM_DATA_POINTERS];//指向音频数据的指针数组intlinesize[AV_NUM_DATA_POI......
  • 开源语音转文本Speech-to-Text大模型实战之Wav2Vec篇
    前言近年来,语音转文本(Speech-to-Text,STT)技术取得了长足的进步,广泛应用于各种领域,如语音助手、自动字幕生成、智能客服等。本文将详细介绍如何利用开源语音转文本大模型进行实战,从模型选择、环境搭建、模型训练到实际应用,带您一步步实现语音转文本功能。一、模型选择目前,市......