音频的获取与处理
2.1声音的基础知识
声音的三个要素是音调、音强和音色。
音调是指声音的高低,由频率决定。高频率的声音听起来高,低频率的声音听起来低。 音乐中按音阶来表示音调的高低。赫兹Hz
音强是指声音的响度,即声音的强弱。响度取决于声音的振幅,振幅大的声音听起来响亮,振幅小的声音听起来轻柔。分贝db
音色是指声音的音质特点,是由声音波的组合产生的【谐波】。不同的乐器或声源会产生不同的音色。例如,钢琴的音色和吉他的音色是不同的,即使它们发出的是相同的音调和音强。除基音之外的高次谐波越丰富,音色就越有明亮感和层次感。
人可以听到的声音的频率范围约为20 Hz至20,000 Hz。这个范围称为听觉频率范围,它因人的年龄、性别和健康状况等因素而略微有所不同。婴儿和小孩可以听到更高频率的声音,而老年人可能听力下降,不能听到高频率的声音。
规则声音是指具有规则性、周期性的声音,例如人类说话、乐器演奏等都是规则声音。这类声音具有可测量的频率和振幅,能够被分析成一系列频率成分的叠加。规则声音的谱线呈现规则的共振峰,这些峰标志着声音特征的出现和消失。常见的规则声音包括语音、音乐、动物鸣叫等。
不规则声音则是指没有明显规律性、周期性的声音,例如雨声、嗓音、风声等。这类声音无法被分析成规则的频率成分,具有复杂的频率谱,难以精确地描述和分析其声波形态。不规则声音往往显得更加随意、自由,而不像规则声音那样受到固定规律的限制。
2.2 声音的数字化
模拟音频-->采集,量化,编码-->数字音频
1. 采集声音信号:使用麦克风等设备将声音转化成电信号。 2. 声音信号的预处理:将信号进行滤波、增益控制等处理,使其达到数字化的要求。 3. 采样:使用模数转换器将信号按照一定的时间间隔进行采样,将模拟信号转化为离散的数字信号。 4. 量化:使用模数转换器将采样后的信号的幅度值进行离散化。 5. 编码:使用编码器将量化后的数字信号转化为不同的二进制编码。 6. 存储或传输:将编码后的数字信号存储到存储介质中,或者通过网络传输到接收端。 7. 解码:接收端对传输过来的数字信号进行解码,恢复原先的数字信号。 8. 数字信号重建:使用数字信号处理技术对解码后的数字信号进行去噪、滤波等处理,恢复出原来的声音信号。
标签:11,03,信号,声音,音色,规则,数字信号,频率,2023 From: https://www.cnblogs.com/chucklu/p/17205190.html