数字技术 - 数字化技术杂记

音频处理初步

作者：Sender 来源：WaveCN.com 发布日期：1999-07-05 最后修改日期：2008-02-14

一、音频媒体的数字化处理

　　随着计算机技术的发展，特别是海量存储设备和大容量内存在ＰＣ机上的实现，对音频媒体进行数字化处理便成为可能。数字化处理的核心是对音频信息的采样，通过对采集到的样本进行加工，达成各种效果，这是音频媒体数字化处理的基本含义。

二、音频媒体的基本处理

　　基本的音频数字化处理包括以下几种：

　　不同采样率、频率、通道数之间的变换和转换。其中变换只是简单地将其视为另一种格式，而转换通过重采样来进行，其中还可以根据需要采用插值算法以补偿失真。

　　针对音频数据本身进行的各种变换，如淡入、淡出、音量调节等。

　　通过数字滤波算法进行的变换，如高通、低通滤波器。

三、音频媒体的三维化处理

　　长期以来，计算机的研究者们一直低估了声音对人类在信息处理中的作用。当虚拟技术不断发展之时，人们就不再满足单调平面的声音，而更催向于具有空间感的三维声音效果。听觉通道可以与视觉通道同时工作，所以声音的三维化处理不仅可以表达出声音的空间信息，而且与视觉信息的多通道的结合可以创造出极为逼真的虚拟空间，这在未来的多媒体系统中是极为重要的。这也是在媒体处理方面的重要措施。

　　人类感知声源的位置的最基本的理论是双工理论，这种理论基于两种因素：两耳间声音的到达时间差和两耳间声音的强度差。时间差是由于距离的原因造成，当声音从正面传来，距离相等，所以没有时间差，但若偏右三度则到达右耳的时间就要比左耳约少三十微秒，而正是这三十微秒，使得我们辨别出了声源的位置。强度差是由于信号的衰减造成，信号的衰减是因为距离而自然产生的，或是因为人的头部遮挡，使声音衰减，产生了强度的差别，使得靠近声源一侧的耳朵听到的声音强度要大于另一耳。

　　基于双工理论，同样地，只要把一个普通的双声道音频在两个声道之间进行相互混合，便可以使普通双声道声音听起来具有三维音场的效果。这涉及到以下有关音场的两个概念：音场的宽度和深度。

　　音场的宽度利用时间差的原理完成，由于现在是对普通立体声音频进行扩展，所以音源的位置始终在音场的中间不变，这样就简化了我们的工作。要处理的就只有把两个声道的声音进行适当的延时和强度减弱后相互混合。由于这样的扩展是有局限性的，即延时不能太长，否则就会变为回音。

　　音场的深度利用强度差的原理完成，具体的表现形式是回声．音场越深，则回音的延时就越长．所以在回音的设置中应至少提供三个参数：回音的衰减率、回音的深度和回音之间的延时。同时，还应该提供用于设置另一通道混进来的声音深度的多少的选项。

- END -

本栏目相关

2008-11-10 Linux 音频 API 指南

2003-07-06 音频文件格式全介绍

2007-02-12 音频术语中常见的“采样频率”对录音效果有什么影响

2000-10-02 如何使用计算机录音

1999-12-15 MP3 基础知识

2000-05-02 电脑与声音

1999-06-01 如日中天的MIDI