05 电子声 Electronic Sound(1 / 1)

从声音到电流:麦克风

19世纪20年代,查尔斯·惠斯通(Charles Wheatstone)发明了麦克风。它是一种由两块金属板组成的纯声学设备,通过一根有弹性的杆子和一段女装裁缝常用的丝带固定在耳朵上。使用的时候需要把自己的头靠在声源上(惠斯通很贴心地建议使用一个烧水壶),如果运气好的话就可以听得更清楚。意料之中(惠斯通却觉得很意外),这个设备并没有流行起来。

现今声学设备的前身是碳质麦克风,由大卫·休斯(David Hughes)于19世纪70年代发明。与惠斯通的设备不同,碳质麦克风可以将声音转化成电。在这种设备中,一个薄金属片(膜片)压住充满碳颗粒的容器,下压的力改变碳颗粒的电阻,电流从中流过。虽然性能很差,但碳质麦克风在电话中使用了几十年。

虽然在过去的几年里,出现了很多种形式的麦克风设计,几种专业的类型现在还有,但目前常用的只有三种类型,即动圈(或动态)麦克风、电容式麦克风和压电式麦克风。

图18 动圈麦克风

在动圈麦克风(见图18)中,膜片连接到环绕固定磁铁的线圈上。线圈运动时产生低电压,从而产生一股弱电流。低电压意味着这种麦克风的质量不足以进行测量工作,所以动圈麦克风主要用在音乐会和录音棚中。

图19 电容式麦克风

在电容式麦克风(见图19)中,膜片形成一个电容板(因此得名)。电容器由一对平行的金属板组成,其间有一层薄薄的空气或其他不导电的材料(称为电介质)。将一块金属板连接到电池的负极上,电池就会给这块板充电。金属都含有自由电子,而另一块金属板上的自由电子会受到和负极相连的金属板上电场的排斥。被排斥的电子从平板中流出,从而使金属板带正电荷。因此,现在整个电容器上都有一个电压(称为极化电压),麦克风可以随时工作了。膜片板随着声波的压缩和膨胀而移动。巨大的电阻阻止电荷快速逸出,因此声波被转换成电压波动的模式。电容式麦克风具有良好的频率响应特性,在实验室和声级计中被用作测量麦克风。它们对突发声音的反应也比动圈麦克风快。

晶体麦克风和陶瓷麦克风利用了压电效应,这种效应是利用了石英或其他一些晶体材料在受到轻微压缩时会产生电压这一性质。大多数固定电话都使用这种麦克风,呼叫中心使用的受话器里也是它。

出于我个人对历史或专业上的兴趣,我将其他类型的一些麦克风列在下面。

驻极体麦克风是由永久充电材料(在电学中相当于磁铁)制成的。它们的功能与电容式麦克风类似。

微电子机械系统(MEMS)麦克风是直接蚀刻在硅片上的电容式麦克风,面积只有几平方毫米,而且价格低廉,特别坚固,这意味着它们可以被用于手机及许多其他设备中。

光学麦克风使用闪亮的硅薄膜作为膜片,它可以反射来自发光二极管(LED)的光。当薄膜被声波振动时,光探测器测量光的变化,然后电子电路将这些变化转换成电信号。这种麦克风结构紧凑、坚固耐用,不受局部电磁场的影响,因此,在病人进行核磁共振扫描期间,他们可以用这种麦克风和工作人员进行交流。

压力区麦克风是专门设计在硬反射表面附近使用的(如必须直接朝向舞台地板放置)。对于传统的麦克风,麦克风表面的反射会干扰麦克风直接接收到的声音,但是压力区麦克风克服了这个问题,因为它的膜片离麦克风表面非常近,以至于大多数波长都会重叠。

带式麦克风使用金属带而不是小的膜片,与鼓膜和大多数其他类型的麦克风不同,它对金属带两侧的压力差产生回应。这意味着金属检测到的是随声波移动的空气分子的速度,而不是声压模式。通常解说员会在嘈杂的环境中使用这样的麦克风,因为来自四面八方的声音会同时影响金属带的两侧,从而使得麦克风不会对这些声音做出反应。在这个应用场景中,麦克风在靠近上唇的地方有个凸起,这有助于引导解说员的声音,使它只撞击金属带的一侧。

在嘈杂的环境中准确捕捉声音的另一种选择是项链式麦克风,这是一种小型的可以夹在物体上的驻极体麦克风或动圈麦克风。项链式麦克风的优点是体积小,要将它藏在衣服下面简直轻而易举。

声强探头由一对面对面的麦克风组成,它测量同一声波不同部分的压力,由此可以计算出分子速度并进一步得到声强。

选择麦克风的一个重要标准是方向性。比如,理想的全向麦克风对来自任何方向的声音都有着同样的敏感度。再比如,在捕获完整的音效场景时常常需要使用全向麦克风。单向麦克风只能从一个方向接收声音,非常适合在嘈杂的环境中接收语音或歌曲。

除带式麦克风和声强探头外,只要声波波长比膜片的尺寸大,那么对这种类型的声波麦克风都是全方向的。如要使麦克风主要针对从正前方或正后方(双向)传来的声音敏感,只需让麦克风前后方都向空气敞开。膜片不会对四面传来的声波做出太大的反应,因为前部压力的升降与后部压力的升降非常相似。但是任何入射到麦克风正面或背面的波都会很容易地被接收到。

实现定向的一个简单方法是将麦克风安装在截面为抛物线的反射器的焦点上。只要麦克风比反射器小,这个抛物面的形状就可以将入射声波反射到膜片上。另一种选择是将麦克风安装在一个管道的末端,管道两侧有裂缝,以制造枪式麦克风(又叫远程拾音器)。声波沿着管道畅通无阻地传播,一直传到麦克风,但来自其他方向的声波则通过缝隙进入麦克风。每一个这样的声音都会进入多个狭缝,形成许多版本,每个版本都有不同的相位。因此,这两种版本将在很大程度上通过相消干涉互相抵消。霰弹式麦克风广泛用于户外录音,常常配合摄像机一起使用。不过,这种麦克风对频率的依赖度很高。

从电到声:扬声器

扬声器与麦克风的原理恰恰相反。如果给一个动圈、电容、晶体或陶瓷麦克风提供一个变化的电流,这些麦克风将因振动产生声波(这样的麦克风因此被称为互易换能器)。大多数实际的扬声器是反过来的动圈麦克风,称为动圈式扬声器(见图20)。顾名思义,一个电信号被传送到一个线圈(音圈),该线圈连接到一个锥形的膜片上。线圈包围着磁铁,信号在线圈形成的电磁场中使线圈和膜片发生运动。

图20 扬声器

因为扬声器对电能的利用效率比较低,大部分进入扬声器的电能都转换成了热能,只有大约1%的能量可以被听到。因此,放大是至关重要的。如今,有了晶体管,放大变成了一件很简单的事情,主要挑战变成了确保每个频率被放大到一个适当的程度。考虑到听觉系统的非线性属性,如果要保持输出声音音高不变,就必须对不同的频率进行不同程度的放大。谨慎地选择放大倍数非常重要。除了会对听力产生有害影响,扬声器也很容易被损坏,尤其是人为制造的声音,因为这种声音可能会在一个极短的时间内快速变大。此外,如果麦克风发送到扬声器的声音又反过来被麦克风接收到了,就会建立一个正反馈回路,导致一种我们非常熟悉的呼啸音产生。

扬声器是音乐生产链中最不高保真(hi-fi)的环节。虽然原理简单,但它们的设计会面临许多实际的挑战。扬声器必须保证当信号降至零时,音圈能精确地回到它的起始位置,而且在任何情况下都不会发生振**,但是又必须处在可以自由移动的状态。锥体必须在振动时保持其形状不变,必须非常轻,但又足够坚硬,以免在重力作用下下垂。与此同时,它必须大到在低频时也能移动大量空气(足够强大的声波才能被听到),但又小到足以在高频时每秒来回移动超过10 000次。此外,其外壳不能与任何频率产生共振。

实际上,分组使用扬声器要容易得多。这些扬声器通常都会组成一个单元,包括一个频率在2000赫兹以上的小型高音喇叭,一个较大的中频扬声器(50~5000赫兹)和一个低音扬声器(30~800赫兹)。对于那些喜欢低音的人,可能还会加一个低音炮(20~200赫兹)。

低音炮通常是有源扬声器,也就意味着它们有自己的放大器(因此需要配供一个电源)。其他大多数的扬声器都是无源的,由外在的信号进行驱动,这些信号常常通过高保真(或其他)系统中的放大器进行了增强。

一个没有外壳的扬声器几乎是无声的,原因很简单,扬声器前方产生的高压脉冲会悄无声息地溜到后方,填充刚刚在那里形成的低压区。因此,可以把扬声器放在一个密闭的盒子里。然而,如果盒子很小,当隔膜向外运动时,盒子里的空气很难被压缩。还有一种解决办法是将隔膜放在一个称为挡板的环的中心。挡板必须足够大,这样当压力脉冲跑到隔膜后面的时候,那里的低压区就已经消失了(换句话说,声波走的距离比最长波波长的1/4要长)。

亥姆霍兹谐振可以用来扩展扬声器在低频声方面的表现性能。在安装扬声器的盒子前面开一个孔,腔体就会与低频声音产生共振。如果盒子的共振频率低于扬声器的共振频率,当扬声器的膜片向初始位置移动(反射回波)时就会产生压力脉冲,脉冲在盒子中运动直到出现在盒子开口处,在那里它将与一个隔膜前方刚刚产生的新脉冲处于同相位。这两个同相脉冲会相互加强。这适用于一切脉冲,只要这些脉冲产生的声波频率在膜片和盒子的共振频率之间。

这样做的缺点是有时可以听到从端口吹来的气流,另一个缺点是声音不会那么清脆,因为每个信号后面都有一个短的衰减共振“尾巴”。此外,形成频率低于该端口频率的声波的脉冲会被来自膜片的后续波抵消。超过这两个共振频率的声波既不被增强也不被减弱。

我们的大脑非常善于填补声音的空白,我们可以利用这一点来改善基频非常有限的扬声器。在自然界中,一组200赫兹、300赫兹、400赫兹和500赫兹的音调几乎总是基频为100赫兹的谐波(泛音)。因为大脑的听觉中枢(见图16)“知道”这一点,所以它会自信地断定100赫兹确实存在。但是,如果一组音调来自一个小型扬声器,那么很可能实际上不会有100赫兹的音调。这种效应被称为缺失的基频,这也是为什么在埃皮达鲁斯剧院(见第1章)听那些缺失低频的音乐却不会觉得奇怪,因为观众的听觉中心自动补足了这些频率。这也解释了为什么尽管早期电话的低频传输信号并不好,

但是仍然有相对足够的清晰度。

高性能麦克风、扩音器和扬声器使唱片业发生了革命性的变化,而且由于唱片本身不需要更改,这种变革可以快速进行。紧接着,社会也发生了变化,一时间,几乎所有人都能接触到音乐,并选择自己喜欢的音乐。

声音研究专家乔纳森·斯特恩(Jonathan Sterne)称,这种新的声音媒体“对经验和存在的基础提出了质疑”。此外,这种声音媒体对表演者同样产生了深远的影响,正如音乐历史学家罗伯特·菲利普(Robert Philip)所指出的,许多人对他们在录制表演中听到的错误数量感到震惊。音乐学家马克·卡茨(Mark Katz)认为,这些表演者陷入了一个“反馈循环”,他们试图呈现出越来越多的“完美”表演,但当他们听到录音结果时,却一次又一次地失望。于是,表演变得不那么个性化,失去了自发性,开始更加标准化。听录音的体验也带来了另一种反馈,例如,小提琴颤音最初是一种留声机效果,但很快就被表演者模仿。

接下来的一次声音革命是1933年立体声留声机的发明。它是通过在凹槽的两侧分别录制互成90°以及与铅直面成45°的两个信道来实现的。立体声唱片的引入,意味着原则上可以再现整个原始表演的三维声场。这就产生了扬声器理想放置位置的问题,这一问题一直吸引着音乐爱好者。同时,也引出了“保真度”(fidelity)的概念,因为人们现在追求的效果是再现一个原始的表演。20世纪70年代之前,许多流行音乐作品从未像现在这样演奏过,当时音乐的大部分内容都是在乐队离开后添加的,这种情况随着后期处理和混合技术的进步而有所改善。然而,对古典音乐来说,保真的录音仍然是关键。尽管数以百万计的业余爱好者和专业听众、录音机、表演者和演奏者对“保真度”有着数十年的兴趣,但我们仍然无法对“保真度”进行量化。

存储的声音

当扩音技术和扬声器的设计得到完善之后,人们主要担心的是记录的脆弱性。一种关于如何处理、收藏、清洁,以及经过训练后正确播放录音的文化因此形成了。自动换片器的出现让一部分人很高兴,不过另一些人则将其视为最令人扫兴的发明,还有人认为它是新兴的唱片破坏机。之所以会这样,一部分原因是自动换片器具有神秘感,另一部分原因是传统黑胶唱片,尤其是后来被称为专辑的密纹唱片(LP)质量极高,这让它们被尊崇的程度空前绝后,甚至至今仍有销售。

1964年,模拟盒式磁带作为一种强大又袖珍的唱片替代品被引入市场,并开始流行起来。尽管磁带很容易买到,但许多人宁愿买一张黑胶唱片,然后(非法地!)把它烧制到磁带上听,同时保持录音的原始精度。无线电广播也可以用这种方法录制,组合音响由无线电、盒式录音机和唱机组成,因为它录制盒式磁带时最方便,所以变得很受欢迎。

但是磁带有两大缺点,选择音乐时转带子(倒退或者前进)耗费时间,而且不可避免地发出高频嘶嘶声。杜比系统的许多变体在一定程度上减弱了嘶嘶声。这些系统都是在录制一个音轨时将高频信号增强,然后在回放时抑制整个音轨来生效。这是一种叫作压展(压缩和扩展的合成词)的技术。

立体声使人们对研究新的声音设备充满兴趣,并取得了很多新成果,磁带的制作也进一步发展。混音带就是磁带制作上的一个新成果,另一个新成果则是索尼随身听,它让音乐爱好者无论身在何处都能听音乐,不过,这有时会惹恼坐在旁边的人。

我们需要做的是完全抛弃模拟录音,也就是说,将声音以连续变化的形式存储(无论是物理的,如黑胶唱片,还是磁性的,如盒式磁带)。在数字系统中,信号被编码为一串数字,以这种形式存储、传输或复制不会降低信号,也不会产生背景噪声。

乍一看,为了捕捉复杂声波的复杂性(如图9所示),我们似乎必须测量和编码该声波的许多点的振幅。事实上,对声音的采样频率是希望保存的最高频率的两倍就可以了。因此,要编码一个包含最高频率为8千赫的信号,我们就必须以16千赫进行采样(这就是众所周知的奈奎斯特定理)。如果以较低的速率采样,编码的数据就会失真,这就是所谓的混叠效应。

1982年光盘(CD)的推出导致了从模拟到数字的大规模转变。在CD上,数字编码的信号存储成光盘闪亮金属涂层上(塑料基片中)的深色凹坑,通过激光扫描即可读取,因为光盘上光滑的区域可以反射激光,但凹坑无法反射激光。CD播放机将反射翻译为1,非反射翻译为0,1和0的字符串将音频信息编码成二进制数字序列。

当然,如今购买、存储和播放音乐都是极为普遍的行为,甚至无须使用物理媒介。音频文件可以简单地下载到电脑上,通过各种设备播放。计算机通常是MP3播放器的一部分(MP3原意是“动态影像专家组音频层III”)。

MP3音频文件的神奇之处在于它们携带的文件非常小,大约只有CD文件的十分之一,这意味着一分钟的MP3音乐可以压缩到兆字节。能够压缩到如此令人吃惊的程度,是依靠一种叫作霍夫曼编码的技术实现的。在这种技术中,出现概率高的符号用较短的方式进行编码。另一方面,该技术对那些一丢失就引起人们极大关注的频段(主要是语音频率)会进行更加充分的编码,而对那些不受人们关注的频段则轻描淡写。

由于MP3播放器在决定歌曲压缩过程中需要去掉哪些信息时,同时考虑了音乐和听者,斯特恩得出结论:

MP3包含了对交流、听或说、“心灵的耳朵”如何工作以及对音乐创作的实际与哲学层面的理解。每一个MP3的编码是由各种声音组成的一个世界,其中还有声音实践的整个历史。MP3编码器通过计算不断变化的录音内容与声音间的间隙,并据此构建声音间的时间对应关系来形成文件。MP3编码器工作得很好,因为它将想象中的倾听者定义为“非理想条件下的不完美的聆听者”,猜测这些听众不会一直将注意力集中于他们正在聆听的声音,而编码器的猜测经常是对的。

高效的音乐编码利用了这样一个事实,即经过数十亿年的发展,我们的听觉系统已经进化到会对与我们最相关的声音做出反应。再加上声音本身的局限性,我们对声音世界的直接接触被限制在一个频率范围内,而这个频率范围只是实际存在的声音的一小部分。那些听不见的领域将是第6章的主题。