精华高级音响师速成实用教程第3版

第六章数字声频工作站

5.1数字声频工作站的构成

数字声频工作站的构成主要有两种类型：一是建立一个专门的系统；二是通过在标准的桌面计算机上安装或添加硬件和软件，即以桌面计算机为基础的系统。本章将以实际的系统为例来说明数字声频工作站中的数字声频存储、重放和处理的方法。

5.1.1专门的系统

在早期的硬磁盘声频系统中，对于制造商而言，要开发出专门的系统是要投入相当大的资金的。这主要是因为批量生产的桌面计算机还不能胜任此项重任，并且大容量存储媒体的应用也不如现在这么广泛，并且还需要各种不同的接口和专门的文件存储技术；另外一个原因就是在开发之初，市场的规模还小，可观的研究和设计投入必须收回。

相比而言，专门的系统具有一些明显的优点，这也是它们在专业应用中受欢迎的原因之一。专门的系统不单单只是一个鼠标和一个键盘，而是通过为此目的而设计的一个专门接口来实现用户对系统的控制，这样可以使相应的设备设计更加符合人体工程学的要求。图5-1所示是这种系统的一个实物照片，它可以通过触摸屏和专门的控制器实现各种功能的控制，其中也用到了连续可调的旋转和推拉式控制器。目前将较便宜的专用编辑系统通过一个接口连接到主计算机上，以便进行更全面的显示和控制。这种做法是十分普遍的。

5.1.2以桌面计算机为基础的系统

近些年来，具有内置基本AV功能的桌面多媒体计算机已经面世，并具备了一定的编辑和声音处理能力。虽然桌面计算机中内置的转换器受到成本因素的限制，但是在许多情况下，它们均具备了44.1kHz声频采样和16bit量化的能力。要想改善音质，则要采用第三方硬件厂商开发的硬件设备。

许多桌面计算机均缺乏对数字声频和视频信号直接处理的能力，但是可以通过增设第三方开发的硬件和软件来将一个桌面计算机转变成一台AV工作站，使其具备对伴随数字视频的几乎无限数量的声轨的声频信号进行存储的能力。通常的方法是在计算机的扩展槽上安装一块声频信号处理卡。该卡利用一个或多个DSP芯片来执行所有的声音编辑和后期处理工作，使主计算机成为一个主要的用户界面。声卡通常被接到一个声频接口上，这一接口可能包括了大量的A/D和D/A转换器，诸如AES/EBU数字声频接口，也可能有SMPTE/EBU时间码接口，在某些情形下还可能有MIDI接口。在声频扩展卡上常带有可与一个或多个磁盘驱动器相接的SCSI接口，这是为了优化声频文件交换操作而设的，同时为了达到这一目的，有些基本的系统使用了自身的SCSI母线。图5-2所示为以桌面计算机为基础的声频工作站的典型系统，图5-3中的照片示出了这种系统中所用的声频处理卡。

目前，苹果的Mac机系统成为声频工作站最受欢迎的一个机型。它采用了高速内部扩展总线，并具有出色的图形用户界面，而且从年开始已使用SCSI母线作为它与周边设备的接口。近年来，大量的以Windows操作系统为基础的产品已经推出，同时面世的还有诸如以Unix为基础的SGI这样的其他平台系统。后两种平台打算以所谓的PCI扩展总线来取代苹果的MuBus，并且由于来自一个平台的系统软件正在被其他的平台所模仿，所以硬件平台间的差别变得越来越不明显了。

5.2数字声频工作站的声频处理

5.2.1大容量存储媒体声音的记录原理

1.声音文件

在数字声频工作站中，记录是以声音文件的形式存储在大容量存储媒体上的。存储媒体通常是磁盘，在某些情况下也可以使用诸如用于磁盘备份的其他媒体。这里，将磁盘作为存储的主要方式。声音文件是一种任意长度的记录。就磁带记录而言，磁带的部分可以以不同的时间来记录，并且在这种情况下，磁带被划分成代表完全不同记录的区域：它们可以是一个专辑中的“轨”，或录音期间的“某次录音”，或者是诸如声音效果的一小段单独的声音。磁带录音过渡到“声音文件”概念的捷径就是：所记录声音信号的不同单元，安装到可利用空间的单元的大小。

在声频工作站中，人们应将磁盘看成是一个“声音的仓库”，其中的某一部分与任何的其他部分并没有特定的时间关系—不能说某一部分在另一部分之前，或在另一部分之后。这是一种随机的特性，或直接访问存储。

一个磁盘可以存放不同长度的多个声音文件，每个声音文件可以是10min的音乐节目，也可以是1s的音响效果。最重要的是，人们能够在可以利用的盘容量上存放尽可能多的声音文件，尽管有些操作系统对能够由目录结构处理的独立文件的数目有一个上限限制。每个声音文件是由众多的独立的数据块组成的，并且数据块的大小通常限制文件所占据的最小数据块的大小，因为系统通常并不写部分的块。

一般声音文件既可以是单声道的，也可以是立体声的。也就是说，一个声音文件可以是单独一个通道，也可以是两个相关声音通道的组合。声音文件几乎没有立体声双通道以上的多通道形式，因为多通道的操作是通过存储多个单独的单声道文件来实现的。同时每个通道的立体声声音文件包括了立体声的左和右通道，通常采用声频文件格式进行逐个样本的交错处理。这样有利于两个通道同时进行重放，而且保持固定的时间关系。访问一个立体声文件与访问单声道文件并没有什么不同，只是在相同的声音持续时间内立体声文件需要传输的数据量加倍了。从使用者的观点来看，系统在一个标题下可以表示一个立体声声音文件，并且在文件页头的注释中表示为立体声。在这种情况下，所有的缓冲将必须分成两部分，以便使左通道的样本读写于一组内存地址，而右通道的样本读写于另一组内存地址。正如所预计的那样，立体声文件所占据的磁盘空间是对应的单声道文件占据空间的两倍。

2.RAM缓冲

计算机磁盘驱动器原本并不是为记录声频信号而设计的，尽管它们可用于此目的。通常，磁盘被格式化成扇区形式，并组成数据块，而以块构成的文件不可能连续地存储要求出入转换器或数字接口的样本是一个恒定的传输率，是一个不间断的数据流。因此，数字声频软件和硬件必须具备能将脉动的数据流转换成连续的数据流，及其反向变换的功能，通常这要通过称为短时间“缓冲器”或存储器的RAM来取得。

RAM是临时性的固态存储器，它具有非常快的访问时间和传输率，可以由声频工作站的CPU和DSP硬件直接进行寻址，并且用于对进出磁盘驱动器的声频采样的临时存储，如图5-4所示。在记录期间，声频样本以规律的速率写入到RAM之中，经过短时间之后，再从RAM中读出并写成磁盘的数据块。在一次操作中，至少要传输完整的一个声频扇区，通常一次操作要写多个扇区。传输进行了有效的时间压缩，因为ms的样本，写入到磁盘中只需要20ms的短脉冲，紧接着的是一个间隙。在进行简单的重放时，数据块以脉冲形式从磁盘传输到RAM之中，然后以稳定的数据率读出并传输到D/A转换器或数字接口。由缓冲器传输出数据的处理一般是在文件被全部传输至缓冲器之前就开始了，因为不这样，则在开始重放与正式听到输出的声音间就有一个难以让人接受的延时，并且缓冲器的容量必须足够大才能盛得下完整的最大声音文件。

RAM缓冲的作用可以比作一个水箱。假定在水箱中存了足够的水，它可以保证在其输入和输出口供给和变化的要求，同时能保持提供不间断的供给。如图5-5所示，它用一个底部有洞的水槽并且由一个水龙头注水来模拟这一过程。人们可以将水龙头看成是磁盘驱动器，而将流出洞的水看成是声频输出。水龙头可以间断地向水槽注水，但是在某种限度内，它可以转成连续的水流。如果水流入水槽的平均流量与流出底部的洞的平均流量相同的话，那么水槽既不会流空，也不会溢出水。如果由洞流出的速度比水龙头注入水槽的速度快，那么它一定流空。另一方面，如果水龙头始终开着，并且注水的速度比流出的速度快的话，则水槽就可能溢出水。

很显然，在此需要一些控制机制，即在水槽里面接上一个传感器，以检测水位的高低，如图5-6所示。这个传感器连接到控制控水线阀门开闭的控制逻辑之上。当水平面变低时，阀门打开；而水平面上升时，阀门关闭。水槽出口的水龙头可以控制水流停止和开始，其中的控制机理相当于声频工作站的软件。在记录和重放期间，指针递增和递减，以触发RAM缓冲器充满的状态，根据充满的状态来决定是传输新的数据块进出磁盘，还是停止传输。

这种模拟比较还可进一步进行下去。假定水槽有不止一个洞。

RAM缓冲还有许多其他的用途。首先，它可以保证来自存储设备的数据中任何短时间时基的不规则变化能被平滑掉，并且不会对音质有影响。从存储器写入内存的数据，即使存在时基抖动，仍然够在准确的晶体时钟控制下以一个恒定的速率从存储器中读出数据。缓冲带来的唯一不足，是在缓冲器的输入和输出间引入了小量的延时，这一延时是由样本写入RAM，然后再从RAM读出这一过程的延时造成的。延时的最大值是由缓冲器的容量决定时，就像小的缓冲器那样，存储器被充满时，在新的样本可以写入之前必须将其部分腾空。缓冲器延时的影响在操作时可以被掩盖掉。因为数据可以在所要求的时间之内从磁盘中读出，并且在获得样本之后以适当的时间写入。

其次，缓冲器还能用于同步目的。如果声频信号要与时间码这样的外部基准同步，那么从缓冲器读出数据的数据率可以进行细微的调整，以确保维持锁定。在实际应用中，要保证同步处理不会产生听得见的副作用是一个相当复杂的课题，该问题将在介绍时基和同步问题中进一步讨论。

在数字声频系统中缓冲器的容量可以由用户来控制，也可以不由用户控制，但是典型值为0.5～2MB。在这种应用中，工作的RAM区域可以不予考虑，因为它是在声频处理卡之中的，而不是主计算机的系统RAM。一般而言，要处理的通道越多，缓冲器就越大，因为每个通道均要有自己的内存空间；另外大一些的缓冲器有助于弥补较差的碎片存储空间的影响，虽然它不能补偿总体运动很慢的磁盘驱动器。

3.磁盘驱动器的性能

作为主要的数字声频存储器而出现的磁盘驱动器，其重要性能就是访问时间和传输率，而且持续传输率比瞬时传输率更重要，因为它更适合表现实时文件传输工作的性能。

如果以不同分辨率的数字声频信号所需的数据传输率和容量为依据，人们能够制定出存储设备所应具备的性能。48kHz采样、16bit量化的单声道声频信号的数据率大约为0.75Mbit/s，因此可以认为传输率为0.75Mbit/s的存储器能够取得一个声频通道的数据重放的满意效果。如果存储器是由可忽略访问时间的固态RAM构成的，那么0.75Mbit/s的传输率已足够了。但是，通常情况下存储器件是磁盘驱动器，其访问时间严格限制了进出缓冲器的平均传输率。虽然由磁盘至缓冲器的脉动传输率可能比较高，但是当驱动器搜索新的数据块时在传输上产生的缝隙将降低有效的传输率。因此访问时间和传输率的综合作用的结果便是有效传输率。所需要的是快速的传输率和短的访问时间。

缓冲器的作用就是要掩蔽掉访问时间延时的影响，并且我们知道缓冲器的大小将取决于潜在的访问延时。如果传输是无规律的，也就是在长时间的间隙之后是极快的传输，那么缓冲器就可以在非常满和非常空的状态间变化，而不是在半充满状态附近徘徊。在前一种情况下，就可以需要一个大的缓冲器。

在使用一段时间之后，磁盘很可能碎片化，并且将导致文件块被存储在许多分开的位置上。存储被碎片化越严重，则数据检查的效率越低。更进一步，访问时间取决于数据块的物理位置相距多远，移动的物理距离短的比距离长的在检查动作时所用的时间就短。所以，指标中所给出的访问时间只是一个大概的表述而已。

某些存储媒体在记录时具有不同的访问时间和传输率。例如，磁盘采用磁记录方法进行记录，它是用新的数据将原来的信息完全覆盖掉，而不用事先进行擦除处理；磁盘驱动器通常需要两个阶段的处理才能在原来的数据区上重新写入新数据，即首先要将块区域进行擦除处理，然后再写入。虽然有各种不同的处理方法，但是都存在局限性。有的可能需在写入之后，还要进行“验证”通过处理。这就是说记录性能不可能总是与重放性能一样出色，并且磁盘驱动器是可以同时重放比所记录的更多的通道。

基于以上原因，通常很难计算出一个磁盘驱动器到底能处理多少声频通道。例如，假定磁盘驱动器的平均访问时间为20ms，传输率为20Mbit/s，如果访问时间趋于零，那么传输率为20Mbit/s时将允许以上面假定的分辨率来传输26个左右的声频通道，但是实际工作时的有效传输率将达不到这个数目，可能在大部分的工作环境下，可以安全可靠地工作的通道只有12个或更少。如在声频编辑中，编辑对磁盘驱动器的性能也有附加的要求，具体则取决于执行怎样的编辑。正因为如此，有些厂家为了保证重放的安全可靠，将其系统限制为：每个磁盘驱动器可能只重放4或8个通道，尽管在有些情况下，驱动器有能力处理更多的通道。他们是宁愿始终保持可靠的性能，而不去冒险去做一些危险的事。在其性能许可的范围之外使用磁盘驱动器的影响通常是会产生重放时的失落，并且在打算重放多个编辑处理的大量通道时，会产生诸如“驱动器太慢”这样的系统信息。

4.分配单元或传送块

优化数据进出存储器设备的效率，将取决于对任何所给的文件传递要保持磁头寻道的数目最小，并且要求认真优化声频传送块或分配单元的大小和位置。一般而言，磁盘的扇区包括B的信息，但有些备选的驱动器采用了B的扇区。尽管如此，这个容量与中等长度的数字声频文件的大小相对比还是太小了，并且如果一个文件被分开来存储到分布于整个磁盘的B的数据块中的话，则由于要对磁盘的不同部分进行寻道，所以工作效率将不可想象地被降低。正因为这样，通常要定义一个最小的传送块，这个传送块是可以一起被传送的字节数目，并且最好将它们相邻存储，以取得效率的改善。或许传送块应包括8KB的声频字节，这种情况，它将占用16个B的扇区。为了在存在碎片的情况下提高磁盘空间的使用率，传送块的容量必须足够小，而为了提高数据传送速度，传送块的容量应大一些。如果在主计算机本身的文件系统之下数字声频系统存储声音，那么在对磁盘卷进行格式化期间，传送块的大小应该是固定的。

5.2.2多声道记录和重放

1.是多轨还是多声道

重要的一点是要弄清多声道工作的工作站与磁带录音机的多轨录音概念间的基本区别。这一区别就是“声轨”。

在工作站中，“轨”和“声道”可以彼此分离，即在声音文件中，一旦存入了数据就可以根据用户的选择来重放任一声音通道，甚至可以将轨的概念完全废除，但这要取决于系统的用户接口，并且大多数厂家均保留了轨的概念，因为它既方便又便于理解。在工作站的术语中，轨只是一种表示将声音元素编组在一起在同一声道上重放的方法，但在磁带录音中它们并不是固定的。图5-7所示为对多轨包的模拟显示，图中轨用含有声音文件片段的水平条表示。左手方可以改变用于哪一轨重放的具体声频输出安排。通过左右滑动声音片段，可以将声音片段在虚拟轨上沿时间轴移动，如果需要的话还可以将其复制或移至其他轨上。

2.输入、输出、轨和声道

由于轨、声道和声频输入及输出间有松散的关系，所以经常引起混淆。首先，应该牢记的是，这些概念中没有一个必须与其他相关联，虽然有时设计者可以决定让它们联系起来。在24轨磁带录音机中，有24路输入、24路输出、24条声轨和24个声道，所以能很容易地看出它们之间的直接关系，甚至可以准确地说出磁带的第13轨是在什么时刻开始录音的；在工作站中，例如，可以有2个输入，8个输出，99轨和8个声道，所以几乎不可能准确地说出第13轨是在什么位置开始录音的，或者说在它上面录了什么信息，因为这完全取决于用户的决定。在这个例子中，由于设计者允许用户在任何一个时刻进行记录，所以可能仅提供了2个输入，但是这非常像将这2个输入分配至任何一“轨”或任何输出通道上。两个声道允许记录立体声或单声道声音文件，这些声音文件可以存储在任意的位置上，并且可由用户来为其取名。尽管一次仅能记录两轨，但是这个操作可以执行多次，以便在存储器中建立起大量的声音文件。

在有些系统中，轨的概念被认为是很重要的。在上面的例子中，有99个声轨，但却只有8个输出或声道。这是因为允许用户在任何一轨上记录信息，但是用户仅可以同时重放其中的8轨。同时输出声道的数目是受存储器件上传输率、系统的信息处理能力和所用的D/A转换器的数目的限制。通过扩充系统，即增加更大或更快的磁盘和增强处理能力，可同时重放的声轨数可以超过99个。许多厂家在系统设计中已经采取这种模块化方案，允许用户从简单的开始起步，待时间和资金允许时，再扩充系统的能力。

3.轨的使用、存储容量和磁盘安排

对于多通道而言，存储的容量会随着通道数目的增加成正比地增加，但是有许多“轨”在大部分时间是空白的，所以实际上的8轨录音并不需要8倍于单声道录音的容量。如果考查磁带上的多轨录音，就会发现在没有记录内容的磁带段上留下很大一段空隙。所要用的总的存储空间将取决于节目中所用的单声道文件的总体持续时间，而不必去理会轨或声道是怎么安排的。例如，Anderson已经估计过，故事片成片中的音响效果轨大约有1/3是无声的寂静段，而对白轨只有2%～20%被利用。

人们常说，以磁盘为基础的系统并不在轨上记录无信号的寂静区，所以也就不会占用相应的存储空间，但是寂静段所节省的存储时间只是输出的声音文件间所存在的空白段落，在这一段落没安排重放的声音文件，如图5-8所示。所记录的寂静段落占用的磁盘空间与记录音乐占用的空间是相同的。

多声道磁盘记录系统常常使用不止一个磁盘驱动器，并且一个单独的驱动器仅能用于有限数目的声道，所以必须首先确定一个存储器件实际能处理多少声道，然后再制定出所必需的总容量。有些早期的系统打算采用将某些磁盘驱动器固定安排给某些声轨组的方式来模拟多轨磁带录音机的做法，如图5-9所示，但是这样限制了操作的灵活性。如果一轨上的声音文件另一轨也需要，那么就要花一定的时间将其复制到相应的驱动器上。如今这种方案已很少见了，而磁盘驱动器的性能正变得重要了，人们可以用一个单独的驱动器来同时重放大约16个声道。在模型化的系统中，如果需要更多的声道记录和重放能力，则只需简单地增加磁盘I/O卡，将它们与单独的磁盘相连即可。如果需要更大的存储容量，则可以将更多的磁盘驱动器接到相同的SCSI总线上，如图5-10所示。这样文件存储在哪个驱动器上相对而言并不重要，只要软件能够处理多驱动器的寻址就可以了。

4.多声道存储和缓冲

非线性记录的基本性能之一就是能够随时在任何输出通道上重放文件。原有的文件间固定时间关系的概念已不再成立，并且文件记录的顺序与其重放时的顺序没有必然的关系。对此，实际上是一个磁盘驱动器能够为多个输出提供文件，实际使用中，可以同时访问大量的文件。任何的文件可由系统随时使用，以及可分配到任何输出上的思想，就是为什么以块构成文件的物理位置，并且在盘面上彼此相对“邻近”存放的原因之一，这样可以减少问题的发生。在多声道工作时，尤其是影视后期制作时，小的和大的文件以各种不同时间关系重放，在声频磁盘驱动器上的磁头定位器被希望能够在各个地方工作，以满足重放每个“轨”的要求。

如果原本在时间上挨得很近的记录的块被存放在存储器件中相距很近的区域上，那么将有助于在它们之间取得良好的特定时间关系。在这些文件同时需要时，这种做法可以具有访问时间上的优点，但它也有一个缺点，即在同样的时间上只需要它们中的一个时，就没有相距一段空间存储的优势了。由此认为任何一种将某一文件比其他文件更靠近另一文件存放的方案将有助于在这些文件间取得良好的特定时间关系。看来似乎唯一可行的方案是将数据块随机地分布于整个存储器中，在这种情况下，无一个固定的关系将优于任何其他的处理。

上面所述的伪随机存储技术在对一个服务于大量通道的驱动器进行真正的随机访问时，会优化传递的效率，但是在系统试图模仿多轨磁带录音机时，每个磁盘驱动器仅服务于很少几个通道，可能对采取一种将声频数据以物理顺序写入磁盘的方案会更加合情合理，这样可以建立起一个串行的时间关系。

（温馨提示：全文小说可点击文末卡片阅读）

在多通道系统中，一个正在被访问的存储器件将为大量的通道提供输出，系统将处于必须决定在什么时刻提供哪个输出的地位，并且必须为每个通道保持一个合理的缓冲器充满状态。这将与用户所制定的声音文件重放次序一起取得，并且它将表示出哪个文件在什么时间分配到哪些输出上。编排软件将

转载请注明：http://www.abuoumao.com/hyfz/3625.html

上一篇文章：计算机模块16练习含答案我的精品

下一篇文章：调频广播的魅力上收音机评论译介