- 收藏
- 加入书签
杜比全景声技术在广播媒体中的应用与思考
——以《满月升起》声音剧场为例
摘要:本文以纪念坂本龙一的声音剧场《满月升起》为实践案例,探讨杜比全景声在广播媒体中的应用价值。通过梳理杜比全景声的发展脉络,分析其家庭化、个人化消费场景的转型,以及制作端从“闭源”到“开源”的变革。结合制作实践,总结杜比全景声“低成本”制作方案的局限性。针对受众端,提出多版本兼容性建议,归纳适用于杜比全景声的广播节目类型,强调技术服务于内容核心的理念。
关键词:杜比全景声;广播媒体;音频制作;声音创作
“我还能看到多少次满月升起呢?”这是坂本龙一在经历第一次直肠癌大手术前,躺在病榻上的喃喃自语。
2025年3月29日,在世界级音乐家坂本龙一逝世两周年之际,北京音乐广播联合索尼音乐、中信出版社、传新科技、杜比实验室在传新科技杜比全景声体验空间共同举办“满月升起”·纪念坂本龙一逝世两周年杜比全景声音乐聆赏会。在9.1.6声道杜比全景声的加持下,伴着主持人杰克糖的深情播讲,在场观众得以在音乐中与坂本龙一来了一场沉浸感十足的“灵魂共振”,多位观众潸然泪下。
笔者是北京音乐广播的录音师,担任《满月升起》声音剧场的声音设计、后期制作。虽然本次活动只是一次中等规模的音乐沙龙,活动报名人数350多人,因座位有限最终遴选了80余名观众到场。而“满月升起”在线上的影响力是超预期的:QQ音乐歌单播放量1.7万+、网易云音乐歌单播放量8700+,听听FM客户端直播收看人数67375,直播间点赞近31万。这可以说是笔者从业以来参与的最成功的一次杜比全景声线下演出,也引发了我作为一个广播音频从业者对于杜比全景声应用的一些深入思考。
本文将先对杜比全景声自问世以来的发展脉络进行总结和梳理,并从制作端、受众端两个切入点来分析杜比全景声技术在广播媒体中的应用和价值。
一、杜比全景声的发展脉络
(一)杜比全景声的“开拓性”
2012年,杜比实验室正式发布杜比全景声技术,定位为电影行业开拓性3D音频新标准,其“开拓性”主要体现在:
(1)加入天空扬声器。将声场维度从2D拓展到了3D,实现了顶向声音塑造。
(2)突破声道概念。通过声床(Bed)+对象(Object)+元数据(Metadata)三层架构,实现声音在3D空间的精确定位与运动轨迹。在不同监听环境之间进行切换时具有良好的兼容性。
(3)灵活地再渲染(Re-render)。杜比全景声工程文件(.atmos)支持多种再渲染格式,如2.0、5.1、7.1、7.1.4、9.1.6、Binaural(双耳)格式等。可实现灵活地上下变换,满足不同平台介质的需求。
(二)杜比全景声的“自我革命”
杜比全景声问世十三年,恰逢移动互联网、自媒体的兴起,新技术、新理念日新月异,外部市场环境也发生了翻天覆地的变化。杜比实验室始终能够根据环境的不断变化对杜比全景声进行一次次“自我革命”。
1、消费端——从影院到个人
影院阶段(2012-2014)。2012年6月,全球首部支持杜比全景声的影片《勇敢传说》上映,标志着杜比全景声时代的开启。问世之初,杜比全景声是专门针对电影制作、放映的系统,软硬件具有很高的技术壁垒,除专业院线外几乎没有应用场景。
家庭阶段(2014-2020)。2014年,杜比实验室发布了杜比全景声家庭影院7.1.4标准;同年,首款支持杜比全景声7.1.4标准的家用功放问世、华纳兄弟发行首套杜比全景声蓝光碟《超凡蜘蛛侠2》,标志着杜比全景声家庭化移植的开始。
个人阶段(2020至今)。2020年,苹果Airpods Pro开始搭载头部追踪空间音频功能,支持杜比全景声音乐与影视内容,开创“耳机即影院”的概念。同年,Apple Music推出杜比全景声专区,标志着杜比全景声个人消费时代的开始,杜比全景声从“偏科影视”转向“影视音乐双修”。
2、制作端——从“闭源”到“开源”
(1)硬件“闭源”阶段(2012-2016)。2012年6月,杜比实验室推出了RMU(Rendering and Mastering Unit)硬件渲染器,强制绑定于杜比全景声制作全流程,仅支持64声道渲染,售价高达数万美元;2014年,杜比实验室更要求影院必须采购RMU才能进行杜比全景声认证,导致硬件垄断加剧。单部电影的杜比全景声制作成本高达数十万美元,仅好莱坞大片厂可承担。
(2)软件“闭源”阶段(2016-2023)。2016年,欧盟对杜比实验室发起垄断调查,迫使其开放软件接口;同年,首个脱离RMU硬件的软件解决方案Dolby Atmos Production Suite(DAPS)发布,搭配Avid HDX板卡可支持128个对象渲染;2018年,推出功能更为完善的Dolby Atmos Mastering Suite(DAMS),可实现母版文件(ADM BWF)导出。Netflix剧集《罗马》成为首部基于DAMS纯软件制作的杜比全景声流媒体电影;2023年3月,杜比实验室将DAPS与DAMS合并为统一平台DAR(Dolby Atmos Renderer),实现了混音与母版功能的整合。售价为299美元终身订阅,大大降低了杜比全景声制作成本和门槛。
(3)“开源”阶段(2023至今)。2023年12月,Avid 发布Pro Tools 2023.12版本,将杜比全景声渲染器(DAR)集成到软件内部,并在Pro Tools Studio和Ultimate两个版本中免费提供,无需额外购买软硬件。Pro Tools 2023.12的发布是具有里程碑意义的,标志着杜比全景声“开源”时代的开始。用户可以直接在DAW内部完成杜比全景声监听、混音和渲染,虽然并没有解锁DAR的全部功能,但已有功能基本可以满足除专业院线电影制作以外的大多数应用场景。
(三)总结和展望
自2012年问世来,杜比全景声在保留自身核心要素的同时,持续不断地“开放壁垒”,从曾经“高高在上”的王者,逐步变为今日“平易近人”的伙伴。未来,笔者也期待杜比实验室能够与各大插件厂商进行合作,推出更多支持杜比全景声的效果器,进一步优化制作体验、提高制作效率。
总之,杜比全景声的发展历程让我想起了一句古话:旧时王谢堂前燕,飞入寻常百姓家。
二、杜比全景声在广播媒体制作端的应用
(一)实现杜比全景声制作的“最低成本”
得益于杜比全景声于2019年开放了Binaural(双耳)监听渲染模式,并于2023年12月将渲染器集成到了Pro Tools内部。当前,理论上我们只需要一台电脑+一副监听耳机+加一套Pro Tools工作站,便可以开始制作杜比全景声了,软硬件成本极大缩减。
笔者在制作声音剧场《满月升起》时采用的是耳机+Binaural监听模式,设备情况如下:
(1)耳机——Sennheiser HD 800S(任意监听耳机均可代替)
(2)耳放——Sennheiser HDV 820(非必要,可选择声卡直推耳机)
(3)电脑——MacBook Pro Intel i7(优先选择Mac,稳定性更佳)
(4)数字音频工作站——Pro Tools Studio(必须是2023.12之后的版本)
(5)声卡——MOTU UltraLite mk5(非必要,可用板载或虚拟声卡代替)
(6)杜比全景声插件——Liquid Sonic - Cinematic Room \ Seventh Heaven(非必要,可通过多个立体声或环绕声插件来“模拟”)
(7)杜比全景声渲染器——DAR(非必要,可用Pro Tools内置渲染器代替)
除去非必要选项,实现杜比全景声制作的“最低成本”只是一台电脑+一副监听耳机+一套Pro Tools工作站而已,几乎是“零成本”。这正是多年以来杜比全景声坚持“自我革命”,不断走向“开源”的结果。
(二)Binaural监听模式下的注意事项
现阶段,杜比全景声的Binaural模式不论是作为监听模式还是渲染输出,品质都不是非常理想。利用HRTF函数所带来的空间定位感有限,并且很难把声音“推远”,即使在DAR设置中把Binaural模式调为“Far”,效果也不明显,甚至还会在中高频段产生“梳状滤波”失真效果。
因此,杜比全景声Binaural模式下的空间定位只能作为一个大概参考,效果还是无法与扬声器阵列相提并论。对比Plugin Alliance的DearVR Pro这类Binaural插件效果器,以及SMYTH Realiser A16这类集成了混录棚IR的硬件渲染器相比,杜比全景Binaural模式同样具有一定差距。
这也是笔者期待未来杜比全景声能够有所提高的方面,毕竟不论前期制作环境如何,最后来到受众端,听众在绝大多数情况下听的还是立体声或Binaural版本的音频。如果最终在立体声或Binaural模式下杜比全景声的效果大打折扣,那么前面所有的工作都如同空中楼阁,无法落地。
(三)Binaural模式与扬声器阵列的监听效果对比
在音乐聆赏会的前几天,笔者提前来到传新科技的杜比全景声体验空间,利用其高品质9.1.6扬声器阵列来检验我通过监听耳机+Binaural监听模式制作的《满月升起》声音剧场的节目效果。
经过反复推敲,笔者的感受是:在描绘坂本龙一“去北极听冰川”“将麦克风沉入冰川和海底,录下了非常奇妙的声音”“躺在病床上整夜听雨声”等自然场景时,环境音效堆砌得不够丰富。原本通过Binaural模式监听时认为足够饱满的声场,实际来到9.1.6扬声器阵列上,才发现当各类声音元素被“肢解”到了各个方位上后,它们之间的关联性大大减弱了,整体声场显得单薄,缺乏一致性、连续性。
可见,即使使用最好的耳机+耳放(HD800S+HDV820)配合Binaural模式监听,效果依然并不十分理想。耳机天然的劣势是归根结底只有两个单元,声音元素越多,耳机单元内的各种掩蔽、混叠就越明显,监听效果终究无法与扬声器阵列相提并论。也从侧面反映出,在杜比全景声扬声器阵列监听环境下,由于扬声器单元数量大大增加、分工明确,显著减少了同一发声单元内声音的掩蔽、混叠,提升了声音解析度和声场宽度。加入天空扬声器后,拓展了声场维度,为创作者提供了更为广阔的“画布”和想象空间。
(四)“声床”与“对象”的差异
以往,笔者在通过耳机+Binaural监听模式制作时,将同一声音元素在声床、对象两种模式下进行切换,基本只能感受到音色的变化,却很难体会到声像定位感的明显不同。然而来到9.1.6扬声器阵列进行对比后,笔者对于声床、对象在听感和功能性上的差异有了更加深刻地认识。
在塑造顶向声音时,声床、对象的听感差异尤为明显。杜比全景声默认声床的天空声道只有2个(7.1.2),并不具备在顶向实现前后声像定位的能力;而在9.1.6监听环境下,对象则可以充分发挥6个天空扬声器的功能,实现更为精准平滑的声像塑造,带来顶向前后声像定位感“质的飞跃”。
经过9.1.6校准后,我在《满月升起》声音剧场中显著增加了对象使用比例。如在描绘坂本龙一“将麦克风沉入冰川和海底,录下了非常奇妙的声音”这一场景时,应用对象使得麦克风沉入海底过程的声场变化更为平滑,海底“奇妙声音”的左右声像移动也更加精确生动,大大提升了沉浸感和临场感。
当然,对象的使用也并非多多益善,对象通道的数量最多为118个(Studio版内部渲染最多支持90个)。而且对象对于电脑资源的占用远大于声床,增加对象的使用比例后,系统CPU占用率明显增加,最终生成的杜比全景声Master Flie文件大小也增加了数倍。
总之,声床以7.1.2声道为基底,是声场氛围的构建者,通常动态范围较为稳定、瞬态不突出。常用于自然声场(风声、雨声等)、城市低噪(交通声、人群声等)、氛围音乐、节奏循环等。
对象则用于强调叙事焦点或描述运动轨迹,可在3D空间内自由定位,通常具有大动态、高瞬态的特点。常用于角色动作(脚步、开门声等)、事件触发音(玻璃碎裂、爆炸、急刹车等)、移动声源(汽车驶过、子弹飞过等)、点状高频声源(金属碰撞、水滴、铃铛等)、心理暗示(耳语、幻觉等)。通常需要在数字音频工作站中绘制运动路径。
(五)混响类效果器的运用
《满月升起》声音剧场本质上是一期音效丰富、沉浸感十足的音乐类专题节目,音乐部分需要进行复杂剪辑,与人声、音效相呼应,使这三者成为1+1+1>3的有机整体。为满足音乐编辑需要,节目中选用的是坂本龙一音乐的2.0立体声版本,在此基础上进行全景声上混(Upmix)。
在笔者看来,不论是最后一张音乐会专辑《杰作》,还是过往的录音室专辑,坂本龙一的音乐作品录音制作风格是强调细节、弱化空间的,话筒拾音距离偏近。这种“重细节、轻空间”的风格并不利于发挥杜比全景声的优势。为改善这一点,笔者选用了Liquid Sonic的Cinematic Room、Seventh Heaven两款支持杜比全景声母线的混响器来为坂本龙一的音乐增加厅堂感、空间感,并使音乐、人声、音效在空间层次上区隔开来。
为减小音乐与人声的相互掩蔽,笔者将音乐双声道的声像普遍往侧向Pan了25(如图3所示),避免浪费侧向声像定位空间,减少前方三声道之间的混叠和掩蔽。而对于《Romanzo》《20211201》这两首带有宗教色彩、冥想感的作品,更是完全Pan到了天花板声道(如图4所示)。充分利用杜比全景声的声场维度,强化声音剧场不同段落间的反差,弱化音乐形式同质化带来的单调感,始终保持对听众注意力的吸引。
早在2015年,笔者撰写硕士毕业论文《3D环绕声音乐录音初探》时,包括杜比全景声在内的各类3D环绕声制式都还处于起步阶段,市面上几乎找不到能够直接兼容全景声母线的混响类效果器。笔者当年的妥协方法是:下层使用传统5.1混响器,上层使用4.0(四方声)混响器,通过5.1、4.0两个混响器来“模拟”杜比全景声7.1.4的空间效果,但效果只能说是中规中矩。混响器是一种具有高度统一性,同时又十分强调细微差异性的效果器,想要通过两个混响器的两套算法逻辑来塑造一个统一空间,效果必然打折扣。
经过十年的发展,目前已有越来越多像Liquid Sonic这类兼容全景声母线的插件厂商出现,为杜比全景声的空间塑造提供了解决方案。
(六)内部渲染和外部渲染的差异
2023年12月之前,DAR是制作渲染杜比全景声的刚需,没它不行。然而从Pro Tools 2023.12版本开始,Pro Tools将杜比全景声渲染器内置在了软件内部。自此,在使用Pro Tools进行杜比全景声制作时,有内部渲染(Interier Render)和外部渲染(Exterier Render)两种模式可供选择。
DAR虽不再是刚需,但只有使用DAR(外置渲染)时,才能够解锁杜比全景声的全部功能。内置、外置渲染器的适用场景对比如下:
总之,Pro Tools内置渲染器可以覆盖80%左右的杜比全景声功能,能够满足音乐制作、中小型电影项目以及广播电视节目制作的需求;而外部渲染器在电影终混、多团队协作、复杂元数据控制等场景下具有不可替代性。
笔者制作《满月升起》声音剧场时使用的是Pro Tools Studio 2024.6,虽然支持杜比全景声内置渲染,但Pro Tools Studio 输出ADM BWF时最多只支持100通道。而《满月升起》声音剧场音效丰富、轨道众多,需至少116通道(10通道声床+106通道对象),超出了内置渲染器的上限,只得选择使用外置渲染器DAR。
笔者在初用DAR时并不适应。例如录制Master File时无法从时间码00:00:00:00开始录制,最早只能从00:00:00:01开始。起初笔者并不了解这一点,导致多次尝试录制Master File失败。后得知DAR无法从00:00:00:00录制是一个复杂的技术性问题,涉及行业标准、元数据规范、硬件同步机制等多方面因素,这里就不展开说明了。
此外,DAR在录制和播放时没有“波形”和“轨道”作为视觉辅助,且无法在软件内进行直观的编辑和插录。体现了DAR的设计理念具有一些“模拟时代”的烙印。
三、杜比全景声在广播媒体受众端的应用
(一)环绕声的受众端应用难题
“在电台做环绕声没意义,播出端没有出口。做了半天听众也听不到。”这是笔者初入北京电台工作那几年,常听到前辈老师们说的一句话。
在杜比全景声问世前的环绕声时代,前辈老师们的观点是成立的。相比杜比全景声,基于声道的环绕声标准(5.1、7.1等)主要有以下短板:
(1)没有天空声道,无法实现顶向声像定位。声场维度是2D而非3D;
(2)不支持耳机+Binaural监听渲染,必须采用扬声器阵列进行监听制作。制作、收听场景受限;
(3)基于声道模式,无法实现灵活的格式上下变换。不具备良好的跨设备(如电视端、FM广播端、手机端、汽车端等)兼容性。
在环绕声时代,电视端还未进入智能电视时代;手机端的音乐类App的功能单一;汽车端车机系统几乎不具备智能化;FM广播端受限于物理传输特性,至今最高也只支持2.0立体声。因此,环绕声节目收听场景基本只有两个:专业影院、配备了环绕声系统的家庭影院。这就导致了声音创作者花费大量心血制作的环绕声节目,绝大多数听众无处可听的尴尬局面。
在受众端缺乏应用场景,是环绕声时代最大的难题。这种“老大难”的窘境也催生了兼容性更强的杜比全景声应运而生。
(二)杜比全景声与广播媒体的兼容性
1、如何听到杜比全景声节目
杜比全景声因其“声床+对象+元数据”三层架构的先天优势,具有制作场景灵活、跨平台兼容性强等特点。
在广播节目制作完成后,建议一次性导出三版音频:2.0、Binaural和ADM BWF来满足不同场景需求。
(1)2.0(立体声版)。提供给FM广播端,以及音频客户端的常规版本,兼顾扬声器+耳机收听;
(2)Binaural(双耳版)。专供音频客户端的“杜比全景声专区”。由于Binaural音频必须使用耳机收听才能获得全景效果,采用扬声器播放会产生一定程度的频响失真和相位问题,最好不要将Binaural音频直接提供给FM广播端和音频客户端。建议在音频客户端中设立一个“杜比全景声专区”来播放Binaural音频,或借鉴视频平台一键切换“杜比音效”的功能,实现节目版本在2.0和Binaural之间灵活切换,但一定要提示听众在收听Binaural音频时佩戴耳机。
(3)ADM BWF(杜比全景声母版文件):ADM BWF本质上是基于多声道的WAV格式音频文件组,无法兼容FM广播端和大部分音频客户端,主要兼容平台是Apple Music。此外,线下播放也是ADM BWF的主要应用场景。本次“满月升起”·杜比全景声音乐聆赏会,就是通过电脑DVS(Dante Virtual Soundcard)直接连接调音台播放的9.1.6 ADM BWF文件。而另一次类似尝试是在国家大剧院与北京音乐广播合作主办的“2023台湖爵士音乐节”,中阮演奏家冯满天带来了全景声音乐曲目《山·海·观》。艺术家通过录音设备抓取自然界的各种声音,并通过播放杜比全景声ADM BWF将其“搬运”到舞台之上,再现大自然春夏秋冬的风貌,使观众在现场体会到沉浸式全景声效果。
2、适用于杜比全景声的广播节目形式
并不是所有广播节目形式都值得制作杜比全景声,正如不是所有类型的电影都值得拍成IMAX 3D。
几年前的某次务虚会上,曾有同事提议把某档嘉宾访谈节目制作成杜比全景声。对比笔者的态度是:可以做,但没必要。就好比把《新闻联播》拍成IMAX 3D,技术上可以实现,但意义不大。
绝大多数广播节目都以语言为核心,节目形式单一,音乐、音效的功能定位相对边缘化。保证语言清晰可懂、信息准确传达,是大部分广播节目的第一要务。这其实与杜比全景声所追求的沉浸感、临场感在一定程度上是相悖的。
那么杜比全景声适用什么类型的广播节目呢?笔者认为主要有以下三类:
(1)广播剧。作为广播节目中的“天花板”,广播剧本质上是没有画面的“声音戏剧”,文艺属性很强。其制作工艺与影视声音制作有诸多异曲同工之处,许多场景的制作难度相比影视甚至有过之而无不及。杜比全景声能为广播剧创作者提供更为广阔的“画布”,也使听众拥有更为宽广的“想象空间”。
(2)精品广播专题节目。广播专题节目就好比是没有画面的“声音纪录片”。《满月升起》声音剧场本质上就是一期声音元素丰富的音乐专题节目在线下落地的产物。人声与音乐的耦合丝丝入扣,音乐与音效交融使得人声的情感表达入木三分,人声、音乐、音效三者共同构建起一个个“想象空间”。对于声音元素丰富的精品广播专题节目,运用杜比全景声可以提升收听沉浸感、临场感,起到画龙点睛的作用。
(3)节目片花。俗话说,浓缩的都是精华,那么广播节目最“精华”的部分当数片花。广播片花经常需要在数十秒乃至数秒之内切换多段音乐,堆砌丰富的音效,实现情绪、节奏上的起承转合。片花时长虽短,制作难度却很大,可谓“在针尖上跳舞”。笔者有一位从事电影音效编辑的朋友曾说过,他时常去听一些高质量的广播节目片花,来获得声音设计的灵感。这也从侧面反映出,优秀的广播节目片花具有很高的艺术价值,值得制作杜比全景声。
3、杜比全景声不是“万能滤镜”
在论述杜比全景声的功能性之前,笔者想先拿3D电影技术做一个类比。
2010年,具有划时代意义的电影《阿凡达》上映并火爆全球,至今依然牢牢占据全球影视票房榜第一名,3D电影技术也随即风靡世界。
之后数年间,3D电影如雨后春笋般出现,甚至连家庭电视机都开始搭载3D功能。这些如下饺子般接连上映“3D”电影,大多是2D拍摄、后期转制的“伪3D”电影,之所以有如此多的电影进行这种“3D注水”行为,主要是商业利益驱使的。
近年来,“3D电影审美疲劳”“3D电影是‘智商税’”等论调在网上弥漫开来,越来越多电影消费者在有意无意间排斥甚至抵制3D电影,3D电影热潮迅速退去。2024 年,全球 3D 电影市场规模相比 2016年巅峰时显著下滑,降幅约为40%~50%。
如果说《阿凡达》的导演詹姆斯·卡梅伦是3D电影的奠基人,那么另一位传奇导演诺兰好比是“硬币的另一面”。哪怕经历了3D电影最风靡的十年,诺兰始终是一位坚定的2D电影拥趸,《星际穿越》《盗梦空间》等伟大的电影都只有2D版本。放眼国内,票房排行前十的电影中有六部都只发行了2D版本。2025年春节档屡屡刷新影史票房纪录的《哪吒之魔童闹海》,其3D场次上座率为60%,2D场次上座率却高达80%,可见2D版本更受观众青睐。
十余年来,3D电影经历了从“风靡全球”到“日渐失宠”的窘境,引发了笔者对新兴视听技术应用的思考。其实,3D电影技术与杜比全景声颇有相似之处,它们本质上都是作品的“外壳”,而非“内核”。就好比一件精美华丽的“衣服”可以“锦上添花”,却不能“雪中送炭”。对于声音创作者而言,还是要坚持“修炼内功”,将更多精力放在作品创意、声音设计、剪辑混录等基本功上。无需“神话”杜比全景声,它绝不是美化声音的“万能滤镜”,用不好的话反而会适得其反,放大作品的缺陷。
笔者坚信,伟大的声音作品哪怕只有2.0立体声版本,也依然是伟大的。内容本身才是作品的核心竞争力。
四、结语
笔者对于杜比全景声的研究始于2015年撰写的研究生毕业论文《3D环绕声音乐录音初探》,至今刚好十年。希望通过本篇论文,将十年来笔者作为杜比全景声发展的见证者、技术的使用者产生的感悟,以一个广播音频从业者的视角做一个系统性梳理,也为自己在广播媒体工作多年的实践经验做一个阶段性总结。



京公网安备 11011302003690号