2026年05月19日 

金华日报 数字报纸


第04版:深度

在横店,感受无法被AI取代的真人配音

短剧的突飞猛进,让配音需求如潮水般涌来,但与此同时,AI配音却以不到真人1/3的价格和数倍的交付速度,迅速抢占市场。配音行业是否正在被AI技术所碾压?带着这个疑问,最近,记者走进横店影视城一家录音棚。这里就像“声音工厂”,每天产出各种各样的哭喊声、低语声和嘶吼,经过层层雕琢,最终进入万千观众的耳朵。

不断重复,只为精心雕琢的台词

上午9点,录音师王倩倩已经进入“战斗状态”,她戴着耳机,两只眼睛像雷达一样在双屏之间来回扫描:右边屏幕是短剧画面,左边屏幕是密密麻麻的音轨。她的手指在键盘和鼠标上飞速敲击、拖拽,动作快得令人眼花缭乱。

跟着王倩倩,我戴上耳机,体验了一回录音师的工作,流程其实并不复杂:先听原声,然后启动录音,让配音演员跟上口型,再剪掉多余的杂音,最后把干净的配音贴合到画面下方。王倩倩操作鼠标很熟练,一句话几秒就完成,而我折腾了5分钟,录了8遍才搞定。

“再来一次。”她的语气平静,却透着不容商量的坚持。

我忍不住问:“台词和原片明明一样,为什么还要重来?”她指了指屏幕:“这句是女孩子从远处跑过来时喊的话,你得听出由远及近的层次感,还要带一点喘。前面几遍,气息是平的——画面里她在跑,声音却像站着不动。”

在她的工作词典里,情绪不饱满、口型偏差半帧、气息与画面错位、语气偏离人物设定……只要有一处不对,就要推倒重来。有时候一句十几个字的台词,要反复打磨三四遍,直到声音与画面像齿轮一样严丝合缝,情绪恰如其分。

“其实我们就像声音的雕塑师。”王倩倩一边操作一边说,“不光靠耳朵,还得读懂剧本和画面。”

她给我讲了一个故事:“有一场喷泉边上的戏,现场收音被巨大的水声吞没,字幕和演员的口型完全对不上,配音演员试了好几次,怎么都对不上,我就在旁边建议,要不在台词前面加个‘哎’,没想到配音演员调整情绪之后重录了一遍,口型瞬间对齐了。”

很多短剧拍摄节奏很快,现场台词经常来不及精修,于是录音师的工作就是对声音进行润色和二次创作。为此,王倩倩必须提前通读剧本,摸清楚每个角色的性格和心理,甚至只有一两句台词的群众演员也不能马虎。“我们完整的流程就是试音、定角色、选角色、排期录制、审核出片,整套流程跑下来,平均5天能搞定一部短剧的配音,每个月产出12~15部,忙的时候一天要录七八个角色。”她说这话时,眼睛就没离开过屏幕。

真实的情绪是AI无法取代的

审片是这个“声音工厂”的最后一道关卡。在审片室,两块超宽的屏幕上,40多个角色的音轨挤成一团,像密密麻麻的彩色线条。审片师小王在键盘和鼠标之间飞速游走,反复比对。“这句话应该加个特效。”“这句台词声压有点高,再往下拉一点。”小王的耳朵像一台精密仪器,能精准抓出音轨的瑕疵。“配音讲究的是整体的平衡和节奏,有主有次,情绪要连贯。”

“今年很多制片方都问我们能不能改用AI配音,好像不用就落伍了。”小王说,现在的AI配音工具制作出来的声音标准而稳定,只需要几秒钟,输入台词,就能出现一个清晰且带着预设哭腔的女声。但这并不是越完美越好的。

她点开一段真人配音演员的哭戏,我听到了声音中藏不住的痛苦和哽咽,气息也断断续续。“这就是AI无法取代的情绪,它或许知道这里该哭,但它生成的声音太标准了,对于脚步声、风声等标准音效能做得很好,但是这些关乎角色心情和剧情张力的台词,AI还摸不着门道。”小王坦言,一些重复性的体力活可以交给AI,但是创意和灵魂,终究还是得靠人来把握。

AI配音的出现,反而帮他们筛选了客户,也推动演员们把戏打磨得更细,将标准定得更高,也让市场更多地为好声音买单。

我问她,配音演员最核心的能力是什么?她没有直接回答,而是让我站到话筒前试一次。屏幕上,一个女二号仓皇推门,急喊:“你们在干什么,快放开他!”我压低声音念了一遍,语气平淡得像在读课文;又扯着嗓子喊了一遍,尴尬得自己都想笑。语速对不上,气息全乱。

“别光动嘴,用上身体。”小王在旁边指导。他让我站起来,模仿推门的动作——肩膀发力,呼吸急促起来。这一次,声音像是自己从身体里挣脱出来的。虽然依然生涩,但至少不再空洞。

“镜头前的表演有表情、动作、神态帮助烘托,但配音演员只有声音这一个武器。”小王说,“如果你摸不透一个人物心里的那根弦,角色就是扁平的。AI配音很完美,发音标准、吐字清晰、声线丰富,但恰恰是那些‘不完美’,哽咽时的破碎气声、情绪失控时的破音、哭到极点的噎住,才让声音听起来像一个活生生的人。”

在横店影视城,每天都有新剧开机、杀青,让观众深受震撼的,除了画面之外,还有配音演员那些真实的颤抖、哽咽和嘶吼,这些远不是算法能够模拟的。而面对AI,小王说,他并不把它当成一个“抢饭碗的敌人”,而像是一个最严苛的评委,使得对自己的要求越来越高,口型贴合度和情绪精度。“AI在逼我们把戏磨得更细。”小王说。

记者手记

这次体验让我第一次感受到声音的力量,最让我震撼的,不是配音演员的技巧有多娴熟,而是他们面对每一个气声、每一帧口型时的执着,并不是吹毛求疵,而是一种对“真实”的敬畏。

AI或许可以在一秒内生成1000种标准化的哭泣,但是它永远也无法模拟一个人在真正心碎时的哭声,是噎在喉咙里的,是破碎的,也许是不完美的,但足够真实。我最大的感受就是:或许技术可以模拟声音的频率和音色,但是录音棚里传递的真实情绪,是算法学不会的。

本报记者 张丹楠/文 俞佳妮/摄