看看语言学家如何分析刘强东涉嫌性侵案电话录音 | 微思客

来源: 微思客wethinker 

编者按

近日,南方都市报发布了一则由“匿名人士提供”的、据称是刘强东涉嫌性侵犯案中刘强东律师与当事人女方的电话录音。今日,“呈现小组”发布了据称是“完整电话录音”的音频资料。一瞬间,在视频真伪风波之后,刘强东涉嫌性侵犯案再起疑团。针对南都的音频以及“呈现小组”发布的音频,微思客特邀语言学爱好者“果子狸”从语音学角度粗析这两则音频材料,供读者参考。

首先,需要科普一下两个语音学上的概念。一个是声波(waveform),一个是声谱图(spectrogram)。声波是指声源体发生振动引起周围空气振荡,振荡的方式就是声波。例如,人在说话的时候,是通过声带振动发声。发音“一”时的声波跟“八”时的声波是不一样的。在声波的基础上,我们可以通过一些语音分析软件获取更多关于声音的特质。例如,声谱图就是记录声音在一段时长内的频率变化。“一”跟“八”不仅仅声波不一样,声谱图呈现的也不一样。语音学家可以通过分析声波以及声谱图来挖掘很多“隐藏在声音里的秘密”。

 

假设说,我们想知道,网上流传的“南都音频”是否真的如“呈现小组”的视频里指出的那样,是被剪辑过的。我们可以通过分析“南都音频”里那23个剪辑点的声波以及声谱,或许能够发现一些蛛丝马迹。如果“南都音频”是被剪辑过的,那么必然会在声波以及声谱图上留下破绽;反之,如果“南都音频”里是连贯的电话录音,那么声波跟声谱图上也能呈现其连贯性。

分析方法

从网上下载两则录音,录入到语音分析软件Praat,分析其声波以及声谱图(spectrogram)的声音物理性质。两则录音皆由网上下载,可能会因为下载、压缩过程中造成一定的音质受损,以下分析也是建立在音频有可能音质受损的基础上。

500

语音分析

“呈现小组”音频里列举了“南都”音频的23处剪辑点。以下分析会针对这23个剪辑点,看看从“南都音频”里是否能找到被剪辑过的痕迹,以及对比“呈现小组”版本的音频,看看两则音频的差异在哪里。

500

这个点是“南都音频”的最开头,无法判断此处是说话人1与说话人2对话的开始或是两人对话的截取片段。

 

对比“呈现小组”的音频,在此点开始之前,有13秒的音频,其中包括电话拨打的信号声,以及说话人2接听电话的应答声。

500

500

在南都音频里,此处的前一句是说话人1在说 “I am an attorney at Caplan & Tamburino law firm”, 然后说话人1接着说“How can I help you?”。请注意,在说话1说完第一句话之后的那一段不规则声波,显示的是当时的背景噪音。但声波在红色箭头处发生了变化,声波的振幅稍微加大了一些,显示背景噪音似乎更加大了。这一点也可以从声谱图里黄色箭头处看出,这一处的声谱更加暗了。如果这两句话是未经剪辑,是说话人1连贯说出来的话,背景噪音的声波不应该有这样的变化。因为在那个静默的阶段,背景噪音应该是相对一致的。当然不排除背景突然多了一些干扰,导致声波变化。所以,“南都音频”在这一点上剪辑的可能性,仅依据声波以及声谱图上来看的话,是有可能的,但这个证据并不是太直接。

对比“呈现小组”音频,在说话人1在说完“I am an attorney at Caplan & Tamburino law firm”,紧接着的是说话2的一段静默以及询问。

500

500

此处的剪辑痕迹比较明显。根据“南都音频“,此处是说话人1在说完“How can I help you?” 之后,静默了一段时间,然后接 “I’m the attorney that you wanted to speak to. ”如果此处是未经剪辑的,在说话1接“I’m the attorney…”时,声谱图上不会出现红色箭头处的bar。这个bar更像是前面还有一些话,但在剪辑的是因为没有办法完全健掉而留下的痕迹。当语流非常快的时候,每个词的发音并不是独立的,是会受前后的词的影响(例如连读、coarticulation等)。所以,此处被剪辑过的可能性比较高。

 

对比“呈现小组”的音频,此处前面还有一段说话人2与说话人1的对话。

500

500

此处剪辑痕迹非常明显!根据南都音频,此处是说话人1在表明自己身份“I’m the attorney that you wanted to speak to.” 之后,说话人2说:“I know the boss,right?…, his name is Liu…”. 当两个并非连贯的音频片段拼接一起的时候,因为不同声音片段的频率是不一样的(即便是两段white noise的拼接,也非常困难),拼接在一起时没有办法很自然地过渡 , 所以很容易出现这样个一个gap。

 

对比“呈现小组”的音频,此处前面还有一段说话人1与说话人2的对话:

500

500

根据“南都音频”,此处是说话2在询问说话人1当事人信息之后,说话人1说:“Go on, ma’am, I’m listening.”. 此处唯一疑似剪辑的地方是当说话人2完成说话之后,有很短的一段静默,声谱图记录了这段静默时间内背景噪音的一些信息(红色箭头处)。而当说话人1接话的时候,从静默到说话人2发声之间的声谱图过渡不大自然。当然,这里也有可能是受去躁音的影响。

 

对比“呈现小组”音频,此处前面还有一段说话人1跟说话人2的短暂对话。

500

500

此处剪辑痕迹明显。根据“南都音频”,在说话人1表明“Go on, ma’am, I’m listening.”之后,说话人2接着说:“Now I want him to give me an apologize.”  露出马脚的地方就在那个 “now”。一个未经剪辑的 “now”, 会在声谱图上呈现一个比较完整的鼻音[n]。而鼻音[n]是一个浊音,浊音在声谱图上的特征是在声谱图最下边有一个voice bar(红色箭头处)。但这个点的voice bar非常不自然,出现了像剪辑点3里的“断层”现象。所以,依此可以判断,此处被剪辑过的可能性很高。

 

对比“呈现小组”的音频,此处说话人2说的是:“OK…emm… Now I want him to give me an apologize.”

500

500

此处剪辑痕迹明显。出现了“剪辑实锤のgap”。参考剪辑点4的分析。

 对比“呈现小组“的音频,此处说话人2说的是:

500

500

此处剪辑痕迹明显。出现了“剪辑实锤のgap”。参考剪辑点4的分析。

 

 

对比“呈现小组”的音频,说话人2说完之后,说话人1接话。

500

500

此处剪辑痕迹明显。出现了“剪辑实锤のgap”。参考剪辑点4的分析。

 

对比“呈现小组”音频,此处对话如下。

500

500

此处剪辑痕迹明显。出现了“剪辑实锤のgap”。参考剪辑点4的分析。

 

对比“呈现小组”的音频,此处的对话如下。

500

500

此处剪辑痕迹明显。出现了“剪辑实锤のgap”。参考剪辑点4的分析。

 

对比“呈现小组”音频,此处对话如下。

500

500

根据“南都音频”,此处为第一段电话录音的结束。紧接着第二段电话录音的开始。此处无法判断,第一段录音是否在此处有删减,也无法判断此处是否真的为第二段录音开始。

 

对比“呈现小组”音频,第一段录音在此处之后,还有一段说话人1与说话人2的对话。

500

另外,根据“呈现小组”的音频,第二段录音在此处之前,还有一段电话拨号信号音,以及一段说话人1与说话人2的对话。

500

500

根据“南都音频”,此处是说话人1在说完“I’m just calling back to touch base and get what your proposal is.” 紧接着说话人1说“You had asked that you want to receive an apology and money. So my question to you is, what is your proposal for money?”在两句话之间的静默时间,声波呈现出了不自然的波动,这个说明可能前后两句话的背景噪音不一样。情况类似剪辑点2. 此处有被剪辑的可能性。

 

对比“呈现小组”的音频,此处两人对话如下。

500

500

此处剪辑痕迹明显。出现了“剪辑实锤のgap”。参考剪辑点4的分析。

 

对比“呈现小组”音频,此处删除的是一段1秒钟的沉默。

500

此处剪辑痕迹明显。出现了“剪辑实锤のgap”。参考剪辑点4的分析。

 

对比“呈现小组”音频,此处删除的是一段1.87秒钟的沉默。

500

此处剪辑痕迹明显。出现了“剪辑实锤のgap”。参考剪辑点4的分析。

 

对比“呈现小组”音频,此处删除的是一段2.1秒钟的沉默。

500

此处剪辑痕迹明显。出现了“剪辑实锤のgap”。参考剪辑点4的分析。

 

对比“呈现小组”音频,此处删除的是一段0.53秒钟的沉默。

500

根据“南都音频”,在说话人2说完:“I just wanna ask…ask about his proposal.” 之后,说话人1接话:“I’m gonna need a little bit of guidance from you.” 此处有嫌疑的地方是红色箭头处的阴影,像是friction,但是说话人1接话的“I’m” 是一个双元音[ai]开头, 不应该出现friction。这里也可能是背景噪音导致。

 

对比“呈现小组”的音频,此处对话如下。

500

500

此处剪辑痕迹明显。出现了“剪辑实锤のgap”。参考剪辑点4的分析。

 

对比“呈现小组”的音频,此处删减的是说话人2的一段语塞。

500

此处剪辑痕迹明显。出现了“剪辑实锤のgap”。参考剪辑点4的分析。

 

对比“呈现小组”音频,此处删减的对话如下。

500

500

此处呈现了在红色箭头处的前后声波以及声谱图都有一些不同,这可能是因为背景噪音发生了变化,也有可能是剪辑之后的结果。参考剪辑点2与剪辑点14的分析。

 

对比“呈现小组”音频,此处说话人的对话如下。

500

500

此处为南都音频第二段录音的结尾。根据此点无法判断,此处是否是第二段录音的结束。

 

对比“呈现小组”音频,此处之后,说话人1、2还有一些对话。

500

以上是根据“呈现小组”视频里指出的南都音频23处疑似被剪辑处的语音分析。根据这些分析,我们不难得出“南都音频”是被剪辑过的这个结论。

至于为什么剪辑、哪些部分被剪辑掉,以及为什么要剪辑掉这些部分,各位读者可自行判断。

可能也会有读者质疑,为什么果子狸不做一份对于“呈现小组”音频的语音分析,是不是有所偏颇?欢迎各位民间高手下载“呈现小组”的音频分析,然后有依有据地指出任何您觉得该音频疑似被剪辑的部分。如果有这么一份“呈现小组音频疑似剪辑点清单”,微思客会应读者要求,请果子狸出山,再做一份针对“呈现小组”音频的语音分析,以示公允。

2019-04-26
社会

观察者APP,更好阅读体验

欧洲央行行长呼吁:这是欧元替代美元的机会

印度官方称已超日本成第四大经济体,果真?

格陵兰岛催美欧:要我们找中国?

“再见,华盛顿!你好,北京!”

“转向中东和加拿大后,中国买家不回头了”