Hey 语音助手,你在监听我吗?

划重点:亚马逊、谷歌、苹果和微软先后被曝出录音监听丑闻,看起来,录音监听似乎已是科技巨头的标配。

随着AI语音技术及相关产品的发展,智能音箱、语音助手服务等已经成为主流的应用。这些产品在我们的生活中扮演着越来越重要的角色,与此同时,个人信息被泄露的风险也相应增大。

500

本期导览:

Hey Siri,你在窃听我吗?

Alexa,你在窃听我吗?

Okay Google,你在窃听我吗?

Cortana,你在监听我吗?

监听背后:人工智能与隐私保护


Hey Siri,你在窃听我吗?

事件:2019年8月初,苹果外包公司员工向英国《卫报》爆料称,Siri会对人们的隐私活动进行录音,并将音频发送给评估师进行评估。录音中的谈话内容和其他声音清晰可听,附带有用户数据,包括录音发生的位置、联系方式和APP应用数据,甚至有可能会带有名字。此外,爆料人还提到,这些敏感信息并没有具体的程序来处理,或者说没有具体的流程来保护这些极为敏感的个人信息。工作人员如何收听这些录音、使用这些信息,也没有具体的限制。无论是向外分发还是自己存档,苹果都没有很明确告知用户。

回应:对于上述指控,苹果在第一时间回应到,用户被录音的比例仅占Siri的1%,并且每段录音仅持续了几秒;回传的录音与用户的苹果ID没有关联,录音会在安全的环境下分析;所有审核人员都有义务遵守严格的保密要求。苹果还表示,录音发给国际承包商进行人工分析的目的是改善Siri的服务质量。苹果试图以“数据脱敏”和“改善服务”的理由换得外界谅解。

Alexa,你在窃听我吗?

事件:今年4月,据彭博社报道,多名知情人士透露,亚马逊在全球雇佣有数千名员工,以帮助改进为其Echo智能音箱提供支持的数字助手Alexa。曝光资料显示,发送给Alexa审计员的录音与账号、用户名和设备序列号相关。知情人士说,这个团队由承包商和全职亚马逊员工组成,他们在波士顿、哥斯达黎加、印度和罗马尼亚等地工作。这些研究人员被曝可在Echo主人家里和办公室里监听他们的对话,并进行录音。

回应:亚马逊表示,此举是为了消除Alexa对人类语言理解的空白,帮助它更好地响应命令。发言人在电子邮件声明中表示:“我们认真对待客户个人信息的安全和隐私,为了改善客户体验,我们只标注了一小部分Alexa语音录音样本,它们可以帮助我们训练语音识别和自然语言理解系统,因此Alexa可以更好地理解用户的请求,并确保服务对每个人都有效。我们有严格的技术和操作保障措施,对滥用我们的系统采取零容忍政策。员工不能直接访问带有标识的信息,所有信息都被高度保密。”

Okay Google,你在窃听我吗?

事件:谷歌紧随亚马逊之后。据TechCrunch报道,谷歌会将一小部分语音助手的录音外包给承包商进行人工分析,以训练人工智能的准确性。一名分析荷兰语录音的承包商员工,将1000份录音爆料给了比利时公共广播公司。据称,在这些录音中能够听到人们的地址、对医疗问题的讨论以及女性遇险的声音,而且能够识别出录音中的人。

回应:谷歌在7月11日的一篇博客文章中,承认其会雇佣人工来分析一小部分的录音。谷歌还表示,其不会在分析过程中将录音和用户账户相关联,雇佣的语言专家只会对录音中约0.2%的内容进行人工分析,以便更好地理解不同的语言、口音和方言。“这是构建语音技术过程的关键部分,对于创新像谷歌语音助手这样的产品是必要的一步。”

Cortana,你在监听我吗?

事件:微软也没落下。据美国新闻网站Vice报道,微软外包商会监听Skype用户和Cortana用户录音。这些音频内容包括情侣之间的亲密交谈、谈论的减肥等私人问题。微软向外包商提供一段音频时,他们还会收到一系列由Skype翻译系统生成的内容。随后,外包商从中选择最准确的翻译内容,或提供自己的翻译。但据Vice报道,尽管这些信息很敏感,但外包商当中却有部分员工在家里收听、处理Skype和Cortana的音频,而这并不是很安全的处理环境。

回应:微软称其仅通过安全的在线门户网站向外包商提供音频数据,公司会采取相应措施删除用户或设备识别号码等个人识别信息。发言人则称,“微软收集语音数据是为了提供、改进语音服务,比如搜索、语音命令、听写或翻译服务。我们努力在收集和使用语音数据方面做到透明,以确保客户明晰选择何时以及如何使用他们的语音数据。在收集和使用客户的语音数据之前,微软会得到客户的许可。”

500

截图来自电影《银翼杀手2049》(Blade Runner 2049)

此时此刻,我们在触碰AI;而在科幻对未来的想象中,AI在触碰人类

监听背后:人工智能与隐私保护

需要指出的是,微软的隐私政策并没有说明其中一些分析将由人工完成,这便与此前谷歌、亚马逊、苹果的监听丑闻十分类似,并且都涉及到语音助手。四家公司都宣称此举是为了提高语音助手的理解力。操作手法上,都聘用了外部承包商采用人工监听的方式,并称只用了少数语音片段。看起来,录音监听似乎已是科技巨头的标配。

亚马逊曾在广告词中介绍,“Alexa生活在云端,而且会变得越来越聪明”。实际上,这样“变聪明”的监督学习需要所谓 “人类智慧” 来训练算法,而大多数现代语音识别系统依赖于模仿人脑的神经网络,软件会通过海量数据进行机器学习,为智能音箱的算法提供可能性的模型。AI的深度学习是建立在大数据之上的。在使用深度学习AI的过程中,往往伴随着海量隐私数据泄露的风险。而前不久,便有多家国内APP被指监听用户手机,利用麦克风权限获取用户隐私,今日头条和百度等巨头,也纷纷“涉案”。

而回看谷歌过去数年的隐私变迁历史,20 世纪 90 年代末的谷歌,彼时这家新兴企业所拥有的仅仅是搜索引擎。谷歌公司发布的第一份隐私政策,寥寥 600 余字就解释了其如何收集并使用用户的个人信息。然而,无论是互联网还是谷歌自身,都不可避免地迎来了新的发展阶段。在过去二十年当中,谷歌的隐私政策开始不断膨胀,如今,它需要使用 4000 字才能明确表述现有数据实践。

对于AI技术的反思很多,而隐私保护是其中非常重要的一环。按照如今的AI发展速度,这个问题已经迫在眼前。人类不能简单地认为,智能系统可以照进生活的每一个角落,在这一图景与人类之间,仍隔着一层迷雾,迷雾里不仅有技术,也有伦理风险。如何在发展技术的同时建立起全新的法律法规、伦理框架,从而将收益提至最高、将风险降至最低,这是一个亟待解决的问题。

谷歌CEO桑达尔·皮扎伊(Sundar Pichai)曾公开表示,“隐私不应该成为一种奢侈品,不能只提供给有能力购买高端产品和服务的人。”没有人愿意生活在一个毫无隐私、处处被监视的世界,但随着AI语音技术的发展,你说过的每句话都可能正在被窃听,个人隐私面临着巨大的挑战,这一对于隐私泄露的担忧便成为了非常现实的存在。也许确实到了临门一脚的时刻,一如丘吉尔所说:“这不是结束的时刻,不是开端时刻的结束。或许,这只是结束时刻的开端。”

来云猜,和大家一起聊聊吧

云猜,珍视每一个观点。

500

全部专栏