12月12日消息,据国外媒体报道,自2014年亚马逊发布智能音箱Echo以来,亚马逊Echo、谷歌Home和Apple HomePod等“智能音箱”设备已经销售了数以百万台,大科技公司正在将亚马逊Alexa、苹果Siri、谷歌Assistant、微软Cortana,以及Facebook的类似服务整合到人们生活中。咨询公司Juniper Research估计,到2023年,全球智能音箱年市场规模将达到110亿美元,全球约有74亿部语音控制设备。
科技公司表示智能音箱只有在用户激活时才会录音,但事实上正在把永远开着的麦克风引入私密空间。亚马逊及其竞争对手表示,绝大多数语音请求都是由电脑自动执行的,无需人工审核。然而,这些智能设备都在依赖成千上万的低薪员工进行人工转录,用户私密对话已经成为他们最有价值的数据集之一。所有科技公司都认为,这是改善他们产品的一种合理方式。
苹果
2011年,苹果公司推出了带有Siri功能的iPhone 4S,不再需要通过实验室收集录音。几天之内,苹果卖出了400多万部4S手机,开始免费积累不可估量的自然语音数据。在最初的几年里,直到2014年之前,苹果都在依赖外部语音软件专家使用这些数据来提高Siri的分析能力。过去几年,苹果在收集和分析自然语音方面非常积极,期望外包商能解释语音片段中不同的语言、方言和文化特质。在GlobeTech办公室里,合同工们戴着耳机坐在电脑前,每天要抄录1300个片段。当合同工点击播放语音录音时,电脑会在一个文本框中填入它认为Siri“听到”的单词,然后提示通过或更正内容。当合同工询问负责人是否可以跳过过于私密的语音片段时,却被告知没有任何片段是过于私密的。合同工通常只工作几个月,关于隐私问题的培训也很少。一名对这项工作毫无疑虑的前合同工表示,偷听真实世界的用户的声音“绝对令人捧腹”。
2015年,苹果Siri每周处理的请求超过10亿次。这时的用户可以开启一项功能,不必再按iPhone上的按钮来激活语音助手,但这种情况下Siri总是处于倾听状态。苹果表示,语音数据可能会被记录和分析以改进Siri,但它没有提到人们可能会被监听。“偷听别人说话让我觉得非常不舒服,”一位前合同工说。
苹果Siri部门的十名前高管表示,他们从不认为Siri系统侵犯了隐私。这些前高管表示,录音与苹果用户标识无关,他们认为用户会理解苹果在处理他们的音频剪辑,那么有人帮忙处理又有什么关系呢?“我们在情感上感到安全,认为这样做是正确的,”Siri高级开发小组前员工约翰·伯基(John Burkey)说。“这与应用程序崩溃并询问你是否要将报告发送给苹果是一样的。这只是个语音错误。”
苹果公司表示,只有不到0.2%的Siri请求经过了人工分析。到2019年,苹果将Siri引入无线耳机和HomePod音箱等产品后,Siri每月处理150亿条语音指令,0.2%仍意味着每月有3000万次请求经过语音分析,一年就是3.6亿次。
亚马逊
在智能音箱领域,苹果的HomePod估计只占美国市场的5%。亚马逊估计有70%。亚马逊Echo的七个麦克风一直在监听“唤醒词”,这将触发新的录音。与苹果一样,每一段用户音频都会被发送到公司的服务器,其中的一部分会被分流到数百个数据关联公司中进行人工审查。
默认情况下,亚马逊会无限期保留录音。亚马逊没有透露这些数据的具体用途,只是表示在将Alexa翻译成世界各地新语言和扩展其响应能力方面,人工转录已被证明具有巨大的优势。