员工爆料:亚马逊全球雇佣数千人“偷听”Alexa用户说话
编者按:本文来自“腾讯科技”,审校:承曦;经授权发布。
这个庞大的团队聆听Echo业主的家中和办公室捕捉到的录音。这些录音被转录、注释,然后反馈到软件中,亚马逊这一团队的目的,是消除Alexa对人类语言理解的空白,并帮助它更好地响应消费者的语音命令。
根据七个参加过上述团队工作的人士透露,Alexa的语音审听过程突出了在训练软件算法中经常被忽视的人类角色。
在营销材料中,亚马逊表示,Alexa“生活在云中,而且总是变得越来越聪明。”但是就像许多软件工具都是为了从经验中学习而构建一样,人类也在给语音助手做一些教学工作。
知情人士称,该团队由承包商和亚马逊的全职员工组成,他们在从波士顿到哥斯达黎加、印度和罗马尼亚的分支机构工作,他们签署了保密协议,被禁止公开谈论该项目。
这项工作基本上是平淡无奇的。波士顿的一名工作人员说,他积累的语音资料包括像“泰勒·斯威夫特”(Taylor Swift)这样的单一词语,他会对这些数据进行了注释,以表明搜索者指的是一位音乐艺术家。
这些工作人员经常会听到令人沮丧的对话,甚至可能是犯罪过程的声音。
其中两名员工说,他们发现了一起他们认为是性侵犯的事件。当类似的事情发生时,他们可能会在内部聊天室里分享这些情况,以此作为缓解工作压力的一种方式。
亚马逊表示,当员工听到令人不快的事情时,他们已经制定了如何进行处理的程序,但两名驻罗马尼亚的员工表示,在要求对此类案件进行指导后,他们被告知,亚马逊不会干预语音背后发生了什么。
亚马逊在其营销和隐私政策材料中没有明确表示,人类员工正在收听Alexa收集的一些对话的录音。“我们利用你对Alexa的要求来训练我们的语音识别和自然语言理解系统,”该公司在一份常见问题列表中说。
今年早些时候,美国媒体《The Intercept》报道称,亚马逊旗下子公司RING的员工在该公司门铃摄像头拍摄的视频中手动识别车辆和人员,以期更好地训练该软件自己完成这项工作。
他补充说:“这是否涉及隐私问题,取决于亚马逊和其他公司对他们手工注释的信息类型有多谨慎,以及他们如何向其他人展示这些信息。”
2014年Echo智能音箱首次亮相之后,亚马逊的发明推动了语音软件在家庭环境中的使用。
不久之后,谷歌公司它推出了自己版本的智能音箱,名为Google Home,随后苹果公司也推出了自家的的HomePod。
在中国市场,也有许多公司开始销售智能音箱。科技市场研究公司Canalys的数据显示,去年全球消费者购买了7800万台智能音箱。数以百万计的人使用语音软件与智能手机上的语音助手进行交互。
大多数现代语音识别系统都依赖于模仿人脑的神经网络。软件通过在大量数据中发现规律和模式,从而一边工作一边学习。
为Echo和其他智能音箱提供动力的算法使用概率模型进行有根据的猜测。如果有人问Alexa附近有没有希腊餐馆,算法知道用户可能是在找餐馆,而不是教堂或社区中心。
另外,Hecho在西班牙语中代表事实或行为,有时被误解为Echo。诸如此类,这就是亚马逊招募人工助手来弥补算法不足的原因。
该公司表示,在谷歌,一些审听者可以从“谷歌助手”那里获取一些音频片段,以帮助培训和改进产品,但它与任何个人身份信息都没有关联,音频也进行了修改。
据一位熟悉该工作流程的人士透露,亚马逊对语音数据的审查过程始于Alexa随机抽取一小部分用户的录音,并将这些音频文件发送给远方的员工和承包商。
一些Alexa审听者的任务是转录用户的命令,将录音与Alexa的自动转录文本进行比较,或者注释用户和机器之间的交互。那个人问了什么?Alexa提供了有效的答复了吗?
根据亚马逊的网站,除非Echo检测到唤醒词或按下按钮激活,否则音频不会被存储。但有时,Alexa似乎开始录制声音,没有任何提示,一个听不懂的噪音意味着音频文件已经开始录制。
无论激活是否错误,审听人都必须对语音内容进行转录。一位知情人士说,当Alexa没有收到唤醒指令或被意外触发时,审听人每天记录多达100段录音。
据两位亚马逊审听人说,在世界各地的家庭中,Echo智能音箱的用户经常猜测谁可能在听,“你为美国国安局工作吗”他们还问:“Alexa,有人在听我们说话吗?”