我的数据不是你的商品,OK?
文章摘要
1、"数据打包,倒手外卖"的交易
2019年8月1日,日本最大互联网公司RECRUIT(中文瑞可利)旗下的就职情报平台Rikunabi(リクナビ)被曝滥用网站注册者的个人数据谋取私利,事件持续发酵至今。
*Rikunabi社长记者会谢罪。图片来《日本经济新闻》
作为日本极具影响力的就职平台之一,从2016年到2020年4年间Rikunabi共累计超200万注册用户,刊登3万多家企业的求职信息,同时为2万8千多家公司提供求职申请注册窗口。
据日本经济新闻报道,Rikunabi公司在没有告知学生求职者的情况下,私自利用AI技术解析求职者的注册及浏览等数据,用以来判定求职者最后辞退某家公司的概率。然后将其数据和技术打包,作为一项服务产品倒卖给人才招聘企业方。
随着数据不正利用的受害者数不断攀升,该事件引起了社会和政府的广泛关注。2019年8月12日,日本劳动省东京劳动局联合日本个人情报保护委员会,紧急对此事开展了调查。截至到8月29日,已有包括本田、丰田等38家大型企业被曝光先后使用过此款产品用于估测求职者的辞退概率,甚至作为求职者的录用筛选的一项选考核指标。
受此事件的影响,Rikunabi的控股公司RECRUIT(中文瑞可利)8月29日股价大跳水,共计13家企业相继以"企业内部监察管理缺陷"为由,联合集体抛售1億2千多股RECRUIT股票,一天之内RECRUIT股价大跌8%。
*控股公司RRCRUIT股价大跌,只有投8亿日元股票回购
2、数据商品化,3宗罪
此次事件“一石激起千层浪”,而此款将求职者个人数据商品化的2C服务产品「Rikunabi DMP follow」到底如何运作的?又何遭“群起而攻之”?
*笔者根据pyolog刊登图片翻译而成
每年4月,10月的校招季节Rikunabi都可以稳定获得一批求职者数据。因此从2017年起,Rikunabi便开始收集数据训练模型。
RikunabiDMP follow的具体流程为,企业方先将前年录用者的注册ID、考核结果、学历等信息和今年应聘者的信息(数据群A)上传到DMP follow。同时Rikunabi还要求企业方还向今年的应聘者发送含有Beacon(信标)的网页链接以确定核对学生信息(数据群B)。而这些数据都会将被直接上传至Rikunabi DMP follow。
释义:
Web beacon,中文称网络信标,又称网页臭虫(Web bug),是可以暗藏在任何网页元素或邮件内的1像素大小的透明GIF或PNG图片,常用来收集目标电脑用户的上网习惯等数据,并将这些数据写入Cookie。
--摘自「web beacon初探」详细参照“参考资料一览”
Rikunabi再根据企业上传的数据群A、数据群B和自身在线招聘平台上所收集到的往年度应聘者行为数据设计算法。最后根据算法匹配今年度用户行为数据,分为5个级别(辞退某家公司的概率高低)计算出用户放弃某家公司Offer的可能性。再将其级别分数和用户者姓名发给购买该服务的企业方。
同时,将个人就职者数据打包贩卖的服务Rikunabi DMP follow存在着很多问题。
触犯个人情报保护法。首先,在就职者注册Rikunabi网页信息的时候,Rikunabi方面并没有给予详细清晰的说明。其次,有接近8千名非Rikunabi注册会员在毫不知情的情况下,个人情报被收集利用。
AI算法精度堪忧。根据Rikunabi最新公布的公告显示,在算法设计上Rikunabi DMP follow重度依据用户的Cookie数据来做预判。例如,该求职者除A公司之外的查询公司数,公司类型,浏览频度等。不但数据母集团质量堪忧,数据训练模型也很机械,对于后期数据验证,模型检测更是堪称玄学。而这样精度的推算结果却会特定到某个应聘者,简直可笑可怕。
滥用行业优势。Rikunabi和Mainabi并驾齐驱,在日本求职网站的市场上独占绝对优势,和众多公司都有合作。并且求职过程中,大多数情况下求职应聘者由于信息不对称处于弱势,加之应届求职毕业生没有求职经验没有职场人脉会及其依赖Rikunabi获取信息。而Rikunabi却没有好好利用这种行业优势,而是滥用其优势获不宜之利。
3、RECRUIT成也数据,败也数据
在有“互联网女皇”之称的玛丽·米克尔所公布的《2019年互联网趋势报告》中,RECRUIT(中文瑞可利)是全球30大互联网公司中唯一的日本公司,在中美公司的重重夹击下获得第14名,市场估值528亿美元。
*图片来自玛丽·米克尔所公布的《2019年互联网趋势报告》
成立于1960年,以做人力资源起家。1990年代,RECRUIT(中文瑞可利)在日本互联网黎明期,利用积累了30多年的情报经验大胆结合互联网技术设立了不动产购买咨询的线上网站Mix-Juice为其在数据情报积累阶段打下来了基础。
*图片来自RECRUIT官网
除了主线业务人力资源开发管理之外,RECRUIT还在餐饮、美容、旅游、二手车、婚庆、住房、教育等副线市场深耕。
在日本,从人生的第一份工作为起点,结婚,转职,购房,育儿等。未来人生的每一个重要节点,RECRUIT都可以参与。而在大数据时代,这也意味着人生每一个重要节点的数据,RECRUIT都有机会获取。
在日本几乎所有的网民或多或少都会用到我们的产品。通过各个平台收集到 C端的数据和B端的数据,形成一个大数据库。再通过数据库进行大数据分析和机器学习,使得最终的客户交易持续扩大,进而扩大我们自身收入。所以从自己的业务发展和优化角度来讲,去年Recruit营业收入涨了16.3%。
——“2019 WISE超级进化者”大会上Recruit中国董事总经理的演讲
RECRUIT业务拓展的两个重要优势,基于招聘为数据入口形成的强大数据库和平台运作商业模式的精准匹配能力都离不开数据沉积。然而说来讽刺,因为数据RECRUIT获得了快速成长,也是因为数据失去了市场的信任。虽然我相信它会恢复,但需要时间。
4、我们,数据时代的弱势群体
数据驱动口号热了很多年,也有很多企业从数据的迭代沉积中获得了自身的优化和提高。作为使用服务和享受服务的一方,我们也的确获利不浅。我们享受数据时代下的便利高效,见证科技财富的增长。
我们获利于数据时代,同时我们也是数据时代的弱势群体。
无论是之前的谷歌Assistant、Alexa的个人录音泄露风波,这次Rikunabi未尽详细说明私自商品化个人数据,还是今天的“上传脸脸就归我们的”ZAO作换脸软件。以个人数据换便利,以个人隐私换产品服务的不对等局面早已屡见不鲜。
*出演天下好戏的换脸APPZAO,因为个人隐私条款而引热议
然而更可怕的是数据时代,无论在技术,知识还是金钱上我们都处于弱势。由于技术情报的不对称,我们不知道自己的情报是否被合理使用,是否在不需要的时候被合理销毁,是否依据合理目标被收集适当的数据。
数据时代,除了依靠政府的法律监管(2019年7月欧盟更新数据保护安全指令GDPR)和我们自身的学习提升之外。还希望所有的互联网企业可以对每一份数据怀有敬畏之心,科技向善。