Pinterest是如何建立起硅谷最强算法之一的(二)
编者按:2010年,Pinterest诞生于美国加州,名字来源于Pin(图钉)+Interest(兴趣)。其丰富多彩的图片内容深得用户喜爱,尤其是年轻女性群体。成立9年以来,不断引发争议,又不断改进。如今,Pinterest已坐拥近3亿月活用户,作为图片社交的领头羊,Pinterest是如何构建其强大算法的呢?本文用这些年来的历程给出了答案。文章译自Medium,作者Will Oremus,原文标题为How Pinterest Built One of Silicon Valley’s Most Successful Algorithms。本文共分成两部分,此为第二部分。
Pinterest从来没有像Twitter和Facebook那样受到媒体的密切关注,但这并不意味着它可以避免在其他地方引发丑闻的问题。其中一个著名的批评者是迈克·考尔菲德(Mike Caulfield),他是华盛顿州立大学温哥华分校的媒介素养和网络传播专家。2017年,他在Pinterest上寻找政治文化,结果发现的东西和你在其他社交平台上看到的一样丑陋,有一些图板上充斥着假新闻、种族偏见和匿名者Q阴谋论。
考菲尔德认为,Pinterest激进的推荐算法,加上它对用户创建的相关图片图板的依赖,可以在几分钟内把用户的推送变成一个充满仇恨的污水坑。考尔菲德写道:“浏览网页14分钟后,对疫苗有一些疑问的新用户可以从‘如何做完美的鸡蛋’的图钉转移到相关信息之外的东西上。”
米德尔伯里学院的艾米·柯里尔(Amy Collier)解释说,部分问题在于,垃圾信息发布者利用Pinterest的算法,将病毒式政治图片与他们想出售的T恤放在同一个图板上。当用户与这些图片进行互动时,算法会根据相同的理论向他们显示同一图板上的其他项目,因为他们可能也会对此感兴趣。最终,它向他们显示了T恤,其中有一部分人购买了T恤,而垃圾信息发布者则从中获利。
考尔菲尔德说,他已经习惯了科技公司无视他的批评,或者采取保守态度。因此,Pinterest的反应让他感到意外:他们感谢他强调了这个问题,并邀请他与公司高管会面,分享解决问题的想法。然后,至少在anti-vaxx(反对接种疫苗)问题上,他们坚持了下来。
今年8月,Pinterest改变了其搜索引擎处理疫苗查询的方式。Pinterest表示,它将只显示来自WHO(世界卫生组织)和 CDC (美国疾病控制与预防中心)等主要卫生组织的“图钉”,而不是最流行的疫苗相关“图钉”。考菲尔德对该公司的这一举动表示赞赏,与其他大多数平台相比,这是一种更为坚定的立场。这表明,该公司愿意改写自己的软件,来解决单靠算法无法解决的系统问题。
对于一个拥有3亿用户的平台来说,这种方法能在多大程度上解决所有其他问题还有待观察。但Pinterest似乎愿意找出答案。
社交媒体公司的传统观点是,你不能把太多的责任放在用户身上,让他们个性化自己的内容。通过建立一个比用户自己更了解他们可能会点击什么内容的新闻推送算法,Facebook近乎上升到全球主导地位。多年来,Instagram和Twitter一直抵制算法推送,但最终都接受了自动化,用户基础和财务状况都出现了增长。你采取的每项操作都会进一步改善参与度优化机器,让用户自己使用这一杠杆只会增加工作量。
和其他社交平台一样,Pinterest也会根据月度活跃用户和激活率等指标来判断自己的价值。从历史上看,它的算法一直在不断打磨给用户推送的内容,向他们展示越来越多他们过去参与过的内容。对于这类事有一些常见的批评:优化用户的参与度可能会导致用户盲目或上瘾地滚动页面,还可能让用户陷入充斥着错误信息(或更糟)的过滤气泡中。
但如果优化用户参与度不是你的终极目标呢? 这是其他一些社交网络,如Facebook和Twitter最近开始提出的问题,因为它们都分别具有更高的定性目标,比如“合理使用时间”和“健康的对话”。Pinterest的核心产品负责人西耶尔说,这为公司本周推出的新功能铺平了道路。
西耶尔说,多年来,Pinterest用户最常抱怨的问题之一是,他们无法控制其算法显示的内容。“你点击某个东西,你的整个推送就变成了那个。”问题是如何在不影响算法效率的情况下解决这个问题。“每个运营在线平台推送的人都会说,‘哦,是的,我们试图让它更可控。但当我们试图推出它的时候,却失去了最高参与度。’”
最后,西耶尔说,他认为这个问题完全错误。相反,他告诉负责解决用户控制问题的工程师们不必担心用户参与的影响,他们唯一的工作就是找到一个解决方案,以减少用户对推送内容矫枉过正的抱怨。
这个项目的结果是“调整你的主页推送”,它已经对一些用户可用。在允许用户调整算法如何响应他们的每个操作时,Pinterest将提供一定程度的定制化服务,而很少有人愿意采用。但是西耶尔说,在测试中很明显,这些用户与那些抱怨的用户有很大重叠。他们也是Pinterest最忠实的粉丝,而且毕竟测试尚未显示出对参与度的任何重大影响。
现在,西耶尔认为这是一个教训。“这是在呼吁其他平台向他们的用户开放。这是一个棘手的问题,但人们越来越渴望获得好的解决方案。”
Pinterest正在赋予用户更多的控制权,但就像任何依赖于算法驱动推荐的社交网络一样,它最终依赖于一种偏见。与其他同行不同,Pinterest欢迎它——只要它是合适的。
“我们终究是一个用户生成内容的平台,” 西耶尔说。“我们无法理解其中的每件事。我们网站里确实有垃圾信息散布者,确实有想要利用这个平台散布负面内容的人,并且有些是对抗性的。”
他说,为了缓解这些问题,该公司可以做的是,仔细研究其系统倾向于放大的内容类型,并调整算法的参数,使某些内容优先于其他内容。
例如,Pinterest的算法把“保存”一个给定的“图钉”作为一个比点击强得多的积极信号。“人们不会真的保存一篇关于总统的煽动性文章,但他们会保存一套他们将来想买的衣服。所以我们倾向于这种类型的互动,而不是与好友互动。”
对社交媒体网站来说,回避好友间的互动似乎是一种奇怪的做法。但Pinterest表示,这是该公司缓解骚扰和病毒式宣传等问题的方式之一。 “最终,我们不会像其他平台那样看到虚假信息宣传,因为算法根本不会对其有回报。” Pinterest产品沟通主管马洛里·卢西克(Malorie Lucich)表示: “当你试图大量发送垃圾信息或迷惑人们时,你可能希望那些内容出现在‘首页’上,而这在Pinterest上是不太容易发生的。”
即使在点击类别中,该公司的软件也将对优质网站的点击视为比对其他网站的点击更有价值。西耶尔说,每当Pinterest测试算法的变化时,它就会关注这种变化如何影响知名网站人工选择索引的站外流量,这些索引集中于生活方式,时尚和家庭装饰等主题。(尽管Facebook试图通过调查用户来建立“可信来源”,但Pinterest承认它依赖老式的、主观的、人工的判断。)如果这种变化向这些站点发送的流量更少,而更多向其他站点发送流量,那么产品团队将研究原因。这可能也是一个迹象,表明这一变化为一些信誉较差的网站开辟了漏洞,使它们得以利用这一算法。
所有主要的社交平台都会有意修改软件,不管它们承认与否。泽奈普·图费克奇(Zeynep Tufekci)等批评者提出了一个有说服力的理由,他们认为社交媒体的许多问题源于他们不愿承认算法中的基本偏见:不是支持自由政治,也不是支持保守政治,而是眼球——越来越多的眼球。
像Google,Amazon,Facebook和Uber这样的公司以勃勃的野心和看似无限的增长而闻名。西耶尔说,Pinterest也有伟大的想法。“我们可以在我们所做的事情上做得更好:新格式、新类型的交互,而不只是‘图钉’”。他认为,Pinterest未来的算法不仅要反映用户的品味和风格,还要像顶级时尚品牌那样帮助用户塑造那些品味和风格。他以Spotify的人工播放列表为榜样,比如颇具影响力的RapCaviar。(注:Spotify是一个起源于瑞典的音乐串流服务,是全球最大的串流音乐服务商,RapCaviar可以说是Spotify上一个引领着Hip-Hop音乐风向的榜单。)
但随后他停顿了一下,又回过头来。他说,Pinterest成长的关键是要记住自己的局限性。“我想我们只想做好能做好的事情。如果你想让每个用户每时每刻都花在你的产品上,那么你就缺乏谦逊。事实是,科技公司不可能做地球上的所有事情。”
译者:Yoyo_J