新西蘭
繁體中文(香港)
分享

Pinterest是如何建立起硅谷最强算法之一的(一)

转载作者: 神译局
Pinterest是如何建立起硅谷最强算法之一的(一)
摘要神译局是旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风……

编者按:2010年,Pinterest诞生于美国加州,名字来源于Pin(图钉)+Interest(兴趣)。其丰富多彩的图片内容深得用户喜爱,尤其是年轻女性群体。成立9年以来,不断引发争议,又不断改进。如今,Pinterest已坐拥近3亿月活用户,作为图片社交的领头羊,Pinterest是如何构建其强大算法的呢?本文用这些年来的历程给出了答案。文章译自Medium,作者Will Oremus,原文标题为How Pinterest Built One of Silicon Valley’s Most Successful Algorithms。本文共分成两部分,此为第一部分。

hougarden

与大多数社交网络一样,Pinterest也建立在假设和偏见之上。但与大多数社交网络不同的是,Pinterest承认这一点。(注:Pinterest是一个图片社交平台,采用瀑布流的形式展现图片内容,无需用户翻页,新的图片不断自动加载在页面底端,让用户不断的发现新的图片,堪称图片版 Twitter。)

从一开始,你就告诉了Pinterest你的简要情况。当你注册时,会被询问两个个人问题——你的年龄和性别——以及你如何回答它们,这将影响接下来发生的一切。根据你的回答,以及你的语言、地区和浏览历史,Pinterest会选择一系列它认为你可能感兴趣的主题类别,并要求你也选择至少五个。

告诉Pinterest你是一个三十多岁的女人,你提供的兴趣包括“化妆”、“美发教程”、“锻炼计划”和“晚餐食谱”;告诉它你是一个三十多岁的男人,你会得到一些非常不同的选项:“木工”、“有趣的图片”、“生存技能”和“游戏”。或者你也可以在“非二进制”选项中输入你自己的回答——它允许你输入任何东西——你会得到一堆性别中立的选项,比如“动物”、“家居装饰”、“女性发型”、“男性发型”和“香烟”。

一旦你做出了选择,Pinterest的机器学习软件就会制作一个满是图像,或者说“图钉”(Pin)的主页,并预测这些会吸引你。这是一个关键时刻:Pinterest内部数据显示,如果人们看到这些“图钉”是他们喜欢的,很有可能他们会成为活跃用户, 定期回到网站寻找与他们兴趣相关的新鲜内容,查看针对这些兴趣定制的广告,并管理他们自己相关“图钉”的图板(Board)。如果人们第一眼找不到他们感兴趣的东西,他们可能就再也不会回来了。

对于每年加入Pinterest的5000万新用户来说,注册过程是硅谷最成功、但审查最少的算法之一的初次体验。驱动Pinterest主页推送、搜索结果和通知的代码决定了用户在每一轮会看到什么图片和想法,类似于支撑Facebook新闻推送、YouTube推荐或TikTok“For You”页面的代码。这是一家市值150亿美元的公司的核心产品,该公司今年成功上市,是Uber、Lyft和Slack等科技独角兽公司中唯一一家股价一直高于IPO价格的公司。

然而,在幕后,Pinterest的工程师和高管们正竭力应对在其他地方造成麻烦的同样紧张的局面。该公司的领导们表示,他们希望在硅谷开辟一条不同的成功之路,一条不那么耀眼、更人性化的道路。但在上市的第一年,它就面临着一个关键的挑战:如何在不疏远忠实用户和对新来者定型,也不让错误信息传播和激进化的情况下,超越一直以来偏向白人郊区女性的用户基础?

周二,该公司将推出一个功能旨在解决其算法中也许是最明显的缺陷,即倾向于从用户过去的行为中得出错误的结论,用他们不想再看到的东西污染内容推送——比如为解除婚约的用户推送婚纱,或者为流产的用户推送育儿室装饰。Pinterest将这项功能称为Home Feed Tuner(主页推送调谐器),它允许用户查看并手动编辑他们的活动历史和兴趣,本质上是告诉算法该记住什么,以及该忘记什么。

Pinterest希望这一功能能减少投诉,提高一小部分高级用户的满意度。但这对网站的扩张几乎没有帮助,甚至可能通过限制算法可获得的信息而导致降低用户的参与度。公司表示愿意做出这种取舍,尤其是在早期测试显示用户活动没有明显下降的情况下。

然而,事实证明,其他的折衷方式更加棘手,比如如何深入了解用户,让他们继续关注更多内容,同时又不让他们感到厌烦、限制他们,或者让他们离开。

“用户不想被归类,”该公司的包容和多样性主管坎迪斯·摩根(Candice Morgan)说。今年早些时候,她受委托进行了一项研究,以了解Pinterest如何更好地服务于那些来自平台无法代表其背景的用户。她补充道:“他们不想让我们根据他们的人口结构来猜测他们会喜欢什么。”

然而,至少在注册后的最初几分钟,Pinterest的确会根据用户的人口统计猜测他们会喜欢什么。如果没有这么做,部分用户会认为Pinterest不适合他们。

此外,还有一些问题困扰着一些知名度更高的社交网络:病毒式的错误信息,激进化、攻击性图片和表情包,垃圾信息,以及试图利用算法牟利的可疑网站,所有这些都是Pinterest在某种程度上要处理的问题。在这方面,该公司采取了不同于竞争对手平台的方式:接受偏见,限制病毒式传播,成为某种意义上的反社交网络。

到目前为止,一切顺利。

2010年,山景城黑客道场(Dojo)的三名年轻男性技术工人创立了Pinterest,一开始,它很难成为一个分享图片集合的大众平台。来自爱荷华州的联合创始人本·西尔伯曼(Ben Silbermann)参加了一个由女性博客作者和有影响力的人参加的会议,她们很快就喜欢上了Pinterest。这个网站在女性和郊区居民之间迅速发展,他们发现它是分享食谱、时尚窍门、DIY项目以及家居装饰想法的理想场所。

这些早期用户塑造了网站的发展轨迹。该公司的工程师们遵循社交媒体模板,开发了从用户行为中学习的个性化算法,软件吸收的正是用户的兴趣和活动模式。但是过度依赖这些早期用户生成的特定数据导致了一些问题。例如,你可能会偶然发现满是全白色婚纱的图板。

最初,主页推送显示了来自所有用户的各种最受欢迎的“图钉”,这些“图钉”是根据用户关注的图板设计的,这对于吸引志同道合的新用户来说是完美的,但对于发散网站的吸引力来说却不是。摩根说:“男性有一种误解,认为Pinterest只是女性用来爱美的工具,尽管其中很多内容是中性的。”

多年来,Pinterest不得不重新设计系统,重新训练算法,以便更好地识别和定位不同类型的用户,并绘制他们的兴趣图谱。因此,你注册时的性别问题、让算法初步了解你感兴趣内容的主题选择器、以及可能有些冒昧使用浏览器数据 (尽管这是行业标准),这些数据可以告诉Pinterest你是否曾经访问过该网站,以及你是如何来到这个网站的。

例如,关于语言和地区的问题帮助Pinterest接触到了美国以外的受众,这些人之前曾抱怨说,这个平台“从他们注册的那一刻起就感觉很陌生”。Pinterest现在有一半以上的用户来自美国以外,这与其他类似规模的社交网络是一致的。在某种程度上,这些用户为Pinterest开辟了一条更具包容性的道路:例如,该公司报告称,在日本,男性在首次访问该网站后成为活跃用户的可能性与女性相当。

但是,将用户划分为更细的子群也有风险,特别是对于那些在网站上一直代表性不足的组。内部数据可能会告诉你,用一堆男性化的图片来欢迎男性用户可以提高激活率,但它可能不会告诉你的是,有一部分男性用户对这种含蓄的假设不感兴趣,甚至觉得被冒犯了,因为他们喜欢“猿人洞”或全是女性“漂亮名人”的图片。

Pinterest正在研究如何帮助用户在产品中看到自己。今年1月,该公司推出了由摩根和奥马尔·西耶尔 (Omar Seyal)领导的多元化项目推出的首批产品之一。

根据该公司的研究,这是出色的第一步,但并不完美。“我们想知道,用户是否愿意主动提供更多关于自己的信息,以增加个性化?我们发现答案是否定的——他们只是想让产品适用于所有人。”摩根说。

译者:Yoyo_J


转载声明转载声明:本文系后花园转载发布,仅代表原作者或原平台态度,不代表我方观点。后花园仅提供信息发布平台,文章或有适当删改。对转载有异议和删稿要求的原著方,可联络[email protected]