从视频分析到量子霸权:探究谷歌的人工智能之路
【编者按】
谷歌比地球上任何一家公司都拥有更多的计算能力、数据和人才来追求人工智能,也经受着公司内外关于人工智能的更多质疑,但其开发人工智能的速度丝毫没有放缓的迹象。
【划重点】
(本文约8000字,阅读全文需要12分钟)
来自YouTube的那只猫
人脑是个有趣的东西。某些记忆会永远伴随着我们:比如上学、结婚或孩子出生。但我们只会记住其中的一些细节,例如婚礼上的音乐或是医院产房的颜色,其他的则会随着时间的推移而渐渐褪色。对于谷歌首席执行官桑德尔·皮查伊(Sundar Pichai)来说,他永远不会忘记人工智能走出实验室的那一天。
“那是2012年,在一个小团队的房间里,只有我们几个人,” 皮查伊这样说。一位名叫杰夫·迪恩(Jeff Dean)的工程师正在做一个新项目,他想让皮查伊看一看。作为传奇程序员的迪恩曾帮助开发谷歌搜索引擎。皮查伊说:“每当杰夫想要告诉你一些事情的最新进展时,你就会感到兴奋。”
当迪恩展示成果时,皮查伊并不记得自己到底在哪幢楼。他记得当时自己是站着的,而不是坐着的;有一位人事还把从事人工智能研究40年的“深度学习之父”杰弗里·辛顿(Geoffrey Hintu)误认为实习生,皮查伊记得当时还有人拿这事开玩笑。
当时皮查伊还是谷歌高级副总裁,负责Chrome浏览器和应用程序,还没有认真思考过人工智能。谷歌联合创始人拉里·佩奇(Larry Page)和谢尔盖·布林(Sergey Brin)在12年前就曾公开表示,人工智能将改变这家公司。“理想的搜索引擎是智能的,”佩奇在2000年5月接受采访时就表示,“它必须理解你的查询,它必须理解所有文件,这显然是人工智能。”尽管前景光明,但几十年来机器学习一直收效甚微。然而现在,强大的力量正在谷歌的服务器中激起波澜。在一年多的时间里,迪恩、吴恩达(Andrew Ng)和他们同事一直在构建由数量庞大计算机组成的庞大网络,以人脑为模型相互连接在一起。该团队在1000台计算机中设计了16000个处理器,相互之间有10亿个连接。尽管距离与人脑超过100万亿连接的规模相距甚远,但这也是一个前所未有的计算机系统。
为了测试这个庞大的神经网络如何处理数据,工程师们进行了一个看似简单的实验。连续三天,他们给这台机器输入了大量来自YouTube视频的随机图片。他们没有给它任何其他指令,只是看计算机会有何种反应。研究人员发现,沉迷于YouTube的电脑大脑与人类大脑并没有太大区别。迪恩和他的同事们发现,在该系统内存的一个角落里,计算机自动生成了一个模糊图像,显示的是它在72小时内反复看到的东西:一只猫。
这是一台能够学习思考的机器。
皮查伊记得,当他第一次看到谷歌服务器上出现这种智能时,他的思维发生了转变,产生了一种预感。他说:“这个东西将会扩大规模,也许能够揭示宇宙的运行方式。”“这将是我们作为人类所做的最重要事情。”
谷歌人工智能的影响力
人工智能在谷歌内部的崛起,也是我们数十亿人共同经历的一段旅程,奔向一个几乎没有人完全理解、也无法选择退出的数字未来。其进展在很大程度上是由谷歌控制的。地球上很少有其他公司有能力或雄心推动这种计算机思维的发展。谷歌运营的产品比世界上任何一家科技公司都多,拥有超过10亿用户:Android、Chrome、Drive、Gmail、谷歌应用商店、地图、照片、搜索和YouTube。只要有互联网连接,用户几乎肯定会依赖谷歌来增强自己大脑的某些功能。
皮查伊在2015年接任首席执行官后不久,就着力将谷歌打造成一家“人工智能第一”的公司。它已经有几个研究型的人工智能部门,其中包括谷歌大脑和2014年收购而来的DeepMind。皮查伊专注于将所有有关智能的东西转化为新的、更好的谷歌产品。Gmail于2018年5月推出了预测输入功能Smart Compose,每周通过电邮草稿为用户推荐逾20亿个字符;谷歌翻译可以用用户不会说的语言重新生成发音;谷歌的人工智能个人助理Duplex可以通过电话为用户预约餐位或预订房间,其声音非常逼真,很多接听电话的人并不知道它是机器人。谷歌表示,它一直向消费者披露电话来自谷歌。
谷歌人工智能的影响力远远超出了该公司的产品范围。外部开发人员现在使用谷歌人工智能工具做各种事情,从训练智能卫星到监测地球表面的变化,再到根除Twitter上的语言攻击。现在有数百万台设备在使用谷歌的人工智能,而这仅仅是个开始。谷歌即将实现所谓的量子霸权。这种新型计算机将能够以比普通计算机快一百万倍的速度进行复杂运算。这意味着我们即将进入计算的火箭时代。
人工智能如果被用于好的方面,就有可能推动社会进步。它可能会找到治疗致命疾病的方法,为饥饿的人提供食物,甚至解决气候问题。今年6月,几位领先的人工智能研究人员向康奈尔大学(Cornell University)的科学杂志提交了一篇论文,其中明确了机器学习可以解决气候变化的几种方法,比如说加速开发太阳能燃料以及从根本上优化能源使用。
但人工智能也有负面影响。美国公民自由联盟(American Civil Liberties Union)今年6月发布了一份题为《机器人监控的黎明》(The Dawn of Robot Surveillance)的报告,警告称美国各地已经安装了数百万台监控摄像头,它们可能会利用人工智能来影响公众隐私。同月有人对谷歌提起诉讼,指控其在医院使用人工智能侵犯患者隐私。
人类历史上每一次强有力的技术进步都有善恶。OpenAI创始人之一的格雷格 布罗克曼(Greg Brockman)表示:“想想那些人类发明火、启动工业革命或开发原子能的想法都是如此。”OpenAI是一家专注于开发通用人工智能的初创企业,今年7月获得了微软10亿美元的投资。
谷歌首席执行官桑德尔·皮查伊(Sundar Pichai)
谷歌公司内部对人工智能的未来也有争议。最终谷歌如何决定开发和部署它的人工智能,很可能会决定这项技术最终会对人类有利还是有害。LinkedIn联合创始人兼风险投资家、斯坦福大学(Stanford University)以人为本人工智能研究所(Institute for human - center Artificial Intelligence)董事会成员里德 霍夫曼(Reid Hoffman)解释称:“一旦你建立了这些(人工智能)系统,它们就可以在全世界范围内进行部署。”“这意味着,其创造者的任何举措都将产生相应的大规模影响。”
安德的游戏
早在两年前,卡森·霍尔盖特(Carson Holgate)就接受了机器学习的“忍者训练”。
谷歌Android部门工程师卡森·霍尔盖特(Carson Holgate)
作为谷歌Android部门的工程师,霍尔盖特是参加当年“机器学习忍者”项目的18名程序员之一。在“机器学习忍者”项目中,谷歌通过类似“安德的游戏”方式,从各个团队选拨有才华的程序员,向他们传授人工智能技术,以便提升所有产品的智能化程度。
负责“机器学习忍者”项目的谷歌内部机器学习产品经理克里斯汀·罗伯森(Christine Robson)说:“机器学习忍者计划的口号是:你想成为机器学习忍者吗?我们从谷歌各个部门选拨人员,并将他们融入机器学习团队进行6个月的培训。在人工智能专家的指导下,这些人可以参与部分项目并由此入手,从而掌握大量机器学习方面的知识。”
对于拥有计算机科学和数学学位的霍尔盖特来说,这是掌握软件行业最热门技术的机会。多年来,机器学习都被视为高度专业的领域,仅有少数精英人士才能够掌握它。谷歌则希望扩大内部精英人才的数量,甚至希望让机器学习成为谷歌人人能够掌握的常规技术。对霍尔盖特这样的工程师而言,“机器学习忍者”项目是实现自我飞跃的绝佳机会,可以向精英中的精英学习。
尽管机器学习很早以前就是谷歌研发的重点技术,谷歌也始终在积极招募这个领域的专家,但直到2016年,谷歌才真正开始痴迷于机器学习。在2015年末的财报会议上,皮查伊重点阐述了该公司的机器学习战略。他说:“机器学习是颠覆性的核心技术,可以让我们反思做任何事情的方式。我们希望将它应用于所有的产品中,包括搜索、广告、YouTube或谷歌应用商店。我们目前还处于发展初期,但你会看到我们以系统化的方式将机器学习应用到这些领域中。”
机器学习与传统编码完全不同。如果谷歌要在旗下的所有产品中应用机器学习技术,就需要精通这项技术的大量工程师。
谷歌人工智能负责人迪恩指出:“越多的人通过这种方式思考解决问题的方案,我们就会变得越好。”迪恩估计,谷歌目前约有2.5万名工程师,但只有几千人精通机器学习技术,或许这个比例仅有10%。他希望最终精通机器学习技术的人能接近100%。在被问及这个愿望能否实现时,迪恩称“我们会尽力尝试”。
打造开源的人工智能
“一开始,神经网络并未经过训练,”迪恩表示。他站在海岸线圆形剧场外的一棵棕榈树下,谷歌正在这里举办一场派对,庆祝其技术展示年会I/O开发者大会的开幕日。
谷歌人工智能负责人杰夫·迪恩(Jeff Dean)
谷歌通过大会向开发者以及世界其他地方展示了未来的发展方向。迪恩靠着一棵树,谈到了神经网络,就像冲浪先锋莱尔德·汉密尔顿(Laird Hamilton)在聚会间隙描述冲浪一样。他的眼睛亮了起来,双手做着扫视的手势。“好吧,这就是网络的各层,”他一边说,一边抓住那棵树,用灰白的树干来解释电脑中的神经元是如何相互连接的。他聚精会神地看着那棵树,好像看到了树里面藏着什么东西。去年,皮查伊任命迪恩为谷歌人工智能的负责人,这意味着他将负责公司的投资和建设,其部分职责是将YouTube神经网络实验扩展到一个新框架中,以训练机器进行更大规模的思考。该系统最初是一个名为DistBelief的内部项目,包括Android、谷歌地图和YouTube在内的许多团队都开始使用这个项目,以使产品更加智能化。
但到了2014年夏天,随着DistBelief在谷歌内部的不断发展,迪恩开始发现它有不少缺陷。DistBelief的设计初衷并不是为了适应诸如GPU性能提升或高度复杂语音数据集等技术变革。此外,DistBelief也不是为了开源而设计的,这限制了它的进一步发展。因此迪恩做出了一个大胆的决定:开发一个对所有人开源的新产品。2015年11月,皮查伊发布了他出任首席执行官之后的首个重大公告之一,即DistBelief的继任者TensorFlow。
向谷歌之外的所有开发人员开放TensorFlow,这种重要性怎么强调都不过分。芯片架构设计公司ARM机器学习主管伊恩 布拉特(Ian Bratt)表示:“人们迫不及待地想要得到它。”如今,Twitter正利用TensorFlow开发的机器人来监控对话、对推文进行排名,并吸引人们在信息流上花费更多时间;空中客车公司正通过TensorFlow训练卫星,使其对地球表面的探测分辨率缩小到厘米级;印度新德里的学生通过TensorFlow把移动设备变成了空气质量监测器。今年春天,谷歌发布了早期版的TensorFlow 2.0,这使得没有经验的开发人员更容易访问人工智能。谷歌的最终目标是让开发人工智能应用程序像开发网站一样简单。
TensorFlow现在已经有4100万次的下载量。包括汽车、无人机、卫星、笔记本电脑、手机在内的数以百万计设备都用它来进行学习、思考、推理和创造。公司内部文件跟踪了谷歌内部TensorFlow的使用情况,发现自2015年以来已经增长了500%。
然而技术内部人士指出,如果TensorFlow是送给开发者的礼物,那么它也可能是特洛伊木马。一位不愿透露姓名的前谷歌工程师表示:“我担心谷歌正试图成为人工智能的看门人。”目前TensorFlow只有一个主要的竞争对手,也就是Facebook的PyTorch,后者在学术界很受欢迎。这使得谷歌能够控制人工智能的基础层面,并可以将其可用性与谷歌的其他要求联系起来。“看看谷歌对Android做了什么,”这位人士指出。去年欧盟监管机构对谷歌处以50亿美元罚款,原因是该公司要求电子产品制造商在运行Android系统的设备上预装谷歌应用程序。谷歌开发的产品颇具吸引力,但它在欧洲和印度的竞争行为正面临进一步调查。
通过推动人工智能应用,谷歌也创造了对新工具和新产品的商业化需求。张量处理单元(TPU)就是一个例子,这种芯片专为TensorFlow加速应用程序而打造。如果开发人员需要为他们的TensorFlow应用程序提供更多的功能,他们可以付费使用运行在谷歌数据中心的这些芯片。
TensorFlow的成功战胜了谷歌领导层的怀疑。“所有人都知道人工智能曾经没什么用途,”谢尔盖 布林(Sergey Brin)在2017年世界经济论坛(World Economic Forum)的一次采访中回忆道。“人们尝试过人工智能,他们尝试过神经网络,但都没有成功。”即便当迪恩和他的团队开始取得进展后,布林也显得不屑一顾。“杰夫·迪恩(Jeff Dean)会时不时地过来对我说,‘看,电脑自动生成了一张猫的照片,’我只是说,‘好吧,这很好,杰夫,’”布林这样回忆当时的举动。但他不得不承认,人工智能是“我一生中计算机领域最重要的发展”。
打消公司内外的疑虑
I/O开发者大会的第二天,谷歌机器学习道德、信任和安全负责人珍·金奈(Jen Gennai)主持了一场关于“为公平、道德的人工智能和机器学习编写概要”的会议。她告诉观众:“我们已经确定了四个领域,这是我们的红线,是我们不会追求的技术。我们不会制造或部署武器。我们也不会部署我们认为侵犯权利的技术。”她和另外两名谷歌高管继续解释公司现在如何将人工智能原则融入所开发的内容中,以及为解决算法偏见和预测人工智能意外后果所制定的全面计划。
发言结束后,来自不同公司的一小群开发人员混在一起,对此并不满意。“我觉得我们得到的还不够多,”一位用TensorFlow且经常与谷歌合作的大型国际公司员工表示。“他们告诉我们,‘别担心。我们能够做到。我们都知道他们没有做到。”
这些开发人员完全有理由怀疑。谷歌经常言行不一,而人工智能的风险更高。2018年3月有报道称,该公司与五角大楼签订了一份名为Maven的人工智能无人机打击技术合同。在谷歌员工抗议了三个月后,皮查伊宣布不会续签合同。
当被问及人工智能的黑暗面时,和蔼可亲的迪恩变得严肃起来。“我团队中的人对我们应该如何与国防部合作直言不讳,”他指的是他们在Maven项目上的工作。迪恩列举了谷歌不会开发的人工智能应用列表。“其中之一是研发自动化武器。对我来说,这是一件我不想做的事,或者希望撇开的事情。”
在最初Maven项目引发的争议中,谷歌内部电子邮件揭示了公司内部对其人工智能野心能否被接纳的担忧。“我不知道如果媒体开始关注谷歌正在秘密制造人工智能武器的话题,会发生什么,”谷歌云首席人工智能科学家李飞飞曾经在其中一篇文章中对同事们说。“无论如何要避免提及或暗示人工智能。人工智能武器可能是人工智能中最敏感的话题之一。”她还建议公司植入一些积极的公关故事,比如一些人性化的人工智能。“我会非常小心地保护这些非常正面的形象,”她写道。
这些有关人工智能的抗议引发了一场持续的公关危机。今年3月,谷歌宣布成立一个先进技术外部咨询委员会,也就是俗称的人工智能道德委员会。但就在一周多后,该委员会因数千名谷歌员工抗议其组成而解体。
皮查伊本人也已经介入了好几次。去年11月,他致信员工承认谷歌的失误。他说:“我们认识到,我们过去所做的一切并不完全正确,对此我们深表歉意。”“很明显,我们需要做出一些改变。”但围绕谷歌如何部署技术的争议仍在继续。今年8月,一个名为谷歌人权(Googlers for Human Rights)的内部员工组织发布了一份有800多个签名的公开请愿书,要求谷歌不要向海关和边境保护局(Customs and Border Protection)、移民和海关执法局(Immigration and Customs Enforcement)或难民安置办公室提供任何技术。
当被问及谷歌的人工智能原则如何影响他自己的工作时,皮查伊把它与另一个公司的优先事项联系起来:减轻人们对谷歌如何处理所拥有用户数据的担忧。“我推动团队前进的目标是兼顾人工智能和隐私,”他表示。“这有点违反直觉,但我认为人工智能给了我们一个强化隐私的机会。”去年春天,他讨论了谷歌内部使用机器学习来保护智能手机数据,使其不被除用户以外任何人访问的努力。
皮查伊表示,人们对人工智能危险的担忧有些言过其实。他解释说:“重要的是让人们明白什么需要担心而什么不用担心,好在我们还有时间。”皮查伊希望谷歌能够通过展示人工智能的优点来平息人们对其危险性的担忧。在一项名为“社会公益人工智能”的倡议下,谷歌正在利用机器学习来解决它所描述的“世界上最大社会、人道主义和环境问题”。有些团队利用人工智能来预测洪水、追踪鲸鱼、诊断癌症,以及探测非法采矿和伐木。在I/O开发者大会上,一位来自乌干达的年轻企业家受谷歌邀请谈到使用TensorFlow来追踪导致非洲各地饥荒的粘虫。谷歌于2018年发起的人工智能影响挑战赛(AI Impact Challenge)向慈善机构和初创企业提供2500万美元的资助,将人工智能应用于拯救雨林和扑灭火灾等事业。
在围绕人工智能的争论中,该公司还撤回了两项有争议的举措。去年12月,谷歌搁置了自己的面部识别软件。一位内部人士估计,此举可能会导致谷歌收入损失数亿美元。谷歌还因为道德方面的担忧退出为五角大楼提供云计算的100亿美元项目竞标,而亚马逊和微软仍在竞争中。
当被问及谷歌如何决定一个项目对社会是好是坏时,皮查伊引用了一个叫做“唇读项目”的例子。一组工程师想出了一个主意,用人工智能通过摄像头读取唇语。其目的是让不能说话的人士能够进行自由交流。然而一些人对意外后果表示担忧。坏人会通过街头摄像头用它来监视吗?工程师们在街头摄像头和其他公共摄像机上进行了测试,并确定人工智能需要近距离才能起作用。谷歌随后发表了一篇论文,详细介绍了这项功能,并确信目前可以安全使用。
推动人工智能更进一步的量子霸权
这是加利福尼亚州圣巴巴拉市一个阳光明媚的下午,当地谷歌实验室里的温度计显示的读数是10毫开尔文,只是比绝对零度高了千分之一。“这是宇宙中最冷的地方之一,”在实验室工作的研究科学家埃里克·卢塞罗(Erik Lucero)如是指出。“这里面,”他指着一个闪闪发光的金属容器说,“比太空还要冷。”这个容器的大小和形状像一个油桶,由铜制成的外壳镀了真金。由铌钛制成的粗电缆像章鱼一样从顶部伸出来,传输控制和测量信号。
这个容器里装的是地球上最脆弱、可能也是最强大的机器之一:量子计算机。如果一切按计划进行,它将大大增强人工智能,很可能重塑我们对宇宙以及人类在宇宙中地位的看法。
谷歌的量子计算机能否让人工智能更进一步?
量子计算的梦想早在上世纪80年代就已经有了,当时制造原子弹的曼哈顿计划(Manhattan Project)创始成员理查德·费曼(Richard Feynman)开始从理论上研究如何通过改造量子力学来释放计算能力。现有计算机运行的比特信息要么等于0,要么等于1;这些设备必须一步一步地计算结果、概率和方程,在得出答案之前要连续地用尽所有选项。相比之下,量子计算机中的量子比特能够让0 和1的状态可以同时存在,这使得量子计算机处理某些信息的速度快得多。据称,一台300量子比特的计算机可以同时进行与宇宙中原子数量相同的并行计算。
“这些实际上是量子比特,”卢塞罗说。显微镜下是一些模糊的黑色东西,一共有22个。在实验室的其他地方,谷歌已经制造了72个量子比特。目前它们只能存活20微秒,而且环境必须比外太空更冷。
为了创造一个商业上可行的量子计算机,谷歌需要制造足够的量子比特,并使它们保持稳定,以便能够做出任何重大的计算突破。其他实验室也在进行竞争,但是谷歌已经召集了一批世界上最重要的专家,想法设法创造一个量子比特能够生存和繁荣的环境。谷歌朝着这个目标前进的速度比任何人预期都要快:去年12月,谷歌用一台普通笔记本电脑与最好的量子计算机进行比对测试,结果笔记本电脑赢了。几周后,经过对处理器的一些调整,它击败了笔记本电脑,但仍落后于台式电脑。今年2月份,量子计算机已经超过了实验室里的所有其他计算机。
今年5月,谷歌量子团队的负责人哈特穆特·尼文(Hartmut Neven)在谷歌量子之春研讨会上介绍了实验室的进展,他将处理能力的增长描述为双指数增长。
现在谷歌团队正在研究称之为量子霸权的重要里程碑。近日,谷歌研究人员称谷歌的量子计算机用3分20秒时间完成了相关计算,而世界第一的超级计算机Summit完成同样运算要花费1万年的时间。
在加州大学圣巴巴拉分校的实验物理学家约翰·马提尼斯(John Martinis)领导下,谷歌首次预测它将在2017年底实现“量子霸权”。但事实证明,它所开发的连接72个量子比特的系统太难控制。
最终该公司对系统进行了改造,设计出连接53个量子比特的系统,代号为Sycamore。该系统的任务是证明随机数生成器是真正随机的。尽管这项工作几乎没有任何实际应用,但谷歌研究人员表示,“这种计算能力的其他最初用途”包括机器学习、材料科学和化学。
要使谷歌的量子计算机充分发挥潜力还需要数年的时间。但在谷歌实验室里,对这一刻的期待是显而易见的。“如果没有量子计算机,目前的一些问题人类将无法解决,”卢塞罗站在准备实现这一壮举的机器旁边说。“你正在为人类开启一种新的潜能,这个想法令人兴奋。”
房间里在有节奏地嗡嗡作响,表明量子比特在孵化。当计算机真的可以指数级的速度思考和计算时,这对人类意味着什么?这门新兴科学或许能够解释宇宙中最深奥的奥秘——暗物质、黑洞和人脑。“这是‘Hello,World!’的时代。” 卢塞罗指的是1984年推出的麦金塔电脑,其为一代程序员开启了新时代。当谷歌打开通往这个新宇宙的大门时,无疑所有人都需要为另一边的世界做好准备。