新西蘭
繁體中文(香港)
分享

金融时报:Facebook正在加入AI芯片竞赛

生活作者: 半导体行业观察
金融时报:Facebook正在加入AI芯片竞赛
摘要在认识到需要大大加快计算速度以实现人工智能的下一个突破之后,Facebook紧跟亚马逊和谷歌的脚步,正在加紧开发自己的人工智能芯片。

LeCun先生最近在接受英国“金融时报”采访时表示,Facebook希望与多家芯片公司合作开发新设计 ,他们最近也宣布与英特尔合作开展项目。但他也表示,Facebook也在开发自己的定制“ASIC”芯片,以支持它的AI程序。

“众所周知,Facebook会在需要时构建其硬件,包括构建自己的ASIC。如果有任何不解之处,我们将继续努力”,Lecun说,这也是Facebook官方第一次公开其在芯片领域的野心。

谈到公司有可能在芯片哪些方面取得突破的时候,LeCun强调,在底层会有很大的空间。

Facebook决定打造自己的芯片,对Nvidia来说,又将是另一个长期挑战。后者是目前用于数据中心AI的图形处理器的主要生产商,在各大厂商进入芯片领域之后,Nvidia面临着大型数据中心客户退出的短期挤压。

随着对以闪电般的速度和更低的功耗执行单一任务需求的提升,过去的通用处理器的瓶颈凸显,专用AI芯片开始爆发。这个趋势不仅吸引了谷歌,亚马逊和苹果等公司的投身其中,还有几十家初创企业大举进入。

hougarden

对新芯片设计和硬件架构的关注表明,我们需要在基本计算方面取得根本性突破,以防止今天的AI成为死胡同。

LeCun先生说,在人工智能的整个历史中,研究人员在该领域提出突破性见解之前,硬件方面通常已经取得了很大的进步。

“在相当长的一段时间里,人们没有太多想法”,他说。

以反向传播(back propagation)为例,这是当今深度学习系统中的一项核心技术,它将算法在其计算之上进行重新计算,以最大限度地减少错误。LeCun先生表示,这是早期研究的一个明显延伸,但在计算硬件发展之后,才在20世纪90年代得到广泛应用。

Facebook曾设计过其他类型的硬件,例如为数据中心设备提出新想法,然后再开放供其他人使用。LeCun先生说,同样的方法将应用于芯片设计,并补充道:“目的是将其开放。”(The objective is to give it away)。

该公司还将研究重点放在神经网络的新设计上,神经网络是图像和语言识别等最新进展背后的深度学习系统的核心。

三十年前,LeCun先生在AT&T贝尔实验室的AI芯片上工作时,建立了第一个“卷积”神经网络:一种基于视觉皮层在动物中如何工作的设计,现在在深度学习系统中很常见。

hougarden

今天的神经网络使用一种称为监督学习的技术,这需要大量的数据进行训练,在像Facebook这样规模的公司中,这种运算消耗大量的电力。

Facebook现在已经对每天上传到其核心服务上的所有2-3亿张照片进行了大量即时分析,包括使用面部识别来识别其中的人物,创建描述场景的标题,以及识别裸露等。

LeCun先生表示,Facebook正在做我们可以做的任何事情来降低功耗并改善延迟,以加快处理速度。但他补充说,在网站上实时监控视频所带来的巨大需求需要新的神经网络设计。

Facebook也在寻求新的神经网络架构,以模仿人类智能的更多方面,并使其系统更自然地与之交互。

LeCun先生表示,公司正在大力投资“自我监督”系统,这些系统能够对周围的世界做出更广泛的预测,而不仅仅是能够得出与他们接受过培训的数据直接相关的结论。

这可以使他们对世界产生同样广泛的理解,使人类能够应对新情况。

“就新用途而言,Facebook会感兴趣的一件事是提供具有一定程度常识的智能数字助理 ”,LeCun说。“他们有背景知识,你可以就任何话题与他们进行讨论。”

计算机具有常识的想法还处于早期阶段,LeCun先生表示,这种更深层次的人工智能短期内不会发生。

“你如果想让机器像人类或动物那样能够就当前发生的事情预测可能的结果,这还有很长的路要走 ”,LeCUN说。“能够预测不确定性是当今的主要挑战之一。”

Facebook是尝试增强当今神经网络的更广泛研究工作的一部分。LeCun先生将于周一在旧金山举行的Chip会议上发表演讲,概述这项工作。研究工作包括将计算机存储器添加到神经网络中,以便他们在与人进行“对话”时可以保留更多信息并形成更强的上下文感。

神经网络如何发挥作用的进展很可能对为其芯片设计产生连锁反应,这可能会为制造当今领先的AI芯片的公司带来更多的竞争。

LeCun先生说,谷歌的TPU已经成为最强大的机器学习数据中心芯片,但他们做出的假设不一定适用于未来的神经网络架构。

另一方面,芯片的灵活性可能具有其他缺点。例如,微软计划在其所有数据中心服务器中加入一种不同类型的芯片,称为现场可编程门阵列(FPGA)。它们在如何使用它们方面更加灵活,但在处理大量数据方面效率较低,使它们对于针对特定任务进行了优化的芯片处于劣势。


转载声明转载声明:本文系后花园转载发布,仅代表原作者或原平台态度,不代表我方观点。后花园仅提供信息发布平台,文章或有适当删改。对转载有异议和删稿要求的原著方,可联络[email protected]