新西蘭
繁體中文(台灣)
分享

AI技术重大突破:成功通过八年级科学测试

转载作者: 神译局
AI技术重大突破:成功通过八年级科学测试
摘要神译局是旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风……

编者按:2016年,谷歌人工智能围棋程序AlphaGo战胜世界围棋冠军李世石的消息,让不少人都认为,人工智能已经进入了新的拐点。然而,有些科学家却并不这样认为。这篇翻译自《纽约时报》的文章,原标题是A Breakthrough for A.I. Technology: Passing an 8th-Grade Science Test,作者Cade Metz介绍了人工智能技术的一项重大突破,并向你介绍人工智能技术的有关进展与现状。

hougarden

图片来源:unsplash.com @hiteshchoudhary

四年前,700多名计算机科学家参加了一项竞赛。该竞赛旨在鼓励建立一套可以成功通过八年级科学测试的人工智能系统。据称,该竞赛的奖金金额累计高达8万美金。

当时,这些科学家建立的人工智能系统都没有通过测试。即便是精心设计、构造复杂的系统,其正确率也未能达到60%。在语言以及逻辑技能等方面,人工智能系统还无法达到中学生的水平。

然而,就在前不久,位于美国西雅图的人工智能艾伦研究院(Allen Institute for Artificial Intelligence)推出了一项新的人工智能系统,这项系统能够轻轻松松地通过测试。在八年级科学测试中,该系统的正确率达到了90%以上;而在12年级科学测试中,该系统的正确率也达到了80%以上。

人工智能艾伦研究所研发的这套系统叫做Aristo。Aristo系统的推出,也证明了研究人员在过去几个月中在人工智能研究领域的重大突破,实现了让人工智能系统理解语言、并模仿人类逻辑推理和制定决策的能力。

全球范围内,众多人工智能领头试验室都在快速研发并推出进一步理解并回应自然语言的机器系统。在分析文件、搜寻信息、回答问题甚至生成语言等方面,机器系统的能力也逐步得到了提高。

建立Aristo系统的初衷,仅仅是为了让它去完成全是选择题的测试。在建立这套系统的过程中,研究人员搜寻了大量纽约市中学生的标准测试习题,但他们人为地删除了带有图像和表格的习题。要回答这些习题,还需要额外的技能,比如语言理解及逻辑,以及计算机视觉等。

其中,有一些像如下示例的八年级科学试题,考核的不仅仅是信息检索:

但也有一些像如下示例的试题,则需要借助逻辑推理能力:

2013年,西雅图的亿万富翁、微软公司的联合创始人保罗·艾伦(Paul Allen)发起成立了人工智能艾伦研究院。自成立后不久,该研究院的研究人员就开始着手研发Aristo系统了,他们还希望打造出一款“数字亚里士多德”。

这些研究人员认为,常规的科学测试习题相比于典型的人工智能基准而言,更具有重要意义。人工智能基准主要依赖于象棋和双陆棋等棋类游戏或者专门为机器系统建立的任务。

要答对科学测试的习题,并不仅仅涉及到规则的学习。它还需要借助于逻辑来建立联系。比如,森林火灾次数的增多,可能会导致松鼠的死亡,或者可能会减少可获取食物的数量,从而影响它们的繁殖与发展。

对于Aristo系统所取得的突破,仍然有一些科学家并不予以关注和支持。他们认为,机器系统要完完全全地掌握自然语言,仍然还有很长的路要走,更不用说开发出真正的人工智能系统了。

“我们不能把这项技术用来和中学生以及其推理能力作比较,”从事与人工智能艾伦研究院类似技术研究的微软研究人员刘晶晶(音译)说。

但是,Aristo系统所取得的突破,可以拓展延伸至一系列产品和服务行业中,包括互联网搜索引擎以及医院的数据记录系统等。

hougarden

人工智能艾伦研究院负责人奥伦·埃齐奥尼(Oren Etzioni)。图片来源:Kyle Johnson for The New York Times

“它具有非常重要的商业意义,”负责管理人工智能艾伦研究院的前华盛顿大学(University of Washington)教授奥伦·埃齐奥尼(Oren Etzioni)博士表示,“我非常自信的是,你将会发现许多新一代的产品,它们既包括创业公司的产品,也包括大公司的产品。”

这一项新的研究,可以研发出能够基本与人对话的系统。但是,它同时也可能会导致错误信息的传播。

杰瑞米·霍华德(Jeremy Howard)是一名数据科学家,他同时也是位于旧金山的另一个重要实验室Fast.ai的负责人。霍华德说,“我们现在还处于早期研发阶段,仍然还有很长的路要走。至于在这方面的发展潜能,我甚至都无法确定它能走多远。”

2016年,来自伦敦的一个实验室开发的一套系统,击败了世界顶尖围棋选手。这个事件,也标志着人工智能的转折点。

然而,埃齐奥尼却对此反应冷淡。他认为,人工智能还并没有达到人们所认为的那种智能阶段,他甚至提到了其研究院之前着力研发可以轻松通过八年级科学测试的人工智能系统的案例。

不过,人工智能艾伦研究院在之前的基础上所取得的突破,的确让包括埃齐奥尼在内的许多专家另眼相看。

他们的研究突破,主要得益于神经网络以及复杂数学系统的运用。借助这些技术,人工智能系统可以通过分析大量数据信息而理解相应任务。比如,通过明确指出上千张带有狗的图片中的模式,神经网络就可以学会识别图片中的狗。

近几个月来,全球范围内主要领先的人工智能实验室都已经推出了精心研发的神经网络系统。通过对人类撰写的文章和书籍的分析,其可以更好地理解语言中存在的各种变量。

在谷歌公司,研究人员开发出了一套叫做Bert的系统。这一套系统的开发,结合了上千篇维基百科的文章,以及庞大的数字图书馆的图书信息,其中还包括爱情小说、科幻小说以及由作者自行出版的多种类别图书。

通过对这些书籍或文章文本的分析,Bert系统可以推测出一个句子中可能遗漏的文字。就单单通过这一项技能,Bert系统就学习并吸收了大量关于语言构造的基本方式。基于此,研究人员还可以将它运用于其它任务之中。

hougarden

埃齐奥尼与Aristo项目经理彼得·克拉克(Peter Clark)。图片来源:Kyle Johnson for The New York Times

人工智能艾伦研究院的Aristo系统,是建立在Bert系统技术之上的。通过对Bert系统中的一系列问题及答案的不断学习后,它可以学会自行回答相似的问题。

不久之前,人工智能艾伦研究院的研究人员还在将其系统的行为用代码表示出来,并且每一个行为都用一串代码来表示。如今,他们也还时不时地做着这种费尽心思的编码工作。不过,如今的系统可以自行学习并理解数字信息,所以在很大程度上速度都得到了提升。

当前,许多类似于Bert系统的“语言模型”系统,都在推动一系列研究项目的落地,包括识别假新闻的对话系统和工具。得益于更多的数据和更强大的计算能力,研究人员认为这方面的技术还可以进一步提高。

但埃齐奥尼强调,目前还很难去预测这些系统的未来发展情况。他表示称,语言理解问题,只是众多难题中的一小部分。

刘晶晶和她的微软同事之前也尝试建立过一套系统,并争取成功通过美国研究生入学考试(GRE)。

刘晶晶提到,对于GRE测试中的语文部分,她们研发的系统还基本能够应付。但对于数学部分中需要借助于推理技能的试题,则完全不一样了。“这就太具有挑战性了。”刘晶晶说。

译者:俊一


转载声明转载声明:本文系后花园转载发布,仅代表原作者或原平台态度,不代表我方观点。后花园仅提供信息发布平台,文章或有适当删改。对转载有异议和删稿要求的原著方,可联络[email protected]