OpenAI“单手解魔方”被公开质疑，Gary Marcus称七大问题涉嫌误导

转载2019-10-22 20:30作者: 新智元

摘要编者按：本文来自微信公众号“新智元”（ID：AI_era），经授权发布。

编者按：本文来自微信公众号“新智元”（ID：AI_era），经授权发布。

来源：Twitter、Reddit

编辑：小芹、大明

近日，“OpenAI的机器手在4分钟内单手成功还原魔方”引起刷屏，然而，这一成就被著名机器学习怀疑论者马库斯质疑了，马库斯逐条列举OpenAI的误导性说法，机器学习圈却都撑OpenAI。

这几天，人工智能领域最令人兴奋的进展莫过于“OpenAI 的机器手学会了单手解魔方”。

OpenAI 在 10月 15 日发布这一成果，立即引起大量讨论。转魔方的视频被疯狂刷屏，仅 YouTube 的视频就有 20万观看，网友纷纷表示：人工智能机器人的一个新里程碑诞生了！这是机器人在机体灵活性以及机器学习软件方面的飞跃！

OpenAI 使用强化学习和 Kociemba 算法训练神经网络来模拟解决魔方问题。

研究人员专注于一个机器目前难以掌握的问题：感知和灵巧的操作。他们训练神经网络来实现由法生成的还原所需的旋转和翻转，并开发了一种称为自动域随机化的新方法，该算法能够无休止地在仿真中生成越来越困难的环境，从而让神经网络在模拟环境中学习解魔方，再迁移应用到现实世界。

“用机器手解决魔方”的背后有许多人手

OpenAI 训练类人机器手来解魔方的尝试，早在 2017 年 5 月就开始了。之所以对解魔方情有独钟，是因为研究人员认为，如果能成功训练这样一只机器手来完成复杂的操作任务，就能为通用型机器人奠定基础。

OpenAI 同时公开了一个机器手解魔方的完整视频，可以看到，机器手灵活地操作魔方，在约 4 分钟的时间里成功还原了一个三阶魔方。

机器手还原魔方的完整过程

然而，这一成果遭到了纽约大学心理学与认知科学教授、畅销书作家加里·马库斯(Gary Marcus)的质疑——OpenAI 声称“解决”了魔方，真的是这样吗？马库斯认为 OpenAI 还原魔方的博客内容存在误导性，他说：

鉴于 OpenAI 仍然没有更改关于“解决魔方”的误导性博客帖子(博客标题是“Solving Rubik’s Cube with a Robot Hand)，所以我附上了详细的分析，将他们的说法和暗示与实际所做的进行了比较。依我之见，这些误导性对大多数对非专业人士来说并不明显。

马库斯对 OpenAI“解决魔方”的 7 条质疑如下：

1、这不是神经网络解决的；而是有 17 年历史的符号算法做到的。

2、这种算法是先天的，而不是学习的。

3、强化学习在选择转向哪个方向(即大多数人所说的解决了魔方)时不起作用。

4、所学到的是物体操纵，而不是解魔方。

5、只有一个物体被操纵，并且没有测试对其他对象的可推广性。

6、该物体装配了大量仪器(如蓝牙传感器)，机器手也安装了 LED。

7、成功率只有 20%；魔方经常从机器人手中掉落。

他说：“我强调一下，这个成果本身给人留下了深刻的印象，但描述有误导，更恰当的标题应该是’用强化学习操纵魔方’或‘灵巧的机器人手操纵物体的进展”或类似的句子。”

OpenAI 联合创始人、机器人团队负责人 Woj Zaremba注意到马库斯的帖子，反驳道：

1. 你的前三个论点是一样的。

2. 泛化是从模拟到现实，而不是从一个物体到另一个物体。

3. 我们没有装配仪器得到的结果稍微弱一些。

4. 你确信我们不会将性能提升到 100%吗？

马库斯回应道：

1. 我的前两个论点完全不同：先天性≠象征性。这些是不同的。第三个论点有一点重叠，但并不明显。

2.我当然知道，但是为了稳健性，你需要推广到新物体上

3&4：我期待看到其他结果；我相信你们最终会做得更好。

尽管是马库斯率先提出质疑，但不少人的回复并不赞同马库斯的说法，有人回复道：

“这是一个有缺陷的批评，基于对魔方的误解。魔方不是像围棋那样是一种可以学习的任务，而是需要记忆解法和熟练操作的任务；人类玩魔方也遵循一种算法。”

马库斯仍表示：总的来说，他们(OpenAI)没有对我的观点做出回应，我的观点是那篇博客的框架与论文的内容不相符合，虽然我同意这个工作很重要，但炒作是有误导性的。

网友评论各执一词，马库斯是一针见血，还是吹毛求疵？

马库斯在 Twitter 上也承认这个研究是个不错的研究，但博客文章中的一些说法用词不当，和实际不符，具有误导性。

OpenAI 博客中的结尾表示：“强化学习不仅可以作为虚拟任务的工具，而且可以解决需要前所未有的灵活性的真实世界中的问题。” 而马库斯认为，如果没有更强的泛化测试，就无法提出进一步的主张。5 个略有不同的 cube 实验，也不能让这个机械手学会拧紧螺丝，开锁或给衬衫系上扣子。

所以，这些问题的解决实际上无从谈起。

Twitter 上有人对马库斯表示支持，认为 OpenAI 的博客中的说法和实际确实存在实际差异。这种夸大其词可能导致大众对技术的盲目信任，进而造成消极后果，比如特斯拉的撞车事故。

马库斯自己还发了个投票：

不过从 600 多人的投票结果看，支持“解决魔方”应包括认知和操纵两方面的占大多数。

在 Twitter 上不断 “放炮” 的同时，这场辩论的战火不了避免地转到了其他平台，比如 Reddit。

有网友搬运了马库斯在 Twitter 上发出的对 OpenAI 博客文章的 7 点详细意见，并配了贴图。但从网友讨论来看，支持马库斯的不多。更多的人认为他这是过于苛刻，咬文嚼字，没事找事。

比如下边这位就说，他觉得马库斯写的这 7 点摘要比 OpenAI 博客文章更具误导性。

关注点 1-4：“神经网络没有解决问题；解决问题的是具有 17 年历史的符号 AI 算法。”

博客：“我们使用强化学习和 Kociemba 的算法来选择求解步骤，训练神经网络来解决仿真中的魔方。”

关注点 5：“只有一个对象被操纵，没有对其他对象的可推广性测试”

博客：测试使用了五种不同的原型，一个锁紧的模仿，一个面部立方体，一个完整的立方体，一个吉克魔方和一个 “常规” 魔方。这篇文章从来没有声称要解决魔方的问题。

关注点 6：“该物体已被植入大量设备（比如带有蓝牙功能传感器）。玩魔方的手上也装有 LED。”

博客：五个不同的原型中置入了不同级别的仪器。“常规” 魔方没有置入任何设备，只是从中心正方形上切除小角，以消除对称性。

关注点 7：“成功率只有 20％；魔方经常掉落。”

博客：“尽管如此，我们的机器人仍未完善其技术，因为只有 60％的成功几率（而最困难的情况下只有 20％的成功几率）。”

而且下文专门开了一段来说这个问题。

还有人认为，马库斯实在是过于挑剔了，过于纠结于实际上并不重要的问题。

我承认马库斯是一个能言善辩的人。但我觉得他过于迂腐，以至于无视于眼前的实际问题，大多数外行人都有能力阅读文章的背后之意，查看研究或博客文章的内容。

你可以去追求学术上的精确，但是那些真正关心这些东西的人很可能会陷入困境。我们都对他列出的几条问题有所了解，但至少其中大多数。在这种情况下几乎是无关紧要的，甚至像 “泛化性”之类的重要论点，在机器人的高灵敏度这一主要问题面前，也显得不那么重要了。

我明白，不同的人会以不同的严谨程度来对待这个问题，并且我也理解马库斯的担忧，但我认为，对于 OpenAI 的公开批评过于挑剔，这些问题本身对这次讨论并不重要。

马库斯是谁？深度学习怀疑论者

Gary Marcus

加里·马库斯(Gary Marcus)是一位科学家、畅销书作家和企业家。他是 Robust.AI 公司的创始人和首席执行官，Geometric Intelligence 公司(2016 年被优步收购)的创始人兼首席执行官，出版著作包括《代数思维》、《怪诞脑科学(Kluge)》、《思维的诞生》等，最新著作是与 Ernest Davis 合著的《Rebooting AI :构建我们可以信任的人工智能》。

马库斯也是著名的深度学习怀疑论者。作为认知心理学家，他一直高调参与人工智能辩论，与 Yann LeCun、AAAI 前主席 Thomas Dietterich 等 AI 大牛都展开过激烈辩论。

他曾撰文批判深度学习(Marcus, 2018)，称深度学习实际上并没解决什么问题。这篇文章引起了人工智能圈极大的反响，几天之内，成千上万的人在推特上发表了自己对这个问题的看法，有些人热情支持马库斯的论点（例如，“这是我多年来读到的有关深度学习和 AI 的最好的观点），有些相反（例如，“有思考...... 但大部分都是错误的”）。

在那篇批判深度学习的文章中，马库斯概括了深度学习的十大挑战，直言深度学习本身虽然有用，但它不可能实现通用人工智能。他建议把深度学习视为“一种非普遍的解决方法，而只是一种工具。”

他说：“相比纯粹的深度学习，我呼吁混合模型，不仅包括深度学习的监督形式，还包括其他技术，例如符号处理（symbol-manipulation），以及无监督学习（它本身也可能被重新概念化）。我也敦促社区考虑将更多的内在结构纳入 AI 系统。”

Reddit：

https://www.reddit.com/r/MachineLearning/comments/dkd4vz/d_gary_marcus_tweet_on_openai_still_has_not

转载声明转载声明：本文系后花园转载发布，仅代表原作者或原平台态度，不代表我方观点。后花园仅提供信息发布平台，文章或有适当删改。对转载有异议和删稿要求的原著方，可联络[email protected]