会搭积木的AI,正在手眼并用地探索现实世界
春节假休完,北上广又开始上演小城妈宝惨变五环内社畜的惨剧。恢复到自己洗衣做饭收拾屋子的日子,年轻人们又深刻地感受到——科技不能改变生活,老妈才能。
人工智能虽然在各种游戏比赛中血虐人类,但在现实世界里却不能帮助人类“血虐”家务活。在研究更适用于复杂现实场景的机器人这件事上,我们一直在努力。
一般来说通过计算机视觉对外界进行感知,再结合数据模拟计算规划行动,是机器人训练研究的一个常见的方向。
就像在电影里常常出现这样的情节:机器人已经发展到高度智能化,甚至和人类无异,但在做一些类似于拿起一包牛奶,或者跟人类握手的动作时,往往会掌握不好力道。
这种情节并不是完全虚构的,对于应用视觉传感技术的机器人来说,它们能够辨识外界事物的形状,却很难判断外界事物的质地、密度和受力情况。所以在很多情况中,光有视觉技术是远不足够的。
守序善良且秀:一位非人类的职业积木玩家
比如很多人都玩过,或者在美剧里见过的桌游“叠叠乐”——用积木条堆叠成积木塔,参与玩家在不导致塔倒塌的前提下从塔身中抽出积木条,将积木条搭到塔顶端,塔在哪位玩家的回合中倒塌,哪位玩家就输掉比赛。
这种过程如果是用视觉技术理解,则需要难以想象的海量计算——堆起积木塔时每一条积木的位置、两位玩家的每一步动作,都会造成无数的分叉结果,几乎是不可能完成的任务。
在最近的Science Robotics期刊中,来自MIT的科研人员公布了他们最新的研究成果——用机器手臂玩叠叠乐。
项目负责人Rodriguez提到,之所以选择叠叠乐作为实验对象,是因为这个游戏中体现了机器人应用的一个重要问题——物理交互,也就是前面提到的动手能力。
为了解决物理交互问题,MIT为普通机械手臂添加了三样东西,柔性夹钳、有力量传感作用的腕带和拍摄全局画面的摄像头。
这也导致了在叠叠乐上,AI还很难实现和人类对战。不过项目负责人Rodriguez认为,他们创造这个项目本来也不是为了和人类在叠叠乐游戏上一决高下的。
当AI开始多才多艺
BBC、CBS News和Wired等主流媒体都对这一研究结果给出了很高的评价,原因就在于这一研究在AI的触觉刺激上突破,具有很高的现实意义。
MIT提到,目前应用在叠叠乐AI模型上的原理,同样也可以被应用在另外一些应用机械手臂的场景中。
其实这种结合两种纬度数据进行AI训练的方式并非MIT独有,在去年我们在一些类似于视频分析的领域中,也能看到诸如画面分析+语音分析的多模态理解。
随着触觉机制越来越多地被引入机器人领域,与视觉系统、红外/激光雷达等其他传感模式的结合也越来越多。
可见在探索现实世界的旅途中,AI正在愈发多才多艺起来。相信当机器人也开始手眼并用时,我们距离“科技改变生活”的未来也越来越近了