IBM AI再战人类辩手,输了!复盘全程精彩
本次比赛在位于旧金山的IBM Think会议上举行。双方围绕“政府是否应该资助学前教育(Whether goverment should subsidize pre-schools?)”进行激烈交锋。
从AlphaGo接连战胜国际围棋冠军,到AlphaStar在星际争霸2将人类对手杀得片甲不留,AI一直在挑战新的高峰,不断刷新战胜人类的历史记录。
不过,如果你以为这个AI系统只是个辩论机器,或者只是个帮助人类补充逻辑思维的工具,那你就有点天真了。这只是IBM宏伟野心刚刚拉开的序幕。
▲人类冠军辩手Harish Natarajan与IBM Project Debater进行辩论
人类首次辨赢AI这场辩论采用传统美式辩论规则:双方在开场15分钟前得知辩题,辩论分为三回合,前两回合每人4分钟,第三回合2分钟结辩陈词。最终结果由现场800位观众投票决定。在开场时,观众会根据辩题进行第一轮的投票,然后在辩论结束时再次投票,哪一方的跑票数更少,哪一方就是冠军。
这种投票方式可以避免辩题本身对观众产生的倾向性,使得辩论胜负的判断更为公正。
Natarajan拥有大多数辩论赛冠军的世界纪录,参加过三次世界锦标赛,并在2012年赢得了欧洲锦标赛冠军。在得知辩题后,Natarajan快速将思考潦草地记在纸上。
IBM的研究人员们就像看自己的孩子参加演出一样,在台下时而大笑时而紧张。
在打比赛之前,Project Debater完全不知道辩题,但它展示出即时且富有逻辑的语言组织能力。作为辩题的正方,Project Debater主要围绕资助学前教育对社会的意义展开论证,具体观点包括可使贫困人口受益,让学生获得成功、促进整体教育、提升社会公平、以及降低犯罪率。
Project Debater在论证时多旁征博引,从离线数据库、语料库中调用广泛的资料来源,其中包括国家早期教育研究所和疾病控制与预防中心。
但令人感到稍有遗憾的是,在驳辩(Rebuttal)环节,Project Debater未能突破既有立论观点,除了更多地铺陈外,并未作出有力的反击。
最终投票结果是,62%的观众支持正方,30% 的观众支持反方,因为反方的跑票数更少,Natarajan为人类摘下了辩论界人机大战第二战的桂冠。
虽败犹荣,AI背后的技术不容小觑
尽管Project Debater输了,它的表现依然令人印象深刻。这个搅动辩论界风云的Project Debater由IBM Research所研制,它是一个具有幽默感、小巧机智和偶尔有强有力的论点的实验性会话AI系统,也是第一个可以对复杂话题进行辩论的AI系统。和拥有预先定义规则的棋盘游戏截然不同,AI辩手必须适应人的理性和思考逻辑,并提出人们可以理解和接受的论点。
它除了要具备从海量凌乱的非结构化人类语言数据库中检索并提取所需知识的能力外,还要具备坚持自己论点、快速组织逻辑结构、避开语法错误以及预测和反驳对手论点的能力。
▲从左到右:IBM Project Debater,以色列国家辩论冠军Noa Ovadia,以色列国际辩论协会主席Dan Zafrir
当时IBM Research首席调查员兼Project Debater的创造者Noam Slonim称,这一AI系统的训练早在六年前就开始,直到两年前才有能力参与与人们的辩论。过去六年来,IBM以色列海法实验室领导的全球IBM研究团队研究了数十篇研究论文中记载的许多创新技术,最终赋予了Project Debater三种功能,每种功能都在AI方面开辟了新的天地:
2、听力理解能够识别隐藏在人类连续冗长的自然语音中的关键主张,并构建有意义的反驳;
3、系统的模拟人类困境,基于一个独特的知识图谱,提炼出原则性的论点。
最终,当Project Debater站上辩论场,它已经是一台拥有渊博知识和超强逻辑的颇为“成熟”的辩论机器。
IBM研究项目Debade首席研究员Noam Slonim表示,自去年6月以来,他们一直在努力改进系统,Project Debater的数据来源已经扩充到2018年年底的数据。
当然,在和人类交锋时,Project Debater也露出了一些破绽。
IBM的星辰大海:“无偏见”的辩论机器
IBM(国际商业机器公司)这位年逾百岁的蓝色巨人,不仅堪称科技界的教父级公司,更是AI系统的开山鼻祖。1962年,IBM展示了全球第一个语音识别设备Shoebox。
1997年,IBM的深蓝系统vs国际象棋世界冠军卡斯帕罗夫,是世界上最早以机器胜利告终的人机大战,比击败柯洁的AlphaGo还早了19年。
2001年,IBM的沃森系统在在美国老牌智力问答节目《危险边缘(Jeopardy!)》打败了最高奖金得主布拉德·鲁特尔和74场连胜记录保持者肯·詹宁斯,赢得100万美元奖金。
而Project Debater出生的使命,也不只是为了和人类打辩论赛。
根据IBM研究人员Noam Slonim和Ranit Aharonov的说法,辩论只是对该技术的有趣展示方式,而Project Debater真正力的量将是其展现无偏见论述的能力。
语言充满了魅力,亦处处是陷阱,当人类被情感和偏见左右,看问题的角度很难做到完全的真实与客观。
IBM希望做到的,是在充满错漏和片面信息的时代,通过推动AI在语言和推理的进步,帮助人们建立充分知情的论点,产生更为公正的结论,并做出更好的决策。
当然,这一目标的实现过程充满荆棘。数据库本身就是个难题,Project Debater所使用的原始数据来自人类的作品,这些数据仍然会包含作者的情感和偏见。
IBM研究人员Noam Slonim曾透露他们解决偏见问题的做法。他们为AI系统设置了一个置信度阈值,如果AI对其论述感到自信,它会创建一个更复杂的陈述;如果感觉不那么自信,那么陈述就会相对简单。
结语:AI踏上新的征程
这场辩论赛,AI输了,这说明在语言和推理领域,人类依然保有优势,而AI还没有真正地准备好。虽然AI尚且并不能完全和人类相提并论,但从Project Debater的表现来看,我们正在见证互动性AI系统的持续演进。
毫无疑问,在快速地成长中,这一变革性的AI系统将以更敏锐的反应速度给出流畅的思辨,并将提出更加贴近公正事实的观点。
AI和人类,谁输谁赢其实并没有那么重要。AI背后的技术以及如何帮助人类做出更加明智的决定,这些才是我们应当关注的焦点。
最终结果由现场800位观众投票决定。在开场时,观众会根据辩题进行第一轮的投票,然后在辩论结束时再次投票,哪一方的跑票数更少,哪一方就是冠军。
这种投票方式可以避免辩题本身对观众产生的倾向性,使得辩论胜负的判断更为公正。
Natarajan拥有大多数辩论赛冠军的世界纪录,参加过三次世界锦标赛,并在2012年赢得了欧洲锦标赛冠军。在得知辩题后,Natarajan快速将思考潦草地记在纸上。
IBM的研究人员们就像看自己的孩子参加演出一样,在台下时而大笑时而紧张。
在打比赛之前,Project Debater完全不知道辩题,但它展示出即时且富有逻辑的语言组织能力。 作为辩题的正方,Project Debater主要围绕资助学前教育对社会的意义展开论证,具体观点包括可使贫困人口受益,让学生获得成功、促进整体教育、提升社会公平、以及降低犯罪率。 Project Debater在论证时多旁征博引,从离线数据库、语料库中调用广泛的资料来源,其中包括国家早期教育研究所和疾病控制与预防中心。 但令人感到稍有遗憾的是,在驳辩(Rebuttal)环节,Project Debater未能突破既有立论观点,除了更多地铺陈外,并未作出有力的反击。 最终投票结果是,62%的观众支持正方,30% 的观众支持反方,因为反方的跑票数更少,Natarajan为人类摘下了辩论界人机大战第二战的桂冠。 尽管Project Debater输了,它的表现依然令人印象深刻。 这个搅动辩论界风云的Project Debater由IBM Research所研制,它是一个具有幽默感、小巧机智和偶尔有强有力的论点的实验性会话AI系统,也是第一个可以对复杂话题进行辩论的AI系统。 和拥有预先定义规则的棋盘游戏截然不同,AI辩手必须适应人的理性和思考逻辑,并提出人们可以理解和接受的论点。 它除了要具备从海量凌乱的非结构化人类语言数据库中检索并提取所需知识的能力外,还要具备坚持自己论点、快速组织逻辑结构、避开语法错误以及预测和反驳对手论点的能力。 ▲从左到右:IBM Project Debater,以色列国家辩论冠军Noa Ovadia,以色列国际辩论协会主席Dan Zafrir 当时IBM Research首席调查员兼Project Debater的创造者Noam Slonim称,这一AI系统的训练早在六年前就开始,直到两年前才有能力参与与人们的辩论。 过去六年来,IBM以色列海法实验室领导的全球IBM研究团队研究了数十篇研究论文中记载的许多创新技术,最终赋予了Project Debater三种功能,每种功能都在AI方面开辟了新的天地: 2、听力理解能够识别隐藏在人类连续冗长的自然语音中的关键主张,并构建有意义的反驳; 3、系统的模拟人类困境,基于一个独特的知识图谱,提炼出原则性的论点。 最终,当Project Debater站上辩论场,它已经是一台拥有渊博知识和超强逻辑的颇为“成熟”的辩论机器。 IBM研究项目Debade首席研究员Noam Slonim表示,自去年6月以来,他们一直在努力改进系统,Project Debater的数据来源已经扩充到2018年年底的数据。 当然,在和人类交锋时,Project Debater也露出了一些破绽。 IBM(国际商业机器公司)这位年逾百岁的蓝色巨人,不仅堪称科技界的教父级公司,更是AI系统的开山鼻祖。 1962年,IBM展示了全球第一个语音识别设备Shoebox。 1997年,IBM的深蓝系统vs国际象棋世界冠军卡斯帕罗夫,是世界上最早以机器胜利告终的人机大战,比击败柯洁的AlphaGo还早了19年。 2001年,IBM的沃森系统在在美国老牌智力问答节目《危险边缘(Jeopardy!)》打败了最高奖金得主布拉德·鲁特尔和74场连胜记录保持者肯·詹宁斯,赢得100万美元奖金。 而Project Debater出生的使命,也不只是为了和人类打辩论赛。 根据IBM研究人员Noam Slonim和Ranit Aharonov的说法,辩论只是对该技术的有趣展示方式,而Project Debater真正力的量将是其展现无偏见论述的能力。 语言充满了魅力,亦处处是陷阱,当人类被情感和偏见左右,看问题的角度很难做到完全的真实与客观。 IBM希望做到的,是在充满错漏和片面信息的时代,通过推动AI在语言和推理的进步,帮助人们建立充分知情的论点,产生更为公正的结论,并做出更好的决策。 当然,这一目标的实现过程充满荆棘。数据库本身就是个难题,Project Debater所使用的原始数据来自人类的作品,这些数据仍然会包含作者的情感和偏见。 IBM研究人员Noam Slonim曾透露他们解决偏见问题的做法。他们为AI系统设置了一个置信度阈值,如果AI对其论述感到自信,它会创建一个更复杂的陈述;如果感觉不那么自信,那么陈述就会相对简单。 这场辩论赛,AI输了,这说明在语言和推理领域,人类依然保有优势,而AI还没有真正地准备好。 虽然AI尚且并不能完全和人类相提并论,但从Project Debater的表现来看,我们正在见证互动性AI系统的持续演进。 毫无疑问,在快速地成长中,这一变革性的AI系统将以更敏锐的反应速度给出流畅的思辨,并将提出更加贴近公正事实的观点。 AI和人类,谁输谁赢其实并没有那么重要。AI背后的技术以及如何帮助人类做出更加明智的决定,这些才是我们应当关注的焦点。虽败犹荣,AI背后的技术不容小觑
IBM的星辰大海:“无偏见”的辩论机器
结语:AI踏上新的征程