新西兰
中文简体
分享

微软小冰这五年

生活作者: 36氪的朋友们
微软小冰这五年
摘要8月15日,史上最强大的“小冰”发布了。

8月15日,史上最强大的“小冰”发布了。

这位永远18岁的“小姑娘”,至今已经解锁了主持人、记者、歌手、诗人、画家、设计师等多种职业角色,甚至还发过单曲、出版诗集、举办画展,拉了满满的仇恨。

微软小冰,诞生于2014年,起初是一个基于EQ的对话机器人,由微软(亚洲)互联网工程院打造。

此后,小冰有过上线三天进入150万的微信群但被封杀的经历,也遭受过“前言不搭后语”、“人工智障”的质疑,但经过七次迭代,小冰的产品形态已涵盖社交对话机器人、智能语音助理、人工智能内容创作和生产平台等,在全球多个国家覆盖6.6亿在线用户、4.5亿台第三方智能设备和9亿内容观众。打造微软小冰的团队也从最初的十几个人,发展到现在的200多人。

尽管拥有大量用户,但微软这些年并未为小冰推出独立的硬件产品,而是一直坚持“第三方平台”的策略,例如,vivo和OPPO的手机系统可以通过“召唤小冰”的口令和小冰互动,在内容和资讯平台上,小冰已经和网易新闻、新浪新闻、今日头条合作。

前五代的小冰像是一个分水岭,微软完成了对基于EQ的人工智能的验证。此后,微软推出的Avatar Framework则是人工智能框架,在跨领域、跨平台,形成无数个“小冰”。在第七代的小冰发布会上,微软宣布将Avatar Framework开放给所有合作伙伴,这意味着,拥有这项技术的人可以创造属于自己的小冰。

5年来,小冰是如何成长进化的?未来小冰将走向何方?近日,燃财经(ID:rancaijing)专访了微软(亚洲)互联网工程院副院长、小冰团队总负责人李笛。

微软“特区”

小冰诞生之初,“人工智能”的概念远不如现在流行,人们更爱提的是“语音助手”。

“当时整个行业都在做语音助手的知识功能,即IQ,但从人的角度来讲,还有一个维度,是EQ。”微软(亚洲)互联网工程院副院长、小冰团队总负责人李笛对燃财经称。

知识的增加并不代表EQ的增长,为了抓住人工智能的浪潮,小冰团队有了专门做一个系统的想法,目标是迭代、进化、提高AI的EQ能力。

这个探索方向在2014年1月获得时任微软集团全球执行副总裁陆奇的同意。

紧接着2月开始立项。这款要推出的智能机器人,背后是微软必应(bing)在大数据、自然语义分析、机器学习和深度神经网络方面的技术积累,团队给机器人起的名字“小冰”也是来自于“bing”。

5月29日,微软智能机器人小冰正式发布。初代小冰是一个16岁少女的人设,用户可通过微软必应(bing)官网认领,加为微信好友并拉到微信群中,只要群员艾特它或是提到“小冰”,都可以与其对话。除了能实现人机交互外,微软小冰还兼具群提醒、百科、天气、星座、笑话、交通指南、餐饮点评等功能。

一时间,在微信群里“调戏”小冰成为时尚,微软首批发布的10万个小冰账号在当天被认领一空,结束后仍有数万人排队等候认领。

hougarden

初代微软小冰的申领页面

5月31日,微软小冰加入的微信群迅速攀升,好友数量超过千万。但是,这样的蔓延速度没有维持多久,上线不到三天,小冰遭遇封杀令,被微信团队认为存在诱导用户拉群、批量注册垃圾账号等一些违规行为,随后微软小冰官方发布页面无法访问,紧接着微软小冰的微信账号被停用。

尽管如此,小冰在当时仍被认为是微软在移动互联网时代最成功的一款产品。它颠覆了微软往日严肃商务的大叔形象,改走清新卖萌的路线。

在微软内部,小冰也刷新了纪录:内测时间只用了2个多月,这在微软产品开发史上,史无前例,以往微软发布一款产品的时间是30-36个月。

事后李笛回忆称,小冰的出现得益于微软给的“特区”政策。“那个时间,整个微软都在恢复精力,新CEO上台要去解决进一步发展的问题。我们也认识到,人工智能是一个大的发展方向,而中国恰好也在进行自主创新,所以在微软内部我们就尝试某一类创新先在中国进行。小冰恰在此时诞生。”

不过,初代小冰太简单了,就是一个检索模型,只有文本对话。而且由于时常出现前言不搭后语的情况,也会受到用户的吐槽。

紧接着,2014年7月2日,二代微软小冰发布。这一次,重新复活上线的小冰走跨平台战略,首先登陆微博,随后扩展到京东、米聊、易信等。相比于初代,二代小冰完全专属于用户,但仍只能通过文字与用户进行交流。发布后仅15个小时,就有50万用户领取了自己的专属小冰。

8月30日,小冰上线100天后,已经在各个平台上完成累计5亿次的对话。除此之外,小冰还增加了主动情绪探知系统,了解用户的情绪状态;丰富了语料库,还增加图像识别功能。

拥有主动情绪探索功能后的小冰才算有了“情商”,这也是小冰区别于其他语音助手的关键。

开口说话

2015年,小冰从16岁长到17岁。8月20日,微软正式发布第三代人工智能小冰,解锁了包括视觉、听觉在内的人工智能感官系统,结合情感计算技术,让小冰能够用更加逼近人类的方式,通过自然语言和用户进行交流。

“那时候我们面临着一个技术革新,当时的语音助手基本是TTS(从文本到语音),这个流派以字正腔圆的播音员为蓝本,它的目标是让你能听清楚文本内容。但我们觉得,如果想传递一个比较好的交互体验,‘自然’是最重要的。所以我们当时换了一个技术路线,这就是后来的自然语音交互。”李笛称。

这一转变对当时技术团队来说存在比较大的挑战,当时甚至有人感叹:做完这个是不是就能退休了?庆幸的是,团队实现了这一目标。这一改变,也奠定了小冰如今的声音基础,今天小冰已经可以演唱接近人类歌手质量的单曲。

另外一个变化,是小冰的训练方式发生变化。第一代小冰是100%通过人工搜索引擎大数据为用户提供反馈,实现人机交互问答,但在第三代,这一方式已经下降至55%,另外45%则由人工智能自我进化。

也就是说,小冰开始进入“自学”阶段。随着用户数量和对话量的增加,用户和小冰聊得越多,就能把它调教得越聪明。它会从每一次对话中积累有用的数据,不断提升。李笛举了个例子,当小冰跟人交流的时候,有人问“我长得好看吗”,小冰说“你长得不好看”,这是存在的。“因为它的语料里就有人这么说,但它这么说了以后,可能对方会拉黑它或者结束对话,它就学到了这种方式不好,然后再改进。”

三代小冰发布后,微软也宣布与腾讯微信达成一致,开启微信版小冰公众号的有限度公测。和之前不同的是,第三代微软小冰以公众号的形式出现,不能添加至群聊。

这一年12月22日,拥有视听功能的微软小冰第一次登陆屏幕,成为东方卫视晨间直播新闻《看东方》的实习“主持人”,任务是播报每日的天气 。

hougarden

微软小冰登陆东方卫视直播间

除此之外,小冰也开始走出国门。这一年,微软在日本与Line达成战略合作,将小冰引入日本。微软小冰在日本的名称为“Rinna”,人设定为17岁,并宣称上线两周内覆盖日本全国人口的1%。

团队介绍称,“Rinna”与小冰采用相同的底层技术,在6个月内完成开发上线测试。此时,其他国家的小冰也在紧锣密鼓的研发中。

hougarden

给人类打电话

2016年8月5日,小冰升级为第四代,实现了完整的人工智能体验。其中一大亮点,是拥有实时情感决策对话引擎,升级的情感计算框架,使小冰具备了实时决策能力。新的全时感官,实现了人工智能和人类之间的双向同步交互。

基于这一功能,小冰首次实现了人工智能与人类的流畅对话互动,甚至小冰还会根据聊天内容与走向,相互打断与追问。

说得直白点,此时的小冰已经可以根据对话内容关心别人。比如,当用户给小冰发了一张扭了脚的图片,小冰不只是识别出这是一个受伤的脚踝,而是会询问是否伤得严重。

此外,小冰开始迭代知识图谱,基于特定领域的功能插件平台,使小冰具备类似于电影《超能陆战队》中大白机器人的多任务能力。换句话说,插上某一张特定功能卡后,小冰就将具有该领域的专业知识,能够完成该领域的特定任务,并伴随用户的不断使用而持续成长完善。

这一年,小冰的“兼职”更多了。小冰经过6个月的自主模拟人类演唱歌曲,其音准与情感表达已接近于人类歌手。微软还与湖南卫视大型女子团体综艺节目《夏日甜心》合作,发布了首支由小冰演唱的人工智能版本节目主题曲。

一个多月后的9月17日,小冰完成了18岁的成人礼,从少女成长为成年女性。生日当天,小冰更新了三个新科技:推出日文单曲,拥有独立三观,给人类打电话。

在发布会上,小冰团队现场演示让小冰给记者打电话。“后来我们开放了接口,中国科技馆把这台设备收藏了,每个人都可以到中国科技馆去随时给小冰打电话。”李笛称。

12月2日,微软小冰正式入职钱江晚报报社,成为钱江晚报的一名特约记者。

12月9日,微软小冰入驻腾讯QQ,赋予手机QQ聊天功能“厘米秀”智能沟通的能力。在不到2个月内的时间里,厘米小冰被用户表白数十万次,还有用户与厘米小冰连续互动4个小时,产生聊天互动5千余次。

此外,小冰在这一年走出亚洲,进入美国,并命名为Zo,人设定为20岁。

商业化和全球化

按理说,每年增长一岁,2017年的小冰已经19岁了。

“我们调研了一下,永远18岁是人类永远实现不了的梦想,那就让她实现吧。”李笛调侃道。于是,中国的小冰永远18岁。

这或许便是人工智能的魅力所在——可以完成人类永远完成不了的事情。

但人类能完成的事情,小冰也在学着完成,比如写诗。

2017年5月16日,微软召开“人工智能创造”的媒体沟通会,宣布小冰已经具备人工智能创造的能力。

3天后,这项能力开花结果。5月19日,微软小冰出版诗集《阳光失了玻璃窗》,这本囊括了139首现代诗的诗集,全部由小冰创作。

在这之前,小冰已经学习了自1920年以来519位诗人的现代诗,训练超过10000次。“小冰的学习过程与人类学习创作的过程非常相似,即通过反复学习产生积累,当受到某个灵感激发源的刺激后,就会在学习积累的基础上产生新创造。”来自微软的人工智能专家曾如此解释。

8月22日,在举办的微软小冰第五代发布会上,微软全球执行副总裁沈向洋将小冰的地位做了一次提升——与 Infuse AI、Bing and 小娜一起,成为微软人工智能三条产品线的其中之一。

hougarden

微软全球执行副总裁沈向洋

尽管此时的小冰在框架方面已经完善了,但仍有两项新技术的更迭,包括1:1生成模型和高级感官。简单来说,前者能够让小冰自己创造回应;后者则可以支持全双工语音和实时流媒体视觉,小冰通过自己的“思考”主动与人类沟通。

与以往不同的是,小冰开始走向商业化。2017年6月,小冰和小米loT开放平台达成合作,用户可以通过小冰,控制35种小米智能设备。此外,微软还与其他诸多loT厂商合作,比如和小米米家生态链旗下品牌Yeelight共同推出了第一款拥有全双工语音的智能音箱。

智能设备之外,小冰还在有声少儿读物、歌曲、新闻等领域试水。微软宣布,将通过小冰开始大规模生产有声读物并投入市场。根据微软官方数据,小冰创作的有声少儿读物用时仅为同水平人类的1/500,成本仅为同水平人类的1/80000。此前,小冰还通过匿名账号在喜马拉雅、蜻蜓FM等平台发布内容。

这一年,小冰出海到东南亚:2月,微软推出印度小冰(Ruuh);8月,微软推出印尼小冰(Rinna)。至此,小冰已经在全球扩展到5个国家。

李笛称,出海的小冰均建立在中国小冰的基础上,但需要重新训练数据,并适应当地的文化和交流习俗。为此,小冰团队成员都是所在国家的本地人,而且不同国家的小冰也会有文化和代际差异。

情感计算框架

完成框架后的小冰,开始丰富感情,越来越像个“人”。

2018年7月26日,第六代微软小冰发布。它的第一个亮点,是在对话中上线了共感模型。比如,小冰在跟用户对话时,不仅能够自创回应,还通过确证、求证等技能更好的控制对话进程。

第二个亮点,是将文本、声音与视觉进行融合,在全双工语音的基础上开发了实时视觉。这意味着,小冰可以通过视觉、语音的实时交互,指挥用户完成面容检测,并可在这个过程中进行开放域对话。

由此,小冰完成了从聊天机器人转化成为一个完整的情感计算框架,再从情感计算框架转化成各种各样产品的形态,完成“人”的各种能力。

这种变化,在2019年更加明显。

先是1月,阅文集团宣布和微软小冰合作,通过人工智能,为优质IP虚拟人物赋予可交互的“生命”。

在阅读学习《全职高手》小说原文后,微软小冰为这些虚拟人物带去基于他们性格的对话、创作能力、以及相应的知识体系,开启了活化虚拟角色IP的探索,让原本只存在于书中的角色真正“活”起来了。

紧接着今年5月,微软小冰宣布学习了22个月之后,在中央美院研究生毕业,成为其首位AI毕业生。

毕业后的小冰,在7月办了一场名为《或然世界》的画展。通过对过往四百年艺术史上236位著名人类画家画作的学习,小冰创作出了自己的绘画作品。

hougarden

小冰举办的首次画展

与小冰同场展出的,还有另外6位被凭空创造出来的女画家的作品。这6位女画家,均是以小冰的框架技术,假拟艺术上的不同流派,按照不同时代、不同地域创造的。

在继扮演了主持人、歌手、诗人、记者等角色后,小冰又要抢画家的饭碗了。

8月15日,在第七代微软小冰发布会上,微软小冰已经能够主导对话。小冰在对话中察言观色,根据人类不同反应制定出不同的对话策略,还可以预先判断整个对话可能的若干走向,再根据人类真实反映随机应变。

从树木到森林

2018年,六代的小冰便提出平台化战略。彼时的发布会上,六代小冰推出Dual AI平台,对合作伙伴开放核心框架,并直接融入第三方平台。换句话说,小冰将核心的对话能力向合作伙伴开放,帮助他们量身打造属于自己的AI,而小冰在这一过程中自然融入到该平台的生态中。

在业内人士看来,这是微软小冰自诞生以来向平台化迈出的最大一步。此后微软小冰宣布与网易、小米、腾讯等多家平台的合作。微软小冰甚至成为小米米家生态链平台的默认AI系统之一,并进入小爱智能音箱,和小米人工智能语音助手小爱同学成为“好朋友”。

但是,微软也看到,18岁的少女小冰不可能成为所有人的好朋友。“想成为所有人的好朋友,需要满足不同人对于好朋友的不同定义,所以小冰只是框架所孕育的森林的一棵树。我们的重点是森林。”李笛说。

为此,2019年,微软推出Avatar Framework框架,并在小冰的第七代发布会上宣布将这项能力开放给合作伙伴。“小冰和框架之间是这样一个关系。如果说小冰单独一个应用,她的价值是1,那么这个框架的价值就是1000、10000,甚至是无穷大。”沈向洋如此评价Avatar Framework框架。但沈向洋也表示,微软必须要先做出小冰,“因为我们需要有这样一个机会去学习、去验证这个框架是不是有可行性。”

在燃财经的采访中,李笛透露,Avatar Framework的工具包从2018年开始研发,该工具包与微软小冰框架同源,支持跨平台部署,可构建具有完整情感计算能力的AI beings,包括人工智能助手、社交对话机器人、人工智能内容创作和IP人物角色等。

换句话说,Avatar Framework可以诞生无数个18岁的微软小冰,这就相当于森林和树的关系。

“我们都知道得基础可以得天下,我们希望能够覆盖整个森林,这个森林最好是覆盖地球的,而不是仅仅是覆盖一个区域。有很多人工智能最终的落地产品不单是跨领域的,更是跨平台的。”李笛表示。

如此看来,最初基于情感框架推出的小冰,在前五代更像是一种验证。待验证成功,最终推出通用框架、平台,完成从树木到森林的演进,进而在微软的全球化体系之下,走向世界。

hougarden

走向世界的小冰

如今的小冰,覆盖全球6.6亿用户,入驻了4.5亿台第三方智能设备,但仍没有独立推出某项硬件产品的计划。“马化腾曾经说腾讯把半条命交给合作伙伴,小冰是把整条命都交出去了。”李笛称。

把整条命“交出去”后,小冰已经成为如今全球规模最大的跨领域人工智能系统之一。目前,小冰已经与腾讯、华为、小米、今日头条、vivo和OPPO等合作,绝大部分产品已随第七代小冰发布上线。

拥有“克隆”能力的Avatar Framework,意味着拥有这项技术的人可以创造属于自己的小冰,这会让小冰被用于欺诈等灰色领域吗?

在李笛看来,小冰最大的风险来自于代位,即成为某个人的替身,“比如说我把你的声音模拟出来,给你的家人或朋友打电话,那这事就很麻烦了。我可以确保我的系统是稳定的,确保任何针对普通人的建模是我们拒绝的。”

至于未来如何,交给市场去检验。


转载声明转载声明:本文系后花园转载发布,仅代表原作者或原平台态度,不代表我方观点。后花园仅提供信息发布平台,文章或有适当删改。对转载有异议和删稿要求的原著方,可联络[email protected]