Nueva Zelanda
Español
compartir

谁是Cerence:Siri背后的语音巨头,开讲中国汽车软件概念

转载autor: 财经涂鸦
谁是Cerence:Siri背后的语音巨头,开讲中国汽车软件概念
resumen编者按:本文来自微信公众号“财经涂鸦”(ID:caijingtuya),作者:施挽袈,编辑……

10月1日起,一个名为Cerence的品牌开始正式启用。

hougarden

这个陌生的品牌,有一些来头。今年8月份,智能语音公司Nuance (NASDAQ: NUAN) 宣布,将汽车业务分拆出来命名为Cerence,Inc,并于10月启用。

这件事有两个看点。首先,Nuance是包括苹果Siri背后的语音技术供应商,在2015年时还有百度要收购它的传闻,也间或有苹果、谷歌要收购它的传闻。其次,分拆Cerence的目标主要是为了抢占中国市场。

Nuance分拆Cerence的目标是致力于打造一代汽车软件,并以此为核心赋能未来出行。就新的公司来说,主要由Nuanc原大中华区团队和汽车业务为主体,目前主要在德国和中国有两个研发中心。

Cerence在宣传信息中特备强调,团队在中国已有10年经验。

在8月份,新的公已将中国区运营主体企业名称由纽昂斯软件技术(Nuance的音译)变更为赛伦思软件技术(Cereance)。

语音帝国盛极而衰,天时地利人和都不在线

hougarden

创立于1992年,2005年就走上IPO之路的Nuance 在海外占据了全球智能语音市场近三分之一的市场份额(数据来源:前瞻数据研究院)。但要说到近年来的发展可能流年不利了,这点从股票市场就能看出端倪——2013年末股价站上30美元的高位后至今一路下调,如今在近乎腰斩的价位上止步不前。

背后则是它的市场份额减少、营收增长缓慢、连续三年亏损等等企业财务数据的直观反映。

去年末,就连企业发家致富的OCR(图像转文字识别技术)业务和背后参与部门也被打包15亿美元卖给了 Kofax。

据《财经涂鸦》了解,在其所有四大业务部门中,图像业务的营收占比和利润贡献始终为一大来源(占比11%),毛利率也基本维持在40%左右。公司层面的说法是剥离让公司业务保持合作与专注。

对比过去三年的财报数据总体看来,各个业务在2014年之后都显出天花板效应:增长缓慢,整体毛利率下降,业绩表现不佳。

而同样失意的,还有管理层的动荡,先是苹果挖走了Nuance前研发副总裁Larry Gillick以及语音资深科学家,谷歌挖走了在Nuance的联合创始人Mike CoheNuance以及产品经理Hugo Barra(后来去小米统领国际业务)。这也从侧面反映出这家公司正徘徊在下坡路,失去对人才的吸引力。

这些当然和外部大环境有关,在语音识别和自然语言理解领域,Nuance面对的对手不止是 AAMG这样的巨头,还有不少垂直创业公司在开源算法(谷歌自己的语音识别技术授权给安卓开发者免费接入)的加持下弯道超车。

所以很快作为老牌大厂 Nuance 不仅流失了大客户的依赖,技术优势上也因为深度学习技术对行业的普惠效应,在成本和准确度上大大拉低了门槛,填平了所谓的保护企业技术优势的那道护城河。

这对于靠技术输出获取收入的Nuance而言,找到一个盈利增长空间庞大的市场大力耕耘是它试图翻身重夺行业霸主地位的重要棋子,同时也需要给投资人一个新的故事拯救或维系萎靡的市值。于是瞄准这几年新兴的车内语音交互需求、以及汽车增长量领先的中国市场成为了转型愿景下的关键布局。

不止要做汽车领域的Siri

hougarden

但依赖于收购了众多技术型企业以及先发优势,所以在车载语音市场上,Nuance至今仍保持了相当大的市场份额。如今,它旗下的Dragon Nuance Drive(声龙驾驶)以超过40种语言为当今道路上行驶的超过2.5亿辆汽车提供技术支持。

从用户体验升级来看,无疑,在汽车的使用场景中,相比实体按键和触摸屏,语音交互因为生理习惯和安全性,具备天然的交互优势,车厂也拥有了新的卖点。也因此,车载语音已经成为了当前新车出厂标配。

为此,Nuanc 专门为汽车内坏境设计的人机交互环境名为Drago Nuance Drive(声龙驾驶)技术解决方案不仅提供了由声音,还有人工智能的加入重塑数字时代的汽车驾驶新体验:

比如它可以凭借语音识别和眼动侦测,用户就可以直观地与智能挡风玻璃上的窗体部件进行交互以访问和优化电话和联系人、天气、导航、音乐等传统显示在控制台显示屏上的服务。

驾驶员可以看着乘客侧的车窗并说,“将那个车窗打开一半”,从而进一步减少了汽车中基于按钮控制的需求。

除了 Just Talk 这个语音免唤醒功能之外,Nuance 还提出了更大胆的想法:凝视检测。根据多模态交互,系统可将眼睛轨迹和头部角度与精确的汽车定位,以及 3D 环境建模相结合,以跟踪用户的注视。当用户查看车辆内外的对象,并随便说出它,比如一家餐厅,人工智能根据 Just Talk 功能和上下文推理,就能很明确地知道用户想知道的是什么。

无论是传统车厂还是人工智能语音识别的垂直领域团队,都没有发布过这样的多感知车内移动助手,夸张一点得说它可能将会是未来交通人机交互的范式。

能否抢占中国汽车市场空间

hougarden

在转型战略的源头上, Nuance无疑对于中国市场寄托了厚望。这主要来自大中华区的主要销售团队将业务重心在十年前放到了传统车企相关的业务合作,如今来看可谓是无心插柳。

此次Nuance将汽车业务分拆并成立独立公司与母公司正在进行中的整体战略转型有着同样的逻辑,都是要从卖技术产品的甲方变成开放的解决方案中一员服务者、赋能者。

目前之扭昂斯中国在组织架构上非常完整,包括销售、市场、产品、研发、云端、交互、设计等部门。研发基地有三个,分别在上海、成都和北京。

最近3年汽车语音市场得到了飞速发展,据统计约有60%的汽车都装配了智能语音技术。其中近一半的车辆都会采用Nuance的Cerence 作为底层技术提供商,中国和美国是其中最大的两个市场。

根据财报显示,2018年Nuance在中国成长迅速,业余规模扩张了三倍。

为了迎合中国车主的本地化需求,Nuance特别开发了Chinese DragoNuance Drive(CDD)平台,这套能为合作伙伴提供语音技术支持的创新车机系统中包括了160多项中国相关专利并将国外代码转到中国;100多项人工智能语音中文相关标准作业程序(SOP);建立了中国本地云便于服务器响应速度。

Nuance和50多家汽车品牌有着供应商的关系,其中在这里值得一提的是与中国最大的民营品牌之一吉利汽车及第三方合作商ESCARX 打造的的GKUI 吉客智能座舱交互系统——高速人机界面(HMI)能就所有关键的车载功能(兴趣点搜索,导航以及温度控制)提问并极速响应。

它提供的语音信号增强技术(SSE)可以消除麦克风输入中的噪声用以改善语音识别和GKUI 上完成免提交互的通讯质量。其解决方案专注于提供端到端的用户体验。同时,其也不再只提供语音技术。在实车演示中,可以看到其解决方案结合了语音和凝视追踪。

如果把吉客系统比作智能汽车的大脑,Nuance就是教会和负责它和人类驾驶员交流的左半球大脑,这也是Nuance从技术服务者发生的角色变化。Nuance走的是一条OEM分离的路径,是作为汽车整体软件解决方案提供者不与汽车公司直接发生竞争,从这个意义来看Nuance的商业模式不是B To C 而B To B To C。

包括和斑马出行的合作案例也能看出它对自己全新定位,斑马是一家上汽和阿里共同投资的互联网汽车平台,为多个民族整车厂商提供只能出行系统。最近在和Nuance宣布的一个合作就是利用后者的语音识别能力切入到其生态系统服务中,将车载语音用户界面的体验进化为情感交互实现车辆、驾驶员结合的“千人千面”,包括个性化的请求如定制的导航服务、空调、灯光、语音都能通过车载功能语音来控制、访问、甚至结合算法做到预先判断。

作为平台型服务商系统中的一个能力提供者,它解决的是在激烈本土的竞争中自己能够避开红海的定位。

这可能是吸取了这十年Nuance不断在移动业务上碰壁萎缩的教训:一直想在移动业务上大拓边疆的Nuance遭遇了像苹果、三星这样巨头的“背叛”,从购买产品到自己研发语音识别甚至抢夺市场份额,Nuance开始认识到现在的局势,想从技术提供商转型如果不从源头开始其实是不容易实现的。所以这次分拆发展的新业务,Nuance开始有了清晰的认知并想寄托这点再次夺回市场。

在纵向纬度上观察,Nuance和对手其实也并非完全在一个层面,时下国产车载语音交互已经成为兵家必争之地,但在语音之外,因为部分交互的便利性,手势、视觉等交互也会发挥作用。未来车载交互将会呈现出一个多模态交互的状态。

而这对于在该领域布局已久的Nuance来说,在语音之外(比如姿态识别)或者才是Nuance领先于对手的拿手好戏,上文中提到的声龙系统就是例子,此外在如自动驾驶汽车专属助手的研究上,Nuance也在人工智能和算法方面投入不小,位于慕尼黑的基地拥有上百人的专门团队。

hougarden

巨头觉醒?

觉醒之后的Nuance是否能啃下中国市场?

虽然中国汽车市场蛋糕很大,但从语音识别的To B市场开始出现饱和,不少巨头也发现To C的巨大市场潜力,开始发力。比如这两年亚马逊就将原本智能音箱搭载的Alexa助手开放出来扩张到了汽车领域,推动行业知名度及自家技术的普及,2018年8月,亚马逊推出Alexa汽车核心SDK和Auto SDK的开源版本,包括宝马、福特、丰田等汽车制造商已与亚马逊达成合作,共同整合Alexa。

刚刚结束的9月25日发布会上,亚马逊宣布将联手腾讯在内的全3多冢顶尖科技公司,共同成立语音互操作联盟——这个联盟的意义非同小可,当用户通过不同的唤醒词来唤醒(可能不同联盟内厂商语音交互)设备,就能选择不同平台返回的语音服务。

由此,我们或许可以总结为无论谷歌、百度这样的大公司还是新兴的科技公司都在往开放生态发展以获取市场竞争力,不同于以往每家公司在NLP(自然语言处理)、ASR(语音识别)、TTS(语音合成)不同人机交互的技术层面各自为战,现在的智能语音市场已然形成了一种开放的全栈式产业链,这颠覆了以往的竞争格局。

根据Gartner在2018年7月发布的AI技术成熟度曲线,语音理解、虚拟助理已经进入泡沫化的低谷期阶段,而语音识别则进入实质生产的高峰期,这意味着语音识别技术的场景落地大幕已经开始。国内的企业服务市场,除了巨无霸科大讯飞的触角早就开始伸向各行各业,占据一定市场规模的还有云知声、思必驰、小i机器人等成立两三年的垂直公司,加入到技术提供服务商的候选列表项目中。那么,Nuance是否还能在充分的市场竞争环境中维持自己在汽车品牌中老而弥坚的印象,守业是一个不小的考验。

对于中国本土竞争对手,它的中国负责人蒯文瑞的评论十分直接:“中国本土的语音人工智能公司,他们的商业模式一直都在变化,开始卖软件,之后变成互联网公司,最后变成人工智能公司或者数据公司,不是很纯粹。”而这点对于分拆后将中国运营重心都投入其中的Cerence而言,集中资源在汽车和物联网相关领域进行大规模投入是它的另一大优势。

随着Cerence独立在纳斯达克上市,能够在汽车相关策略上进行操作,产品研发也将不再局限于汽车领域,其可以提供从自然语言理解、虚拟助手、人工智能到Digital Tier 1 发展的整个解决方案,Nuance已将其未来押注在这一主体之上。

Nuance执行副总裁StefaNuance最近表示:“将汽车业务在纳斯达克分拆上市,我们会变成全球唯一一个世界级的软件解决方案的提供者,在汽车和IoT层面成为世界级的Digital Tier 1(数字一级供应商)。”

但资本市场却并未有足够信心。自Cerence9月16日在纳斯达克独立上市之后,其股价已经从29.36美元下跌至15.05美元,一个多月股价腰斩。


转载声明转载声明:本文系后花园转载发布,仅代表原作者或原平台态度,不代表我方观点。后花园仅提供信息发布平台,文章或有适当删改。对转载有异议和删稿要求的原著方,可联络[email protected]