印度人要做“语音版 Quora”,怎么让它听懂印度的众多方言?
在13亿印度人中,真正会说英语的人不到1亿,不管你参考的是哪份报告。
印度的大多数网站和应用还必须使用英语操作,但现在变化正在发生——所有的数字和在线产品/服务都在向印度本地的语言过渡。这种变化吸引了新的用户,但是本土语言的使用还面临一个重要挑战。
不仅是印度,全世界的初创公司和开发人员都在大力投资语音技术。语音技术省掉了用户打字的麻烦,能打开全新的用户市场——包括那些还不懂ABC的小孩子,以及不太会用手机键盘的老年人等等。
搜索巨头 Google 目前支持9种印度语言,而 Amazon 也在构建基于语音技术的各种功能。
而印度需要的不仅仅是语言支持和语音技术。像人们常说的“内容为王”,对一种语言进行精确识别需要足够的数据来训练,而印度有多达17种官方语言(编者校:印度宪法认定的官方语言有22种)和数百种被认可的方言。如果想打动印度的消费者,对这些不同语言的语音识别是必经之路,尽管这并不容易。
为了弥合这一缺口,几家初创公司正在帮印度人打造使用本地语言的搜索工具,毕竟每个人都希望为自己的问题搜索到明确的答案。这项工作的难点是:印度缺少使用本地语言的内容,或者说数据。
印度有许多初创公司都在对语音技术进行探索,但其功能各有不同。比如 Gnani.AI,这家公司一直专注于 B2B 业务,但现在它正计划为农户推出 B2C 服务,让他们能够用本地语言咨询有关农作物的问题。
除了官方语言,Gnani 平台也可以将方言转换为文字内容。目前,Gnani 的主要使用语言是埃纳德语,但未来肯定会扩充更多语言。
“我们还在对产品进行测试,完善算法,以求输出最准确的(翻译)结果。”Gnani.AI 的联合创始人 Ganesh Gopalan 表示。
根据一篇《语音识别市场》的报告,语音技术市场预计将从2018年的75亿美元增长到2024年的215亿美元,复合年增长率为19.18%。对语音识别市场强劲增长的预期有很多原因,包括其在医疗保健类应用方面的潜力、手机银行类应用中不断增长的对语音认证需求、多功能设备和智能音箱的快速普及,以及在AI帮助下不断提高的语音识别的准确性。
该报告补充说,微观语言学、教育和自动驾驶等领域都可能为语音识别公司创造巨大的增长机会。