搜狗地图ai交互(语音交互导航策略背后)
李根 发自 一路向南G71
量子位报道 | 公众号 QbitAI
AI代表的新技术可能不光开拓新领域,也在冲击固有市场格局。
新技术 旧产品,这样的趋势变革正在发生。
语音交互 地图=?2016年年底,网易北京搬离清华科技园启迪科技大厦,隔壁的搜狗随即租下两层,安排搜狗地图和搜狗语音团队入驻。半年后,这两支协同工作的团队推出完全语音驱动的语音地图产品,取名“智能副驾”。
这是一款语音驱动的手机导航地图产品,完全基于手机,完全语音交互。之所以取名“智能副驾”,是因为搜狗希望它在车内充当起“副驾”的作用,有问有答。这算不上是全新的产品,本质还是手机地图导航。
在这个领域,百度和高德占据了大部分市场份额,在移动互联网时代厮杀了整整7年,并且在产品细节和体验上费尽心思,连导航的语音包都花样百出,希望覆盖到所有目标群体。
更主要的是,语音为核心交互的地图导航,在手机之外的终端硬件上早已试水,特别是此前竞争激烈的车机和当前愈加火热的后视镜上,通过语音驱动拿下车载场景,有巨头玩家,也有初创厂商,有前装合作方,也有后装搅局者。
你可以用语音说出想去的目的地,如果是去一个公园,还能继续用语音确定抵达哪个门,路线确定后,还能继续用语音进一步规划:比方要求不走二环或者中途加油等。这的确与百度、高德地图的基本语音交互不同。
当然这个功能算不上100%成熟。多轮交互失败的情况并不罕见,如果要增加一个途经点,有可能会打乱之前的行程规划。方言识别肯定是不行,即便是普通话也做不到100%。
另有数据称车载情况下,语音识别准确率只有90%左右。
这是一个有点冒险的尝试。
“趟过不少坑”显然,对于市场份额更大的厂商来说,冒险的成本更大。
一是基于手机的多轮语音交互,识别准确率是个大问题,从硬件方面的麦克风阵列,到手机运算资源消耗的考量,技术挑战不小。
二是用户体验要求高,一旦上线多轮语音交互,内在要求必定是又快又准,一旦识别有误,或交互“弱智”,用户体验就会大打折扣,除了让人骂娘,可能还会客观上助攻竞争对手。
所以把多轮语音交互带入手机地图,多少算是“激进”之举。但对搜狗地图来说,包袱要小得多,转身和尝试可以快得多,即便技术上的坑不少。
搜狗地图总经理孔祥来也承认,在产品立项的半年内,“在技术上趟过不少坑”。
首先是语音识别问题。车载环境,手机终端,应用环境接近远场识别,需要面临降噪、回声、纠错等语音识别方面的技术挑战,而且导航地图需求中,只要一个字、一个词识别不准,都会造成意图错误,用户体验差。
其次是语义理解。车载环境需要尽可能降低眼和手的使用,全靠人机语音对话理解意图,而多轮交互还会对对话模型和引导模型提出高要求。
最后是数据重构,文字输入客观上要求极尽准确,但语音交互却可能语焉不详,单如“首都机场”,就可能面临“航站楼T1、T2、T3”和“出发/到达”等数据的结构关系构建,换而言之是要让机器模型建立起“知识体系”。
而这次新产品的发布,就是搜狗对上述技术挑战交出的答卷。孔祥来告诉量子位,主要有三方面:
一围绕语音识别,针对性做了4000小时车载语音训练,并专门针对POI(兴趣点,包括商家商铺和标志性建筑物等)数据的优化提升语音识别准确率,还要建立语音、语义、地图概率模型,在多个识别结果中做反向挑选,以此作为准确率辅助手段。
二是在最后产品中准备了10万个对话路径,用启发式对话模型,不断细分搜索结果类型,通过对话引导,让机器理解人类的真正意图。
最后则是POI数据的重构,按照现实世界的隶属关系,组成父子、容器、区域从属关系,为语音对话提供相应精准的领域知识,保障播报和上下文理解能力。
孔祥来还说,在三步语音交互方案实现后,目前的搜狗地图,可能在AI新能力的基础上,拥有了新的产品形态,产生新模式。
但就此会改变手机地图竞争格局吗?
难。
换道竞争在孔祥来看来,之所以此时上马“智驾副手”,重点并不在重新抢夺手机地图市场份额——意义已非常有限。
“现在市场份额抢夺、用户增长,可能不是最主要的目的。我们现在赋能地图,希望通过这样的尝试去获得车厂的认可。其实语音交互大方向已经被认可了,但之前车厂尝试过语音方案后,认为效果一般,所以现在我们相当于通过手机去进行验证,再进一步获得车厂认可,比我拿着PPT去车厂硬讲,要靠谱很多。”
此外,孔祥来也认为:新的竞争已经不再围绕旧形态展开,即不再围绕“手机地图”展开。
“语音交互引入地图、车内场景后,手机地图可能要被重新定义了,将不再是传统的工具软件。”这位搜狗地图总经理说。
语音交互 地图,会构建一种全新的形态和模式。用户可以在导航中可以用语音说任何事情,不光是导航,可以提供更多服务:问答的能力、搜索水平。这个能力、习惯形成,那远比在地图里做O2O靠谱。
“更加直白地说,相当于得到了一个车内语音交互的入口,就不再是一个地图软件 语音,而是在车内的语音助手,只不过拥有了导航的能力而已,用户在车内的语音助手,提供车内的任何服务,这跟地图导航不再是一个维度的事情。”
听起来像是利用新一代技术,换到了更高的维度参与竞争,然后高维打低维,在新场景新模式中完成“弯道超车”。
但事情也并没有那么简单,百度和高德也在利用新技术加码布局,方向不尽一致而已。
百度的大方向是车,无论是车联网、智能驾驶还是无人车,地图的核心功能是不断精确的路网数据和搜索能力,把AI、AR等一系列新技术叠加到产品中。
而多轮语音交互方面,实际百度已经在车机产品CarLife、后视镜CoDriver中引入,何时迁移应用到手机地图中,可能只是时间问题。
高德的方向是“数据中心”。在最新阐述的AI应用中,高德的方向是“活地图”,利用机器模型搭建交通大脑,在实时数据计算的基础上,把实时路况、动态预测和用户偏好作为体验改善的大方向。
目前,语音交互在高德地图中,被当做了辅助性的搜索手段,技术由科大讯飞提供,这也意味着如果高德在地图导航中上马语音交互,多半会与讯飞进一步合作,产品的磨合或许挑战相对更大。
当然,阿里集团CTO王坚也曾公开表示,利用阿里云的计算力和大数据模型,阿里自主研发的语音交互也迅速取得了突破,但是否会直接赋能高德,目前难以获悉。
不过可以确定的是,原本以为竞合格局已定的领域,现在又因为AI浪潮的到来,展现出新的可能,新一轮比拼再度开启,固有优势带来的机会,有可能稍纵即逝。
这可能会是很长一段时间内的趋势。
关于市场格局
最后,量子位补充一点背景资料。
根据搜狗地图2015年5月公布的数据,在手机地图市场,激活用户共计1.5亿,排名第三。百度地图去年6月公布的数据为5亿用户。高德地图去年10月公布的数据为7亿用户。这些数据,听听就好。
实际上,虽然搜狗地图的知名度,远不能跟输入法、搜索和浏览器相比,但始终是搜狗内部业务中不可或缺的一环,否则很难解释这样一个“买来的”业务,已经让很多用户忘记了“来路”。
老一辈互联网从业者和用户或许有所了解,搜狗地图也并非完全来自搜狗内部的创造孵化。
它的前身是现任搜狗地图总经理孔祥来创立的电子地图服务平台go2map,可追溯至1999年,其后2005年4月,Go2map被搜狐全资收购,成为现在的搜狗地图,孔祥来也进入搜狗,成为地图业务的负责人。
在此前的地图导航竞赛中,搜狗地图一度有机会。在2008年,它是北京奥运的官方合作伙伴,在2011年,它已面向移动端推出了路况导航产品,直至2015年5月,官方披露的数据中,手机客户端的激活用户还有1.5亿,总量排名第三。
但后来的故事我们都知道了,随着阿里收购高德,百度加码O2O,手机地图的竞争逐渐成为B和A的竞技场,二者抢占了更多的市场份额,在整个移动互联网时代,百度和高德为谁是第一,打了整整一个时代。
至今,双方围绕市场份额和排名,依旧口水仗不断,难解难分。
【完】
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com