原标题:AI技术是制约整个智能音箱行业发展的最大瓶颈
阿里巴巴达摩院人工智能实验室总经理浅雪。来源:被访者供图
教育市场需要时间,AI技术是制约整个智能音箱行业发展的最大瓶颈。
采访| 《中国企业家》记者 张弘 梁宵
文| 张弘编辑| 尹一杰
对于中国市场上的后来者来说,想要复制亚马逊Echo的成功并不容易。
8月中旬,来自市场调查机构Canalys的2018年Q2全球智能音箱出货量数据显示,作为昔日“领头羊”的亚马逊Echo(410万台),再次被谷歌(540万台)超越,阿里巴巴(300万台)和小米(200万台)分别位列全球第三、第四。
制图:中国企业家
日益增长的出货量凸显巨头高歌猛进的势头。十分亮眼的是,后起的中国市场贡献了近一半的智能音箱出货量。中商产业研究院数据显示,2018年中国智能音箱市场规模将达到3.3亿元。国内外的分析师一致认为,中国的智能音箱市场潜力无限,未来或赶超美国。
智能音箱被称为“智能家居的入口”。眼下,国内互联网巨头麓战正酣,手机硬件厂商华为、诺基亚、联想、OPPO、vivo等纷纷入局,它们不想错失时机。
但在资本层面,今年以来,这一赛道却遭遇了投资人的冷眼相待,一位长期关注智能制造领域的投资人直言“已经不关注这个赛道”,转向供应链的上下游。
2014年,京东叮咚智能音箱首席科学家汤跃忠加入京东和科大讯飞合作的早期研发团队,他一言蔽之,“窗口期已过,后进入者或可担任‘补缺者’的角色”。他认为智能音箱在技术、内容服务方面的机会尚存。
CounterPoint中国区研究总监闫占孟告诉《中国企业家》:“后来进场的厂商虽有一些时机,但能否做大,并不明朗。”他认为,接下来智能音箱领域将成为大玩家主导的市场,中小玩家只能从垂直细分市场挖掘机会,或致力于内容方面的布局。
后来者
留给后来者的机会已经不多。
“2015年,资本错失了一次机会。他们对于这个市场、技术的信心不够,反应有点保守,未尽早进入。现在进入的创业公司,机会已然不多。国际上亚马逊独领风骚,国内市场从去年到现在已是一个爆发期。”汤跃忠说。
京东叮咚智能音箱首席科学家汤跃忠。摄影:王攀
相比去年的资本热捧,今年投资人更多将目光转移到了芯片、语音技术、零部件及技术方案提供商等上下游产业链。今年6月,天猫精灵和小米AI音箱背后的语音交互解决方案提供商思必驰宣布完成5亿元人民币D轮融资,由元禾控股、中民投领投,富士康等跟投。
即便如此,资本冷却的赛道依然吸引着不同玩家进入,外围玩家喜马拉雅、酷狗、猎豹,家电厂商海尔、美的先后入场,手机硬件厂商华为、诺基亚、OPPO、vivo、联想更是快速布局。今年8月,华为消费业务CEO余承东在半年度业绩报告中透露华为在做智能音箱,称10月就能推出产品。
但在闫占孟看来,一些厂商此时是“被动入局”,意为保证利润增长或者挽回败局,一些则是为了增加原有用户的粘性而进入手机以外的智能音箱终端。
这并不是一个好的时机,巨头主导的战场,唱衰后进入者的声音很大。即使是早期进入该赛道的创业公司,发展也并不那么顺利。
2014年,杭州的创业公司Rokid进入智能音箱赛道,其早期团队成员多数来自原阿里M实验室。从时间上看,Rokid要先于亚马逊发布产品,而在量产上,却要晚半年。Rokid副总裁向文杰是早年参与智能音箱产品研发项目的成员之一,他在今年7月接受本刊采访时,连连感叹做一家智能音箱公司“太难了”。
Rokid副总裁向文杰(右三)。摄影:余子
自称“早入场、赶晚集”的出门问问CEO李志飞告诉《中国企业家》,“一开始,市场上做音箱的公司寥寥可数,绝大部分厂商都是在去年之后才进来的。”2017年8月,人工智能科技公司出门问问正式发布了针对家居场景的智能音箱——问问音箱Tichome。
但在加入巨头们主导的音箱大战后,李志飞觉得存在两大矛盾:一是AI和快市场的矛盾,在AI技术发展尚未成熟的情况下,中国是一个“六个月就能结束一个领域的战争”的市场;二是小市场和大玩家之间的矛盾,国内音箱市场原本就小,巨头选择在市场起量的情况下入局,令其他玩家措手不及。
巨头的游戏
“2018年势必是一场恶战。”此言出自小鱼在家创始人兼CEO宋晨枫之口,而“恶战”所指正是国内智能音箱价格大战。
2017年“双十一”期间,阿里人工智能实验室下原价499元的天猫精灵X1以99元的低价引发抢购热潮,天猫精灵出货量超过200万台。今年7月,阿里巴巴达摩院人工智能实验室总经理浅雪在接受本刊采访时称,“200万的数量证明了用户在中国市场的接受度很高,并且爆炸度明显还会高于美国市场。”
天猫精灵。来源:被访者供图
天猫精灵的火爆引发的补贴大战延续至今。小米、百度、京东等公司也相继推出不足百元的音箱,它们的目标都指向了抢占更多的市场份额。
“确实没有想到,短短一年时间,完全变成了由巨头低价主导的市场,”李志飞说,“国内走的路线多是在复制亚马逊Echo。国外花三年时间走的路,国内一年就走完了。”
2015年6月,发布了半年左右便开始售卖的亚马逊Echo,当年的销量突破250万台。很快谷歌入局,一段时间内,全球智能音箱也保持着亚马逊和谷歌“二元争霸”的局面。
后入局者纷纷追随亚马逊Echo的脚步。国内最早的入局者是京东和科大讯飞。2014年底,京东成立团队,2015年年初与科大讯飞合资成立公司,进军智能音箱赛道。
汤跃忠介绍,2014年,“智能硬件”的概念虽然火,但具体要做什么,包括亚马逊在内的各家一直处于摸索状态,“经过筛选,无人机、手表等被我们过滤掉,最终做智能音箱”,当时担心“入错行”的汤跃忠说,之所以选择智能音箱也是基于科大讯飞的经验——“已经做出了一台自主研发、不带唤醒功能的音箱”。
在亚马逊Echo面世仅四个月后,2015年3月,京东与科大讯飞合资成立的灵隆科技推出叮咚智能音箱,但市场反应平平,2016年科大讯飞年报披露的数据显示,叮咚智能音箱年出货量近10万台。
虽然同时期创业公司也试图分一杯羹,但现实的技术瓶颈限制了它们的想象空间。2016年,汤跃忠去深圳开会时,他得知深圳南山区做智能音箱的初创公司有两百多家,“它们(创业公司)低估了智能音箱的技术含量,那时麦克风阵列唤醒、自然源理解、合成等很多技术还不成熟,大家都处于摸索阶段。”
这依然是一场大公司之间的较量。
2016年5月,谷歌发布智能音箱Google Home;一个月后,苹果随即发布了智能音箱HomePod。第二年7月,阿里、小米相继杀入这片蓝海,11月,百度推出小度系列的Raven H智能音箱;2018年4月,腾讯听听智能音箱上市;6月,百度发布了小度智能音箱。至此,BAT全部入局。
“进入现阶段,也只有巨头们才能玩得转这个游戏了。”汤跃忠说。
不同玩法
在大公司的挤压下生存,李志飞形容为“被逼出走”。
和这些公司抢占C端,创业公司无疑有点吃力。李志飞告诉本刊,公司在智能音箱业务的布局上,to C的业务很难开拓,于是不得不调整战略,一方面逐渐转向to B,另一方面转向中外巨头卖不到的海外市场。
出门问问CEO李志飞。来源:被访者供图
而在向文杰看来,虽然市场由大公司们所主导,对于任何一家智能音箱的创业公司而言,快速盈利、赚钱、上市,短期内都很难现实,“但打磨出特色和有竞争力的产品,耐心等待才是我们现在该做的事。”
向文杰认为,未来智能音箱发展有两个方向:一是偏互联网的玩法,降低音箱价格,把产品“送”出去,以此来完善自身的业务链条;二是将产品平台化,“散”出去,提升用户体验,让用户离不开智能音箱。
在2018世界机器人大会上,猎豹移动的一款价格并不亲民的小豹音箱也跻身机器人的展台,一位现场体验者告诉记者,其音质与音效确实优于他使用过的普通音箱。对于音箱的定价,现场工作人员回应称,之所以不跟风走低价路线,主要在于其产品成本覆盖了音效、音质的技术及自主研发技术的迭代。
猎豹移动董事兼高级副总裁周品称,小豹AI音箱的定位是“爆款音质、听歌神器”,以优秀的音质来切入市场。从去年开始,猎豹移动旗下人工智能公司猎户星空就以语音OS技术提供者的身份,协助喜马拉雅和小米分别推出了小雅音箱和小爱同学。
智能音箱的下半场将开始采用垂直细分、差异化打法,这也是来自巨头、创业公司及资本玩家达成的共识。和巨头的低价策略相比,目前国内几乎所有的智能音箱创业公司一致在走“高价、个性”路线。
闫占孟告诉本刊,在巨头玩家“入侵”下,后来者除非做垂直细分市场,拥有不同玩法,否则很难生存。
不容忽视的是,语音技术创业公司也在发力。今年5月,国内四家AI语音领域的头部创业公司几乎都在同一时间开始押注AI语音芯片,云知声、出门问问、Rokid、思必驰相继推出了自己研发的AI语音专用芯片。
周品则认为,中场过后,智能音箱产品的逻辑在于回归声音的本质,在音质和音乐的来源上进行深度布局,用音质去吸引和打动用户在音箱上的原始需求。
瓶颈突破
“人工智能的赛道足够宽、足够长,大家都会逐渐找到自己的定位。但如果视野不够广,是没有办法创造未来的”,浅雪称,阿里巴巴凭借自身的强品牌背书和行业资源整合能力,扮演了行业推动者的角色,做着教育市场的工作。
早期智能音箱诞生时,出现唱衰的声音——中国人的生活习惯和场景里没有语音交互需求,而这已被现实证明是一个伪命题。
不过,在接受本刊记者采访的诸多业内人士中,“教育市场”仍是提及较多的一个关键词。多数人认为,目前在语音交互概念和场景需求的渗透上仍存在很大的提升空间。
“目前国内市场智能音箱的出货量还没有智能手机的出货量多。”李志飞一语道破智能音箱现阶段用户渗透率低的特征。
一项来自奥维云网(AVC)的调研表明,中国57%的消费者听说过智能音箱,23%的消费者对智能音箱有一定了解,但消费者在购买之后的使用频次和时长并不理想。相比美国家庭接近30%的普及率,中国智能音箱的普及率仍很低。
用户在使用音箱产品过程中普遍反馈存在远场识别差、误唤醒率高、连续对话功能不稳定、语义理解能力差等问题。
汤跃忠表示,产品教育市场是一个过程,全球消费者使用语音交互产品经验匮乏。不过中国用户接受新技术、新产品、新体验的能力超出他们的预想。调研数据显示,一些南方城市的老年用户使用粘性极高,使用时长、活跃度超出了预期。
闫占孟称,国内智能音箱预计会在2019年或2020年迎来一轮大爆发,真正迎来爆发的关键在于如何实现智能音箱产品的“好用好玩”。时至今日,国内并未出现一款“既好用又好玩”的颠覆性产品。
现在市场上智能音箱产品的竞争力除了渠道,强调最多的就是用户体验。而语音交互和服务内容则是竞争的核心。李志飞如此描述语音交互的重要性:语音交互是“灵魂”,智能音箱只是载体。
但教育市场需要时间,AI技术是制约整个智能音箱行业发展的最大瓶颈。向文杰认为目前整个行业都在创造需求,而非用技术去满足需求。
汤跃忠也持同样观点,在他看来,目前还处于弱AI阶段,语音识别、语音合成、自然语言理解、降噪、唤醒等技术仅仅达到可用的程度,尚未达到令用户十分满意的阶段。早期,汤跃忠和团队研发叮咚音箱时,在他们准备将完善的产品装进硬件之前,投入时间和精力最多的要属语音识别、唤醒率、声音合成等核心技术的研发。
他以麦克风阵列为例,为保证音质的完美体验,要在麦克风的音质和喇叭的噪音处理之间做出平衡,“如何实现音质和音效的协调,这涉及到硬件、软件和算法,这也是目前包括亚马逊Echo在内的所有音箱产品需要突破的一项技术瓶颈”,汤跃忠说,这也是未来巨头在布局生态以外会重点发力的方向,“巨头们要想保持在这个行业里的优势,除了做生态,技术突破不可或缺。”
目前,大公司依托其强大生态推出智能音箱,各有所长。比如天猫精灵内置的人工智能系统整合了支付宝、淘宝和菜鸟物流的信息。小米的小爱同学则和配套的智能家居设备连接在一起。
不过,浅雪告诉本刊记者,硬件与软件的迭代,中间需要一个衔接点,目前大部分公司还没有完全触碰到这个点,这也是天猫精灵有待突破的环节。而天猫精灵的重心正逐渐由智联网连接转到AI算法上。
“这还需要一些时间。”浅雪说。