语音版淘宝天猫面世:阿里巴巴 推出 天猫精灵X1音箱 与 AliGenie语音助手
一夜之间遍地AI(人工智能),这可能是2017年科技新闻给人的既视感。缘何Google突然间AI技术遍及所有业务?百度又何以开始自称是AI公司?人工智能是如何占领新闻版面的已经不可考,但人工智能作为一个简单的技术名词,从幕后走向台前,已经是不争的事实。
神经网络、卷计算法、机器学习、深度学习,这些词已经随人工智能一起进入消费者的视野,但主打这些技术的硬件产品,却大部分还停留在PPT里,停留在传闻阶段。今天,其中的一个传闻成真:阿里巴巴的人工智能语音硬件产品天猫精灵X1正式面世,成为BAT里第一家发布AI语音硬件产品的公司。天猫精灵X1仅售499元,8月开卖。相比类似形态的Echo和Google Home,X1的价格可称亲民。
同时,阿里自家的人工智能电子助手、内置于天猫精灵X1的AliGenie也一起上线。但有意思的是,阿里巴巴这场发布会上,全程未提到“人工智能”或“AI”这两个词,他们对AliGenie的称呼是“人机交流系统”。
BAT第一家,AI硬件后发先至
相比腾讯“AI即服务”战略与“绝艺”围棋AI,百度的duerOS、度秘和无人驾驶(没错,就是昨天被北京交警调查罚款的那种),阿里的AliGenie来的有些迟。并非阿里不注重AI和硬件,正相反,机器人、AI、云计算一直是阿里巴巴的重点业务。早在2015年,阿里巴巴就投资了软银旗下的机器人公司SBRH,后者就是人形机器人Pepper的制造商;针对天猫淘宝买家卖家的多种服务里,AI技术已经于2015年开始应用;同时作为国内最大的云计算服务提供商,阿里云今年年初已经推出FPGA云服务,而FPGA是目前用于AI的主流计算解决方案。
阿里巴巴投资的Pepper
比起百度和腾讯乃至科大讯飞和出门问问,阿里的AI服务一直保持低调,其阿里巴巴人工智能实验室也是近期才正式亮相,但硬件发布却抢了个先,成为第一款BAT旗下的智能音箱。这次发布的天猫精灵X1直接归入了天猫品牌下,与天猫魔盒命名类似。身材上,它比亚马逊的初代Echo和苹果的HomePod更小,不过造型类似,圆柱形设计,按键和拾音的阵列式麦克风(支持全向5m拾音)在顶部,底部则是发声单元。
天猫精灵X1内部使用了一颗定制的联发科MT8516芯片,四核Cortex-A35架构,还有一颗独立的NEON处理单元,据称能带来更快的语音识别速度和音频处理效果。Cortex-A35是ARM高能耗比方向设计的核心,比A53有更高的效率和更低的功耗,适合智能语音音箱这类全天开机的智能硬件产品。内置德仪的功放芯片,使用DC供电,12V/1A。支持2.4G Wi-Fi和蓝牙4.0连接。
阿里巴巴人工智能实验室负责人浅雪(花名)在介绍这款产品时,提到了设计时的一个难点:如何在音效与唤醒灵敏度之间做到平衡。也就是说,如何在大音量播放音乐时,保证试音麦克风阵列能保持对人声的高识别率。最终阿里工程师靠气密性设计做到了这一点,据悉目前天猫精灵X1在75分贝的临界值时仍能轻松唤醒AliGenie人机交流系统。现场演示里,较大音量的音乐播放时,天猫精灵X1仍然快速准确地识别到了“暂停”的命令,表现相当不错。这也意味着频繁打断并发出新的指令并不是问题,这多少能提高一点语音输入的效率。
相比Alexa,AliGenie仅仅更懂中文?
一款功能完整的AI语音智能音箱定价499元,纵观此类产品市场,可以说这个价格是比较良心的。但低售价必定有低成本的原因,或许相比苹果HomePod定位家庭音频设备,天猫精灵X1更接近智能语音助手而非客厅音箱。具体的音质表现,还有待后续实际测试。毫无疑问,比起Echo、Google Home和国内的叮咚、喜马拉雅小雅AI音响,天猫精灵X1具备更高的性价比。比起AI巨头亚马逊和Google的产品,天猫精灵X1定价低于前两者同级别产品;而和国内产品相比,阿里系产品显然拥有更好的生态和内容资源。
同样首次亮相的AliGenie是阿里巴巴的人机交流系统,比起硬件载体天猫精灵X1,它其实更应该受到关注。在发布会上,浅雪将它的能力总结为三点:理解力、执行力和进化力。
所谓理解力,即AliGenie的语音识别和自然语义理解能力。一个AI语音助手,应该是一个拟人化的对话对象,而不是过去那种识别单条语音命令的语音识别工具。执行力则是一种智能分析选择的能力,AliGenie具备上下文分析和场景化识别功能,举例来说,当你在夏天下班回家时喊一声“天猫精灵,我回来了”,它会打开与天猫精灵X1相连的空调、风扇、电视;接着喊一句“风再大点”,它会调节空调或电风扇的速度而非厨房里排气扇的速度。而进化力,则是人工智能通用的一项特性,通过大数据的调教和机器学习,人工智能对于场景的判断、选择将会越来越准确。
从发布会上公布的特性来说,除了对汉语的语音识别支持,天猫精灵X1与AliGenie并没有表现出太多比Echo更令人眼前一亮的能力。但笔者认为,“更懂中文”并不是一项值得嘲讽的事情(当年的百度正是凭着这句口号,从谷歌手里吃下了中国搜索引擎的大部分份额。),这反而是目前天猫精灵X1在中国市场最大的优势。要知道优秀的本地化体验,很多时候比技术本身是否领先要更重要。目前Google Assistant和亚马逊Alexa对汉语语音识别都没有提供足够的支持,之前这块市场是国内百度、搜狗、科大讯飞和出门问问的天下,Google的Android Wear中国版正是使用了出门问问的语音识别方案。
而阿里巴巴的天猫精灵X1,是目前中国互联网巨头中唯一的AI智能音箱产品。它背后是阿里海量的资源版权库,是庞大的阿里智能物联平台,是几乎覆盖整个中国大陆互联网用户的淘宝天猫购物生态,这都是天猫精灵X1和AliGenie的巨大优势。这种生态圈的资源优势相对于国内其他AI语音硬件产品,可以说是碾压级别的。再加上499元的定价,目前天猫精灵X1似乎没有够格的对手。或许,即将来临的腾讯智能音箱“耳朵”会成为它短时间内最大的竞争者。
声纹支付是亮点,暂时领先业界
除了汉语语音识别,AliGenie的声纹识别其实也有必要一提,目前Alexa和Google Assistant的声纹功能都还在开发调试中,所以阿里成熟的声纹识别系统已经小小领先。何谓声纹识别?类似于指纹,每个人的声音也具备各自的独特之处,声纹就是可以区别每个人声音的东西,因此也可以作为人物识别的依据。Windows、Android系统有多帐号功能,可以在一台PC上开多个帐号,以适应不同人的不同使用习惯。智能音箱的不同声纹的用户可以认为是多个帐号,而且这些帐号的切换是即时的,不必登入登出。
简单举例,在家庭中多人共用天猫精灵X1,老年人喊一句“播放我上次听的曲子”,放的可能是京剧;年轻人同样喊一句,则可能播放的是之前自己听的流行歌曲。通过声纹识别,多个用户可以方便的共用一台天猫精灵X1。阿里还将声纹技术用于语音购物验证,用户可以向AliGenie发送命令,说明想购买的商品,确定购买后,支付时需要验证声纹,一般是跟着AliGenie说一句话。有了这一层可靠的验证技术,语音购物不但可行,安全性也增强了很多。
声纹以外的其他方面,AliGenie面对已拥有15000项技能的Alexa并不占优势。至于对智能家居的控制、日程管理、内容获取和播放等功能,市面上的产品基本都带有,也是大同小异。同时,国内智能家居产品的标准还是分化明显,阿里巴巴的阿里智能物联平台,京东的京东微联,小米的米家各有一套协议。天猫精灵X1目前只能连接阿里智能平台的产品,不过目前许多主流品牌的家电和智能家居都已接入该平台,可用性还是很高的。
目前阿里智能平台的智能家居产品
AliGenie不是我想要的温柔女声
如果问对天猫精灵X1和AliGenie哪点最不满意,笔者一定会回答:AliGenie并不是我想要的温柔女声。现场演示环节有这么一段,浅雪让天猫精灵X1讲了个笑话,笑话的内容并无不妥,但那种匀速朗读、毫无语气语调起伏的“女声”所表现出来的“机器感”十足,似乎在时刻提醒你,这是一台机器,而不是一个有真实血肉的自然人。
当然,这不是AliGenie和天猫精灵X1独有的问题,事实上可能所有AI语音服务的开发者都正在努力让AI的声音更像真人,但目前还没能实现。因此,即使你可以更加自由地向智能音箱和语音助手们表达你的问题和情感,直接向它们输入自然语言而非特定的语音指令。但现阶段,它们回应还会略显生硬。
另外一个痛点在于,不管是天猫精灵、Alexa、Google Assistant还是Cortana,你都无法省略前面那一句“天猫精灵”、“OK,Google”或“Hey,Siri”,目前暂时没有比唤醒语句更智能的唤醒方法。而在你唤醒后,如果突然切入与他人对话,此时智能语音助理是否还能准确地分辨你对话的对象?这也是智能语音助手需要解决的问题。相信随着AI技术的发展,我们终能看到一个交流起来与真人无异的虚拟数字助手,相信科技发展的每一步,都是朝未来踏的一小步。(完)