新闻是有分量的

智能音箱开荒、AI播种

2018-12-13 11:49栏目:评测
TAG:

拿过接力棒,智能音箱成为了扣开AI时代大门的第一个硬件载体——它正置身于新旧体系的交替之期,把守着大门的入口,门内外图景都令人慨叹:

旧世界由智能手机开启,后者以硬件霸主的地位见证了移动互联网的黄金十年,全民触网、衣食住行“在线生活”,但它也在繁荣中迟暮,这个行业在不可挽回地“过去”——市场机构IDC最新报告显示,今年第三季度全球智能手机总出货量已较去年同期下降了6个百分点,而这已是它自2017年第二季度以来持续下滑的第6个季度。

数据来源:IDC

往更早之前看,智能手机则是接棒PC,继而书写了自1970年代以来的互联网革命史:时代前行,技术更迭,旧引擎疲软后总会也总得有新引擎承启,开启下一阶段的更大规模发展。

新世界的主引擎是物联网与AI,而智能音箱成为了装配主引擎落地的开荒级硬件。事实上,“智能音箱比过去十年推出的任何其他消费级科技产品的发展都更快”,市场调研机构Strategy Analytics 最新季度的研报指出,2018年Q3全球智能音箱出货量同比增长197%, 且智能音箱保有量很快将突破 1 亿大关,换言之,它将迎来更广泛的使用基础和市场认知。

时代选中智能音箱,有其运行逻辑。

交互方式的演变是主因之一。人类数字化进程的三十年,也正是交互方式变迁的三十年:PC时代,我们在适应电脑,键盘和鼠标是贯穿二者的交互方式;移动时代,我们和手机彼此适应,触摸屏、各类MEMS传感器是更便捷的交互方式;到如今的AI、物联网时代,机器该主动适应我们,语音/图像代替文本成为主流,语音交互、机器图像识别提供了门槛更低的交互方式。

百度智能生活事业群组总经理景鲲在36氪WISE大会上曾分享,下一代人机交互方式就是语音主导。判断背后的大背景则是语音识别的准确率不断提升,机器学习技术让前者达到了人们广泛接受的阈值。与此相对应的数据是,自2015年以来,全球虚拟语音助手市场的规模正不断攀升,预计2020年将超过百亿美金市场。

而泛语音品类中之所以是音箱,则是因为它兼具语音场景、入手门槛低、市场接受度广等典型特征:智能音箱主要构件包括芯片、扬声器、麦克风阵列、闪存和RAM芯片、数字媒体处理器、立体声ADC处理器和通讯模块。事实上,上十年PC、手机的繁荣很大程度上促进了上游元器件的规模发展并倒逼成本下降——制造产业链足够成熟、经济——这成为音箱智能化、普及化的前提。

但智能音箱的快速式爆发并不单只是一款硬件这么简单。换言之,硬件本身的制造门槛并不高,但支撑其AI新物种想象力的门槛则要高得多。

语音交互是连接人与物的关键一环。这个过程所需要求概括下来即为两点——“听的懂”、“答的对”。“听懂”解决输入过程,“答对”强调结果匹配:背后的完整技术流程是语音输入经由麦克风阵列——声纹识别后确认用户身份——进而语音识别,得到文本——语义理解后得到语义结果——TTS语音输出。

上述各环节的准确率直接决定用户体验,这在AI技术实力上便构成较高门槛,这也是为何百度等技术巨头更具优势的原因,而且其所涉及的对话式AI技术正将差距拉大:一个直观的例证是今年百度世界大会上,小度音箱所搭载的人工智能对话式操作系统DuerOS已经能提供“一次唤醒、持续对话”的体验,目前全球范围内率先实现这种“全双工”技术的除了百度,便是微软和谷歌。

技术之外,生态的门槛更高,这外化为应用场景、生态伙伴以及用户群三个方面。

以应用场景为例,智能音箱开启了语音交互的时代,它所构建的场景天然更合适搜索、通讯和内容分发,也因此当语音交互日渐成为主流后,人们无需掏出手机打字搜索、寻找联系人进行通讯,前者已经重塑了这些功能的获得方式,这些恰巧是诸如百度、谷歌等搜索巨头的核心战场,它们更具备生态优势。

生态伙伴则决定服务边界。智能音箱作为入口,能够给用户分发何种服务,会成为吸纳用户的主要考量因素。以小度在家为例,内容方面,除其自身的信息流产品外,诸如QQ音乐等外部内容伙伴也是其实力的补充;此外,百度投资的小鱼在家、极米、创维等生态链企业也能在其技术核心之外,拓展各种场景和服务边界,增强用户的使用黏性。

用户群保证平台的双边效应可以运转起来。尤其对于AI系统支撑的智能音箱而言,更广泛的用户群能够提供更丰富的数据,反向促进识别、匹配的精准度,后者提升又能吸纳、积累更多的用户群。这也是为何巨头如亚马逊、谷歌、百度、阿里等前期补贴换取市场的原因,这对于用户教育和培养至关重要。

百度智能音箱在中国市场份额变化 数据来源:Canalys

从Strategy Analytics的研报来看,Echo在2018年第三季度仍以32%的市占率排第一,而百度凭借其产品的性价比优势将全球市占率猛增至8%,力压小米成当季度最大黑马;这从IDC的数据也得到进一步验证,3Q2018,搭载百度DuerOS的智能音箱在中国市场出货量第一——行业格局基本形成。

如同十年前智能手机出现后PC的使用率降低一样,格局初显的智能音箱战场,已经在瓜分手机的流量了。埃森哲今年年初发布的调查数据显示,受访者中有66%的人表示使用智能音箱后,智能手机的使用频次减少了;这在NPR与Edison Research的春季调查里也得到了印证,近34%的调研者认为智能音箱的使用替代了智能手机的占用时长。

数据来源:NPR × Edison Research

这易于理解,新兴智能设备的出现改变了围绕用户时长的争夺格局。物联网生态下并非手机不智能了,而是用户有更容易触达的媒介载体了,单一个体的时长有限,使用智能音箱的频次越来越多,智能手机也就自然使用变少。

围绕使用时长及频次的流量发生了转移,也意味着智能音箱这个破局者在重塑原有互联网的产业走向。分发硬件之王的交椅由单一的手机端向音箱等多种新兴终端过渡,随之衍生的产业链规则也将改写。

以内容行业为例,语音交互的时代走向必然冲击文字交互的创作生态,用户与智能音箱交互的行为习惯意味着对个性化内容的分发需求更为强烈,声音创作者的红利时代也将到来,一切不便依靠视觉输入信息的场合,都是听觉输入的主场,这都将在语音、语义理解等技术的加持下全面落地;服务行业的影响更为直接,叫车、外卖、购物等功能已经被推出与使用,尽管受限于业务复杂度,短期内上述冲击影响还并不明显,但变化却已在发生,旧有的思维正失去其效力,新的通路正待人挖掘。

数据来源:DuerOS对话式人工智能用户数据洞察报告

这一切,都将入口的争夺指向场景。过去,传统音箱所代表的就是一个功能机时代,但智能音箱则将物与物连接起来,AI是贯穿的大脑,以智能音箱为代表的智能设备则成为了由大脑控制的耳朵等器官,器官与器官之间开始互联互通,音箱可以控制灯具、空调家电,这是音箱背后的家居场景。

场景与场景之间,多个终端设备依靠一个大脑进行互通。以百度为例,小度音箱代表家庭场景,百度无人车代表车载场景,看似分割的两个场景,却都是依靠DuerOS这个大脑中控来运转。换言之,DuerOS可以搭载在任何具备连接能力的终端上,进而卡位对应的端场景,多场景多终端积累的多元数据都反哺于DuerOS本身,促进其更加智能决策。

实际上,DuerOS已经成为市场上最活跃的对话式AI操作系统,最新数据显示,搭载DuerOS设备的激活量已经超过1.5亿,月活跃设备量超过3500台,合伙伙伴超过300家,搭载DuerOS的落地主控设备达到160多款,加上开发者数量,基本都居于中国市场第一,具有极强的平台效应。

李彦宏说,“过去20年人类社会可能走的是互联网时代,未来的30到50年,人们正进入人工智能时代”。当下,人工智能正成为百度焕新的血液,它被有效地注入到这家科技公司的新旧各项业务里,平滑着各方生态:无论是音箱、手机端应用,还是正如火如荼建造的车载终端,百度依靠AI在将生意从流量转移到围绕人的需求挖掘上,在此基础上,生态中各方互惠共赢,但又在本质上持续为百度的闭环护城河贡献川流。

旧世界在失去活力,百度借智能音箱们以开荒者的姿态“闯进”AI新时代,它找到了一条清晰的通路,前方到站新大陆,风景这边独好。