人机交互智能程度提升,智能语音发展恰逢其时

    2020-09-28 17:56
    头豹研报

    2020年智能语音行业概览

    2022-03-01

    全文字数:2112字,精读时间:4分钟

    本文援引于报告《2020中国智能语音行业概览》,首发于头豹科技创新网(www.leadleo.com)。

    头豹科技创新网内容覆盖全行业、深入垂直领域,行业报告每日更新;政策图录、数据工具助您轻松了解市场动态;智能关键词轻松搜索,直奔行业热点内容。

    诚挚欢迎各界精英交流合作,头豹承接行业研究、市场调研、产业规划、企业研究、商业计划、战略规划等业务,您可发送邮件或来电咨询。

    客服邮箱:CS@leadleo.com 咨询热线:400-072-5588

    新冠肺炎期间,智能语音机器人成为战“疫”得力助手

    新冠肺炎疫情爆发初期,湖北省不少居民接到这样的电话:“您好,请问您正在武汉吗?请问您和家人体温是否正常?” ,仔细分辨电话声音,其实是智能语音机器人拨打的电话,这是中国移动利用智能语音机器人帮助政府部门开展疫情智能排查外呼,使政府职能部门工作人员通过无接触高效方式进行疫情信息通知和排查工作。疫情期间,湖北省武汉市、宜昌市、黄石市均启动智能语音机器人使用计划,通过智能语音机器人开展居民家庭健康信息访问与采集,疫情期间通过智能语音机器人完成的居民疫情排查共计70万户。

    智能语音的本质是通过人工智能技术实现人机语音交互

    智能语音是人工智能技术的重要组成部分,其中语音识别(ASR)、自然语义理解(NLP)和语音合成(TTS)是实现智能语音解决方案的核心技术基础。智能语音解决方案的本质是通过人工智能技术,实现人机语音交互。完整的智能语音解决方案包含声音信号前端处理、声音转文字供机器处理、机器生成语言后,通过语音合成技术将文本语音转化为声波,形成完整的人机语音交互流程。

    智能语音在车载、手机和家居等消费级场景应用广泛

    智能语音+车载

    按键或触控操作对驾驶员而言安全系数较低,在驾驶过程中使用容易引发安全事故。语音控制在车载场景中是替代按键或触控的最佳方案。各大汽车厂商开始在前装控制系统中搭载语音控制方案,通过语音助手处理驾驶员对导航、音乐搜索与播放、信息听写等任务的指令。众多语音助手行业巨头纷纷推出语音车载产品,如科大讯飞推出汽车语点系统,百度推出Carlife智能车载系统支持语音声控,实现其语音助手在车载场景的投放。


    智能联网汽车产量迅速增长,2017年智能联网汽车销量为1,430万辆,渗透率仅为15%,预计到2022年,渗透率可达69%。随着智能联网汽车市场的增长,智能车载终端作为智能汽车的标配,其市场规模必将水涨船高。语音交互作为智能车载的最佳搭配,在汽车市场将拥有强烈的市场需求,2021年,智能语音在汽车市场的渗透率有望高达80%。


    智能语音+家居

    具备语音交互能力是家居智能化的体现,语音助手与空调、电视、音响、灯具、玩具等家用设备和智能家居控制中枢系统相结合,控制互联的智能家居产品,如长虹、LG、TCL等主流的智能电视内嵌了语音助手,用户通过命令语音助手可实现查收影视剧、开关电视等功能。


    中国智能家居从业者认为智能音箱是最合适的用户入口,用户可通过智能音箱方便操控整屋家电。随着远场语音识别、基于NLP的对话和问答能力成熟,智能音箱的人机交互功能达到实际可用,当智能家居生态成熟时,语音交互将成刚需。

    语音交互逐渐从辅助的接入工具转变为重要的信息入口

    中国智能语音市场收入主要来源于语音识别产品和语义理解产品,目前语音识别产品销售额大于语义理解产品销售额。未来3年,由于智能音箱等交互类产品市场逐渐饱和,语音识别产品销售额增长速度将放缓,与此同时,医疗、教育、金融等行业领域市场交互需求释放,语义理解产品的市场份额将快速上升。随着人机语音交互体验的持续改善,语音交互逐渐从辅助的接入工具转变为重要的信息入口,众多下游应用领域对语音交互具有旺盛需求,智能语音市场增长空间大。


    深度见解:

    初创企业可把握垂直细分市场,避开与巨头直接竞争

    中国智能语音产业链中游市场是参与者较容易进入的环节,上游的基础设施环节对资金、技术壁垒较高,由巨头主导市场,进入门槛高。中游市场进入门槛相对较低,下游客户群体大,初创企业可把握垂直细分市场,避开与巨头直接竞争。各企业开发和掌握的智能语音技术的本质区别逐渐缩小,技术壁垒效应逐渐被削弱,基于技术销售的商业模式难以为继,技术已不再是企业构建商业模式的最主要基础,全产业链布局及生态体系构建将成为智能语音服务商持续发展的主要途径,应用场景的开发将是智能语音厂商未来的主要关注点。


    智能人机交互将向语音、图像、视频等多模态融合方向发展

    随着人工智能的智能程度提升,语音、图像、视频等模态将趋于融合,语音可视化将成为可能。类比人类的语言感知过程,智能人机交互也将向语音、图像、视频等多模态融合方向发展,语音助手通过收集声音、语言、视觉、触觉等感知信息,以自然语言处理为主,辅以唇语识别、表情认定、姿势识别、情绪感知等技术,将数据多维度融合以实现人工智能从感知转变为认知。

    本文来源于头豹科创网,原创内容,作者:头豹研究院。转载或合作请联系 support@leadleo.com,违规转载法律必究,详见说明。如您有商务合作需求,请联系我们,我们将尽快与您取得联系。