1、智能语音交互技术
目前,智能语音交互技术缺乏权威的定义。无论是学界的研究成果,还是业界对智能语音交互技术的称谓,都没有明文确定的规范。比较主流的认知有两种:一是胡郁、严峻,在《智能语音交互技术及其标准化》一文中,将智能语音交互技术概括为:就是让机器像人一样“能听会说”并进而“能理解会思考”的技术,主要包括语音合成(让机器开口说话)、语音识别
(让机器听懂人说话)、自然语言理解(让机器理解人的意图)等核心技术。二是在小米公司王斌,王育军等研究者的《智能语音交互技术进展》对于智能语音交互技术的概述部分,将语音识别技术、自然语言处理技术、人机对话技术、语音合成技术。
2、智能语音交互技术应用领域
从市场应用级别来看,智能语音交互技术的应用可从消费级应用、企业级应用、工业级应用三方面进行区分:
(1)消费级应用
智能家居:智能电视、智能音箱、智能机顶盒……
智能教育:智能故事机、智能学习机、儿童机器人……
智能商务:智能翻译机、录音转写器、智能办公本……
(2)企业级应用
智能客服:智能电话营销、人工客服服务、电话质量检验……
新闻媒体:ai合成主播、自动播发稿件、智能字幕匹配……
公检法领域:智慧庭审、声纹研判、声纹终端采集……
(3)工业级应用
安防系统:智能报警系统、双模对讲机、安防机器人……
智慧城市:智慧政务服务、超级应用、智慧旅游……
AI新基建:AI通用平台、AI定制服务、AI训练能力……
3、智能语音交互技术优缺点
智能语音交互技术优点:
(1)语音输入效率高
百度统计数据显示,智能语音交互技术的输入效率是普通键盘输入、文字输入的3倍左右。
(2)解放双手,适应场景多
除常见的车载场景外,医疗场景、政务服务场景都能搭载智能语音交互技术。
(3)使用门槛低
语音交互技术使用门槛低,对视觉障碍的人群、老龄人群及小孩来说,都是易上手的技术。
智能语音交互技术缺点:
(1)接受效率低
从技术角度来说,语音的输出其实是一个线性的输出,如果想掌握输入者的本意,需耐心等待语音播放,而普通的文字则不一样,人们能从部分文字中提取关键信息,无需将整段文字尽数阅读。
(2)环境复杂
受制于当前技术的影响,语音交互技术并不能消除使用者周围的杂音,当声音交叠在一起的时候,就会对我们的交互体验产生非常大的影响。
推荐阅读:《IEEE Digital Reality:人类向多界面进化的报告-语音交互、触摸交互、脑机接口交互(英文版)(17页).pdf 》