智能语音技术是人工智能应用最成熟的技术之一,并拥有交互的自然性,就是让智能设备听懂人类的语音。它是一门涉及数字信号处理、人工智能、语言学、数理统计学、声学、情感学及心理学等多学科交叉的科学。智能语音解决的问题,就是使得设备可以用听觉感知周围的世界,用声音和人做最自然的交互,让操控和生活更为便捷。
智能语音的基础在于通过神经网络技术,提升语音识别的识别率,同时可以用语义理解分析出人的意图,进行相应的操控,反馈时可以通过播放预设的声音或通过语音合成来合成声音播放,输出结果。当前处理智能语音有多种方式,常见的有在线语音、离线语音等分类。因为智能语音处理需要用到算力,所以刚开始都是用云端服务器提供算力来进行识别和语义处理,