论文摘要
语音增强是一种试图从噪声中分离出语音的技术,目的是提高语音的质量和可懂度。在过去的几十年里,人们提出了多种类型的语音增强方法,但这些方法在非平稳噪声环境中的表现还未达到最佳程度,因为他们没有充分利用语音和噪声的先验信息。近年来,随着深度学习的发展,深度神经网络已成为当下实现语音增强的主流方法,在改善语音质量和提升可懂度方面发挥了积极作用。本文从深度神经网络的结构出发,回顾了基于深度学习的单通道语音增强方法。首先,介绍了语音增强的背景;其次,详细描述了四种不同类型神经网络实现语音增强的方法;最后,给出了未来语音增强方法的建议和本文的结论。
论文目录
文章来源
类型: 期刊论文
作者: 鲍长春,项扬
关键词: 语音增强,深度神经网络,深度学习,先验信息,监督学习
来源: 信号处理 2019年12期
年度: 2019
分类: 信息科技
专业: 电信技术,自动化技术
单位: 北京工业大学信息学部语音与音频信号处理研究室
基金: 国家自然科学基金资助项目(61831019,61471014)
分类号: TN912.35;TP183
DOI: 10.16798/j.issn.1003-0530.2019.12.001
页码: 1931-1941
总页数: 11
文件大小: 1498K
下载量: 446