基于深度神经网络的单通道语音增强方法回顾

论文摘要

语音增强是一种试图从噪声中分离出语音的技术,目的是提高语音的质量和可懂度。在过去的几十年里,人们提出了多种类型的语音增强方法,但这些方法在非平稳噪声环境中的表现还未达到最佳程度,因为他们没有充分利用语音和噪声的先验信息。近年来,随着深度学习的发展,深度神经网络已成为当下实现语音增强的主流方法,在改善语音质量和提升可懂度方面发挥了积极作用。本文从深度神经网络的结构出发,回顾了基于深度学习的单通道语音增强方法。首先,介绍了语音增强的背景;其次,详细描述了四种不同类型神经网络实现语音增强的方法;最后,给出了未来语音增强方法的建议和本文的结论。

论文目录

1 引言

2 基于MLP的语音增强方法

3 基于CNN的语音增强方法

4 基于RNN的语音增强方法

5 基于GAN的语音增强方法

6 结论与展望

文章来源

类型: 期刊论文

作者: 鲍长春,项扬

关键词: 语音增强,深度神经网络,深度学习,先验信息,监督学习

来源: 信号处理 2019年12期

年度: 2019

分类: 信息科技

专业: 电信技术,自动化技术

单位: 北京工业大学信息学部语音与音频信号处理研究室

基金: 国家自然科学基金资助项目(61831019,61471014)

分类号: TN912.35;TP183

DOI: 10.16798/j.issn.1003-0530.2019.12.001

页码: 1931-1941

总页数: 11

文件大小: 1498K

下载量: 446

基于深度神经网络的单通道语音增强方法回顾

论文摘要

论文目录

文章来源

相关论文文献

猜你喜欢