基于深度神经网络的单通道语音增强方法回顾

基于深度神经网络的单通道语音增强方法回顾

论文摘要

语音增强是一种试图从噪声中分离出语音的技术,目的是提高语音的质量和可懂度。在过去的几十年里,人们提出了多种类型的语音增强方法,但这些方法在非平稳噪声环境中的表现还未达到最佳程度,因为他们没有充分利用语音和噪声的先验信息。近年来,随着深度学习的发展,深度神经网络已成为当下实现语音增强的主流方法,在改善语音质量和提升可懂度方面发挥了积极作用。本文从深度神经网络的结构出发,回顾了基于深度学习的单通道语音增强方法。首先,介绍了语音增强的背景;其次,详细描述了四种不同类型神经网络实现语音增强的方法;最后,给出了未来语音增强方法的建议和本文的结论。

论文目录

  • 1 引言
  • 2 基于MLP的语音增强方法
  • 3 基于CNN的语音增强方法
  • 4 基于RNN的语音增强方法
  • 5 基于GAN的语音增强方法
  • 6 结论与展望
  • 文章来源

    类型: 期刊论文

    作者: 鲍长春,项扬

    关键词: 语音增强,深度神经网络,深度学习,先验信息,监督学习

    来源: 信号处理 2019年12期

    年度: 2019

    分类: 信息科技

    专业: 电信技术,自动化技术

    单位: 北京工业大学信息学部语音与音频信号处理研究室

    基金: 国家自然科学基金资助项目(61831019,61471014)

    分类号: TN912.35;TP183

    DOI: 10.16798/j.issn.1003-0530.2019.12.001

    页码: 1931-1941

    总页数: 11

    文件大小: 1498K

    下载量: 446

    相关论文文献

    标签:;  ;  ;  ;  ;  

    基于深度神经网络的单通道语音增强方法回顾
    下载Doc文档

    猜你喜欢