基于梅尔倒谱系数、深层卷积和Bagging的环境音分类方法

基于梅尔倒谱系数、深层卷积和Bagging的环境音分类方法

论文摘要

针对传统环境音分类模型对环境音特征提取不充分,以及卷积神经网络用于环境音分类时全连接层易造成过拟合现象的问题,提出了梅尔倒谱系数(MFCC)、深层卷积和Bagging算法相结合的环境音分类方法。首先,针对原始音频文件,利用预加重、加窗、离散傅里叶变换、梅尔滤波器转换、离散余弦映射等方法建立梅尔倒谱系数特征模型;然后,将特征模型输入卷积深度网络进行第二次特征提取;最后,借鉴强化学习思想,用Bagging集成算法集成线性判别分析器、支持向量机(SVM)、Softmax回归、XGBoost四个模型,以投票预测的形式对网络输出结果进行预测。实验结果表明,所提方法能够有效提高对环境音的特征提取能力和深层网络在环境音分类上的抗过拟合能力。

论文目录

  • 0 引言
  • 1 相关工作
  •   1.1 梅尔频率倒谱系数
  •   1.2 卷积与池化
  •   1.3 Bagging算法
  •   1.4 Softmax Regression
  •   1.5 SVM
  •   1.6 LDA
  •   1.7 XGBoost
  • 2 模型结构
  •   2.1 Mel特征系数提取
  •   2.2 卷积池化特征提取
  •   2.3 Bagging随机抽样
  •   2.4 集成分类模型
  •     2.4.1 元模型一——Softmax Regression
  •     2.4.2 元模型二——SVM
  •     2.4.3 元模型三——LDA
  •     2.4.4 元模型四——XGBoost
  •   2.5 投票决策
  • 3 实验与结果分析
  • 4 结语
  • 文章来源

    类型: 期刊论文

    作者: 王天锐,鲍骞月,秦品乐

    关键词: 环境音分类,梅尔频率倒谱系数,集成算法,特征提取,深度学习

    来源: 计算机应用 2019年12期

    年度: 2019

    分类: 信息科技

    专业: 电信技术,自动化技术

    单位: 中北大学大数据学院

    分类号: TN912.3;TP183

    页码: 3515-3521

    总页数: 7

    文件大小: 1767K

    下载量: 271

    相关论文文献

    • [1].基于耳蜗倒谱系数的说话人识别[J]. 电子技术与软件工程 2020(05)
    • [2].基于美尔倒谱系数及隐马尔可夫模型的说话人识别系统研究[J]. 黑龙江科技信息 2012(30)
    • [3].听觉模型倒谱系数及其在声目标识别中的应用[J]. 应用科学学报 2011(01)
    • [4].基于梅尔频率倒谱系数与翻转梅尔频率倒谱系数的说话人识别方法[J]. 计算机应用 2012(09)
    • [5].基于MFCC和加权动态特征组合的环境音分类[J]. 计算机与数字工程 2010(02)
    • [6].基于双耳模型的倒谱系数在声目标识别中的应用[J]. 应用声学 2008(05)
    • [7].改进的美尔倒谱系数用于说话人识别研究[J]. 计算机工程与应用 2012(08)
    • [8].基于美尔倒谱系数和复杂性的语种辨识[J]. 计算机工程 2008(19)
    • [9].基于深度学习的录音回放检测[J]. 电子技术与软件工程 2020(16)
    • [10].一种新的抗噪语音特征的提取[J]. 微电子学与计算机 2011(10)
    • [11].基于减少阶数的Mel频谱倒谱系数改进[J]. 中国科技信息 2013(01)
    • [12].基于多特征组合优化的汉语数字语音识别研究[J]. 电子器件 2013(02)
    • [13].一种声纹美尔频率倒谱系数干扰消除算法研究[J]. 计算机仿真 2013(04)
    • [14].Mel频率倒谱系数的提取与改进[J]. 科技信息(科学教研) 2008(15)
    • [15].基于LPCC和MFCC参数的病理嗓音识别研究[J]. 通信技术 2012(01)
    • [16].最小方差无失真响应感知倒谱系数在说话人识别中的应用[J]. 声学学报 2012(06)
    • [17].水下声目标的梅尔倒谱系数智能分类方法[J]. 应用声学 2019(02)
    • [18].基于FPGA的Mel倒谱系数提取方法设计与实现[J]. 仪表技术与传感器 2017(03)
    • [19].嵌入式语音识别系统特征参数提取研究[J]. 计算机技术与发展 2011(07)
    • [20].一种具有鲁棒特性的Mel频率倒谱系数[J]. 金陵科技学院学报 2008(02)
    • [21].基于Mel频率倒谱系数的心音识别技术研究[J]. 生物医学工程学杂志 2012(06)
    • [22].基于LPCMCC的音频数据检索方法[J]. 计算机工程 2009(11)
    • [23].基于改进梅尔倒谱系数的GIS机械故障诊断方法[J]. 高压电器 2020(09)
    • [24].基于改进反向Mel频率倒谱系数的咳嗽干湿性自动分类[J]. 生物医学工程学杂志 2016(02)
    • [25].基于带阻滤波倒谱系数的回放语音检测算法[J]. 无线通信技术 2019(03)
    • [26].基于MEL频率倒谱系数技术的音控汽车天窗的研究设计[J]. 河南机电高等专科学校学报 2015(02)
    • [27].利用抗噪幂归一化倒谱系数的鸟类声音识别[J]. 电子学报 2013(02)
    • [28].基于梅尔倒谱系数的矿山复杂微震信号自动识别分类方法[J]. 中国安全生产科学技术 2018(12)
    • [29].基于Fisher比的梅尔倒谱系数混合特征提取方法[J]. 计算机应用 2014(02)
    • [30].基于线性预测倒谱系数的地震相分析[J]. 地球物理学报 2016(11)

    标签:;  ;  ;  ;  ;  

    基于梅尔倒谱系数、深层卷积和Bagging的环境音分类方法
    下载Doc文档

    猜你喜欢