基于隐马尔科夫模型及反向传播神经网络的音效素材分类

基于隐马尔科夫模型及反向传播神经网络的音效素材分类

论文摘要

随着多媒体技术发展和计算机运算效率提高,多媒体信息数据呈现快速增长的趋势。目前在国内广播电影电视行业的音效剪辑仅依靠人工听辨音效素材,由于素材声源混杂,且具有丰富语义及听觉特性,要从海量的音效素材中找到目标文件耗时且低效,因此迫切需要一个音效素材自动分类系统。本研究首次在广播电影电视行业内部应用机器学习方法对音效素材的自动分类进行探索,通过对音效素材提取特征参数建立标准数据集,采用不同的算法对于数据集学习训练并建立了基于反向传播神经网络的音效分类原型系统。研究核心为音频数据的相似度匹配算法以及音频数据的标注处理。主要工作及研究成果如下:1、实验对4074个音频文件分别提取了短时能量、短时平均过零率以及梅尔频率倒谱系数及其差分这三类特征参数,根据不同类型算法建立了相应标准数据样本集。2、分别构建隐马尔科夫模型和反向传播神经网络模型对样本进行训练识别得到分类准确率并分别测试模型的性能;对两种算法及相关研究从算法结构、训练时间和识别率进行扩展讨论。结果表明:对于含有复杂声音来源且有较多易混淆元素的音效素材进行分类,反向传播神经网络训练方法更易实现效果,平均识别率接近90%左右。3、建立基于反向传播神经网络的音效分类原型系统,以便于今后音频工作者使用。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  •   1.1 问题的提出
  •   1.2 国内外声音分类研究背景
  •     1.2.1 国内外应用现状
  •     1.2.2 国内外研究现状
  •   1.3 本文设想与主要工作
  •   1.4 本章小结
  • 第二章 声音音效的数据处理
  •   2.1 声音信号的预处理
  •   2.2 声音的短时时域处理
  •     2.2.1 短时能量
  •     2.2.2 短时平均过零率
  •   2.3 MEL频率倒谱系数—MFCC
  •     2.3.1 人耳听觉机理
  •     2.3.2 Mel频率倒谱系数分析
  •     2.3.3 Mel频率倒谱系数的提取过程
  •     2.3.4 梅尔倒谱参数的衍生特征参数
  •   2.4 实验音效素材选取及处理
  •   2.5 本章小结
  • 第三章 基于隐马尔科夫模型的音效识别
  •   3.1 马尔科夫模型概述
  •   3.2 隐马尔科夫模型主要参数
  •   3.3 隐马尔科夫模型的三个问题
  •     3.3.1 概率计算问题——前向算法和后向算法
  •     3.3.2 参数估计问题—Baum-Welch算法
  •     3.3.3 解码问题—Viterbi算法
  •   3.4 基于隐马尔科夫模型的音效素材训练
  •     3.4.1 实验数据样本预处理
  •     3.4.2 隐马尔科夫模型的训练模型
  •     3.4.3 隐马尔科夫模型的分类识别结果及讨论
  •   3.5 本章小结
  • 第四章 基于反向传播神经网络的音效识别
  •   4.1 神经网络研究的基础
  •     4.1.1 人工神经网络的基本概念和特性
  •     4.1.2 单个神经元的工作过程
  •     4.1.3 基本神经元间的互连
  •     4.1.4 神经网络的相关学习法
  •   4.2 BP神经网络原理
  •     4.2.1 BP神经网络的结构
  •     4.2.2 权重及偏置值的更新
  •     4.2.3 迭代算法的收敛性
  •   4.3 基于BP神经网络的音效特征参数训练
  •     4.3.1 音效素材特征参数提取及合并
  •     4.3.2 数据样本的分类标识
  •     4.3.3 数据集的切分及归一化
  •     4.3.4 BP神经网络模型构建及训练
  •     4.3.5 BP神经网络验证测试
  •   4.4 测试训练模型的性能
  •   4.5 本章小结
  • 第五章 隐马尔科夫模型和BP神经网络分析对比
  •   5.1 实验结果分析对比
  •   5.2 实验算法分析对比
  •   5.3 相关实验研究分析
  •   5.4 本章小结
  • 第六章 基于BP神经网络的音效分类原型系统
  •   6.1 原型系统总体架构
  •   6.2 音效检索子系统
  •   6.3 音频管理子系统
  •   6.4 系统维护子系统
  •   6.5 本章小节
  • 总结
  •   总结
  •   展望
  • 参考文献
  • 攻读硕士学位期间取得的研究成果
  • 致谢
  • 附件
  • 文章来源

    类型: 硕士论文

    作者: 张辛宬

    导师: 陈百基

    关键词: 音效特征参数,梅尔频率倒谱系数,隐马尔科夫模型,反向传播神经网络,识别率

    来源: 华南理工大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 数学,计算机软件及计算机应用,自动化技术

    单位: 华南理工大学

    分类号: TP37;TP183;O211.62

    DOI: 10.27151/d.cnki.ghnlu.2019.000415

    总页数: 101

    文件大小: 9272K

    下载量: 88

    相关论文文献

    • [1].基于隐马尔科夫模型的人脸识别[J]. 中国刑警学院学报 2019(04)
    • [2].二阶离散隐马尔科夫模型的严格定义及等价性质[J]. 纯粹数学与应用数学 2015(04)
    • [3].量子隐马尔科夫模型参数学习研究[J]. 科技视界 2014(16)
    • [4].基于伪二维隐马尔科夫模型的图像符号识别算法[J]. 计算机光盘软件与应用 2014(11)
    • [5].基于加权自回归隐马尔科夫模型的语音识别[J]. 统计与决策 2012(22)
    • [6].基于时变隐马尔科夫模型的机器人故障预测[J]. 机电一体化 2016(06)
    • [7].基于小波域隐马尔科夫模型的肌电信号滤波[J]. 仪器仪表学报 2010(11)
    • [8].二阶隐马尔科夫模型在基因识别中的应用[J]. 佳木斯大学学报(自然科学版) 2009(06)
    • [9].基于改进隐马尔科夫模型的非侵入式家居负荷识别[J]. 电力建设 2020(04)
    • [10].改进初值∏隐马尔科夫模型预测电池健康度[J]. 哈尔滨理工大学学报 2017(06)
    • [11].广义隐马尔科夫模型在轴承温升预测中的应用[J]. 机械与电子 2013(06)
    • [12].关于非齐次隐马尔科夫模型的强极限定理[J]. 科学技术与工程 2009(02)
    • [13].基于改进的隐马尔科夫模型的网页新闻关键信息抽取[J]. 数据分析与知识发现 2019(03)
    • [14].基于变长隐马尔科夫模型的维基词条编辑微过程挖掘[J]. 成都信息工程大学学报 2018(01)
    • [15].基于隐马尔科夫模型的市场指数量化择时研究[J]. 厦门大学学报(自然科学版) 2018(03)
    • [16].基于粒子群优化的隐马尔科夫模型的复合攻击预测方法[J]. 通信电源技术 2015(03)
    • [17].基于主题隐马尔科夫模型的人体异常行为识别[J]. 计算机科学 2012(03)
    • [18].二阶隐马尔科夫模型的原理与实现[J]. 价值工程 2009(12)
    • [19].基于隐马尔科夫模型的石油钻井事故预警方法[J]. 郑州大学学报(工学版) 2018(04)
    • [20].基于多维高斯隐马尔科夫模型的驾驶员转向行为辨识方法[J]. 汽车技术 2011(07)
    • [21].动量策略收益尾部风险的实证研究——基于两状态隐马尔科夫模型[J]. 中国经济问题 2019(04)
    • [22].一种基于隐马尔科夫模型的步态识别算法[J]. 计算机科学 2016(07)
    • [23].基于双阶段并行隐马尔科夫模型的电力系统暂态稳定评估[J]. 中国电机工程学报 2013(10)
    • [24].半连续隐马尔科夫模型脱机阿拉伯手写识别[J]. 武汉理工大学学报(信息与管理工程版) 2011(03)
    • [25].隐马尔科夫模型修正的交互多模跟踪算法[J]. 现代雷达 2019(04)
    • [26].基于隐马尔科夫模型的中文术语识别研究[J]. 现代图书情报技术 2008(12)
    • [27].公共资源网络中资源滥用行为检测研究仿真[J]. 吉林大学学报(信息科学版) 2020(03)
    • [28].基于符号特征的隐马模型在WEB信息提取中的应用[J]. 计算机应用与软件 2009(05)
    • [29].基于多参数融合优化的隐马尔科夫模型的设计[J]. 现代计算机 2020(18)
    • [30].基于遗传算法的耦合隐马尔科夫模型的故障诊断方法[J]. 机械设计与制造 2018(12)

    标签:;  ;  ;  ;  ;  

    基于隐马尔科夫模型及反向传播神经网络的音效素材分类
    下载Doc文档

    猜你喜欢