民航陆空通话语音识别BiLSTM网络模型

民航陆空通话语音识别BiLSTM网络模型

论文摘要

民航陆空通话对民航飞行安全十分重要,但因其通话模式有特殊的语法结构与发音方式,日常语音识别声学模型无法有效应用于民航陆空通话的语音处理问题。针对民航陆空通话的特殊语境,本文提出了基于双向长短时记忆网络(BiLSTM)的民航陆空通话语音识别方法。首先,提取民航陆空通话语音的FBANK特征作为输入,以时序链式连接(CTC)为目标函数,训练BiLSTM网络得到BiLSTM/CTC模型。然后,利用声学模型,语言模型与陆空通话词典实现民航陆空通话的语音识别,并结合数据增强与数据迁移对模型进行增强训练提高语音识别性能。实验结果表明本文提出的方法适用于民航陆空通话语音识别,并且数据增强模型可有效降低民航陆空通话语音识别的词错误率。

论文目录

  • 1 引言
  • 2 LSTM的基本原理
  • 3 基于BiLSTM/CTC的民航陆空通话声学模型
  •   3.1 陆空通话语音特征提取
  •   3.2 BiLSTM网络
  •   3.3 时序链式连接
  •   3.4 声学模型训练
  • 4 实验与分析
  •   4.1 民航陆空通话语料库
  •   4.2 语音特征实验
  •   4.3 声学模型实验
  •   4.4 模型训练及实验结果
  • 5 结论
  • 文章来源

    类型: 期刊论文

    作者: 邱意,贾桂敏,杨金锋,刘远庆

    关键词: 民航陆空通话,语音识别,双向长短时记忆网络,数据增强,数据迁移

    来源: 信号处理 2019年02期

    年度: 2019

    分类: 信息科技,工程科技Ⅱ辑

    专业: 航空航天科学与工程,电信技术

    单位: 中国民航大学天津市智能信号与图像处理重点实验室

    基金: 国家自然科学基金(U1433120,61502498),中央高校基本科研业务费资助项目(ZYGX2018042)

    分类号: TN912.34;V355.1

    DOI: 10.16798/j.issn.1003-0530.2019.02.015

    页码: 293-300

    总页数: 8

    文件大小: 520K

    下载量: 185

    相关论文文献

    标签:;  ;  ;  ;  ;  

    民航陆空通话语音识别BiLSTM网络模型
    下载Doc文档

    猜你喜欢