论文摘要
民航陆空通话对民航飞行安全十分重要,但因其通话模式有特殊的语法结构与发音方式,日常语音识别声学模型无法有效应用于民航陆空通话的语音处理问题。针对民航陆空通话的特殊语境,本文提出了基于双向长短时记忆网络(BiLSTM)的民航陆空通话语音识别方法。首先,提取民航陆空通话语音的FBANK特征作为输入,以时序链式连接(CTC)为目标函数,训练BiLSTM网络得到BiLSTM/CTC模型。然后,利用声学模型,语言模型与陆空通话词典实现民航陆空通话的语音识别,并结合数据增强与数据迁移对模型进行增强训练提高语音识别性能。实验结果表明本文提出的方法适用于民航陆空通话语音识别,并且数据增强模型可有效降低民航陆空通话语音识别的词错误率。
论文目录
文章来源
类型: 期刊论文
作者: 邱意,贾桂敏,杨金锋,刘远庆
关键词: 民航陆空通话,语音识别,双向长短时记忆网络,数据增强,数据迁移
来源: 信号处理 2019年02期
年度: 2019
分类: 信息科技,工程科技Ⅱ辑
专业: 航空航天科学与工程,电信技术
单位: 中国民航大学天津市智能信号与图像处理重点实验室
基金: 国家自然科学基金(U1433120,61502498),中央高校基本科研业务费资助项目(ZYGX2018042)
分类号: TN912.34;V355.1
DOI: 10.16798/j.issn.1003-0530.2019.02.015
页码: 293-300
总页数: 8
文件大小: 520K
下载量: 185
相关论文文献
标签:民航陆空通话论文; 语音识别论文; 双向长短时记忆网络论文; 数据增强论文; 数据迁移论文;