论文摘要
[目的]本文对语音识别系统的主流技术框架及主要挑战进行了系统而全面的介绍,为语音识别领域的进一步技术研究提供参考。[方法]首先,介绍了端到端语音识别框架的主流方案;然后,提出了语音识别应用中的四大挑战性问题,即恶劣场景的识别问题、中英文混合识别问题、专业术语的识别问题以及低资源小语种识别问题。[结果]针对端到端框架稳定性不足的问题,提出了带有强化和过滤注意力机制的改进方案。针对语音识别中的挑战性难题,探讨了主流的解决方案及未来的发展方向。[结论]端到端框架的大规模商用仍存在较大挑战,四大挑战性问题的解决将对语音识别的行业应用推广起到关键的作用。
论文目录
文章来源
类型: 期刊论文
作者: 刘庆峰,高建清,万根顺
关键词: 语音识别,端到端,远场识别,中英文混合,专业术语
来源: 数据与计算发展前沿 2019年06期
年度: 2019
分类: 信息科技
专业: 电信技术
单位: 科大讯飞股份有限公司
分类号: TN912.34
页码: 26-36
总页数: 11
文件大小: 1120K
下载量: 107