自然场景文本检测是从自然场景中检测出文本所在的位置,检测结果的好坏将直接影响后续的文本识别效果,在图像检索、自动驾驶等领域具有重要应用。提出CNN与RNN联合的自然场景文本检测方法。首先,采用CNN提取图片中多尺度特征并构建FPN;其次,为充分利用文本的序列特性,采用Bi-LSTM编码特征并输出一系列文本提议;最后,通过多向文本连接器连接生成的文本提议,实现多尺度、多方向的文本检测。通过在ICDAR2013、ICDAR2015以及USTB-SV1K数据集上进行测试,实验结果证明该算法在精确度和召回率上具有优势。
类型: 期刊论文
作者: 常宇飞,陈欣鹏,王远航,钱冰
关键词: 场景文本检测,卷积神经网络,递归神经网络,特征金字塔
来源: 信息工程大学学报 2019年05期
年度: 2019
分类: 信息科技
专业: 计算机软件及计算机应用,自动化技术
单位: 华南理工大学计算机科学与工程学院,陆军炮兵防空兵学院(士官学校),陆军炮兵防空兵学院(郑州校区)
分类号: TP391.41;TP183
页码: 622-628
总页数: 7
文件大小: 1812K
下载量: 23
本文来源: https://www.lunwen66.cn/article/53f0ef5dc83373bb10c99342.html