基于特征金字塔的场景文本检测

基于特征金字塔的场景文本检测

论文摘要

自然场景文本检测是从自然场景中检测出文本所在的位置,检测结果的好坏将直接影响后续的文本识别效果,在图像检索、自动驾驶等领域具有重要应用。提出CNN与RNN联合的自然场景文本检测方法。首先,采用CNN提取图片中多尺度特征并构建FPN;其次,为充分利用文本的序列特性,采用Bi-LSTM编码特征并输出一系列文本提议;最后,通过多向文本连接器连接生成的文本提议,实现多尺度、多方向的文本检测。通过在ICDAR2013、ICDAR2015以及USTB-SV1K数据集上进行测试,实验结果证明该算法在精确度和召回率上具有优势。

论文目录

  • 0 引言
  • 1 理论基础
  • 2 研究方法
  •   2.1 特征提取
  •   2.2 RNN编码
  •   2.3 文本连接器
  •   2.4 多任务损失
  • 3 实验
  •   3.1 数据集
  •   3.2 评估标准
  •   3.3 实验结果
  • 4 结束语
  • 文章来源

    类型: 期刊论文

    作者: 常宇飞,陈欣鹏,王远航,钱冰

    关键词: 场景文本检测,卷积神经网络,递归神经网络,特征金字塔

    来源: 信息工程大学学报 2019年05期

    年度: 2019

    分类: 信息科技

    专业: 计算机软件及计算机应用,自动化技术

    单位: 华南理工大学计算机科学与工程学院,陆军炮兵防空兵学院(士官学校),陆军炮兵防空兵学院(郑州校区)

    分类号: TP391.41;TP183

    页码: 622-628

    总页数: 7

    文件大小: 1812K

    下载量: 23

    相关论文文献

    标签:;  ;  ;  ;  

    基于特征金字塔的场景文本检测
    下载Doc文档

    猜你喜欢