复杂场景下的水表示数检测与识别

复杂场景下的水表示数检测与识别

论文摘要

目前自然场景下水表示数的统计工作由人工完成,但在大工作量的情况下人工统计容易出现统计错误和遗漏的情况,而且这一过程繁琐,耗时耗力。针对这种情况,提出一种基于深度学习的数字识别与检测算法。首先,使用旋转区域卷积神经网络(R2CNN)检测出文本框;然后,对该文本框区域使用基于注意机制(Attention)的文本识别算法预测出最终结果;最终,通过对不同深度的卷积神经网络(CNN)的速度和准确度进行对比,使用了一种准确有效的配置。结果显示训练好的网络模型可以应用于自然环境下的水表示数检测,能够达到实时检测的效果,并且优于其他检测识别算法的效果。不同数据下的结果验证了算法的有效性和鲁棒性。

论文目录

  • 0 引言
  • 1 相关研究
  •   1.1 文本检测
  •   1.2 文本识别
  •   1.3 端到端文本识别
  • 2 文本检测
  •   2.1 文本区域
  •   2.2 旋转区域卷积神经网络
  •     2.2.1 提出文本框
  •     2.2.2 特征图池化
  •     2.2.3 非极大抑制
  •     2.2.4 损失函数
  • 3 文本识别
  •   3.1 特征提取
  •   3.2 RNN
  •   3.3 注意机制
  •   3.4 训练
  • 4 算法评估与分析
  •   4.1 训练数据
  •   4.2 检测效果
  •   4.3 识别准确度
  • 5 结语
  • 文章来源

    类型: 期刊论文

    作者: 康鑫,孙晓刚,万磊

    关键词: 文本检测,文本识别,深度学习,旋转区域卷积神经网络,注意机制

    来源: 计算机应用 2019年S2期

    年度: 2019

    分类: 信息科技

    专业: 计算机软件及计算机应用,自动化技术

    单位: 中国科学院成都计算机应用研究所,中国科学院大学

    基金: 四川省重点研发计划项目(2018GZ0231)

    分类号: TP391.1;TP183

    页码: 63-67

    总页数: 5

    文件大小: 1177K

    下载量: 127

    相关论文文献

    标签:;  ;  ;  ;  ;  

    复杂场景下的水表示数检测与识别
    下载Doc文档

    猜你喜欢