版面分析论文_邹志文

导读:本文包含了版面分析论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:版面,文档,表格,图像,藏文,蒙古文,卷积。

版面分析论文文献综述

邹志文[1](2019)在《图文混编图像的版面分析及识别研究》一文中研究指出现如今,越来越多的用户通过社交软件向好友分享存在图文混编版面的图像(下文简称“图文混编图像”),而图文混编图像存在庞杂的信息使得用户无法在短时间内获取重要信息。为了快速地帮助用户从图文混编图像中获取尽可能多的有效信息,本文提出了基于图文混编的版面分析算法。该算法不仅能够快速区分图文混编图像的文本标题区、文本正文区以及图像区。而且能够高效地识别文本标题区和图像区的内容,以较低的算法复杂度获取图文混编图像中重要信息。本文主要研究内容如下。(1)提出了融合轮廓投影的连通域版面分割算法。该算法在对图文混编图像进行图像预处理的基础上,首先基于八连通将整个图文混编图像进行单字区域扩充。然后根据轮廓投影后的灰度直方图中波形的规律性和周期性对不同区域进行大致划分。最后通过引入文本行(列)间隔阈值以及图文间隔阈值对各个连通区域进行合并,更加有效地区分文本标题区、文本正文区以及图像区。(2)提出了基于多级划分的单字识别算法。该算法对标题汉字采用36×36点阵归一化处理,首先对标题汉字进行粗划分,根据绝对值距离,从字典库7000个汉字中选出与标题汉字匹配的前m个汉字。然后对标题汉字进行细划分,根据欧氏距离,从m个汉字中选出匹配的前n(n<<m)个汉字。最后根据匹配度计算,完成最终匹配。通过对标题汉字进行粗划分和细划分降低了计算量,同时提高了算法的识别效率。(3)研究了基于局部特征的SIFT算法的图像匹配技术。首先构建图像尺度空间金字塔找出其极值点;然后对于找到的极值点进行筛选确定稳定的特征点;最后根据由特征点所表示的局部描述子对图像进行匹配和识别。本文将基于图文混编的版面分析算法移植到移动端,从而设计了移动端版面分析系统。该系统能够对图文混编图像版面进行分割,准确识别出标题区域和图像区域,并将识别结果通过手机移动端推送给用户。通过对算法实验和系统测试的分析,证明了算法的有效性和系统的实用性。图[22]表[8]参[63]。(本文来源于《安徽理工大学》期刊2019-06-04)

张昊玥[2](2019)在《非结构化文档的版面分析及表格提取》一文中研究指出现实生活中有大量的文档数据是以图像的形式存在的,如何将这些非结构化的图像数据进行结构化转换是对非结构化文档进行自动分析的初始步骤和关键技术。以此为目的,本论文采用基于改进的区域卷积神经网络(region-based convolutional neural network,R-CNN),即 Faster R-CNN 结构的深度学习网络模型并使用基于图像处理中投影计算的算法,对非结构化的文档图像进行了版面内容的自动分类与定位,并且对非结构化文档图像中的表格进行了识别、提取与转换,实现了对非结构化文档图像完成结构化转换的目的。本论文的主要内容包括非结构化文档图像的版面分析和文档图像中表格识别两部分。具体工作内容如下:在非结构化文档图像的版面分析部分,先对非结构化的文档进行半结构化图片的转换,再对转换了的图片进行投影计算,使用图像处理算法和模式识别方法对图片中的各版面组成部分进行分类和初步定位。对于图像处理后的结果不确定的情况,再采用Faster R-CNN的方法进行判断并得出结论,进而实现非结构化文档版面的结构化。这种方法在有效控制计算量的同时也降低了对深度学习所需要的数据集规模的要求,能够准确地对版面结构进行分类并精确定位非结构化文档中的表格部分。在非结构化文档的表格识别部分,着重对图像中出现的噪声影响严重、表格倾斜及有遮挡情况进行了处理,并对非结构化文档中提取出的表格进行类型细化,对全线表格、纯横线表格、色彩相间表格以及无线表格分别进行处理和算法设计,具体问题具体分析,使得表格结构识别的精度更高。最后对识别后表格中的每一个单元格进行切分,分别进行字符识别,完成Excel格式下表格内容的结构化复现。采用平均精度均值(Mean Average Precision,mAP)为指标,衡量了 Faster R-CNN网络对非结构化文档的分类及定位效果,并通过对表格识别算法的识别及转换率(识别并转换完成的表格数量与实验总样本数量的比值)的统计,对表格识别算法的效果进行的评估。本论文中所采取方法所得到的结果中mAP指数为71.3%,表格的识别转换率总体为81%。经过研究,本论文实现了对较常见非结构化文档版面内容的分类和定位功能;同时实现了将非结构化文档版面中表格部分的识别、提取以及复现为Excel格式表格的功能。测试结果表明,论文实现的方法能够比较准确地完成非结构化文档中文字、图片和表格的识别和定位功能;同时能够比较准确地将非结构化的表格复现为Excel格式的电子表格,为非结构化文档的进一步自动化处理奠定了良好的基础。(本文来源于《北京交通大学》期刊2019-06-03)

陈璇,贺建军,李厚杰,武林秀[3](2019)在《基于Mask R-CNN的满文文档版面分析》一文中研究指出提出一种基于Mask R-CNN深度学习框架的满文文档版面分析方法,将满文文档版面分析问题转化为基于深度学习的图像实例分割问题。使用ResNet101网络和FPN网络构成的卷积神经网络自动提取满文文档图像特征,特征图经过RPN网络和RoI Align层生成新的特征图。新特征图经过全连接层完成感兴趣区域的类别和边框预测,并经过全卷积神经网络对感兴趣区域的像素进行分类得到mask预测,最终实现满文文档图像的实例分割。通过《新满汉大辞典》的文档图像构建了满文文档图像数据集,算法在该满文文档图像数据集上进行了实验。实验结果表明,本算法在满文文档版面分析中取得了较好的检测和分割效果。(本文来源于《大连民族大学学报》期刊2019年03期)

刘亚楠[4](2019)在《《内蒙古日报》“两会特别报道”版面分析》一文中研究指出作为重要政治活动的全国两会向来都是各大媒体争相报道的热点,两会期间,《内蒙古日报》发布两会特别报道"奋斗中的内蒙古",为我区受众全面解读两会内容,传递两会声音。本文从版面内容、表达艺术以及版面编排几方面入手,对两会特别报道版面进行分析,探究其版面编排特点和报道亮点内容,并对此加以解析。(本文来源于《品位经典》期刊2019年03期)

张西群,马龙龙,段立娟,刘泽宇,吴健[5](2018)在《基于卷积降噪自编码器的藏文历史文献版面分析方法》一文中研究指出近年来,随着人们对历史和传统文化的保护和传承越来越重视,研究人员对历史文献数字化的兴趣也越来越高涨。版面分析是历史文献数字化的重要基础步骤,该文提出了一种基于卷积降噪自编码器的藏文历史文献版面分析方法。首先,将藏文历史文献图像进行超像素聚类获得超像素块;然后,利用卷积降噪自编码器提取超像素块的特征;最后,使用SVM分类器对藏文历史文献的超像素块进行分类预测,从而提取出藏文历史文献版面的各个部分。在藏文历史文献数据集上的实验表明,该方法能够对藏文历史文献的不同版面元素进行有效的分离。(本文来源于《中文信息学报》期刊2018年07期)

许博臣[6](2018)在《基于机器学习的复杂版面分析技术研究》一文中研究指出目前,OCR技术对简单版面的分析已经解决并得到了一定的普及,然而随着信息时代的到来,文本图像的版面已经不再是简单的文字和图形的组合,而是涵盖了文本、表格、图形和图像等多种内容,它是一种更加综合的形式,OCR对这种繁杂的版面识别效果不是很好,甚至无法进行有效地分析。因此,进行OCR识别前须对复杂版面进行有效地分析。传统的版面分析方法如:连通域法、投影法等已变得愈发不实用,运行时间过长、分析准确性不高,无法满足用户的需求;近年来,模式识别和机器学习中的许多方法运用到了版面分析中,支持向量机(SVM)便是其中一个,在结构风险最小化原则的基础上,运用核函数技术使低维到高维空间的非线性映射得以实现,其结构风险最小化原则避免了过拟合现象,提高了学习机的泛化能力,能够有效的处理复杂版面。本文针对报纸、科技论文、网页等具有复杂版面的图像,提出了一种基于机器学习的复杂版面分析方法,主要内容如下:1.从图像的关键特征入手,选择了图像的灰度、形状、纹理及相位一致性统计特征,并针对纹理特征中的灰度共生矩阵(GLCM)算法进行了深入的研究,结合和差统计法对其进行改进。通过后续的训练和测试证明,该方法能减少特征提取的计算时间和存储空间,并可达到良好的版面分析效果。2.针对复杂背景下的版面分割,选用支持向量机(SVM)和BP神经网络两种方法对图像中的文本区域进行了分割提取工作,并根据实验结果进行了对比与分析。3.在对分割后的版面进行分类的过程中,详细研究了支持向量机(SVM)实现多分类的方法,并针对其中存在的不可分区域问题,提出了一种基于距离测度的改进方法。经过测试,改进后的方法能够进一步提升版面分类的准确性。实验表明,本文采用的方法能够针对具有复杂版面的图像进行有效的版面分析,且其具有速度快、分析准的特点,有一定的应用前景。(本文来源于《北方工业大学》期刊2018-05-31)

朱健菲[7](2018)在《档案图像版面分析与字符提取方法研究》一文中研究指出基于图像处理技术的文档数字化重构是模式识别研究的一个重要领域。将纸质档案原件影像化,通过图像处理、字符识别等技术实现文档的版面分析与版面理解并最终实现文档版面数字化重构,转化为数字化的文档资源并以双层PDF文档、Word文档等形式呈现,以互联网为媒介服务大众,极大地便利了档案资料的检索、查阅、保存与传播等工作。版面分析与字符提取是文档数字化重构的重要基础步骤,尤其是在这个追求个性与创造的时代,文档版面的排版结构越来越复杂,图片、文字、表格等元素甚至印刷体与手写体的混合排版对版面分析与字符提取带来了很大的挑战,异构文档图像版面分析的任务是实现版面多种组合元素的分解,将复杂的版面同构化为同质化的单一区域,进而通过字符提取、字符识别实现文档版面理解,进而实现版面重构。针对文档图像版面分析与字符提取问题,本文的主要研究工作体现在以下两个方面:(1)基于深度迁移学习的文档版面目标检测研究。由于文档图像版面中公式、表格、插图等基本图像单元排版的无序性与多样性,传统的版面分析方法针对不同的文档图像往往需要不同的处理策略,并且文档版面区域的定位与分类模块完全独立,不仅导致系统的冗余还严重限制了系统的通用性。为了更好的实现文档版面的区域定位与分类,同时克服文档图像标注样本数据不足的缺陷,提出了一种基于深度迁移学习的文档版面目标检测方法。由于在自然场景的语义理解方面具有大量的标注数据集来做深度学习的研究支撑,本文采用迁移学习的方式将自然场景下的目标检测模型迁移到文档版面目标即公式、插图、表格的检测任务上。在一个网络框架下同时实现了文档版面多种目标的检测与界限框的定位,提高了系统的通用性,实验结果表明该算法具有较高的准确率,不仅实现了文档图像版面区域的识别还实现了版面目标的精确定位。(2)无约束书写条件下的手写文本行提取算法研究。在没有基准线与界限框约束的条件下,自由书写的文本行都会有不同程度的倾斜、弯曲、交叉、粘连等问题。传统的文本块几何线分割或超像素聚类的方法一般都无法保证文本行边缘字符笔画的精确分割。针对这些问题提出了一种改进的方案,文本行回归-聚类联合框架。首先,利用拖尾效应提取文本行主体区域,并结合形态学处理对其骨架化得到文本行回归模型。然后,建立了像素-超像素-文本行关联层级随机场模型,利用能量函数优化的方法实现字符连通域的聚类,并分配所属文本行标签。在此基础上,检测出所有的行间粘连字符块,采用基于回归线的k-means聚类算法由回归模型引导粘连字符像素聚类,实现粘连字符分割与所属文本行标注。最后,利用文本行标签开关实现了文本行像素的操控显示与定向提取,而不再需要几何分割。实验表明,提出的文本行回归-聚类联合分析框架相比于传统的分段投影分析、最小生成树聚类、Seam Carving等方法提高了文本行边缘的可控性与分割精度。在高效手写文本行提取的同时,最大程度地避免了相邻文本行的干扰,具有较高的准确率和鲁棒性。(本文来源于《五邑大学》期刊2018-05-01)

王艳文[8](2017)在《蒙古文文档图像版面分析及识别后处理的研究与实现》一文中研究指出光学字符识别(Optical Character Recognition,简称OCR)技术的研究在近年来得到了飞速发展,中文、英文等文字识别技术的研究已经取得了显着的成果。文字识别率是OCR系统中最重要的一个性能指标,对于印刷体蒙古文字识别系统来说,要想完善整个系统,提高蒙古文字的识别率,就要对蒙古文文档图像在识别前期的版面分析技术和后期的识别后处理技术进行研究和实现。因此,本文的主要研究内容包括两个部分,一个是蒙古文文档图像的版面分析,另一个是蒙古文字识别后处理。在印刷体蒙古文字识别过程中,版面分析是一个很重要的基础工作,而目前对蒙古文文档图像的版面分析研究较少,蒙古文文档图像的版面形式多种多样,且存在文字、图片、表格等多种版面元素混排的情况,这些都给印刷体蒙古文字识别工作带来诸多困难。本文采用自底向上和自顶向下相结合的版面分析法,通过标记连通域、合并连通域、去除连通域等相关流程,将非文字部分去除,只保留文字部分。之后再经过段落划分,获得各段落的位置信息,这些位置信息可供后续版面恢复使用。在蒙古文字识别系统中,文档图像经过切分和识别得到的识别结果是蒙古文字形编码,目前常用的为国际标准编码,因此要对识别结果进行编码转换,本文所关注的后处理是将字形识别结果转换为国际标准编码的过程。文中所采用的是基于对照词典的编码转换方式,首先需要将已有的国际标准码词典(涵盖了目前常用的50553个蒙古文单词)依次转换为WORD文档、PDF文件,最后转换为图片并进行版面分析和列切分、字切分以及字元切分,将经过切分得到的蒙古文字元图像作为训练好的卷积神经网络分类器的输入,输出即为蒙古文字形编码,利用已有的国际标准码词典与获取到的字形编码按照一一对应的关系整理成编码转换词典。进行后处理时在整理好的词典中查找与识别结果相同的字形编码的位置,即可在词典中找到该字形编码相对应的国际标准码,完成编码转换过程。本文研究的蒙古文文档图像版面分析技术,能够对多种复杂版面格式的蒙古文文档图像进行处理,包括去除非文字部分、将文字区域划分段落并标记段落位置等,在一定数量的样本集上进行测试,版面分析准确率达到了 97.87%。本文研究的识别后处理,能够快速、有效、准确的将蒙古文字形编码识别结果转换为国际标准码,使得印刷体蒙古文字识别系统更加完善。(本文来源于《内蒙古大学》期刊2017-06-09)

段露,宋永红,张元林[9](2017)在《一种面向问卷图像的版面分析算法》一文中研究指出针对目前已有的问卷图像版面分析算法无法自动识别信息填写区域和无法处理无固定格式的问卷图像等问题,提出了一种连通区域和神经网络相结合的问卷图像版面分析算法.首先获得扫描得到的问卷图像的中心有效图形,接着提出并应用了一种针对问卷图像的快速倾斜矫正方法,对中心有效图像进行倾斜矫正;再利用水平投影进行行分割得到问卷行;然后提取每个问卷行的首个连通区域判断是否存在表格区域即表格问卷行,若存在表格问卷行,则对其进行表格区域分布分析和表格类型判断,得到可能的答案区域,否则直接对文本问卷行进行分析,得到可能的答案区域;最后利用神经网络判断筛选区域的类型,得到最终的答案填写区域.针对问卷图像的实验结果表明,该算法可以准确地识别各种问卷图像中的信息填写区域.(本文来源于《软件学报》期刊2017年02期)

李涛[10](2016)在《图文分解的版面分析技术》一文中研究指出版面分析技术集合了模式识别理论应用和图像处理技术,它作为OCR的一个局部应用领域在整个系统中占据重要地位,它首先将一个具体的版面图像视为模式识别对象,从而运用模式识别的方法和图像处理技术对在版面识别过程中出现问题提出有效的解决手段。(本文来源于《科技经济导刊》期刊2016年26期)

版面分析论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

现实生活中有大量的文档数据是以图像的形式存在的,如何将这些非结构化的图像数据进行结构化转换是对非结构化文档进行自动分析的初始步骤和关键技术。以此为目的,本论文采用基于改进的区域卷积神经网络(region-based convolutional neural network,R-CNN),即 Faster R-CNN 结构的深度学习网络模型并使用基于图像处理中投影计算的算法,对非结构化的文档图像进行了版面内容的自动分类与定位,并且对非结构化文档图像中的表格进行了识别、提取与转换,实现了对非结构化文档图像完成结构化转换的目的。本论文的主要内容包括非结构化文档图像的版面分析和文档图像中表格识别两部分。具体工作内容如下:在非结构化文档图像的版面分析部分,先对非结构化的文档进行半结构化图片的转换,再对转换了的图片进行投影计算,使用图像处理算法和模式识别方法对图片中的各版面组成部分进行分类和初步定位。对于图像处理后的结果不确定的情况,再采用Faster R-CNN的方法进行判断并得出结论,进而实现非结构化文档版面的结构化。这种方法在有效控制计算量的同时也降低了对深度学习所需要的数据集规模的要求,能够准确地对版面结构进行分类并精确定位非结构化文档中的表格部分。在非结构化文档的表格识别部分,着重对图像中出现的噪声影响严重、表格倾斜及有遮挡情况进行了处理,并对非结构化文档中提取出的表格进行类型细化,对全线表格、纯横线表格、色彩相间表格以及无线表格分别进行处理和算法设计,具体问题具体分析,使得表格结构识别的精度更高。最后对识别后表格中的每一个单元格进行切分,分别进行字符识别,完成Excel格式下表格内容的结构化复现。采用平均精度均值(Mean Average Precision,mAP)为指标,衡量了 Faster R-CNN网络对非结构化文档的分类及定位效果,并通过对表格识别算法的识别及转换率(识别并转换完成的表格数量与实验总样本数量的比值)的统计,对表格识别算法的效果进行的评估。本论文中所采取方法所得到的结果中mAP指数为71.3%,表格的识别转换率总体为81%。经过研究,本论文实现了对较常见非结构化文档版面内容的分类和定位功能;同时实现了将非结构化文档版面中表格部分的识别、提取以及复现为Excel格式表格的功能。测试结果表明,论文实现的方法能够比较准确地完成非结构化文档中文字、图片和表格的识别和定位功能;同时能够比较准确地将非结构化的表格复现为Excel格式的电子表格,为非结构化文档的进一步自动化处理奠定了良好的基础。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

版面分析论文参考文献

[1].邹志文.图文混编图像的版面分析及识别研究[D].安徽理工大学.2019

[2].张昊玥.非结构化文档的版面分析及表格提取[D].北京交通大学.2019

[3].陈璇,贺建军,李厚杰,武林秀.基于MaskR-CNN的满文文档版面分析[J].大连民族大学学报.2019

[4].刘亚楠.《内蒙古日报》“两会特别报道”版面分析[J].品位经典.2019

[5].张西群,马龙龙,段立娟,刘泽宇,吴健.基于卷积降噪自编码器的藏文历史文献版面分析方法[J].中文信息学报.2018

[6].许博臣.基于机器学习的复杂版面分析技术研究[D].北方工业大学.2018

[7].朱健菲.档案图像版面分析与字符提取方法研究[D].五邑大学.2018

[8].王艳文.蒙古文文档图像版面分析及识别后处理的研究与实现[D].内蒙古大学.2017

[9].段露,宋永红,张元林.一种面向问卷图像的版面分析算法[J].软件学报.2017

[10].李涛.图文分解的版面分析技术[J].科技经济导刊.2016

论文知识图

古籍图像自动版面分析处理流程21《版式设计》(P40-41)版面及...版面分析效果对比版面分析模块的效果图名片版面分析和理解的结果待版面分析的文档图像

标签:;  ;  ;  ;  ;  ;  ;  

版面分析论文_邹志文
下载Doc文档

猜你喜欢