文档图像分割论文_原亚珍

导读:本文包含了文档图像分割论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:图像,文档,水印,法文,文字,形态学,数字。

文档图像分割论文文献综述

原亚珍[1](2014)在《基于图像分割的文档图像水印算法的设计与实现》一文中研究指出当今社会,信息化的步伐日益加快,移动网络的发展将人类数字化的应用推向了一个新的高潮,以此带来的安全问题已变得岌岌可危。版权保护、防伪信息溯源仍是人类社会亟待解决的问题。目前,DRM技术作为一项成熟的技术对电子文档的安全问题起到了很好了保护作用,相对于电子文档,纸质文档的保护尚且处于初级探索阶段。尽管众多学者对文本水印算法做了大量研究,但大多数是针对排版单一的纯文本文档,对于版面复杂的文档水印算法却是凤毛麟角。因此,研究版面复杂的文档图像水印算法对水印技术的应用推广具有重大的现实意义。本文首先对数字水印的基本特征、基本框架等进行综述,并详细分析了在打印扫描过程中图像受到的失真和攻击,同时针对纯文本图像与自然图像的不同特点对其抵抗打印扫描的算法分别进行分析与介绍。接着对图像分割的基本概念和原理做出介绍,并对现有的基于区域、边缘以及基于特定理论的叁类图像分割算法详细介绍与分析。其次对连通域标记的基本概念以及常用的标记方法进行了研究分析,在原有算法需要多次扫描的基础上,一次扫描完成所有连通域的标记及合并,并对连通域特殊分叉情况进行分析。应用该算法,设计了基于复杂版面的文档图像的分割、去噪、单字切分算法。具体是,先用该法标记出所有的连通域,然后根据连通域的特性对文档图像进行分割、去噪,并结合汉字的构成原理进行单字切分。实验证明,该算法在文档图像上的应用效果良好。最后本文对基于打印扫描前后不变量的文本水印算法进行研究介绍,并深入分析了“不变量”的变化范围,对该算法进行扩充更好的实现了该算法的鲁棒性;实现了基于数据分类的DCT水印算法并对其进行深入研究和分析;提出了一种基于图像分割的文档图像水印算法设计,并对其进行实现。该设计主要先应用快速连通域算法将文档图像的文本部分与图像部分分别提取出来,然后利用不同的水印算法进行水印的添加或提取。实验证明,该算法设计可成功应用在复杂版面的文档图像上。(本文来源于《西安电子科技大学》期刊2014-12-01)

刘凌霞,牛红惠[2](2012)在《基于两级阈值的图像分割技术在文档图像中的应用》一文中研究指出研究图像二值化分割问题。针对模糊或者蜕化文档图像背景与文字融合在一起导致难以区分的难点,提出一种快速有效的两级结构图像分割算法。首先利用迭代算法对图像进行单一阈值分割,在每次迭代过程中以图像均值为依据,对图像进行均衡化处理;在基于全局分割的基础上,在局部范围内根据噪声的统计特性对文档图像进行去噪处理。方法简单高效,实验结果显示该方法能快速地将文档中的文字与背景进行分离,为后续的文档自动化处理提供准确有效的二值化图像。利用该方法,可以方便地拓展到其他类型的二值化处理系统中,例如车牌分割等。(本文来源于《计算机应用与软件》期刊2012年09期)

曲亮[3](2011)在《基于模块提取和二值化的文档图像分割方法》一文中研究指出随着计算机技术和通信技术的飞速发展,当今社会已经逐步步入到信息化时代。传统的记录信息,储存信息的载体(如纸张等)已经无法满足人们每天生活和工作中所产生的大量的文件和人们在通信过程中产生的大信息量。将这些文件转换成电子文档来进行通信和存储已经势在必行。现在人们主要使用OCR系统对这些信息进行电子录入,然而一些比较复杂的文档图像我们很难直接将信息准确的识别出来,需要对这样的文档进行一系列的处理后才能将其录入。这其中文档图像分割作为数字图像处理的一个重要部分成为了人们积极研究的热点。文档图像分割是处理文档文档图像过程中的重要研究课题它主要是介于文档图像的预处理和高级字符识别之间的重要一环。早在上个世纪80年代,很多的文献中都基于文档图像页面的复杂性提出了不同的处理方法。与别的领域不相同的是由于各种算法的基本理论不同,所采用的方法也都差别很大,大多数的方法都是针对某一类或者几种具有明显特征的文档页面进行分割处理,很难能够找到一种可以对所有类型的文档图像进行良好分割的方法。目前比较有效的和常用的对文档图像进行分割和分类的方法主要有阈值法,和几何分析方法等几大类。本文提出了一种基于二次模块提取和二值化方法将结合的文档图像分割方法。先通过两次的模块提取将复杂的文档图像页面中拥有独立背景灰度的模块都提取出来,然后根据这些模块内部的灰度值来确定它们独立的背景灰度值。其他的未被提取出的部分我们采用了一种经典的二值化方法Otsu全局阈值法来对其进行二值化处理。这种方法采用多种分割方法相结合的方式,在保证运行速度的同时大大提高了图像分割的准确度,得到的文档图像二值化的结果也很令人满意。为了验证这种方法,本文挑选了300张合适的文档图像进行了二值化的处理。将得到的结果和其他的方法进行了对比。结果表明本文提出的这种方法的准确度最高,速度快。尤其是在处理拥有复杂的页面结构的文档图像时,这种方法的优势非常明显。(本文来源于《吉林大学》期刊2011-04-01)

杨晓娟,宋凯[4](2009)在《基于投影法的文档图像分割算法》一文中研究指出提出了一种基于投影法的中文文档图像分割算法,从文档图像的投影出发,根据文档图像水平投影的统计特性,进行灰度值累加,找到每行文字所在坐标;根据文字的竖直投影形状特征,进行竖直方向上的分割,通过对字符图像的分割,实现对整篇文档的分割;对各种字体的文档图像的灰度图进行了试验.结果表明,该算法能够准确地对文档图像进行分割.(本文来源于《成都大学学报(自然科学版)》期刊2009年02期)

孙亮[5](2009)在《基于图论的文档图像分割应用研究》一文中研究指出随着信息技术的发展,文档图像在办公自动化、数字图书馆、网上阅卷、电子商务、电子政务等项目中获得广泛的应用。在这些应用中,纸质文档通常采用扫描方式形成数字化文档图像进行存储、传输、显示和打印。为了保证对文档图像的有效处理,对文档图像的分割研究显得尤为重要。论文分析了文档图像的特点,指出文档图像是由一些具有特定性质的区域块组合而成,通常包括文字块、线图、连续色调图像(真彩色图)和半色调图像(带调色板的图)。其中,文字和线图保存了图像较多的细节以及结构信息,具有较高的空间分辨率特征,这一部分区域对颜色分辨率的要求不高;而连续色调和半色调的图像则保存了较多的颜色信息,通常要求较高的颜色分辨率,但对空间分辨率的要求不高。也就是说文档图像大多数是由具有明显不同特征的部分组合而成,通常来说包含文本区域、线图区域和插图区域,而文本区域又包含文字的轮廓和文字的背景颜色,插图区域通常是高分辨率的彩色图像。这些区域不仅在逻辑意义上具有独立性,而且在颜色分辨率和空间分辨率上也具有明显不同的特性。这种图像特征明显却逻辑上具有独立性的文档图像更适合利用具有全局分割特性的分割方法去处理。基于图论的图像分割是近年来正处在发展中的一种新兴的图像分割技术。该技术具有全局分割特性。本文介绍和阐述了整合图像分割和图割理论的基本框架。一幅图像可以被映射成一个加权的无向图,其中像素点被当作图中的顶点,而相邻的像素之间的视觉性质(比如灰度级别,颜色或者纹理)的相似度当作相应的边的权值,于是图像的分割结果就可以通过对图的最小割方法来获得。具体研究了归一化方法。基于Ncut的图像分割方法有很多优点,能够给出具有全局特征分割结果,具有很好的数学理论背景,但是也隐藏了一些缺点。比如算法中涉及到特征方程的求解问题,计算量过打,不适合大幅图像的分割,为了使该方法具有实用性,本文使用自适应像素块映射为单一的节点,降低生成图的边和节点数目;修改邻域系统适应块结构,提高区域间邻近性和连续性,通过试验证明得到了可以接受的算法效率。为了提高计算速度,我们受到着名的多分辨率信号处理和金字塔型结构的启发,引入了一种用于图分割计算的多尺度计算方法。最后我们进行了几个数值实验,结果表明这种多尺度计算方法能够降低分割算法的运算时间,并且能够获得与传统分割方法近似相同的分割结果,特别是对于图像中所要分割目标在整个图中所占比例较小的情况,速度提高更为明显。(本文来源于《山东师范大学》期刊2009-06-02)

王佐林[6](2007)在《图像分割在文档图像处理中的应用》一文中研究指出文档图像在办公自动化、数字图书馆、电子商务、电子政务、教育等项目中已经广泛应用,在这些应用中,纸质文档通常采用扫描方式得到数字化文档图像进而进行存储和数据处理,纸质文档的信息化是提高数据管理效率、查询效率的重要途径之一。文档图像的处理一般包括:图像预处理、图像分割、图像识别。本文研究了文档图像的分割问题,将图像的文本块与自然图像分离,实现文本图像的行切分和字符切分。基于文档图像的纹理及结构特点,本文先对文档图像进行预处理,使用HOUGH变换检测、定位文档图像的行信息和倾斜角,进行图像的校正,然后使用连通域算法对图像中的目标进行标记,利用文档图像的结构特征和统计特征分割图像,获得纯文本区域,字符的分割使用了连通域、字符结构特征分析等方法,实验数据说明了本文算法的有效性和鲁棒性。本文的工作主要体现在以下几个方面:(1)对自然图像和纯文本文档图像的纹理特征进行了分析,通过量化指标说明文档图像与自然图像之间的差异性。(2)针对文档图像的特点,对文档图像的预处理进行了分析和比较,给出了图像预处理算法的流程图。(3)提出一种新的文档图像分割方法,使用图像的边缘连通域目标数的统计特征分割图像,给出了具体的实现算法。(4)字符分割使用了多种方法,具有更好的实用性。(5)指出本文算法的不足,提出改进建议,对进一步的研究进行了展望。(本文来源于《山东师范大学》期刊2007-10-18)

王婷[7](2007)在《图像分割技术在文档图像水印算法中的应用研究》一文中研究指出随着网络技术和多媒体技术的飞速发展,如何保护多媒体信息和数字产品安全的问题已经成为世界各国极为关注的重要课题。数字水印技术就是在这个背景下应运而生的,它可以有效地弥补传统信息加密方法的缺点。数字水印技术在认证、防伪、防篡改、保障数据安全和完整性等方面具有广泛的应用前景,所以引起了人们极大的关注。目前的数字水印技术发展得十分迅速,并且已经取得了大量的学术成果。电子文档相对于传统的纸张资料而言,具有易存储、检索、传输、易于更新等优点,其安全性保护也不容忽视。但是文档图像的结构各式各样,许多文档图像不仅包含文字部分,还有图片、图表等非文字部分。因此有必要对文档图像进行分割和分类,在文字区域和图像区域分别添加水印。本文以图像分割技术在文档图像水印算法中的应用为研究内容,主要做了以下工作:(1)介绍了数字水印的基本理论,从水印的生成、嵌入、提取、检测和攻击五个方面阐述水印系统的基本框架,对数字水印技术的分类、特点、典型算法和应用领域进行了详细的介绍。接着介绍了文档图像分割的基本理论,详细介绍了自顶向下的分割算法、自底向上的分割算法和纹理分割算法,并分析比较了各种算法的优劣。(2)分析了文档图像中文字区域和图像区域的特征。在空间域上,主要从灰度直方图、均值、方差、能量、熵五个统计特征进行分析;在频率域上,主要从DCT变换后的均值、标准差、均值的均值、标准差的标准差四个统计特征进行分析。通过以上分析,提出了分割后对不同区域分别添加水印的思想。(3)提出了一种文档图像分割算法。通过半色调化技术将灰度图像变换到二值图像,以加强图像区域灰度值,减弱文字区域灰度值,运用多尺度技术生成二值图像特征缩略图,以减小计算量,降低图像分析时的计算复杂度,减弱文字区域信息,再利用数学形态学的方法对特征图像进行处理,运用开启运算得到多尺度缩略图中的图像区域,运用闭合运算将图像区域的非连通区域进行填充,使得生成的图像区域比较完整,最后对应到原始图像中,实现了文档图像中文字区域和图像区域的分割。(4)实现了一种半脆弱DCT域水印算法。算法从低频带上生成水印信息,然后根据文档图像的不同区域,在中频带上选择不同嵌入位置的半脆弱DCT域水印算法,实验证明,分割算法能够将文档图像的文字区域和图像区域进行有效分割,水印图像的峰值信噪比有一定程度的提高,具有较好的抗压缩性,水印检测难度增加,并且可以对篡改进行检测和精确定位。算法还有很多需要改进的地方,相关工作还有待进一步研究。(本文来源于《山东师范大学》期刊2007-04-27)

付旻,黄祥林,高芸[8](2006)在《文档图像分割技术研究》一文中研究指出在文档图像分析处理中,分割技术十分必要。本文介绍了目前文档图像分割算法中常用的特征和方式,并对针中文文档图像给出了一种分割方法。该方法首先利用Sobel算子粗略检测出文字边缘区域,利用形态学膨胀方法扩展该区域,接着进行了两次颜色聚类分析,最后根据中文字符的特征进行了一系列启发式处理,很好地分割出了文字区域。(本文来源于《中国传媒大学学报(自然科学版)》期刊2006年04期)

付旻,高芸,黄祥林[9](2006)在《文档图像分割技术研究》一文中研究指出在文档图像分析处理中,分割技术十分必要。本文介绍了目前文档图像分割算法中常用的特征,并对针中文文档图像给出了一种分割方法。该方法首先利用Sobel算子粗略检测出文字边缘区域,利用形态学膨胀方法扩展该区域,接着进行了两次颜色聚类分析,最后根据中文字符的特征进行了一系列启发式处理,很好地分割出了文字区域。(本文来源于《计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)》期刊2006-07-01)

赵健,田泽,李镐炜,周明全[10](2004)在《基于小波的文档图像分割改进算法》一文中研究指出文档图像分割的研究对于打印、传真以及这样的数据处理工作具有十分重要的意义 .提出了一个文档图像分割的新算法 .分割算法的特征是基于根据文档图像中各种图像类型直方图的不同特性 .算法中重要的特征是通过小波图像来加强原始图像的特征 ,从而使得精确度提高(本文来源于《小型微型计算机系统》期刊2004年10期)

文档图像分割论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

研究图像二值化分割问题。针对模糊或者蜕化文档图像背景与文字融合在一起导致难以区分的难点,提出一种快速有效的两级结构图像分割算法。首先利用迭代算法对图像进行单一阈值分割,在每次迭代过程中以图像均值为依据,对图像进行均衡化处理;在基于全局分割的基础上,在局部范围内根据噪声的统计特性对文档图像进行去噪处理。方法简单高效,实验结果显示该方法能快速地将文档中的文字与背景进行分离,为后续的文档自动化处理提供准确有效的二值化图像。利用该方法,可以方便地拓展到其他类型的二值化处理系统中,例如车牌分割等。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

文档图像分割论文参考文献

[1].原亚珍.基于图像分割的文档图像水印算法的设计与实现[D].西安电子科技大学.2014

[2].刘凌霞,牛红惠.基于两级阈值的图像分割技术在文档图像中的应用[J].计算机应用与软件.2012

[3].曲亮.基于模块提取和二值化的文档图像分割方法[D].吉林大学.2011

[4].杨晓娟,宋凯.基于投影法的文档图像分割算法[J].成都大学学报(自然科学版).2009

[5].孙亮.基于图论的文档图像分割应用研究[D].山东师范大学.2009

[6].王佐林.图像分割在文档图像处理中的应用[D].山东师范大学.2007

[7].王婷.图像分割技术在文档图像水印算法中的应用研究[D].山东师范大学.2007

[8].付旻,黄祥林,高芸.文档图像分割技术研究[J].中国传媒大学学报(自然科学版).2006

[9].付旻,高芸,黄祥林.文档图像分割技术研究[C].计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册).2006

[10].赵健,田泽,李镐炜,周明全.基于小波的文档图像分割改进算法[J].小型微型计算机系统.2004

论文知识图

文档图像分割示意图文档图像分割结果图文档图像分割实例(报纸1)效果图3.3基于Ncut准则的文档图像分割文档图像分割流程图文档图像分割实例(有污渍图像)

标签:;  ;  ;  ;  ;  ;  ;  

文档图像分割论文_原亚珍
下载Doc文档

猜你喜欢