手写汉字提取论文_刘妍

导读:本文包含了手写汉字提取论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:汉字,特征,手写体,笔迹,神经网络,笔划,表征。

手写汉字提取论文文献综述

刘妍[1](2014)在《基于Gabor双弹性网格特征提取的手写体汉字识别的研究》一文中研究指出随着科技水平的不断提高,脱机手写体汉字识别技术已经成为各行业中广泛使用的技术之一。由于汉字都是由“横”、“竖”、“撇”和“捺”4种笔画构成的,所以如何准确、迅速地识别出汉字的笔画特征,成为了手写体汉字识别的研究难点。特征提取方法是汉字识别中的最为关键的环节之一。有效的特征提取方法可以快速、准确地识别出汉字的笔画特征。本文研究的主要内容如下:1.对手写体汉字的样本进行采集,然后介绍了几种常用的图像预处理的方法。通过对手写体汉字图像进行预处理,使汉字图像变得更加容易被识别。2.手写体汉字的特征提取。本文介绍了几种常用的针对汉字识别的特征提取方法。针对Gabor变换提取手写体汉字图像的特征能够抑制汉字的噪声、模糊等图像干扰,但是不能有效地识别因书写方式不同而出现文字变形的汉字图像的这种情况,本文将双弹性网格技术和改进的Gabor特征提取法结合起来,提出一种基于Gabor的双弹性网格特征提取方法。该方法首先对手写体汉字图像进行子图像分解,划分成“横”、“竖”、“撇”、“捺”4个子图像;然后运用双弹性网格技术及设置了最优参数的Gabor滤波器组对子图像进行特征提取。通过实验表明,该方法与其它特征提取法相比,计算量明显减少,识别速度显着提高。说明这种方法能够有效地避免文字变形和噪声等问题,有效地提高了识别率。3.手写体汉字的分类识别。主要介绍了常见的几种分类方法,分别介绍了最近邻(KNN)分类法、朴素贝叶斯分类法、支持向量机(SVM)和BP神经网络分类方法。再通过对比实验分析这几种分类方法的有效性。4.手写体汉字识别实验结果及分析。采用几种常见的特征提取方法和分类识别方法分别对手写体汉字进行对比实验,并分析实验结果。实验结果表明本文提出的基于Gabor的双弹性网格特征提取算法具有有效性,并且在使用BP神经网络分类器进行分类识别时,识别的正确率最高。(本文来源于《河北工业大学》期刊2014-11-01)

刘慧[2](2014)在《基于模糊划分的脱机手写汉字笔画特征提取方法》一文中研究指出脱机手写汉字识别是文字识别领域的一项重要研究内容,特征提取对识别有着至关重要的作用,本文设计了一种基于模糊划分的脱机手写汉字笔画特征提取方法。首先,采用先提取汉字基本笔画,再对其进行细化的思想,用模糊游程算法来提取汉字横、竖、撇、捺四个方向的基本笔画,并对汉字笔画进行修正和细化处理,用于后续特征提取;其次,对汉字笔画进行特征提取,主要提取汉字笔画端点、中点、长度、倾斜度等基本特征,并引入模糊理论进行汉字模糊位置判定,按照相交关系得到笔画的交点信息;最后,整合笔画结构特征进行汉字结构判别和相似字区分,主要针对汉字的横竖笔画进行处理,利用模糊判定规则,将汉字分为上下、左右、独体和包围四种结构;并设计了一种基于笔画特征的相似字区分算法,先分析相似字成因,再结合汉字结构特征识别相似字。实验结果表明了本文特征提取方法的有效性。(本文来源于《河北大学》期刊2014-05-01)

宁博[3](2013)在《手写体汉字识别实验平台及笔划网格特征提取方法的研究》一文中研究指出脱机手写体汉字识别研究是一个涉及多种学科的课题。手写体汉字的数量巨大、类别繁多、结构复杂、以及书写风格差异性等特点,使其在模式识别广阔的研究领域中,成为一个极其富有挑战性的课题。建立一个统一的脱机手写体汉字识别实验平台是对手写体汉字识别研究方法进行客观分析、评价的重要方式和手段。本文设计和构建了一个脱机手写体汉字识别实验平台。并在实验平台基础上对汉字识别相关算法进行了深入的研究。研究的主要内容如下:1.手写体汉字识别的实验平台。首先对手写体汉字样本库进行了研究,介绍了样张的设计和采集,样本库构建流程以及样本信息的组织方式,构建了一个标准的手写体汉字样本字库。接着介绍了汉字常用的预处理技术。最后重点介绍了本文手写体汉字识别实验平台的系统架构,实验平台功能模块的设计。2.手写体汉字的特征提取。汉字的特征提取方法主要可以分为两类:基于统计特征、基于结构特征的提取方法。本文主要研究并在实验平台上编程实现了汉字识别中几种常用的特征提取算法。在此基础上,将笔划密度函数的定义扩展到对角方向上,构成对角方向网格,提出了一种新的基于笔划密度函数的双弹性网格方法,此方法不仅考虑到汉字的笔划结构中“撇”、“捺”笔划的书写特性,而且通过构造对角弹性网格技术弥补了纵横网格技术的不足之处。3.手写体汉字的分类识别。首先介绍了汉字分类中的一些典型的分类方法,如最近邻(KNN)分类法、贝叶斯(Bayes)判别分类法、支持向量机(SVM)和BP神经网络分类方法。同时介绍了AdaBoost算法的相关知识。接着,深入研究了用于手写体汉字分类的基于BP神经网络的AdaBoost方法。最后,在汉字实验平台的基础之上,对比了不同分类器的实验结果,验证了该方法的有效性。4.汉字识别实验平台的系统实现和识别实验结果及分析。首先介绍了汉字实验平台的系统实现。接着,对手写体汉字实验平台的性能进行测试,对比了构造样本集所用的时间,验证了本文构造的脱机手写体汉字识别实验平台的实用性和高效性。然后基于实验平台,对多种特征提取方法和分类识别方法,进行汉字识别实验并分析实验结果。验证了本文提出的基于笔划密度函数的双弹性网格算法的合理性和有效性。(本文来源于《河北工业大学》期刊2013-12-01)

陈睿,唐雁[4](2013)在《基于关键词提取的手写汉字文本依存笔迹鉴别技术》一文中研究指出针对文本独立笔迹鉴别技术中需要大篇幅文档以提取图像纹理等笔迹信息的限制条件,和传统文本依存笔迹鉴别技术中需要内容完全相同的笔迹文档的限制条件,本文提出了一种新的文本依存笔迹鉴别技术.它以局部特征匹配与投票为手段进行关键词提取,对提取出的相同关键词建立训练集,在两篇文档的相同关键词之间进行匹配,将笔迹鉴别问题转化为签名识别问题.实验结果表明,在文档内容不完全相同的情况下,该技术仍然能够有效地对文档进行笔迹鉴别.(本文来源于《四川大学学报(自然科学版)》期刊2013年04期)

曹敏[5](2013)在《基于过程神经网络的脱机手写体汉字特征提取与识别方法的研究》一文中研究指出脱机手写体汉字识别因其重要的理论意义和实用价值已成为模式识别领域中的热门课题。汉字识别属于超大规模的分类识别问题,而脱机手写体汉字由于书写的随意性和不规范造成的汉字形变与连笔以及缺乏书写过程信息等问题,成为汉字识别领域的研究难题之一。本文将过程神经网络的理论和方法与人类认知汉字的过程结合起来,研究了基于过程神经网络的脱机手写体汉字特征提取与识别方法,对机器“认知”脱机手写体汉字进行了新的探索。论文的主要研究工作如下:1.分析并提出了一种具有容错性的汉字特征表征方法。通过模拟人类汉字的书写习惯,将脱机手写体汉字的特征容错性的表征为笔划类型数量、笔划类型位置、拓扑结构类型数量和笔划书写顺序特征,给出了脱机手写体汉字多特征的表征方法。2.构建了用于提取脱机手写体汉字特征的过程神经网络模型。将手写体汉字二维点阵的图像转化为空间聚合与时间聚合的序列,利用过程神经网络的时空聚合能力,建立用于提取脱机手写体汉字特征的过程神经网络模型,并运用粒子群优化算法对网络进行训练,采用训练好的过程神经网络提取手写体汉字的多特征,构建脱机手写体汉字多特征数据表。3.研究了具有容错机制的脱机手写体汉字识别匹配规则。通过模仿人类识字时的对比、判断、分析能力,给出了具有容错性的脱机手写体汉字识别匹配规则,将待识别脱机手写体汉字的多特征数据表与样本库中的手写体样本的多特征数据表进行容错性匹配识别。4.从SCUT-IRAC手写体汉字图像样本库中选取了各种类型的脱机手写体汉字样本,在MATLAB7.0软件平台上,对本文提出的基于过程神经网络的脱机手写体汉字特征提取与识别方法进行了仿真实验。结果表明,该方法较好地消除了汉字畸变对特征提取造成的影响,具有较高的识别率。(本文来源于《合肥工业大学》期刊2013-04-01)

陈睿,唐雁[6](2013)在《基于广义Hough变换的手写汉字文档关键词提取》一文中研究指出提出了一种基于广义Hough变换的手写汉字文档关键词提取技术。对于待提取的手写文档图像,采用字符像素逐点匹配和投票的方式进行广义Hough变换,在参数空间中定位出手写关键词图像的位置。本技术对传统的广义Hough变换进行了修改,突破了形状匹配需要完整轮廓信息的局限,简化了局部特征的计算,对手写汉字文档图像中具有局部形变、部分旋转和缩放的手写关键词能够有效提取。对于提取的相同关键词建立训练集,用签名识别的方法对书写者建模,能够达到书写者身份鉴别的目的。(本文来源于《微型机与应用》期刊2013年06期)

乔玉平[7](2012)在《基于过程神经网络的脱机手写体汉字特征提取与识别方法研究》一文中研究指出脱机手写体汉字识别是模式识别领域中的热门课题,具有重要的理论意义和实用价值。由于汉字的种类多、结构复杂、相似字多,且脱机手写体汉字存在形变及不能反映手写过程信息等因素,使得脱机手写体汉字识别成为了汉字识别领域中的难题之一。本文运用过程神经网络的理论方法,模拟人类认知汉字的思维过程,研究了基于过程神经网络的脱机手写体汉字特征提取与识别方法,对机器“认知”脱机手写体汉字进行了探索。论文的主要研究工作如下:1、构建脱机手写体汉字的多特征数据表。模拟手写体汉字的书写习惯和汉字形码输入法,把脱机手写体汉字的特征表征为笔划类型数量、笔划类型位置、拓扑结构类型数量和笔划书写顺序特征,在研究脱机手写体汉字特征容错性表征的基础上,构建了待识别脱机手写体汉字的多特征数据表。2、分析并建立用于提取脱机手写体汉字特征的过程神经网络模型。利用过程神经网络能够处理时空二维信息的特点,构建用于提取脱机手写体汉字特征的过程神经网络模型,选用脱机手写体汉字样本及改进的BP算法对网络进行训练;用训练好的过程神经网络提取脱机手写体汉字的多重特征,完成脱机手写体汉字的多特征数据表。3、制定具有容错性的脱机手写体汉字识别匹配规则。模仿人类对比判断能力,制定具有容错性的脱机手写体汉字识别匹配规则,把待识别脱机手写体汉字的多特征数据表与标准仿宋印刷体汉字的多特征数据表进行容错匹配识别。在MATLAB R2009b的仿真软件平台上,选取SCUT-IRAC HCCLIB字库中包含各类结构的脱机手写体汉字,对本文研究的基于过程神经网络的脱机手写体汉字特征提取与识别方法进行了验证实验,实验结果表明该方法能较好地提取脱机手写体汉字特征,识别率较高。(本文来源于《合肥工业大学》期刊2012-04-01)

李锟华,王海瑞,段利华,桑志强[8](2011)在《基于联机手写汉字字块特征码提取的研究》一文中研究指出该文对常见的联机手写汉字的识别方法进行分析,通过汉字字块分类作为汉字特征码提取的基本单位,通过汉字每个字块笔划之间的关系提取汉字的特征码,把基于笔划联机汉字识别的优点和基于字根联机手写汉字识别优点相结合,从而提出一种汉字特征码提取的新方法。(本文来源于《电脑知识与技术》期刊2011年01期)

袁媛,刘文才[9](2010)在《基于形状分割的手写汉字笔划提取方法》一文中研究指出笔迹鉴别的目的是区分不同的书写者,而笔划提取是笔迹鉴别的基础。本文提出了一种用于笔迹鉴别的手写汉字笔划提取算法,该算法定义了凹凸点与四种基本笔划相交类型的对应关系,通过字符图像轮廓上的凹凸点检测来确定笔划相交区域和相交类型;接着,在各个相交区域上,根据其笔划相交类型进行形状分割;最后,用对笔划轮廓两侧对应点进行跟踪的方法来进行细化。我们将该算法与基于细化和基于段化的笔划提取算法进行比较,实验结果表明,该提取算法具有比较高的准确率和有效性,因此本文提出的基于形状分割的手写汉字笔划提取方法具有较高的可操作性和实用价值。(本文来源于《计算机工程与科学》期刊2010年12期)

邓国强[10](2010)在《无约束联机手写汉字特征提取与识别融合的研究》一文中研究指出一直以来,手写文字识别是模式识别领域内的一个重要的分支,许多研究人员付出了长期的巨大的努力。经过四十多年的研究与发展,手写识别技术已经被广泛应用于各种设备中以方便人机交互。手写识别可以分为脱机识别和联机识别。无约束联机手写汉字识别技术可以让用户以非常随意的风格、速度甚至角度进行手写输入,使得书写者书写得更流畅更快捷。然而,汉字类别庞大,结构复杂,书写风格更是千变万化,无约束联机手写汉字的识别仍然是一个难题。在模式识别中,特征提取关键步骤,最终识别结果很大程度依赖于此,研究手写识别技术必然要深入研究相关的特征提取技术。现有的研究成果已经包含不少分别针对脱机和联机手写文字的识别方法,如何利用脱机识别和联机识别的互补性,构建性能更好的识别系统,以提高联机手写汉字的识别率,是一个非常值得研究的课题。本文针对上述问题,作了以下工作:1.介绍和总结了手写汉字识别中当前主流的特征提取方法,包括Gabor特征,梯度特征、8方向特征和方向变化特征,以及常用分类器,包括距离分类器和MQDF分类器。通过大类别的汉字识别实验对比了各种特征的性能,从中选取了最适用于联机手写汉字识别的特征;2.虚拟笔画技术是解决联机草书识别问题的一项关键技术,但它同时也存在混淆部分汉字笔划的严重弊端。本文通过理论和实验,深入分析了虚拟笔画技术在大类别汉字识别时的利与弊,提出了四种用于改进虚拟笔画技术的算法。实验结果表明,采用本文提出的方法改善了虚拟笔画技术,识别率得到了更进一步的提升;3.从特征级和分类器级的角度出发,对脱机识别方法和联机识别方法进行了融合,提出叁种融合脱机识别和联机识别的方法。实验结果表明,联机和脱机识别技术有着较好的互补性,两者的融合大幅度提高了联机草书汉字的识别率。(本文来源于《华南理工大学》期刊2010-05-01)

手写汉字提取论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

脱机手写汉字识别是文字识别领域的一项重要研究内容,特征提取对识别有着至关重要的作用,本文设计了一种基于模糊划分的脱机手写汉字笔画特征提取方法。首先,采用先提取汉字基本笔画,再对其进行细化的思想,用模糊游程算法来提取汉字横、竖、撇、捺四个方向的基本笔画,并对汉字笔画进行修正和细化处理,用于后续特征提取;其次,对汉字笔画进行特征提取,主要提取汉字笔画端点、中点、长度、倾斜度等基本特征,并引入模糊理论进行汉字模糊位置判定,按照相交关系得到笔画的交点信息;最后,整合笔画结构特征进行汉字结构判别和相似字区分,主要针对汉字的横竖笔画进行处理,利用模糊判定规则,将汉字分为上下、左右、独体和包围四种结构;并设计了一种基于笔画特征的相似字区分算法,先分析相似字成因,再结合汉字结构特征识别相似字。实验结果表明了本文特征提取方法的有效性。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

手写汉字提取论文参考文献

[1].刘妍.基于Gabor双弹性网格特征提取的手写体汉字识别的研究[D].河北工业大学.2014

[2].刘慧.基于模糊划分的脱机手写汉字笔画特征提取方法[D].河北大学.2014

[3].宁博.手写体汉字识别实验平台及笔划网格特征提取方法的研究[D].河北工业大学.2013

[4].陈睿,唐雁.基于关键词提取的手写汉字文本依存笔迹鉴别技术[J].四川大学学报(自然科学版).2013

[5].曹敏.基于过程神经网络的脱机手写体汉字特征提取与识别方法的研究[D].合肥工业大学.2013

[6].陈睿,唐雁.基于广义Hough变换的手写汉字文档关键词提取[J].微型机与应用.2013

[7].乔玉平.基于过程神经网络的脱机手写体汉字特征提取与识别方法研究[D].合肥工业大学.2012

[8].李锟华,王海瑞,段利华,桑志强.基于联机手写汉字字块特征码提取的研究[J].电脑知识与技术.2011

[9].袁媛,刘文才.基于形状分割的手写汉字笔划提取方法[J].计算机工程与科学.2010

[10].邓国强.无约束联机手写汉字特征提取与识别融合的研究[D].华南理工大学.2010

论文知识图

手写汉字提取结果(a)在线书写...手写汉字提取过程(a)在线书写...2文档模板和待识别文档Fig.2Doc...音首键记录程序流程7手写体汉字的笔画提取过程图“中”、“国”两字的书写与识别结果

标签:;  ;  ;  ;  ;  ;  ;  

手写汉字提取论文_刘妍
下载Doc文档

猜你喜欢