联机手写汉字识别论文_曲丽娜

导读:本文包含了联机手写汉字识别论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:汉字,笔划,特征,卷积,手写体,笔顺,方向。

联机手写汉字识别论文文献综述

曲丽娜[1](2018)在《联机手写汉字识别系统应用研究》一文中研究指出介绍了联机手写汉字识别的关键技术,重点研究卷积祌经网络结构,搭建TensorFlow实验平台,以中国科学院采集的CASIA-OLHWDB数据集进行训练,结果表明,将卷积神经网络方法应用于联机手写识别系统中能取得较好的效果。(本文来源于《信息与电脑(理论版)》期刊2018年18期)

孙阳光,何坚韧[2](2012)在《联机手写汉字识别系统中特征提取方法研究》一文中研究指出本文对笔划识别过程中提取关键点的重要性进行分析研究,介绍了提取拐点的两种常用的算法,并进一步结合这两种算法的优缺点,提出了二次检测的方法,使得系统提取拐点的准确度得到了进一步提高。实验结果表明,本文提出的改进方法具有很好的鲁棒性。(本文来源于《计算机光盘软件与应用》期刊2012年24期)

郭欣怡[3](2010)在《语句级联机手写汉字识别方法》一文中研究指出联机的手写汉字输入技术已经非常成熟。而起着关键作用的联机识别算法还不能达到高准确率的水平。这主要原因是手写汉字类别多、字形的多样化、各种形近字、连笔输入等原因。所以怎样解决这些差异、选出最具分类能力的特征与分类器成为识别技术的关键。虽然各种成熟高识别率的书写识别产品不断更新问世,但都是限制在一个输入区域且每次只能识别一个汉字,但实际上是有上下文语义的句子或段落。单字输入时,就往往由于要从多个候选字中选择正确的目标汉字,而打断原来写文章的思路。平板电脑、大屏幕触摸设备提供了可以像传统纸张输入方式一样的可能性,一次可以输入多个汉字甚至一条语句。如此,“语句级”甚至“篇章级”汉字识别就成为汉字识别应用的一种新的趋势。联机手写汉字识别技术也会更加注重语句以及篇章级的识别方向。本文将根据语句级识别算法实现一个语句级的联机手写识别系统。用户可以在无约束的条件下手写输入,识别过程在后台进行。当用户完成一句或一个段落时,可以一次性的将整段文字进行识别并显示出来,并可以与手写文档一同保存起来。整个过程分为单字识别阶段与后处理语言模型阶段。单字识别的正确率是重要的因素,特别是对特征的提取。本文对连续的NCFE八方向特征提取算法进行改进,增加了向量的端点处理,根据不同情况运用不同的赋值方法,增强了特征的区分性能,同时将AP聚类算法引入识别的粗分类阶段,AP聚类算法与其他聚类算法相比对手写字符识别有着明显的优势。第二阶段充分利用了用户输入的语义信息,建立语言模型对整个段落进行基于语句级的候选识别结果调整。在这里词典的容量和领域对调整结果影响很大,单纯的依赖字典的调整结果有时不但没有提高识别率,反而影响到正确的识别结果。为了解决这个问题,本文建立了将单字识别结果与语言模型通过优化权重相结合的识别算法。最后,本文的算法在HIT-OR3C以及中科院CASIA-OLHWDB1手写数据集上进行实验与测试。结果表明与其他方法相比较,准确率有了明显的提高。整个语句级识别系统与现有识别系统来说,更是有着使用上的便利性。识别准确率能够满足使用要求。(本文来源于《哈尔滨工业大学》期刊2010-12-01)

吕新桥[4](2009)在《联机手写汉字识别技术研究》一文中研究指出联机手写作为一种友好的人机交互方式,以其“不用学,不用记”的特点一直受到人们的青睐,特别是近年来,消费类电子终端产品的普及,更是对联机手写汉字输入提出了更高的要求。联机手写汉字识别作为解决手写汉字的联机输入问题的重要方法更是一直作为人们关注和研究的热点。联机手写汉字识别是一个超多类的复杂模式识别问题,以其类别多,手写变形大,字形结构复杂而成为联机手写系统必须攻克的难题。多年来,许多新方法新技术不停应用于联机手写汉字识别系统,取得了相当的成功,但有关联机手写汉字识别的关键算法和体系架构尚没有完整的报道。联机手写汉字识别技术的研究有着广泛的市场前景和深刻的理论意义。围绕着联机手写汉字识别的难题,开展了如下几个方面的工作:基于内角和多边形逼近提取笔段;基于有限状态机对笔段进行合并;基于字根的联机手写汉字识别算法研究;利用支持向量机识别字根和相似字。针对汉字的结构特征提取不稳定以及笔段可能会被过度合并或者合并不足而影响识别结果,提出基于内角和多边形逼近的汉字笔段提取算法。算法首先找到笔画的第一个拐点(最小内角值小于指定阈值),该拐点将笔画分割成两个部分。然后分别寻找拐点两侧曲线段上的拐点,反复执行,直到再也找不到拐点为止。依次连接一个笔画中所有曲线的起点和终点,就形成了该笔画的笔段系列。对提取到的笔段集合运用有限状态机描述并判定笔段的状态,并以此判定笔段的合并要求,以最大限度地减少冗余笔段。实验证明,这种算法具有较低的计算复杂度和很好的逼近效果,能适应手写汉字的笔段提取合并要求。对于基于字根识别手写汉字的算法进行了研究。汉字的类型分为包围、半包围、左右、上下和独体五种类型。在判断汉字的结构类型后,对汉字进行分解,得到汉字的字根属性字符串,然后对字根属性字符串进行匹配得到汉字的识别结果。系统稳定高效,取得了非常好的识别效果。采用排除法判断汉字的结构类型。首先判断汉字是否为包围类型,即如果能检测到外围“口”字形,则判定该汉字为包围类型,需根据具体汉字的笔段个数决定对汉字进行拆分或者匹配;否则如果检测到汉字中的长笔段符合半包围的结构特征,则判定为半包围类型,并确定字根的类型,再根据笔段个数确定对汉字进行拆分或者匹配。针对既不是包围也不是半包围结构的汉字,使用聚类算法进行分类判断结构类型,为保证分类的准确性,对分类的结果进行了校验后再确定汉字的结构类型。如果不是独体字,则继续进行拆分直到不能拆分为止。这样,提取的每一个部分都是一个字根。将所有的字根结合起来构成汉字的待识字根属性串,对其进行匹配得到汉字的识别结果。为保证字根识别的正确性,利用局部排序算法对字根里的笔段进行了局部排序。支持向量机是一种统计学习方法,具有全局最优性和学习泛化能力强的特点。近年来广泛应用于模式识别。对支持向量机应用于联机手写汉字识别做了研究和探讨。首先,对经过抽取得到的笔段块提取统计特征,然后进行学习识别以得到字根,实验证明,利用支持向量机能一定程度地有效识别汉字字根,支持向量机的优点得到了体现。针对汉字的字型结构复杂,相似汉字很多的特点,利用支持向量机结合部分空间特征对相似字进行识别处理。首先分析归纳相似汉字的不同特征,然后利用支持向量机进行学习和识别,最后得到相似字区分的结果。实验证明,在前期阶段已经识别的基础上,支持向量机能提高系统的识别率。论文在联机手写体汉字识别方面做了一些有益的探索,也形成了稳定可靠的汉字识别系统。下一步应努力提高汉字的识别速度,使之能够很好地应用于嵌入式系统。(本文来源于《华中科技大学》期刊2009-11-01)

罗巧玲[5](2009)在《联机手写汉字识别关键技术研究》一文中研究指出随着计算机的广泛应用和发展,联机手写汉字识别以操作其简单方便得到了极大的关注。联机手写汉字识别的原理是通过手写板捕获书写的轨迹并进行汉字识别。但由于汉字字库庞大,结构复杂,手写汉字又具有随意性,对于相同的笔段,不同的书写者,系统获得的笔段序列是不一样的。因此,笔段排序和结构检测一直是目前研究的热点和难点。针对联机手写汉字识别中笔顺自由的问题,提出并实现了基于模糊属性关系图的笔段排序算法。根据笔段间位置关系、方向码等属性建立模糊隶属函数,得出每个笔段相对于其它笔段的优先关系的权值,所有的权值之和就是该笔段的优先级。汉字模式检测把汉字划分为左右、上下、独体、包围四种模式。模式检测首先检测包围结构汉字,然后进行基于笔段块组合的模式检测,以区分汉字左右、上下和独体结构。基于笔段块组合模式检测把笔段块划分为首尾两部件,调整首尾两部件的笔段,检测首尾两部件是否满足左右或上下关系,如果最后所有的笔段属于同一个部件,则该汉字为独体结构。笔段排序解决了书写随意性所带来的笔顺不一致问题;汉字结构检测可用于粗分类,大大减少匹配模板的个数。实验结果表明,本文所采用的方法对工整手写汉字笔段排序结果稳定,模式检测正确率达到90.35%。(本文来源于《华中科技大学》期刊2009-05-01)

刘晓娟[6](2008)在《联机手写汉字识别中字根提取算法研究》一文中研究指出联机手写汉字识别(OLCCR)作为模式识别的一个重要分支,已经发展成为一种非常重要的计算机智能接口技术。由于手写汉字输入符合人的自然手写习惯,是一种实时的、操作方便的汉字输入方法,因此具有非常广阔的应用前景。但是手写汉字识别存在字库庞大、书写易变形、不易提取特征等难点,现有的理论和方法在解决这些困难方面还存在缺陷。识别系统的核心在于特征提取和特征匹配。在特征提取方面,提出了一种联机手写汉字识别中基于多边形逼近的笔段提取算法,以内角作为准则进行多边形逼近,检测出书写笔画上角度变化最大的点作为提取笔段的分界点,逼近效果良好,复杂度低。在特征匹配方面,采取基于字根的多级识别方案。根据字根与汉字的关系,选取并自定义了36个首字根,为了适用于无限制手写,采取笔段延迟法提取首字根;针对包围结构的汉字在书写时易颠倒笔顺导致其首字根提取不准确的问题,提出了一种新的包围结构细分方法,将包围结构细分为多种不同类型,通过检测包围结构类型提取包围结构字根,较为全面地解决了包围结构的检测及其字根的提取问题。实验测试结果表明,笔段提取效果好,对提取的笔段以笔段延迟法提取首字根取得了98%的正确率,此外提取包围结构字根也取得了良好的效果,基本解决手写汉字识别的特殊难点。(本文来源于《华中科技大学》期刊2008-06-01)

俞庆英[7](2005)在《联机手写汉字识别系统的研究与实现》一文中研究指出汉字属丁二维平面的方块字,不像英文那样能直接键入计算机,而需要熟记编码、击键输入,这曾一度成为汉字输入的唯一模式,目前也仍是计算机汉字输入的主要方法,但是键盘输入学习起来比较困难,而且需要记忆大量编码,对于很多人来说并不方便。随着计算机技术的发展,一种新的输入方法——联机手写汉字识别的输入法诞生了。这是一种实时识别方式,即用户一边写,机器一边识别处理。这种输入方法不需要记忆编码,也不需要键盘操作,方便、易学。 本文着眼于一个基于鼠标设备的联机手写汉字识别系统的研究与实现,借助于鼠标手写汉字,并完成实时识别。该系统对cpu速度影响小,识别速度快且使用简单。 联机手写汉字识别的方法可分为两人类:一类是基于整字识别的方法,一类是基于笔画识别的方法,本文采用的是后者,即先识别笔画再判别整个汉字的两级识别方法,因为汉字由笔画组成,而联机识别的特点就是写一笔、识别一笔。因此,在汉字识别中,笔画识别是文字识别的前提和关键。论文首先讨论了笔画的分类和特征,然后对汉字笔画信息的各种数据做了统计,这些数据对本文研究的识别系统具有重要的指导意义和应用价值。 论文所采用的笔画识别方法是以方向代码这个概念为基础的。在鼠标移动过程中可以获得笔迹的一系列坐标点数据,由于这些数据点是离散的,所以任相邻两点的曲线就是计算机所能分辨的一段最小直线。文中对每一最小段直线所属的方向域进行标记,产生了8种方向代码。这样,每一个笔画的移动轨迹都可以产生一个方向代码序列,通过对该序列进行滤波、归并之后可以得到该笔画的笔段序列,依照笔画特征字典用动态规划法匹配获得的笔段串,从而完成笔画的识别,其中也包括了部分连笔部件的识别。 由于手写的随机性,手写的笔画或汉字因人而异、冈时而异、因书写条件、设备和环境而异。所以在识别过程中,获得的方向代码序列是随机的。这就要求系统具有自学习的功能,对于新出现的正确模式,能够进行学习记忆。机器学习方法的种类很多,本文就笔画识别问题主要讨论了文法学习和神经网络学习方法。 实现笔画的识别是本文所采用的两级识别方法的第一步,第二步就是实现汉字的识别。论文设计了汉字识别系统的流程图。整字识别中主要讨论了四个问题:一是在汉字识别过程中对单笔画的识别进行后处理,提出了两种方法;二是分析了识别字典的种类以及相关问题;二是笔画串的匹配问题;四是讨论了识别系统实现的联想输入功能。 论文研究的手写汉字识别系统开销小,能有效节省软硬件资源,适用于嵌入式系统和单片机,有很大的应用前景。(本文来源于《安徽大学》期刊2005-05-01)

章颖芳,戴月明[8](2000)在《联机手写体汉字识别系统中汉字的输入及其特征的提取》一文中研究指出汉字识别是模式识别领域最富挑战性、又极具应用前景的研究课题之一 ,而联机汉字识别是近期需求十分迫切的技术 .字量大、字形复杂多变、笔顺没有一定规范、笔划数目变动等多种因素 ,是联机汉字识别的主要困难 .笔划相对易于提取是联机识别的优点 .针对联机手写体汉字的特点 ,提出笔划轨迹点方向量化的方法 ,提取笔划和计算笔划间的连接关系 ,形成输入样本字的特征 .(本文来源于《无锡轻工大学学报》期刊2000年04期)

徐志明,王晓龙,张凯,关毅[9](1999)在《联机手写体汉字识别后处理技术的研究》一文中研究指出文中提出了一种规则和统计相结合的计算语言模型应用于联机手写体汉字识别后处理的技术,把基于统计的大词表Markov语言模型与语言规则量化模型,通过词网格技术集成在一个语言解码器.这种后处理方法由3个阶段组成:词网格生成、语言解码、基于Cache的自学习机制.语言解码器采用Viterbi搜索算法求解最优语句候选.该项技术已应用于HPC(手持机)手写电脑的联机汉字手写体识别系统中,汉字识别率为91.3%.(本文来源于《计算机研究与发展》期刊1999年05期)

余楚中,赵学军,蔡雷,潘保昌[10](1998)在《联机手写体汉字识别方法的研究》一文中研究指出提出了一种基于笔划的一级分类、笔划特征二级分类的新方法来实现联机手写体汉字的识别。该方法对笔划变形的容忍度大、计算简单。通过两级分类,对国标二级汉字的识别率为98%以上,不要求笔顺,识别时间短。(本文来源于《重庆大学学报(自然科学版)》期刊1998年03期)

联机手写汉字识别论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文对笔划识别过程中提取关键点的重要性进行分析研究,介绍了提取拐点的两种常用的算法,并进一步结合这两种算法的优缺点,提出了二次检测的方法,使得系统提取拐点的准确度得到了进一步提高。实验结果表明,本文提出的改进方法具有很好的鲁棒性。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

联机手写汉字识别论文参考文献

[1].曲丽娜.联机手写汉字识别系统应用研究[J].信息与电脑(理论版).2018

[2].孙阳光,何坚韧.联机手写汉字识别系统中特征提取方法研究[J].计算机光盘软件与应用.2012

[3].郭欣怡.语句级联机手写汉字识别方法[D].哈尔滨工业大学.2010

[4].吕新桥.联机手写汉字识别技术研究[D].华中科技大学.2009

[5].罗巧玲.联机手写汉字识别关键技术研究[D].华中科技大学.2009

[6].刘晓娟.联机手写汉字识别中字根提取算法研究[D].华中科技大学.2008

[7].俞庆英.联机手写汉字识别系统的研究与实现[D].安徽大学.2005

[8].章颖芳,戴月明.联机手写体汉字识别系统中汉字的输入及其特征的提取[J].无锡轻工大学学报.2000

[9].徐志明,王晓龙,张凯,关毅.联机手写体汉字识别后处理技术的研究[J].计算机研究与发展.1999

[10].余楚中,赵学军,蔡雷,潘保昌.联机手写体汉字识别方法的研究[J].重庆大学学报(自然科学版).1998

论文知识图

联机手写汉字识别原理框图联机手写汉字识别系统方框图笔顺变化等汉字模式,常采用以笔段为基元的...市面上可见的手写输入产品“中”、“国”两字的书写与识别结果

标签:;  ;  ;  ;  ;  ;  ;  

联机手写汉字识别论文_曲丽娜
下载Doc文档

猜你喜欢