手写数学公式识别论文_张文君

导读:本文包含了手写数学公式识别论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:数学公式,文法,手写体,上下文,深度,模型,语言。

手写数学公式识别论文文献综述

张文君[1](2019)在《基于编码器—解码器的联机手写数学公式识别方法研究》一文中研究指出随着互联网和人工智能技术的快速发展,教育信息化的步伐正在加快,智慧教育的概念已经开始影响并改变着传统的教育方式,而且现代化的电子产品与移动终端都已经全方位的覆盖于教育教学过程中,其中手写识别技术担任着不可或缺的责任。目前手写体识别主要是集中在汉字、英文字符以及数字的研究上,并在这几个领域已取得了非常好的成绩,但是这些识别都只局限于一维的空间上,对于诸如数学,物理和化学公式等二维结构分布的识别就显得力不从心。由于数学公式这种二维结构的数据在识别时不仅仅要考虑其中每一个符号的类别,还要考虑各个符号之间的结构位置关系,这对于手写技术的要求非常高,因此该领域的研究还处于初级阶段,需要不断的去探索。据此,本文将针对联机手写数学公式的识别技术进行分析,提出了基于行为链的数据构建方式对数学公式进行处理,结合深度学习模型LSTM来分析数据间的时序关系,帮助更好的分析公式中符号的构成以及符号间的关联关系,并采用编码器—解码器与注意力模型相结合的框架来构建整个联机手写数学公式识别模型(EAD-OHMER)。主要完成的工作如下:1.基于目前处理时序问题较为流行的深度学习模型长短时记忆网络(LSTM)来构建联机手写数学公式识别模型,可以直接将手写笔迹数据作为输入,不需进行符号切分就可以直接识别公式符号,较之前传统的识别方式更加方便准确。2.提出了一种基于行为链的数据构建方法,重点对公式中符号间的关系进行抽象描述,旨在反映符号间的相关性,避免在分析时舍弃符号间的关联性而单独考虑一个符号的类别,其同时也能降低输入网络模型中的数据冗余。3.提出了基于编码器—解码器的联机手写数学公式识别模型(EAD-OHMER),并加入了注意力机制来解决原始编码器—解码器存在输入序列过长时会造成之前信息被覆盖的缺点,较传统公式识别分几个环节单独研究的方式更加简便准确。4.在提出的EAD-OHMER模型基础上,详细介绍了各模块的实现方法,数据的预处理及特征提取,以及行为链的构建和编码器与解码器模型的构建算法及训练过程,模型的输入是(8836,50,210),输出是一个个的数学符号。基于本文所述的方法,在不同的数据集上进行了验证,并在同一数据集下与其他系统对比分析,发现EAD-OHMER在同等条件下有着更好的识别效果。(本文来源于《华中师范大学》期刊2019-05-01)

王奕松[2](2018)在《基于LSTM模型的数学公式手写体识别技术的研究与实现》一文中研究指出随着移动互联网、云计算等信息技术渗透到社会生活的方方面面,每天都有海量的数据通过各类终端被收集到云端进行处理。对用户数据的自动化处理和挖掘蕴含着巨大的经济效益,但与此同时真实场景下数据的多样性与复杂性也带来了新的挑战。联机数学手写公式数据是一种用户在使用触摸屏、电子笔等设备时产生的数据,用户的书写笔迹以采样点的形式被收集下来,数学手写公式识别技术可以将这类数据转化为更利于计算机处理的文本格式,便于进一步利用这些数据的价值。联机数学手写公式识别技术有别于传统手写字符识别技术的地方在于,数学公式是一种具有二维布局的符号系统,要正确识别数学公式,不仅要正确识别数学符号,还要正确地解析符号间的结构关系,这也是目前该领域所面临的难点。本文对联机数学手写识别的关键技术进行了深入研究,重点针对初等数学教育领域的数学手写公式真实场景进行分析,提出了一种基于循环神经网络语言模型的初等数学手写公式识别问题的解决方案,同时我们也完成一套针对初等数学领域的联机数学手写公式识别系统的研发工作,并基于真实数据集进行了测试和应用。本文的主要贡献如下:(1)、为了解决教育领域的初等数学手写公式真实场景中数学符号与描述性文字符号混合、符号存在固有歧义的特点,结合自然语言处理技术中的语言模型对识别的候选进行排序。此外,本文也总结了初等数学解题公式语料预处理的一些方法技巧。通过实验证明,引入数学公式的语言模型后大大提升了识别的候选排序质量,识别候选的Top5匹配率提升约20%;(2)、研究近年来在图像识别领域取得突破性成果的卷积神经网络,使用卷积神经网络模型开发符号识别引擎。同时,根据本课题的应用场景针对性地提出了引入非法类别、数据集采样方法等技巧,最终开发完成的符号识别引擎在测试数据集上达到了99%以上的Top5识别准确率;(3)、研究了初等数学公式提取相关技术,根据本课题的系统框架流程进行设计,提出了一种针对初等数学领域公式的结构解析方法,并完成相关功能模块的设计与实现;(4)、针对教育领域的初等数学解题语句特点,创造性地整合主流深度学习、自然语言处理和数学公式结构解析等技术,提出一套完整的中文与数学符号混合场景下的解题语句识别方案,且开发了一套完整的针对教育领域的初等数学联机数学手写公式识别系统。对系统在功能和性能方面进行测谁,最终测试结果表明系统功能完整,整行识别准确率达到70%,同时具有良好的时间稳定性。(本文来源于《电子科技大学》期刊2018-03-01)

喻雨峰[3](2017)在《联机数学公式手写体识别的研究与实现》一文中研究指出在教育行业,为了实时追踪学生的学习轨迹和知识薄弱环节,机器自动识别学生答题的手写笔迹成为必要的技术需求。因此,本文的研究重点为联机数学公式手写体识别,旨在提出一个稳健可行的解决方案来识别学生的手写数学公式笔迹,主要研究内容包括如下几点:1、提出了一种融合CNN和DBN的单字符识别模型应用卷积神经网络(Convolutional Neural Network,CNN)搭建和训练了一个单字符分类器模型,针对神经网络对对抗样本的脆弱性表现,同时创造性的采用了深度信念网络(DeepBeliefNetwork, DBN)的解码重构损失作为识别置信度评价模型,最后融合了 CNN和DBN的置信度评价,增强了对对抗样本的拒识能力。2、提出了一种基于组合排序的手写体识别算法手写数学公式中存在着大量的二义性,二维结构准确判定存在着相当的难度,同时还有许多容易混淆的相似字符,这些情况都增大了机器自动识别的难度。本文提出了一种基于组合排序的手写体识别算法,先把这些不确定的情况都保存下来作为候选,产生候选组合路径,再基于词组频率表,语义模型,识别置信度等进行路径排序就能保证识别正确率,可以大大简化系统的复杂度,同时增大识别系统的鲁棒性。3、提出了一种基于错误识别案例的快速学习方法识别出错案例的调试工作非常繁重,本文提出了一个基于错误案例的学习方法,可以快速的从我们提供的错误案例标记数据中学习到新的组合映射知识,并将这些知识作为系统的组合补充分支,避免了再次出现同样的识别错误。基于上述的方法,实现了一个识别系统,实验结果表明本文提出的联机数学公式手写体识别方法具有较高的识别率及较好的鲁棒性。(本文来源于《电子科技大学》期刊2017-03-01)

克昊哲[4](2016)在《基于全局方法的联机手写数学公式识别》一文中研究指出近年来,符号语言,如LATEX,以及模板编辑器被越来越多的用于向科学文档中输入数学公式,但是,这类输入方式对用户的要求较高,且需要经过专门的训练。随着触屏设备的普及,手写输入作为人类最自然的输入方式,被越来越多的人使用,因此,手写数学公式识别技术也应运而生。不同于常规的手写识别,由于数学公式本身具有二维结构,在对其进行识别时,我们不仅要识别公式中的数学符号,还要识别公式中符号之间的结构关系,并且,符号识别要受到数学公式结构的影响,而数学公式的结构又依赖所识别的符号,这些都使得对手写数学公式的识别变得尤其困难。为了解决这个复杂问题,通常将数学公式的识别分为叁个阶段,符号切分,符号识别以及结构分析。常规方法是将这叁个阶段顺序执行,导致上一阶段的错误会遗留到下一阶段中,从而使最终的识别结果不高。针对该问题,本文实现了一种基于全局方法的联机手写数学公式识别系统。该系统通过使用二维随机上下文无关文法,将手写数学公式识别问题看作一个构建最大可能树的问题,从而从全局决定最大可能的识别结果。通过这种方式,数学公式的叁个阶段(符号识别,符号切分以及结构分析)能够同时得到优化。另外,在符号切分方面,本文提出了使用笔画之间“距离”的概念来降低切分假设的数量。在符号识别方面,本文提出了将循环神经网络和卷积神经网络组合的方式,实现对符号的识别,从而提高了符号识别的准确率。最终本文通过编程实现了符号切分模块,符号识别模块以及结构分析的功能,从而实现了一个完整的联机手写数学公式识别系统。基于系统评测的结果和对比实验的结果,本文的系统在公式识别取得了很好的结果。在CROHME 2014的测试集上,公式识别率达到了35.18%,排在第叁,证明本系统的性能较好。最后,本文通过编码实现了一个手写板,能够将用户的手写数学公式转换为LATEX格式,并最终展示出来。(本文来源于《哈尔滨工业大学》期刊2016-12-01)

张虹扬[5](2016)在《在线手写体数学公式的分割与识别算法研究》一文中研究指出模式识别研究的进程间接地推动了线上智能教育系统的发展。在针对数学学习的线上智能判卷这一应用中,由于答案有效的判分点往往在数学公式上,如何准确有效地识别出学生的手写答案是本文所要解决的重点问题。结合线上系统可以以题目为单位传输答案笔序流文件作为识别源文件的特性,项目先后研究了大量的机器学习算法用于完成识别系统的设计。研究中发现,对单字切分质量直接影响到了后续单字识别的准确性,而且用于单字识别的CNNs需要识别的文字类别越少识别效果越精确。所以提升单字切分的准确性以及尽可能地分离出手写体答案中的数学符号成为了降低对字段文字整体识别错误率的改进方案。系统需求的分割算法应具备如下两个功能:第一:将答题样本中的描述性语言与数学公式进行分离;第二:对被分离出的语段进行单字切分。对应新的需求,本文就两个思路提出了两种不同的切分法案:方案一量化了汉字笔画和数学符号笔画之间的差异,并使用规则对笔画进行分组,通过对笔画组的识别对组合打分并利用维特比算法思想选取最佳组合序列作为分组结果输出。针对汉字特性和数学符号特性的方案又有两种实现,分别是依照数学符号特性对笔画进行排除的实现方式和依照汉字特性对笔画进行候选的实现方式。方案二基于特征学习的分割方法遵照从宏观上对答案的汉字和数学公式进行分区的思想,在无监督的环境下训练用于抽取字段特征的卷积自编码网络,训练完成以后,分别抽取字段中数学公式和汉字的特征对SVM进行训练。该方案首先通过半自动的机器学习方法对字段进行划分,而后再利用普通段分割方法对不同区域进行单字切分。在保证字段分割准确性的基础上,对识别优化工作集中在研究如何实现并改进CNNs结构和训练方式进而提升单字识别正确率之上。实验表明,分别针对常用汉字和数学符号训练对应的识别引擎有利于降低相似符号间的识别错率,进而提升整体的识别效率。且通过规格判定和机器学习的组合算法对字符段进行中英文预切分是可行的,该方法在经过改进和调试可以实现并提升对手写体数学公式文本化的正确率。(本文来源于《电子科技大学》期刊2016-03-28)

胡龙灿,杨帆,樊爱军[6](2014)在《手写数学公式的识别研究及在Android上的应用》一文中研究指出为了开发一款在Android平板电脑上运行的手写数学公式识别的软件,首先采用特征值多级分类方法对手写字符进行识别;然后提出一种使用叁叉结点结构存储数学公式的算法,将手写数学公式转换成一棵叁叉树;最后利用叁叉树的先序算法将叁叉树转换成MathML语言即可在Web浏览器上显示。(本文来源于《计算机应用与软件》期刊2014年08期)

吴炳玮[7](2014)在《二维文法的研究及其在联机手写数学公式识别的应用》一文中研究指出近年来,随着智能手机和平板电脑等移动终端的普及,人们大量使用手写电子文档。手写输入和识别技术应运而生。在过去的几十年里,研究人员在单字识别和文本行识别等领域取得了不少先进成果。但是,这些技术适用于具有一维布局的文档,不适用于具有二维布局的文档,比如说电路图、化学公式、数学公式等等。由于二维文档不仅包含符号信息,还包含二维空间信息,所以要识别这些二维文档将会相当困难。研究人员发现二维文法在处理二维文档空间结构关系的问题上具有巨大的潜能。二维文法在二维文档解析的应用成为了一个新的研究热点。特别地,数学公式作为一种二维图形文档,在日常生活和工作极为常用。因此,数学公式识别的问题富有研究意义。本文主要研究二维文法在联机手写数学公式识别中的应用。要正确识别数学公式,除了需要分析数学符号本身携带的信息,还需要分析数学符号之间的空间关系。在众多的二维文法中,本文选用了上下文无关文法。如何利用上下文无关文法去分析数学公式的空间结构是本文的一个研究重点。本文的主要工作和贡献如下:1.本文制定了一套完整的二维随机上下文无关文法规则,涵盖了6种空间关系和190个数学符号,可以表达绝大部分常用的数学公式。2.本文提出一种改进的CYK解析算法。该算法利用搜索区域合并空间上邻近的子公式,解析过程对笔画顺序没有限制,更加适用于联机手写公式的识别。3.本文开发了一个完整的联机手写数学公式识别系统,完成符号切分、符号识别、结构分析、文法规则、空间关系模型的程序编写。尽管本文的研究重点是数学公式识别,但是本文研究技术的应用并不局限于此。因为二维文档的空间结构具有共通性,所以本文研究的技术可以扩展到其他二维文档的识别及处理。(本文来源于《华南理工大学》期刊2014-06-10)

任昆[8](2014)在《上下文感知手写数学公式识别》一文中研究指出目前的结构识别方法基本属于盲析法,即把某种各个区位的识别算法,以固定的次序轮询于各个区位上,根据识别算法的结果判断当前符号处于前一符号的何种区位当中;或者是符号识别与结构分析同时进行的搜索解空间中最小代价的搜索法。这些方法由于均是基于区位遍历技术,识别速率或区位识别正确率都不同程度受到较大局限。对此本文研究基于上下文感知的联机手写数学公式结构分析方法,该方法依据不同教学层次数学公式各种符号链写结构出现的概率及源位符号的类别,建立上下文感知模型,根据模型对后继字符可能出现的区位进行预测并监督,有效避免了盲析法的区位识别弊端,区位识别正确率和识别速度得以提升,有益于推广使用间接式白板系统。本文的主要工作与创新内容如下:1.深入分析数学公式的书写结构,将书写结构分为一般、规范型非一般及专用符号体系叁大类书写结构。规范型非一般书写结构重点讨论具有代表意义的分段函数结构与水平盖括等书写结构;专用符号体系重点讨论典型的分数、∑、∏、积分、等符号体系。2.详细描述CSDTW、SVM、KNN、多分类器四种有代表性的联机手写字符识别方案,并选取识别率最高的CSDTW方案实现系统的联机手写单笔画数学公式符号识别,利用组合策略实现联机手写多笔画公式符号识别。3.提出基于上下文感知的联机手写数学公式结构分析方法。设计一般书写结构、规范型非一般书写结构以及专用符号书写结构等的上下文感知模型通用结构。通用结构中建立了各个教学层次的数学公式符号在不同区位链接的教学概率及区位感知码。利用感知模型进行结构分析,分析过程包括区位推荐、后继感知区位监测、区位确定等重要环节。4.设计并实现基于上下文感知模型的联机手写数学公式结构分析算法。一般结构的识别是基于两符号质心间的连线与水平线所成的角度来判别的方法。规范型非一般结构和专用符号体系结构的识别是利用字符区域和质心的方法或者利用高度比的方法。实验的区位确定正确率达到98.2%;区位确定的平均时间约为3ms左右,与现有相关成果比较,上下文感知技术使得联机手写数学公式识别的正确率和速度都明显提高。该课题由湖南省十二五重点学科建设项目资助。(本文来源于《湘潭大学》期刊2014-05-05)

徐旭明[9](2010)在《在线手写数学公式识别的研究》一文中研究指出摘要:手写数学公式识别系统,总体上分为字符分割和结构分析两个主要的步骤。其中,字符分割是公式识别的基础。分割的好坏直接决定识别的正确率,因此设计好的分割算法显的尤为重要。而结构分析是公式识别的关键,单个地识别出字符意义不大,只有对整个数学公式的理解才是正确识别的关键。在过去几年中,在模式识别的研究领域,对手写数学公式识别已受到越来越多的关注。然而,对这一问题的方法的多样性和缺乏一个商业可行的系统,这些都表明,有这个领域仍然有许多的研究工作要做。在这篇论文中,将描述一个基于公式结构和二维语法的联机手写数学公式识别系统。一般来说,这种方法可以成功用于分析由复杂结构关系组成的对象。结构构建的一个重要的优点是没有将符号分割和结构分析作为两个独立的过程,允许系统在考虑整个公式结构上下文的情形下处理分割,以此更可靠地解决由公式所带来的歧义。我们探讨具有多项式复杂性的解析算法的开放性,并由这些语法产生许多新的语法规则,以便使系统对现实中的公式更有效。我们提出几个语法扩展支持一个真正的广泛的数学公式,并且在系统中实现了新的功能。我们目前的方法可以识别函数,极限,导数,二项式系数,复数等等。本文第一章介绍了在线手写体数学公式识别的研究背景、国内外的研究现状以及相关的一些商业化的产品,介绍了本文主要所做的工作。第二章介绍了符号预处理的相关方法,以及基于OCR工具的符号检测,对用户手写的笔划进行分组,根据不同的分组得到一些候选符号,结合公式的二维结构和相关上下文信息,决定何种笔划组是正确的分组,从而最终得到有意义的符号,以此将用户输入的笔划分割成符号。第叁章介绍了在线手写数学公式识别的一般步骤和常用方法,以及本文所作的改进。第四章介绍了手写数学公式识别的主要任务,提出用于手写数学公式识别的二维相关文法和解析算法。第五章介绍了手写数学公式中符号的特征,结合这些特征以及公式结构的二维性提出二维相关文法的扩展文法。提出数学公式的输出Word EQ域。主要介绍了自己如何设计并实现手写数学公式识别系统,提出了自己的设计思路与模块划分并编写程序实现。第六章阐述了本文所设计的二维相关文法用于识别在线手写数学公式的整体效果和时间复杂度,根据本系统目前存在的问题提出了下一步的计划。(本文来源于《淮北师范大学》期刊2010-06-30)

潘伟民,齐向伟,玉素甫[10](2009)在《终端嵌入式数学公式手写识别中的连笔搜索算法》一文中研究指出在数学公式的手写识别中,由于人们的书写习惯造成大量连笔的存在,连笔识别错误给后续公式的识别造成的影响是当前公式识别系统中一个非常重要、而又没有得到很好解决的问题,同时,公式输入的过程中出现连笔又在所难免.本文提出了一种基于DP算法和隐马尔可夫模型的数学公式连笔字符识别方法,识别时,采用DP匹配算法和隐马尔可夫模型相结合的方法,首先使得字库样本与待识样本的码列匹配关系是最优的,当出现连笔字符或结构系统拒识时,采用隐马尔可夫分类器,从而提高整体的识别效率.(本文来源于《江汉大学学报(自然科学版)》期刊2009年02期)

手写数学公式识别论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着移动互联网、云计算等信息技术渗透到社会生活的方方面面,每天都有海量的数据通过各类终端被收集到云端进行处理。对用户数据的自动化处理和挖掘蕴含着巨大的经济效益,但与此同时真实场景下数据的多样性与复杂性也带来了新的挑战。联机数学手写公式数据是一种用户在使用触摸屏、电子笔等设备时产生的数据,用户的书写笔迹以采样点的形式被收集下来,数学手写公式识别技术可以将这类数据转化为更利于计算机处理的文本格式,便于进一步利用这些数据的价值。联机数学手写公式识别技术有别于传统手写字符识别技术的地方在于,数学公式是一种具有二维布局的符号系统,要正确识别数学公式,不仅要正确识别数学符号,还要正确地解析符号间的结构关系,这也是目前该领域所面临的难点。本文对联机数学手写识别的关键技术进行了深入研究,重点针对初等数学教育领域的数学手写公式真实场景进行分析,提出了一种基于循环神经网络语言模型的初等数学手写公式识别问题的解决方案,同时我们也完成一套针对初等数学领域的联机数学手写公式识别系统的研发工作,并基于真实数据集进行了测试和应用。本文的主要贡献如下:(1)、为了解决教育领域的初等数学手写公式真实场景中数学符号与描述性文字符号混合、符号存在固有歧义的特点,结合自然语言处理技术中的语言模型对识别的候选进行排序。此外,本文也总结了初等数学解题公式语料预处理的一些方法技巧。通过实验证明,引入数学公式的语言模型后大大提升了识别的候选排序质量,识别候选的Top5匹配率提升约20%;(2)、研究近年来在图像识别领域取得突破性成果的卷积神经网络,使用卷积神经网络模型开发符号识别引擎。同时,根据本课题的应用场景针对性地提出了引入非法类别、数据集采样方法等技巧,最终开发完成的符号识别引擎在测试数据集上达到了99%以上的Top5识别准确率;(3)、研究了初等数学公式提取相关技术,根据本课题的系统框架流程进行设计,提出了一种针对初等数学领域公式的结构解析方法,并完成相关功能模块的设计与实现;(4)、针对教育领域的初等数学解题语句特点,创造性地整合主流深度学习、自然语言处理和数学公式结构解析等技术,提出一套完整的中文与数学符号混合场景下的解题语句识别方案,且开发了一套完整的针对教育领域的初等数学联机数学手写公式识别系统。对系统在功能和性能方面进行测谁,最终测试结果表明系统功能完整,整行识别准确率达到70%,同时具有良好的时间稳定性。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

手写数学公式识别论文参考文献

[1].张文君.基于编码器—解码器的联机手写数学公式识别方法研究[D].华中师范大学.2019

[2].王奕松.基于LSTM模型的数学公式手写体识别技术的研究与实现[D].电子科技大学.2018

[3].喻雨峰.联机数学公式手写体识别的研究与实现[D].电子科技大学.2017

[4].克昊哲.基于全局方法的联机手写数学公式识别[D].哈尔滨工业大学.2016

[5].张虹扬.在线手写体数学公式的分割与识别算法研究[D].电子科技大学.2016

[6].胡龙灿,杨帆,樊爱军.手写数学公式的识别研究及在Android上的应用[J].计算机应用与软件.2014

[7].吴炳玮.二维文法的研究及其在联机手写数学公式识别的应用[D].华南理工大学.2014

[8].任昆.上下文感知手写数学公式识别[D].湘潭大学.2014

[9].徐旭明.在线手写数学公式识别的研究[D].淮北师范大学.2010

[10].潘伟民,齐向伟,玉素甫.终端嵌入式数学公式手写识别中的连笔搜索算法[J].江汉大学学报(自然科学版).2009

论文知识图

手写数学公式识别中较复杂的错...基于语音和笔的多通道手写数学公式用户修正技术在手写数学公式识别...汉王E粉笔Figure1-5HangWangE-chalk公式识别的分类服务安全性测试框架

标签:;  ;  ;  ;  ;  ;  ;  

手写数学公式识别论文_张文君
下载Doc文档

猜你喜欢