文档分析论文_孙锦伟

导读:本文包含了文档分析论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:文档,数据,结构化,版面,表格,满文,数据管理。

文档分析论文文献综述

孙锦伟[1](2019)在《机关文秘人员的工作意识与文档管理分析》一文中研究指出目前,我国机关单位的档案管理工作主要由文秘人员负责,文秘人员在这方面的工作能力稍有欠缺,在进行文档管理工作过程中仍然存在着很多的问题。本文通过了解文秘人员具备文书档案管理的要求,分析文秘人员需要具备的工作意识,探究文秘人员进行文档管理的具体措施,从而提高文档管理工作的工作效率和质量。(本文来源于《河北农机》期刊2019年11期)

竺博,吴嘉嘉,何春江,胡金水[2](2019)在《人工智能在手写文档识别分析中的技术演进》一文中研究指出本文简要回顾手写文档识别和分析技术在过去十年的技术变化,对比各项主要技术的原理和性能,着重分析基于深度学习的神经网络方法在文档识别分析应用中所带来的显着效果提升。(本文来源于《电子测试》期刊2019年13期)

张昊玥[3](2019)在《非结构化文档的版面分析及表格提取》一文中研究指出现实生活中有大量的文档数据是以图像的形式存在的,如何将这些非结构化的图像数据进行结构化转换是对非结构化文档进行自动分析的初始步骤和关键技术。以此为目的,本论文采用基于改进的区域卷积神经网络(region-based convolutional neural network,R-CNN),即 Faster R-CNN 结构的深度学习网络模型并使用基于图像处理中投影计算的算法,对非结构化的文档图像进行了版面内容的自动分类与定位,并且对非结构化文档图像中的表格进行了识别、提取与转换,实现了对非结构化文档图像完成结构化转换的目的。本论文的主要内容包括非结构化文档图像的版面分析和文档图像中表格识别两部分。具体工作内容如下:在非结构化文档图像的版面分析部分,先对非结构化的文档进行半结构化图片的转换,再对转换了的图片进行投影计算,使用图像处理算法和模式识别方法对图片中的各版面组成部分进行分类和初步定位。对于图像处理后的结果不确定的情况,再采用Faster R-CNN的方法进行判断并得出结论,进而实现非结构化文档版面的结构化。这种方法在有效控制计算量的同时也降低了对深度学习所需要的数据集规模的要求,能够准确地对版面结构进行分类并精确定位非结构化文档中的表格部分。在非结构化文档的表格识别部分,着重对图像中出现的噪声影响严重、表格倾斜及有遮挡情况进行了处理,并对非结构化文档中提取出的表格进行类型细化,对全线表格、纯横线表格、色彩相间表格以及无线表格分别进行处理和算法设计,具体问题具体分析,使得表格结构识别的精度更高。最后对识别后表格中的每一个单元格进行切分,分别进行字符识别,完成Excel格式下表格内容的结构化复现。采用平均精度均值(Mean Average Precision,mAP)为指标,衡量了 Faster R-CNN网络对非结构化文档的分类及定位效果,并通过对表格识别算法的识别及转换率(识别并转换完成的表格数量与实验总样本数量的比值)的统计,对表格识别算法的效果进行的评估。本论文中所采取方法所得到的结果中mAP指数为71.3%,表格的识别转换率总体为81%。经过研究,本论文实现了对较常见非结构化文档版面内容的分类和定位功能;同时实现了将非结构化文档版面中表格部分的识别、提取以及复现为Excel格式表格的功能。测试结果表明,论文实现的方法能够比较准确地完成非结构化文档中文字、图片和表格的识别和定位功能;同时能够比较准确地将非结构化的表格复现为Excel格式的电子表格,为非结构化文档的进一步自动化处理奠定了良好的基础。(本文来源于《北京交通大学》期刊2019-06-03)

张丽[4](2019)在《印度对“一带一路”倡议的认知与应对实证研究》一文中研究指出“一带一路”倡议自2013年被提出以来,受到沿线沿路国家积极响应,逐渐从理念转化为行动,从愿景转化为现实。随着丝路基金设立、《愿景与行动》实施方案出台、亚洲基础设施投资银行成立、以及倡议被写入联合国大会决议,“一带一路”倡议得到国际社会广泛认可,并被普遍视为新时代中国外交战略布局有机组成部分。作为亚洲基础设施投资银行主要创始成员国的印度却公开反对“一带一路”倡议,引起国内外关注和研究。中印共同崛起成为21世纪亚洲甚至国际政治新动向。作为世界人口基数最大、毗邻而居的两个发展中国家,中印面临着市场、资源、地区影响力竞争等诸多挑战。两大新兴经济体能否打破冲突魔咒实现和平共处,对双边关系、亚洲乃至全球稳定至关重要。印度对“一带一路”倡议的负面认知不仅严重影响了中印合作,而且加剧了南亚地区安全紧张局势。分析印度对“一带一路”倡议的关切、态度及应对,探究印度对华认知影响因素,厘清错误知觉产生的根源,对于中印两国增进互信互谅、形成良性战略互动将起到积极作用。本文通过实证研究对建构主义视角下国家身份理论及国际政治错误知觉两个理论假设的有效性进行充分验证。本文第一章主要阐述从尼赫鲁到英迪拉再到人民党执政期间印度国家身份认知对其南亚政策的影响。第二章通过对2000年至2018年间18份印度外交年报,尤其是莫迪执政以来相关外交文档文本分析,论述印度外交战略布局及其对华政策定位转变。第叁、四章为本文主体论证部分,对包括2013年10月至2019年2月期间112组议会相关问答、30组新闻发布会相关记者问答、38份外交部相关新闻通告、6份政要演讲在内的192份印度外交文档进行话语及潜在语义分析,研究文本对象的立场、观点、价值、利益等,推断其背后的意图和目的,并据此系统梳理总结印度对“一带一路”倡议的认知、态度、关切及应对。第五章探析印度对“一带一路”倡议认知的影响因素及印度视角下中印关系走向。本文研究表明,印度对“一带一路”倡议的态度主要取决于地缘政治及经济博弈下国家利益的权衡,大致经历了观望争议、不合作、抗衡抵制、竞争合作四个阶段,目前仍处于动态建构中。印度致力于追求大国地位,视中国为市场资源及地区主导权竞争对手,尤其忌惮中国在其传统势力范围加大存在。随着南亚国家与中国在“一带一路”框架下取得显着合作成效,印度对“一带一路”倡议态度出现从摇摆到抵制的较大转变。2018年1月以来美国特朗普政府推行贸易单边主义及对伊制裁使印度国家利益受损,印度重新审视对美政策,提升印俄及印中关系,逐渐回归大国平衡外交,印度对“一带一路”倡议态度随之“柔化”。印度对中巴经济走廊领土主权关切及对中国在南亚印度洋地区存在增大的关切,本质上都体现了印度的安全焦虑。一方面,印度担心巴基斯坦在中国经济及军事援助下获得对印战略优势,从而威胁印度国家安全。另一方面,印度唯恐中国在南亚印度洋地区存在不断增加,危及印度地区主导权。因此,印度通过“邻国优先”政策加强与南亚次大陆国家互联互通、通过“向东行动”政策对接东南亚国家、通过伊朗恰巴哈尔港经阿富汗联通中亚国家、通过印日联盟打造“亚非增长走廊”等战略举措,初步构建以印度为中轴向四周辐射的印度版“一带一路”规划,并借力美-日-印-澳四方安全对话,在“印太”地区抗衡中国影响力。印度对华认知建立在对国际形势研判、自我定位及对中国角色身份定位等基础上,对“一带一路”倡议的错误知觉主要受认知相符、诱发定势、历史包袱等叁个维度因素影响。自我与他者身份是动态建构的产物,国家间通过行为互动确定敌人、对手或朋友关系。中印之间缺乏战略相互保障,印度将中国在南亚防御性安全行为解读为进攻性战略,在此棱镜下,印度对华负面认知不断集聚,加之历史偏见的现实影射以及西方舆论的激化,从而导致洞朗对峙发生。中印互信缺乏根源在于人文交流动能不足,民众间沟通渠道不够畅通,更遑论培养相互认同感。长远来看,自下而上的民间模式比自上而下的政府模式更具可持续性,更有利于中印关系发展。(本文来源于《中共中央党校》期刊2019-06-01)

陈璇,贺建军,李厚杰,武林秀[5](2019)在《基于Mask R-CNN的满文文档版面分析》一文中研究指出提出一种基于Mask R-CNN深度学习框架的满文文档版面分析方法,将满文文档版面分析问题转化为基于深度学习的图像实例分割问题。使用ResNet101网络和FPN网络构成的卷积神经网络自动提取满文文档图像特征,特征图经过RPN网络和RoI Align层生成新的特征图。新特征图经过全连接层完成感兴趣区域的类别和边框预测,并经过全卷积神经网络对感兴趣区域的像素进行分类得到mask预测,最终实现满文文档图像的实例分割。通过《新满汉大辞典》的文档图像构建了满文文档图像数据集,算法在该满文文档图像数据集上进行了实验。实验结果表明,本算法在满文文档版面分析中取得了较好的检测和分割效果。(本文来源于《大连民族大学学报》期刊2019年03期)

陈美芳[6](2019)在《基于智能语音的车辆售后技术文档需求分析与研究》一文中研究指出随着语音识别和自然语言处理技术的进步,车载等智能语音应用越来越广泛,传统车辆售后技术文档转化为适用智能语音的结构语言面临极大挑战。文章基于智能语言技术来分析车辆售后技术文档的多个基本需求,如支持对话形式的检索语言、分解场景和用户的操作意图等,以及研究支持智能语音的车辆售后技术文档语音基础词库、知识模型、数据结构化等要求。(本文来源于《汽车实用技术》期刊2019年07期)

张真,李宁,田英爱,耿思,许洁[7](2019)在《语法分析与纠错相结合的文档结构重构方法》一文中研究指出对于传统方法在处理结构不规范的流式文档时的不足,提出一种左角分析和纠错规则相结合的新的流式文档结构重构方法。使用XML Schema构造文档逻辑构件的排版规则语法树;在排版规则语法树引导下,利用左角分析方法分析文档的逻辑构件,实现文档结构的重构;结合纠错规则对文档中的错误进行判断和改正,保证文档结构重构过程的顺利进行,得到最佳的流式文档结构。实验结果表明,所提方法在流式文档结构重构过程中的容错能力和识别准确率均优于其它算法。(本文来源于《北京信息科技大学学报(自然科学版)》期刊2019年02期)

米静[8](2019)在《大数据时代文档一体化管理的构建与实施方案分析》一文中研究指出伴随着社会的进步,时代的发展,文档一体化的发展已成为档案管理中的重要组成部分。在当今科技时代,Big Date(即大数据)时代,文档一体化的管理构建与实施更需要不断地改革创新,以紧追时代的步伐。大数据,显然易见,代表的是大量的数据集合,通过这些海量数据的整理与分析,从而使产品等获得更好效果的一种信息处理模式。在此类情况下,以文档一体化管理方式来替代传统的档案管理方式,不仅极大地改善了纸质载体形式的缺点,在数据完整性方面,更是有着无与伦比的优势。因而,在大数据时代文档一体化管理的构建与实施显得尤为重要。(本文来源于《办公室业务》期刊2019年07期)

孙护军[9](2019)在《基于大数据分析的增强型网络文档分类模型》一文中研究指出针对海量网络文档涵盖着广泛的主题和类别,需要使用大数据技术提取有用信息的问题,使用文本挖掘技术和进化模糊算法,基于模糊规则的分类器,提出一种增强型网络文档分类模型,将网络文档归到不同类别(领域)中,进化模糊算法可依据文档内容的变化实现文档分类的动态实时更新。通过和其它经典分类算法对比,验证了该分类算法能够取得较好的效果。(本文来源于《计算机工程与设计》期刊2019年03期)

蒋洪,苏钊[10](2019)在《微信公众号实训文档的分析与研究》一文中研究指出微信不仅能够为人们提供快捷的通讯交流体验,而且利用微信公众号还能够及时获取各种讯息资源。在基础技能电工实训教学中应用微信公众号技术,可以通过分析和研究教师课堂教学方法和学生学习活动过程实训文档信息,了解学生在教学过程中的学习动态,及时调整课堂教学方法和教学进度,有效促进课堂教学方法灵活多样化,提高课堂教学效率。(本文来源于《科技资讯》期刊2019年04期)

文档分析论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文简要回顾手写文档识别和分析技术在过去十年的技术变化,对比各项主要技术的原理和性能,着重分析基于深度学习的神经网络方法在文档识别分析应用中所带来的显着效果提升。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

文档分析论文参考文献

[1].孙锦伟.机关文秘人员的工作意识与文档管理分析[J].河北农机.2019

[2].竺博,吴嘉嘉,何春江,胡金水.人工智能在手写文档识别分析中的技术演进[J].电子测试.2019

[3].张昊玥.非结构化文档的版面分析及表格提取[D].北京交通大学.2019

[4].张丽.印度对“一带一路”倡议的认知与应对实证研究[D].中共中央党校.2019

[5].陈璇,贺建军,李厚杰,武林秀.基于MaskR-CNN的满文文档版面分析[J].大连民族大学学报.2019

[6].陈美芳.基于智能语音的车辆售后技术文档需求分析与研究[J].汽车实用技术.2019

[7].张真,李宁,田英爱,耿思,许洁.语法分析与纠错相结合的文档结构重构方法[J].北京信息科技大学学报(自然科学版).2019

[8].米静.大数据时代文档一体化管理的构建与实施方案分析[J].办公室业务.2019

[9].孙护军.基于大数据分析的增强型网络文档分类模型[J].计算机工程与设计.2019

[10].蒋洪,苏钊.微信公众号实训文档的分析与研究[J].科技资讯.2019

论文知识图

各方法单语言中文(CC)分类性能比较叁维CAD/CAE系统集成流程框架聚类过程机床再制造工艺过程视图内容查询与分级查询的搜索时间对比分...一1web服务查找与发现过程

标签:;  ;  ;  ;  ;  ;  ;  

文档分析论文_孙锦伟
下载Doc文档

猜你喜欢