文本文档论文_杜青松,赵任洁

导读:本文包含了文本文档论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:文本,文档,语义,水印,波尔,图像,特征。

文本文档论文文献综述

杜青松,赵任洁[1](2019)在《基于Excel工作表和Txt文本文档批量处理度分秒与十进制度之间的转换》一文中研究指出利用Excel工作表的查询、替换功能,以Txt文本文件格式存贮的数据文档在导入Excel工作表时的分隔符功能和Excel工作表的最基本函数,批量实现度分秒与十进制度之间的转换。(本文来源于《电脑知识与技术》期刊2019年04期)

王孝飞[2](2019)在《基于文本文档的知识检索》一文中研究指出知识检索是在资料查询中运用的较为广泛的一种形式,它充分吸收了信息检索过程中遇到的问题,并运用语义、数据等形式,进行合理的、有效的检索。知识检索是基于知识本体进行操作的,而文本文档和知识本体之间有着一定的联系,基于此,对基于文本文档的知识检索进行了系统的分析和论述。(本文来源于《科技经济导刊》期刊2019年01期)

王琳[3](2016)在《短文本文档建模及查询扩展方法研究》一文中研究指出随着计算机和网络Internet的迅猛发展,从海量的信息资源中精确地获取信息变得越来越困难。海量信息中有很大一部分是以短文本的形式存在,同时短文本也是人们在日常生活中所必不可少的一种数据形式。短文本信息主要包括博客留言,微博信息,短信息,聊天记录等。其特点是信息长度短、语言形式灵活、数据规模大、时效性强、更新速度快。传统的文本挖掘方法没有考虑这些特点,不能够满足人们从大量短文本中准确获取信息的需要。因此发明并实现一种更为适合短文本信息的建模方法,具有重要的理论价值和实践意义。 本文具体研究工作如下:(1)提出一种更为适合短文本领域的文档建模方法,有助于提高短文本相关自然语言处理任务的准确度。使用叁层置信网络能量模型,融合词向量信息,同时学习文档在线性空间与非线性空间下的向量表达,从而将短文本映射成文本向量的形式。本文提出一种深层受限波尔兹曼机模型,模型中加入词向量信息,丰富了短文本数据的语义信息,可以更准确地对短文本文档进行抽象表达。在公开的叁个数据集上,使用得到的短文本线性表达与非线性表达进行文档分类与文档检索任务,均得到了令人满意的结果,提高了短文本数据在此类任务上的准确率。(2)提出一种使用词向量对检索词进行意图识别的查询扩展方法。利用深度学习训练得到的词向量具有线性关系的特性,结合文档建模方法中得到的单词权重,提出一种从全局角度进行查询扩展的方法。本文重点分析了伪相关反馈查询扩展方法与词向量查询扩展方法的不同,比较它们各自的优势与局限性。在新浪微博语料集上进行检索实验,结果表明,本文提出的融合基于全局文档集的查询扩展方法与局部文档集的查询扩展方法,可以有效去除扩展词中的噪音,提高扩展词的质量,最终提升检索任务的NDCG值。(本文来源于《大连理工大学》期刊2016-05-01)

张憧,张守彬[4](2015)在《基于Word文本文档的信息隐藏方法研究》一文中研究指出在信息技术快速发展的新时代,一些信息的保密性也逐渐被人们重视,尤其是计算机网络的安全。因此,对于信息隐藏技术的研究则是近年来信息安全领域的最为重要的研究。虽然我国对于信息隐藏的研究有了一定的进展,但是由于技术和环境的限制,在信息隐藏方法的研究过程中还是存在一定的难度,阻碍了信息隐藏技术的发展。本文就信息隐藏技术的相关基础概念与内容进行研究阐述,对基于Word文本文档的信息隐藏方法进行深入的研究,有效的解决信息安全问题,促进计算机技术的进一步加强。(本文来源于《电子技术与软件工程》期刊2015年12期)

黄淑芹,徐勇,常郝[5](2014)在《一种文本文档相似性计算的方法》一文中研究指出首先对当前文本文档相似度计算方法的优缺点及适用范围进行了分析.由于越长的词语表达的意思一般越完整,基于这一思想,对不同长度的词语赋予不同的权值,把长度为n的公共序列引入到相似度的计算中,构造了一文本相似度计算公式,对其中相似度计算公式的合理性给予了理论证明.最后,通过实验证明该方法是有效的.(本文来源于《吉林师范大学学报(自然科学版)》期刊2014年04期)

傅柱[6](2014)在《面向文本文档的语义标注研究综述》一文中研究指出语义网的实现需要为网络上现有的和新的文档进行广泛可用的语义标注,使其内容可被机器所识别和理解。语义标注是清晰、明确、容易理解的,可作为大量应用的服务基础,适用于多种文本,包括网页、普通(非网络)文档、数据库中的文本等。本文根据语义标注的研究历程,介绍了国内外面向文本的语义标注研究现状,对语义标注所使用的技术进行总结;在已有语义标注方法分类的基础上,对现有的标注方法进行分类分析;指出了近年来语义标注方法的不足,并探讨了面向文本文档的语义标注发展趋势。(本文来源于《情报学报》期刊2014年04期)

郭加旋[7](2014)在《面向非纯文本文档图像的检索技术研究与实现》一文中研究指出随着电子信息化进程的加快和互联网的快速发展,图像资源正海量的增长。越来越多的文档以图像的形式进行存储。文档图像中除了纯文本文档图像和纯表格文档图像外还有很多在文本中包含表格或图像的文档。如何对这些非纯文本内容的文档图像进行检索值得进行深入的研究。针对纯文本文档的检索技术主要提取与文本或字符有关的特征,这些特征对于文本中有表格或图像的文档图像则不适用。针对表格提取的特征同样不适用于文档中的文本部分。对于文本占主体同时包含表格或图像的文档图像,充分利用文本部分和非文本部分的特征,并且把两部分的特征很好的结合起来才能有效的表达图像。本文提出综合文档版面分析、全局特征以及局部特征的方法对文本图像进行特征提取和检索。在特征提取前首先对文档图像进行预处理。由于种种原因,文档以图像存储时可能会产生噪声或发生倾斜,这些干扰将影响到文档图像的特征提取,因此对文档图像进行预处理很有必要。本文通过对文档图像预处理的研究,对文档图像进行二值化、去噪、倾斜校正操作,使得文档图像便于特征提取。在特征提取时,分析文档的版面特征,把文档分为纯文本文档、包含表格的文档和包含图像的文档。针对纯文本文档和非纯文本文档中的文本部分,提取全局段落特征和局部像素特征;针对非纯文本文档中的表格部分,提取其相对空间位置特征和表格单元格框架特征;针对图像部分提取其空间位置特征和投影直方图特征。然后将所提取到的特征相结合作为文档图像的综合特征,以此作为对文档图像检索的依据。检索前,把图像库中文档图像的特征按文档类型的不同存到相应的特征库中。在检索时,根据文档的类型,把提取的文档图像特征与特征库中相应类型的特征进行匹配,根据特征向量之间距离的大小检索出最相似的图像。实验时分别对纯文本文档、包含表格的文档和包含图像的文档叁种类型的文档进行检索,通过与针对文本文档的检索方法和针对表格文档的检索方法进行对比,实验结果表明:通过对文档进行版面分析并把文档分成不同的类型,然后针对每一种类型分别提取全局和局部特征,最后对提取的特征进行综合的方法对非纯文本文档的检索有较高的正确率。(本文来源于《西南大学》期刊2014-04-18)

王潇[8](2013)在《浅析基于文本文档的数字水印加密技术》一文中研究指出随着计算机网络的发展,数字文本在传播过程中的版权问题成为目前市场上亟需解决的难题之一,不少非法商家就是利用电子出版物没有版权信息的缺陷,肆意盗版、篡改,对电子出版市场的发展起到了推泼助澜的作用。本文基于文本文档为载体,简单介绍几种文本水印加密技术,不但不会影响原文档的内容和使用价值,还不会轻易的被人或系统察觉到,能有效的帮助教师在教案的编写中杜绝他人抄袭的效果。(本文来源于《现代企业教育》期刊2013年22期)

王志军[9](2012)在《为文本文档添加自动保存功能》一文中研究指出我们知道,Word和WPS文字都提供了自动存档的功能,可以每隔一段时间保存bing自动恢复信息,这样就可以在一定程度上挽回编辑损失,但遗憾的是记事本并没有提供类似的功能,而记事本却是我们随手编辑的常用武器…只要安装EmEditor,即可代替记事本自动接管原有的文本文档(本文来源于《电脑迷》期刊2012年24期)

曲丹丹[10](2012)在《文本文档中嵌入水印技术》一文中研究指出本文主要提出文本文档水印问题和技术的概述。随着互联网技术的发展人们共享图像、音频和视频文件的信息很容易做到。此功能会产生文档的身份验证和所有权问题。解决这一问题的最佳方案之一就是数字水印技术。本文从各个角度阐述了文本文档的数字水印技术。(本文来源于《计算机光盘软件与应用》期刊2012年13期)

文本文档论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

知识检索是在资料查询中运用的较为广泛的一种形式,它充分吸收了信息检索过程中遇到的问题,并运用语义、数据等形式,进行合理的、有效的检索。知识检索是基于知识本体进行操作的,而文本文档和知识本体之间有着一定的联系,基于此,对基于文本文档的知识检索进行了系统的分析和论述。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

文本文档论文参考文献

[1].杜青松,赵任洁.基于Excel工作表和Txt文本文档批量处理度分秒与十进制度之间的转换[J].电脑知识与技术.2019

[2].王孝飞.基于文本文档的知识检索[J].科技经济导刊.2019

[3].王琳.短文本文档建模及查询扩展方法研究[D].大连理工大学.2016

[4].张憧,张守彬.基于Word文本文档的信息隐藏方法研究[J].电子技术与软件工程.2015

[5].黄淑芹,徐勇,常郝.一种文本文档相似性计算的方法[J].吉林师范大学学报(自然科学版).2014

[6].傅柱.面向文本文档的语义标注研究综述[J].情报学报.2014

[7].郭加旋.面向非纯文本文档图像的检索技术研究与实现[D].西南大学.2014

[8].王潇.浅析基于文本文档的数字水印加密技术[J].现代企业教育.2013

[9].王志军.为文本文档添加自动保存功能[J].电脑迷.2012

[10].曲丹丹.文本文档中嵌入水印技术[J].计算机光盘软件与应用.2012

论文知识图

一6uLene的索引架构一1web服务查找与发现过程审阅流程读取外部文本文档信息的计算图...爬行结果粘贴到文本文档中我...在文本文档中总共有3000个链接

标签:;  ;  ;  ;  ;  ;  ;  

文本文档论文_杜青松,赵任洁
下载Doc文档

猜你喜欢