导读:本文包含了信息自动获取论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:数据,信息,信息检索,分词,爬虫,向量,语义。
信息自动获取论文文献综述
周昆[1](2019)在《开放域党建信息自动获取及智能标引系统的设计与实现》一文中研究指出“互联网+党建”概念提出以来,互联网上党建领域信息日趋丰富。面向党建领域的垂直检索系统可以为党建用户提供专业准确且低冗余的领域内容。构建党建垂直领域检索系统需要以党建领域文本作为基础数据。同时为了提升党建领域垂直检索系统的检索质量,需要将党建领域文本中包含的关键信息标引出来,作为检索结果展示给用户,使返回结果更加直观。如果可以挖掘出用户检索内容中潜在的实体关系,并结合从党建数据中标记出的实体关系对待检索内容进行处理,则可以改善党建领域垂直检索系统中用户查询内容与检索结果之间的相关性。为解决党建领域文本数据的采集问题,本文设计了开放域党建信息自动获取系统,提出了基于语义关系与链接结构、用于预测未访问链接主题相关性的链接主题相关度预测算法,并基于此算法实现了党建领域语义相关度主题爬虫,用于采集互联网开放域中的党建信息。根据选定的主题词,利用页面描述信息,基于维基百科中文语料训练出的词向量综合HowNet计算页面的语义相关度,结合URL的结构信息预测未访问URL链指的页面与党建领域的相关程度。最终将系统采集到的党建领域数据作为构建党建领域垂直搜索引擎的基础数据。为解决目前缺少用于提升党建领域垂直检索系统检索结果的直观度、改善检索结果相关性的标注数据的问题,并兼顾批量数据更新场景下数据的完整性与时效性,本文设计了一种用于综合考虑历史全量数据与实时增量数据查询更新处理过程的系统架构,并基于该架构实现了智能标引系统。该系统抽取采集到的党建语料中的关键词与实体间关系作为标引结果,并将其应用到党建领域检索的结果展示中;将全量数据处理与流数据处理结合,综合考虑了标注结果的完整性与时效性。开放域党建信息自动获取及智能标引系统能够解决党建信息采集以及标注问题,并在性能以及准确性上进行了一定验证。(本文来源于《中国科学院大学(中国科学院沈阳计算技术研究所)》期刊2019-06-01)
符浩军,范承啸,张海勃[2](2019)在《基于矢量地图数据的地名信息自动获取与融合方法》一文中研究指出提出了一种基于矢量地图数据的地名信息自动获取与融合方法。首先,分析了矢量地图数据与地名数据之间的相关关系;然后,从属性、空间、元数据3方面基于现有地理数据成果,设计了基于矢量地图的地名信息自动提取策略;在此基础上,以提取的地名信息集为处理对象,提出了一种地名信息自动融合算法,保证了所提取地名信息的属性唯一和实体完整。实验表明,采用该方法不仅能从现有矢量地图数据中有效地获取地名相关信息满足地名工程建设要求,而且充分利用了现有地理数据成果,避免了地名信息的重复建设。该方法为地名相关工程建设中地名数据的生产、更新提供一种新思路。(本文来源于《测绘地理信息》期刊2019年02期)
霍文丰[3](2018)在《镀锌生产线入口钢卷信息自动获取功能的研究与应用》一文中研究指出结合生产设备并根据生产需求开发了镀锌生产线入口钢卷信息自动获取功能。控制系统顺序接收叁级下发的生产计划信息并存储到数据库中;在生产过程中,根据入口钢卷存储鞍座的钢卷触发信号从数据库中顺序获取钢卷ID信息,然后将钢卷信息加载到生产数据中,实现钢卷的信息自动获取功能,满足了现场生产需求,简化了入口生产操作。(本文来源于《冶金自动化》期刊2018年06期)
李元,丰磊,吴玲惠,舒青龙[4](2018)在《基于Perl脚本在NCBI网站自动或批量获取物种信息》一文中研究指出根据物种学名、分类号、任意一段核酸或蛋白质的序列,判定其属于什么物种及其详细分类的信息如何,是生物信息分析的最为基础且重要的环节,但该过程的分析及结果的获取均为手动,费时费力且容易出错。本研究旨在解决如何在NCBI网站上自动或批量获取物种信息。通过解析NCBI在线BLAST结果及其网页源程序特点,利用Perl语言编写自动化脚本,以达到批量获取查询或比对结果的物种分类信息。本研究编写的Perl语言脚本可解决序列在NCBI在线比对后自动或批量获取物种的分类信息问题,适用于细菌、真菌、动物、植物等物种学名、分类号、核酸或蛋白质的任意序列,可以为同行生物数据分析提供参考。(本文来源于《生物信息学》期刊2018年03期)
王江,郭秋红,梁秀霞[5](2017)在《数据新闻制作应用中基于正文信息定位的自动数据获取方法》一文中研究指出随着数字化的日益普及、数据量的急剧增长,大数据正逐步深入我们的生活。为了对数据进行有效的处理与展示,数据新闻应运而生并成为新闻界应对信息爆炸式增长的新型新闻形式。为实现数据新闻中数据获取方法的精确性以及高效性,本文结合DOM树和统计的方法,在新闻网页特征分析的基础上提出了基于正文信息定位的新闻网页正文信息定位算法,并在此基础上实现了对数据新闻制作中数据的自动精确获取、"清洗"和可视化。(本文来源于《2017中国自动化大会(CAC2017)暨国际智能制造创新大会(CIMIC2017)论文集》期刊2017-10-20)
周斯涵,刘月兰[6](2017)在《基于Python的自动获取生物信息数据的软件设计》一文中研究指出从国际生物信息学数据库中采集数据来进行相关领域的分析,但随着数据库规模不断扩大,数据来源种类繁多,即便是直接从网页中搜索所需的数据,仍十分繁琐并且消耗了大量的时间.为了解决该类问题,基于Python开发出了一款可自动从云端数据库中获取指定的数据的应用软件,有效地解决了在巨量生物信息数据中如何准确检索与快速获取的难题.(本文来源于《哈尔滨师范大学自然科学学报》期刊2017年04期)
吴春燕,黄巧梅,刘海清,张捷[7](2017)在《文本主要信息的自动获取和主体挖掘》一文中研究指出文本挖掘是数据挖掘的重要内容之一,其应用十分广泛。对文本文件进行分析的一个前提条件是对文本文件进行分词处理,中文分词是进行中文信息处理的一个难点。为此,本文采用了分词算法~([1])和支持向量机~([2])对文本进行分类,设计和实现文本文件主要信息自动获取系统。。(本文来源于《信息技术与信息化》期刊2017年03期)
黄杨[8](2017)在《基于“信息技术+翻转课堂”混合模式的教学设计——以“IP地址的自动获取”为例》一文中研究指出目前混合式教学成为中职教学改革的一个重要研究方向。文章设计了基于"信息技术+翻转课堂"混合式教学模式,将其应用到计算机网络课的课前、课中、课后的教学实践中,达到了良好的教学效果。(本文来源于《学园》期刊2017年08期)
杨柳,仇顺海[9](2015)在《面向军事特种医学深网信息的自动获取技术研究》一文中研究指出互联网上存在的国外军事特种医学研究信息具有一定的保密性和时效性,采用简单搜索方式难以查取。因信息大多在深网中存在,采用人工跟踪和捕获的方式耗费时间多,数据初加工的人力消耗大,不利于数据的长期积累。1研究背景由于科研任务的需要,笔者在开展网上特种医学资源研究时接触到大量处于网站深层结构中的拒绝链接或未被链接的"孤岛网页"、动态网页等深网数据。这些网页因隐藏的专业数据数量多,且发展速度快,成为重要的网络数据来(本文来源于《海军医学杂志》期刊2015年03期)
薛元庆,孟凤娇,张海峰[10](2014)在《自动获取软件操作信息的通信组件设计》一文中研究指出为捕获软件操作界面和其上输入的信息以便于日后追溯生产情况,本文将客户端抓取的相关信息自动实时同步传输和集成到服务器端相应的数据表中,同时,服务器端需及时把接收的信息按照需求进行比对和分析,且将其结果实时传输给客户端。在这一相互通信中,会出现数据包猝发、丢失、实时性差等问题,为此,本文设计研究基于时间驱动机制、超时重发机制的网络通信组件,并实际应用于基于电子码的企业生产监管系统中,有效实现了客户端和服务器端之间的信息实时传输。(本文来源于《计算机与现代化》期刊2014年09期)
信息自动获取论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
提出了一种基于矢量地图数据的地名信息自动获取与融合方法。首先,分析了矢量地图数据与地名数据之间的相关关系;然后,从属性、空间、元数据3方面基于现有地理数据成果,设计了基于矢量地图的地名信息自动提取策略;在此基础上,以提取的地名信息集为处理对象,提出了一种地名信息自动融合算法,保证了所提取地名信息的属性唯一和实体完整。实验表明,采用该方法不仅能从现有矢量地图数据中有效地获取地名相关信息满足地名工程建设要求,而且充分利用了现有地理数据成果,避免了地名信息的重复建设。该方法为地名相关工程建设中地名数据的生产、更新提供一种新思路。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
信息自动获取论文参考文献
[1].周昆.开放域党建信息自动获取及智能标引系统的设计与实现[D].中国科学院大学(中国科学院沈阳计算技术研究所).2019
[2].符浩军,范承啸,张海勃.基于矢量地图数据的地名信息自动获取与融合方法[J].测绘地理信息.2019
[3].霍文丰.镀锌生产线入口钢卷信息自动获取功能的研究与应用[J].冶金自动化.2018
[4].李元,丰磊,吴玲惠,舒青龙.基于Perl脚本在NCBI网站自动或批量获取物种信息[J].生物信息学.2018
[5].王江,郭秋红,梁秀霞.数据新闻制作应用中基于正文信息定位的自动数据获取方法[C].2017中国自动化大会(CAC2017)暨国际智能制造创新大会(CIMIC2017)论文集.2017
[6].周斯涵,刘月兰.基于Python的自动获取生物信息数据的软件设计[J].哈尔滨师范大学自然科学学报.2017
[7].吴春燕,黄巧梅,刘海清,张捷.文本主要信息的自动获取和主体挖掘[J].信息技术与信息化.2017
[8].黄杨.基于“信息技术+翻转课堂”混合模式的教学设计——以“IP地址的自动获取”为例[J].学园.2017
[9].杨柳,仇顺海.面向军事特种医学深网信息的自动获取技术研究[J].海军医学杂志.2015
[10].薛元庆,孟凤娇,张海峰.自动获取软件操作信息的通信组件设计[J].计算机与现代化.2014