导读:本文包含了语义挖掘论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:语义,神经网络,模型,文本,卷积,深度,谓词。
语义挖掘论文文献综述
王娜娜,张顺香[1](2019)在《基于句法与语义特征分析的朋友关系挖掘》一文中研究指出本文基于句法与语义特征分析提出一种朋友关系挖掘方法。首先,提出综合知网和同义词词林的词语语义相似度计算方法,从两者库中提取朋友关系描述词,得到朋友关系描述词库;其次,在处理微博文本数据时运用核心谓词、依存句法以及语义分析等方法,从微博文本中挖掘朋友关系;其中,核心谓词能确定朋友实体对,依存句法能描述前后词语间存在的关系,语义分析能进一步挖掘文本信息。实验结果证明朋友关系挖掘准确率显着提高。(本文来源于《阜阳师范学院学报(自然科学版)》期刊2019年03期)
普树芳[2](2019)在《基于移动计算平台的轨迹数据挖掘语义化感知技术研究》一文中研究指出如今智能手机的发展发生了质的飞越,无论是硬件技术还是软件技术,双核、四核智能手机在现今的人们看来已是很平常,操作系统也在更新换代,对于人工智能已不是遥不可及。智能手机平台上的各种应用给人们提供了极大的便利。因此,利用智能手机来实现数字化轨迹感知正是适应了这一主流趋势,充分拓展了智能手机的应用范围。随着人们对4A(anything,anywhere,anybody,anytime)位置信息的需求不断增加,当前实时位置信息已成为人们最受关注的服务之一,现如今人们的活动范围越来越大,随之而来的是越来越多的不确定性。这种移动性和不确定性给数字化轨迹研究带来了更多可能性,也让位置感知计算推进了一大步。该技术通过GPS和WiFi进行结合,在不同的情景下使用不同的定位方式,以移动设备终端进行数据采集,对行为轨迹信息结构设计和语义化,便于用户进行行为轨迹信息的分析查询。(本文来源于《科技资讯》期刊2019年24期)
王涛,李明[3](2019)在《基于LDA模型与语义网络对评论文本挖掘研究》一文中研究指出通过主题模型与语义网络对旅游电商中的评论文本进行挖掘,从而引导消费者与商家对评论信息作出重要决策;提出一种基于LDA(Latent Dirichlet Allocation,LDA)主题聚类与语义网络模型(LDA topic clustering and semantic network model,LTC-SNM)的方法对酒店在线评论文本进行研究;获取在线评论文本进行数据预处理,使用Word2vec生成词向量,利用机器学习算法对评论文本进行情感分类;通过LDA主题模型对分类后的文本进行聚类,生成酒店的特征主题词;通过ROSTCM将特征主题词与所修饰的情感词生成语义网络,缓解了挖掘文本信息的复杂性;实验结果表明:提出的LTC-SNM文本挖掘方法使得在线用户评价的主题更具表达性。(本文来源于《重庆工商大学学报(自然科学版)》期刊2019年04期)
徐里萍,侯玲,张建欣,赵丽[4](2019)在《利用改进型语义特征的Web商品信息挖掘方法》一文中研究指出针对于互联网商品信息数据量庞大的问题,提出一种基于改进型轻量级语义特征提取的web商品信息挖掘方法。首先,通过分析网站链接的层级关系,采用层次访问的方式抓取电子商店的网站URL。其次,采用改进型轻量级语义特征提取方法对元素进行聚类以实现电子商店页面内商品记录的提取。最后,利用产品属性格式和产品记录结构的常识信息进行正则匹配,实现商品属性的提取。实验采用该方法提取来自不同国家的两个电子商店网站不同产品的属性,实验结果表明,提出的方法较好地兼顾了信息提取的完整性和准确性,商品信息的平均提取准确率可高达98. 39%。(本文来源于《信息技术》期刊2019年07期)
庄建昌,武娇,顾兴全,洪彩凤[5](2019)在《基于热词语义聚类的领域特征挖掘方法》一文中研究指出目的:帮助人们更好地利用领域关键词挖掘和分析领域特征,解决领域关键词提取技术面临的领域语料信息冗余且分布不均衡的问题。方法:提出二次关键词提取策略,并结合词向量模型和聚类算法构建领域的局部热词模型。结果:得到了领域的热词和热词频率分布、特征划分及其分布图。结论:旅游评论挖掘的结果表明该方法能够有效提取领域特征,实现领域特征可视化,降低领域语料分布不平衡的负面影响。(本文来源于《中国计量大学学报》期刊2019年02期)
乔德地[6](2019)在《深度好奇 用深度语义理解挖掘商业价值金矿》一文中研究指出深度学习更偏向"端到端"的学习模型。自然语言理解一方面承载着机器与人的交流,另一方面直达知识与逻辑。视频领域已经有诸如商汤科技、face++等知名创业公司,但对自然语言(特别是复杂文本)的智能化处理才刚刚开始。让机器处理自然语言,难度在于人类信息(本文来源于《创业邦》期刊2019年06期)
蒋逸雯,李黎,李智威,苏超,王干军[7](2019)在《基于深度语义学习的电力变压器运维文本信息挖掘方法》一文中研究指出电力变压器运维过程中形成的工作票及操作票等文本蕴藏着丰富的设备状态信息,然而由于中文文本结构和语义的复杂性,难以进行信息挖掘。针对该现状,提出基于深度语义学习的变压器运维文本信息挖掘方法。首先分析并归纳传统文本挖掘模型的局限性及变压器运维文本的特点,然后利用分布式文本学习工具word2vec,自动学习语义信息,将单词用低维稠密向量表示,并建立循环卷积神经网络,基于其端到端的网络结构提取文本的深层语义特征。基于变压器运维文本的案例分析表明,所提方法比常规文本挖掘方法的语义学习能力更优。通过对非结构化文本数据的信息挖掘,有利于今后结合结构化数据,全面评估变压器运行状态。(本文来源于《中国电机工程学报》期刊2019年14期)
沈海兰[8](2019)在《基于文本挖掘的语义相近程度副词的使用情况研究》一文中研究指出韩国语的程度副词是指对谓词或者副词在程度上加以限定或修饰的副词。韩国语的程度副词中有些语义相近,可以替换使用。本文运用文本挖掘方法,研究了网络报纸、新闻中出现的语义相近的程度副词"■""■""■"的使用情况,并且通过N-Gram分析了"■""■""■"的连语。(本文来源于《韩国语教学与研究》期刊2019年02期)
韩朋[9](2019)在《基于跨语言映射的语义相似项挖掘》一文中研究指出随着世界文化的交融和信息的多样式传播,文本信息处理依旧是信息技术中最重要的研究与应用领域之一。近些年,随着各种语言在各国的推广以及国内外研究学者更多的发表外文期刊,跨语言映射下的研究显得尤为重要。跨语言映射是一种跨越语言界限进行获取知识的问题,同时它又属于数据挖掘领域。为了提高汉语相似词汇聚类的结果,我们在研究了英语词汇构造后,提出了通过汉语翻译英语的跨语言映射,将汉语映射到英语中进行处理,获取汉语的语义相似项集合。课题中主要运用了在建立双语字典时跨语言映射的规则、词汇语义相似度的计算、特征值的提取和数据挖掘技术中的聚类算法等知识,对通过网络爬虫程序收集的汉语词汇进行了语义相似项挖掘。本文的主要研究内容如下:1、建立跨语言映射的双语字典。编写以建立的本地汉语词汇库为主题的网络爬虫程序,借助网络词典以本地汉语词汇为关键词进行检索,收集每个汉语词汇的html文件。然后,通过数据预处理操作,对html文件进行数据清洗和数据集成,组成基于网络词典的统计地Key-Values键值对,并且以键值对为基础建立跨语言映射字典。结果表明,我们建立的双语字典涵盖的词汇更丰富,对以后的实验更加有利。2、特征值的提取。在研究word2vec的基础上,调整了CBOW模型,对字典的Values进行词汇向量化,通过PCA算法对向量化后组成的向量矩阵进行计算,得出特征值。3、选取K-means聚类算法对特征值进行距离的计算,通过迭代模式,获取特征值的聚类结果。再利用对应关系得到英语词汇的聚类,通过字典的values查询key,获取汉语词汇语义相似项的集合。本文研究成果不仅得到了汉语词汇语义相似项集合,同时也建立了一个较为丰富的汉英双语字典,具有一定的实践意义,有助于推动自然语言处理领域对汉语文本的发展。(本文来源于《济南大学》期刊2019-06-01)
池军奇[10](2019)在《基于深度语义挖掘的标题生成技术研究与实现》一文中研究指出信息化的迅速发展给人们带来便利的同时,也使得网络中充斥着大量冗余、非结构化的文本信息,这也大大降低了人们获取信息的效率。自动摘要技术可以帮助人们快速地获取信息,而利用标题生成技术则可以获得更加简洁的摘要。本文将其作为研究任务,针对短文本语料和长文本语料,分别从文本特征表示和层级模型两个方面深入挖掘文本语义信息进行标题生成。在文本特征表示方面,为了深入挖掘语义信息,本文针对短文本语料进行了基于词向量的文本特征表示研究。在词向量基础上,引入多种抽取式摘要中常用的特征,如词频、位置、聚类以及层次分布等特征,使文本特征表示对标题生成具有任务倾向性,并对这些文本特征的不同组合和表示进行相关研究;引入这些特征可以从语言学、统计学等角度对文本语义进行深入挖掘。在特征表示时,本文将词向量与引入特征直接进行拼接;并在此基础上,针对标题生成任务训练专门的词向量,利用命名实体,词性、主题特征等信息构造新的词向量训练语料,以期得到的词向量包含部分语言学和统计学信息等。在标题生成任务中引入抽取式摘要特征可以与词向量在表示语义时相互补充,从而全面多角度地深入挖掘文本语义信息。通过对比实验验证其有效性。此外,对稀疏词语义进行不同类别的细化表示,实验表明其对性能提升有一定作用。在模型方面,本文提出了一种标题生成的层级模型,利用抽样算法和序列映射两个过程深入挖掘文本的重要语义信息。其中,抽样算法包括抽样概率公式和行列式点过程(Determinantal Point Processes,DPPs)抽样;序列映射主要利用序列到序列模型实现输入序列到输出序列的语义映射。针对短文本语料先利用所构造的抽样概率公式进行词抽样挖掘重要语义信息,然后利用序列到序列模型生成标题;针对长文本语料先利用DPPs进行句子抽样筛选语义信息,并提出静态DPPs抽样算法和动态DPPs抽样算法增加筛选语义的多样性;实验结果表明,层级模型中动态DPPs抽样算法将抽样得到长摘要的字数限制在一定范围时,能够提高长文本语料标题生成的质量。(本文来源于《北京邮电大学》期刊2019-05-31)
语义挖掘论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
如今智能手机的发展发生了质的飞越,无论是硬件技术还是软件技术,双核、四核智能手机在现今的人们看来已是很平常,操作系统也在更新换代,对于人工智能已不是遥不可及。智能手机平台上的各种应用给人们提供了极大的便利。因此,利用智能手机来实现数字化轨迹感知正是适应了这一主流趋势,充分拓展了智能手机的应用范围。随着人们对4A(anything,anywhere,anybody,anytime)位置信息的需求不断增加,当前实时位置信息已成为人们最受关注的服务之一,现如今人们的活动范围越来越大,随之而来的是越来越多的不确定性。这种移动性和不确定性给数字化轨迹研究带来了更多可能性,也让位置感知计算推进了一大步。该技术通过GPS和WiFi进行结合,在不同的情景下使用不同的定位方式,以移动设备终端进行数据采集,对行为轨迹信息结构设计和语义化,便于用户进行行为轨迹信息的分析查询。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
语义挖掘论文参考文献
[1].王娜娜,张顺香.基于句法与语义特征分析的朋友关系挖掘[J].阜阳师范学院学报(自然科学版).2019
[2].普树芳.基于移动计算平台的轨迹数据挖掘语义化感知技术研究[J].科技资讯.2019
[3].王涛,李明.基于LDA模型与语义网络对评论文本挖掘研究[J].重庆工商大学学报(自然科学版).2019
[4].徐里萍,侯玲,张建欣,赵丽.利用改进型语义特征的Web商品信息挖掘方法[J].信息技术.2019
[5].庄建昌,武娇,顾兴全,洪彩凤.基于热词语义聚类的领域特征挖掘方法[J].中国计量大学学报.2019
[6].乔德地.深度好奇用深度语义理解挖掘商业价值金矿[J].创业邦.2019
[7].蒋逸雯,李黎,李智威,苏超,王干军.基于深度语义学习的电力变压器运维文本信息挖掘方法[J].中国电机工程学报.2019
[8].沈海兰.基于文本挖掘的语义相近程度副词的使用情况研究[J].韩国语教学与研究.2019
[9].韩朋.基于跨语言映射的语义相似项挖掘[D].济南大学.2019
[10].池军奇.基于深度语义挖掘的标题生成技术研究与实现[D].北京邮电大学.2019