主题粒度论文_王瑞东

导读:本文包含了主题粒度论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:主题,模型,情感,细粒度,粒度,多维,实体。

主题粒度论文文献综述

王瑞东[1](2019)在《社会化视频主题检测及细粒度情感分析算法研究与实现》一文中研究指出随着社会化视频的普及,许多新的视频研究方法被相继提出。弹幕数据是近年来较为流行的社会化视频的产物,其与视频时间同步的属性相较于传统的评论数据具备更精确的时间信息。本文以弹幕文本和视频图像为出发点,首先提取视频情节主题,然后结合两种模态数据进行视频情感分析。本文的研究内容包括两方面。首先提出了基于概率图模型的视频情节主题检测算法,目的在于能够自动对视频情节主题进行检测,提取出每个情节的主题内容。视频情节主题检测算法以弹幕文本作为输入,得到视频情节的主题信息,同时对切分好的情节输出文本主题内容。在视频情节主题检测的基础之上,进行情节粒度下多模态的视频情感分析。相较于对整部视频的粗粒度情感分析,本文所提出的模型能够针对每个情节给出情感极性分析结果。利用弹幕的文本模态以及时间片的图像模态对影视剧进行多模态的视频情感分析,以解决单模态下情感分析不准确的问题。情节主题检测算法与多模态情感分析相结合,构成本文所研究的主要内容。本文主要分析的视频为影视剧,根据不同类型的视频进行了模型算法的验证。实验结果表明,基于改进概率图模型的视频情节主题检测算法能够对一部视频进行合理的切分,同时对切分后的时间片给出主题内容文本。此外实验也分析了情节粒度下的多模态情感分析算法,相较于单模态的情感分析算法,本文所提出的多模态情感分析算法结合了弹幕文本与视频人脸图像,能够更准确的对视频片段的情感进行分类。(本文来源于《北京邮电大学》期刊2019-06-10)

李岩彪[2](2019)在《基于主题的文本细粒度情感分析与应用》一文中研究指出基于主题的文本情感分析技术逐渐成为人们关注的热点,其主要任务是通过挖掘用户评论所蕴含的主题、以及对这些主题的情感偏好。本文中的情感倾向包含叁级:满意、中立以及不满。区别于传统情感分析和方面级情感分析,“细粒度”体现为在一段评论中,以多个<主题词,情感词,情感倾向>叁元组作为结果呈现,并非一段文本只有一个情感;除此之外,主题词不再是“方面”级别,而是随机性更强的任意词语。本文基于真实的互联网商品评论数据,采用模型融合思想,提出了一套包含主题词与情感词抽取、主题词与情感匹配以及主题情感分析的算法框架,在交叉验证的条件下使用标准的F1-Score评判指标取得稳定且显着的效果。本文的主要工作如下叁个方面:(1)主题词与情感词抽取方面,将双向长短时记忆网络联合条件随机场作为算法框架;受词嵌入思想的启发,提出主题词与情感词词典嵌入向量方法(Dict Embedding),使召回率以及精确率均取得显着提升。(2)主题词与情感词的匹配策略方面,提出分层匹配策略。分层匹配策略包括两个阶段:在R(Recall)阶段先对所有<主题词-情感词>进行“粗选”,提高召回率;在P(Precision)阶段,为了提高精确率,再基于当前配对的相关信息使用深度神经网络进行“精选”,实验结果验证了策略的有效性。(3)情感分析方面,考虑到语境的差异性,不仅使用情感词作为特征,还引入上下文词向量等相关信息,提出一种新的联合情感分析算法框架对情感进行分类,并取得理想的实验效果。(本文来源于《北京邮电大学》期刊2019-05-21)

赵俊祎[3](2019)在《基于主题的细粒度情感分析研究》一文中研究指出情感分析任务能够帮助人们高效分析互联网所呈现的包含情感信息的海量文本数据,并在一定程度上帮助消费者更加高效地做出决策,故颇具研究意义。传统的情感分析任务是直接判断给定文本的情感倾向。然而,当文本中包含多个情感目标(主题词),并且对应情感倾向冲突时,它则无法对文本情感倾向做出恰当的判断。因此,针对基于主题的细粒度情感分析任务的分析与研究非常有必要。该任务不但能够将文本中的多个情感对象识别出来,同时还能判别主题词对应的情感倾向。本论文立足于基于主题的细粒度情感分析任务的两个子任务——提取主题词任务和给定主题词的情感分析任务。主题词提取任务主要工作是从评论文本中将情感对象(主题词)提取出来,而给定主题词的情感分析任务主要工作是分析评论中特定主题词的情感倾向。因此,本论文的主要工作和研究成果如下:1.本论文借助于迁移学习方法,提出了基于预训练模型学习领域信息词嵌入表达、情感信息词嵌入表达的方法,以弥补通用嵌入表达只能捕获通用语义信息的缺陷。这两种嵌入表达更加贴近提取主题词、及特定主题词的情感分析两个子任务的需求。此外,通过迁移学习,可以将大规模语料涵盖的通用语义信息、以及扩展语料蕴含的特定知识,迁移到学习的词嵌入表征中。2.针对主题词提取任务,提出了基于多维度嵌入表达和self-attention机制的主题词提取模型。self-attention机制的引入,有效解决了主题词和上下文之间长距离依赖关系捕获不充分的问题。为了解决实验数据领域相关性强的问题,模型添加了包含领域信息的词嵌入表达。此外,该模型嵌入层同时使用了通用的词嵌入表达、包含领域信息的词嵌入表达、以及单词特征共同提升模型性能。3.针对特定主题词的情感分析任务,提出了改进的基于预训练方法的模型、以及改进的基于多任务方法的模型,以解决深度学习模型在小数据集上性能受限的问题。模型通过引入门控的多重attention机制,解决传统attention机制长距离文本特征捕获不充分问题,多角度学习上下文对特定主题词情感判定的贡献度。其次,利用包含情感信息的词嵌入表达的使用,解决通用嵌入表达不包含情感信息的问题。(本文来源于《电子科技大学》期刊2019-03-26)

张庆芝,白如江,王效岳[4](2018)在《规划文本和论文数据对比视域下细主题粒度科学研究前沿识别研究——以碳纳米管研究领域为例》一文中研究指出[目的/意义]文章利用规划文本和论文数据两种数据源,提出一种基于多维度划分的细主题粒度研究前沿识别方法。[方法/过程]获取碳纳米管研究领域相关规划文本和论文,将两种数据源分别划分为理论创新、实际应用和风险管理叁个维度,在各个维度内利用主题模型和回溯原文方法进行细粒度主题抽取,通过不同数据源不同维度细粒度主题对比分析,识别相应研究前沿主题。[结果/结论]实验结果表明该方法可以更有效地识别出细分领域科学研究前沿主题。(本文来源于《情报理论与实践》期刊2018年11期)

王会岛[5](2018)在《基于主题的学生评教短文本多粒度情感分析》一文中研究指出新时期的“双一流”高校建设是中国政府在高等教育领域新近推出的又一重大国家战略,势必将教师教学质量放在学校长期发展的重要战略地位。学生评教是教学质量的重要测评工具之一,如何利用和量化评教系统中存在的大量评教文本信息,是公正客观地评价教师教学质量的关键环节。论文主要通过自然语言处理和机器学习方法对学生评教文本进行情感分析,旨在客观公正地反馈教师教学质量的相关信息。主要工作如下:1、构建了评教主题词典Topic-Dictionary。论文提出了一种基于词语共现原理的抽取算法,提取了主题词集合和情感词集合,并对主题词集合进行平滑处理,将其归结为九个主题大类,最终得到了主题词典。2、构建了评教情感词典Edu-Dictionary。论文采用Word2Vec方法进行词典扩展,这种基于词向量的方法携带了丰富的语义信息,利用词向量之间这种潜在的语义关系可有效地进行词典扩充。Word2Vec方法是基于评教领域独立的语料空间而扩展得到该领域专用的情感词典,因此可有效识别该领域的新词及独有的表达方式。3、提出了基于主题的学生评教短文本细粒度情感分析模型。该模型基于中文句法依存关系分析,结合主题词典、情感词典、程度副词词典和否定词词典,构建了<主题,情感>评价单元并进行情感计算,获得了针对各个评教主题的情感倾向评价。4、提出了基于情感词典与机器学习的评教短文本粗粒度情感分析模型,即对整条评教文本进行情感分析。首先利用情感词典计算情感极性,将情感极性置信度较高的评教文本作为训练集,训练分类器,然后借助多分类器(SVM+KNN)多特征融合的方法对测试集进行分类预测。实验证明:多分类器多特征融合的分类效果要比单一分类器略胜一筹。(本文来源于《华南理工大学》期刊2018-04-26)

王圣[6](2018)在《细粒度文本主题检测技术的研究与应用》一文中研究指出随着网络技术的快速发展与应用,用户对于信息的判别需求也在不断加大,对文本进行主题判别已经不能满足用户对于信息的需求。在很多实际应用中需要对文本进行多层次分类,即首先判定一个文本是否属于一个大的类别,之后进一步判定其是否属于一个更小的子类,如此直到分到一个最细粒度的类别。细粒度文本主题检测技术是指对新文本数据,判断是否属于某特定主题,再判断属于哪种子主题的一项技术。基于此,人们不仅可以从大量的网络信息中挑选出自己要关注的主题信息,还能得到这个主题信息的子主题信息,并且了解各个子主题的分布。本文使用两种方法来实现这项技术。一种方法是使用多次分类的方法,另一种方法是使用多层分类的方法。多次分类的细粒度文本主题检测共有叁个部分,首先使用单分类的方法进行新文本的特定主题判断,然后使用聚类的方法进行特定主题的子主题创建,最后使用再分类的方法来对属于特定主题的新文本的子主题进行判别苦。本文通过大量实验针对实验领域,选择了 一种聚类方法,并对聚类模型进行了调整,实验表明了其有效性。多层分类的细粒度文本主题检测建立了一个新的模型来进行多层分类。新的模型基于分类模型Hierarchical softmax,但不使用一个网络进行一次分类,而是将多次分类结合到一次分类中,使用一个网络进行多次分类。本文称这种模型为基于层次softmax的多层次分类模型(Multi-layer classification model based on Hierarchical softmax),该模型不仅简化了多次分类的过程,同时,实验表明了其有效性。(本文来源于《北京邮电大学》期刊2018-03-13)

张帆[7](2017)在《电商评论中细粒度主题情感混合模型建构》一文中研究指出本文对细粒度观点挖掘的相关理论做了深入探讨,详细研究了LDA模型,又对该模型加以改进,提出了细粒度主题情感混合模型,该模型能对实体提取、意见词识别、情感倾向分析、评论信息自动汇总分析、用户评价等提供评价分析,为用户提供直观的信息。(本文来源于《商业经济研究》期刊2017年24期)

郑玉桂[8](2017)在《面向电商评论细粒度观点挖掘的拓展主题模型研究》一文中研究指出随着互联网和电子商务技术的发展,网络购物成为一种热潮,人们可以实现足不出户购买到自己心仪的商品。但是,与传统线下购物相比,网络购物有着商品种类繁多、用户无法直接感受商品的质量、体验商品功能等特征,这使得电商网站上的商品评论信息成为消费者选择和购买决策的重要参考。同时,评论信息作为反馈机制也可以帮助商家改进产品、提升服务。但是,目前电商网站评论数据量巨大、内容庞杂,采用人工阅读方式无法准确有效的得到有用的信息。而且人们更希望得到的是关于产品或服务多个方面的细粒度评价信息,而非其整体情感倾向。因此,针对电商评论的细粒度观点挖掘成为了热门的研究课题,受到国内外研究学者的广泛关注。细粒度观点挖掘旨在从评论数据中抽取出被评价实体方面以及相对应的情感,生成评价摘要,,为潜在消费者和商家提供决策支持。考虑到目前细粒度观点挖掘方法如基于人工定义、基于频率、基于有监督学习方法的局限性,而LDA主题模型作为无监督方法不仅不需要人工标注的训练数据,还可以克服上面所述方法中没有将具有相似语义的特征词进行聚类的缺点,被研究者广泛应用。但是LDA模型抽取的主题粒度较粗,无法识别被评价实体方面,而且叁层模型无法实现细粒度观点挖掘目标,需要进行改进和拓展。针对上面提到的问题,本文根据细粒度观点挖掘的目标,对LDA模型进行设计和拓展,提出了细粒度的主题情感混合模型(Fine-grained Topic Sentiment Unification Model,FG-TSU 模型)。首先针对标准的LDA模型识别出的主题粒度较粗,本文将主题分为局部主题和全局主题,利用滑动窗口的方法将词共现信息从文档级降到句子级,实现细粒度局部主题的抽取;然后,本文根据词分类和在模型中引入指示变量用以区分方面词和观点词;最后,本文在LDA模型的叁层模型基础上加入了情感层,对主题和情感进行同时建模,实现情感倾向分析,不仅可以获得整篇评论的情感极性,还可以获得被评价实体方面层的情感极性,最终完成细粒度观点挖掘的目标,生成评价摘要。为了验证本模型具有跨领域性,本文选取了酒店和手机两个领域的电商评论数据集进行实验,设计了叁个实验,实验结果表明本模型在实现电商评论细粒度观点挖掘上的可行性。(本文来源于《浙江工商大学》期刊2017-01-01)

马长林,谢罗迪,王梦,司琪[9](2015)在《基于主题情感混合模型的细粒度观点挖掘》一文中研究指出在对标准潜在狄利克雷分布(LDA)模型进行改进的基础上,提出了一个主题情感混合最大熵LDA模型对在线评论进行细粒度观点挖掘.首先,在传统LDA模型中加入最大熵组件来区分背景词、特征词和观点词,并对特征词和观点词进行局部和全局的划分;然后,在主题层和单词层之间加入情感层,将传统的LDA叁层模型扩展成四层;最后,进行情感极性分析,同时获取整篇评论和每个主题的情感极性,生成细粒度的主题情感摘要.实验验证了所提模型和理论的有效性.(本文来源于《华中科技大学学报(自然科学版)》期刊2015年S1期)

王忠义,黄京[10](2015)在《数字图书馆馆藏资源多粒度层级主题分割研究》一文中研究指出数字图书馆馆藏资源服务粒度过大、集成度不高的主要原因在于馆藏资源知识组织的粒度过粗。为解决这一问题,本文提出一种数字图书馆馆藏资源多粒度层级主题分割方法。该方法基于最优分割,采取自上而下逐步二分的策略,首先将待分割文本包含的所有语句视为一个类,而后对该类进行逐级二分,直到识别出所有的主题为止,最终生成一棵文档分割树。该树结构的突出优势是可以实现馆藏资源的多粒度层级组织,进而提供多粒度集成知识服务。(本文来源于《情报学报》期刊2015年09期)

主题粒度论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

基于主题的文本情感分析技术逐渐成为人们关注的热点,其主要任务是通过挖掘用户评论所蕴含的主题、以及对这些主题的情感偏好。本文中的情感倾向包含叁级:满意、中立以及不满。区别于传统情感分析和方面级情感分析,“细粒度”体现为在一段评论中,以多个<主题词,情感词,情感倾向>叁元组作为结果呈现,并非一段文本只有一个情感;除此之外,主题词不再是“方面”级别,而是随机性更强的任意词语。本文基于真实的互联网商品评论数据,采用模型融合思想,提出了一套包含主题词与情感词抽取、主题词与情感匹配以及主题情感分析的算法框架,在交叉验证的条件下使用标准的F1-Score评判指标取得稳定且显着的效果。本文的主要工作如下叁个方面:(1)主题词与情感词抽取方面,将双向长短时记忆网络联合条件随机场作为算法框架;受词嵌入思想的启发,提出主题词与情感词词典嵌入向量方法(Dict Embedding),使召回率以及精确率均取得显着提升。(2)主题词与情感词的匹配策略方面,提出分层匹配策略。分层匹配策略包括两个阶段:在R(Recall)阶段先对所有<主题词-情感词>进行“粗选”,提高召回率;在P(Precision)阶段,为了提高精确率,再基于当前配对的相关信息使用深度神经网络进行“精选”,实验结果验证了策略的有效性。(3)情感分析方面,考虑到语境的差异性,不仅使用情感词作为特征,还引入上下文词向量等相关信息,提出一种新的联合情感分析算法框架对情感进行分类,并取得理想的实验效果。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

主题粒度论文参考文献

[1].王瑞东.社会化视频主题检测及细粒度情感分析算法研究与实现[D].北京邮电大学.2019

[2].李岩彪.基于主题的文本细粒度情感分析与应用[D].北京邮电大学.2019

[3].赵俊祎.基于主题的细粒度情感分析研究[D].电子科技大学.2019

[4].张庆芝,白如江,王效岳.规划文本和论文数据对比视域下细主题粒度科学研究前沿识别研究——以碳纳米管研究领域为例[J].情报理论与实践.2018

[5].王会岛.基于主题的学生评教短文本多粒度情感分析[D].华南理工大学.2018

[6].王圣.细粒度文本主题检测技术的研究与应用[D].北京邮电大学.2018

[7].张帆.电商评论中细粒度主题情感混合模型建构[J].商业经济研究.2017

[8].郑玉桂.面向电商评论细粒度观点挖掘的拓展主题模型研究[D].浙江工商大学.2017

[9].马长林,谢罗迪,王梦,司琪.基于主题情感混合模型的细粒度观点挖掘[J].华中科技大学学报(自然科学版).2015

[10].王忠义,黄京.数字图书馆馆藏资源多粒度层级主题分割研究[J].情报学报.2015

论文知识图

RF结果综合比较3-5词特征提取举例Figure...一12主题数为12的主题概率分布3-13主题数为8的主题概率分布F...ODS关系元模型酒店评论数据集下主题数对分类效果的...

标签:;  ;  ;  ;  ;  ;  ;  

主题粒度论文_王瑞东
下载Doc文档

猜你喜欢