意见抽取论文-马晓君,刘亚雪,魏晓雪,刘艳,于渊博

意见抽取论文-马晓君,刘亚雪,魏晓雪,刘艳,于渊博

导读:本文包含了意见抽取论文开题报告文献综述及选题提纲参考文献,主要关键词:意见信息,条件随机场,航空公司,微博评论

意见抽取论文文献综述

马晓君,刘亚雪,魏晓雪,刘艳,于渊博[1](2017)在《航空公司微博评论的意见信息抽取研究——以国航、南航和东航为例》一文中研究指出如今越来越多的乘客选择乘坐舒适快捷的飞机出行,中国航空运输需求因此逐年增长,航空公司在获得更多盈利空间的同时也面临激烈的竞争.对航空公司的用户评论进行意见信息抽取,不仅可用于航空公司改进服务质量和用户体验,还可为用户选择满意的航空公司提供参考.文章首次以新浪微博平台上航空公司的用户评论为基础数据,利用条件随机场进行意见信息抽取.在有关研究中,专家学者大多凭借以往知识的了解对特征对象和特征词进行人工标注,鲜少分析用户在本评论语料中的关注点.因此,文章创新性地在人工标注前首先利用TF-IDF算法进行关键词提取,找到本评论语料中用户的关注点,最后以超过93%的F平均值证明模型的有效性,为后续的研究提供了新方向.(本文来源于《系统科学与数学》期刊2017年04期)

高明[2](2016)在《我市扎实督导移风易俗工作》一文中研究指出本报讯( 高明)近日,从市文明办获悉,为巩固移风易俗工作成果,防止出现反弹现象,市文明办联合市总工会、团市委、市妇联、市公安局、市民政局、市国土局、市住建局、市文广新局、市市场监管局成立10个移风易俗实地督导组,深入各乡镇(街道)所辖村庄扎实开展(本文来源于《莱芜日报》期刊2016-03-26)

刘骁[3](2015)在《基于产品评论的意见抽取方法研究》一文中研究指出随着互联网技术的成熟,各类依托于网络的电子平台得到很好的发展和普及,人们可以通过这样的网络媒体表达自己的观点和意见,其中蕴藏着大量信息,具有不可小觑的研究价值。产品评论信息作为用户产生文本的重要组成部分,如何快速、准确的挖掘其中包含的意见信息,已经成为自然语言处理(Natural Language Processing,NLP)相关领域的热点问题之一。本文面向产品评论,在机器学习框架下融合多种特征和知识探索汉语意见抽取方法,重点研究意见要素识别、意见关系抽取和动态极性分类问题。具体地,本文主要从以下叁个方面展开研究:(1)条件随机场结合知识库的意见要素识别。意见要素分为显性意见要素和隐性意见要素两类,其中隐性属性识别一直被认为是意见要素识别的瓶颈问题。本文在条件随机场模型框架下,融合词形、词性、位置信息及上下文信息等特征进行显性意见要素的识别,取得了理想的实验结果;为了识别隐性意见要素,本文首先采用统计方法构建搭配知识库,然后在条件随机场框架下确定隐性属性位置,最后利用搭配知识库确定隐性属性。实验结果表明融合多种特征和知识有利于意见要素识别性能的提高,尤其是隐性意见要素识别。(2)基于支持向量机的意见关系抽取。意见关系分为产品品牌与产品属性构成的“Aspect-of”关系和产品属性与评价构成的“Aspect-Evaluation”关系两类,其中存在的一对多和多对一的复杂意见关系抽取一直被认为是关系抽取的瓶颈问题。本文认为复杂意见关系是由多个简单的意见关系构成的。为了抽取意见关系,本文将意见关系抽取问题形式化为一个分类问题进行处理,首先构造简单意见关系候选,然后在支持向量机框架下,融合词性、依存关系、距离信息融合等特征进行意见关系判别,进而构建一种基于支持向量机的意见关系抽取系统。实验结果表明了基于支持向量机的意见关系抽取方法的有效性。(3)基于动态极性词关联词词典的情感极性分类。本文以产品评论句中的产品属性为主体,将句子粒度下的情感极性分类问题转化为词粒度下的情感极性分类问题。特别地,动态极性词的情感极性分类是情感极性分类的瓶颈问题,针对该问题本文提出基于动态极性关联词词典的情感极性分类方法,为具有动态极性的情感词分别构造褒贬倾向的关联词词典,证明了基于动态极性关联词词典的情感极性分类方法的有效性。(本文来源于《黑龙江大学》期刊2015-05-10)

段祥超[4](2014)在《维吾尔语意见挖掘关系抽取研究》一文中研究指出互联网的飞速发展和普及给人们的工作、生活以及学习带来了非常大的方便,网络上的各类信息的数量也在急速地增长。随着各类维吾尔语购物网站、博客以及通讯平台的不断地建立和完善,评论性的维吾尔语文本也在逐渐增多。这些评论性文本对人们有很大的实际意义,如何有效、快递地从大量评论性文本中抽取出对人们有用的信息已经成为了人们面临的难题。因此,意见挖掘技术成为了当前的一个研究热点。本文面向维吾尔语评论文文本,主要针对意见挖掘领域中关系抽取及意见持有者抽取技术进行研究,研究内容包括以下叁点:(1)主题抽取:提出了一种维吾尔语法规则与统计方法相结合的领域内的主题抽取算法。根据文档频率以及主题词与领域权威词的共现频率来调节主题词的权重,再利用改进的词频-逆文件频率(TF-IDF)方法抽取出主题词候选项,然后通过设定的主题词的支持度阈值去除冗余的主题词候选项,从而得到最终的主题词抽取结果。(2)主题-意见词对抽取:提出了一种基于Bootstrapping算法的主题-意见词对抽取方法。在每一次迭代过程中,根据改进的评分公式选取最优模式抽取主题词-意见词对;迭代结束后,对于主题-意见词对为空的评论语句,使用最近匹配算法抽取主题-意见词对;最后用并联模式和否定模式对抽取的主题-意见词对进行扩展和修正。主题-意见词对抽取的最终结果是:每一个评论性语句都存在一个或多个二元组<主题词,意见词>,且每一个主题词都有唯一的一个意见词与之对应。(3)意见持有者抽取:在分析维吾尔语法特征和语言规则的基础上,以维吾尔语评论语句为研究对象,提出了一种细颗粒度的叁层模型进行意见持有者抽取。首先利用CRFs(Conditional Random Fields)模型,结合人工制定的启发式规则和维吾尔语人名构成规则,识别出每一个评论语句中所有意见持有者候选项;然后根据意见持有者分类算法,把评论语句分成四种不同的类型,并针对不同持有者类型提出不同的意见持有者抽取方法;最后根据扩展规则修正意见持有者抽取结果。(本文来源于《新疆大学》期刊2014-05-01)

杨伟杰,马博渊,刘雯[5](2014)在《基于意见目标句抽取的中文股评情感分析方法》一文中研究指出针对股评文章进行情感倾向性分析时,不包含情感倾向的干扰信息过多而影响分析的正确率的问题,提出了一种股评文章中意见目标句识别及抽取的方法,利用股评文章的特点,借助主动词识别及其情感预判,识别与股评情感分析直接相关的意见目标句,并在缺少领域词典的情况下,使用基于半监督学习的分类方法进行此类句子的情感倾向分析,最终依此得到整篇文章的情感倾向。实验证明上述方法能够较大程度上改善股评文章情感分析的准确性。(本文来源于《计算机仿真》期刊2014年03期)

段祥超,禹龙,田生伟,吐尔根·依布拉音,艾斯卡尔·艾木都拉[6](2013)在《维吾尔语意见挖掘关系抽取研究》一文中研究指出在分析维吾尔语词性规则和语法特征的基础上,以维吾尔语评论性语句为研究语料,提出了一种基于Bootstrapping算法的意见挖掘关系抽取方法。在每一次迭代过程中,根据改进的评分公式选取最优模式抽取主题词-意见词对;迭代结束后,对于主题-意见词对为空的评论语句,使用最近匹配算法抽取主题-意见词对;用并联模式和否定模式对抽取的主题-意见词对进行扩展和修正。关系抽取的最终目标是为每一个评论性语句建立一个或多个二元组<主题词,意见词>,并使主题词和意见词一一对应。实验结果表明了该方法在关系抽取上的有效性。(本文来源于《计算机工程与设计》期刊2013年09期)

宋凯嵩[7](2012)在《意见领袖发现及典型观点抽取技术的研究与实现》一文中研究指出随着Internet技术的迅速发展,众多的在线交流平台应运而生。论坛已经成为一种主要的信息交流平台,越来越多的网民通过论坛来发表观点和看法。在信息传播过程中,意见领袖被视为最具影响力的观点或其作者,其中正向意见领袖群代表一组用户,其观点可以引起回复者的共鸣,并且促使回复者表达相同的情感倾向。另外,针对一个事件,代表各种情感倾向的典型观点对于网络舆情分析具有重要的作用。基于此,本文研究Web论坛中意见领袖发现及典型观点抽取技术。首先,针对当前观点网络建模研究中主要考虑显式链接、而很少考虑隐式链接的问题,本文提出显式链接和隐式链接的发现方式,并且对发现的链接继续分为正向链接和负向链接,基于这些链接构建观点网络和用户网络模型,为进一步的意见领些发现和典型观点抽取打下基础。其次,基于上述观点网络建模方法,针对Web评论信息构建评论网络和用户网络,并提出Dynamic OpinionRank算法用以发现中文新闻评论中的意见领袖。进而通过聚类用户节点、计算用户的权威值、对评论和用户排序等手段,发现评论网络中最具有影响力的评论和用户网络中最具有影响力的用户。第叁,在意见领袖动态检测的基础上,考虑多主题中正向意见领袖群的重要作用,进一步构建多主题用户网络,进而通过评论遍历过程中的用户权威值计算,将Top-k用户作为正向意见领袖群。第四,考虑典型观点在网络舆情分析中的作用,首先采用情感聚类技术划分评论集合成为观点社区,在各社区中构建情感短语树,依据本文提出的最长有序情感短语抽取算法发现观点社区的典型观点。上述各部分的实验表明,本文提出的方法能有效地发现Web上各种论坛内的意见领袖、正向意见领袖群以及各观点社区的典型观点。(本文来源于《东北大学》期刊2012-06-01)

石玲玲[8](2012)在《统计与规则相结合的汉语意见抽取方法研究》一文中研究指出随着互联网技术的迅猛发展和普及,特别是Web2.0的兴起,网上购物、微博、博客及BBS论坛等各种新兴的互联网应用正成为人们感兴趣的热点,而网上购物后的评论、博客、微博以及BBS上的意见信息也在与日剧增。这些评论和意见信息通常具有比较重要的价值,一般政府部门可以通过互联网上的评论来了解人们对某个政策法规或事件的看法并进行及时的科学决策。商业机构可以通过调查互联网上的产品评论来监测顾客意见和预测市场趋势,进而改进他们的服务和产品或采取更为有效的有针对性的营销策略。消费者也可通过浏览其他消费者对某个产品的网络评论并作出判断他们是否购买该产品。因此,怎样有效处理和分析这些具有情感的意见信息是文本情感分析领域亟待解决的问题之一。意见挖掘(opinion mining)研究正是为了满足这些应用而发展起来的,而且已经成为当前自然语言处理(NLP)相关领域的研究热点之一。意见挖掘一般包括叁个方面的内容,即有主观性识别、意见极性分类和意见抽取。而本文研究的是意见抽取相关方面的问题。本文利用统计和规则相结合的方法研究汉语中评价对象即主题特征和评价对象、情感词关系对抽取的问题。具体地,本文从将以下几个方面展开论文的研究。首先,本文首先介绍了意见挖掘方面的基本概念,意见挖掘包括的子任务,意见挖掘研究的层次和研究重点,然后介绍汉语意见挖掘研究现状,以及意见挖掘研究的在国内外研究现状。其次,意见句中的评价对象的抽取是细粒度词语级意见挖掘要研究的关键问题之一。为了提高评价对象的抽取性能,本文在条件随机场模型,最大熵模型,支持向量机叁种系统模型下综合名词性信息,频率信息,依存关系等各种信息,重点探索在不同特征和不同模型框架下对评价对象抽取的影响。实验结果表明,本文在引入各方面的特征信息后经过叁种模型的对比发现条件随机场模型更适合对评价对象进行抽取。最后,本文主要基于统计和规则相结合的方法研究评价对象、情感词关系对抽取问题。首先应用t检验和规则方法对评价对象,情感词关系对进行抽取然后利用查字典的方式进行再抽取,最后采用互信息的方法对评价对象、情感词关系对进行扩展。并将第叁章中最好评价对象识别结果采用就近匹配方法与标准的评价对象数据采用同样的方法进行比较。实验结果表明:本文提出的两种对评价对象、情感词关系对抽取方法是有意义的。(本文来源于《黑龙江大学》期刊2012-05-09)

张鹏[9](2010)在《中文意见挖掘的特征层次构建和抽取算法》一文中研究指出随着Web技术的发展,网络上现存的主观意见表述文本陡增。主观WEB文本不仅能给其他用户提供客观的参考价值,并且产品生产方也可以及时根据用户的意见言论来调正自己的产品设计以及营销策略。因此主观意见文本的处理也随之受到人们的重视。近年来也成为了WEB数据挖掘的热点。在中文意见挖掘中,相关学者都将如何准确得到意见词的语义情感倾向作为他们的着手点,对准确获取特征以及特征之间的关系相对研究较少。而特征的相关层次关系分析将对后面的语义情感分析和对整篇评论的理解起到重要作用。因此,为了研究特征词的抽取方法和特征层次关系的获取方法,本文主要做了如下几方面的研究工作:①由于语料在中文文本挖掘中的重要作用,描述了不同语料在意见挖掘中的运用,分析了不同语料对于特征词提取的作用。并针对不同语料介绍了不同的特征词抽取算法。②描述了中文语料中能够体现概念上下位与部分整体关系的特定语法结构,并从统计的角度探索和深入地分析了汉语“的”字结构短语中的概念上下位关系,总结出一种利用Tdf/idf公式判定“的”字前后概念上下位关系的方法。③研究给出了基于网络的PMI统计算法的一种新应用。通过使用特定语法结构短语在现有比较成熟的网络搜索引擎中进行搜索,来获取词汇和加入特定语法结构的短语在网络中被搜索到的次数,用于判断词汇之间的关系。④分析了现有中文评论特征词与意见词所形成的词对的抽取算法。并将Bootstrapping算法和关联规则算法对特征词的抽取效果作了对比和分析。通过较充分的实验,验证了PMI算法用于特征层次提取的可行性和有效性。论文研究为基于网络的PMI算法在中文意见挖掘的应用提供了新的可供借鉴的方向和思路,具有较好的学术意义和一定的应用参考价值。(本文来源于《重庆大学》期刊2010-04-01)

陈奇哲,刘全升,姚天昉[10](2009)在《汉语意见型语句主题与情感关系抽取的研究》一文中研究指出近年来,随着互联网的发展,越来越多的人在网上发表观点、评论等。目前对于这些包含观点的意见型文本的研究十分活跃,而主题与情感的关系匹配是意见挖掘中比较关键的一项研究内容。通过获得的意见元素关系(以下简称元素关系)为意见挖掘的后续研究奠定了基础,同时元素关系可以有效解决汉语意见挖掘中指代消解以及评价对象遗漏等问题。本文主要研究意见型文本中主题、情感成分的抽取以及二者所含有的元素关系等。本文首先使用信息检索中常用的tf/idf算法抽取主题,利用情感词词典抽取情感,然后将同一个句子中共现的主题以及情感作为候选集合,使用最近匹配以及SVM算法并结合词汇,词性,语义、距离等句子以及上下文特征进行主题以及情感的元素关系抽取。最后,本文除了比较两种算法,还比较了不同规模,不同正反例比例以及不同领域条件下的系统性能指标。(本文来源于《第五届全国信息检索学术会议论文集》期刊2009-11-14)

意见抽取论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本报讯( 高明)近日,从市文明办获悉,为巩固移风易俗工作成果,防止出现反弹现象,市文明办联合市总工会、团市委、市妇联、市公安局、市民政局、市国土局、市住建局、市文广新局、市市场监管局成立10个移风易俗实地督导组,深入各乡镇(街道)所辖村庄扎实开展

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

意见抽取论文参考文献

[1].马晓君,刘亚雪,魏晓雪,刘艳,于渊博.航空公司微博评论的意见信息抽取研究——以国航、南航和东航为例[J].系统科学与数学.2017

[2].高明.我市扎实督导移风易俗工作[N].莱芜日报.2016

[3].刘骁.基于产品评论的意见抽取方法研究[D].黑龙江大学.2015

[4].段祥超.维吾尔语意见挖掘关系抽取研究[D].新疆大学.2014

[5].杨伟杰,马博渊,刘雯.基于意见目标句抽取的中文股评情感分析方法[J].计算机仿真.2014

[6].段祥超,禹龙,田生伟,吐尔根·依布拉音,艾斯卡尔·艾木都拉.维吾尔语意见挖掘关系抽取研究[J].计算机工程与设计.2013

[7].宋凯嵩.意见领袖发现及典型观点抽取技术的研究与实现[D].东北大学.2012

[8].石玲玲.统计与规则相结合的汉语意见抽取方法研究[D].黑龙江大学.2012

[9].张鹏.中文意见挖掘的特征层次构建和抽取算法[D].重庆大学.2010

[10].陈奇哲,刘全升,姚天昉.汉语意见型语句主题与情感关系抽取的研究[C].第五届全国信息检索学术会议论文集.2009

标签:;  ;  ;  ;  

意见抽取论文-马晓君,刘亚雪,魏晓雪,刘艳,于渊博
下载Doc文档

猜你喜欢