源语文本分析论文-向进勇

源语文本分析论文-向进勇

导读:本文包含了源语文本分析论文开题报告文献综述及选题提纲参考文献,主要关键词:维吾尔语文本情感分析,特征选择,深度信念网络,卷积递归深度模型

源语文本分析论文文献综述

向进勇[1](2019)在《维吾尔语文本情感分析》一文中研究指出如今,互联网上社交媒体的数据量大幅度增长,越来越多的网民成为数据的提供者,微博数据、论坛数据、电子商务网站评论数据等都是由网民主动提供的。这些数据包含着网民对某个社会问题或者某个产品的态度,对这些带有网民主观情感的评论信息进行分析不仅具有经济价值,而且还存在着社会价值。研究人员试图从这些情感数据中提取有用的信息,以便帮助管理人员作出更好的判断。文本情感分析就是使用计算机自动地对这些文本数据进行情感判断,本文对维吾尔语文本情感分析进行了研究。相对于中文、英文文本情感分析来说,维吾尔语文本情感分析的起步较晚。虽然以前的研究人员对维吾尔语文本情感分析也进行了一定的研究,但是都是针对单个机器学习或者深度学习的模型。文本情感分析一般由文本表示、特征选择、特征提取、分类算法的选择组成,特征提取技术与特征选择技术不同,特征提取是通过某种算法将原始特征转化成对于分类效果具有提升作用的特征,而特征选择则是从特征中选择出更具有代表性的特征。本文提出了两种特征提取的方法--基于特征选择和深度信念网络的文本特征提取以及基于卷积递归深度模型的文本特征提取,基于特征选择和深度信念网络的文本特征提取解决了DBN耗时且计算代价昂贵的问题,通过特征选择将一些无用的特征删选出去,这样减小DBN网络的输入维度;基于卷积递归深度模型的文本特征提取解决了卷积神经网络不能捕获文本长期依赖关系的问题。这两种方法在维吾尔语文本情感分类中都表现出了不错的效果,基于特征选择和深度信念网络的文本特征提取在训练时间上比深度学习算法(卷积神经网络、循环神经网络、深度信念网络)要好,而基于卷积递归深度模型的文本特征提取在准确率方面要比朴素贝叶斯、支持向量机、卷积神经网络、循环神经网络等算法高。本文提出的第一个算法将机器学习与深度学习的方法进行了结合,第二个算法将两个深度学习模型进行组合,这样规避单个模型的缺点。(本文来源于《新疆大学》期刊2019-06-03)

徐楚楚[2](2019)在《《多模态语用学和翻译:分析源语文本的新模式》(第四章)的汉译及翻译实践报告》一文中研究指出本实践报告主要包含源语文本、译本以及翻译报告。源语文本摘自《多模态语用学和翻译:分析源语文本的新模式》的第四章,从叁个角度寻找分析多模态源语文本的新模式。翻译报告以其译稿为例,选取韩礼德和哈桑衔接理论中的指代手段作为理论支撑,探讨源语文本中指代衔接在译本中的处理。翻译报告一共包含五部分:任务阐述、翻译过程、理论分析、理论在翻译中的应用以及结论。第一部分部分包含源语文本简介、选择文本的理由和翻译任务的意义叁个方面;第二部分从译前译中以及译后叁个阶段描述整个翻译过程;第叁部分简要阐述衔接理论中的指代手段,为后文奠定理论基础;第四部分通过举例和说明,详细阐述译者如何处理原文中出现的指代衔接手段;第五部分包含总结和启示。从理论上讲,此次翻译报告以韩礼德和哈桑的衔接理论作为指导,运用指代手段解决翻译中的问题,拓展了该理论在专着翻译中的应用;从实践上讲,此次翻译的源语文本是有关多模态的理论专着,这有助于引进国外文献,促进国内多模态文本翻译的发展。(本文来源于《贵州师范大学》期刊2019-06-02)

黎红[3](2018)在《基于深度学习的维吾尔语文本事件信息的抽取与分析》一文中研究指出互联网的普及以及网络信息爆炸式的增长,使得人们越来越多的从网上获取自己关心的事件。如何高效且准确的抽取相关信息变得极具挑战性。事件抽取作为信息抽取领域重要的研究方向,其将事件作为信息表示的基本单元和组织手段,把含有事件信息的非结构化文本以结构化或者半结构化的形式从不同的信息源中抽取并以不同层次和粒度呈现出来。维吾尔语文本事件抽取与分析目的是利用深度学习技术从非结构化的维吾尔语文本数据中抽取事件信息,是自动文摘、自动问答系统等基于事件的信息组织技术的基础。随着新疆的通信事业发展迅速,大量基于民族语言的网站和通信平台不断建立,这为基于维吾尔语事件信息的抽取和分析研究提供了大量的语料资源。事件信息抽取与分析包括事件识别和事件要素的识别,事件识别旨在抽取事件触发词,并将其所对应的事件做出对应的分类。针对事件识别研究中对事件句上下文隐含语义信息挖掘不充分,识别稳定性弱的问题,结合对维吾尔语语言特点分析,提取维吾尔语文本事件包含的六大特征块。为提高维吾尔语事件特征表达,在特征集中引入富含词汇语义及上下文位置关系的Word Embedding。利用深度学习联合模型对特征抽象化的学习能力和事件中抽象含义序列关系的捕获特性,训练分类器完成事件识别任务。实验结果表明Word Embedding特征项的引入提高了模型识别的性能,并且与六大特征块的融合获得了较理想的召回率和准确率以及F值。事件要素识别部分,本文采用深度学习技术将其转化为分类问题,利用双向长短期记忆网络对事件句前后文进行双向序列学习,从已识别出的事件类别中识别出真正的事件要素类别。并聚焦于模型分类器的训练和特征的选择,以及隐含特征的发现。避免了过多的人工干预因素和相关领域知识的欠缺,由此获得较客观的识别结果。实验评测表明深度学习技术有效的改善了维吾尔语文本事件要素识别任务中训练实例不平衡和数据稀疏问题,加强了系统识别的稳定性。(本文来源于《新疆大学》期刊2018-05-25)

张莹,亚森·艾则孜,吴顺祥[4](2019)在《利用N-gram和语义分析的维吾尔语文本相似性检测方法》一文中研究指出为了实现维吾尔语文本的相似性检测,提出一种基于N-gram和语义分析的相似性检测方法。根据维吾尔语单词特征,采用了N-gram统计模型来获得词语,并根据词语在文本中的出现频率来构建词语—文本关系矩阵,并作为文本模型。采用了潜在语义分析(LSA)来获得词语及其文本之间的隐藏关联,以此解决维吾尔语词义模糊的问题,并获得准确的相似度。在包含重组和同义词替换的剽窃文本集上进行实验,结果表明该方法能够准确有效地检测出相似性。(本文来源于《计算机应用研究》期刊2019年09期)

施梅芳[5](2018)在《面向语音合成的马来语文本分析》一文中研究指出近年来随着人工智能的飞速发展,语音合成技术也日趋成熟。语音合成技术应用在我们生活的方方面面,如朗读软件、语音播报等领域。现阶段,语音合成的主要实现方式为文语转换,即通过计算机实现从文本到语音的转换。但语音合成的研究主要集中在比较通用的语言上,而对马来语的研究相对较少。本文以开发马来语语音合成系统为目的,研究并实现了马来语前端文本分析中的语料库的构建、文本归一化和音节的自动划分。本论文的主要工作包括:(1)马来语语料库的构建。借助现有软件从马来语网站和电子书上下载马来语的文本,并去除文本中的非法字符和重复语料,作为本文研究的马来语文本语料库。基于该文本语料库,采用句型、高频词和句子长度相结合的原则选取用于录音的发音语料。最后用优劣评判的标准来验证发音语料库的合理性和代表性。(2)马来语文本中数字字符的归一化。研究了马来语文本中常出现的特殊字符及其歧义类型。设计了马来语的归一化方案和算法流程。采用正则表达和关键字相结合的方法,对句子中的数字及与数字连用的特殊字符进行文本归一化处理。实验结果表明,本次实验的马来语归一化正确率达95.13%。(3)马来语音节的自动划分。学习和研究了现有的马来语音节化方案,针对这些方案的优缺点提出本文的音节化方案,设计并实现了该方案的算法流程。采用规则和音节列表相结合的方法实现了马来语的音节自动划分。实验结果表明,此次实验的马来语音节化的集内测试正确率达100.00%,而集外测试的正确率达96.40%。综上所述,本文提出的马来语语料库构建、归一化、音节化的前端文本分析方法达到了预期的效果,能基本满足开发马来语语音合成系统的要求。(本文来源于《云南大学》期刊2018-05-01)

谢辉[6](2017)在《翻译、多语文本与身份认同——林语堂汉语散文中的多语现象分析》一文中研究指出林语堂的汉语散文是一个多语杂合的文本集合。本文运用综合分析法,将林语堂的汉语散文作为一个整体的分析单元,从语言接触视角分析文本中因翻译引发的多语现象的特征、多语现象产生的文本意图及其功能,从新的角度揭示林语堂在特定历史语境下实现身份认同的独特途径。(本文来源于《山东外语教学》期刊2017年05期)

李敏[7](2017)在《基于深度学习的维吾尔语文本情感分析》一文中研究指出随着互联网的发展,新疆的互联网用户大幅度增加,基于维吾尔语的网络平台也在不断建立,带有主观感情色彩,反映态度和意见的维吾尔语评论性文本日益增多。因此,本文主要针对内容丰富、信息量大的维吾尔语评论性文本进行研究,完成情感分析任务。现有的情感分析研究方法大多基于传统机器学习模型或与人工提取特征结合,虽然在一定程度上提升系统性能,但存在一些局限性:1)依靠人工经验抽取样本的特征规则,受限于特征规则。2)传统浅层机器学习,对复杂问题的泛化能力有限,无法充分表示深层次的语义信息。因此针对维吾尔语情感分析任务,本文完成了以下工作:(1)提出采用深度学习算法进行基于深层语义的维吾尔语句子级情感分析任务。根据维吾尔语语言特性,考虑词性、情感词、转折连词,否定成分等对情感倾向性的影响,从词汇和句式两个抽象层次共提取了8项情感特征,并引入富含丰富语义和上下文信息的词向量表征词汇,利用栈式自编码算法无监督的学习文本的深层语义特征。(2)实体指代成分准确无歧义的消解为正确分析句子级情感任务提供了前提。研究分析近年来指代消解的研究现状,提出基于深度学习的维吾尔语名词短语的指代消解方法。根据维吾尔语具体的语言特性,总结具有指称性的五类名词短语,提取相应的13项指称特征。同时,提出利用词向量空间位置关系表示语义层面上的联系,增加特征对文本语义和句法信息的表达。(3)考虑词序与名词短语上下文信息对指代消解结果的影响,提出利用LSTM构建名词短语向量,结合深度栈式自编码实现多模型结合的维吾尔语名词短语指代消解方法,通过引入双层LSTM学习名词短语间对应的词汇序列和上下文信息,挖掘隐含的语义和句法关联,利用深度栈式自编码算法的多层映射单元进一步学习深层的特征,完成基于深层语义和句法信息的维吾尔语名词短语指代消解任务。(本文来源于《新疆大学》期刊2017-06-30)

王树恒[8](2017)在《基于深度学习的维吾尔语文本情感分析》一文中研究指出随着新疆基础通信服务的发展,大量社交网站相继建立。在这些社交网站上面存在大量的主观性言论,在这些主观言论中蕴含着用户丰富的情感。但是由于社交网站的更新速度快,数据量庞大,需要消耗大量人力物力成本来处理数据,因此,需要研究如何使用计算机自动化处理这些数据。针对这一问题,文本情感分析应运而生。现有情感分析主要集中在英语、汉语等语言,对于类似维吾尔语的小语种研究相对较少。针对传统情感分类方法未考虑文本间的深层语义关系,过于依赖背景知识并且忽略文本间情感极性的弊端,本文利用深度学习技术提取文本语义特征,并探索基于深度学习的维吾尔语文本情感分析技术。首先,本文通过使用词向量训练工具构建情感词典。通过获得词的语义表示,借鉴中文情感词库,利用语义相似度计算,构建维吾尔语情感词典。相对于传统使用领域专家结合字典或者大量语料人工构建情感词典的方法,此方法可以大量节省人力物力。其次,为解决传统研究方法中特征泛化能力差等问题,本文探索了基于词向量和LSTM-RNN模型的维吾尔语文本情感分析方法。首先,利用词向量训练工具,获取维吾尔语文本的词向量表示,充分利用维吾尔语词语间的深层次语义信息,提高特征向量对文本语义信息的表达。其次,通过探索LSTM-RNN型神经网络充分考虑上下文信息的优势,较好的获取文本历史信息。结合二者的优势,完成维吾尔语文本情感分类,通过实验获得较好的结果。最后,针对单纯的词向量无法考虑到文本间情感信息的问题,提出了基于双向LSTM模型的维吾尔语情感分析方法。该方法通过构建情感词典,将传统研究方法提取情感特征的词向量表示方式同基于语言模型训练词语词向量的方式结合起来,共同构成数据的向量表示。这种方法不仅考虑到文本的语义表征信息,同时也考虑到文本间的情感信息。然后,利用双向LSTM模型获得正向的历史信息与反向的历史信息。最后,通过实验表明,该方法能够充分描述原始文本数据的情感信息,进而提高模型分类准确性。(本文来源于《新疆大学》期刊2017-05-01)

罗亚伟,田生伟,禹龙,吐尔根·依布拉音,艾斯卡尔·艾木都拉[9](2016)在《细粒度意见挖掘中维吾尔语文本情感分析研究》一文中研究指出传统的情感分析研究通过分析,确定词语、句子或篇章的情感,但忽略了情感表达的主题。针对这一不足,该文提出了一种基于双层CRFs模型的细粒度意见挖掘中维吾尔语意见型文本陈述级情感分析方法。第一层模型识别意见型文本中的主题词和意见词,确定意见陈述的范围,并将识别结果传递给第二层模型,将其作为重要特征之一,用于陈述级情感分析。细粒度意见挖掘中情感分析的目标是构建<意见陈述,主题词,意见词,情感>四元组。该方法用于维吾尔语陈述级情感分析的准确率为77.41%,召回率为78.51%,证明了该方法在细粒度意见挖掘中情感分析任务上的有效性。(本文来源于《中文信息学报》期刊2016年01期)

王洁[10](2015)在《译者主体性与源语文本地位分析》一文中研究指出目的语文本与源语文本关系历来是翻译研究的重要话题,传统语言学派将文本意义等同于作者意译,以翻译忠诚为评价标准限制译者主体性发挥,语言学则将源语文本作为完全科学的客观实体,把译者当做语言转换的工具,抹煞译者主体性,文化学派兴起后抬升译者主体地位,源于文本地位因此没落。本文旨在打开传统二元对立的突破口,以主体性视角分析源语文本的地位发展过程。(本文来源于《校园英语》期刊2015年35期)

源语文本分析论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本实践报告主要包含源语文本、译本以及翻译报告。源语文本摘自《多模态语用学和翻译:分析源语文本的新模式》的第四章,从叁个角度寻找分析多模态源语文本的新模式。翻译报告以其译稿为例,选取韩礼德和哈桑衔接理论中的指代手段作为理论支撑,探讨源语文本中指代衔接在译本中的处理。翻译报告一共包含五部分:任务阐述、翻译过程、理论分析、理论在翻译中的应用以及结论。第一部分部分包含源语文本简介、选择文本的理由和翻译任务的意义叁个方面;第二部分从译前译中以及译后叁个阶段描述整个翻译过程;第叁部分简要阐述衔接理论中的指代手段,为后文奠定理论基础;第四部分通过举例和说明,详细阐述译者如何处理原文中出现的指代衔接手段;第五部分包含总结和启示。从理论上讲,此次翻译报告以韩礼德和哈桑的衔接理论作为指导,运用指代手段解决翻译中的问题,拓展了该理论在专着翻译中的应用;从实践上讲,此次翻译的源语文本是有关多模态的理论专着,这有助于引进国外文献,促进国内多模态文本翻译的发展。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

源语文本分析论文参考文献

[1].向进勇.维吾尔语文本情感分析[D].新疆大学.2019

[2].徐楚楚.《多模态语用学和翻译:分析源语文本的新模式》(第四章)的汉译及翻译实践报告[D].贵州师范大学.2019

[3].黎红.基于深度学习的维吾尔语文本事件信息的抽取与分析[D].新疆大学.2018

[4].张莹,亚森·艾则孜,吴顺祥.利用N-gram和语义分析的维吾尔语文本相似性检测方法[J].计算机应用研究.2019

[5].施梅芳.面向语音合成的马来语文本分析[D].云南大学.2018

[6].谢辉.翻译、多语文本与身份认同——林语堂汉语散文中的多语现象分析[J].山东外语教学.2017

[7].李敏.基于深度学习的维吾尔语文本情感分析[D].新疆大学.2017

[8].王树恒.基于深度学习的维吾尔语文本情感分析[D].新疆大学.2017

[9].罗亚伟,田生伟,禹龙,吐尔根·依布拉音,艾斯卡尔·艾木都拉.细粒度意见挖掘中维吾尔语文本情感分析研究[J].中文信息学报.2016

[10].王洁.译者主体性与源语文本地位分析[J].校园英语.2015

标签:;  ;  ;  ;  

源语文本分析论文-向进勇
下载Doc文档

猜你喜欢