导读:本文包含了文本分类模型论文开题报告文献综述及选题提纲参考文献,主要关键词:文本分类,关键词抽取,注意力机制,胶囊网络
文本分类模型论文文献综述
李钰曼,陈志泊,许福[1](2019)在《基于KACC模型的文本分类研究》一文中研究指出【目的】通过提高文本内容表示的数据质量,关联文本内容和文本标签向量,从而提高文本分类的效果。【方法】改进关键词的抽取方法,并使用关键词向量表示文本,提出类别标签表示算法对文本类别进行向量化表示,提出基于注意力机制的胶囊网络作为分类器,构建KACC模型,并进行文本分类的对比实验。【结果】KACC模型有效提高了数据质量;实验结果表明,KACC模型在准确率、召回率、F值叁方面均优于现有模型,分类准确率达97.4%。【局限】实验数据规模受限,未对类别区分度在其他语料上的代表性进行探究。【结论】KACC模型在文本分类方面与现有分类方法相比具有更好的分类效率和效果。(本文来源于《数据分析与知识发现》期刊2019年10期)
孙嘉琪,王晓晔,周晓雯[2](2019)在《基于神经网络模型的文本分类研究综述》一文中研究指出文本分类是自然语言处理与理解当中重要的一个研究内容,在文本信息处理过程中有关键作用.目前深度学习已经在图像识别、机器翻译等领域取得了突破性的进展,而且它也被证明在自然语言处理任务中拥有着提取句子或文本更高层次表示的能力,也备受自然语言处理研究人员的关注.文章以基于深度学习的文本分类技术为研究背景,介绍了几种基于深度学习神经网络模型的文本分类方法,并对其进行分析.(本文来源于《天津理工大学学报》期刊2019年05期)
牛雪莹[3](2019)在《结合主题模型词向量的CNN文本分类》一文中研究指出挖掘微博文本中的信息对自动问答、舆情分析等应用研究具有重要意义。文本数据的分类研究是文本数据挖掘的基础。本文提出将Word2vec和LDA(Latent Dirichlet Allocation)的文本表示同时输入卷积神经网络模型进行高层语义特征抽象和分类学习,使得输入的词向量既能表现词语之间的语义信息又能体现文本的主题思想。首先用Word2vec和LDA模型分别在语料库中学习产生词向量,然后词向量分别级联得到各自的文本矩阵表示,最后将文本矩阵作为2个通道同时输入到卷积神经网络做分类训练,并通过微博数据实验验证了该方法的有效性。(本文来源于《计算机与现代化》期刊2019年10期)
殷晓雨,阿力木江·艾沙,库尔班·吾布力[4](2019)在《基于卷积递归模型的文本分类研究》一文中研究指出近年来卷积神经网络和循环神经网络在文本分类领域得到了越来越广泛的的应用。提出一种卷积神经网络和长短时记忆网络特征融合的模型,通过长短期记忆网络作为池化层的替代来获得长期依赖性,从而构建一个联合CNN和RNN的框架来克服单卷积神经网络忽略词语在上下文中语义和语法信息的问题。所提出的方法在减少参数数量和兼顾文本序列全局特征方面起着重要作用,实验结果表明,可以通过更小的框架来实现相同级别的分类性能,并且在准确率方面超越了同类型的其他几种方法。(本文来源于《电子技术应用》期刊2019年10期)
马正奇,呼嘉明,龙铭,陈新[5](2019)在《运用CNN-LSTM混合模型的短文本分类》一文中研究指出针对分类短文本时卷积神经网络(CNN)只提取局部特征和长短时记忆网络(LSTM)学习计算量大、处理时间长且随着短文本文字量增加与上下文的联系会减弱的问题,给出了基于CNN-LSTM混合模型算法.该算法融合CNN对短文本的特征提取能力,降低了文本数据量;利用LSTM的记忆能力,充分学习短文本的全局特征,进而对短文本进行更加有效地分类.实验结果表明,CNN-LSTM混合模型对短文本的分类效果远远好于CNN模型和LSTM模型.(本文来源于《空军预警学院学报》期刊2019年04期)
郑诚,薛满意,洪彤彤,宋飞豹[6](2019)在《用于短文本分类的DC-BiGRU_CNN模型》一文中研究指出文本分类是自然语言处理中一项比较基础的任务,如今深度学习技术被广泛用于处理文本分类任务。在处理文本序列时,卷积神经网络可以提取局部特征,循环神经网络可以提取全局特征,它们都表现出了不错的效果。但是,卷积神经网络不能很好地捕获文本的上下文相关语义信息,循环神经网路对语义的关键信息不敏感。另外,利用更深层次的网络虽然可以更好地提取特征,但是容易产生梯度消失或梯度爆炸问题。针对以上问题,文中提出了一种基于密集连接循环门控单元卷积网络的混合模型(DC-BiGRU_CNN)。该模型首先用一个标准的卷积神经网络训练出字符级词向量,然后将其与词级词向量进行拼接并作为网络输入层。受密集连接卷积网络的启发,在对文本进行高级语义建模阶段时,采用文中提出的密集连接双向门控循环单元,其可以弥补梯度消失或梯度爆炸的缺陷,并且加强了每一层特征之间的传递,实现了特征复用;对前面提取的深层高级语义表示进行卷积和池化操作以获得最终的语义特征表示,再将其输入到softmax层,实现对文本的分类。在多个公开数据集上的研究结果表明,DC-BiGRU_CNN模型在执行文本分类任务时准确率有显着提升。此外,通过实验分析了模型的不同部件对性能提升的作用,研究了句子的最大长度值、网络的层数、卷积核的大小等参数对模型效果的影响。(本文来源于《计算机科学》期刊2019年11期)
吴龙峰[7](2019)在《基于Word2vec和LDA的卷积神经网络文本分类模型》一文中研究指出针对短文本的文本分类出现的特征维度高和数据稀疏性的问题,本文提出了一种结合神经网络语言模型word2vec和文档主题模型LDA的文本特征表示模型,并使用表示矩阵模型,矩阵模型不仅可以有效地表示单词的语义特征,还可以表达上下文特征,增强模型的特征表达能力。将特征矩阵输入卷积神经网络(CNN)进行卷积池化,并进行文本分类实验。(本文来源于《电脑知识与技术》期刊2019年22期)
赵云山,段友祥[8](2019)在《基于Attention机制的卷积神经网络文本分类模型》一文中研究指出文本分类是自然语言处理的重要内容,而有效提取文本全局语义是成功完成分类任务的关键.为了体现卷积神经网络提取特征的非局部重要性,在模型中引入Attention机制并建立了包含4个Attention CNN层的A-CNN文本分类模型.其中,Attention CNN层中普通卷积层用于提取局部特征,Attention机制用于生成非局部相关度特征.最后,使用A-CNN模型分别在情感分析、问题分类、问题答案选择等数据集上进行了实验和对比分析.结果表明:相比于其他对比模型,A-CNN模型完成上述3个文本分类任务时的最高精度分别提高了1.9%、4.3%、0.6%,可见A-CNN模型在文本分类任务中具有较高的精度和较强的通用性.(本文来源于《应用科学学报》期刊2019年04期)
涂文博,袁贞明,俞凯[9](2019)在《针对文本分类的神经网络模型》一文中研究指出文本分类是自然语言处理领域的一项重要任务,具有广泛的应用场景,比如知识问答、文本主题分类、文本情感分析等.解决文本分类任务的方法有很多,如支持向量机(Support Vector Machines, SVM)模型和朴素贝叶斯(Na?ve Bayes)模型,现在被广泛使用的是以循环神经网络(Recurrent Neural Network, RNN)和文本卷积网络(TextConventional Neural Network, TextCNN)为代表的神经网络模型.本文分析了文本分类领域中的序列模型和卷积模型,并提出一种组合序列模型和卷积模型的混合模型.在公开数据集上对不同模型进行性能上的对比,验证了组合模型的性能要优于单独的模型.(本文来源于《计算机系统应用》期刊2019年07期)
庄建昌,武娇,洪彩凤,顾兴全[10](2019)在《基于结构张量空间模型的文本分类》一文中研究指出在自然语言处理中,将非结构化的文本数据表示成结构化数据是文本处理工作的基础,文本表示的优劣对后期文本处理的效果有直接的影响。提出一种新的结构化文本表示模型——结构张量空间模型,该模型将文本按照其自身的层次含义进行分层表示,相比较于传统的文本表示模型,更充分地体现文本的结构信息。研究了基于结构张量空间模型的文本分类问题,实验结果表明,在小样本数据下,结合结构张量空间模型的分类器性能更好。(本文来源于《统计与信息论坛》期刊2019年07期)
文本分类模型论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
文本分类是自然语言处理与理解当中重要的一个研究内容,在文本信息处理过程中有关键作用.目前深度学习已经在图像识别、机器翻译等领域取得了突破性的进展,而且它也被证明在自然语言处理任务中拥有着提取句子或文本更高层次表示的能力,也备受自然语言处理研究人员的关注.文章以基于深度学习的文本分类技术为研究背景,介绍了几种基于深度学习神经网络模型的文本分类方法,并对其进行分析.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
文本分类模型论文参考文献
[1].李钰曼,陈志泊,许福.基于KACC模型的文本分类研究[J].数据分析与知识发现.2019
[2].孙嘉琪,王晓晔,周晓雯.基于神经网络模型的文本分类研究综述[J].天津理工大学学报.2019
[3].牛雪莹.结合主题模型词向量的CNN文本分类[J].计算机与现代化.2019
[4].殷晓雨,阿力木江·艾沙,库尔班·吾布力.基于卷积递归模型的文本分类研究[J].电子技术应用.2019
[5].马正奇,呼嘉明,龙铭,陈新.运用CNN-LSTM混合模型的短文本分类[J].空军预警学院学报.2019
[6].郑诚,薛满意,洪彤彤,宋飞豹.用于短文本分类的DC-BiGRU_CNN模型[J].计算机科学.2019
[7].吴龙峰.基于Word2vec和LDA的卷积神经网络文本分类模型[J].电脑知识与技术.2019
[8].赵云山,段友祥.基于Attention机制的卷积神经网络文本分类模型[J].应用科学学报.2019
[9].涂文博,袁贞明,俞凯.针对文本分类的神经网络模型[J].计算机系统应用.2019
[10].庄建昌,武娇,洪彩凤,顾兴全.基于结构张量空间模型的文本分类[J].统计与信息论坛.2019