基于深度学习的文本特征提取研究综述

基于深度学习的文本特征提取研究综述

论文摘要

文本特征项的选择是文本挖掘和信息检索的基础和重要内容。传统的特征提取方法需要手工制作的特征,而手工设计有效的特征是一个漫长的过程,但针对新的应用深度学习能够快速地从训练数据中获取新的有效特征表示。作为一种新的特征提取方法,深度学习在文本挖掘方面取得了一定的成果。深度学习与传统方法的主要区别在于,深度学习能自动地从大数据中学习特征而不是采用手工制作的特征,手工制作的特征主要依赖于设计者的先验知识,很难充分利用大数据;深度学习可以自动地从大数据中学习特征表示,并包括数以万计的参数。文中概述了用于文本特征提取的常用方法,并阐述了在文本特征提取及应用中常用的深度学习方法,以及深度学习在特征提取中的应用展望。

论文目录

  • 0 引 言
  • 1 文本特征提取方法
  •   1.1 过滤方法
  •     1.1.1 词 频
  •     1.1.2 互信息
  •     1.1.3 信息增益
  •     1.1.4 应 用
  •   1.2 融合方法
  •     1.2.1 加权KNN(k最近邻)
  •     1.2.2 中心向量加权法
  •   1.3 映射方法
  •     1.3.1 潜在语义分析
  •     1.3.2 最小二乘映射方法
  •     1.3.3 应 用
  •   1.4 聚类方法
  •     1.4.1 CHI(卡方)聚类法
  •     1.4.2 概念索引
  •     1.4.3 应 用
  • 2 深度学习方式
  •   2.1 自编码
  •   2.2 受限玻尔兹曼机
  •   2.3 深度信念网络
  •   2.4 卷积神经网络
  •   2.5 递归神经网络
  • 3 结束语
  • 文章来源

    类型: 期刊论文

    作者: 张千,王庆玮,张悦,纪校锋,张宇翔,祝赫,赵昌志

    关键词: 深度学习,特征提取,文本特征,自然语言处理,文本挖掘

    来源: 计算机技术与发展 2019年12期

    年度: 2019

    分类: 信息科技

    专业: 计算机软件及计算机应用,自动化技术

    单位: 中国石油大学(华东)计算机与通信工程学院

    基金: 中央高校基本科研业务专项基金(18CX02019A),科技部创新方法工作专项(2015IM010300)

    分类号: TP391.1;TP18

    页码: 61-65

    总页数: 5

    文件大小: 371K

    下载量: 1556

    相关论文文献

    标签:;  ;  ;  ;  ;  

    基于深度学习的文本特征提取研究综述
    下载Doc文档

    猜你喜欢