文本特征项的选择是文本挖掘和信息检索的基础和重要内容。传统的特征提取方法需要手工制作的特征,而手工设计有效的特征是一个漫长的过程,但针对新的应用深度学习能够快速地从训练数据中获取新的有效特征表示。作为一种新的特征提取方法,深度学习在文本挖掘方面取得了一定的成果。深度学习与传统方法的主要区别在于,深度学习能自动地从大数据中学习特征而不是采用手工制作的特征,手工制作的特征主要依赖于设计者的先验知识,很难充分利用大数据;深度学习可以自动地从大数据中学习特征表示,并包括数以万计的参数。文中概述了用于文本特征提取的常用方法,并阐述了在文本特征提取及应用中常用的深度学习方法,以及深度学习在特征提取中的应用展望。
类型: 期刊论文
作者: 张千,王庆玮,张悦,纪校锋,张宇翔,祝赫,赵昌志
关键词: 深度学习,特征提取,文本特征,自然语言处理,文本挖掘
来源: 计算机技术与发展 2019年12期
年度: 2019
分类: 信息科技
专业: 计算机软件及计算机应用,自动化技术
单位: 中国石油大学(华东)计算机与通信工程学院
基金: 中央高校基本科研业务专项基金(18CX02019A),科技部创新方法工作专项(2015IM010300)
分类号: TP391.1;TP18
页码: 61-65
总页数: 5
文件大小: 371K
下载量: 1556
本文来源: https://www.lunwen66.cn/article/ece42278e042762f2121321a.html