论文摘要
对于搜索引擎而言,如何能够正确理解用户提出的问题十分重要。而在识别问句的过程中,如何能够对形式不同而语义相似的问句进行相似性识别后,归一化处理,则会对整个搜索引擎的效果有一个明显的提升。对此,本文提出了一种基于机器学习的问句相似性判别模型,从数据集的构建到特征的提取,探究了相应的解决方案。本文创新性地从5个方面提取了不同类型的特征,并将其应用到整个分类器的建模过程中。实验结果表明,该方法能够在现有的语料上取得令人满意的结果,F值达到了83%。
论文目录
文章来源
类型: 期刊论文
作者: 尹庆宇,张宇,刘挺
关键词: 相似度,问句,机器学习
来源: 智能计算机与应用 2019年06期
年度: 2019
分类: 信息科技
专业: 计算机软件及计算机应用
单位: 哈尔滨工业大学计算机科学与技术学院
分类号: TP391.1
页码: 41-44
总页数: 4
文件大小: 587K
下载量: 41