中文分词论文
中文新词语自动检测研究
邹纲[1]2004年在《中文新词语自动检测研究》文中提出随着社会、经济的飞速发展,越来越多的中文新词语出现在人们的生活中。新词语的出现丰富了语言的色彩,同时也给词典编纂、中文自然语言处理等领域带来了挑战。如何寻找新词语成了一个重要的问题。然而目前新词语并没有一个明确的、公认的定义,本文根据词法分析和...大规模语料库分词质量评价方法研究
宋礼鹏[1]2004年在《大规模语料库分词质量评价方法研究》文中提出在自然语言处理领域里,以大规模真实文本为基础的语料库研究和知识自动获取越来越受到重视,建设大规模高质量的语料库成为首要的任务。然而,对语料库加工质量检验方法的研究却很少。语料库分词质量的评价问题是汉语语料库的特有问题,已有的简单随机...在自然汉语中进行分词和词性标注
刘东旭[1]2003年在《在自然汉语中进行分词和词性标注》文中研究表明分词和词性标注是自然汉语处理(NLP)的基础,前几届师兄已经在这方面做了大量的研究,我所做的课题就是在他们的基础上对这部分内容进行总结、改进、提高,对后续研究提供更完善的支持。分词在以前的研究中主要采用将MM法(正向最大匹配)、R...