新时代人民日报分词语料库构建、性能及应用(三)——句长与词的分析比较

新时代人民日报分词语料库构建、性能及应用(三)——句长与词的分析比较

论文摘要

[目的/意义]基于新时代人民日报分词语料库从不同维度统计分析句子长度和词汇分布,有助于了解当代汉语文本的语言学特征,进而开展自然语言处理和文本挖掘研究。[方法/过程]在2018年1月人民日报分词语料的基础上,结合1998年1月人民日报分词语料,确定统计中所使用的6种句子类别,统计和分析字与词单位上的句子长度分布,并基于齐普夫定律揭示词汇静态分布情况。[结果/结论]从字词维度上的句子长度分布情况和词汇的齐普夫分布状态上看,随着时间的推移,在1998和2018两个语料上,句子的长度和词汇的分布均发生变化,但这种变化又是延续的、有关联的。

论文目录

  • 1 引言
  •   1.1 研究背景和意义
  •   1.2 相关研究情况梳理
  • 2 字维度上的句长分布
  •   2.1 1998年1月人民日报字维度上的句长分布
  •   2.2 2018年1月人民日报字维度上的句长分布
  • 3 词维度上的句长分布
  •   3.1 1998年1月人民日报词维度上的句长分布
  •   3.2 2018年1月人民日报词维度上的句长分布
  • 4 词分布上的齐普夫定律验证
  • 5 结语
  • 文章来源

    类型: 期刊论文

    作者: 黄水清,王东波

    关键词: 新时代人民日报分词语料,语料库,句子长度,词汇分布,齐普夫定律

    来源: 图书情报工作 2019年24期

    年度: 2019

    分类: 信息科技,哲学与人文科学

    专业: 中国语言文字

    单位: 南京农业大学信息科学技术学院,南京农业大学领域知识关联研究中心

    分类号: H146

    DOI: 10.13266/j.issn.0252-3116.2019.24.001

    页码: 5-15

    总页数: 11

    文件大小: 825K

    下载量: 195

    相关论文文献

    • [1].突发公共卫生事件网络语料库系统构建[J]. 情报学报 2013(09)
    • [2].华裔美国作家哈金作品《落地》建构的中国形象——基于语料库的考察[J]. 乐山师范学院学报 2019(11)
    • [3].近十年国际语料库翻译研究文献计量分析(2008-2018)[J]. 外语与外语教学 2019(06)
    • [4].科技大数据背景下的中英双语语料库的构建及其特点研究[J]. 中国科技资源导刊 2019(06)
    • [5].浅析信息技术背景下口译语料库的研究现状及进展[J]. 教育现代化 2019(99)
    • [6].语料库在俄语教学中的应用探究[J]. 科技风 2020(08)
    • [7].文学作品的语料库检索分析——以小说《呼啸山庄》为例[J]. 现代交际 2020(04)
    • [8].音乐口述史语料库分析方法的理论原理与操作步骤[J]. 中国音乐 2020(01)
    • [9].基于语料库“刚刚”“刚才”的维译对比研究[J]. 汉字文化 2019(23)
    • [10].语料库技术辅助汉译英教学模式探索[J]. 科技视界 2020(03)
    • [11].基于语料库的对话口译模糊限制语性别研究[J]. 甘肃广播电视大学学报 2020(01)
    • [12].《基于语料库的语法研究》评介[J]. 南昌师范学院学报 2019(05)
    • [13].国内基于语料库的翻译研究二十年综述(1999—2018)[J]. 成都理工大学学报(社会科学版) 2020(01)
    • [14].语料库翻译学:在名与实之间[J]. 外语学刊 2020(01)
    • [15].《诗经》汉英平行历时语料库研制与应用[J]. 沈阳大学学报(社会科学版) 2020(02)
    • [16].言者顺应:基于语料库驱动视角[J]. 广东石油化工学院学报 2020(02)
    • [17].基于语料库的习近平国际峰会主旨演讲高频词研究[J]. 法制与社会 2020(11)
    • [18].浅谈中日农业术语对译语料库的建设[J]. 农家参谋 2020(16)
    • [19].基于历时语料库的“先生”称谓语用嬗变研究[J]. 教育教学论坛 2020(18)
    • [20].基于历时语料库的“度”字义项演变探微[J]. 汉字文化 2020(09)
    • [21].俄汉可比语料库翻译等价物抽取的方法设计及应用展望[J]. 欧亚人文研究 2019(01)
    • [22].国内基于语料库的翻译显化和隐化研究综述[J]. 牡丹江大学学报 2020(06)
    • [23].国内语料库翻译研究现状及未来走向探讨[J]. 英语广场 2020(16)
    • [24].基于语料库汉语人体部位词“脸”的认知研究[J]. 汉字文化 2020(10)
    • [25].基于历时语料库的在线词典编纂系统设计[J]. 中文信息学报 2020(05)
    • [26].基于语料库及其技术的思政课优质教学资源建设与共享研究[J]. 思想政治课研究 2020(03)
    • [27].海外社交平台的广州城市形象呈现——基于推特十年涉穗话语语料库分析[J]. 国际传播 2020(03)
    • [28].语料库翻译学视阈下的意识形态显化——《语料库批评翻译学概论》述评[J]. 山东外语教学 2020(04)
    • [29].自建语料库在商务英语翻译教学中的应用[J]. 宁波广播电视大学学报 2020(03)
    • [30].基于语料库的多维翻译文体评估——以《骆驼祥子》的葛浩文译本为例[J]. 海外英语 2020(16)

    标签:;  ;  ;  ;  ;  

    新时代人民日报分词语料库构建、性能及应用(三)——句长与词的分析比较
    下载Doc文档

    猜你喜欢