流通度论文-史中琦,张普

流通度论文-史中琦,张普

导读:本文包含了流通度论文开题报告文献综述及选题提纲参考文献,主要关键词:词表,流通度,动态流通语料库,语感

流通度论文文献综述

史中琦,张普[1](2005)在《基于DCC动态流通报纸语料库的流通度词表和使用度词表的对比分析》一文中研究指出词表对于中文信息处理等领域具有重要的价值和意义。作者对从2002年10种主流报纸中提取的两个词表(流通度表和使用度表)前3000词语进行了比较,如果把使用度词表作为初表,对比后发现流通度对使用度词表进行了较大幅度的调整,使用度表前3000词语中34.37%的词语到了流通度表中跌出了3000,65.63%的词语保留在了流通度表前3000,同时有1031个词语新进入了流通度表前3000。本文对新进入的词语进行分析,发现2/3的词语具有显着领域特色;标识类名词数量众多,代词和形容词数目偏少。我们还进行了语感验证,结果显示流通度对使用度词表的调整是合理的,最后的结论是:以流通度为标准提取的词表由于加入了发行量和媒体等系数,在内容和顺序上更能反映报纸的动态变化,更加科学实用。(本文来源于《全国第八届计算语言学联合学术会议(JSCL-2005)论文集》期刊2005-08-01)

史中琦[2](2005)在《基于DCC动态流通报纸语料库的流通度词表和使用度词表的对比分析》一文中研究指出词表,对于语言学理论、语言教学、中文信息处理等领域都具有极其重要的价值和意义。词表研究,也因此成为众多学者历来关注的重要课题之一。本文针对从2002年10种主流报纸中提取的两个词表——流通度词表和使用度词表进行了多角度的比较分析,最后得出结论:以流通度为标准提取的词表由于加入了发行量和媒体等系数,在内容和顺序上更能反映报纸的动态变化,更加科学实用。 本文主要对两个词表前3000的词语进行了比较,如果把使用度词表作为初表,对比后我们发现流通度对使用度词表进行了较大幅度的调整,使用度表前3000中有65.63%的词语到了流通度表中仍然保持在前3000的行列,34.37%的词语到了流通度表中则跌出了前3000,同时有1031个本来在使用度表中位列3000以后的词语进入了流通度表前3000。在新进入的词语中,具有显着领域特色的词语大量涌入,涵盖经济、政治、休闲娱乐等多个方面;从词性角度看,标识类名词数量众多,代词和形容词数目偏少。在跌出去的词语中,形容词数量较多。在保留下来的词语中,有叁类词语特点明显:网页信息类、报纸栏目名称类和报纸属性信息类;从词性角度看,代词和几种虚词更为引人注意。在对词表观察分析时我们发现,报纸发行量、发行地域等“媒体系数”在调整词表的过程中发挥了重要作用,这体现了流通度的重要思想——媒体流通度会直接影响到文本的流通度,文本的真实流通才会对大众语感产生影响。除了分析词表的变化,我们还对“语结构”进行了专门的研究并得出结论:流通度词表中的语结构更好地兼顾到了统计和语感两个方面的因素,因此更有实用价值。为了验证文章结论是否正确,我们还进行了一定范围的语感验证,验证结果与我们之前得到的结论非常吻合,这也是对流通度理论的有力佐证。 本文的语料来自北京语言大学DCC动态流通语料库。采用语料库技术,同时参考大众语感。希望通过本文可以体现流通度理论在科学性和实用性上的优势,同时,也希望我们的结果能够为对外汉语教学提供一些借鉴和参考。(本文来源于《北京语言大学》期刊2005-06-01)

曹钦明[3](2005)在《字母词的社会流通度考察》一文中研究指出从社会流通这个角度对字母词进行考察,运用统计学上的卡方检验方法来分析字母词的流通度与社会人群的性别、年龄、受教育程度、职业等因素的关系,指出这些因素并没有影响到人们更倾向使用字母词,字母词已在人们生活的各个领域大量使用并呈现出受欢迎的趋势。(本文来源于《广西社会科学》期刊2005年04期)

郑泽之,王强军,张普[4](2003)在《流通度—字词使用情况测定的新方法》一文中研究指出流通度理论是由张普教授提出的,是对字词的使用情况进行多层次信息分析加工的一种动态的方法。我们使用流通度的方法对北京语言文化大学网络教育学院DCC博士研究室的大规模动态流通语料库的汉字使用情况进行了统计,在此基础上给出了统计结果的分析。并由此阐明流通度理论及其加工方法是对语言文字使用情况进行研究的一种行之有效的、直观快捷的新方法。(本文来源于《语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集》期刊2003-08-01)

张普[5](2001)在《流通度在IT术语识别中的应用分析——关于术语、术语学、术语数据库的研究》一文中研究指出本文概述了术语、术语学、术语数据库研究的必要和国内外研究的现状,探讨了术语的界定、术语的基本特征、术语与一般词语的共同特征和区别特征,流通度与术语的自动提取等有关问题.(本文来源于《辉煌二十年——中国中文信息学会二十周年学术会议论文集》期刊2001-11-01)

张普[6](1999)在《关于语感与流通度的思考》一文中研究指出在1998年8月的应用语言学研讨会上,我提交的论文《关于大规模真实文本语料库的几点理论思考》,对语料库的建设进行了反思,在回顾多年来语料库建设的成就和当前迫切需要解决的棘手问题的基础上,对于第叁代语料库的建设,特别是面对下一个世纪的超大规模语料库的建...(本文来源于《语言教学与研究》期刊1999年02期)

流通度论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

词表,对于语言学理论、语言教学、中文信息处理等领域都具有极其重要的价值和意义。词表研究,也因此成为众多学者历来关注的重要课题之一。本文针对从2002年10种主流报纸中提取的两个词表——流通度词表和使用度词表进行了多角度的比较分析,最后得出结论:以流通度为标准提取的词表由于加入了发行量和媒体等系数,在内容和顺序上更能反映报纸的动态变化,更加科学实用。 本文主要对两个词表前3000的词语进行了比较,如果把使用度词表作为初表,对比后我们发现流通度对使用度词表进行了较大幅度的调整,使用度表前3000中有65.63%的词语到了流通度表中仍然保持在前3000的行列,34.37%的词语到了流通度表中则跌出了前3000,同时有1031个本来在使用度表中位列3000以后的词语进入了流通度表前3000。在新进入的词语中,具有显着领域特色的词语大量涌入,涵盖经济、政治、休闲娱乐等多个方面;从词性角度看,标识类名词数量众多,代词和形容词数目偏少。在跌出去的词语中,形容词数量较多。在保留下来的词语中,有叁类词语特点明显:网页信息类、报纸栏目名称类和报纸属性信息类;从词性角度看,代词和几种虚词更为引人注意。在对词表观察分析时我们发现,报纸发行量、发行地域等“媒体系数”在调整词表的过程中发挥了重要作用,这体现了流通度的重要思想——媒体流通度会直接影响到文本的流通度,文本的真实流通才会对大众语感产生影响。除了分析词表的变化,我们还对“语结构”进行了专门的研究并得出结论:流通度词表中的语结构更好地兼顾到了统计和语感两个方面的因素,因此更有实用价值。为了验证文章结论是否正确,我们还进行了一定范围的语感验证,验证结果与我们之前得到的结论非常吻合,这也是对流通度理论的有力佐证。 本文的语料来自北京语言大学DCC动态流通语料库。采用语料库技术,同时参考大众语感。希望通过本文可以体现流通度理论在科学性和实用性上的优势,同时,也希望我们的结果能够为对外汉语教学提供一些借鉴和参考。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

流通度论文参考文献

[1].史中琦,张普.基于DCC动态流通报纸语料库的流通度词表和使用度词表的对比分析[C].全国第八届计算语言学联合学术会议(JSCL-2005)论文集.2005

[2].史中琦.基于DCC动态流通报纸语料库的流通度词表和使用度词表的对比分析[D].北京语言大学.2005

[3].曹钦明.字母词的社会流通度考察[J].广西社会科学.2005

[4].郑泽之,王强军,张普.流通度—字词使用情况测定的新方法[C].语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集.2003

[5].张普.流通度在IT术语识别中的应用分析——关于术语、术语学、术语数据库的研究[C].辉煌二十年——中国中文信息学会二十周年学术会议论文集.2001

[6].张普.关于语感与流通度的思考[J].语言教学与研究.1999

标签:;  ;  ;  ;  

流通度论文-史中琦,张普
下载Doc文档

猜你喜欢