句子长度论文-塞麦提·麦麦提敏,吐尔根·伊布拉音

句子长度论文-塞麦提·麦麦提敏,吐尔根·伊布拉音

导读:本文包含了句子长度论文开题报告文献综述及选题提纲参考文献,主要关键词:汉语,维吾尔语,句子对齐,基于长度的方法

句子长度论文文献综述

塞麦提·麦麦提敏,吐尔根·伊布拉音[1](2018)在《汉维句子对齐长度计算单位的研究》一文中研究指出在面向机器翻译的语料库建设过程中,基于长度的汉维句子对齐和长度相似度算法大多都以字符作为汉维句子长度的计算单位。但是,还有其他计算方法值得尝试。对长度计算单位的4种组合进行统计与实验分析,以确定汉维句子长度计算的最佳单位,最终提高汉维句子对齐的准确率。双语句子汉语字符数和维文词数之间相关系数较高,句子长度比值近似于正态分布。根据实验结果,汉文字符和维文单词是汉维句子对齐的最佳长度计算单位,句子对齐的准确率和召回率最高,分别达到94%和93.6%。(本文来源于《现代计算机(专业版)》期刊2018年33期)

李青苗[2](2018)在《从《左传》的偏正结构和句子长度看现代汉语细节意义的增强》一文中研究指出《左传》中的"城濮"、"城隶"等并非固有的地名,它们在意思上等同于今天的"某城"。今天的偏正式结构,一般都是"偏+正"的形式,而在《左传》中,这些地名却是"正+偏"的组合,古今这种对比的差异折射出了汉民族对细节意义逐渐重视的历史;《左传》中的句子大多很短,而今天的句子则比先秦古代汉语要复杂得多,这也是人们逐渐看重细节意义的理据,同时,从中也可以找到认知上的解释。(本文来源于《东北师大学报(哲学社会科学版)》期刊2018年04期)

邱小燕[3](2017)在《句子长度的分布规律及其制约因素》一文中研究指出句长统计是一种针对句子在语用方面分析研究的统计方法,即通过统计定量的语料库中长度相同的句子出现的次数,再根据得到的数据绘制成表格,从句长的分布规律从而分析人们在句子使用方面的规律,从而分析出造成这种情况的原因。而且对于句长的研究在语言学——特别是第二语言教学中发挥着重要的作用,另外,在信息学、文献计量学及情报学方面也有所涉及。本文的研究工作,主要是从历时角度建立不同时间段的语料库,通过统计各个时间段的句长及其分布规律,再进行对比分析从而了解汉语的发展规律;最后,通过共时角度的汉英句长的对比分析异同点,从而证明语言具有共同性。文章一共分为六章:第一章是绪论,主要介绍了本文的选题背景以及国内外关于句法学、统计语言学及句长的研究现状,简要介绍了本文的研究目的与意义、研究思路和研究方法以及本文的结构组成。第二章是主要是针对本文在句长统计的过程中所要涉及到的相关实验软件进行的分析,主要分四个部分:第一,对已有的句长及句频的相关概念作了简单的说明;第二,介绍了统计语言学中叁种主要的中文分词算法及中文分词算法的难点——未登录词识别和歧义识别;第叁,介绍了一般情况下检测实验软件的标准——正确率和召回率及F指标,在这叁个检测标准的基础上,利用汉语及英语句长、句频的样本统计实验对本文所要使用的软件进行检测,从而确认本文实验软件的可行性;第四,大致介绍了本文语料的收集与整理的过程,为了确保数据的可靠性,本文语料库中汉语的语料上溯先秦,下及现当代,以及两汉、魏晋南北朝、隋唐、宋元、明清等时期,英语语料收集的主要是中世纪文艺复兴后的,文章篇幅也涉及了短篇、中篇及长篇,包括经、史、子、集各种典籍。第叁章是本文为下文作准备的基础部分,主要介绍了统计句长及句频的实验设备、程序代码的编写及实验步骤。本文所使用的软件是在Java软件的基础上完成的,由于本文所采用的语料涉及古今中外,既有纵向的从先秦到现当代,又有横向的中英文对比,并且是从字本位和词本位两个角度来统计分析的,因此本文所要进行的实验也是具有针对性的,这种"针对性"就要通过不同的程序代码来实现的。在实验设备和程序代码都具备的情况下,就可以进行句长及句频统计的实验了。第四章主要是对句长及句频实验数据的整理分析。根据上文的实验得出的数据绘制成Excel表格,再绘制成各个时期的散点图,从而通过每个时期高频句的句长及平均句长发现语言发展是比较稳定的。然后通过对汉语句长、句频在不同时间段的分析及同时间段汉英句长、句频的对比分析,从而得出句子长度的分布规律:一篇文章的句长是呈现抛物线的分布趋势的。即在理论上语言本身的递归性使得句子的长度是无限长的,但在语言的实际运用中,因为受到各种因素的影响,使得语言的长度是有限的,从而为下文分析句长制约的因素作了基础。第五章是本文的重点部分,先说明因为语言的递归性及重写规则使得句子可以无限长的,然而上文的实验数据表明每个时期无论是平均句长还是高频句的句长都是有限的,因此本章从信息加工的处理方式、语体、语调、强制性表达方式、语言的经济规则及个人的语言风格等六个方面来结合实验数据详细分析了它们对句长产生的作用。然后通过对复句及独立成分的分析证明句法是无法制约句长的。第六章是本文的结语,在总结了本文主要内容的基础上,指出本文还存在的一些不足之处,最后对将来在句长方面的研究作了一些展望。(本文来源于《安徽大学》期刊2017-04-01)

刘海燕,尹晓虎[4](2016)在《多斯·帕索斯经典小说句子长度的多重分形分析》一文中研究指出小说的句子长度变化具有长程相关的分形结构,通过应用多重分形去除趋势波动分析方法,对"迷惘的一代"经典作家多斯·帕索斯代表作中句子长度变化进行实证研究,检验了这一观点。结果表明,小说文本的句子长度序列具有分形特征,其Hurst指数能较好地反映作品的文学质量,其分形程度可以用序列奇异谱的宽度来刻画。(本文来源于《科技经济导刊》期刊2016年28期)

才藏太,索南才让[5](2016)在《基于锚点信息和句子长度相结合的汉藏句子对齐方法研究》一文中研究指出语料库资源对于自然语言处理研究的巨大价值已经得到社会各界越来越多的认可。特别是句子级对齐的双语平行语料库,已经成为机器翻译、翻译知识获取以及双语词典编纂研究不可或缺的重要资源。本文结合青海省科技厅项目《汉藏句子自动对齐技术研究》的研究经验,提出了一种利用句子长度和锚点信息相结合的汉藏双语句子对齐方法,该方法利用(1:1)型的句珠作为候选锚点,用锚点将双语文本分割成几个分块,在对应双语分块中用基于长度的对齐实现句子的对齐。(本文来源于《青海师范大学民族师范学院学报》期刊2016年01期)

王艺璇[6](2015)在《HSK作文成绩与句子长度、复杂度及语法错误的相关性》一文中研究指出本文以北京语言大学"HSK动态作文语料库"中抽取的90篇作文为研究样本,借鉴T单位测量法,尝试从句子长度、复杂度及语法错误这叁个方面考察影响汉语学习者作文成绩的因素。研究表明,作文成绩与以上叁者均相关。通过使用SPSS统计软件计算出作文成绩与叁者的皮尔逊积差相关系数,对其进行比较后,相关性由高到低为:复杂度>句子长度>语法错误。文章最后,根据研究结论对写作课程的安排提出了分"两步走"的教学建议。(本文来源于《汉语应用语言学研究》期刊2015年00期)

李建平,张晓菡[7](2015)在《中美中学生英语写作句子长度对比分析——一项基于高考英语作文的研究》一文中研究指出句子的长度反映学习者自由运用语法知识的能力,而平均句长作为一种评测语言发展的非标准化工具,在儿童母语习得研究、智障儿童语言习得研究、第二语言习得研究中均有重要应用。基于中美两国中学生英语写作语料库和语料库相关工具的对比研究发现,中国中学生写作的平均句长低于美国中学生写作的平均句长,且不同长度句子在分布上存在很大差异,其原因主要在于中国中学生写作中使用的复杂结构较少、功能词的使用能力较差以及缺乏语体意识。基于此,中学英语教师应加强对学生句法能力的培养、重视功能词的教学,同时注重培养中学生的语体意识。(本文来源于《教育测量与评价(理论版)》期刊2015年07期)

唐瑜婷,陈宝国[8](2014)在《工作记忆、语境限制强度和句子长度对二语词汇学习的影响》一文中研究指出本研究选取初二、高二、大叁叁个年龄阶段的被试,考察在句子阅读过程中,工作记忆容量、语境限制强度和句子长度对第二语言词汇学习的影响。研究结果发现,在句子阅读条件下,工作记忆容量是影响第二语言词汇学习的重要因素,高工作记忆容量促进了第二语言词汇的学习;在中等和长句子的条件下,语境的限制性越强,词汇学习的成绩越好;相比初二年龄组被试,高二和大叁年龄组被试,在低语境限制性的条件下,阅读的句子越长,第二语言词汇学习效果越差。研究结果说明,个体工作记忆的容量,以及阅读材料等变量都是影响自然阅读条件下第二语言词汇学习的重要因素。(本文来源于《心理科学》期刊2014年03期)

吴倩,王蓓[9](2014)在《话题转换方式和句子长度对边界声学参数的影响》一文中研究指出该文研究了不同话题转换方式和句子长度对边界处停顿、边界前延长量及音高重置的影响。语料是由两个句子构成的小语篇,通过改变第二个句子控制两种句子长度(短和长)和叁种话题转换方式(延续、精述和转折)。20位发音人的语音分析结果显示:(1)话题转换方式和句子长度对停顿及音高重置都有调节作用,但对边界前词的时长延长量没有显着影响。另外,两因素间没有交互作用。主要表现为:边界后句子越长,句间停顿越长,且边界处的音高重置越大。从话题延续、话题精述到话题转折,停顿时长呈增长趋势,且音高重置度增大;(2)停顿时长与边界前延长量存在较弱的负相关,与音高重置则存在较弱的正相关;(3)相较于男性发音人,女性发音人对话题转换方式更为敏感,且更倾向于用停顿和音高两种声学线索标记话题转换方式。句长效应则在男女发音人中都稳定存在。以上结果表明,句长对边界处声学参数的影响基于底层发音机制,而话题转换方式的影响则是语言中信息传递的需要。(本文来源于《中文信息学报》期刊2014年03期)

汪永娟,赵亚茹,谭迎花,姜淑萍,潘虹地[10](2012)在《沈阳市部分城区16~30月幼儿普通话最长语句的平均句子长度调查》一文中研究指出【目的】了解16~30月幼儿普通话最长语句的平均句子长度随年龄增长的变化规律。【方法】采用现况定量研究方法。随机抽取沈阳市2个城区194名16~30月幼儿,家长完整填写《汉语沟通发展量表使用手册》中的幼儿量表,以词为单位计算每名幼儿最长3句话的平均句子长度(MLU3),观察MLU3随年龄增长的变化情况。【结果】184名幼儿进入研究。MLU3值随年龄增长而逐渐增加,直线回归分析示MLU3与月龄呈正相关(r=0.742);23月组MLU3值较22月明显增加,差异有统计学意义(P<0.01),余相邻各组间MLU3值差异无统计学意义。【结论】16~30月幼儿普通话最长语句的平均句子长度随着月龄的增长而不断发展,22~23月是最长语句平均句子长度发展最迅速的时期。(本文来源于《中国儿童保健杂志》期刊2012年07期)

句子长度论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

《左传》中的"城濮"、"城隶"等并非固有的地名,它们在意思上等同于今天的"某城"。今天的偏正式结构,一般都是"偏+正"的形式,而在《左传》中,这些地名却是"正+偏"的组合,古今这种对比的差异折射出了汉民族对细节意义逐渐重视的历史;《左传》中的句子大多很短,而今天的句子则比先秦古代汉语要复杂得多,这也是人们逐渐看重细节意义的理据,同时,从中也可以找到认知上的解释。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

句子长度论文参考文献

[1].塞麦提·麦麦提敏,吐尔根·伊布拉音.汉维句子对齐长度计算单位的研究[J].现代计算机(专业版).2018

[2].李青苗.从《左传》的偏正结构和句子长度看现代汉语细节意义的增强[J].东北师大学报(哲学社会科学版).2018

[3].邱小燕.句子长度的分布规律及其制约因素[D].安徽大学.2017

[4].刘海燕,尹晓虎.多斯·帕索斯经典小说句子长度的多重分形分析[J].科技经济导刊.2016

[5].才藏太,索南才让.基于锚点信息和句子长度相结合的汉藏句子对齐方法研究[J].青海师范大学民族师范学院学报.2016

[6].王艺璇.HSK作文成绩与句子长度、复杂度及语法错误的相关性[J].汉语应用语言学研究.2015

[7].李建平,张晓菡.中美中学生英语写作句子长度对比分析——一项基于高考英语作文的研究[J].教育测量与评价(理论版).2015

[8].唐瑜婷,陈宝国.工作记忆、语境限制强度和句子长度对二语词汇学习的影响[J].心理科学.2014

[9].吴倩,王蓓.话题转换方式和句子长度对边界声学参数的影响[J].中文信息学报.2014

[10].汪永娟,赵亚茹,谭迎花,姜淑萍,潘虹地.沈阳市部分城区16~30月幼儿普通话最长语句的平均句子长度调查[J].中国儿童保健杂志.2012

标签:;  ;  ;  ;  

句子长度论文-塞麦提·麦麦提敏,吐尔根·伊布拉音
下载Doc文档

猜你喜欢