英语特殊句型在机器翻译软件中的对比研究

英语特殊句型在机器翻译软件中的对比研究

黎斌, 唐跃勤[1]2005年在《There be句型在机器翻译软件中的对比研究》文中研究说明机器翻译虽已取得了很大进展,但仍主要停留在查词功能上,其译文可读性不强,准确性不够。以英语特殊句型Therebe为切入点,着重探讨英汉机器翻译中特殊句型的对应与不对应的调整问题,并以五种英汉全文机器翻译软件作为测试对象,就可以分析发现机器翻译软件在Therebe句型英汉翻译过程中的两点不足:一方面,将there译成地点状语“那里”;另一方面,翻译时不能对地点状语或时间状语进行位置调整,只能机械地逐词顺译。

孙静茹, 万丽[2]2018年在《科技类英语倒装句在机器翻译软件中的对比》文中指出随着互联网的发展,机器翻译软件层出不穷。多数翻译软件停留在查词功能,译文准确性不够、可读性不强。本文以英语倒装句为切入点,通过英汉翻译对比,并以五种机器翻译软件为研究对象,着重探讨机器翻译软件在翻译英语特殊句型时能否与之对应的问题。研究结果发现大多数翻译软件能够将句子基本意思译出来,但在句法结构处理、译文表达上还需改进。

黎斌[3]2004年在《英语特殊句型在机器翻译软件中的对比研究》文中认为机器翻译是指计算机通过指令和程序将一种自然语言转换为另一种自然语言的过程。机器翻译是一个跨学科的研究领域,涉及计算机科学、语言学、人类学和心理学等多方面的知识。本文首先回顾了机器翻译在世界和中国的发展。经过几十年的努力,机器翻译已取得了令人瞩目的成绩。特别是作为人们的辅助翻译工具,机器翻译得到大多数人的认可,近年来国内外翻译软件的蓬勃发展充分证明了这一点。尤其是诸如译星、雅信2.5、IBM翻译家、东方快车XP、金山快译2003和译典通2003之类的全文翻译软件在市场上广受欢迎。 然而,目前大多数全文翻译软件的操作程度、翻译准确性、可读性等都不很理想。这些翻译软件存在的问题主要有:歧义消解不当、代词指代不明、省略补充不当以及词序(即句法结构)处理不当。本文通过英汉对比研究,主要讨论机器翻译软件在翻译英语特殊句型时,如何恰当地调整词序以符合汉语语法特点。 本文以翻译等值、转换生成语法和句法关系为理论基础,对英语中的几种特殊句型进行结构分析,通过英汉对比研究找出其异同。在不考虑个别单词词义的情况下,将There be句型、It句型和被动语态等特殊句型在上述六种全文翻译软件中进行测试。测试结果表明,在绝大多数情况下,全文翻译软件大都只是在实现查词功能后,将单个的字或词按原文顺序排列出来,即字对字的硬译,有时译文令人费解,甚至荒谬可笑。这些软件主要存在两个方面的问题:一是对虚词的处理,如There be句型中的There,It句型中的It,以及对被动结构“be+v.-ed”处理;二是译成的中文仍然按照原来的英语词序排列,没有调整为符合汉语特征的语序。 在分析以上两点不足的基础上,本文为克服全文翻译软件的这些缺陷提出了种种假设。并以Delphi 7设计了一个试验性程序。对此程序的验证说明,文中提出的假设是可行的,这给机器翻译研究者解决其它机器翻译问题提供了语言学方面的参考,尤其是对机器翻译软件的发展提供了一定的帮助。

丹娜[4]2014年在《论俄汉机器翻译中存在的问题及其解决方案》文中认为二十世纪被人们称为“翻译时代”,其中一个重要的原因就是机器翻译的问世。它几乎与计算机的发明同时出现,其发展为人工翻译减轻了压力,缓解了大量的翻译需求与翻译人才短缺之间的矛盾,降低了翻译成本,提高了翻译效率。历经半个多世纪的风风雨雨,直到今天,它仍然是许多翻译工作者和软件开发商热衷研究的对象。然而目前世界上较为成功的机器翻译系统大多都是英语与其他语言之间的,国内较为成功并已经投入商业使用的也主要是英汉翻译系统,比较成型的俄汉机器翻译系统屈指可数,且译文质量低下。本论文以国内较有代表性的叁个俄汉机器翻译系统对上百个简单句的译文为研究对象,系统总结了这些系统在进行俄汉翻译时出现的问题,分析了这些问题出现的原因,并给出了相应的解决方案,其中之一就是建立大规模的俄汉平行语料库,以作为俄汉机器翻译系统的知识储备和支撑。论文的第一部分简要介绍了机器翻译系统的类型和工作原理,机器翻译发展经过的五个阶段,其当今的发展状况和今后的发展趋势。第二部分通过设计实验,记录并分析国内叁个主要俄汉机器翻译系统对例句给出的译文,验证了俄汉机器翻译系统译文质量低下的猜想,并分析了出现这些问题的根本原因:对翻译过程的研究不够深入,对语言规则的总结不够细致,以及对俄汉平行语料库的建设不够重视。第叁部分通过实验结果的系统分析,总结了影响俄汉机器翻译系统产生正确译文的几大因素——词类标记与词性转换,义项选择,词典的完善度,句子结构与句型转换,词序的调整,以及俄汉平行语料库的建立——并根据这些问题分别提出了针对性的建议。其中,建设大规模的俄汉平行语料库不仅在提高俄汉机器翻译系统译文质量上将发挥巨大的作用,还会在汉、俄语教学以及语言学和翻译学的其他分支学科中起重大作用,应当受到足够的重视。

董姣姣[5]2013年在《基于系统功能语法的长难句英译汉机器翻译效果评价》文中进行了进一步梳理全球经济迅猛发展,传统人工翻译已不能满足的翻译市场的需求,作为新时代的产物,机器翻译因高效率低成本的优势成为当今热门课题。但是因为机器不像人类一样有认知社会的独特能力,译文质量仍未取得突破性进展。尤其是长难句处理这一问题依然是机器翻译研究领域中一个无法逾越的障碍。(许建平1998)本文主要研究英语长难句机器翻译成汉语的问题,包含两个主要的创新点。首先,作者从自身大量机器翻译实践中,将长难句句型特征与翻译结果进行归纳分析,总结得出译文元语言功能表现错误使得其质量欠佳,而英语长难句的特殊句型无法在中文中找到对应成分是导致译文元功能错误的根本原因。另一个创新点是,以韩礼德的系统功能语法中的叁个语言功能理论为视角,分类评价叁种长难句的译文元功能,统计长难句各类句型译文的元功能错误的数量,对比得出导致其机译困难的原因所在,并提出提高长难句机译质量的建议。全文拟分为六部分。第一部分为绪论,简要介绍机器翻译的发展与研究现状,以及详细介绍本研究意义与目的,研究对象,研究方法和基本思路等。第一章为文献综述,总结与评价国内外已有长难句机器翻译的研究成果。第二章介绍本课题的理论背景。包括系统功能语法及其与对翻译和机器翻译研究的影响,以及叁大元语言功能在翻译研究中的运用。第叁章对比分析翻译实践中不同类型英语长难句及其译文的特征,总结出长难句机器翻译的叁大困难。第四章以翻译实践中的长难句实例,剖析原文特征及其译文的叁大元语言功能表现,并讨论结果。最后一章为结论,提出改进长难句机器翻译质量的见解,总结该课题研究的发现与不足,及对未来研究的建议。

王洁[6]2008年在《汉语中介语偏误的计算机处理方法研究》文中提出本文的研究目标是让计算机辅助人来处理汉语中介语中的偏误。辅助的方式有四种:偏误的自动识别及提示;偏误的交互式识别及提示;偏误的自动标注;偏误标注的自动管理和检索。其中自动识别及提示的智能性最高,是本文研究的重点,其处理过程首先是自动发现偏误,在发现的基础上,计算机还可以进一步在不同程度上给出提示:直接修改、给出修改建议、指出偏误原因或提出疑问。目前,有关计算机查错的研究领域中,只有英语拼写检查技术比较成熟,汉语字词错误的校对系统刚刚达到具有实用价值的水平,其他方面的应用技术还在研究过程中,汉语中介语偏误的计算机处理还没有见到有相关研究成果发表。本文的工作集中在以下叁方面:第一,面向计算机进行了偏误分析的理论研究。分析了计算机的长处和局限性,结合HSK动态作文语料库的偏误标注体系以及《外国人学汉语语法偏误分析》中的偏误类别体系,根据计算机处理自然语言的能力及所需知识,对各类偏误自动识别及提示的可行性进行了分析,特别指出语法偏误自动识别及提示的可行性较强,提出了计算机进行偏误处理的指导思想。第二,进行了偏误自动识别及提示的实践研究。依据出错率较高、可形式化程度较高等标准,选择了“把”字句、“比”字句、“有”字句和“被”字句四种特殊句型偏误作为切入点,采用规则的方法进行了偏误自动识别及提示的实验,通过与人工标注的结果相比较,证实了计算机能够在这些特殊句型偏误的识别和提示方面发挥很好的辅助作用。第叁,进行了偏误自动标注的实践研究。利用了经典的求解字符串间编辑距离的算法,以汉语的词为单位通过进一步求解仿人的编辑路径发现修正原句所需要的基本编辑操作,从而实现了原句和修正句的自动比对。此外,基于自动比对的结果还让计算机在一定程度上参与偏误的归类。这样,能够较好地弥补偏误人工标注的缺陷,体现了人机的优势互补。与以往的一些相关研究比较起来,本文工作的创新性体现在:(1)研究侧重点在汉语的偏误分析方面,以往的研究是面向人的,目的是寻找让学生减少、避免偏误的教学策略;本文的研究是面向计算机的,目的是寻找让计算机自动或半自动地识别、修正偏误的方法。在汉语的中介语语料库建设方面,以往的工作主要是人工标注偏误;本文的研究是探讨如何让计算机尽可能地参与其中,与人形成优势互补。在中文文本查错方面,以往的研究针对的是汉语母语写作中出现的偶然性错误;本文的研究针对的是汉语非母语写作中出现的规律性偏误。在计算机辅助汉语教学方面,以往的研究热衷于计算机如何向学生单向地传授知识;而本文的研究重点是计算机如何对学生输入的信息给出反馈。(2)技术思想分析了计算机处理自然语言的能力以及处理各类偏误的能力,提出了利用计算机处理偏误时应遵循的指导思想。(3)技术方法基于HSK动态作文语料库,对“把”字句、“比”字句、“有”字句和“被”字句四种特殊句型的各种偏误做了具体分析,给出了识别及提示的规则,实验结果表明有较高的识别准确率和召回率。提出了采用编辑距离算法进行偏误自动标注的方法,实验证明能明显提高标注的质量和速度。本文的意义在于:理论方面,探讨了计算机辅助语言教学的可能性,既不能停留在简单的多媒体教学手段方面,又不能希冀计算机能全自动地处理各类偏误,而是实事求是地指出在这一领域计算机能力所及的范围。此外,面向计算机进行偏误分析为汉语语法研究、对外汉语教学研究提出了新的关注视角。应用方面,本文提出的方法可以辅助教师教学,减轻教师的负担;可以辅助科研人员进行中介语语料库的标注,提高标注的质量和速度;可以辅助有一定汉语基础的学生自学;有助于提高汉语作文评分的自动化程度。

李伟[7]2007年在《现代汉语句型自动识别的研究》文中提出每一种语言都有自身的特点,一种语言区别另一种语言,句型上的差异起着重要作用。汉语句型复杂多样,是汉语句法理论中一个重要的研究单位。但是,在中文信息处理中,以句型为目标的研究并不多。本文以汉语句型的自动识别为研究对象,强调结合自然语言处理要求和汉语语法规律,构建统一的句型系统框架,并在该框架下,尝试进行句型分析、研究句型识别策略。在汉语句型的语言理论研究中,本文结合句模理论,提出“阶”的概念,构建了将谓词的句法特性与语义特征结合的谓词知识库,为计算机识别句型提供帮助。在汉语句型识别的策略研究中,本文给出了汉语句型自动识别系统的流程框架。该框架中包含预处理模块和句型识别模块两个部分。预处理模块以去除句子的非句型成分为目的,抽象出句子的句干,填充包括定中结构、状中结构和补中结构的句法关系槽。句型识别模块以判定句干的句型类别为主要目的,并填充包含主谓关系、谓宾关系的句法关系槽。在预处理模块中,本文提出“语片”的概念,将预处理过程分为粘合语片、填充句法关系槽两个流程,并提出基于滑动窗口机制的粘合算法,以及基于上下文无关文法的填充器C-Filler。在句型识别模块中,本文提出了“基于规则匹配”和“基于函数模型”的两种可选策略。“基于规则匹配”的策略中,利用扩充的上下文无关文法,设计了句型识别器Recognizer;“基于函数模型”的策略中,本文首次提出,利用转化函数,将句子转化到坐标空间中,使用函数模型研究句子的句法特征,并通过函数计算获得句子的特征向量用于机器学习,最终利用机器学习得到的决策函数识别句型。“基于函数模型”的策略是一种“引用数学方法研究句子”的新思路。作为策略评估,在句型系统的子集上构建了实验模型,对预处理策略和两种句型识别策略分别进行了评估,实验结果证明了叁种策略的可行性。最后,论文从应用角度,在机器翻译、语法错误自动检查、统计汉语句型分布等几个方面,对汉语句型自动识别的应用前景作了简介。

参考文献:

[1]. There be句型在机器翻译软件中的对比研究[J]. 黎斌, 唐跃勤. 西南交通大学学报(社会科学版). 2005

[2]. 科技类英语倒装句在机器翻译软件中的对比[J]. 孙静茹, 万丽. 电子技术与软件工程. 2018

[3]. 英语特殊句型在机器翻译软件中的对比研究[D]. 黎斌. 西南交通大学. 2004

[4]. 论俄汉机器翻译中存在的问题及其解决方案[D]. 丹娜. 上海外国语大学. 2014

[5]. 基于系统功能语法的长难句英译汉机器翻译效果评价[D]. 董姣姣. 中南大学. 2013

[6]. 汉语中介语偏误的计算机处理方法研究[D]. 王洁. 北京语言大学. 2008

[7]. 现代汉语句型自动识别的研究[D]. 李伟. 厦门大学. 2007

标签:;  ;  ;  ;  ;  ;  

英语特殊句型在机器翻译软件中的对比研究
下载Doc文档

猜你喜欢