自动术语翻译论文-黄政豪

自动术语翻译论文-黄政豪

导读:本文包含了自动术语翻译论文开题报告文献综述及选题提纲参考文献,主要关键词:术语自动识别,术语结构特征,互信息,翻译辅助系统

自动术语翻译论文文献综述

黄政豪[1](2017)在《基于术语自动抽取的科技文献翻译辅助系统的设计与实现》一文中研究指出科技文献是科研工作者了解和研究最新科技动态和新技术的重要信息来源,因此多语种科技文献的共享平台对于不同国家科研工作者之间相互了解科研工作进展和共同促进科技创新方面有着重要的意义。科技文献翻译的主要难点之一就是不同领域科技文献中专业术语的翻译,准确定位并按统一规则翻译专业术语是科技文献翻译工作的重要步骤和内容。为此,本学位论文针对中韩科技信息综合平台设计了翻译辅助系统。该系统在新录入科技文献中自动获取新术语且进行标记,并通过辅助译文生成系统快速地生成翻译工作者所选术语的译文、相似译文和翻译历史纪录,从而让非专业领域翻译工作者也能够高效地完成科技文献的翻译工作。首先,设计并实现了结构特征与互信息相结合的术语自动抽取算法。该算法将已有科技文献中的关键词作为领域术语进行分词并分析获得相关领域术语的组词特征(词项数量和词性组合)。利用这些组词特征构建筛选模板和停用词模板,并对新输入的科技文献进行筛选以获取候选术语,再使用互信息评估组成候选术语的相邻词项间的组词稳固程度,最终根据所设定的阈值确定候选术语是否应处理为专业术语。其次,将已有术语、抽取到的新术语、术语译文和历史翻译记录等信息存储到系统数据库中形成术语数据库。术语数据库包含所有术语的相关信息,翻译工作者可通过翻译辅助系统和术语搜索功能快速地获取到所选术语的所有相关信息。最后,设计并实现了翻译辅助系统。该系统包含针对翻译工作者的用户接口,翻译工作者可通过该接口获取已有术语的译文信息、新术语的相似译文信息和译文记忆库为基础的历史翻译数据。该系统根据相似度算法将翻译工作者获取到的辅助译文信息进行排序,能够让翻译工作者快速地找到匹配的翻译结果,从而提高翻译工作效率。测试结果表明,本论文设计的术语自动抽取功能和辅助译文生成功能达到了预定的设计目标,术语自动抽取算法召回率达到61.8%,结合优化方法进行优化后达到66.9%,提高了 5.1%;辅助译文生成平均响应时间为0.031秒,MRR为0.951,测试结果满足用户需求。(本文来源于《延边大学》期刊2017-05-20)

李楠[2](2015)在《基于多策略融合的英汉术语自动翻译技术研究》一文中研究指出专利文献的翻译对于科技信息的传播与交流有着重要的作用。术语作为专利文献的重要组成部分,其翻译效果在很大程度上影响专利文献的译文质量。目前机器翻译方法已经发展成熟,各种翻译系统相继出现,翻译人员在对专利文献中的术语进行翻译时,往往会借助于这些翻译系统帮助其对术语进行翻译,同时翻译人员在对专利文献翻译的过程中,通过历史积累会产生大量的术语翻译实例存储于术语实例库中,可以利用其对翻译系统的术语译文结果进行优化处理,从而给翻译人员提供更好的参考,辅助其对术语进行翻译。本文提出了一种基于多策略融合的英汉术语自动翻译方法,主要工作包括以下两个方面:第一、通过深入分析术语的特点,引入了能充分刻画术语译文流利度、紧密度、和忠实度的叁类特征,即术语构词特征、术语互信息特征和术语实例库特征,将其与一些基础特征进行组合,采用机器学习方法中回归算法来预测多个翻译系统的术语译文质量,从中选出最优译文。第二、利用术语实例库对从译文质量估计方法中获得的评价分数较低的术语译文进行优化处理。通过字符串相似度算法在术语实例库里找到与待优化术语译文源语言相似度较高的多个术语翻译实例,根据翻译实例的目标语言和待优化术语译文搭建出来一个翻译网格,结合翻译模型和语言模型特征,使用Viterbi解码算法在网格中找到一条最优路径,从而生成一个新的优化术语译文。结合以上两方面工作,本文构建了基于多策略融合的英汉术语自动翻译系统,实验结果表明在术语译文质量估计和术语译文优化实验中本文的方法具有很好的效果,可以辅助翻译人员对专利文献中的术语进行翻译。(本文来源于《沈阳航空航天大学》期刊2015-03-02)

姜东洋[3](2014)在《基于匹配模板的术语自动翻译方法》一文中研究指出本文针对于专利术语的特点,建立了一个基于属于模板的术语自动翻译系统。系统中结合了翻译模型和相似度打分机制,实验结果表明该方法能够解决术语翻译中的固定术语翻译问题和基于中心词序调整问题,提高了统计机器防疫的质量。同时术语模板中引用了单一的统计翻译中增加了语言学知识,为翻译提供了一个有效手段。(本文来源于《网络安全技术与应用》期刊2014年02期)

马丽丽[4](2009)在《英汉机器翻译系统中术语自动翻译技术的研究》一文中研究指出随着科技的不断发展,专利文献的翻译越来越被人们所关注。专利中包含大量的专业术语,术语的翻译效果在很大程度上影响专利文献的译文质量,而且术语集中承载了特定领域的核心知识,因此随着信息全球化以及机器翻译技术的发展,术语自动翻译技术的研究已经成为专利文献翻译的热点问题。本文在对国内外相关技术调研的基础之上,实现了英汉专利文献翻译中术语自动翻译系统。通过对双语语料中大量名词性术语进行分析,系统的实现过程中首先对源语言术语进行调序,通过统计翻译工具摩西(Moses)获得n-best候选译文,然后对N个候选结果进行重新打分,选取最佳译文。主要工作包括以下两个方面:第一、针对英语和汉语术语在语言学上的特点不同,提出了基于中心词约束的术语自动翻译方法。英汉术语中词语的顺序有所不同,为在进行译文选词时提供正确的上下文信息,本文在术语翻译之前先对其进行调序处理。根据术语中心词的特点,建立NP调序模式库对源语言进行调序。对于NP调序模式不能调序的术语,本文采用统一方式对其进行调序。第二、对于摩西得到的多个候选译文,通过分析发现,候选译文中最好结果并非一定是摩西打分最高的结果,因此本文通过加入互信息特征对n-best候选译文进行重新打分,即通过计算每个结果中各词与中心词的关联程度,并结合候选结果的语言模型及摩西的参考打分进行重新排序,选择最佳译文。结合以上两方面工作,本文构建了术语自动翻译系统。实验结果表明,本文的方法对于专利文献中术语的自动翻译具有很好的效果,其翻译结果优于目前统计机器翻译中对术语翻译的结果。(本文来源于《沈阳航空工业学院》期刊2009-12-15)

王金玲[5](2009)在《日汉机器翻译系统中术语自动翻译技术的研究》一文中研究指出术语作为人类智慧的结晶,集中承载着特定领域的核心知识。随着信息时代的发展,术语学的各项研究,越来越成为人们关注的焦点。术语翻译作为术语学的研究热点之一,广泛应用于机器翻译、跨语言信息检索和双语词典编撰等领域。本文主要分析了日汉术语的特点,并对术语所在专利文献的国际专利分类号(IPC号)、日汉术语包含的汉字信息,以及术语中词之间的搭配信息等进行了详细研究,然后将上述信息作为特征与语言模型、翻译概率等特征融合,利用摩西解码器实现了基于多特征融合的日汉术语自动翻译系统。本文主要工作如下:第一,将术语IPC分类信息作为术语的领域信息特征加入到翻译模型中。术语的领域信息对术语的翻译具有重要的作用,因此本文对术语及其组成所在专利文献的IPC号和词频进行了统计,将该信息作为特征之一,参与翻译代价计算;第二,将日汉字形相似信息作为特征融入翻译模型中。本文主要提取了日语和汉语中含有的共同汉字信息,将其作为特征,辅助术语翻译中的译文选词,参与状态转移的代价计算;第叁,将具有词搭配信息的相对条件熵信息作为特征,参与翻译模型计算。该特征主要与语言模型共同作用,加大区分翻译候选的优劣。实验结果证明,本文基于多特征融合的术语翻译方法具有一定的有效性,在实验中取得了很好的效果。另外,本文对基于柱搜索的翻译流程进行了深入研究,包括翻译候选短语表的生成、启发函数计算、搜索和剪枝策略、译文生成等算法等。最后,本文对术语自动翻译中各个特征对术语翻译的影响进行了总结,并对术语翻译的下一步研究做了展望。(本文来源于《沈阳航空工业学院》期刊2009-11-23)

林晓庆[6](2009)在《基于NP树的英文专利文献术语自动翻译技术研究》一文中研究指出随着对外交流,引进先进技术的增加,人们接触专利文献的机会越来越多。从事科技翻译的人员经常要遇到专利文献的翻译问题。而术语翻译尤其是专利文献翻译的一个重要部分。近年来机器翻译技术取得了很大的突破,使得翻译质量有了很大的提高,为专利文献翻译提供了有力的手段。本文针对专利文献中的术语NP(noun phrase)的特点,使用统计和规则相结合的方法实现了术语NP的自动翻译。从建立NP树库,译文选择模型的建立,NP翻译模式的归纳,到基于知网的最相似NP树的查找以及翻译结果的自动评测,实现了一个完整的术语翻译流程。主要工作包括以下几个方面:第一,提出了一种改进互信息的译文选择方法。本文认为词语的译文的选择不是孤立进行的,上下文对译文的选择有着重要的意义,通过对已有的互信息公式加入翻译模型特征进行改进,结合翻译模型与互信息来选择最佳译文。第二,采用了NP翻译模式进行译文的调序处理。根据术语NP的特点,对句法分析后的NP进行翻译模式的总结,概括出比较常用的NP翻译模式,作为复杂NP进行译文调序的依据。第叁,提出了一种基于HowNet的最相似NP树的查找方法。本文将已有的基于HowNet的词语相似度公式进行扩展,提出基于HowNet的NP语义相似度计算方法来进行最相似NP树的查找。第四,建立一个完整的术语翻译系统。使用机器翻译自动评测技术进行翻译结果的自动评测,与基于短语的统计机器翻译系统(Pharaoh)进行对比实验。实验结果表明本文基于NP树的术语翻译方法优于基于统计的机器翻译方法(Pharaoh)。对于下一步的工作,尝试加入更多NP翻译模式和语言学知识来改善翻译效果。(本文来源于《沈阳航空工业学院》期刊2009-02-20)

周锦姝[7](2007)在《基于Web和信息抽取技术的自动术语翻译》一文中研究指出互联网上存在大量的多语语料资源。如何通过Web挖掘和信息抽取的相关技术,从非平行可比较或部分平行语料中抽取出术语的正确翻译,是当前研究者广为关注同时又极具挑战性的问题。本文首先对目前的术语翻译技术进行了比较分析,总结了其各自的优缺点。然后针对中英术语翻译,分析了Web上部分平行语料的存在性和可用性,并实现了一个自动术语翻译系统。该系统利用一对源术语E及其正确翻译F作为输入,基于搜索引擎的查询结果来获取匹配模式,并以模式出现频率作为其评分。在候选答案的选择方面,确定了叁条层次规则,依据这叁条规则,建立候选答案的评分函数。实验结果表明,相对于已有的系统,本文系统可以有效地从Web上自动挖掘出术语的合理翻译。在Web上还蕴含着大量包含术语的页面,如何自动发现此类页面并将其中的术语对抽取出来也是一个很有意义的研究课题。本文利用已有术语对(术语表或词典中的术语)作为“种子”词语,并以查询条件的形式提交给搜索引擎,而后采用简单的判断原则,对返回结果的Snippets进行分析,自动发现包含大量术语的网页。接着,利用正则表达式,将这些网页中的术语以规定的格式抽取出来,并添加到本地词库中,从而实现了本地词库的不断扩充。最后本文给出了基于Web的自动术语翻译的一些建议,对今后的研究工作进行了展望,提出了若干值得研究的问题。(本文来源于《天津大学》期刊2007-08-01)

王有志,赵敏,陈峻峰[8](2004)在《英汉科技自动翻译中术语定名决策12则》一文中研究指出自动翻译远未达到实用的地步,目前可行的是人助机译或机助人译。这就需要相应的定名规则。根据参与翻译评审英汉信息技术标准及辞书的体验,本文总结提出在翻译规范与术语定名时应注意的12条规则——基于规范,直译首选,名实照应,力避既占,类数一致,弃繁就简,体察词外,勿宽勿严,全面寻词,求助经典,并列术语同构,统一各术语元。每一原则都举出两例,加以剖析评点。这些规则有望适用于英汉人助机译或机助人译科技文献的定名与选词决策。(本文来源于《中文信息处理技术研讨会论文集》期刊2004-06-30)

自动术语翻译论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

专利文献的翻译对于科技信息的传播与交流有着重要的作用。术语作为专利文献的重要组成部分,其翻译效果在很大程度上影响专利文献的译文质量。目前机器翻译方法已经发展成熟,各种翻译系统相继出现,翻译人员在对专利文献中的术语进行翻译时,往往会借助于这些翻译系统帮助其对术语进行翻译,同时翻译人员在对专利文献翻译的过程中,通过历史积累会产生大量的术语翻译实例存储于术语实例库中,可以利用其对翻译系统的术语译文结果进行优化处理,从而给翻译人员提供更好的参考,辅助其对术语进行翻译。本文提出了一种基于多策略融合的英汉术语自动翻译方法,主要工作包括以下两个方面:第一、通过深入分析术语的特点,引入了能充分刻画术语译文流利度、紧密度、和忠实度的叁类特征,即术语构词特征、术语互信息特征和术语实例库特征,将其与一些基础特征进行组合,采用机器学习方法中回归算法来预测多个翻译系统的术语译文质量,从中选出最优译文。第二、利用术语实例库对从译文质量估计方法中获得的评价分数较低的术语译文进行优化处理。通过字符串相似度算法在术语实例库里找到与待优化术语译文源语言相似度较高的多个术语翻译实例,根据翻译实例的目标语言和待优化术语译文搭建出来一个翻译网格,结合翻译模型和语言模型特征,使用Viterbi解码算法在网格中找到一条最优路径,从而生成一个新的优化术语译文。结合以上两方面工作,本文构建了基于多策略融合的英汉术语自动翻译系统,实验结果表明在术语译文质量估计和术语译文优化实验中本文的方法具有很好的效果,可以辅助翻译人员对专利文献中的术语进行翻译。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

自动术语翻译论文参考文献

[1].黄政豪.基于术语自动抽取的科技文献翻译辅助系统的设计与实现[D].延边大学.2017

[2].李楠.基于多策略融合的英汉术语自动翻译技术研究[D].沈阳航空航天大学.2015

[3].姜东洋.基于匹配模板的术语自动翻译方法[J].网络安全技术与应用.2014

[4].马丽丽.英汉机器翻译系统中术语自动翻译技术的研究[D].沈阳航空工业学院.2009

[5].王金玲.日汉机器翻译系统中术语自动翻译技术的研究[D].沈阳航空工业学院.2009

[6].林晓庆.基于NP树的英文专利文献术语自动翻译技术研究[D].沈阳航空工业学院.2009

[7].周锦姝.基于Web和信息抽取技术的自动术语翻译[D].天津大学.2007

[8].王有志,赵敏,陈峻峰.英汉科技自动翻译中术语定名决策12则[C].中文信息处理技术研讨会论文集.2004

标签:;  ;  ;  ;  

自动术语翻译论文-黄政豪
下载Doc文档

猜你喜欢