汉语文语转换系统论文_王展

导读:本文包含了汉语文语转换系统论文开题报告文献综述、选题提纲参考文献及外文文献翻译，主要关键词:分词,韵律,泰语,语音合成,汉语,模型,文本。

汉语文语转换系统论文文献综述

王展^[1]（2017）在《傣语文语转换系统开发》一文中研究指出随着移动互联网、云计算和大数据的发展,越来越多的科技产品都带有人工智能的特性,语音合成作为人机交互中的一个重要环节,也获得了迅猛发展的机会。语音合成的过程就是计算机将信息从文本形式转换为语音形式的过程。这其中包含了从输入文本到语音信号的各种计算。要满足这些计算需求,文语转换系统必须具备抽象语言学分析、语音编码等众多复杂功能。到现在为止,语音合成主要针对中文、英语等常用的语言,而在民族语言领域的研究相对缺乏。本文以西双版纳傣语作为研究语言,研究傣语的文本分析和语音合成方法,设计并实现了傣语文语转换系统。论文的主要工作包括:1.研究了西双版纳傣语的文本分析与处理方法,并从开发的角度实现了傣语文语转换系统中的前端文本分析与处理功能。文本分析与处理主要包括文本归一化、分词和文本罗马化。2.构建可训练的傣语声学模型训练系统。介绍了基于隐马尔可夫模型的语音合成的基本原理,在此基础上研究了傣语的声学模型训练方法。着重介绍了在模型训练过程中声学参数的提取及校对。最后在Cygwin平台上,利用HTS-2.0完成整个声学模型的训练,并基于STRAIGHT合成器进行傣语语音合成的实验。3.实现傣语文语转换系统。根据前期的研究结果,利用Spring Web MVC框架,开发了一个可以实现集内文语转换的Web应用。在这个过程中,需要把前端文本分析与处理的功能和语音合成的功能都集成进去。本文最后的实验结果表明,文本分析与处理模块基本满足傣语文语转换系统中对文本归一化和罗马化的要求;训练出来的声学模型也可以合成出准确度很好、自然度有待提高的傣语语音。(本文来源于《云南大学》期刊2017-03-01）

王昱,杨鉴,陈志琼,伍烛梅^[2]（2016）在《傣语文语转换系统中的汉语借词发音规则及其合成方法》一文中研究指出傣语属于汉藏语系壮傣语支。随着傣、汉文化交流日益加深,在汉语的影响下,大量的汉语词汇被借入到傣语中,形成了发音具有特殊性的汉语借词。本文以开发西双版纳傣语文语转换(TTS)系统为目的,从音位学、说话人的教育背景等方面分析、归纳汉语借词的使用现状和发音规律。提出了傣语TTS系统中的汉语借词发音规则和罗马化方法,进一步改进了HMM模型训练过程中涉及汉语借词的上下文属性和问题集设计方法。最后,基于HTS平台,通过合成含有汉语借词的傣语语句,验证方法的有效性。实验结果表明,合成语音中的汉语借词具有较好的可懂度,并符合西双版纳傣语的实际发音习惯。(本文来源于《第35届中国控制会议论文集（C）》期刊2016-07-27）

王雨蒙^[3]（2016）在《英语文语转换系统中的ToBl韵律自动标注方法与实现》一文中研究指出随着互联网浪潮的汹涌之势扑面而来,语音合成技术也趁着站在风口的机会实现了快速的成长。作为人工智能的一部分,语音合成技术的未来方向必然是让机器语音合成效果达到人类的说话水平。那么作为语音合成中关键的一项技术,即韵律的表达效果也会越来越被重视。论文将就ToBI韵律自动标注展开讨论和研究,并展示加载了自动标注后的英文TTS效果。论文的具体工作如下：首先,论文将对语音合成技术的背景以及历史发展进行阐述,然后分别介绍各种语音合成方法,其中包括目前最主流的两种合成方式,即基于HMM模型的参数合成以及基于大语料库的拼接合成。论文在第二章对于韵律标注的体系ToBI进行详细介绍。因为之后的预测正确率和合成效果均是建立在对ToBI韵律标注体系进行预测的基础上的。其次,论文会着重描述C4.5预测树算法、最大熵算法和条件随机场算法,并在具体的实现过程中,介绍这几种模型训练和测试方法。通过对不同韵律模型的分析对比,我们可以用不同的模型来对韵律进行自动标注,并加载进入英文的TTS。最后,论文将分别测试出几个不同模型的预测效果,通过不同的测试方式我们可以得到一个直接的数据结果。结果显示,论文所使用的C4.5决策树和CRF模型能够有效对ToBI韵律体系进行预测标注。当加入韵律预测模型后,我们对英文TTS系统合成的声音做了一个主观MOS测听实验,相比于之前的MOS得分,新的句子提升0.31,在韵律上有一个明显的提升。这进一步地论证论文中采取的实验思路和方法具备一定的可靠性。此外,论文对实验结果进行总结,提出在ToBI自动标注上仍待优化的几个部分,并对语音合成在ToBI韵律预测上的一些展望和建议。(本文来源于《云南大学》期刊2016-05-01）

李诗心,杨鉴,陈志琼,辛振球^[4]（2015）在《基于HMM的傣语文语转换系统》一文中研究指出本文介绍基于HMM的可训练傣语文语转换系统的构建方法,重点讨论发音语料的挑选、分词、以及用于声学模型训练的上下文属性集的设计方案。针对傣语的特点,设计并实现了以音节覆盖率最大化为主要准则的Greedy算法,其全音节覆盖率为94.2%。采用基于词表的FMM算法实现了傣语的自动分词,进一步考虑到交集型歧义词的消歧,改进了傣语自动分词的算法,其分词正确率由92.3%提升为93.8%,召回率由89.2%下降为90.6%,基于HTS平台并根据傣语的韵律层级结构,设计了上下文属性集。在上述工作的基础上,构建完成了可训练的傣语文语转换系统。(本文来源于《第叁十四届中国控制会议论文集（C卷）》期刊2015-07-28）

庞哨苎,刘院波,巴桑卓玛,群诺^[5]（2014）在《藏语文语转换系统关键技术的研究》一文中研究指出藏语文语转换系统主要由叁个部分组成:文本顿处理模块、劫律生成模块和语音合成模块。文章围绕以上叁方面分别研究了藏语文语转换中文本预处理的藏文分词技术、韵律标注规则和韵律标注内容,并实现了韵律标注时所需藏文拉丁转写算法和语音处理后端合成的一些方案设想。(本文来源于《西藏科技》期刊2014年12期）

林雪娥^[6]（2014）在《泰语文语转换系统中的文本分析和处理》一文中研究指出语音合成是用计算机将输入文本转换为人能听懂的语音信号的过程。语音合成和语音识别是实现人机语音通信的必要支撑技术。文语转换系统是现阶段实现语音合成的有效方式,合成语音的自然度已成为影响该技术推广应用的关键。文语转换系统,分为前端文本分析模块和后端语音合成模块,文本分析与处理的效果将直接决定合成语音的自然度。本文以开发泰语文语转换系统为目的,研究并实现泰语文本分词、归一化以及罗马化。论文的主要工作包括：1.针对泰语特点,构建泰语字符连缀集,并将其应用于前后向最大匹配分词算法中。实验结果表明,含未登录词语料的分词正确率,可由85.69%提升到94.04%。2.提出基于规则和关键词相结合的方法,实现泰语文本归一化。在特殊字符处理模块中,先对泰语文本中出现的数字、物理单位、货币符号、缩略语等的特殊字符进行分类。归纳易产生歧义的字符类型,构建关键词词典。在此基础上,编写C语言程序进行特殊字符的处理,成功将其转化为标准的泰语文本。实验结果表明：集内测试正确率为97.83%,集外测试的正确率为97.12%,且大部分非标准词的消歧正确率达到95%以上。3.根据泰语音节结构的特点,归纳、整理元音和辅音以及韵母中的元音和尾辅音的搭配规则,在此基础上,以音节为基本单元,用Perl脚本语言编写程序实现泰语文本的罗马化。测试结果表明,罗马化结果可满足后端语音合成的要求,并从中可体现分词、文本归一化的结果。(本文来源于《云南大学》期刊2014-05-01）

胡恩星^[7]（2013）在《越南语文语转换系统中的前端文本分析方法》一文中研究指出越南语是越南的官方语言,属南亚语系孟一高棉语族。越南语类似于汉语普通话,也采用“声、韵、调”标记其音节。文本以开发越南语文语转换(TTS)应用系统为目的,研究越南语文本分析方法,探索提高合成语音自然度的途径。一个完整的TTS系统包括前端文本分析模块和后端语音合成模块。前端文本分析对提高合成语音的自然度、可懂度起至关重要的作用。文本分析涉及文本归一化、分词、词性标注和韵律短语(L3)边界预测等技术。论文的主要工作包括：1.采用规则加关键字的方法实现越南语文本归一化。经测试,文本归一化的准确率达97.2%。2.采用前后向最大匹配结合词频统计的方法实现越南语分词。经测试,分词的准确率、召回率和F-1值分别为：97.24%、91.35%和94.20%。3.采用N-gram语言模型建模,Viterbi解码的方法进行越南语词性标注。集内外测试准确率分别为82.42%和71.28%。4.采用C4.5算法建立越南语韵律短语边界决策树模型,利用剪枝后的决策树进行L3边界预测。集内外测试的F-1值分别为60.73%和57.96%。以上文本分析的测试结果说明,本文所讨论的方法可以满足越南语语音合成系统的初步应用需求,并为进一步提高越南语TTS系统的性能奠定了基础。(本文来源于《云南大学》期刊2013-05-01）

刘怀璟^[8]（2013）在《泰语文语转换系统中的文本分析方法研究》一文中研究指出泰国位于中国南部,处于东南亚的中心,是我国的友好邻邦,泰国与中国贸易往来频繁,和我国在经济、政治领域有重要合作关系。泰语是泰国的官方语言,目前有6000多万人口使用泰语,泰语是一种分析型、孤立型语言,它多由单音节词构成基本词汇。同时,泰语也是一门声调语言,声调可以用来区分不同的词汇和语法。东南亚市场蕴含着巨大的潜力,东南亚语言将会成为语音合成领域的研究重点。论文的主要工作包括：].从专业泰语在线词典下载词条包,挑选出包括常用词、复合词、地名、数量词、借词等词条,并通过在线词典人工查询并添加标准音标和词性信息,构建泰语词典。2.从泰语专业书籍以及网站中挑选常用语句,并对语料进行进一步筛选,去除长度、格式不合适的语句,最后留下作为前端文本分析的语料。3.在构建好泰语词典的基础上,进行泰语TTS系统前端文本分析,针对泰语语言特征,设计基于泰语词典的前向后向最大匹配算法进行分词,再将分词结果利用词典替换成对应泰语音节信息。4.针对基于泰语词典前向后向最大匹配算法未匹配到的词语(即未知词),设计基于泰语音节拼写规则的处理方法进行处理。5.设计一个改进的泰语罗马化编码方案,在上述过程完成的基础上,用该编码方案对泰语文本进行编码,再与标准泰语读音进行比较。本论文通过前向后向匹配算法对泰语文本进行基于泰语词典的分词,已经能够将词典内包含的词语正确切分出来,对未知词进行处理后,将文本尽量表现成音节组合形式,经实验研究,初步分词正确率达到78%；语音合成系统需要将文本罗马化以提取音节音调信息,因此还需要将泰语进行罗马化,经过改进的泰语罗马化编码方案能够更准确的表达出泰语音节以及音调信息。(本文来源于《云南大学》期刊2013-05-01）

雷冠军^[9]（2010）在《基于HMM的混合激励英语文语转换系统》一文中研究指出采用传统激励模型的基于HMM的文语转换系统的合成语音自然度不高,主要原因是其采用的激励模型用脉冲串作为浊音段激励和白噪声作为清音段激励过于粗糙,不能很好地模拟自然语音的激励。借鉴MELP语音编码算法,把混合激励模型应用到系统中,对合成语音激励信号进行改进。试验结果表明,混合激励模型大大提高了系统的自然度。(本文来源于《江南大学学报(自然科学版)》期刊2010年06期）

王亮^[10]（2010）在《汉语文语转换系统中韵律调节算法的研究与实现》一文中研究指出文语转换技术是一种应用广泛的语音技术。目前,以波形合成为基础的文语转换技术已经可以合成清晰度、可懂度较好的语音,然而在合成语音的自然度方面仍需进一步提高。韵律调节是改善合成语音自然度最有效的手段之一。本文的主要工作是围绕汉语文语转换系统的韵律调节技术进行的。本文对相关的算法进行研究,并开发一种汉语普通话文语转换系统。本文首先对韵律理论和汉语的语音特点进行了分析,并对文语转换系统现有的技术路线进行了讨论,并在此基础上提出了一种基于韵律规则的波形合成法。接下来,本文对PSOLA、Fujisaki基频曲线预测算法、音节与停顿时长预测算法等韵律调节的关键算法进行了深入的研究,并在对Fujisaki模型进行部分修改的基础上,提出了一种充分考虑语音库中语音基频特性的语调曲线预测算法,这种方法能够比较准确的模拟句子的语调曲线趋势,同时对合成基元频率特性的修改较小。然后,本文从系统构成的角度介绍了系统中各个模块的功能和设计方案;同时,本文介绍了构建语音库的方法,为了提高合成语音的自然度,本文同时构建了音节语音库和汉语中高频词语音库。最后,本文从程序实现的角度介绍了代码中主要函数的功能和输入输出,并对程序设计时需要考虑的关键问题进行了分析。另外,本文还运用平均意见分的方法对开发的汉语文语转换系统的性能进行了评估,测试结果表明系统合成的语音具有比较好的自然度。(本文来源于《上海交通大学》期刊2010-01-01）

汉语文语转换系统论文开题报告

（1）论文研究背景及目的

此处内容要求：

首先简单简介论文所研究问题的基本概念和背景，再而简单明了地指出论文所要研究解决的具体问题，并提出你的论文准备的观点或解决方法。

写法范例：

傣语属于汉藏语系壮傣语支。随着傣、汉文化交流日益加深,在汉语的影响下,大量的汉语词汇被借入到傣语中,形成了发音具有特殊性的汉语借词。本文以开发西双版纳傣语文语转换(TTS)系统为目的,从音位学、说话人的教育背景等方面分析、归纳汉语借词的使用现状和发音规律。提出了傣语TTS系统中的汉语借词发音规则和罗马化方法,进一步改进了HMM模型训练过程中涉及汉语借词的上下文属性和问题集设计方法。最后,基于HTS平台,通过合成含有汉语借词的傣语语句,验证方法的有效性。实验结果表明,合成语音中的汉语借词具有较好的可懂度,并符合西双版纳傣语的实际发音习惯。

（2）本文研究方法

调查法：该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法：用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法：通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法：通过调查文献来获得资料，从而全面的、正确的了解掌握研究方法。

实证研究法：依据现有的科学理论和实践的需要提出设计。

定性分析法：对研究对象进行“质”的方面的研究，这个方法需要计算的数据较少。

定量分析法：通过具体的数字，使人们对研究对象的认识进一步精确化。

跨学科研究法：运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法：这是社会科学用来分析社会现象的一种方法，从某一功能出发研究多个方面的影响。

模拟法：通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

汉语文语转换系统论文参考文献

[1].王展.傣语文语转换系统开发[D].云南大学.2017

[2].王昱,杨鉴,陈志琼,伍烛梅.傣语文语转换系统中的汉语借词发音规则及其合成方法[C].第35届中国控制会议论文集（C）.2016

[3].王雨蒙.英语文语转换系统中的ToBl韵律自动标注方法与实现[D].云南大学.2016

[4].李诗心,杨鉴,陈志琼,辛振球.基于HMM的傣语文语转换系统[C].第叁十四届中国控制会议论文集（C卷）.2015

[5].庞哨苎,刘院波,巴桑卓玛,群诺.藏语文语转换系统关键技术的研究[J].西藏科技.2014

[6].林雪娥.泰语文语转换系统中的文本分析和处理[D].云南大学.2014

[7].胡恩星.越南语文语转换系统中的前端文本分析方法[D].云南大学.2013

[8].刘怀璟.泰语文语转换系统中的文本分析方法研究[D].云南大学.2013

[9].雷冠军.基于HMM的混合激励英语文语转换系统[J].江南大学学报(自然科学版).2010

[10].王亮.汉语文语转换系统中韵律调节算法的研究与实现[D].上海交通大学.2010

论文知识图

标签：分词论文; 韵律论文; 泰语论文; 语音合成论文; 汉语论文; 模型论文; 文本论文;

汉语文语转换系统论文_王展

汉语文语转换系统论文文献综述

汉语文语转换系统论文开题报告

汉语文语转换系统论文参考文献

论文知识图

猜你喜欢