汉语文语转换论文_王展

导读:本文包含了汉语文语转换论文开题报告文献综述、选题提纲参考文献及外文文献翻译，主要关键词:分词,泰语,韵律,语音合成,文本,汉语,藏文。

汉语文语转换论文文献综述

王展^[1]（2017）在《傣语文语转换系统开发》一文中研究指出随着移动互联网、云计算和大数据的发展,越来越多的科技产品都带有人工智能的特性,语音合成作为人机交互中的一个重要环节,也获得了迅猛发展的机会。语音合成的过程就是计算机将信息从文本形式转换为语音形式的过程。这其中包含了从输入文本到语音信号的各种计算。要满足这些计算需求,文语转换系统必须具备抽象语言学分析、语音编码等众多复杂功能。到现在为止,语音合成主要针对中文、英语等常用的语言,而在民族语言领域的研究相对缺乏。本文以西双版纳傣语作为研究语言,研究傣语的文本分析和语音合成方法,设计并实现了傣语文语转换系统。论文的主要工作包括:1.研究了西双版纳傣语的文本分析与处理方法,并从开发的角度实现了傣语文语转换系统中的前端文本分析与处理功能。文本分析与处理主要包括文本归一化、分词和文本罗马化。2.构建可训练的傣语声学模型训练系统。介绍了基于隐马尔可夫模型的语音合成的基本原理,在此基础上研究了傣语的声学模型训练方法。着重介绍了在模型训练过程中声学参数的提取及校对。最后在Cygwin平台上,利用HTS-2.0完成整个声学模型的训练,并基于STRAIGHT合成器进行傣语语音合成的实验。3.实现傣语文语转换系统。根据前期的研究结果,利用Spring Web MVC框架,开发了一个可以实现集内文语转换的Web应用。在这个过程中,需要把前端文本分析与处理的功能和语音合成的功能都集成进去。本文最后的实验结果表明,文本分析与处理模块基本满足傣语文语转换系统中对文本归一化和罗马化的要求;训练出来的声学模型也可以合成出准确度很好、自然度有待提高的傣语语音。(本文来源于《云南大学》期刊2017-03-01）

王昱,杨鉴,陈志琼,伍烛梅^[2]（2016）在《傣语文语转换系统中的汉语借词发音规则及其合成方法》一文中研究指出傣语属于汉藏语系壮傣语支。随着傣、汉文化交流日益加深,在汉语的影响下,大量的汉语词汇被借入到傣语中,形成了发音具有特殊性的汉语借词。本文以开发西双版纳傣语文语转换(TTS)系统为目的,从音位学、说话人的教育背景等方面分析、归纳汉语借词的使用现状和发音规律。提出了傣语TTS系统中的汉语借词发音规则和罗马化方法,进一步改进了HMM模型训练过程中涉及汉语借词的上下文属性和问题集设计方法。最后,基于HTS平台,通过合成含有汉语借词的傣语语句,验证方法的有效性。实验结果表明,合成语音中的汉语借词具有较好的可懂度,并符合西双版纳傣语的实际发音习惯。(本文来源于《第35届中国控制会议论文集（C）》期刊2016-07-27）

王雨蒙^[3]（2016）在《英语文语转换系统中的ToBl韵律自动标注方法与实现》一文中研究指出随着互联网浪潮的汹涌之势扑面而来,语音合成技术也趁着站在风口的机会实现了快速的成长。作为人工智能的一部分,语音合成技术的未来方向必然是让机器语音合成效果达到人类的说话水平。那么作为语音合成中关键的一项技术,即韵律的表达效果也会越来越被重视。论文将就ToBI韵律自动标注展开讨论和研究,并展示加载了自动标注后的英文TTS效果。论文的具体工作如下：首先,论文将对语音合成技术的背景以及历史发展进行阐述,然后分别介绍各种语音合成方法,其中包括目前最主流的两种合成方式,即基于HMM模型的参数合成以及基于大语料库的拼接合成。论文在第二章对于韵律标注的体系ToBI进行详细介绍。因为之后的预测正确率和合成效果均是建立在对ToBI韵律标注体系进行预测的基础上的。其次,论文会着重描述C4.5预测树算法、最大熵算法和条件随机场算法,并在具体的实现过程中,介绍这几种模型训练和测试方法。通过对不同韵律模型的分析对比,我们可以用不同的模型来对韵律进行自动标注,并加载进入英文的TTS。最后,论文将分别测试出几个不同模型的预测效果,通过不同的测试方式我们可以得到一个直接的数据结果。结果显示,论文所使用的C4.5决策树和CRF模型能够有效对ToBI韵律体系进行预测标注。当加入韵律预测模型后,我们对英文TTS系统合成的声音做了一个主观MOS测听实验,相比于之前的MOS得分,新的句子提升0.31,在韵律上有一个明显的提升。这进一步地论证论文中采取的实验思路和方法具备一定的可靠性。此外,论文对实验结果进行总结,提出在ToBI自动标注上仍待优化的几个部分,并对语音合成在ToBI韵律预测上的一些展望和建议。(本文来源于《云南大学》期刊2016-05-01）

李诗心,杨鉴,陈志琼,辛振球^[4]（2015）在《基于HMM的傣语文语转换系统》一文中研究指出本文介绍基于HMM的可训练傣语文语转换系统的构建方法,重点讨论发音语料的挑选、分词、以及用于声学模型训练的上下文属性集的设计方案。针对傣语的特点,设计并实现了以音节覆盖率最大化为主要准则的Greedy算法,其全音节覆盖率为94.2%。采用基于词表的FMM算法实现了傣语的自动分词,进一步考虑到交集型歧义词的消歧,改进了傣语自动分词的算法,其分词正确率由92.3%提升为93.8%,召回率由89.2%下降为90.6%,基于HTS平台并根据傣语的韵律层级结构,设计了上下文属性集。在上述工作的基础上,构建完成了可训练的傣语文语转换系统。(本文来源于《第叁十四届中国控制会议论文集（C卷）》期刊2015-07-28）

庞哨苎,刘院波,巴桑卓玛,群诺^[5]（2014）在《藏语文语转换系统关键技术的研究》一文中研究指出藏语文语转换系统主要由叁个部分组成:文本顿处理模块、劫律生成模块和语音合成模块。文章围绕以上叁方面分别研究了藏语文语转换中文本预处理的藏文分词技术、韵律标注规则和韵律标注内容,并实现了韵律标注时所需藏文拉丁转写算法和语音处理后端合成的一些方案设想。(本文来源于《西藏科技》期刊2014年12期）

林雪娥^[6]（2014）在《泰语文语转换系统中的文本分析和处理》一文中研究指出语音合成是用计算机将输入文本转换为人能听懂的语音信号的过程。语音合成和语音识别是实现人机语音通信的必要支撑技术。文语转换系统是现阶段实现语音合成的有效方式,合成语音的自然度已成为影响该技术推广应用的关键。文语转换系统,分为前端文本分析模块和后端语音合成模块,文本分析与处理的效果将直接决定合成语音的自然度。本文以开发泰语文语转换系统为目的,研究并实现泰语文本分词、归一化以及罗马化。论文的主要工作包括：1.针对泰语特点,构建泰语字符连缀集,并将其应用于前后向最大匹配分词算法中。实验结果表明,含未登录词语料的分词正确率,可由85.69%提升到94.04%。2.提出基于规则和关键词相结合的方法,实现泰语文本归一化。在特殊字符处理模块中,先对泰语文本中出现的数字、物理单位、货币符号、缩略语等的特殊字符进行分类。归纳易产生歧义的字符类型,构建关键词词典。在此基础上,编写C语言程序进行特殊字符的处理,成功将其转化为标准的泰语文本。实验结果表明：集内测试正确率为97.83%,集外测试的正确率为97.12%,且大部分非标准词的消歧正确率达到95%以上。3.根据泰语音节结构的特点,归纳、整理元音和辅音以及韵母中的元音和尾辅音的搭配规则,在此基础上,以音节为基本单元,用Perl脚本语言编写程序实现泰语文本的罗马化。测试结果表明,罗马化结果可满足后端语音合成的要求,并从中可体现分词、文本归一化的结果。(本文来源于《云南大学》期刊2014-05-01）

胡恩星^[7]（2013）在《越南语文语转换系统中的前端文本分析方法》一文中研究指出越南语是越南的官方语言,属南亚语系孟一高棉语族。越南语类似于汉语普通话,也采用“声、韵、调”标记其音节。文本以开发越南语文语转换(TTS)应用系统为目的,研究越南语文本分析方法,探索提高合成语音自然度的途径。一个完整的TTS系统包括前端文本分析模块和后端语音合成模块。前端文本分析对提高合成语音的自然度、可懂度起至关重要的作用。文本分析涉及文本归一化、分词、词性标注和韵律短语(L3)边界预测等技术。论文的主要工作包括：1.采用规则加关键字的方法实现越南语文本归一化。经测试,文本归一化的准确率达97.2%。2.采用前后向最大匹配结合词频统计的方法实现越南语分词。经测试,分词的准确率、召回率和F-1值分别为：97.24%、91.35%和94.20%。3.采用N-gram语言模型建模,Viterbi解码的方法进行越南语词性标注。集内外测试准确率分别为82.42%和71.28%。4.采用C4.5算法建立越南语韵律短语边界决策树模型,利用剪枝后的决策树进行L3边界预测。集内外测试的F-1值分别为60.73%和57.96%。以上文本分析的测试结果说明,本文所讨论的方法可以满足越南语语音合成系统的初步应用需求,并为进一步提高越南语TTS系统的性能奠定了基础。(本文来源于《云南大学》期刊2013-05-01）

刘怀璟^[8]（2013）在《泰语文语转换系统中的文本分析方法研究》一文中研究指出泰国位于中国南部,处于东南亚的中心,是我国的友好邻邦,泰国与中国贸易往来频繁,和我国在经济、政治领域有重要合作关系。泰语是泰国的官方语言,目前有6000多万人口使用泰语,泰语是一种分析型、孤立型语言,它多由单音节词构成基本词汇。同时,泰语也是一门声调语言,声调可以用来区分不同的词汇和语法。东南亚市场蕴含着巨大的潜力,东南亚语言将会成为语音合成领域的研究重点。论文的主要工作包括：].从专业泰语在线词典下载词条包,挑选出包括常用词、复合词、地名、数量词、借词等词条,并通过在线词典人工查询并添加标准音标和词性信息,构建泰语词典。2.从泰语专业书籍以及网站中挑选常用语句,并对语料进行进一步筛选,去除长度、格式不合适的语句,最后留下作为前端文本分析的语料。3.在构建好泰语词典的基础上,进行泰语TTS系统前端文本分析,针对泰语语言特征,设计基于泰语词典的前向后向最大匹配算法进行分词,再将分词结果利用词典替换成对应泰语音节信息。4.针对基于泰语词典前向后向最大匹配算法未匹配到的词语(即未知词),设计基于泰语音节拼写规则的处理方法进行处理。5.设计一个改进的泰语罗马化编码方案,在上述过程完成的基础上,用该编码方案对泰语文本进行编码,再与标准泰语读音进行比较。本论文通过前向后向匹配算法对泰语文本进行基于泰语词典的分词,已经能够将词典内包含的词语正确切分出来,对未知词进行处理后,将文本尽量表现成音节组合形式,经实验研究,初步分词正确率达到78%；语音合成系统需要将文本罗马化以提取音节音调信息,因此还需要将泰语进行罗马化,经过改进的泰语罗马化编码方案能够更准确的表达出泰语音节以及音调信息。(本文来源于《云南大学》期刊2013-05-01）

朱菁^[9]（2013）在《具有表现力的汉语文语转换》一文中研究指出具有表现力的文语转换系统有着广阔的应用前景。本课题着重于研究韵律和语调对普通话语音表现力的影响以及这两者在汉语语音合成中的应用。其中，韵律特征主要从重音，停顿以及语速叁方面进行描述。通常，一句话中着重强调的词语即是重音，语音合成时，重音可以通过增大语音的幅度和提高语音的基频实现控制。停顿则是指词间或句间的间歇，合成时，可以在语音参数的相应位置插入零值实现。语速是指朗读文本的速度，一般由说话者的个人风格以及文本思想内容共同决定，语速的调节分为减慢和加快，减慢是通过在语音参数一定的位置复制粘贴相邻帧的语音参数实现，加快则是通过删除特定帧参数实现。由于汉语是有调语言，所以语调对于汉语的语音合成也具有重要的意义。本课题研究的语调主要是指语句音高的变化，根据音高的不同走势，可将语调分为四种调型：升调，降调，平调以及曲折调。研究时，首先建立有调语音的语音库，然后采用STRAIGHT算法分析有调语音库的基音频率，再用多项式函数对归一化后的语音基频曲线进行拟合，建立每一种调型的基频模型。这里采用了叁种方法进行语调建模：均值模型，单高斯模型以及混合高斯模型。通过建立的语调模型可以实现将一种语调转换成另一种语调。本系统中，语音合成模块也是采用STRAIGHT算法，对经过韵律及语调调整后的参数进行拼接合成。从实验结果来看，在汉语文语转换系统中，采用本课题提出的方法加入韵律和语调控制模块，可以灵活地调节语音的韵律特征，实现语调之间的转换，合成出的声音自然度较高，语音质量较好，明显地增强了语音的表现力。(本文来源于《苏州大学》期刊2013-05-01）

奎丽萍^[10]（2012）在《越南语文语转换技术研究》一文中研究指出随着语音合成应用的普及,人们对合成语音的音质和自然度提出了更高的要求。越南语是越南的官方语言,属于南亚语系孟—高棉语族。越南语类似于汉语普通话,也采用“声、韵、调”标记其音节。本文以开发越南语文语转换(TTS)应用系统为目的,研究越南语语音合成,探索提高音质和自然度的途径。根据越南语的特点,本文选用声母和韵母为合成基元,并采用左、右相关的叁音子模型。一个完整的TTS系统包括前端文本分析模块和后端语音合成模块。在前端文本分析方面,本文研究越南语的分词、词性标注、特殊符号处理和韵律短语(L3)边界预测等关键技术。在后端语音合成方面,本文研究越南语训练语料的收集、标注,以及合成器的训练等。学位论文的主要工作包括：1.构建越南语的TTS基线系统,包括文本收集和录音、确定音素列表、标注、上下文属性和问题集设计、训练HMM合成器等。根据系统测试和评测的结果,从标注、上下文属性和问题集叁个方面对初步构建的合成器进行了改进。2.采用正向最大匹配法(FMM)和逆向最大匹配法(BMM)相结合的分词方法实现自动分词工作。提出了越南语词性标注方案,拟采用基于统计语言模型的方法实现词性自动标注。对越南语文本中出现的特殊符号进行标准化处理,包括文本中的阿拉伯数字、数学符号、国际物理量和货币单位、缩略语等。3.采用C4.5决策树算法实现越南语L3边界的自动预测工作,包括属性信息提取、模型训练和L3边界自动标注,并对自动标注结果进行了主客观评测。实验结果表明：(1)采用本文方案改进后的合成系统,其合成语音的主观评测得分(MOS)分别为：集内3.89,集外3.55,说明改进效果明显。(2)使用论文中所述方法实现越南语自动分词和特殊符号处理具有实用性和可行性。(3)采用本文所述方法预测L3边界,集内外测试的F-Score值分别为60.73%和57.96%,主观评测其可接受率分别为72.3%和69.0%。该方法用于越南语L3边界的预测可满足语音合成系统的初步应用,且为进一步提高越南语语音合成的自然度奠定了基础。(本文来源于《云南大学》期刊2012-04-01）

汉语文语转换论文开题报告

（1）论文研究背景及目的

此处内容要求：

首先简单简介论文所研究问题的基本概念和背景，再而简单明了地指出论文所要研究解决的具体问题，并提出你的论文准备的观点或解决方法。

写法范例：

傣语属于汉藏语系壮傣语支。随着傣、汉文化交流日益加深,在汉语的影响下,大量的汉语词汇被借入到傣语中,形成了发音具有特殊性的汉语借词。本文以开发西双版纳傣语文语转换(TTS)系统为目的,从音位学、说话人的教育背景等方面分析、归纳汉语借词的使用现状和发音规律。提出了傣语TTS系统中的汉语借词发音规则和罗马化方法,进一步改进了HMM模型训练过程中涉及汉语借词的上下文属性和问题集设计方法。最后,基于HTS平台,通过合成含有汉语借词的傣语语句,验证方法的有效性。实验结果表明,合成语音中的汉语借词具有较好的可懂度,并符合西双版纳傣语的实际发音习惯。

（2）本文研究方法

调查法：该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法：用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法：通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法：通过调查文献来获得资料，从而全面的、正确的了解掌握研究方法。

实证研究法：依据现有的科学理论和实践的需要提出设计。

定性分析法：对研究对象进行“质”的方面的研究，这个方法需要计算的数据较少。

定量分析法：通过具体的数字，使人们对研究对象的认识进一步精确化。

跨学科研究法：运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法：这是社会科学用来分析社会现象的一种方法，从某一功能出发研究多个方面的影响。

模拟法：通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

汉语文语转换论文参考文献

[1].王展.傣语文语转换系统开发[D].云南大学.2017

[2].王昱,杨鉴,陈志琼,伍烛梅.傣语文语转换系统中的汉语借词发音规则及其合成方法[C].第35届中国控制会议论文集（C）.2016

[3].王雨蒙.英语文语转换系统中的ToBl韵律自动标注方法与实现[D].云南大学.2016

[4].李诗心,杨鉴,陈志琼,辛振球.基于HMM的傣语文语转换系统[C].第叁十四届中国控制会议论文集（C卷）.2015

[5].庞哨苎,刘院波,巴桑卓玛,群诺.藏语文语转换系统关键技术的研究[J].西藏科技.2014

[6].林雪娥.泰语文语转换系统中的文本分析和处理[D].云南大学.2014

[7].胡恩星.越南语文语转换系统中的前端文本分析方法[D].云南大学.2013

[8].刘怀璟.泰语文语转换系统中的文本分析方法研究[D].云南大学.2013

[9].朱菁.具有表现力的汉语文语转换[D].苏州大学.2013

[10].奎丽萍.越南语文语转换技术研究[D].云南大学.2012

论文知识图

标签：分词论文; 泰语论文; 韵律论文; 语音合成论文; 文本论文; 汉语论文; 藏文论文;

汉语文语转换论文_王展

汉语文语转换论文文献综述

汉语文语转换论文开题报告

汉语文语转换论文参考文献

论文知识图

猜你喜欢