导读:本文包含了可懂度论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:语音,言语,方根,维吾尔,灰质,指数,识别率。
可懂度论文文献综述
张硕[1](2019)在《结合可懂度约束条件的维纳滤波语音增强算法研究》一文中研究指出当今社会,人与机器之间的交流非常频繁密切,因此对语音信号的处理水平要求更高。由于语音信号传播的主要介质是空气,所以语音信号在传输过程中必然会受到空气中噪声的干扰,影响接收端正确接收语音信号。在这种背景下,语音增强算法的研究具有必要的现实意义。语音增强的目的在于最大限度地消除噪声,同时提高增强语音的质量和可懂度。然而语音质量的提高并不一定能带来可懂度的改善,这是由于语音增强技术在抑制噪声的过程中会造成增强语音的幅度失真。根据频域中增强语音与纯净语音幅度的比例关系,把增强语音的幅度失真分为叁类:衰减失真、放大倍数小于6dB的放大失真和放大倍数大于6dB的放大失真。现有研究表明放大倍数超过6dB的放大失真对语音可懂度影响较大,有效去除这部分失真可以明显提高增强语音的可懂度。本文针对上述问题,首先介绍了语音增强技术的发展历程及基本理论,并就本文的研究重点—维纳滤波算法进行了详细说明。然后,鉴于现有语音增强算法在解决放大倍数超过6dB的放大失真时,需假设已知纯净语音的幅度,并假设纯净语音和噪声是相互垂直的,于是针对上述理想约束条件,本文通过引入带噪语音、纯净语音和噪声之间的几何相位关系,成功将现有算法中基于纯净语音幅度或瞬时先验信噪比的理想约束条件转化为对瞬时先验信噪比和瞬时后验信噪比的约束,提出了一种能够有效改善放大倍数超过6dB的放大失真的维纳滤波语音增强算法。最后,在理论分析及公式推导的基础上,结合仿真实验,验证了本文所提出的算法较现有算法在语音可懂度及语音质量两方面均有提高。(本文来源于《烟台大学》期刊2019-05-30)
左建,邵薏汀,陈艾婷,冀飞[2](2019)在《基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系》一文中研究指出目的研究助听器使用者基于真耳分析的言语可懂度指数(speech intelligibility index,SII)与言语识别率的关系,探索SII在助听器验配效果验证中的应用。方法对27例感音神经性聋的助听器使用者依据真耳分析测试结果进行调试,调试前后分别通过真耳分析得到不同输入级下的SII值,并分别进行安静条件下单音节识别率和噪声条件下句子识别率测试。根据两种言语识别测试结果,将患者分为助听最佳组(仅单音节有此分组)、助听佳组、助听一般组和助听差组,分析各组助听SII值与言语识别率得分的相关性。结果调试后,受试者的SII值和言语识别率均得到提高。助听佳组的安静下单音节识别率与SII值的相关性最高(R2=0.74,P<0.05),助听差组的噪声下句子识别率与SII值的相关性最高(R2=0.60,P<0.05)。结论通过真耳分析调试后,助听器佩戴者的SII值与言语识别率相关性提高。(本文来源于《中国听力语言康复科学杂志》期刊2019年03期)
刘鹏[3](2018)在《低信噪比下高可懂度语音增强算法》一文中研究指出提出了低信噪比下高可懂度的基于分段信噪比相对均方根(RMS)的语音增强子空间算法.现有的多数语音增强算法在低信噪比的恶劣条件下,改善带噪语音质量的同时通常会伴有语音可懂度的降低.一个重要原因是这些算法大都仅基于最小均方误差(MMSE)来抑制语音失真,却忽略了语音增强算法所导致的语音失真对差异类型语音分段的可懂度影响程度不同.为了改进这一缺点,提出了基于短时信噪比RMS对语音分段进行分类,然后调整处于信噪比中均方根语音分段的增益矩阵分量,来减小语音失真对增强语音可懂度的影响.客观评价实验说明,改进算法可以改善增强语音可懂度归一化协方差评价法(NCM)的评测值.主观试听实验说明,改进算法的确提升了增强后语音的可懂度.(本文来源于《计算机系统应用》期刊2018年12期)
黄志华[4](2018)在《共振峰对维吾尔语语音可懂度的影响》一文中研究指出0引言1共振峰在语音理解和识别中有重要作用,正弦波语音(SWS,Sine-wave speech)是由共振峰频率和幅度调制的正弦波稀疏编码语音的声学结构,一些声音特征(如谐波结构和基频轮廓)在处理过程中被丢弃,SWS可用于研究共振峰在语音理解中的重要性。文献[1]研究了语音基频与共振峰对汉语普通话元音可懂度的贡献,发现元音基频对汉语普通话的可懂度贡献更大,而共振峰对英语的可懂度更(本文来源于《2018年全国声学大会论文集 K语言声学与语音信号处理》期刊2018-11-10)
陶畹琪,祝培生,郭飞,李德民,周凯宇[5](2018)在《教室言语可懂度评价研究进展》一文中研究指出教室是典型的语言声厅堂,良好的言语交流条件至关重要,言语可懂度是表征语音传输质量的重要参量。传统的客观声学参量不能对教室的语音传输质量进行综合性的评价。随着言语可懂度的客观评价参量语音传输指数(STI)最新标准的发布,使用言语可懂度评价教室音质成为当前的研究热点。基于探讨传统评价方法与言语可懂度评价方法的关系,本文对使用言语可懂度评价教室音质的研究进行了梳理与分析,并指出了STI用于客观评价教室音质的发展方向。(本文来源于《电声技术》期刊2018年07期)
马宁,王海宝,余永强,宋彪,刘灿[6](2018)在《先天性耳聋脑灰质密度与人工耳蜗植入术后言语可懂度相关性研究》一文中研究指出目的应用基于体素形态学测量(VBM)研究先天感音神经性耳聋(CSNHL)患儿脑灰质密度与人工电子耳蜗植入(CI)术后语言恢复的相关性,探讨CSNHL相关脑重塑性机制。方法收集117例CSNHL患儿磁共振资料,CI术后6个月随访患儿言语可懂度分级标准(SIR)评分,将患儿分成叁组(高、中、低分组)。运用数据处理助手DPARSFA 3.2及统计参数图软件包SPM 12软件分析患者磁共振结构像资料,采用单因素方差分析(One-way ANOVA)分析与组间多重比较分析患儿脑灰质密度资料,从而获得差异显着性的脑区,并运用SPSS 16.0软件将部分脑区的脑灰质密度效应值与SIR分数进行相关性分析。结果叁组患者脑灰质密度差异显着性的脑区主要有:左侧额上下回、左侧前扣带回、后扣带回、左侧枕下回、双侧梭状回、右侧颞上回(P<0.005);上述脑区脑灰质密度效应值与SIR分数均具有相关性(P<0.05)。组间多重比较分析,高分组比低分组脑灰质密度增加的脑区有:左侧额下回、左侧中央后回、左侧缘上回、右侧颞中回、后扣带回;高分组比中分组脑灰质密度增加的脑区有:双侧额上回、左侧中央前回、右侧中央后回、右侧颞上回、右侧距状沟皮层、左侧楔前叶、双侧梭状回、后扣带回、左侧枕下回、双侧壳核、右侧丘脑(P<0.001)。结论CSNHL患儿术后语言恢复水平与术前视听觉皮层和默认网络等相关脑区灰质密度改变显着相关,这可能与相关脑区的神经重塑性有关联。(本文来源于《安徽医科大学学报》期刊2018年07期)
李春艳[7](2018)在《混响对中国英语学习者英语言语可懂度的影响研究》一文中研究指出真实的语言交际往往在火车站、地铁站、机场、饭店、礼堂、广场、工厂、街边等复杂多变的环境中开展,因此言语交际会受到噪声、混响等环境声学因素的干扰,而不同的声学因素会对言语理解产生不可忽视的影响。对于以英语为外语的学习者而言,真实场景下的复杂声使得英语言语的理解变得更具挑战。本论文尝试探索混响声环境对中国EFL学习者英语言语可懂度影响的语音学机制。在本研究中,我们设计了两种言语可懂度的测试:实验一是英语句子听力测试;实验二是诊断性押韵测试。前者主要是为了探究混响对句子可懂度和不同音素识别度的影响,后者则主要探究混响对英语区别性特征的影响。测试条件有干音和混响两种声学条件。共计57名中国在校大学生完成了本测试。结果表明,首先,不论是从句子层面还是音素层面,混响条件下的中国英语学习者的英语言语可懂度要显着低于干音条件下的言语可懂度。不同英语水平的受试,其英语言语可懂度受混响的影响有所差异,英语水平越高,可懂度受混响的影响越小。其次,元音和辅音的可懂度受混响的影响也有所差异,表现为两种声学条件下元音可懂度受混响的影响要稍高于辅音可懂度所受的影响。测试结果也说明对于中国英语学习者而言,元音的感知要比辅音差。最后,混响对英语区别性特征的影响并没有特别显着的差异,但是其对不同的特征有着不同的影响。其中,鼻音特征和连续音受混响的影响要大(如在nest/best对中,鼻音[n]的辨别受混响影响正确率不高;在sheet/cheat对中,连续音[?]的正确率受混响影响有所下降),但咝音的结果与已有研究有所出入,这可能是因为中国英语学习者对某些咝音音素(如[s]/[θ]、[z]/[e])难以辨别。本研究进一步增加了混响这一声学条件对言语可懂度有不利影响的证据,也对中国大学英语教学和学习环境有一定的启发意义;同时也为建筑声学研究提供了更广的语言视角;另一方面也为中国大学生英语语音学习指出了重点和难点。(本文来源于《哈尔滨工业大学》期刊2018-06-01)
高源[8](2018)在《基于音素的语音可懂度评价方法的研究与实现》一文中研究指出伴随着全球文化交流的日益频繁,人们越来越明白熟练掌握一门外语的重要性。口语训练是语言学习的基本要求,而计算机辅助发音训练系统也随之成为语音识别应用中的一个重要研究方向。对于我国英语学习者口语发音评价的重要指标之一是语音可懂度,但目前在音素级自动语音可懂度评分与人类专家评分相关性差距较大。此外,由于非母语学习者发音错误的多样性,在对学习者发音检测过程中,相似音素发音易出现混淆,传统基于概率统计的检测方法很难覆盖到所有的错误音素类型,无法准确有效地反馈音素级的纠正建议来帮助学习者提升语音可懂度水平。针对上述问题,本文首先分析了目前常用发音检测技术的特点和局限,为了解决学习者由于汉语发音习惯产生的错误发音规律性问题。本文采用一种基于音素偏误发音网络的方法对学习者发音中的错误发音的音素进行检测,并研究出一种循环随机音素识别检测方法提高音素识别正确率和准确率,并使用SVM分类器对发音错误类型进行判别分类,结合语音可懂度评价方法,为学习者反馈纠错建议。实验表明,使用本文改进的音素识别检测方法,提高了音素语音特征识别的正确率和准确率。在对学习者语音可懂度评分时,针对目前常用语音可懂度评价方法与人类专家评分相关性差距较大的问题。本文首先分析了基于AI指数、语段特征以及音素得分评价方法原理及特点。研究一种新的基于音素组合特征的语音可懂度评分方法,即通过线性组合的方式得到新的声学特征测量得分来对语音可懂度评分,并实验验证了本文语音可懂度评分方法与人类专家评分的相关性。最后本文将发音问题检测方法与语音可懂度评价方法应用于实际在线原型系统中,设计了针对非母语学习者的语音可懂度评估系统。实验测试表明,通过该系统对英语发音进行检测和纠正错误音素后,学习者语音可懂度评分有了明显提高,进一步验证本文所提方法的有效性和实用性。因此本课题在计算机辅助发音领域有着一定的参考价值和应用价值。(本文来源于《北京工业大学》期刊2018-05-01)
高飞[9](2018)在《基于音频特性的语音可懂度评估》一文中研究指出现代信息技术的快速发展,已经有越来越多的语音信号处理技术融入到我们的生活中,例如语音识别、语音增强、智能语音交互等,这些技术的成熟极大的方便了我们的日常生活和工作。而如何准确的评估语音性能,也一直是众多学者研究的热点,现如今语音性能的评估主要从语音质量和语音可懂度两个方面进行测评。一个准确有效的语音评估方法不仅可以提升通信系统的性能,而且可以间接检验语音增强算法的性能。语音的主观评价拥有人类对语音信号最真实的感受,然而主观评价费时费力,更是无法应对如今海量语音数据的评价需求。近年来,以计算机信息处理技术为核心,以最接近人类主观评价分数为目标的客观评估方法成为了研究热点。本文首先回顾了语音信号的基本知识和语音可懂度评价指数的发展历程。简述了现如今先进的语音主客观评价方法,分析客观可懂度评估方法的改进过程和评估思想,这对本文后面的研究提供了启发。本文首先将基于人耳耳蜗基底膜听觉特性的Gammatone滤波器组被应用于频域激励谱滤波,结合加权频带信噪比方法计算语音信号激励谱能量失真,相对于传统方法,改进的语音可懂度评估方法在Babble、Car、Street背景噪声环境下与主观评价分数的相关系数都有了明显提升。同时,本文还研究了元音和辅音对语音可懂度的相对贡献,在归一化协方差评价方法的基础之上,以语音所有频带信噪比(Signal To Noise Ratio,SNR)的相对均方根(Root Mean Square,RMS)值为阈值进行频域分段。语音频段被分为两个等级,高信噪比频段和低信噪比频段。对两种频段的语音信号采用归一化协方差方法(NCM)计算各自的语音可懂度客观评估分数。实验结果显示高信噪比频段语音含有更多的语音可懂度信息且与整体评估分数接近。同时,统一模型的提出结合了两段语音可懂度的相对贡献,当权重系数为0.2时,所提模型的评价结果与主观评价分数拥有高相关性。(本文来源于《太原理工大学》期刊2018-04-01)
高飞,马建芬,武正平[10](2018)在《基于RMS分频的高可懂度语音评价方法》一文中研究指出语音可懂度是语音信号的一种重要属性,在归一化协方差评价方法(NCM)的基础之上,以相对均方根(RMS)为阈值对语音信号进行分割,对高于均方值的语音段和低于均方值的语音段进行了分段可懂度评估,同时,提出了一种新的可懂度评价模型,结合了这两种语音段对语音可懂度的相对贡献,共同评价语音的可懂度。实验结果表明,高均方语音段相对于低均方语音段对可懂度具有更高的贡献,利用新的模型将这两种语音段的评价结果进行重新结合,评价效果得到了显着提升。(本文来源于《计算机工程与应用》期刊2018年21期)
可懂度论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
目的研究助听器使用者基于真耳分析的言语可懂度指数(speech intelligibility index,SII)与言语识别率的关系,探索SII在助听器验配效果验证中的应用。方法对27例感音神经性聋的助听器使用者依据真耳分析测试结果进行调试,调试前后分别通过真耳分析得到不同输入级下的SII值,并分别进行安静条件下单音节识别率和噪声条件下句子识别率测试。根据两种言语识别测试结果,将患者分为助听最佳组(仅单音节有此分组)、助听佳组、助听一般组和助听差组,分析各组助听SII值与言语识别率得分的相关性。结果调试后,受试者的SII值和言语识别率均得到提高。助听佳组的安静下单音节识别率与SII值的相关性最高(R2=0.74,P<0.05),助听差组的噪声下句子识别率与SII值的相关性最高(R2=0.60,P<0.05)。结论通过真耳分析调试后,助听器佩戴者的SII值与言语识别率相关性提高。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
可懂度论文参考文献
[1].张硕.结合可懂度约束条件的维纳滤波语音增强算法研究[D].烟台大学.2019
[2].左建,邵薏汀,陈艾婷,冀飞.基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系[J].中国听力语言康复科学杂志.2019
[3].刘鹏.低信噪比下高可懂度语音增强算法[J].计算机系统应用.2018
[4].黄志华.共振峰对维吾尔语语音可懂度的影响[C].2018年全国声学大会论文集K语言声学与语音信号处理.2018
[5].陶畹琪,祝培生,郭飞,李德民,周凯宇.教室言语可懂度评价研究进展[J].电声技术.2018
[6].马宁,王海宝,余永强,宋彪,刘灿.先天性耳聋脑灰质密度与人工耳蜗植入术后言语可懂度相关性研究[J].安徽医科大学学报.2018
[7].李春艳.混响对中国英语学习者英语言语可懂度的影响研究[D].哈尔滨工业大学.2018
[8].高源.基于音素的语音可懂度评价方法的研究与实现[D].北京工业大学.2018
[9].高飞.基于音频特性的语音可懂度评估[D].太原理工大学.2018
[10].高飞,马建芬,武正平.基于RMS分频的高可懂度语音评价方法[J].计算机工程与应用.2018