导读:本文包含了语音信号的表示论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:稀疏,语音,信号,字典,信号处理,声频,正交。
语音信号的表示论文文献综述
赵城[1](2018)在《基于稀疏表示和深度学习的单通道语音信号分离技术研究》一文中研究指出盲源分离是指在信源特性和混合过程均未知或部分未知的情况下,仅根据源信号的某些先验特性,从观测信号(也被称为混合信号)中恢复出源信号的过程。当观测信号仅有一路时称之为单通道盲源分离。目前,基于稀疏表示的单通道盲源分离算法取得了一定的研究成果,但仍然存在一些不足。基于稀疏表示求解该问题涉及到了冗余字典构造和优化算法的运用,具有极高的理论意义,同时,单通道盲源分离广泛应用于现实生活中,对该问题的研究具有很大的实用价值。本文深入研究了语音信号稀疏表示理论以及现有的基于稀疏表示的单通道语音信号分离算法。在此基础上,分析了“交叉投影”问题产生的原因,提出了含公共子字典的联合字典构造方法,给出了基于该联合字典的混合语音分离算法。文章尝试了把深度学习技术引入到盲源分离问题当中,实现了基于深度神经网络的异性说话人双输出混合语音分离模型,取得了较好的分离效果。本文的主要研究内容和创新成果包括:(1)介绍了信号的稀疏表示理论,阐述了基于稀疏表示理论的单通道盲源分离算法的基本原理,详述了语音信号预处理的步骤,介绍了了衡量语音信号分离的评价指标。在这个基础上,文章进行了实验仿真,实现了基于稀疏表示的异性说话人混合语音分离。(2)提出了基于含公共子字典的联合字典的单通道盲源分离方法。文章对传统的基于稀疏表示的单通道盲源分离方法存在的“交叉投影”问题进行了探索性的研究,从理论和实验上验证了由于字典训练集之间存在相似成分,导致联合字典区分性较差,影响了分离效果。基于这一结论,文章提出了含公共子字典的联合字典构造方法,通过引入公共子字典使得源信号中相似的成分投影到公共子字典上,同时减小了字典间的干扰,克服了“交叉投影”问题。文章给出了基于含公共子字典的联合字典求解单通道盲源分离问题的详细算法。最后,进行了实验仿真,验证了这一新方法的有效性,并对实验结果的影响因素进行了分析。(3)提出了基于深度学习的异性说话人混合信号分离模型。为了进一步提高分离信号的质量,文章使用了当前非常热门的在语音信号处理领域应用很广泛的深度学习技术。系统的介绍了深度神经网络的理论知识,包括深度神经网络结构、网络的训练算法。搭建了基于深度神经网络的异性说话人双输出混合语音分离模型。通过实验验证了这一模型的有效性,并对实验结果影响因素进行了分析。(本文来源于《南京邮电大学》期刊2018-11-14)
李虎[2](2018)在《基于稀疏表示的语音信号盲源分离算法研究》一文中研究指出盲源分离是指源信号与混合矩阵先验知识均未知的情况下,从观测到的多个混合信号中提取、分离出感兴趣信号的过程。它作为一种功能强大的信号处理方法,其研究与应用在众多领域中都有着举足轻重的地位。随着盲源分离技术的快速发展,其在信号处理和神经网络等学科领域具有重要的研究价值和实用意义。欠定盲源分离技术是一种具有广泛性和挑战性的信号处理技术,在观测信号数量小于源信号数量的情况下,处理技术将面对更大的挑战,并且其分离技术还有待进一步的发展。本文主要研究线性瞬时混合模型下的欠定盲源分离技术,主要通过“两步法”的稀疏分量分析算法对欠定盲源分离问题进行研究,即首先进行混合矩阵的估计,然后根据源信号的先验知识训练过完备字典,获得源信号的稀疏表示,把压缩感知信号重构算法引入到欠定盲源分离中,实现语音信号的盲分离。本文的主要研究工作包含以下两方面的内容:(1)混合矩阵估计的精度直接影响源信号的分离效果。针对模糊C均值聚类算法过于依赖初始聚类中心,在混合矩阵估计中精度低、鲁棒性差的缺点。本文将遗传算法和模拟退火算法相结合,相互舍短取长,提出一种基于遗传模拟退火优化FCM(GASA-FCM)混合聚类和霍夫变换的混合矩阵估计算法。该算法首先结合了模拟退火算法全局搜索、高精度的优点和遗传算法强大的空间搜索能力,将经遗传模拟退火算法得到的聚类中心点赋给FCM,避免了初值选择的随机性。同时为了提升混合矩阵估计的精度,对聚类获得的每一类数据的中心引入霍夫变换进行校正。实验结果表明,该算法改善了算法的稳定性和混合矩阵估计精度,具有一定的有效性和可行性。(2)研究基于字典学习的语音信号盲源分离方法,首先采用双重稀疏字典训练算法(Double Sparsity KSVD,DSKSVD)训练可稀疏表示的冗余字典,在该冗余字典上对观测信号进行稀疏分解;然后分析欠定盲源分离和压缩感知问题的等价性,构建基于压缩感知的盲源分离模型,并应用正交匹配追踪算法对信号进行重构,实现语音信号的盲分离。DSKSVD算法在保证源信号分离精度几乎不变的条件下,降低了字典构建的计算复杂度,提高了信号稀疏表示的有效性,减少了重构算法的运行时间。大量实验表明,该算法训练字典的时间优于KSVD算法和在线字典学习算法,有效地提高了计算效率。(本文来源于《兰州交通大学》期刊2018-04-01)
毕超,冯玉田,李园辉,王瑞[3](2017)在《语音信号的分块稀疏表示分类研究》一文中研究指出传统稀疏表示分类算法(SRC)在处理复杂多维的向量的时候,需要对稀疏后的每个信号单独处理求残差,会导致处理时间过长,无法有效地运用于实际的工程应用中。为解决这一问题,提出将图像处理的分块稀疏应用于语音稀疏表示分类的方法。该方法在传统稀疏表示分类的基础上,引入分块稀疏思想,将语音信号按指定的长度处理,从而将若干个稀疏系数组成稀疏组来进行进一步分类识别。验证实验表明,源于图像处理的分块稀疏表示分类法同样适用于语音信号的处理。实验结果表明,在识别率接近的情况下,语音信号分类识别所花费的时间比图像处理明显降低。这是因为图像稀疏分类的系数之间相关性较强,因而分类的识别率较高;而语音信号是典型的非平稳过程,各种特征参数随时间快速变化,因而根据长度分类的相关性显着减少。因此,语音信号识别的准确率虽然会有所降低,但其效率显着提升。(本文来源于《计算机技术与发展》期刊2017年03期)
张宏乐[4](2016)在《语音信号稀疏表示方法研究》一文中研究指出语音是迄今为止最常用的交流方式。近年,语音通信多与其他多媒体通信方式相结合,例如电视电话会议、微信语音聊天等。随着这些应用的流行,人们不仅对语音信息量的需求在逐渐变大,对语音质量的要求也迈上了新的台阶。传输用传统的采样量化得到的数字语音,会占用较多信道资源,并且在存储时也对存储空间有很高需求。因此,在确保语音通信可靠性的情况下,如何有效地进行语音编码,降低传输语音的比特率、减少信号占用信道资源,是通信过程中的重要问题。语音信号的稀疏表示是语音信号处理中降低数码率并减少占用带宽的有效手段。本文对语音信号的稀疏表示进行了研究。其中重点研究了基于冗余字典的稀疏表示。文章首先对稀疏表示理论进行了详细的总结和归纳,对信号稀疏表示的两个关键技术—稀疏分解算法和稀疏基的构造进行深入分析。1.首先对K-SVD字典训练算法进行研究,并将其与K-Means算法及MOD算法展开对比讨论。K-SVD算法的主要特点是可以为特定的信号训练适应该信号的字典,并能在得到字典的同时得到信号的稀疏表示。K-Means算法是K-SVD算法码本维数为1的特殊情况。与MOD算法对比,K-SVD算法将MOD算法中对矩阵的求逆转化为对误差矩阵kE的rank-1逼近。本文从对比分析这叁者的差异角度来阐述K-SVD算法用于字典训练的机理。2.本文基于线性稀疏表示,针对K-SVD字典初始化问题进行了研究。基于传统K-SVD训练字典的方法需要在开始就确定字典的规模,而选择的字典规模不当会造成信号过表示或欠表示,严重影响语音的稀疏质量。针对字典初始规模的选择问题,本文提出了一种基于新型BDS模型的字典初始化方法,该方法根据最佳字典规模与稀疏比的关系为字典规模建立模型,可以自适应的为语音信号选择恰当的初始字典,避免了K-SVD方法依靠经验设置字典规模的缺陷。本文将加入BDS模型的训练字典的方法应用于来自太原理工大学数字音频与视频实验室语音库的语音,进行仿真实验并对实验结果进行了分析。实验结果表明:基于BDS模型的语音信号字典构造方法实现了自适应选择最佳字典规模目的,可在保证重构语音质量的同时,进一步提高字典训练的效率。3.本文针对语音信号的非线性特征,提出一种基于核字典的语音信号稀疏表示方法。本文通过将语音信号投影至高维特征空间,再对特征空间的信号进行线性稀疏表示来得到语音信号的非线性稀疏表示。算法中将核理论引入计算过程,来避免高维空间的海量计算。实验结果表明:在稀疏表示非线性信号时,核字典法明显优于K-SVD算法。而且在构造字典方面,核字典法比核MOD算法性能更优。(本文来源于《太原理工大学》期刊2016-06-06)
韩卫丽,邹建成,李建伟[5](2013)在《一种基于信号稀疏表示的语音去噪新方法》一文中研究指出由于小波阈值在语音去噪中阈值的单一性,本文提出了一种基于稀疏表示理论的新的去噪算法.该算法首先用K-SVD字典学习得到信号在字典下的稀疏表示,其次用形态成分分析(Morphological Component Analysis,MCA)将语音信号分为高幅部分和低幅部分,最后用重构方法对各部分语音信号进行重构及合成.通过实验仿真,并与小波阈值去噪方法比较,本文所提方法的去噪效果更好,鲁棒性更强.(本文来源于《北方工业大学学报》期刊2013年03期)
徐倩[6](2012)在《基于稀疏表示的语音信号的最佳投影与其重构技术的研究》一文中研究指出近年来,压缩感知理论是国内外信号处理领域学者的研究热点,它的“边采样边压缩”使得A/D转换后数字序列、速率能够远低于传统的奈氏采样定理的特点,是最大的引人之处。本文将压缩感知理论应用于语音信号领域,研究语音信号的压缩感知技术,特别是最佳压缩投影和重构性能。本文分析了语音信号自身的特征,并以此优化观测矩阵,达到改善语音信号的压缩感知和重构性能的目的。本文首先提出了一种基于最优观测的语音压缩感知方法。该方法利用了语音信号在DCT域的近似稀疏性,结合最优观测算法找出DCT基对应的最优观测矩阵,然后采用求得的最优观测矩阵对语音信号进行投影观测。实验结果表明,基于最优观测矩阵的压缩感知的重构语音的质量较好,该方法提高了语音的压缩感知和重构性能。依据语音信号的某一特性自适应地构造观测矩阵,即语音信号的自适应压缩感知,是本文另一个主要研究内容。根据相邻的不同类型的语音帧有不同的帧间变化量,本文提出了一种新的语音帧间自适应压缩感知算法。实验结果表明该帧间自适应压缩感知的重构性能比非自适应压缩感知更好。本文第叁个研究内容是进一步研究语音的自适应压缩感知,提出了一种基于清浊音判断的语音自适应压缩感知方法。该方法分别由帧间自适应和帧内自适应组成。帧间自适应首先依据语音帧的短时能量和短时过零率判断语音帧属于清音帧还是浊音帧,基于浊音信号含有的信息量比清音信号更多且对语义更重要的事实,然后由整段语音信号中清音帧的总个数和浊音帧的总个数自适应地分配较多的观测数给浊音帧。在帧间自适应确定观测个数之后,帧内自适应根据本帧语音的能量特性自适应地从全局观测矩阵中选取能量最大的行向量构成最佳观测矩阵。实验结果表明,上述基于清浊音判断的语音自适应压缩感知算法大大改善了重构语音的质量,并且帧间自适应和帧内自适应都有助于提高语音压缩感知的重构性能。(本文来源于《南京邮电大学》期刊2012-02-01)
王天荆,郑宝玉,杨震[7](2011)在《基于自适应冗余字典的语音信号稀疏表示算法》一文中研究指出基于冗余字典的信号稀疏表示是一种新的信号表示理论,当前的理论研究主要集中在字典构造算法和稀疏分解算法两方面。该文提出一种新的基于自适应冗余字典的语音信号稀疏表示算法,该算法针对自相关函数为指数衰减的平稳信号,从K-L展开出发,建立了匹配信号结构的冗余字典,进而提出一种高效的基于非线性逼近的信号稀疏表示算法。实验结果表明冗余字典中原子的自适应性和代数结构使短时平稳语音信号稀疏表示具有较高的稀疏度和较好的重构精度,并使稀疏表示算法较好地应用于语音压缩感知理论。(本文来源于《电子与信息学报》期刊2011年10期)
郑翠[8](2011)在《基于稀疏表示的语音信号欠定盲分离技术研究》一文中研究指出信号处理在各个领域一直有着重要的地位,而伴随着移动通信和地质勘探技术的发展,迫切需要一种新的信号处理方法,盲信号处理就应运而生。盲源分离是二十世纪九十年代发展起来的一种新兴信号处理方法,它在研究语音增强、图像识别、生物工程信号、通信信号以及地震探测等领域中有非常重要的理论价值。传统盲源分离往往假设传感器个数大于信源数目,但是伴随着盲源分离问题的深入研究,欠定盲源分离问题备受关注,因为它是更符合实际,也是更具挑战的。在此条件下系统是不可逆的,传统的盲源分离算法失效,所以本文在语音信号稀疏表示的基础上,对语音信号欠定盲源分离的关键技术进行了研究。本文首先介绍盲源分离的发展现状,并对传统盲源分离算法进行了阐述。然后对欠定盲源分离的理论基础及关键技术进行了探索性研究。其中“两步法”是欠定盲源分离问题的热点,即首先通过聚类算法估计出混合矩阵,然后通过优化算法得到源信号估计,它与信号稀疏表示以及过完备基的选择有着密切关系。本文主要研究的内容如下:在信号稀疏表示的基础上,本文将目前模式识别聚类理论中最为成熟的模糊C均值聚类算法,运用到混合矩阵估计中。它克服了传统用势函数估计混合矩阵的方法中存在的参数选择复杂,势函数定义缺乏理论指导等缺点。但是模糊聚类自身存在对初始值敏感,易陷入局部最优等缺点,因此将其与差分进化结合,提出DE-FCM的混合矩阵估计算法,实现无监督聚类,参数选择简单,收敛速度快,估计准确等优点,并且达到全局优化。得到混合矩阵的估计之后,为了估计出不同稀疏程度的源信号,本文将平滑l0范数思想引入源信号估计中,不再使用最小l1范数的方法。因为最小化l1范数只有在信号足够稀疏时,才可以很好的恢复出源信号。而平滑l0范数直接利用一个近似函数来逼近l0范数以保证估计的性能,并利用一个控制因子来决定估计出的源信号稀疏性强度。实验表明该方法可以很好的实现源信号估计,而且得到源信号估计更符合混合模型。(本文来源于《哈尔滨工程大学》期刊2011-03-01)
于凤芹[9](2005)在《基于叁参数Chirp原子分解的语音信号的时频表示》一文中研究指出由语音信号的产生机理决定其呈现明显的非平稳特性,传统的信号分析方法不能刻画其局部时变结构。本文提出了基于叁参数Chirp原子分解的语音信号的时频表示,该方法把语音信号分解为由比例、旋转、径向位移表示的叁参数Chirp时频原子的线性组合,并用这些Chirp原子的WVD的迭加来逼近语音信号的时频表示。仿真实验结果表明,该方法与WVD相比无交叉项干扰,与谱图相比具有较高的时频聚集性,并且还可以提供语音信号的局部时频结构的参数。(本文来源于《第十二届全国信号处理学术年会(CCSP-2005)论文集》期刊2005-08-30)
周志杰[10](2002)在《语音信号非线性特征的数值表示》一文中研究指出分析了语音信号的非线性特征 ,用傅里叶谱、吸引子、分维数、李亚普诺夫指数等非线性动力学行为的数值特征表征了语音信号的非线性特征。采用时延语音序列重构语音吸引子 ,用计盒分维数计算语音波形的分维数。实验结果显示语音波形具有分形特征 ,语音中存在混沌(本文来源于《解放军理工大学学报(自然科学版)》期刊2002年01期)
语音信号的表示论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
盲源分离是指源信号与混合矩阵先验知识均未知的情况下,从观测到的多个混合信号中提取、分离出感兴趣信号的过程。它作为一种功能强大的信号处理方法,其研究与应用在众多领域中都有着举足轻重的地位。随着盲源分离技术的快速发展,其在信号处理和神经网络等学科领域具有重要的研究价值和实用意义。欠定盲源分离技术是一种具有广泛性和挑战性的信号处理技术,在观测信号数量小于源信号数量的情况下,处理技术将面对更大的挑战,并且其分离技术还有待进一步的发展。本文主要研究线性瞬时混合模型下的欠定盲源分离技术,主要通过“两步法”的稀疏分量分析算法对欠定盲源分离问题进行研究,即首先进行混合矩阵的估计,然后根据源信号的先验知识训练过完备字典,获得源信号的稀疏表示,把压缩感知信号重构算法引入到欠定盲源分离中,实现语音信号的盲分离。本文的主要研究工作包含以下两方面的内容:(1)混合矩阵估计的精度直接影响源信号的分离效果。针对模糊C均值聚类算法过于依赖初始聚类中心,在混合矩阵估计中精度低、鲁棒性差的缺点。本文将遗传算法和模拟退火算法相结合,相互舍短取长,提出一种基于遗传模拟退火优化FCM(GASA-FCM)混合聚类和霍夫变换的混合矩阵估计算法。该算法首先结合了模拟退火算法全局搜索、高精度的优点和遗传算法强大的空间搜索能力,将经遗传模拟退火算法得到的聚类中心点赋给FCM,避免了初值选择的随机性。同时为了提升混合矩阵估计的精度,对聚类获得的每一类数据的中心引入霍夫变换进行校正。实验结果表明,该算法改善了算法的稳定性和混合矩阵估计精度,具有一定的有效性和可行性。(2)研究基于字典学习的语音信号盲源分离方法,首先采用双重稀疏字典训练算法(Double Sparsity KSVD,DSKSVD)训练可稀疏表示的冗余字典,在该冗余字典上对观测信号进行稀疏分解;然后分析欠定盲源分离和压缩感知问题的等价性,构建基于压缩感知的盲源分离模型,并应用正交匹配追踪算法对信号进行重构,实现语音信号的盲分离。DSKSVD算法在保证源信号分离精度几乎不变的条件下,降低了字典构建的计算复杂度,提高了信号稀疏表示的有效性,减少了重构算法的运行时间。大量实验表明,该算法训练字典的时间优于KSVD算法和在线字典学习算法,有效地提高了计算效率。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
语音信号的表示论文参考文献
[1].赵城.基于稀疏表示和深度学习的单通道语音信号分离技术研究[D].南京邮电大学.2018
[2].李虎.基于稀疏表示的语音信号盲源分离算法研究[D].兰州交通大学.2018
[3].毕超,冯玉田,李园辉,王瑞.语音信号的分块稀疏表示分类研究[J].计算机技术与发展.2017
[4].张宏乐.语音信号稀疏表示方法研究[D].太原理工大学.2016
[5].韩卫丽,邹建成,李建伟.一种基于信号稀疏表示的语音去噪新方法[J].北方工业大学学报.2013
[6].徐倩.基于稀疏表示的语音信号的最佳投影与其重构技术的研究[D].南京邮电大学.2012
[7].王天荆,郑宝玉,杨震.基于自适应冗余字典的语音信号稀疏表示算法[J].电子与信息学报.2011
[8].郑翠.基于稀疏表示的语音信号欠定盲分离技术研究[D].哈尔滨工程大学.2011
[9].于凤芹.基于叁参数Chirp原子分解的语音信号的时频表示[C].第十二届全国信号处理学术年会(CCSP-2005)论文集.2005
[10].周志杰.语音信号非线性特征的数值表示[J].解放军理工大学学报(自然科学版).2002