基于空间定位的混迭语音的分离

基于空间定位的混迭语音的分离

于大刚[1]2006年在《说话人个数时变的语音盲分离研究》文中研究说明盲源分离是用于阵列信号处理与分析的一种新兴技术,因其能够从观测的混合信号中恢复出原始信号,而对原始信号和混合系统的先验知识要求甚少,故此在无线通信、医学信号处理、图像增强和语音分离等诸多领域有着广泛的应用。 混合语音信号的分离是该技术的研究初衷,也是信号处理领域中的一个难题,涉及问题很多,方法各异。本文简要概括了语音盲分离的基本理论和典型算法,并以此为基础,所做的工作包括如下两方面: 现有的语音盲分离算法都是针对说话人个数已知且在分离过程中恒定的情况,而现实中说话人个数可以是时变的。本文提出一种解决方案,仅用两个麦克风对说话人个数时变的语音信号进行盲分离,不仅能反映说话人个数时变的过程,而且解决了麦克风与说话人之间个数差异引起的超定、欠定问题。其主要思想是:首先,判断说话人个数的变化情况。综合比较几种说话人个数的判断方法后,本文选取一种实时性能较好且易于实现的互功率谱相位法来反映说话人个数的变化过程并按照说话人个数不同,将采集的混合信号分段;其次,对各段分别做盲分离处理。由于说话人个数和麦克风个数存在差异,它们不能始终维持正定情况,所以本文借鉴了超定情况下的盲分离算法DUET;最后,本文提出设想,将各段处理结果用说话人识别技术整合,从而解决了说话人个数时变的语音盲分离问题。 此外,本文还用所提出的方法对盲定位进行了研究。基于互功率谱相来确定信号源到两个麦克风的距离差双曲线,用DUET求解波达方向角。联立曲线和方向角实现多信号源盲定位。因为仅用了两个麦克风,所以定位结果是多个解,本文又结合声音传播规律和余弦定理去除了虚定位。最后用定位结果来指导盲信号分离,实验效果证明了算法的有效性。

王宏雨[2]2006年在《基于独立分量分析的语音盲分离算法研究》文中研究说明本文提出以一种修正双曲正割函数的平方概率密度函数作为语音信号概率密度函数的估计,把通过此函数得到的核函数应用到语音信号盲分离中,与常用的拉普拉斯分布的概率密度函数和双曲正割函数的平方分布的密度函数所导出的核函数应用到语音信号盲分离中的分离效果进行对比,由所得的核函数构成的语音分离算法具有更快的收敛速度。本文同时将几种常用的独立分量分析优化算法的分离效果进行仿真实验,经分析发现等变量自适应盲分离方法具有更好的分离效果。在此基础上提出一种改进的变步长参数,将此改进的变步长参数与常数步长以及其它几种变步长参数分别应用到语音盲分离中进行计算机仿真,实验结果说明了本文所提出的变步长参数能够使语音分离算法的收敛速度更快、收敛效果更好。对于语音信号卷积混合的盲分离算法进行了研究,分别从时域和频域的角度进行分析,对于频域里的两种简化算法进行了研究,为以后对信号分离理论的进一步研究打下了基础。

参考文献:

[1]. 说话人个数时变的语音盲分离研究[D]. 于大刚. 哈尔滨工程大学. 2006

[2]. 基于独立分量分析的语音盲分离算法研究[D]. 王宏雨. 吉林大学. 2006

标签:;  ;  ;  ;  ;  

基于空间定位的混迭语音的分离
下载Doc文档

猜你喜欢