基于DSP的语音识别在控制系统的应用研究(附录)

基于DSP的语音识别在控制系统的应用研究(附录)

王璟珣[1]2009年在《基于非特定人语音识别的全音控盲人手机设计》文中指出近年来,语音识别技术的发展为人们提供了一种先进的人机交互方式――语音交互方式。这种方式因其便捷、自然的特点,受到广泛的关注,并且已经开始应用于一些特定的场合与设备中,受到人们的广泛欢迎。而对于盲人来说,由于其视觉缺陷的阻碍,很多时候并不能享受到科技发展带来的好处;而语音交互的方式则可以有效的解决这一问题,使科技进步能更好的服务于这一残疾人群体。经过几十年的努力,语音识别的研究工作已经有了长足的发展,基于不同理论的语音识别方法目前已有许多种。然而多数的研究工作都是在大型机或PC机上进行的,关注的主要是新理论的发现与验证、如何继续提升识别算法的准确度等问题;而基于嵌入式系统的语音识别技术,作为语音识别实用化的重要步骤,目前还没能实现大规模的应用。现有的嵌入式终端设备上的语音识别,也主要是简单的、针对特定人使用的孤立词识别。因此,如何将复杂的语音识别算法在嵌入式系统上实现实用化,使语音交互技术变得成熟起来,是一项有挑战性的工作。因此,本文以如何让语音交互方式为盲人服务作为出发点,对语音识别的原理与思想进行了深入研究,详细探讨了基于隐马尔可夫模型的非特定人孤立词语音训练与识别算法,深入分析了基于Baum-Welch算法的模型训练方法和基于Viterbi解码的识别算法。根据实际应用的需要,研究了实际模型训练中多观察值序列情况下的初始参数设置、训练方法以及需要解决的数据溢出等问题;并以此为依据,提出并设计了一种基于连续隐马尔可夫模型的全音控盲人手机系统。系统采用Baum-Welch模型训练算法,由PC机训练出25条音控指令和0~9等10个数字的语音模型,然后将这些模型传递给DSP平台,从而实现嵌入式的非特定人孤立词语音识别。25条音控指令分别对应不同的控制操作,在识别完成后,系统根据识别结果作出相应处理;当需要进行无线通信时,系统会依据识别结果发送特定的AT命令组合,从而实现相应操作。依据手机菜单操作特点,本文提出了语音指令分级识别方法,充分提高了指令识别准确率;并针对实际应用进行了拒识别设计。针对盲人生理特点,系统设计了语音提示与短信播报等辅助语音功能,将3817个汉字、字母、数字的语音数据存入NandFlash,当需要语音播报时将播报内容的语音数据由DAC输出。最后在不同环境和条件下对系统进行了测试,并提出了改进的方向。

吕涛[2]2009年在《基于DSP的语音识别技术研究与实现》文中研究表明语音识别是近年来一个比较活跃的研究领域,在嵌入式系统中得到了很大的应用,它使得原本需要手工操作的工作,用语音就可以方便地完成。使用语音作为人机交互的途径对于使用者来说是一种很方便、很自然的方式,同时设备的小型化也要求省略以节省体积。本文通过分析语音识别的国内外动态及研究水平,针对目前我国大部分的语音识别产品准确率低、实时性差以及抗噪性弱等缺陷,提出了以高速DSP为平台的改进的语音识别算法。本文实现的语音识别主要由硬件设备和相应的软件算法组成。硬件采用TI公司的高速数字信号处理器芯片TMS320VC5416作为系统的平台,通过麦克风实现语音信号的采集,然后由A/D转换芯片接收,并将采集的信号传送至数字信号处理器的存储器,按照复杂可编程逻辑器件输出的时序进行处理,得到最终的识别结果。论文重点介绍了算法的改进及调试:主要由语音信号的采集、预处理算法、美尔倒谱参数提取、两极端点检测等组成。先将编写的算法在MATLAB环境下进行仿真,然后将算法用C/C++和汇编语言编写移植到DSP开发软件CCS平台上进行调试,最终烧写到DSP,并用VC++编写人机交互界面来实现与DSP的串行通信。提出并采用的改进算法,使系统的适时性能得到了很大的提升,并且在噪杂环境的情况下识别率得到了一定的提升。论文最后对课题的研究作了总结,并根据自己的体会给出了系统设计中几个可能的改进方向。

宫璇[3]2009年在《语音识别在工业机器人上的应用研究》文中提出语音识别技术是一门涉及声学、语音学、语言学、计算机科学、信号处理、人工智能等诸多学科的综合性技术,目前已经被应用在工业、军事以及医疗等部门的指挥、产品检验以及数据录入等人机有声通信领域。长期以来一直是人们研究的热点,但是现有准确率较高的语音识别系统仍存在着耗时、成本高、使用起来不方便等缺点。这些缺点都影响着语音识别的速度、硬件实现和推广应用。尤其应用在噪声环境下智能机器人语音识别技术的研究。作为智能机器人的一种工业机器人的识别技术的研究也越来越受到人们的关注。在工业环境下噪声的加入使得机器人必须有较好的容错力和顽健性,所以本文基于此做了如下的研究:论文首先针对噪声环境下工业机器人语音识别所针对的非特定人、小词汇量、孤立词语音识别要求,分析了传统的利用掩蔽特性进行语音识别的方法特点,然后基于mel频率和bark频率的对应关系对MFCC的提取方法进行了改进,通过对系数做倒谱归一化(CMN)处理,并采用RBF全监督训练和学习方法使机器人的语音识别训练更充分,使新的语音识别系统的鲁棒性增强,并使识别率提升。本文针对工业环境下机器人的语音识别的抗噪性,分析了谱减法和MMSE-LSA的语音增强算法的过程,然后重点分析和研究了经相位还原之后声音信息的时域信号进行频谱分析的语音增强方法的设计和实施过程。并和谱减法与MMSE-LSA的语音增强法进行了比较,进行了数据分析。使工业机器人在噪声环境下提高了识别率。最后由于机器人的多数应用要求实时性。机器人在听懂语声后,还要执行、完成其他一系列动作,即机器人需要处理大量的数据,分配给听觉的时间是非常有限的,因而,提高实时性是机器人听觉的突出问题;所以结合前述信号预处理,特征提取,智能算法,设计了一个低功耗、高可靠性、低成本的ARM+DSP的语音识别系统平台。实现一种自然的人机交互方式,使工业机器人能听懂人的语言,辨明话音内容,将人的语音正确地转化为对应的文本信息,根据语义做出相应的动作。系统分析和比较了与传统方案的优劣,同时对其有关设计的要点和难点做了简要的探讨和分析。

高海英[4]2006年在《基于DSP的机器人语言识别及控制系统设计》文中提出一个完整的迎宾机器人系统需要综合运用多种人工智能技术,其目标是建立起一个“人”的模型,让机器人听懂人的语言就是其中之一。机器人语音识别系统是迎宾机器人头部的重要组成部分,机器人语音识别系统主要是对人的声音进行语音识别并做出判断,然后输出相应的动作指令控制机器人的动作。机器人要能够对非特定人的语音进行识别,当机器人接到语音信号后,对语音进行预处理,端点检测,特征向量提取,再通过对语音库里的特征向量进行模式匹配,输出识别结果。机器人识别的范围由其训练过的语音库决定,特定的语音对应特定的动作。传统的机器人听觉系统一般是以PC机为系统运行平台对机器人进行控制,其特点是用一台计算机作为机器人的信息处理核心通过接口电路对机器人进行控制,处理能力比较强大,语音库比较完备,系统更新以及功能拓展比较容易。缺点是比较笨重,不利于机器人的小型化和复杂条件下进行工作,此外功耗大,成本高。近几年来微型处理器性能的提高促进了机器人的迅速发展,特别是大存储量及高速运算DSP处理芯片的出现使机器人在脱机状态下,独立完成复杂的语音信号处理和动作指令成为可能。论文在硬件上使DSP芯片TMS320VC5509与音频芯片TLV320AIC23相结合作为机器人的语音采集系统,采用DSP作为语音识别处理器,具有较快的处理速度,并采用DSP集成开发环境CCS 3.1完成对DSP芯片的外部接口配置;在软件开发上,论文分析了语音信号的特点,对语音信号进行预处理和端点检测,语音特征向量采用美尔频率倒谱系数(MFCC),模式匹配和训练采用DTW动态规整算法,实现了机器人语音指令的识别。在动作控制上,采用FPGA芯片EP1CT100C8作为机器人头部动作逻辑控制器,使机器人能够根据非特定人的语音命令做出规定的头部动作。DSP的使用使机器人在脱机状态下能够独立快速完成复杂的语音信号处理和动作指令控制,FPGA系统的开发降低了时序控制电路和逻辑电路在PCB板所占的面积,使机器人的“大脑”的语音处理部分微型化,低功耗。一个体积小,低功耗,高速度能完成特定范围语音识别和动作指令的机器人系统的研制具有很大的实际意义。

陈程[5]2008年在《机载环境下的语音识别技术及实现》文中提出语音识别研究的根本目的是研究出一种具有听觉功能的机器,能直接接受人的口述命令并做出相应的正确的反应。近年来信息科学的发展、技术的进步对指挥控制的技术提出了更高的要求,语音识别将是车载、机载、舰载综合电子设备中一项不可缺少的内容,机载语音识别技术的研究对于飞机驾驶员在高速行驶中发出各种必要的控制命令,提高整个作战系统的反应速度,有着重要的意义。在此背景下,本文主要进行特定人特定内容的孤立词语音识别的研究,对语音识别系统的相关算法做了详细的研究。最终以ADI公司的ADSP-21161N为核心设计了基于DSP的语音识别系统,并对系统的硬件电路设计和软件设计进行了详细的介绍。文章主要内容包括以下几个方面:⑴首先介绍了语音识别的研究与发展状况,并简单说明了语音信号处理的基础知识,在此基础上对语音识别的基本理论和主要方法进行了阐述。为进一步的语音识别研究打下了良好的基础。⑵详细分析了语音识别系统的信号处理流程和相关算法。对现有的语音端点检测算法以及常用的语音识别算法进行了详细的分析比较,并通过在Matlab下的仿真对各种算法进行了验证。⑶根据ADSP-21161N的特点和结构,设计了基于DSP的语音识别系统,并对系统的构成和工作过程作了详细的阐述。识别系统由TLV320AIC23进行A/D转换,由FPGA XC2V2000完成对相关芯片的控制以及A/D采样信号的预处理工作,由ADSP-21161N完成相关算法识别语音信号,最后输出识别结果。其整个系统的逻辑接口都是由逻辑接口芯片FPGA来实现的。⑷针对特定人特定内容的孤立词识别系统的特点,选取动态时间规整(DTW)算法进行系统软件设计,论述了系统软件设计的过程。可以在规定词汇范围内将语音识别算法初步实现。⑸在总结全文工作的基础上,对课题目前存在的问题进行了分析,并为进一步研究指明了方向。

梁芳泉[6]2006年在《抗噪语音识别算法的DSP实现》文中认为本研究首先实现了一个以DSP(TMS320VC5409)为主处理器的硬件平台,然后在该平台上实现了50词的小词汇量的语音识别系统。 在本系统中,硬件平台主要包括语音输入输出模块、主处理器模块、存储器模块、异步串口输出模块和电源模块。其中语音输入输出模块实现了语音的输入和输出,采用的芯片为TI公司的TLC320AD50。主处理器模块(TMS320VC5409)主要完成语音识别所需的计算,其性能能够达到实时处理的要求。存储器模块包括一片FLASH和两片SRAM,用512K字的FLASH作为DSP的可编程存储器,两片SRAM分别作为DSP的数据和程序存储器。异步串口实现系统板和PC机之间的通信。电源模块为系统提供5V、3.3V、1.8V、4.1V和-5V的电压。 为了便于程序的设计与调用,采用了模块化的程序设计方法。在编程之前,首先用C语言对每个子模块进行算法仿真。程序整体采用C语言和汇编语言混合方式编程。对于频繁被调用的算法如滤波,采用汇编语言来实现以提高程序运行速度。 系统程序主要包括初始化系统模块和识别算法模块。其中初始化系统模块包括初始化DSP,初始化McBSP(多通道缓冲串口),初始

周春荣[7]2010年在《基于DSP的车载语音识别系统研究与实现》文中研究指明近年,语音识别理论研究、超大规模集成电路技术和计算机技术都得到了快速发展,从而使语音实时信号处理的要求可以得到满足。语音识别技术应用的研究越来越受到人们的关注,现在已经广泛应用到控制、通信和服务等行业。人们最常用和最方便的信息交流工具是语言,人与机器信息交流同样如此,而汽车的越来越普及使其成为了人们最重要和最普遍的交通工具,因此,进行语音识别的研究工作具有实际意义和广阔的应用前景,而将语音识别技术应用到汽车上,形成车载语音识别系统就更具实用意义。论文研究的是基于DSP的车载语音识别系统,主要进行孤立词识别,从而在车上实现用语音命令识别并控制设备运行。本课题进行了语音识别系统设计、算法改进、硬件电路设计和软件编写。首先分析了语音识别技术在国内外的发展现状,阐明了本课题的研究背景和意义。根据语音识别系统的构成模型,介绍了语音识别的基本理论:包括语音信号预处理,语音的端点检测,特征提取(重点分析了LPC倒谱系数和Mel倒谱系数),介绍了语音识别算法DTW和HMM,并做了深入的研究与分析,提出了改进的DTW算法,用移动L型区域法寻找最佳匹配路径。其次分析了TI公司的DSP,并借鉴已有的成熟理论,提出了相应的语音识别系统方案。语音信号通过A/D转换,将转换后的数字信号传送给DSP进行处理和识别,识别结果输出到由CPLD实现的后续控制电路部分,重点设计了语音采集模块、信号处理模块、存储扩展模块、CPLD控制模块、电源模块等。在软件算法上,提出并采用双门限法进行语音端点检测,采用Mel倒谱系数作为语音信号特征矢量。另外,根据孤立词识别算法DTW和HMM的比较结果并考虑本系统的特点,采用改进的DTW识别算法完成语音识别的任务。文中简要研究了系统的开发环境,并在此基础上,完成了程序的设计和调试,验证了算法的可行性,并对程序做了优化设计。最后对全文进行总结,指出了今后工作和待研究的方向。

唐尧[8]2007年在《基于DSP平台的语音识别算法的研究与实现》文中指出自动语音识别系统(简称ASRS)的实用化研究是近十年语音识别研究的一个主要方向,目前在嵌入式系统中的应用主要为语音命令控制,它使得原本需要手工操作的工作用语音就可以方便地完成。使用语音作为人机交互的途径对于使用者来说是最自然的一种方式,同时设备的小型化也要求省略键盘以节省体积。本文论述了一种ASRS由计算机辅助的设计方案,并给出了具体的实现方法。本文采用的识别方法类属于小词汇量孤立词语音识别,主要应用根据文献设计的算法进行语音信号的采集、特征抽取、概率计算、建立数学模型并处理,最终获得识别结果。本文实现的ASRS在功能上主要由硬件设备和相应的算法软件组成。硬件设备构成该系统的硬件平台,通过麦克风实现语音信号的采集,然后由高性能A/D转换芯片接收,并将采集的信号传送至数字信号处理器的存储器,按照复杂可编程逻辑器件输出的时序进行处理,得到最终的识别结果输出。软件部分主要由语音信号的采集算法、预处理算法、前向后向算法、训练算法及维特比算法组成,先将编写的算法在数学运算软件Matlab环境下仿真成功,然后将代码移植到基于TI公司的DSP开发软件CCS平台,实现了硬件仿真。为了满足语音识别在实际应用环境中的抗噪声需要,本文还探讨了基于盲信号分离思想的语噪分离算法,并在Matlab平台下仿真成功。

赵鹏[9]2006年在《基于DSP的连接数码语音识别研究与设计》文中进行了进一步梳理为了克服传统汉语数码语音识别系统抗噪性差、识别率低的特点,本文阐述了一种基于TMS320VC5402定点数字信号处理器(DSP)的连接汉语数码语音识别系统的设计和实践,力争使系统具有实时性、较强抗噪性、较高识别率和非特定人连接数码语音识别的特点。针对传统的“改进谱相减法语音增强”参数设定单一、环境适应能力差的缺点,提出了一种利用模糊理论和“改进的谱相减法”结合的“模糊谱相减法语音增强”;针对语音信号端点检测困难的特点,通过MATLAB仿真试验,给出了能够准确确定数码语音端点的初始和改进参数表;提出了利用基于线性预测编码倒谱参数和差分线性预测编码倒谱参数相结合的离散隐含马尔可夫模型进行第一级识别、利用共振峰参数进行第二级识别的两级汉语数码语音识别系统,在保证系统实时性的同时,实现连接汉语数码语音识别系统识别率的提高;在硬件实现上,详细阐述了基于TMS320VC5402的连接汉语数码语音识别系统各部分硬件设计;在软件开发上,给出了连接汉语数码语音识别的软件设计各部分的流程图,并对各部分进行了MATLAB仿真,并给出了仿真结果。最后,分别建立了数码语音识别仿真系统和连接数码语音训练系统。利用连接数码语音训练系统得到了男女各一套向量量化码本和男女各一套11个数码的非特定人连接数码语音离散隐含马尔可夫参数;基于这些参数,连接数码语音识别仿真系统成功实现了对输入数码语音的识别,并且系统具有较好的抗噪性。

杨东[10]2007年在《基于DSP的语音控制系统研究与设计》文中进行了进一步梳理目前的人机交流主要是手动操作方式实现人机对话,限制了人与计算机系统和机电系统交流的灵活性。为了提高数字化家电系统人机对话灵活性,方便老人、残疾人等特殊人群需要,在人机对话方面需要寻求更好的信息交换手段。因为语言是人类最主要和最基本的交流方式,而且随着数字信号处理软件和硬件的发展,到目前为止语音处理技术日趋成熟,已接近实用化阶段。因此本文根据实际需要提出了一种采用语音作为智能数字化系统的人机交互方式,并设计了一套智能家电的语音控制系统。(1)经过对语音信号的研究,依据对不同信号处理目的和要求,分析并提出语音信息处理的各种方法,实现对语音信号的数字化、前段处理和混合信号盲源分离等处理,并且就各种处理算法进行了仿真实验。(2)重点阐述了系统的硬件构成、技术指标和功能要求,给出了系统的总体结构,研究设计了基于DSP的硬件系统,给出整个系统的硬件电路图,详细说明了系统中MCU模块、数据采集模块、电源管理模块和系统硬件复位模块的组成原理和设计方法。(3)设计开发了系统软件,给出了系统软件总体设计思想,详细说明了语音信号数字化、端点检测和盲分离的软件设计和实现方法。(4)在语音信号处理的基础上设计了语音控制的实现部分,给出了控制操作实现的详细硬件设计和软件设计方法,并解决了控制部分和信号处理部分的接口电路和通信方法。为了验证整体语音控制系统设计中信号处理算法实现的准确性和有效性,最后在CCS软件环境下还就文中软件实现部分,完成了基于仿真器和仿真板的测试。本文提出的语音控制系统的软硬件设计具有通用性,可灵活应用于智能家电之中。

参考文献:

[1]. 基于非特定人语音识别的全音控盲人手机设计[D]. 王璟珣. 湖南大学. 2009

[2]. 基于DSP的语音识别技术研究与实现[D]. 吕涛. 华东交通大学. 2009

[3]. 语音识别在工业机器人上的应用研究[D]. 宫璇. 兰州理工大学. 2009

[4]. 基于DSP的机器人语言识别及控制系统设计[D]. 高海英. 重庆大学. 2006

[5]. 机载环境下的语音识别技术及实现[D]. 陈程. 电子科技大学. 2008

[6]. 抗噪语音识别算法的DSP实现[D]. 梁芳泉. 太原理工大学. 2006

[7]. 基于DSP的车载语音识别系统研究与实现[D]. 周春荣. 重庆大学. 2010

[8]. 基于DSP平台的语音识别算法的研究与实现[D]. 唐尧. 南京航空航天大学. 2007

[9]. 基于DSP的连接数码语音识别研究与设计[D]. 赵鹏. 湖南大学. 2006

[10]. 基于DSP的语音控制系统研究与设计[D]. 杨东. 湖南大学. 2007

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

基于DSP的语音识别在控制系统的应用研究(附录)
下载Doc文档

猜你喜欢