导读:本文包含了小词汇量论文开题报告文献综述及选题提纲参考文献,主要关键词:手语识别,特征手形,卷积神经网络,长短时记忆循环神经网络
小词汇量论文文献综述
李晓旭[1](2017)在《基于神经网络的中小词汇量中国手语识别研究》一文中研究指出手语,作为聋哑人群体的常用语言,在聋哑人与普通人间搭建了一座自由沟通的桥梁。然而,鉴于手语对普通人来说依旧晦涩难懂,两个群体间的交流障碍仍然时常发生。如果能够通过手语识别技术,将手语转换为文字或者语音进行表达,将极大地便利聋哑人与普通人间的交流。同时,作为人机交互领域的一个不可或缺的分支,手语识别研究也在当今这个智能时代显得愈发重要。数据获取与处理、特征的设计以及识别模型的选择是一个高效的手语识别算法所必须考虑的叁个因素。微软的Kinect设备能够方便经济地捕获精确的颜色图像、空间深度映射数据以及关节点坐标,相较于传统的数据手套或者二维摄像头更具优势。因此,本文将以Kinect作为手语数据获取设备,对手语识别中的手语特征设计与识别模型构建进行研究,主要研究内容包括:1.依据手语词汇的手形特点,设计了一种新型的手语特征手形(Specific Hand Shape,SHS)特征。本文通过分析中国手语词汇的手形特点,提出了设计手语特征手形库所需遵守的的6条准则与一种快速构建中国手语特征手形数据库的方法。依靠特征手形数据库,结合卷积神经网络,设计了一种新型的SHS特征。该特征针对手语特征手形的分类正确率达99.59%,而传统的方向梯度直方图特征则只有94.35%,实验结果显示SHS特征对手语手形的表征效果更好。2.依据长短时记忆(Long Short-Term Memory, LSTM)循环神经网络算法,提出一种基于LSTM编码器-解码器结构的孤立词手语识别算法,在80个手语词汇数据集上进行实验,识别准确率达98.67%,优于传统隐马尔科夫模型方法。3.在单向LSTM的基础上,结合手语构词特点,使用双向长短时记忆(Bidirectional Long Short-Term Memory, BLSTM)循环神经网络算法提取手语的上下文信息,研究了一种基于BLSTM编码器-解码器结构的连续词手语识别算法,在由20个手语词组成的句子库上取得了 94.63%的识别率,优于基于单向LSTM结构的方法。(本文来源于《中国科学技术大学》期刊2017-10-08)
张贺,沈天飞,滕秋霞[2](2015)在《小词汇量孤立词语音识别系统多种特征组合参数的选择方法研究》一文中研究指出针对语音识别系统的多种语音特征参数进行了阐述,详细分析了语音特征参数中反映语音特性和说话人特征的美尔倒谱参数(MFCC)、差分美尔倒谱参数(ΔMFCC,Δ2 MFCC)、语音短时能量(Eg)以及语音基音周期参数(Ts)。在不同特征参数阶数下,将多种特征参数进行组合并将组合特征参数分别通过基于矢量量化(VQ)算法的语音识别系统进行验证,实验结果表明,在小词汇量孤立词语音识别系统中,基于MFCC、ΔMFCC、Eg和Ts的组合特征参数既能够较好的反应语音的动静态特性又对不同说话人的语音具有良好的区分度,为语音特征参数的研究提供了重要参考。(本文来源于《电子测量技术》期刊2015年03期)
李昊[3](2015)在《小词汇量语音识别在旅行服务中的应用研究》一文中研究指出随着人们生活水平的不断提高,旅游业在中国蓬勃发展。同时,信息技术的进步让旅行的过程变得更加便捷和丰富。目前,已出现了一些移动应用来帮助人们记录旅行过程,并自动生成游记。本文在对旅行记录类安卓应用进行调研和分析后,针对这类应用通常需要人工输入标注信息的问题,研究使用基于关键字的语音识别技术来代替手动标注,进一步改善用户体验。本文简要介绍了语音识别技术的历史、原理和流程,重点研究了小词汇量语音识别和关键词识别技术及其在Android系统下的实现,论文的主要工作如下:(1)针对旅游应用的特点,本文利用爬虫技术在现有旅游网站上抓取了近4500份游记,经过词语提取和词频排序,最终选择50个词语作为本文语音识别系统的关键词词库。(2)针对智能手机应用场景,本文对现有的语音识别引擎进行了分析和比较,选择了适用于移动终端的开源语音识别引擎——PocketSphinx。在详细研究PocketSphinx的源码、识别原理和工作流程的基础上,本文在Cygwin环境下搭建了PocketSphinx的运行和训练环境,对语言模型和发音字典进行了训练和制作,对语音素材在不同参数环境下的识别性能进行测试,选择了最优参数。(3)设计并实现了具有关键词识别功能的旅游App。该应用利用JNI技术将PocketSphinx编译到Android端,使安卓应用可以调用语音识别接口。此外,本文还针对旅游服务类应用的特点,研究了地图、地理定位、数据库、照相机等技术,借助异步任务、手机传感器、缓存机制对应用进行了进一步的优化,提高了可用性。基于本论文研究成果开发的安卓应用可以通过地图、图片和文字完整地记录旅行过程,并能借助语音识别技术方便地进行关键词的标注。经过了若干用户的使用和测试,系统运行稳定、交互友好,语音识别模块能够识别输入语句中80%以上的关键词,基本可以满足用户在旅行环境中的使用需求。(本文来源于《北京邮电大学》期刊2015-03-07)
熊洋[4](2013)在《基于小词汇量语音识别算法与TTS系统的车联网移动终端研究与实现》一文中研究指出语音人机交互是人机交互工程的一项重要研究内容。目前,中文语音交互技术发展很快,系统应用已经比较成熟,如科大讯飞的移动TTS(Text to Speech文语转换)系统已经投入商用。本文以语音交互系统为研究对象,旨在以构建基于车联网的移动车载语音交互系统为研究目的,通过研究设计实现了系统语音识别及合成模块的相应算法,并分别构建了其对应的系统,实验测试结果良好,可以满足嵌入式移植及车联网环境下的需求。论文介绍了基于小词汇量语音识别算法与TTS系统的车联网移动终端的构建与实现;分析了Android手机平台的系统特性及嵌入式环境下语音交互模式的特点;讨论了基于该具体应用背景下特定的语音识别算法和语音合成算法,分别设计了语音识别模块(含在线模式与离线模式)与语音合成模块;对相应算法做了车联网环境下的适应性改进;在线模式下的语音识别研究:在PC机上利用HTK搭建语音识别系统,以此模拟车联网云计算中心的在线语音识别功能;而离线模式下的语音识别:采用DTW算法,并用C++程序对算法对其进行了编写和修改,在PC机上进行了测试,测评效果良好;语音合成:利用Espeak语音合成开发软件,并在PC机上模拟安卓(Andriod)系统环境,对语音合成系统进行了测试和运行,取得良好的效果;最后对该算法模块的复杂度和实时性进行了分析,最终得到了适合移植到车联网移动环境下的嵌入式语音交互系统的基本构架。本文的创新点在于提出了基于车载嵌入式系统的语音交互系统及其算法,并将车载系统的语音识别分为在线和离线两种模式,并且对相关算法进行了适应性(复杂度和准确度)的分析和优化,使之适合于嵌入式环境的实现。(本文来源于《北京交通大学》期刊2013-09-01)
张悦[5](2013)在《语谱图用于特定人组小词汇量识别算法的研究》一文中研究指出特定人小词汇量的识别是语音识别中常见的一种,但它在车载语音方面的应用有很多,其主要应用之一是控制小车的基本动作。它的优点在于能够提高车载语音系统对说话人语音信号响应的准确度以及响应速率。本文在简单介绍了常用的语音识别的算法基础上,提出了一种基于语谱图的特定人组小词汇量识别的算法。该算法未采用以往语音识别算法对语音信号的逐帧识别,而是利用语谱图的整体特性逐字逐词进行语音识别,能够突显语音信号的整体时频特性,将图像处理技术应用到语音识别领域。本文研究的算法主要是用MATLAB7.1软件编程和仿真完成的。首先将在实验室录制好的语音信号经过语音预处理后,分别转换成傅里叶语谱图,利用形态学图像处理技术对语谱图进行平滑、归一化、二值化等预处理;再根据语音信号在语谱图中显示的特点,利用改进后的图像进行行互相关算法,即对语谱图做行互相关运算,求出行互相关的最大系数作为语谱图的第一个特征参数,同时对语谱图中显示的亮纹特征(即共振峰)统计其个数,将它作为语谱图的第二个特征参数;然后采用支持向量机(SVM)网络分类算法对上面所得的数据进行预测分析,从而得出特定人组小词汇量的识别率。本文主要对车载语音识别系统的汉语语音控制命令进行语音识别。(本文来源于《东北师范大学》期刊2013-05-01)
赵彦敏,张妍,赵宇杰[6](2012)在《小词汇量非特定人的语音识别系统》一文中研究指出设计了一种基于连续概率密度隐含马尔科夫模型的汉语语音识别系统。在实时录音的情况下,利用该语音识别系统,不同的人对10条2~4个字的语音命令进行识别,准确率可达到90%,识别时间1.5~3s。(本文来源于《无线互联科技》期刊2012年10期)
周卓然[7](2012)在《小词汇量非特定人语音识别系统的研究》一文中研究指出语音识别是指使计算机能够“听懂”人类的语言,并且理解语言的内容执行特定的命令或任务。作为人机交互技术的基础,其最终目的是实现人与机器的自然交流。语音识别应用的领域非常广泛,其中,非特定人、小词汇量语音识别系统是语音识别应用领域中的一个重要分支。本文主要针对非特定人、小词汇量的语音识别识别系统进行了深入研究,并在此基础上编写非特定人小词汇量语音识别软件,主要工作如下:(1)通过分析传统端点检测算法的缺点提出了一种改进型端点检测算法——自适应双门限语音端点检测算法,仿真表明该算法具有更好的性能;分析语音识别中叁种不同的特征参数:线性预测倒谱系数(LPCC)和美尔频率倒谱系数(MFCC)以及功率归一化倒谱系数(PNCC)。(2介绍了目前叁种主流的语音识别算法:动态时间规整(DTW)、隐马尔科夫模型(HMM)和支持向量机(SVM),分析了它们的原理、特点及实现过程,以及目前主流语音识别算法的局限性和不足。使用DTW算法和HMM算法,构建了两个小型语音识别系统,通过实验分析了如何选取HMM模型的参数并比较了DTW算法和HMM算法的适用范围。(3)分析了基于统计学习理论的语音识别算法——支持向量机算法,对该算法的基本原理以及使用该算法实现语音识别的流程进行了介绍,对支持向量机(SVM)的不同核函数进行分析,选用了RBF核函数,并实验分析了核函数参数及惩罚因子对语音识别的影响。(4)对于如何选取核函数参数及惩罚因子,传统的方法都是通过反复实验比对以及根据人为经验选择,此方法并不科学,由于对识别效果影响重大,因此本文进行了初步的研究,提出使用粒子群算法优化支持向量机参数算法,即PSO—SVM算法。使用MATLAB的GUIDE,用GUI的形式实现了基于PSO—SVM的语音识别系统,通过实验验证了该算法的有效性,在系统样本有限的情况下,该系统比HMM算法和未使用优化算法的SVM算法语音识别率要有所提高。(5)考虑到硬件条件和算法特点,选取DTW算法作为硬件语音识别算法。实现了以SPCE061A单片机为核心的小型嵌入式语音识别系统,介绍了硬件组成及软件部分,通过测试,证明测试结果较理想。(本文来源于《重庆大学》期刊2012-05-01)
舒琦[8](2012)在《小词汇量的孤立词语音识别方法研究》一文中研究指出计算机在人类生活中扮演的角色越来越重要,人类期望与计算机的交流不再仅仅只是依靠键盘输入,而希望能够用更加直接快速的方式与之进行交流,让计算机能够听懂人类的自然语音。语音识别就是在人类的这种期许之下才渐渐发展起来的,这是一门涉及多学科的新兴科学,具有广泛的应用前景。随着计算机处理能力和语音处理技术的迅速提高,语音识别技术也得到了飞速的发展,相关的研究成果层出不穷。越来越多的涉及语音识别技术的产品走进了人类生活的方方面面,许多智能家居产品中都有语音识别的功能模块,这些都为人类的生活提供了便捷。本论文回顾了语音识别技术的发展历史,并对研究现状也做了分析,详细研究了语音识别的基本原理与处理流程。分析了语音信号预处理的过程,如预加重,分帧加窗,端点检测等,并对预处理过程当中的端点检测做了详细的研究,运用双门限端点检测的方法检测出了实验语音的起始端点与结束端点。对于语音信号的特征提取过程,分析了语音的LPC、LPCC、MFCC特征参数提取的方法,通过实验对比分析,发现结合一阶差分及倒谱提升后的MFCC参数较其它特征参数,在识别率及抗噪声性能方面都具备一定的优势,可作为语音识别的特征参数。在对语音识别方法的研究中,首先对DTW算法的原理进行了分析,并对其进行了仿真实验,然后提出了一种改进的DTW算法,该算法相比传统的DTW算法,缩小了匹配区域,实验结果表明改进后的算法在不影响语音识别系统的识别率的情况下,可以显着的提高系统的识别速度,对于提高语音识别系统的实时性起到了积极的作用。最后设计了一个基于DTW的特定人孤立词语音识别系统,该系统集成了录音、信号观测、预处理、参数分析、特定人的孤立字语音识别等功能,并对此系统的识别率,实时性进行了测试,系统对0到9十个数字字符的识别取得了很好的识别效果,证明了此系统在识别率及实时性方面有着较好的表现,此外针对系统对于特定人与非特定人时的表现也做了对比分析,结果表明此系统对于特定人的语音识别具有更好的效果。(本文来源于《武汉理工大学》期刊2012-05-01)
马丽静,李红[9](2012)在《汉语小词汇量表语音识别算法的研究和应用》一文中研究指出论文研究了汉语小词汇表语音识别算法的基本原理,提出了具有鲁棒性的两级端点检测语音识别技术,在语音信号采集时,根据过零率、短时能量对数据进行提取并压缩,采用了多模板匹配算法识别。硬件采用51内核单片机,用较少的存储空间和计算空间实现语音数据处理,不需要额外的器件。实验用20个字的汉语小词汇量系统进行了测试,识别成功率大于90%,显示该算法比通常采用的算法性能更好。(本文来源于《电子技术》期刊2012年02期)
童强,黄剑,王永骥[10](2011)在《浴室噪声环境下小词汇量语音识别系统研究》一文中研究指出根据实际应用的需求,设计了一种在浴室噪声环境中的小词汇量的语音识别系统.针对特定的浴室噪声进行分析,引入一种语音增强算法来降低噪声对识别的影响.使用基于人耳听力模型的mel频率倒谱特征参数作为语音特征参数,并结合其一阶差分参数描述语音信号特征的动态特性.针对小词汇量的实际应用需求,选用基于动态时间规整的模板匹配方法来识别.该方法可以用于其他相似的噪声环境中,通过实验验证了该方法的可行性.(本文来源于《华中科技大学学报(自然科学版)》期刊2011年S2期)
小词汇量论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
针对语音识别系统的多种语音特征参数进行了阐述,详细分析了语音特征参数中反映语音特性和说话人特征的美尔倒谱参数(MFCC)、差分美尔倒谱参数(ΔMFCC,Δ2 MFCC)、语音短时能量(Eg)以及语音基音周期参数(Ts)。在不同特征参数阶数下,将多种特征参数进行组合并将组合特征参数分别通过基于矢量量化(VQ)算法的语音识别系统进行验证,实验结果表明,在小词汇量孤立词语音识别系统中,基于MFCC、ΔMFCC、Eg和Ts的组合特征参数既能够较好的反应语音的动静态特性又对不同说话人的语音具有良好的区分度,为语音特征参数的研究提供了重要参考。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
小词汇量论文参考文献
[1].李晓旭.基于神经网络的中小词汇量中国手语识别研究[D].中国科学技术大学.2017
[2].张贺,沈天飞,滕秋霞.小词汇量孤立词语音识别系统多种特征组合参数的选择方法研究[J].电子测量技术.2015
[3].李昊.小词汇量语音识别在旅行服务中的应用研究[D].北京邮电大学.2015
[4].熊洋.基于小词汇量语音识别算法与TTS系统的车联网移动终端研究与实现[D].北京交通大学.2013
[5].张悦.语谱图用于特定人组小词汇量识别算法的研究[D].东北师范大学.2013
[6].赵彦敏,张妍,赵宇杰.小词汇量非特定人的语音识别系统[J].无线互联科技.2012
[7].周卓然.小词汇量非特定人语音识别系统的研究[D].重庆大学.2012
[8].舒琦.小词汇量的孤立词语音识别方法研究[D].武汉理工大学.2012
[9].马丽静,李红.汉语小词汇量表语音识别算法的研究和应用[J].电子技术.2012
[10].童强,黄剑,王永骥.浴室噪声环境下小词汇量语音识别系统研究[J].华中科技大学学报(自然科学版).2011
标签:手语识别; 特征手形; 卷积神经网络; 长短时记忆循环神经网络;