说话者身份识别论文-桑静

说话者身份识别论文-桑静

导读:本文包含了说话者身份识别论文开题报告文献综述及选题提纲参考文献,主要关键词:远程语音通信,指纹识别,身份追踪,正交频分复用(OFDM)

说话者身份识别论文文献综述

桑静[1](2018)在《远程语音通信中说话人身份识别与追踪研究》一文中研究指出第四代移动通信技术(4G)的广泛应用以及即将到来的第五代移动通信技术(5G),使得人们的生活更加信息化、智能化,在享受大数据互联网带来的福利的同时,也需要考虑到大数据安全性问题。为了解决大数据网络安全中的信息泄漏以及出现的信息电话诈骗等问题,本文提出将语音信息隐藏技术应用在4G无线移动通信技术中来解决因信息泄漏引起的电信诈骗事件。因此,远程语音通信中说话人身份追踪技术受到人们的广泛关注。本文针对远程语音通信中说话人身份追踪进行研究,主要工作如下:1.提出了一种基于细节特征和不变矩的指纹识别算法。首先利用短时傅立叶变换(Short-time Fourier Transform,STFT)对指纹图像进行增强处理,并对增强后的指纹图像进行形态学处理得到细化图像。随后选取细化图像中的细节特征点,并以细节特征点为中心选取感兴趣区域(Region of Interest,ROI),计算其不变矩。最后利用不变矩值之间的余弦相似度作为指纹识别相似度的判断依据。实验结果表明,该算法具有较高的匹配率,指纹匹配准确率可以达到96.67%。此外,将ROI的不变矩代替指纹原图像,避免指纹信息的泄漏,从而提高了指纹的安全性。2.设计了一种远程语音通信中说话人身份追踪方案。该方案结合4G无线通信中正交频分复用(orthogonal frequency division multiplexing,OFDM)核心技术,将说话人指纹特征作为说话人身份识别标识嵌入到语音中,在接收端得到含有说话人身份特征的语音后,将其特征进行提取后,并与数据库中进行比对。在保护个人隐私安全和防止电信诈骗应用中,本方案具有在远程语音中追溯说话人身份,从而达到追踪诈骗分子身份的目的。实验结果表明,本方案在高信噪比下,对说话人身份特征的提取更加准确且可以有效地对抗诈骗方使用变声器或者匿名来电显示身份隐藏。(本文来源于《西南交通大学》期刊2018-04-23)

王欢[2](2015)在《基于FPGA的说话人身份识别系统设计》一文中研究指出身份认证在我们现在生活的信息时代中无处不在,然而我们使用的传统的身份认证存在携带不便、容易遗失、容易损坏、密码易被破解等诸多问题。而基于声纹识别的说话人身份认证技术中,包含声纹特征的语音信息获取方便、自然,认证过程侵入性小,认证成本低廉,适合远程身份认证等优点,使得说话人身份识别技术将具有重要的科研价值和相当大的社会应用价值。现在的声纹识别系统主要是通过软件来实现的,其运算速度比较慢、可靠性差,SOPC(片上可编程系统)是一种基于FPGA(现场可编程门阵列)的软硬件复合系统,其可靠性好、运算快速、方便升级和成本低廉等优势,使基于FPGA的SOPC技术成为说话人身份识别系统的更佳实现方式。本设计是针对黑龙江省某地区人社局每年要对领取养老金的退休人员进行身份进行认证的项目进行的研究,本地区有数十万的已退休人员,每年都要对领取养老金的人员进行一次身份确认,防止当事人已经过世,但其亲属隐瞒不报继续领取养老金的问题,但是很多老人由于年龄过高、身患疾病或是在比较远的沿海地区养老等原因,确实每年亲自来人社局进行身份确认非常不便,为此当地人社局提出基于说话人识别的身份认证这个项目。通过对说话人声纹特征参数和模式匹配方式的国内外研究现状的调研,分析相应的识别率和FPGA可实现性,特征参数选择了MFCC(梅尔频率倒频谱系数),模式匹配方式选择了DTW(动态时间规整)方法,硬件平台选择了Altera公司的DE2开发平台。本文的主要工作有对基于MFCC特征参数和DTW识别模式的系统算法进行改进,并通过MATLAB进行算法仿真验证;在EP2C35芯片中对说话人的语音信号进行了预处理、MFCC特征提取、声纹库的建立和模式匹配四个模块的FPGA设计,完成说话人的身份认证系统实现;对系统进行集成,并进行下载、调试和验证分析。以10个人为样本对系统的功能实现进行试验,系统的平均识别率为91.67%,平均识别时间为3ms,系统的运行频率为57MHz,FPGA芯片的资源利用率为74.6%,系统达到了认证方便、侵入性小、成本低廉、识别率高、识别速度快和稳定性好等效果。综上所述,基于FPGA的说话人身份识别系统在社保、通信、银行、公安以及国防等领域都将有着广阔的应用前景。(本文来源于《齐齐哈尔大学》期刊2015-04-17)

李耀成,陶佰睿,王小碧,张桂香,刘英男[3](2015)在《基于B-S模式说话人声纹身份识别管理系统》一文中研究指出针对社会保险领域存在的待认证人数量庞大、所处地域分散遥远等情况,基于B/S(浏览器/服务器)模式构建说话人声纹识别管理系统来实现远程说话人身份识别。该系统以My Eclipse作为开发工具,采用My SQL数据库和Java语言开发平台,利用Tomcat6.0设计服务器。管理页面开发运用了CSS样式,JSP等脚本语言并通过Servlet技术进行用户和声纹信息的管理。研究内容对声纹识别技术的推广应用具有重要意义。(本文来源于《齐齐哈尔大学学报(自然科学版)》期刊2015年01期)

张海燕[4](2012)在《基于唇动的说话人身份识别研究》一文中研究指出生物识别技术不论是在国防、军事安全,还是在民用身份认证中都有较快的发展,特别是基于动态唇形的身份识别,因其受制约因素少、实现相对容易、可满足实时识别的需求等特点而受到广泛重视。论文针对现有唇形识别研究中大多基于单个静态图像,未能充分利用唇部变化特征的局限性,以及特征提取中需处理的信息量较大、识别率不高等缺陷,设计并构建了一个基于唇动的说话人身份识别系统,并对该系统进行了较为深入的研究,主要的研究工作和成果体现在以下几个方面:(1)在研究和分析身份识别的一般原理及技术的基础上,构造了一种基于唇动的说话人身份识别系统,设计了系统的体系结构,系统包括视频信息预处理、唇部特征信息提取和待测说话人身份识别叁个部分。(2)在唇部特征信息提取阶段,设计了唇部的静态特征和动态特征相融合的特征表示模式,构造了唇部特征信息的提取模型,对模型中的特征点选择、特征边连接、特征点自动标记和关键帧选择、静态特征提取以及动态特征提取等过程进行了详细的设计,并给出了其具体处理算法。(3)在说话人身份识别阶段,设计并构造了普适音素模型,以此为基础设计出待测说话人特征音素模型,最后构造给出完整的基于唇动的身份识别模型,对模型中的普适音素提取、特征音素提取以及说话人身份识别等关键处理环节的算法进行了详细设计。(4)通过仿真实验对唇部特征信息提取算法的可行性、有效性进行了验证,对说话人身份识别算法的性能进行了对比分析,仿真实验结果表明本文设计的基于唇动的说话人身份识别算法可较好解决身份识别中特征信息量大、信息冗余度高等问题,同时能够提高身份识别的效率。(本文来源于《兰州大学》期刊2012-04-01)

方晓[5](2011)在《一种基于BP神经网络的说话人身份识别系统设计及嵌入式实现》一文中研究指出说话人身份识别是根据说话人的语音来识别身份的一种生物认证技术。目前,应用于说话人识别的技术大多是基于线性系统理论的,但是说话人识别过程本身却是一个复杂的非线性过程,而人工神经网络恰恰是一种基于非线性理论的分布式并行处理网络模型,具有很强的模式分类能力及对不完全信息的鲁棒性,所以利用神经网络作为分类器进行说话人识别是一种必然趋势,它为说话人识别技术提供了一种独特的方法和思想。针对说话人识别的具体流程,本文首先详细介绍了与其相关的语音信号预处理、端点检测和特征参数提取技术,建立起使用BP神经网络作为分类器的说话人识别系统;然后针对BP神经网络收敛速度慢和易于陷入极小值的问题,在粒子群优化算法中引入混沌思想,提出一种混沌粒子群优化算法,用来改善粒子群优化算法摆脱局部极值点的能力,并将其运用到BP网络训练中,提高了BP网络的计算精度和收敛速度;再将用该方法训练的BP网络用于说话人身份识别中,其识别率和训练速度都得到了较大提高,使得基于BP神经网络的说话人识别取得了更好的效果。此外,在以上研究基础上,本文选用ARM和Linux构建了嵌入式平台,完成引导程序,对Linux内核进行移植裁剪,建立根文件系统,并成功将说话人识别程序移植到嵌入式系统中。(本文来源于《西安电子科技大学》期刊2011-01-01)

杨毅明,陈东华[6](2009)在《一种实时说话人身份识别系统的设计》一文中研究指出设计一种以TM S320VC5402为核心,外围扩展语音编解码器、程序存储器、语音存储器等集成电路,基于定点数字信号处理器的实时说话人身份识别的系统.通过为每个语音命令设置3个模板的预留空间,使每个语音命令可以有3个模板参与识别,避免说话人语气和语调的变化产生的影响.在比较嘈杂的环境下,系统的正确识别率超过87%.处理器VC5402从识别中断并响应中断到CPU进入中断服务程序的第1条指令,需要20个时钟周期,系统的平均处理时间小于0.2 s.(本文来源于《华侨大学学报(自然科学版)》期刊2009年05期)

洪家高[7](2009)在《说话人身份识别系统的设计及DSP实现》一文中研究指出说话人识别属于生物识别的一种,是一项根据语音波形中反映说话人生理和行为特征的语音参数来自动识别说话人身份的技术。在生物识别技术领域中,说话人识别技术以其独特的方便性、经济性和准确性等优势受到人们的关注。近年来随着DSP技术的迅猛发展及其性能的不断改善,用DSP来做语音实时处理也越来越受到人们的重视。基于DSP的说话人识别系统具有精度高、速度快、体积小、操作简单、成本低等特点。可广泛的用于司法、公安、机场、办公室等场所,具有非常广阔的应用前景。本文概述了说话人识别技术的概况及特征提取、模式识别等说话人识别的主要技术理论。详细地分析基音频率、线性预测系数、美尔倒谱系数等特征提取的理论和方法以及动态时间规整、矢量量化、隐马可夫模型、高斯混合模型等模式匹配算法的原理及过程。在此基础上,论文针对实际应用进行DSP嵌入式说话人识别系统的设计,并研究如何提高系统的可靠性、识别率、减少识别时间并实现系统的自举运行。系统在TMS320C6713 DSK上实现,采用美尔倒谱系数作为特征参数,以高斯混合模型作为识别模型。为了实现自举运行,模型参数存储在FLASHROM存储器中,以保证参数在掉电情况下不会丢失。系统充分的体现了人性化特点,设置了训练和识别的选择功能,并可进行说话人删除、补充、替换和更新工作;系统运行过程中,由DSP实验板自带的LED灯组合来显示系统的运行状态及最终的运行结果。考虑到识别时间、识别准确率,系统稳定性的要求并结合TMS320C6713 DSK开发板的性能和特点,系统的识别范围选定为10个人。经过测试,识别的速度可达3秒之内,准确率达98%以上。与其他系统相比,本系统在实现方法上加以一定的改进,保证了识别的准确率和系统的稳定性;减少了识别时间;实现了系统的自举运行;同时充分的体现出了系统可操作性,具有更大的实用价值。(本文来源于《苏州大学》期刊2009-05-01)

唐电弟[8](2007)在《从法律语言学角度看言语与说话者身份识别》一文中研究指出语言与社会是不可分的两个方面,语言随着社会的发展不断进步。反之,社会的发展与语言的发展是相辅相成的。语言作为人类区别于其它动物的一个重要特性,在人类社会中起着重要的作用。随着人类社会的不断进步与发展,人类对语言的研究不断深入,语言学的分类更为细致。作为一个社会的人,可以按照其年龄、性别、籍贯、职业、爱好、信仰等等而从属于各种不同角度的社会分类,适应于这些不同的社会集团,他的语言也就会产生不同的变异。说话人因社会属性、社会经历、社会地位、职业职务、文化修养、宗教信仰、情趣爱好,以及年龄、性别、风俗习惯、地域等不同在语言运用上就有差异。据说有一次人们给古希腊哲学家苏格拉底引来一个人,希望他发表对这个人的看法。苏格拉底说只要这个人说话,我就可以发表对他的看法。因为每个人的性格、脾气、职业、年龄等等是往往可以从其言语中看出来的。我们可以说,社会各学科的发展与语言是密不可分的。社会的发展,经济的繁荣,人类的进步,等等都与语言这一媒介有着重要的关联。语言学的研究在F.de Saussure之后特别专注于纯语言学,或者说是内部语言学的研究,希望能得出一个统一的语言理论。这些不顾语言的上下文关联、适当性、及结构而言的理论一直就受到各方的指责。到目前为止,还没有一种语言理论可以得到一致的认可。F.de Saussure曾向第叁度讲课的听者提过,外部语言学是一个重要的研究领域,它在语言学的研究中占有一个光荣的地位(F. de Saussure 2003: F51)。对于外部语言学,或者说对社会语言学的研究,取得了很大的成绩。现在更多的语言学家开始认识到除了研究语言教学之外,还应把语言研究与社会各学科相结合。法律语言学是社会语言学的一个研究方面,是语言学研究与法律结合的一个学科,具有极大的社会实际意义。法律语言学研究的范围,就如Levis (1994)就指出的,涉及到法律的方方面面,诸如声纹鉴定、陪审团语言含糊性、书信作者识别、法庭语言权力不对称性、证言的真伪、律师与辩护人的沟通问题、庭审翻译问题、商标侵权、警示的明确性、作为证据录音的性质等等。近年来的研究,尤其是国外的法律语言学研究取得了广泛的成果,并应用于社会的实际生活中。在语言学研究与法律相结合方面,特别是言语研究与罪犯识别这一方面的研究在近几十年里有了长足的进展。由于言语往往能提示讲话者的线索,这一点给我们提供了一个提示,那就是通过研究罪犯留下的言语线索,分析出罪犯的社会背景,个人特征,地域归属,言语特征等方面,就能缩小查找范围,节省了破案时间,经济支出,提高破案速度,为社会的长治久安提供保障。在对本文进行着手研究的过程中,发现对罪犯留下的言语线索的研究往往主要着重于声纹鉴定方面。而言语中许多能提示罪犯线索的研究成果在对罪犯的侦查与讯问中尚未得到充分利用。如除了声纹外,说话人的用词、说话的句式、语调、说话人的方言等等都能够给我们提示说话人的个人属性与社会属性,所处的社会阶层,所从事的行业等背景材料。论文除了对当前法律语言学界主要研究做一般的介绍之外,更着重于分析综合当前语言研究中能揭示说话者地域来源、社会背景、年龄、性别、种族背景等的各种言语特征。第一部分对语言研究中能提示说话者身份的语音、词汇、句法、各种语言、语言地图、文学作品中的个人或区域语言特征等进行论述。第二部分着重研究言语与地域、言语与性别、言语与年龄、言语与社会阶层的关系。第叁部分将对目前最常用的声纹鉴定做一个简要的描述,并阐述在社会罪犯侦查与讯问、社会实际生活等方面中的言语研究应用实例。希望通过本研究,各种语言研究成果能在法律案件的说话者身份识辨研究中得到充分利用以加速法律案件的破解。同时随着言语研究的深入,其研究成果还必将运用于保障人民财产、国防、打击恐怖活动等方面。尤如F. de Saussure所言,言语研究有着“显着的”的地位,是“重要的”、“富有成果的”;是“任一研究语言的学者都要关注的”(F. de Saussure 2003: P21-2)。这些都表明言语研究有着广阔的研究前景及社会实用价值。同时呼吁相关部门在对罪犯的侦查与讯问中充分利用言语信息所提供的有用线索。(本文来源于《广西师范大学》期刊2007-03-25)

勾轶,刘晓丽,陈长征[9](2005)在《基于小波与神经网络的说话人身份识别》一文中研究指出将小波变换和神经网络结合起来应用于说话人身份识别.通过小波变换提取语音信号的基音周期序列不仅体现了人发声时的生理特点,同时还包含了个人说话习惯等后天形成的特征.所以它能有效地反映说话人的语音特点.应用人工神经网络对基音周期序列进行识别分类以确定说话人身份.实验证明应用人工神经网络进行特征识别直接输出代表说话人身份的二进制编码,可以省去与库中所有数据进行匹配的繁琐操作,同时又能保证较高的正确率.(本文来源于《沈阳工业大学学报》期刊2005年01期)

黄金明[10](2004)在《说话人身份识别系统的设计与实现》一文中研究指出说话人身份识别是生物识别技术的一种,属于模式识别的范畴。说话人识别的目的是根据语音信息识别说话人身份。从技术上主要 是从说话人语音信息中提取反映说话人的生理和行为特征的语音参数,并根据这些语音参数自动识别说话人的身份。该文分析了常见的说话 人识别方法,并以此为基础实现了一种说话人身份识别系统设计。(本文来源于《计算机工程》期刊2004年S1期)

说话者身份识别论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

身份认证在我们现在生活的信息时代中无处不在,然而我们使用的传统的身份认证存在携带不便、容易遗失、容易损坏、密码易被破解等诸多问题。而基于声纹识别的说话人身份认证技术中,包含声纹特征的语音信息获取方便、自然,认证过程侵入性小,认证成本低廉,适合远程身份认证等优点,使得说话人身份识别技术将具有重要的科研价值和相当大的社会应用价值。现在的声纹识别系统主要是通过软件来实现的,其运算速度比较慢、可靠性差,SOPC(片上可编程系统)是一种基于FPGA(现场可编程门阵列)的软硬件复合系统,其可靠性好、运算快速、方便升级和成本低廉等优势,使基于FPGA的SOPC技术成为说话人身份识别系统的更佳实现方式。本设计是针对黑龙江省某地区人社局每年要对领取养老金的退休人员进行身份进行认证的项目进行的研究,本地区有数十万的已退休人员,每年都要对领取养老金的人员进行一次身份确认,防止当事人已经过世,但其亲属隐瞒不报继续领取养老金的问题,但是很多老人由于年龄过高、身患疾病或是在比较远的沿海地区养老等原因,确实每年亲自来人社局进行身份确认非常不便,为此当地人社局提出基于说话人识别的身份认证这个项目。通过对说话人声纹特征参数和模式匹配方式的国内外研究现状的调研,分析相应的识别率和FPGA可实现性,特征参数选择了MFCC(梅尔频率倒频谱系数),模式匹配方式选择了DTW(动态时间规整)方法,硬件平台选择了Altera公司的DE2开发平台。本文的主要工作有对基于MFCC特征参数和DTW识别模式的系统算法进行改进,并通过MATLAB进行算法仿真验证;在EP2C35芯片中对说话人的语音信号进行了预处理、MFCC特征提取、声纹库的建立和模式匹配四个模块的FPGA设计,完成说话人的身份认证系统实现;对系统进行集成,并进行下载、调试和验证分析。以10个人为样本对系统的功能实现进行试验,系统的平均识别率为91.67%,平均识别时间为3ms,系统的运行频率为57MHz,FPGA芯片的资源利用率为74.6%,系统达到了认证方便、侵入性小、成本低廉、识别率高、识别速度快和稳定性好等效果。综上所述,基于FPGA的说话人身份识别系统在社保、通信、银行、公安以及国防等领域都将有着广阔的应用前景。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

说话者身份识别论文参考文献

[1].桑静.远程语音通信中说话人身份识别与追踪研究[D].西南交通大学.2018

[2].王欢.基于FPGA的说话人身份识别系统设计[D].齐齐哈尔大学.2015

[3].李耀成,陶佰睿,王小碧,张桂香,刘英男.基于B-S模式说话人声纹身份识别管理系统[J].齐齐哈尔大学学报(自然科学版).2015

[4].张海燕.基于唇动的说话人身份识别研究[D].兰州大学.2012

[5].方晓.一种基于BP神经网络的说话人身份识别系统设计及嵌入式实现[D].西安电子科技大学.2011

[6].杨毅明,陈东华.一种实时说话人身份识别系统的设计[J].华侨大学学报(自然科学版).2009

[7].洪家高.说话人身份识别系统的设计及DSP实现[D].苏州大学.2009

[8].唐电弟.从法律语言学角度看言语与说话者身份识别[D].广西师范大学.2007

[9].勾轶,刘晓丽,陈长征.基于小波与神经网络的说话人身份识别[J].沈阳工业大学学报.2005

[10].黄金明.说话人身份识别系统的设计与实现[J].计算机工程.2004

标签:;  ;  ;  ;  

说话者身份识别论文-桑静
下载Doc文档

猜你喜欢