导读:本文包含了语音数据库论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:语音,情感,数据库,汉语,声学,英语,东乡。
语音数据库论文文献综述
侯云红[1](2018)在《现代维吾尔语情感对话语音数据库的设计研究》一文中研究指出在世界学术领域,语音的情感研究处于摸索阶段,建立研究者认可的高质量情感语音数据库是亟待解决的问题。文章通过设计合格语料,建立现代维吾尔语情感语音数据库。以高兴、生气、恐惧、中性和悲伤为基本情感,收录男女声情感对话的语音文件、声学特征文件和标注维吾尔语韵律等语音标注文件。对该数据库进行主观评价的结果表明:语音情感状态自然,能够满足语音情感识别的需求。数据库提供的不同情感状态下维吾尔语韵律特征与声学特征数据,可以供情感语音识别研究、情感合成研究和说话人识别研究。(本文来源于《语言与翻译》期刊2018年04期)
陈颖,肖仲喆[2](2018)在《离散标签与维度空间结合的语音数据库设计》一文中研究指出建立了一个将离散情感标签与维度情感空间结合起来的汉语情感语音数据库。该数据库由16名母语为汉语的说话人对情感语音进行表演型录制。语音样本是根据中性、愉悦、高兴、沮丧、愤怒、哀伤,以及悲伤等七种离散的情感标签采集而得,每名说话人有336条语音样本。随后由叁名标注人在维度空间上对每条语音样本进行标注。最后,根据标注所得的数据来研究这七种情感在维度空间的分布情况,并分析了情感在一致性、集中性和差异性方面的性能。除此以外,还计算了这七种情感的情感识别率。结果显示,叁名标注人对该数据库标注的一致性都达到了80%以上,情感之间的可区分度较高,并且七种情感的情感识别率均高于基线水平。因此,该数据库具有较好的情感质量,能够为离散情感标签到维度情感空间的转化提供重要的研究依据。(本文来源于《声学技术》期刊2018年04期)
任国凤,张雪英,李东,闫建政[3](2018)在《普通话双模态情感语音数据库的设计与评价》一文中研究指出针对包含发音动作参数和情感语音的双模态汉语普通话数据库非常匮乏的问题,设计包含中性、高兴、愤怒及悲伤4种情感的普通话语音库。该语音库由10名被试录制的1 440段音频及发音动作数据组成,文本长度有双音节词和句子两种类型。为了确保该数据库的有效性,邀请普通话较好、听力正常的10名评价者组成评价小组,对数据库内所有音频文件进行评价。根据评价小组评价结果结合发音动作数据的稳定性进行筛选,得到语音质量较好、发音动作参数稳定的双模态情感语音数据库。该数据库可用于开展情感语音的发音动作研究,进而单独或联合作为情感语音识别算法的样本数据,对情感语音识别率的提高具有积极的作用。(本文来源于《现代电子技术》期刊2018年14期)
魏可晗,裴正薇[4](2018)在《英语语音测试手段与评估方式——基于SSCI和CSSCI数据库实证研究文献(2010—2016)的述评》一文中研究指出对2010—2016年间SSCI和CSSCI两大数据库中检索到的关于英语语音测试与评估的实证研究文献36篇进行述评,发现国内语音研究在测试手段上较为单一,国外研究所用的测试手段相对多样化,国内外研究者对语音质量评估采取了不同的方式。研究旨在推进二语语音习得领域的研究进展,为我国英语语音教学实践提供参考和借鉴。(本文来源于《重庆交通大学学报(社会科学版)》期刊2018年02期)
郝俊慧[5](2018)在《英语流利说:听懂每个中国人的英语》一文中研究指出“上市的时候,我们应该还会在这里。”出电梯前,王翌留了一句意味深长的话。1月22日,国内“AI+教育”公司流利说将新办公地址迁至上海杨浦区的长阳创谷,近百年前,这里曾经是上海着名的“东华纱厂”,如今,老厂房焕发出新生命,变身为杨浦区重点打造的众创空间。2(本文来源于《IT时报》期刊2018-01-26)
许彬彬,洪青阳,李柏翰,郑大伟,李琳[6](2017)在《基于闽南方言语音识别技术的数据库设计与标注》一文中研究指出针对闽南方言语音识别软件的开发,我们需要对闽南方言有声数据库和文本数据库进行设计和建制,为该软件前期训练声学模型和语义模型提供足够的支撑。采用先进的录音设备和录音技术进行有效采样,结合田野语言学、实验语音学的文本转写和标注方案将自然语音数据进行转写和标注。该设计目标为提高语音识别软件识别非特定人声的精准度。数据库的建制也适用于语言、信息科学研究及应用。(本文来源于《第十四届全国人机语音通讯学术会议(NCMMSC’2017)论文集》期刊2017-10-11)
鲁茸江才[7](2016)在《藏汉双语多模态生理语音数据库的建立和语音特征分析》一文中研究指出随着近几年藏文信息处理技术的迅速发展,藏语语音研究也跟着逐渐升温;实验语音学的理论和方法也在藏语语音研究中逐渐推广和应用。但是到目前为止还没有较为完整的藏汉双语多模态生理语音数据库,因此,建立一个藏汉双语多模态生理语音数据库对藏语语音的基础研究和藏语语音其他领域的发展具有重要的意义。本课题的主要研究对象是藏语卫藏话,首先需要建立一个藏汉双语多模态的生理语音数据库。我们根据此数据库的要求,设计和建立藏汉双语的文本语料集,此文本语料集中包括41句藏语句子、27句汉语句子、30个藏语辅音、4个元音以及25个藏语单音节;然后以该文本语料集为基础,通过由Terason超声仪(Ultrasound)、高速摄像仪(High-speed video camera,HSV)、电磁发音记录仪(Electromagnetic Articulograph,EMA)等组成的生理语音数据采集系统对藏汉双语生理语音数据进行多模态的采集;之后,利用Praat软件对所采集到的音频文件进行语音文本的标注;最终建立了一个大小约为2.5TB的生理语音数据库。数据库建立之后,对得到的多模态数据进行整理和分析,此课题中首先是对藏族发音人发藏语元音和汉语元音的分析,得到男、女发音人在发这两种元音时共振峰的数据,并根据这些数据画出了相应的元音空间图。然后对藏族男、女发音人发藏语元音和汉语元音时的元音空间进行对比研究,发现藏族发音人在发汉语普通话的元音时会受到他们母语的影响。同时也将藏族人发藏语元音时的元音空间与汉族人发普通话元音、美国人发英语元音的元音空间进行对比,发现叁者的元音空间大小相差不大,这也说明语言中元音的数量对元音空间的大小没有太明显的影响。(本文来源于《天津大学》期刊2016-12-01)
宋静,张雪英,孙颖,畅江[8](2016)在《基于模糊综合评价法的情感语音数据库的建立》一文中研究指出为建立一个真实、自然、丰富的情感语音数据库,研究选择高兴、惊奇、悲伤、生气四种情感类型,利用截取广播剧的方式获得初选阶段的情感语音数据库。通过模糊综合评价与层次分析法、熵权法相结合建立情感语音的模糊综合评价模型,利用该模型对初选阶段的数据库进行模糊评价,筛选得到最终高质量的情感语音数据库。将叁种类型的数据库用于情感语音识别实验,对比分析了不同类型数据库的差异,同时也验证了本数据库的有效性。(本文来源于《现代电子技术》期刊2016年13期)
许祖华[9](2016)在《陕西将建省市县叁级方言语音数据库》一文中研究指出新华社西安电 (记者 许祖华)方言承载文化乡愁,秦腔、信天游、民歌、民俗因方言而活力四射。为做好其抢救保护工作,传承地域文化,陕西省政府办公厅日前就关于支持开展方言语音建档工作提出,到2017年6月底,建成省、市、县叁级方言语音数据库和相关文字档案。(本文来源于《陕西日报》期刊2016-03-26)
呼司乐土,巴图格日勒,格根塔娜,德格吉呼[10](2015)在《基于语音声学参数数据库的东乡语元音/i/音位分析》一文中研究指出文章在利用"东乡语语音声学参数数据库"对东乡语元音/i/的第一共振峰(F1)和第二共振(F2)进行分析并绘出声学元音图的基础上,采用定量和定量分析相结合的方法,对东乡语元音/i/的特点进行分析并提出了元音/i/的典型变体与条件变体的分布格局.得出初步结论为:/i/元音音位有[i][][]等3个变体,[i]出现在词首位置,当作典型变体;[]是条件变体出现在ts,s后词中和词尾;[]是条件变体出现在?,?h,后词中和词尾.(本文来源于《西北民族大学学报(自然科学版)》期刊2015年04期)
语音数据库论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
建立了一个将离散情感标签与维度情感空间结合起来的汉语情感语音数据库。该数据库由16名母语为汉语的说话人对情感语音进行表演型录制。语音样本是根据中性、愉悦、高兴、沮丧、愤怒、哀伤,以及悲伤等七种离散的情感标签采集而得,每名说话人有336条语音样本。随后由叁名标注人在维度空间上对每条语音样本进行标注。最后,根据标注所得的数据来研究这七种情感在维度空间的分布情况,并分析了情感在一致性、集中性和差异性方面的性能。除此以外,还计算了这七种情感的情感识别率。结果显示,叁名标注人对该数据库标注的一致性都达到了80%以上,情感之间的可区分度较高,并且七种情感的情感识别率均高于基线水平。因此,该数据库具有较好的情感质量,能够为离散情感标签到维度情感空间的转化提供重要的研究依据。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
语音数据库论文参考文献
[1].侯云红.现代维吾尔语情感对话语音数据库的设计研究[J].语言与翻译.2018
[2].陈颖,肖仲喆.离散标签与维度空间结合的语音数据库设计[J].声学技术.2018
[3].任国凤,张雪英,李东,闫建政.普通话双模态情感语音数据库的设计与评价[J].现代电子技术.2018
[4].魏可晗,裴正薇.英语语音测试手段与评估方式——基于SSCI和CSSCI数据库实证研究文献(2010—2016)的述评[J].重庆交通大学学报(社会科学版).2018
[5].郝俊慧.英语流利说:听懂每个中国人的英语[N].IT时报.2018
[6].许彬彬,洪青阳,李柏翰,郑大伟,李琳.基于闽南方言语音识别技术的数据库设计与标注[C].第十四届全国人机语音通讯学术会议(NCMMSC’2017)论文集.2017
[7].鲁茸江才.藏汉双语多模态生理语音数据库的建立和语音特征分析[D].天津大学.2016
[8].宋静,张雪英,孙颖,畅江.基于模糊综合评价法的情感语音数据库的建立[J].现代电子技术.2016
[9].许祖华.陕西将建省市县叁级方言语音数据库[N].陕西日报.2016
[10].呼司乐土,巴图格日勒,格根塔娜,德格吉呼.基于语音声学参数数据库的东乡语元音/i/音位分析[J].西北民族大学学报(自然科学版).2015