通用语音控制命令识别COM组件的研究与开发

通用语音控制命令识别COM组件的研究与开发

李禹材[1]2004年在《通用语音控制命令识别COM组件的研究与开发》文中研究指明随着微软语音开发平台(Speech SDK)的出现,由于它基于软件构架理论和面向构架/构件的软件开发方法,使得一般程序员开发语音应用程序的梦想成为现实。 本文研究了Speech SDK的技术基础:软件重用技术,软件体系结构理论,面向构架/构件的软件开发方法。基于这些技术,我们分析归纳了微软Speech SDK 5.1里语音应用程序接口(SAPI)的结构和工作原理;以“Z+Z智能教学平台的语音识别接口”的设计为例,展示了这类系统的主框架和关键技术;总结出语音控制命令识别的领域构架;提出了语音控制应用程序的设计方法。这些工作对语音控制应用程序的设计具有普遍的参考价值。 为了解决在“Z+Z智能教育平台的语音识别接口”的研究开发中出现的问题—构架包含的接口太多和理解使用太复杂,在构件/构架的专向领域软件设计方法的基础上,提出了“面向子领域通用模式的构架/构件再集成”的软件设计思想,旨在简化构架及其组装使用,并论证其可行性,完善其开发模型,设计出“通用语音控制命令识别COM组件”。这种软件设计思想可以作为基于构件/构架的专向领域软件设计的补充。

窦则欣[2]2007年在《基于SAPI引擎的文本编辑工具中语音命令的应用研究》文中研究指明语音识别是近半个世纪发展起来的新兴学科,它能使计算机“听懂”人的自然语。由识别得到的信息可作为声控信号应用到多种技术领域,在工业、军事、交通、医学、民用等各方面有广阔的应用前景,蕴有巨大的社会经济效益,它作为高新技术新产业开发受到了世界各国的重视。语音是最符合人类自然习惯的一种通信方式。随着语音识别技术的发展,它在人机接口和多媒体方面的应用也越来越普遍了。在计算机的运算速度和存储能力迅速提高之后,输入输出的人机界面变得越来越重要,人机接口是当前计算机领域的热门课题之一。而语言是人类用来交流最自然、最有效的手段,也是众多载体中具有最大信息量的信号,具有最高的智能水平。一旦计算机具备了这种语言功能,其智能程度与应用价值将大大增加。因为在这种人机交互中使用的是最自然的语言方式来存储和处理信息,是人机交互的一次革命。本文主要是利用微软公司推出的MS Agent在SAPI引擎下进行的二次开发,实现在文本编辑工具(记事本、写字板、word等)中用语音来代替键盘操作,从而使得我们脱离键盘,达到人机交互。本文主要以记事本为例实现Agent动画人物对语音命令的识别和语音输出,即:当说出notepad后,系统即可识别,Agent动画人物以气泡的形式反应出open notepad,之后记事本打开,这时你可以说出open file、print、help等等所有记事本上的命令按钮,这些命令都显示在what can I say对话框中,可以查看这个对话框说出你所想要的语音命令。本文除了可以识别语音命令外,还能够识别26个英文字母和一些简单的英文单词,并且把识别的结果显示在记事本的编辑区中。

罗喆[3]2010年在《基于COM技术的智能军标标绘系统的设计与实现》文中指出在军事行动的筹划和实施中,军事标图是一项重要的工作。敌我态势、作战决心、作战过程等都可以通过标绘过的作战地图反映出来。军事标图逐步向专业化方向发展。可以说,军事标图已是现代军事作战部门的一项主要业务。然而,现在的大部分军事标图仍处于手工或半自动作业状态,标绘周期长,难以有效地修改和传输,同时标绘人员劳动强度较大。这些都是传统标图中难以克服解决的问题。计算机军事标图作为计算机军事应用领域的全新课题不仅得到了广泛的关注,而且在开发研究方面取得了或正在取得人们预期的结果。随着应用的不断扩展,也对标图软件的可移植性和可扩展性提出了要求。智能军标标绘系统是为军事标图而设计的软件系统,目的是要为使用人员提供一个操作简便、灵活的标图平台。本文在全面分析军标标绘系统的功能需求的基础上,采用面向对象方法,基于组件技术设计并实现了智能军标标绘系统。该系统以COM技术为核心,采用Visual C++ 6.0实现。该基于COM技术的智能军标标绘系统取得了以下几方面成果:①系统界面简洁,军标标绘的操作简便、灵活、直观,整个过程只需简单地用鼠标点拉即可完成,易于使用;②具有丰富的军标库,系统根据我军现行的军队标号标准提供了700余种军标,基本满足军事标图的需要,同时,还有军标制作系统的后备支持,可随时根据需要增加各种军标以及象形符号;③网络版具有较强的网络传输功能,可以不同的方式在网络上传送军标标绘信息,也可传送各种各样的文字信息;④语音版具有灵活的语音控制功能,已基本达到实用程度。目前该系统已在部分军事训练与教学单位投入使用,运行效果良好。用户反馈信息表明,该系统功能实用,操作简便,对提高军事训练水平和参谋业务效率起到了积极作用。

李飞[4]2007年在《基于视觉与语音的新型鼠标研究》文中进行了进一步梳理普通鼠标是一种手动的传统交互方式,满足不了特殊人群的需求,譬如手臂残疾的人和游戏爱好者就期望采用多种交互方式来操作PC。随着图像、视觉核心算法的发展,语音识别的理论和应用研究的进展,再加上CCD、CMOS图像传感器制造工艺的成熟,为基于视觉与语音的鼠标实现提供了条件。本文主要的研究是基于视觉与语音的新型鼠标。首先对各种视觉跟踪算法的实现方法进行探讨。在充分了解各种算法优缺点的基础上,系统采用鼻子特征跟踪的方法来作为鼠标的光标移动,采用眼睛睁合判断的方法作为鼠标按键的操作,用HALCON视觉处理软件对各算法进行仿真,并在Visual Basic中调用HALCON库函数加以实现。另外,鼠标按键的操作还可选用语音识别的方式来实现,文中用MATLAB仿真实现了DTW(动态时间规整)算法,该算法训练方法简单,计算量小,适合于本系统的设计。采用Visual Basic与Matlab混编的方式在Visual Basic中调用创建的COM组件,实现语音识别的功能,进行性能测试。将视觉跟踪模块与语音识别模块结合起来,根据基于视觉与语音鼠标的体系结构进行设计,编写全部程序进行系统的整体调试,调试成功后进行预定的实验,记录实验结果。将视觉与语音技术应用于鼠标中,在国内还没有人开发研究,这无疑很有研究的价值,具有一定的市场潜力。从完成的设计表明,基于视觉与语音的方案可以完成鼠标的基本功能,而且可以适用于特殊人群。但本系统还处于研究设计阶段,还不够完善,后续工作将主要围绕算法性能的提高,程序的优化以及其他一些细节问题作进一步的改善、测试。

高振宏[5]2008年在《基于H.264标准的多路音视频服务器客户端软件设计》文中指出网络视频服务器是一种对音视频数据进行编码处理并完成网络传输的专用设备,视频服务器在网络视频服务和视频监控等领域有着广泛和重要的应用。可以广泛用于多媒体视讯调度指挥、网络视频监控和会议、多媒体网上直播、网络教学、远程医疗等各个方面。论文的核心内容是客户端软件系统的设计与实现。作者以模块化的软件设计思想对客户端软件系统进行了模块的划分和细化,然后详细介绍了各子模块的设计和主要功能函数的设计。本文设计并实现了“基于H.264标准的多路视频服务器客户端软件设计”。此软件设计主要是基于Windows平台进行客户端软件的开发。采用了DirectShow多媒体开发工具以及COM规范制作了AcitveX控件,对H.264视频压缩数据进行接收、解压、播放等一系列程序编写。网络传输是基于RTP实时传输协议,并应用了SIP对媒体会话协议作为承载体,支持在IPv6网络协议;并且完成了图像质量的错误检测和音视频同步;应用了基于MFC Dialog制作了客户端的界面;应用PELCO-D协议完成了云台控制协议对镜头控制部分。测试结果表明,该终端可以在IPv4/IPv6网络环境下采用SIP协议同其它设备建立连接,实现实时H.264格式和其它视频格式与多种格式音频的解码、播放、网络通信与硬盘存储等网络视频服务器客户端基本功能,可广泛应用于视频监控与VOD等领域。

张亮[6]2010年在《基于3G无线网卡的PC侧软件系统的研究与开发》文中研究表明随着移动通信技术的快速发展,移动通信网络正逐步向3G演进,移动数据业务的发展步伐将不断加快。3G网络将成为语音、数据、短信、可视电话等各项业务的最佳载体。随着3G移动终端(手机与无线网卡)的研制成功,终端设备本身的功能越来越强大。用户对终端设备的附加功能也有了越来越高的要求,希望能够操作这些设备上的一些功能,比如实现个性化管理、个人通讯录管理、无线上网、短消息等。但是终端设备小巧便携的特点,使得用户现实中使用上述功能时很不方便,而随着计算机的普及以及计算机强大的能力,用户在计算机上对终端设备进行操作的要求日益迫切,因此需要有与移动终端配套的PC侧软件来完成对移动终端的管理。论文首先对3G标准和无线网卡作了介绍,针对3G的发展趋势分析了PC侧软件的意义,接着阐述了系统构架以及层次结构、接口功能和模块划分,整个系统采用层结构,不同层次实现其相应功能。然后系统的介绍了各个主要模块的功能要求、实现原理和程序流程,并具体讲述了短消息模块的实现,最后重点介绍了软件实现中的关键技术,通讯适配层采用标准Win32 API函数实现串行通讯、使用AT命令,实现PC与终端设备的消息互通以及利用COM组件化技术来完成对系统的结构优化。

罗锡梁[7]2006年在《大型电力变压器隐Markov模型(HMM)的故障诊断方法与系统研究》文中指出大型电力变压器是电力系统最重要的变电设备之一,其运行状态直接影响着电力系统的安全水平。大型电力变压器一旦发生故障将造成巨大的经济损失和严重的社会影响。因此,研究与应用电力变压器监测和故障诊断技术和系统,保障大型电力变压器安全、可靠、高效运行,对提高电力企业的经济效益,促进经济和社会发展具有重要的意义。 本文是在嘉兴市科技计划重点项目“大型变压器远程在线状态监测与故障诊断网络化技术与系统研究”和国家自然科学基金资助项目“基于温度场模型及特征提取的大型变压器远程诊断方法与技术的研究”(编号:50575095)的基础上展开研究。本文以大型电力变压器为研究对象,将隐Markov模型(Hidden Markov Models,HMM)理论引入电力变压器故障诊断领域,提出了一种大型电力变压器HMM故障诊断方法,分析了HMM应用到大型电力变压器领域中需要解决的一些关键问题并给出了相应的解决方法,设计开发了大型电力变压器故障诊断原型系统。论文的研究主要内容及章节安排如下: 第一章阐述了大型电力变压器故障诊断技术的研究意义和研究现状,介绍了基于DGA(Dissolved Gases Analysis)的变压器故障诊断技术的研究现状,论述了HMM应用于大型电力变压器故障诊断中的意义。最后结合课题提出了本论文的研究内容,给出了论文的总体结构。 第二章简要介绍了电力变压器的分类和结构,分析了大型电力变压器的主要故障类型及其原因,介绍了油中溶解气体的产生机理,讨论了典型故障与油中溶解气体的关系,给出了基于油中溶解气体分析的故障诊断方法,最后指出了常用油中溶解气体分析诊断法中存在的主要问题。 第叁章介绍了Markov过程和Markov链的基本理论,重点阐述了HMM的基本理论和算法,分析了HMM在故障诊断应用中的参数优化、算法下溢等主要问题,提出了相应的解决方法。通过对电力变压器故障诊断问题和语音识别问题的比较分析,论述了HMM应用于电力变压器故障诊断的可行性。 第四章针对多观测样本序列问题,提出了一种应用于变压器故障诊断的HMM改进算法,给出了利用HMM方法进行建模和故障诊断的具体步骤。在此基础上,提出了大型电力变压器的HMM故障诊断方法。最后利用故障数据对HMM故障诊断方法进行了故障诊断测试,得到了良好的分类结果,验证了HMM故障诊断方法的有效性。 第五章设计开发了以油中溶解气体分析为基础的基于HMM的电力变压器故障诊断原型系统,详细介绍了系统的总体结构、模块组成和主要功能。给出了系统软件的开发环境、开发工具以及混合编程的实现方法。 第六章对全文的研究工作进行了总结;并且结合课题对基于HMM的大型电力变压器故障诊断方法和系统的发展进行了展望。

杨蒙[8]2008年在《HTA应用研究及其多通道工具的设计实现》文中研究表明HTA(Hierarchical Task Analysis),即层次任务分析。它是HCI领域的核心技术,被誉为“几乎可以用于任何环境”及“最着名”的任务分析技术,是一种描述目标及其子目标层次体系的方法,通常用于分析人类要完成的目标或者机器系统要完成的任务,已经被广泛研究和应用了近40年。本文围绕HTA的应用以及HTA的计算机辅助工具展开了一系列工作,主要有:首先,本文对HTA方法及其应用研究现状进行了梳理、总结及简要介绍。在此基础上,分析了HTA计算机辅助工具的用户群以及HTA多通道工具的必要性。其次,本文就HTA方法在UI可用性评估领域中的应用进行了深入研究。结合HTA在该领域的应用研究现状,针对低保真原型以及一些因实验条件有限无法进行正式的用户测试或满意度评估的系统,本文给出了一种基于HTA的UI可用性评估方法:HUGE,并以包裹单填写系统为例实践验证了HUGE,实践在一定程度上表明了HUGE的可行性及有效性。在HUGE实践过程中,本文根据评估结果对包裹单填写系统原UI进行了升级,新UI经评估具有较好的可用性。由于HUGE利用HTA层次图输出对UI可用性评估中的用户满意度及有效性进行了量化,故该实践也间接说明了HTA对于用户满意度及有效性的可用性评估在一定程度上是有效的。最后,根据对HTA方法的研究,结合HTA计算机辅助工具的相关分析,本文设计了纸笔隐喻界面与桌面隐喻界面相结合的HTA多通道工具UI,并据此实现了一个支持HTA方法的多通道工具原型。它既通过笔和语音输入、人类熟悉的命令手势完成HTA层次图以拓宽人机(HTA分析人员与计算机)交互带宽,又通过网络远程沟通以增强人与人(HTA分析人员与被分析对象)之间的信息交流带宽。原型系统支撑HTA方法,而HUGE是以HTA为理论基础的应用研究,故原型系统也支持HUGE中HTA层次图的制作。

李禹材, 王玲[9]2006年在《一种子领域通用构件的开发方法》文中研究指明以“Z+Z智能教育平台的语音识别接口”的研究开发为背景,针对领域构架包含的构件太多和理解使用太复杂的问题,提出了子领域通用构件(General Component for Sub-domain,GCSD)的概念。GCSD的使用,能极大地简化基于构件的应用程序开发,提高软件生产效率和产品质量;结合基于构件/构架的软件复用技术和领域工程方法,提出了GCSD的开发方法,并以语音命令识别通用组件的开发为例,展示其开发过程。

赵威威[10]2007年在《嵌入式语音识别及控制技术在智能家居系统中的应用》文中研究说明随着技术发展和生活水平的提高,人们对家居环境提出了更高要求,智能家居系统已成为目前的该领域的一个重要研究课题。语音是人类最自然的交互方式,利用语音识别与控制技术实现对家用电器的控制是智能家居的重要内容。论文基于微软公司的Microsoft Speech SDK语音开发平台,将语音识别技术集成于嵌入式操作系统Windows XP Embedded中,构建一个智能家居系统,实现对家用电器的语音控制。论文主要工作有:完成基于语音识别控制的智能家居系统方案设计。系统分软件和硬件两部分,上位机实现语音采集和识别、处理,发出相应的动作命令,通过串行通信,构成串行控制网络,控制具备符合接口规范的设备,通过语音实现对家用电器的遥控。对语音识别技术进行研究。经分析比较,采用基于HMM识别算法的Microsoft Speech SDK语音开发平台进行开发。该识别方法具有识别准确率高、便于和操作系统的无缝链接、调用简单方便等优点。研究嵌入式操作系统Windows XP Embedded在本系统中的应用,对系统配置、语音驱动等关键技术进行设计。定制的操作系统可很好的与语音识别软件包相匹配,对硬件配置要求低,有利于降低系统成本。利用单片机构建了执行机构,能和上位机进行可靠通信,并具有红外遥控等复杂控制功能,成本低廉。采用可视化编程完成应用程序设计,界面友好,具备扩展功能,功能增加便利,并便于新控制设备的加入。论文研究的智能家居控制系统能实现对家用电器的有效控制,装设便利、成本低廉、实用性强,并可方便地改造原有家居设备控制系统。论文研究的方法和技术可进一步在其它相关领域得到广泛应用。

参考文献:

[1]. 通用语音控制命令识别COM组件的研究与开发[D]. 李禹材. 四川师范大学. 2004

[2]. 基于SAPI引擎的文本编辑工具中语音命令的应用研究[D]. 窦则欣. 沈阳工业大学. 2007

[3]. 基于COM技术的智能军标标绘系统的设计与实现[D]. 罗喆. 重庆大学. 2010

[4]. 基于视觉与语音的新型鼠标研究[D]. 李飞. 东华大学. 2007

[5]. 基于H.264标准的多路音视频服务器客户端软件设计[D]. 高振宏. 吉林大学. 2008

[6]. 基于3G无线网卡的PC侧软件系统的研究与开发[D]. 张亮. 长安大学. 2010

[7]. 大型电力变压器隐Markov模型(HMM)的故障诊断方法与系统研究[D]. 罗锡梁. 浙江大学. 2006

[8]. HTA应用研究及其多通道工具的设计实现[D]. 杨蒙. 西北大学. 2008

[9]. 一种子领域通用构件的开发方法[J]. 李禹材, 王玲. 计算机工程. 2006

[10]. 嵌入式语音识别及控制技术在智能家居系统中的应用[D]. 赵威威. 重庆大学. 2007

标签:;  ;  ;  ;  ;  ;  ;  

通用语音控制命令识别COM组件的研究与开发
下载Doc文档

猜你喜欢