基于粗集的汉语建模及其应用研究

基于粗集的汉语建模及其应用研究

陈清才[1]2003年在《基于粗集的汉语建模及其应用研究》文中提出自然语言建模是保证计算机能够以可计算的方式对各种语言信息进行有效的处理与应用的基础,尽管基于统计的自然语言模型已经获得了成功应用,当前人们仍然面临如何更加高效、准确地获取语言学知识,同时对各种冗余信息进行有效剪切的问题。为了解决上述问题,同时考虑到粗集技术能够有效地解决信息冗余、冲突、模糊等问题,本文通过引入粗集技术,探索从大规模非结构化的自然语言文本中自动获取语言学规则的方法与模型,研究借助粗集技术来考察自然语言建模的特点以及建模过程中所面临的主要问题、相应的解决方法,在此基础上,进一步研究所建立的语言模型在自然语言处理中的应用。本文研究的主要内容包括以下四部分:第一,本文以汉语音字转换任务所面临的问题为起点,研究文本信息的结构化方法,并在此基础上建立了一个基于粗集的从大规模文本语料库中获取汉语音字转换规则的语言学知识发现模型,研究了模型的实现方法,并通过实验评测了模型的性能。模型的主要优点在于能够针对不同应用所提供的特征来完成对规则库的约简,降低信息冗余,尽管模型所挖掘的规则是应用相关的,但由于所有规则是自动获取的,所以模型本身仍然具有很好的移植性。第二,由于传统的统计语言模型不能有效解决远距离约束问题,为解决这一问题,我们研究了将粗规则集与统计语言模型进行融合的方法。首先针对存储空间受限的应用领域,研究了基于候选剪切及基于线性插值的方法来融合粗规则集以及字tri-gram模型时的模型性能及特点,然后针对通用领域,研究了在最大熵框架下将粗规则集与基于词的tri-gram模型进行融合的方法,并在此基础上建立了一个基于最大熵和粗规则集的统计语言模型。实验结果表明,将粗规则集与统计语言模型进行融合能够有效的改进传统统计语言的性能。第叁,汉语语义的量化建模是进行语义辨识以及语义相似度计算的基础,本文通过采用统计的方法来建立词空间,并将一个词语的上下文映射到该词空间来进行词语的语义量化并建立了相应的量化模型。为了减少计算语义相似度的时间复杂度,我们引入了粗集技术中的属性约简算法来进行词矢量空间的属性约简及坐标词选择,研究了对连续的属性值的离散化处理问题。通过采用伪词的方法对语义量化模型的评测结果显示模型具有较强的语义量化能力及实际

佚名[2]2007年在《自动化技术、计算机技术》文中认为TP13 2007012024一类时滞线性切换系统的稳定性和镇定/陈松林,姚郁(哈尔滨工业大学控制与仿真中心)//黑龙江大学(自然科学学报).―2006,23(2).―206~210.针对一类具有状态延迟的连续线性切换系统,研究了其渐近稳定性及状态反馈和输出反馈镇定控制律的设计问题。首先利用公共李亚普诺夫函数法给出了系统渐近稳定的充分条件及该条件下切换律的构造方法,然后给出了状态反馈和输出反馈镇定的充分条件,同时给出了稳定化控制律的参数化表示和相应切换律的构造方法。最后举例说明了结果的有效性。图2表0参12

李翠玲[3]2006年在《粗糙集理论研究及其在虚拟装配系统中的应用》文中提出在当今的制造企业信息化和信息系统智能化背景下,分析制造企业虚拟装配系统的发展现状和面临的制造知识缺乏问题,提出了应用智能理论体系中的粗糙集理论进行制造知识发现的解决思路。研究粗糙集理论若干环节的计算优化问题,提出了粗糙集理论IMSRS(Improved-MDV-SOM-RoughSet,IMSRS)知识发现模型,并在虚拟装配系统中的装配顺序、装配工时、和虚拟设备诊断等方面进行了探索式的应用研究。在粗糙集理论的研究方面,从课题实际出发,研究了粗糙集约简的范式,提出了连续属性全距离(Continuous Attribute Whole Distance,CAWD)论域空间降维方法、改进的连续属性离散化模型IMDV(Improved Maximum DiscernibilityValue,IMDV),Petri网到粗糙集信息表映射的信息转换模型Petri-RS,改进的粗糙集知识发现模型IMSRS。为粗糙集理论研究成果在虚拟装配系统的应用,提供了较为完善的理论工具。在虚拟装配系统研究方面,以实际的虚拟冲压生产线VPL为课题研究背景,分析了系统的需求,对系统进行了概要设计和详细设计,并给出了系统实现的相关论述。为粗糙集理论研究成果提供了应用基础,并为分析和界定虚拟装配系统所面临的问题,给出了实际的研究对象。分析虚拟装配系统中的装配知识发现问题,并从描述虚拟装配过程的Petri网中,通过Petri-RS模型直接转换为二维的粗糙集决策信息表,从而将IMSRS模型应用到装配顺序的知识发现问题中。将IMSRS模型在装配工时分配问题中进行了应用,取得了满意的装配规则知识,同时验证了IMSRS模型的正确性和有效性。详细分析了虚拟装配系统中虚拟设备的故障诊断问题,分别应用PSVM(Principal components analysis and Support Vector Machine,PSVM)模型和IMSRS模型对设备故障进行探索性研究,获得了满意的诊断规则知识,验证了粗糙集理论良好的处理和分析性能。在论文的最后部分,对本课题的研究内容进行了总结,并对进一步的研究内容和推广工作进行了展望。

金学成[4]2007年在《基于语音信号的情感识别研究》文中提出语音是人类交流的重要手段,是相互传递信息的最方便、最基本和最直接的途径。语音信号在传达语义信息的同时,还传递着情感信息,而情感在人们生活和交流中起着重要的角色。因此,随着人机交互技术的快速发展,语音信号中的情感信息正越来越受到研究人员的重视。作为语音信号情感信息处理的一个重要研究方向,语音情感识别是计算机理解人类情感的关键,是实现智能化人机交互的前提。但是,目前对于人类情感的研究还处于一个探索阶段,对情感的定义与表示至今没有一个统一的认识。加之情感具有较强的社会性和文化性,以及语音信号本身的复杂性,这些因素使得语音情感识别的研究面临着重重困难。应该说语音情感识别的研究还处于一个起步阶段,对于情感语音库、情感特征以及情感建模与识别方法等诸多方面的研究还有待深入。本文以建立不依赖于话者和文本内容的语音情感识别系统为目标,对情感语音数据库、语音声学特征参数提取、情感特征分析与选取、情感维度空间、语音情感建模与识别等问题进行了深入探讨与研究。在对大量情感语料进行分析的基础上,提出了两种语音情感建模方法,为语音情感识别提供了一个理论和技术上的框架,为实现自然的人机交互奠定了一定的基础。借助于这两种情感模型,本文开发了两种语音情感识别算法,构建了不依赖于话者和文本内容的汉语语音情感识别系统。本文的创新点和主要贡献如下:(1)从语音情感特征提取的需求出发,提出了一种基于修正倒谱和动态规划技术的基频估计算法。该算法根据倒谱、短时能量和短时过零率在清音段和浊音段的不同表现,构造了一个清浊音判决函数,据此可简化清浊音判决过程,并大大提高清浊音判决精度。为了得到合乎实际的、具有平滑轨迹的基频估计,利用动态规划技术进行基频跟踪。由于充分考虑了基频连续性的影响,该算法能够有效地避免倍频和半频错误,具有准确率高、基频轨迹平滑等优点。(2)对韵律和声道共振峰等语音声学特征与情感状态之间的关系进行了深入细致的定性/定量分析,得出了一些具有重要指导意义的结论。通过分析发现,短时能量虽然对于区分情感状态有一定的帮助,但存在明显不足;但是信号能量在不同频段上的分布对于区分情感状态具有重要意义,其中,250Hz以下能量占全部能量的比例是区分情感状态的一个重要特征。本文还对基频轮廓及基频轨迹导数等特征与情感状态之间的关系进行了分析。在分析过程中我们发现,男性和女性在语音情感特征参数的分布上存在着较大的差异。据此本文提出了一种以基频均值、范围和方差为特征、采用Fisher线性判别函数的性别判别方法。实验结果表明,通过训练,该方法可取得非常高的正确判别率。(3)提出了一个叁维情感空间模型构想,通过听辨实验确定了几种基本情感在情感空间中的位置,并定量分析了语音信号的韵律特征和音质特征与不同情感维度之间的相关性。(4)从情感建模的角度出发,根据情感具有连续性和离散性的双重特点,将数据场的概念引入情感建模,提出了情感场和情感势的概念,并对势函数的计算方法提出了改进措施。通过势函数寻优确定各类基本情感中心在情感空间中的位置,从而把情感空间中任何一点的情感看成是由几种基本情感复合而成,每种基本情感对该点的贡献由基本情感中心在该点处的情感势决定,情感势的大小决定了该点处情感属于某种基本情感的程度。本文基于这一思想开发了一种基于情感场的汉语语音情感识别方法,获得了优于传统语音情感识别方法的识别率。(5)根据语音韵律特征与情感唤醒度、音质特征与愉悦度之间的相关性,提出了一种基于情感维度的情感建模方法。该方法利用韵律特征和音质特征分别为每种情感构建唤醒度和愉悦度概率模型,然后将每个情感语音样本在12个维度模型上的概率输出作为特征训练情感类别模型。本文利用高斯混合模型(Gaussian Mixture Model,GMM)构建情感维度模型,并提出了一种基于对训练样本进行聚类分析的GMM初始参数估计方法。在最后识别时,选用了支持向量机(Surport Vecter Machine,SVM)来构造六类情感类别识别器。根据该情感维度模型,本文进行了汉语语音情感识别的相关实验,获得了优于情感场方法的识别率。作为一种新的尝试,本文提出的两种语音情感建模方法具有一定的理论依据和较好的实用效果,为今后的语音情感建模与识别研究奠定了良好的基础。

佚名[5]2005年在《计算技术与计算机及网络设备》文中进行了进一步梳理Y2002-63503-1314 0501305用于电信系统硬件模拟的快速样机技术=Fast proto-typing techniques applied to the hardware simulation oftelecommunication systems〔会,英〕/Re,A.D.&Narmarelli,A.//2001 IEEE Thirty-Fifth Asilomar Con-ference on Signals,Systems & Computers,Vol.2 of2.—1314-1317(HE)

佚名[6]2005年在《计算技术与计算机及网络设备》文中研究说明0522883高密度 PCB 模块的加固技术[刊,中]/葛新法//声学与电子工程.—2005,(2).—46-47(D2)论述了一种现代高密度组装的军用 PCB 模块的加固技术。用该技术加固的模块用于水声信号处理机的高速信号处理,能满足舰用、潜用电子装备的恶劣环境条件。参31710 计算技术与计算机科学IELDVD052:8798 05228842003年 IEEE 系统与信息工程设计会议录=2003IEEE Systems and Information Engineering Design Sym-posium[会,英]/University of Virginia.—P.356(E)

佚名[7]2004年在《计算机在电子学方面的应用》文中指出TP39 2004U41249一种网络防御模型研究/刘维国,刘慧敏(解放军9 1550部队)]I航天电子对抗.一2 003,(4)一46一封叁通过一种网络防御模型的引人,进而分析了网络系统保护模式、建立数学模型.该模型对于建立和强化网络安全保障体系有一定

黄娟娟, 周世健[8]2009年在《粗糙集理论在GIS数据处理中的研究与应用》文中提出本文首先介绍了粗糙集理论的基本概念,包括等价关系、不可分辨关系、上下近似、粗糙集和简约;并且从空间数据挖掘、遥感影像处理、GIS不确定性、GIS数据分析、模糊地理对象建模和粗糙集与其它软计算方法的结合等六方面概述了粗糙集理论在GIS数据处理中应用的进展。

参考文献:

[1]. 基于粗集的汉语建模及其应用研究[D]. 陈清才. 哈尔滨工业大学. 2003

[2]. 自动化技术、计算机技术[J]. 佚名. 中国无线电电子学文摘. 2007

[3]. 粗糙集理论研究及其在虚拟装配系统中的应用[D]. 李翠玲. 同济大学. 2006

[4]. 基于语音信号的情感识别研究[D]. 金学成. 中国科学技术大学. 2007

[5]. 计算技术与计算机及网络设备[J]. 佚名. 电子科技文摘. 2005

[6]. 计算技术与计算机及网络设备[J]. 佚名. 电子科技文摘. 2005

[7]. 计算机在电子学方面的应用[J]. 佚名. 中国无线电电子学文摘. 2004

[8]. 粗糙集理论在GIS数据处理中的研究与应用[J]. 黄娟娟, 周世健. 江西测绘. 2009

标签:;  ;  ;  ;  ;  

基于粗集的汉语建模及其应用研究
下载Doc文档

猜你喜欢