人工神经网络软件包的开发及其在药物分析中的应用

人工神经网络软件包的开发及其在药物分析中的应用

白景清[1]2003年在《人工神经网络软件包的开发及其在药物分析中的应用》文中进行了进一步梳理运用Visual Basic 6.0语言编写了一个基于Windows界面的人工神经网络软件包,这个软件包由两个程序组成,一个是神经计算软件(Neural Computing Sofeware,NCS),可以提供BP网络、自组织映射网络、Hopfield网络等常见的神经网络运算;另一个是针对最常用的BP网络结合Access数据库开发的人工神经网络应用平台(BPManager),该平台使用项目-事件方式为用户提供方便的原始数据、训练结果管理,并具有优化隐含节点个数,寻找最优化网络结构,仿真预测等功能。 使用这个软件包对药物分析中的几个问题进行了研究: 运用BP神经网络对维生素B_1等7种药物的毛细管区带电泳迁移时间与实验电压和背景电解质离子强度的关系进行“留一法”建模和预测,本神经网络很好的拟合了毛细管电泳实验条件与迁移时间之间的复杂非线性关系,与二元回归的结果比较,神经网络建模的效果优于二元回归的效果。还运用BP网络进行了毛细管区带电泳的分离条件优化,取得了满意的效果。 分别用BP神经网络和主成分分析结合BP神经网络的方法对6个厂家的复方甘草片进行了分类识别,识别准确率大于90%,表现出较好的复杂类模式识别能力。 运用神经网络识别青霉素钾等24种抗生素药物的红外光谱。利用简单的编码方法对药物的红外光谱谱图编码后用神经网络训练、识别,神经网络不但准确的识别了所有药物,而且在对某一个输入节点加入人为扰动时表现沈川药科大学硕士学位论文 摘要出了良好的容错性。

弥宏[2]2007年在《中药香豆素类化合物的超临界CO_2萃取工艺及产物的非破坏质量监控的实验研究》文中认为中药现代化的范围十分广泛,它包括中药材种植的规范化、中药饮片的现代化生产、制备工艺的自动化与先进化、质量控制与检测手段的现代化以及剂型的现代化等等。但首要最关键的问题就是提取分离工艺的现代化和质量监控的标准化和规范化。实现中药提取、质量监控的现代化,是我们药学工作者努力的方向和所要达到的目标之一。为此,本论文采用先进的超临界CO2萃取技术和人工神经网络-近红外光谱分析技术,分别从中药的提取和非破坏无损质量监控两方面进行了探讨研究,开发得到安全、有效、质量可控的中药提取物。本论文以中药补骨脂、白芷、蛇床子为代表,系统地研究了超临界CO2 (简称SFE-CO2)萃取含香豆素类化合物的中药的工艺条件。探讨了萃取压力、萃取温度、解析压力、提取时间等工艺参数对药材的SFE-CO2萃取产物的收率以及有效成分的影响。采用人工神经网络-近红外光谱法对蛇床子SFE-CO2萃取产物进行了质量监控,建立了用于分析中药提取物中双组分含量的神经网络数学校正模型,取得了较好的成果,实现了药物的无损非破坏快速定量分析。采用正交实验法,以萃取物中有效成分的收率和含量为指标,确定了叁种药材的最佳提取工艺。并通过实验证明,SFE-CO2萃取产物,能保留药材的有效成分,并可以防止常规工艺提取时间过长,引起的产物的氧化变质。有效成分的收率成倍地提高。不仅工艺上优越,而且还能保持药材本身的药理活性。对于有效成分含量较低的药材,萃取时可考虑加入适量的乙醇作为夹带剂。采用薄层色谱法、紫外分光光度法和高效液相色谱法对叁种药材的SFE-CO2萃取产物进行了分析测定。并利用气相—质谱联机技术,对萃取产物中的其他挥发性成分进行了鉴定分析。通过对药材SFE- CO2萃取产物的分离,纯化,获得了纯度较高的总香豆素有效部位,为下一步研究开发新药奠定了实验基础。从补骨脂和蛇床子的SFE- CO2萃取产物中分离结晶得到补骨脂素和蛇床子素单体,是萃取工艺的一大突破。并对其进行了紫外、红外、质谱鉴定,确定了其化学结构。目前此技术已申报国家发明专利二项。此项目在2005年获得吉林省科技进步叁等奖。用近红外光谱结合人工神经网络误差反向传播算法(BP网络)对蛇床子SFE-CO2萃取产物的双组分有效活性成分进行定量预测,并分别建立了人工神经网络、近红外光谱法和短波近红外光谱法快速非破坏监控蛇床子SFE-CO2萃取物中双组分含量的数学校正模型,其快速的预报结果和传统的HPLC法测得的基本一致。说明人工神经网络具有处理复杂非线性信息的强大能力。人工神经网络-近红外光谱法在天然药物在线质量监控,具有较大的指导意义。通过本文的研究,充分证明了超临界CO2萃取技术以及人工神经网络-近红外光谱分析技术在中药现代化的提取与质量监控方面,具有较大的潜力和广阔的前景。

赵小勇[3]2006年在《投影寻踪模型及其在水土资源中的应用》文中进行了进一步梳理通过对传统投影寻踪技术的分析,本文提出了多种改进的投影寻踪新技术,由于水土资源存在高维、非线性、实测数据信息不完整等特征,本文建立了投影寻踪在综合评价和预测等方面的新模型,较好地解决了水土资源中的多元复杂性问题。本文取得了以下叁方面的创新成果:1.本文用基于实数编码的加速遗传算法给出了投影寻踪方法中优化投影方向的新算法,新算法简化了传统投影寻踪模型技术中复杂程序的实现过程,更有利于投影寻踪技术的推广应用。2.在水土资源分类和综合评价中,根据评价样本自身的结构特性或一定的评价标准的结构特性,本文建立了基于多种投影指标函数的投影寻踪聚类模型,当采用标准差和局部密度来构造投影指标函数时,推导得出了投影寻踪聚类模型中唯一的参数——密度窗宽的计算的经验公式;针对评价样本指标间存在多重相关性问题,本文建立了投影寻踪主成分分析。3.在水资源预测中,根据预测对象与预测因子间相互作用关系,本文建立了投影寻踪回归模型、投影寻踪门限回归模型、基于神经网络的投影寻踪耦合模型、基于偏最小二乘回归的投影寻踪耦合模型和基于偏最小二乘回归的神经网络投影寻踪耦合模型。根据预测对象自身的结构特性,本文建立了投影寻踪自回归模型和基于神经网络的投影寻踪自回归耦合模型。各预测模型能从不同角度解决了水资源预测中的高维复杂性问题,开阔了建立水资源预测模型的新思路。综上所述,投影寻踪体现了辨证法中的主要矛盾的思想,本文将其用于水土资源的多元复杂性研究,取得满意结果,为解决当前某些实际问题提供新技术,为水土资源系统研究提供了新思路。

赵巍[4]2008年在《金属材料压印凹凸小类别字符的识别研究》文中研究说明字符识别是模式识别领域的一项传统课题,其中汽车车牌及手写字体、印刷字体等的识别研究已经取得了很大的进展并且得到了广泛应用,但是对于”无色差字符”(即字符与背景的材质相同)图像的研究远不如前者多,在研究成果和应用上也就相应产生了差距。这主要是由于这种”无色差字符”是靠凸、凹字模对压形成突出或者凹进表面的字体,在光学成像时,字符的轮廓是靠其表面不同强度的反射光,而不是靠材质对光线的不同吸收程度而形成的,比较有代表性的就是角铁、轮胎、标牌等。但是提高这种“无色差字符”的识别率,在诸多行业中,例如冶金、建材等均具有重要意义,对于车牌等字符识别的研究也均有极大的参考价值。本文提出实现角铁凹凸字符自动识别的一种方法。针对角铁凹凸字符图像的特点,结合光学字符识别技术,研究了角铁凹凸字符图像的预处理方法、字符的特征提取和字符的分类识别方法。在图像的预处理阶段,对图像进行了滤波、去噪;采用了一种以Canny算子为基础的自适应图像二值化方法并利用投影法取出单个字符。在字符的特征提取阶段,将一种适应性较强的13点特征点法与外围轮廓法相结合并将其引入到角铁上的压印凹凸字符识别中。在字符的识别阶段,采用神经网络的方法对角铁上的压印凹凸字符的数字集进行了识别实验,实践证明此种方法具有较强的实用性。

范彩霞[5]2004年在《人工神经网络辅助HPMC缓释片处方设计》文中研究说明羟丙基甲基纤维素(HPMC)亲水凝胶骨架片是目前应用最广泛的缓、控释制剂,HPMC缓释骨架片不但具有一般的缓、控释制剂的特点、而且制备工艺简单缓控释效果良好、在生理范围内其理化性质与pH无关等优点。对HPMC骨架片的释药机理及影响因素已有很多研究。影响药物释放的处方因素主要有药物的性质、载药量、HPMC的类型、HPMC的量、HPMC的粘度以及填充剂的性质;非处方因素主要有制备工艺、释放介质的性质、药物溶出仪的转速等。 影响HPMC缓释片释放的各个因素与响应之间不存在线性关系,用常规的统计方法很难确定变量和响应之间的关系。解决非线性问题经典的方法是响应面法RSM(Response Surface Methodology),但是响应面法只适合于处理变量较少的低维问题。对于多因素问题,响应面法由于二次拟合的限制及计算的复杂性使得预测结果不理想,在处理多变量的非线性问题中受到限制。人工神经网络ANN(Artificial Neural Network)是利用计算机模拟生物神经网络的某些结构和功能的一种新型信息处理技术。它不仅具有并行性、容错性、非线性、自学习性和自组织性等特点,还有模式识别、系统优化、结果预测乃至联想、记忆等方面的能力,可以克服响应面法的诸多不足并代替响应面法处理缓释制剂处方设计中的非线性问题,利用人工神经网络模型进行处方设计,可以简化和规范处方设计工作,使处方设计更加科学化。 本课题首先建立了两个随机变量人工神经网络模型,通过与响应面法的对照,比较两者的预测能力,并借助叁维图说明各个变量对药物释放的影响。以别嘌醇为模型药物,以HPMC的量和HPMC的固有粘度作为输入变量,浙江大学硕士论文:人工神经网络辅助HPMC缓释片处方设计固定其他因素,以药物在0.1 67、0.333、0.5、1、2、4、6、8、10、12小时的累积释放量作为输出。取17个实验处方中的其中的14个处方作为训练处方,其他3个处方作为验证处方,采用剔除一点交叉验证法对神经网络进行训练,同时与响应面法进行对照,将训练处方和验证处方的自变量分别输入己经训练好的人工神经网络和拟合好的多元二次方程中,预测药物释放。将预测值对实际测定值进行线性回归和应用相似因子比较人工神经网络和响应面法的预测能力。借助叁维图说明HPMC的量和HPMC的固有粘度对药物在2、4、6、8小时释放的影响。结果表明,人工神经网络和响应面法的预测能力是相似的。利用叁维图可以直观的反映HPMC的量和其固有粘度对药物释放的影响:随着HPMC的量和其固有粘度的增加,药物释放减慢,HPMC的量和其固有粘度是影响药物释放的重要因素,HPMC量的影响更显着。 以氟比洛芬为模型药物,HPMC的量和药物溶出仪的转速作为输入,以药物在0.5、1、1 .5、2、4、6、8、10、12小时累积释放量作为输出,取18个实验处方的中的13个处方作为训练处方,其他的5个处方作为验证处方。按上述方法对神经网络模型进行训练,同时与RSM法进行对照,用线性回归法比较两种方法的预测能力。用叁维图说明HPMC的量和药物溶出仪的转速对药物在2、4、6、8小时释放的影响。线性回归表明,无论是训练处方还是验证处方,人工神经网络预测值和实际测定值之间的吻合均优于响应表面法。随着HPMC的量增加,药物释放速率明显减慢,随着药物溶出仪的转速增加,药物释放明显加快。当HPMC量增加,转速对药物释放的影响将减弱,与文献报导一致。 以别嗓醇、甲氧节氨嗜睫、阿昔洛韦、氧氟沙星、对乙酞氨基酚、替硝哇、米诺地尔为难溶性药物的模型药物,以溶解度、载药量、HPMC的量、HPMC的固有粘度、MCC的量、粘合剂中PVP的浓度、药物溶出仪的转速为输入变量(PI、PZ、P3、P4、PS、P6、P7),以药物在2、4、6、8、10、12小时的累积释放量作为输出(TI、TZ、T3、T4、TS、T6),设计52个处方,其中44个处方用于人工神经网络的训练,其他的8个处方作为验证处方。通过训练,建立适合于难溶性药物人工神经网络,并与响应面法对照。用人工神经网络训练的44组数据不能实现多元二次项式的拟和,需另外增加了浙江大学硕士论文:人工神经网络辅助HPMC缓释片处方设计11个处方才能实现。用叁维图反映各个变量对药物释放的影响,以药物在2、6、8小时的累积释放量为0.2、0.6、0.8为目标,结合优化工具箱中的最小二乘法实现HPMC缓释骨架片的不同药物、不同载药量的处方在不同释放条件下的处方优化,得到4个优化处方,并按释放检查方法测定4个优化处方的释放度,与目标进行比较。线性回归结果表明,人工神经网络预测值比响应面法预测值与实际测定值更吻合。人工神经网络预测单个因素对药物释放的影响和文献报道结果一致,而响应面法预测结果在总体上是一致的,个别还是存在差别。药物释放检查结果表明人工神经网络优化的4个处方体外释放与目标一致。 以扑尔敏,维拉帕米、盐酸环丙沙星、多索茶碱、对乙酞氨基酚为水溶性药物模型,以药物的溶解度、载药量、HPMC的量、HPMC的固有粘度、MCC的量、粘合剂中PVP的浓度、药物溶出仪的转速作为输入变量,药物在0.5、l、1 .5、2、3、4、5、6、7、8、10、12小?

曹东升[6]2013年在《化学生物信息学新方法及其在医药研究中的应用》文中指出随着后基因组时代的到来,药物研发已经由传统的研发模式转向了基于系统药理学的研发模式。基于此种模式,海量的数据在药物研发过程中需要分析和处理。化学生物信息学是一门新兴的用于研究药物及药物相关系统中信息内容和信息流向的综合系统学科。将化学生物信息学引入到药物研究过程中,可以极大地加快新药研究进程,缩短研究周期,降低研究费用。从药物研究全过程来看,几乎每一个环节都与化学生物信息学有着密切的关系,如药物靶标发现,药物先导化合物发现,候选物结构修饰和优化、药代动力学研究,药物的临床前研究和临床研究,以及药物投入市场后的不良反应跟踪等。不过面对如此复杂的数据,化学生物信息学研究面临诸多困难问题:(1)高质量QSAR/SAR模型的建立经常涉及到奇异样本检测、特征选择以及非线性等建模问题;(2)如何提取不同水平上不同数据结构信息并加以整合来建立一个假设可测试的模型已成为当今化学生物信息学乃至系统生物学面临的最大挑战;(3)在高通量扫描和药物临床实验数据中,经常会伴随有缺失值、混合数据类型、数据不平衡、存在奇异样本、特征多样本少、非线性、以及多类别多模式等一系列问题;(4)如何对常用药物信息进行提取和收集并转化为药物化学家容易使用的工具是化学生物信息学急切需要解决的问题;(5)如何提取网络中的特征信息以及建立高精度网络预测模型是需要迫切解决的问题。针对这些困难问题,本论文发展了一些新型的化学生物信息学方法,并且基于这些新方法对药物研发中关注的两个问题(药物ADMET性质评估和药物靶标发现)进行了研究。本论文研究内容主要包括两个部分:基础研究部分(第二章-第五章)和实际应用部分(第六章和第七章)。基础研究部分包括化学生物信息学新型方法和药物信息提取方法研究,实际应用部分为药物ADMET性质评估和药物-靶点相互作用网络预测。本论文主要研究内容包括:一、对化学生物信息学及其研究内容进行了简要的介绍,比较了化学生物信息学与化学信息学,生物信息学在药物研发中的异同。明确地提出了化学生物信息学研究应以系统的观点对药物信息进行提取,即从分子水平、细胞水平和组织乃至更高水平上对药物进行描述,并最终有机地整合在一起共同加深对药物行为的理解。鉴于各种统计学习算法在药物数据挖掘中的重要性,对化学生物信息学中常用的数据挖掘方法进行了简要介绍。网络建模在化学生物信息学中变得越来越重要,本章对网络模型的构建以及一些难点问题进行了分析。最后对化学生物信息学研究中的难点问题进行了总结,在以下几章中将通过发展各种化学生物信息学新型方法来解决这些难点问题。(第一章)二、提出了基于模型特征的分布进行奇异样本诊断和特征选择的新方法。通过研究样本在模型种群中预测误差的分布,发现预测误差分布的统计特征能够有效地区分正常样本和各种类型奇异样本。基于此,我们发展了一种用于奇异样本诊断的蒙特卡洛方法。此方法能够同时诊断数据中的各种类型的奇异样本,并且降低了掩蔽效应带来的风险。通过和其它奇异样本诊断和稳健回归方法进行比较,证实了我们提出的方法的优越性能。考虑到样本空间和特征空间的相互作用,我们构建了一个统一的框架来进行奇异样本诊断和变量选择。其主要思想是通过模型系数的统计分布进行变量选择,通过样本预测误差的分布进行奇异样本诊断,后项消除策略用来捕捉样本空间和变量空间的交互作用。将此方法应用到模拟数据和QSAR数据的分析,得到了非常显着的性能提高。(第二章)叁、对核方法及核融合算法进行了深入的研究,提出了几种用于药物数据挖掘的新型核方法。由核方法的模块化可知,核函数的选择和建模方法的选择可以分离开来考虑。通过选择不同的核函数和建模方法,我们能够构建满足不同需求的核模型。基于此,我们发展了一种基于SMILES表征的字符串核支持向量机算法,并将其应用到毒性数据的分类研究。通过和其它核函数及描述符的比较,证实了我们方法的高性能。基于SMILES表征的字符串核支持向量机模型不需要计算任何分子描述符,因此应用简单方便。通过考虑不同的建模方法,我们在核框架内发展了一种核k-近邻算法,并将其和不同核函数结合,有效地克服了原始k-近邻算法的缺点。在核方法中,核特征空间内出现冗余特征时,将会严重影响核方法的预测性能。通过在核特征空间内应用核主成分分析,发展了一个两步算法来解决核空间内冗余特征问题。核主成分分析首先用来在核特征空间内进行去噪处理,然后线性支持向量机在此空间内进行分类研究。将此算法应用于QSAR数据的分析,获得了高的预测性能。(第叁章)四、对决策树及基于决策树的集成算法进行了深入的研究,提出了几种用于药物及组学数据挖掘的新方法。由于特征选择在药物数据建模中的重要性,我们研究了决策树及基于决策树的集成模型的特征选择问题,发展了一个广义的框架用来选择有信息的变量子集。通过对随机森林算法的原理进行分析,发展了一种特征重要度采样的自适应随机森林算法,并将其应用于QSAR数据的分析,获得了比原始随机森林更高的预测性能。通过充分利用决策树的自动逐步特征选择和样本复杂度缩减的优点,我们结合蒙特卡洛采样技术发展了一种蒙特卡洛树算法用于分析代谢组学数据中的模式信息。将此算法应用于两个代谢组学数据分析,获得了代谢组学数据中清晰的模式。最后我们发展了一种基于树核的核Fisher别分析算法,并将其应用到代谢组学数据的分析中,获得了显着的效果。(第四章)五、针对于分子特征表征在化学生物信息学中的重要性,我们开发了四套用于分子特征提取的软件包,并且构建了基于web的分子特征计算服务器。四套软件分别为:(1)用于化学小分子特征提取的ChemoPy软件包;(2)用于蛋白质序列特征提取的ProPy软件包;(3)用于生物网络特征提取的PyNet软件包;(4)用于药物-靶点相互作用及蛋白质互作用描述符PyDPI软件包。应用这些软件包和网络服务器能够很好地辅助药物化学家和生物学家进行复杂分子数据的表征和分析。(第五章)六、对药物ADMET及物理化学性质进行了基于计算机辅助的预测研究,并最终构建了一个药物ADMET'性质数据库和基于web的在线预测平台。鉴于水溶性在药物研发中的重要性,我们发展了叁个预测模型用于化合物水溶性的预测,通过对选择的分子描述符进行分析,发现了影响药物水溶性的因素。运用第四章发展的改进随机森林算法对药物最大日推荐剂量进行结构-活性关系预测研究,通过分析不同疗效药物的子结构碎片,发现了一些相关药物分子毒性的特征碎片。此方法能够提前预估临床一期实验中药物的最大推荐剂量。基于随机森林和子结构模式,我们发展了一个结构-活性关系模型框架对化合物毒性进行计算机辅助预测,此方法有助于化学家对化合物的毒性评估。通过发展2D-QSAR模型,研究了100个结构多样的天然产物对OATPIBI调控的雌酮硫酸盐摄取的抑制效应,一些影响抑制效应的结构因素被识别。通过研究天然产物结构和抑制效应间的定量关系,获得了深入的天然产物-药物相互作用潜在机制的视野。最后我们构建了一个药物ADMET性质数据库和基于web的在线预测平台,旨在方便药物学家对ADMET性质的分析和评估。(第六章)七、基于化学基因组学框架,提出了基因标度地预测药物-靶点相互作用网络的方法。通过药物-靶点对的Ki结合常数,我们区分了整个药物-靶点对集为正样本集和负样本集。化学基因组学方法用来表征药物-靶点相互作用关系,即一个药物-靶点对能够通过同时考虑药物描述符和蛋白质描述符共同来表征。随机森林模型用来构建预测模型。预测结果和深入分析证实了我们提到的化学基因组学框架的合理性。通过对未知药物-靶点对的预测和网络分析,显示了药物在临床上的多药理特征。此方法提供了一种有效方式来研究药物和靶点的行为。基于web的预测服务器PreDPI-Ki最后被构建方便药物学家对此研究成果的应用。在此方法的基础上,通过引入网络特征描述符,药物-靶点相互作用的预测精度能够显着地提高。在四个标准数据集上的预测模型的比较证实了网络特征在药物-靶点相互作用网络预测中的重要性。基于化学、生物和网络特征融合构建的预测模型,我们扫描了未知的药物-靶点对,发现预测排序在前的药物-靶点对大部分能够被实验证实。此方法能够为药物重定向分析和靶点鉴别提供了一种可供选择的方式。最后,基于构建的药物-靶点相互作用预测模型,我们评估了26种天然产物的升压机制。通过预测天然产物和相关靶点间的关系,发现不同的升压机制由不同的靶点所引起。因此通过对天然产物的靶点谱进行聚类分析,可清晰地发现天然产物不同的升压机制。此方法提供了一种药物分子作用机制评估的新途径。(第七章)

谭光兴[7]2006年在《人工免疫系统动力学模型及其在优化控制中的应用》文中指出本文系统研究了免疫系统反应和免疫网络动力学模型的正平衡解稳定性、分岔及不同参数的动力学行为,探讨人工免疫网络模型在优化算法设计及实际应用中的理论与方法。 首先,本文在Marchuk免疫反应模型研究成果的基础上,利用系统动力学理论,研究Marchuk模型正平衡解的稳定性,产生Hopf分岔和周期解的条件,并用计算机仿真方法研究模型不同参数的动力学行为。将Perelson免疫反应的动力学模型扩展到具有时滞的情形,证明了系统正平衡解无时滞稳定的充分条件及其全时滞稳定充要条件。用积分变换将免疫系统的AB网络模型变形为模仿者动态模型,并研究AB网络的纳什均衡条件。对于Farmer网络模型,用Lyapunov稳定性理论研究其稳定性,得出其正平衡点稳定及吸引的充分条件。 其次,针对常用免疫算法存在的一些缺陷,本文在免疫算法中引入混沌搜索的机制,用分布比较均匀的Hénon映射代替其它混沌映射产生混沌序列,用于搜索过程,以改善免疫算法搜索性能和收敛速度。针对一些多目标优化算法中存在收敛速度慢,得到有效解数量少的问题,本文对多目标优化算法的排序策略进行改进,提出一种新的人工免疫算法用于多目标优化,它能产生更多的Pareto最优解,且解分布区域更广,更为均匀。 最后,利用免疫动力学模型理论研究成果,本文尝试将免疫网络动力学模型应用于免疫算法设计。首次地提出用演化博弈论中的模仿者动态模型来设计一种人工免疫网络,它精确描述了抗体之间的进化博弈关系,并用于模式学习。创造性地提出用免疫网络动力学模型来定义抗体的浓度,抗体间的激励和抑制,用函数值和亲合力之积来表示适应度,对抗体进行评价。在此基础上,论文还研究将抗体网络用于优化,提出一种基于抗体网络的优化算法,并给出了收敛性分析。探索用多克隆AB网络动力学模型设计新的优化算法,引入交连场,繁殖函数,改进用Farmer模型进行算法设计时计算较复杂,不直观的缺点,使算法结构更为简单,易于编程。对于提出的每一个算法,用基准测试函数用计算机进行仿真实验,并与其它进化算法做性能比较,实验表明,基于免疫系统动力学模型的优化算法是具有一定适用性、高效、鲁棒的优化计算方法,有较高的理论和应用价值。此外,本文还探索将这些算法应用于PID控制器的参数整定和化工过程的数据挖掘问题。 本文的贡献在于: (1)从系统动力学角度研究了免疫反应和免疫网络的动力学行为,对模型进

严敏[8]2009年在《综放面瓦斯爆炸危险性非线性分析模型及应用》文中研究指明综放面的瓦斯涌出量受煤炭开采量、开采强度、采深加大等因素影响,呈现出明显的不稳定性,严重影响综放面的安全生产,为及时掌握综放面瓦斯爆炸灾害危险程度,预防瓦斯爆炸事故的发生,本论文在事故致因理论基础上,选择以人—机—环系统分析法和层次分析法,建立综放面瓦斯爆炸事故分析模型,从瓦斯状态、人、机、管理四方面对综放面瓦斯爆炸影响因素进行全面分析,建立一套能从总体上反映综放面瓦斯爆炸各因素之间关系和预测瓦斯爆炸危险性的指标体系。鉴于瓦斯爆炸灾害的非线性特性,运用非线性理论中的灰色关联分析方法确定瓦斯爆炸事故分析叁层结构中第二层各因素之间的关联度,然后利用层次分析法确定第二层与目标层权重,将关联度与权重相结合得出综合评价,作为非线性人工神经网络中的BP神经网络的训练样本,再结合综放面瓦斯爆炸灾害特点确定了综放面瓦斯爆炸危险性BP神经网络评价模型,对具体综放面瓦斯爆炸四大类影响因素进行了评价,最后针对某矿102综放面瓦斯爆炸危险性关联度最大的瓦斯涌出量建立了BP神经网络预测模型。本文旨在把危险性论证、矿井综放面瓦斯爆炸防灾能力的科学评估以及建立瓦斯灾害安全保障体系等方面紧密联系起来,为建立瓦斯爆炸事故的控制系统提供依据,为逐步实现以预防事故为中心的现代化科学管理方法提供理论依据。

陈新让[9]2007年在《肾母细胞瘤血清蛋白质标记物检测与分期模型构建研究》文中研究指明背景与目的:肾母细胞瘤是儿童最常见的恶性肿瘤之一,全世界15岁以下儿童的发病率约为1/10,000。德国医师Wilms于1899年首次报告此病,因此多数作者称之为Wilms瘤。肾母细胞瘤是小儿最常见的由肾胚基发生的恶性肿瘤,2岁以下发病率最高。儿童恶性肿瘤的死亡率由20世纪80年代的8%上升到了10.7%,小儿肾母细胞瘤已经成为小儿病死的主要原因之一。肾母细胞瘤的临床病理分期和治疗方法的选择与患儿预后有直接的关系,NWTS在其2001年的总结中提到:在目前的影像学技术条件下(依靠CT等)仍有7.0%的漏诊率,主要是直径小于3cm的肾母细胞瘤。而表面增强激光解析离子化飞行时间质谱技术(Surface Enhanced Laser Desorption/Ionization time of flight Mass Spectrometry,SELDI-TOF-MS)是近年发展起来的一种新的蛋白质研究技术,具有快速、简便、高通量及对多样本平行检验的优点,质谱技术及生物信息学方法的出现提供了有效筛选特异性标记物的方法。Ciphergen公司研发的SELDI-TOF-MS技术是一项全新的蛋白质组学研究方法,该技术通过应用少量天然蛋白质提取物来进行快速分析,克服了传统分析方法的局限性。具有样品用量小、操作简便、灵敏度高、高通量等优点,已成功将其应用于卵巢癌、前列腺癌、乳腺癌、肺癌、直肠癌等恶性肿瘤的诊断、肿瘤标志物的筛选及其他蛋白质组学研究中。本组应用该技术在肝癌,甲状腺癌及肾母细胞瘤前期研究中获得满意效果。应用SELDI-TOF-MS技术结合生物信息学和支持向量机(support vector machine,SVM)方法,筛选出肾母细胞瘤患儿特异性蛋白质标记物,建立肾母细胞瘤临床分期血清蛋白质指纹图谱模型并与CT分期进行对照分析。材料与方法:(1)血清标本共80例均来自郑州大学第一附属医院小儿外科,其中术前肾母细胞瘤30例,其它小儿腹恶性实体肿瘤30例(神经母细胞瘤16例,肝母细胞瘤4例,肾横纹肌肉瘤4例,恶性畸胎瘤4例,胰母细胞瘤2例),正常对照组20例均来自体检的健康小儿。所有的恶性肿瘤均经免疫组化和2名以上病理学教授证实。术前肾母细胞瘤中男21例,女9例,平均年龄2.10±0.10岁;小儿其它腹部恶性实体肿瘤中男18例,女12例,平均年龄2.50±0.16岁。正常对照组与肾母细胞瘤组年龄性别相配对。所有外周静脉全血标本均于术日前清晨空腹抽取,4℃静置1h后3000 rpm离心10min,分离出的血清储存于-80℃低温冰箱中。CT投照方法:西门子SCT机,扫描范围自膈肌上方1cm至肾下极,间隔8mm,层厚8mm.感兴趣间隔5mm,层厚5mm,扫描时间2s。造影剂采用欧乃派克,剂量1.5-2.0ml/kg。(2)样本冰融,4℃10000 rpm离心2min;取96孔板,放冰盒上,每孔加U9(9M Urea,2%CHAPS,1%DTT)10μl,血清5μl,4℃层析柜600 rpm振荡30 min;振荡结束前15 min做芯片预处理,芯片装入Bioprocessor中并记下芯片号;每孔加NaAC(100 Mm,pH4)200μl,层析柜中600 rpm,5 min,重复1次;U9处理后96孔板放冰上,快速加入NaAC185μl在层析柜中6000 rpm振荡2 min;加已处理好的样本100μl到芯片,层析柜4℃600 rpm振荡1h,甩干,重复3次;用hplc水200μl洗2次快速甩干;用50%饱和的SPA 1μl重复2次;上机检测;将芯片放入Ciphergen读谱仪中检测。(3)用protein chip software 3.1做校正,使总离子的强度及分子量均一化。应用ZUCI-Protein Chip Data Analyze System软件包进行分析。原始数据用离散小波(undecimated discrete wavelet transform)分析去除噪音,并减掉基线。聚类分析以10%为最小阈值,将各个样本中m/z的差异小于0.3%的峰聚为一类。支持向量机(support vector machine,SVM)特征向量的选取采用统计过滤结合模型依赖性筛选的方法建立判别模型,用留一法交叉验证作为评估模型判别效果。(4).统计学分析所有的蛋白质谱原始数据经过过滤掉信躁和聚类分析处理后,对所有初步筛选出的质荷比峰做Wilconxon秩和检验,选出p值最小的10个峰进一步分析。将10个峰的任意组合(共175种组合)用于支持向量机模型的输入,用留一法评估模型的预测效果,检验标准设α=0.01结果1.肾母细胞瘤Ⅰ肾母细胞瘤和肾母细胞瘤Ⅱ期组肾母细胞瘤Ⅰ期组和肾母细胞瘤Ⅱ期的质谱经过初步过滤筛选得到483个M/Z峰,对其相对强度做Wilconxon秩和检验分析得到P值小于0.01的M/Z峰5个,从差异显着蛋白质峰的任意组合中,采用SVM筛选出预测值的约登(youden)指数最高的组合模型,筛选出M/Z位于7965.4、5022.4和8469.6的标志物3个,在肾母细胞瘤Ⅱ期低表达,在肾母细胞瘤Ⅰ期高表达。联合两个潜在标记物作为输入值,用留一法交叉检验,在测试集上判别模型的敏感性为100%,特异性为100%。2.肾母细胞瘤Ⅰ肾母细胞瘤和肾母细胞瘤Ⅲ期组肾母细胞瘤Ⅰ组和肾母细胞瘤Ⅲ期的质谱经过初步过滤筛选得到496个M/Z峰,对其相对强度做Wilconxon秩和检验分析得到P值小于0.01的M/Z峰4个,从差异显着蛋白质峰的任意组合中,采用SVM筛选出预测值的约登(youden)指数最高的组合模型,筛选出M/Z位于4263.1、4122.8、4330.7和4303.7的标志物4个,在肾母细胞瘤Ⅲ期组低表达,在肾母细胞瘤Ⅰ期高表达。联合两个潜在标记物作为输入值,用留一法交叉检验,在测试集上判别模型的敏感性为100.00%,特异性为100.00%。3.肾母细胞瘤Ⅰ肾母细胞瘤和肾母细胞瘤Ⅳ期组肾母细胞瘤Ⅰ组和肾母细胞瘤Ⅳ期的质谱经过初步过滤筛选得到565个M/Z峰,对其相对强度做Wilconxon秩和检验分析得到P值小于0.01的M/Z峰4个,从差异显着蛋白质峰的任意组合中,采用SVM筛选出预测值的约登(youden)指数最高的组合模型,筛选出M/Z位于10836.6和8179.1的标志物2个,在肾母细胞瘤Ⅳ期低表达,在肾母细胞瘤Ⅰ期高表达。联合两个潜在标记物作为输入值,用留一法交叉检验,在测试集上判别模型的敏感性为88.89%,特异性为100.00%。4.肾母细胞瘤Ⅱ肾母细胞瘤和肾母细胞瘤Ⅲ期组肾母细胞瘤Ⅱ组和肾母细胞瘤Ⅲ期的质谱经过初步过滤筛选得到490个M/Z峰,对其相对强度做Wilconxon秩和检验分析得到P值小于0.01的M/Z峰3个,从差异显着蛋白质峰的任意组合中,采用SVM筛选出预测值的约登(youden)指数最高的组合模型,筛选出M/Z位于5019.2和4143.2的标志物2个,在肾母细胞瘤Ⅲ期组低表达,在肾母细胞瘤Ⅱ期高表达。联合两个潜在标记物作为输入值,用留一法交叉检验,在测试集上判别模型的敏感性为88.89%,特异性为100.00%。5.肾母细胞瘤Ⅱ肾母细胞瘤和肾母细胞瘤Ⅳ期组肾母细胞瘤Ⅱ组和肾母细胞瘤Ⅳ期的质谱经过初步过滤筛选得到508个M/Z峰,对其相对强度做Wilconxon秩和检验分析得到P值小于0.01的M/Z峰20个,从差异显着蛋白质峰的任意组合中,采用SVM筛选出预测值的约登(youden)指数最高的组合模型,筛选出M/Z位于7976.5的标志物1个,在肾母细胞瘤Ⅳ期组低表达,在肾母细胞瘤Ⅱ期高表达。联合两个潜在标记物作为输入值,用留一法交叉检验,在测试集上判别模型的敏感性为100.00%,特异性为100.00%。6.肾母细胞瘤Ⅲ肾母细胞瘤和肾母细胞瘤Ⅳ期组肾母细胞瘤Ⅲ组和肾母细胞瘤Ⅳ期的质谱经过初步过滤筛选得到504个M/Z峰,对其相对强度做Wilconxon秩和检验分析得到P值小于0.01的M/Z峰12个,从差异显着蛋白质峰的任意组合中,采用SVM筛选出预测值的约登(youden)指数最高的组合模型,筛选出M/Z位于8194.4的标志物1个,在肾母细胞瘤Ⅳ期组低表达,在肾母细胞瘤Ⅲ期高表达。联合两个潜在标记物作为输入值,用留一法交叉检验,在测试集上判别模型的敏感性为93.75%,特异性为100.00%。7.肾母细胞瘤Ⅰ+Ⅱ肾母细胞瘤和肾母细胞瘤Ⅲ+Ⅳ期组肾母细胞瘤Ⅰ+Ⅱ期组和肾母细胞瘤Ⅲ+Ⅳ期的质谱经过初步过滤筛选得到519个M/Z峰,对其相对强度做Wilconxon秩和检验分析得到P值小于0.01的M/Z峰3个,从差异显着蛋白质峰的任意组合中,采用SVM筛选出预测值的约登(youden)指数最高的组合模型,筛选出M/Z位于4153.9,3257.6和3290.7的标志物3个,在肾母细胞瘤组Ⅲ+Ⅳ期低表达,在肾母细胞瘤Ⅰ+Ⅱ期高表达。联合两个潜在标记物作为输入值,用留一法交叉检验,在测试集上判别模型的敏感性为83.33%,特异性为93.75%。8.临床各分期的对照:通过肾母细胞瘤早期诊断模型中的2个m/z(6984.4,6455.5)血清标记物进行分析得出肾母细胞瘤各期情况如下:Ⅳ期相对于Ⅲ期低表达;Ⅲ期相对于Ⅱ期低表达;Ⅱ期相对于Ⅰ期低表达;Ⅰ期相对于正常儿童低表达;后者相对高表达;临床分期越晚M/Z强度就越低表达。9.盲法验证CT与蛋白质芯片分期的准确性:蛋白芯片分期如下:Ⅰ期6例,Ⅱ期10例,Ⅲ期10例,Ⅳ期4例,30例肾母细胞瘤各期均与病理分期相一致,各期符合率均为100.00%,CT分期与手术病理分期的对照:各期均被手术及病理所证实CT把病理Ⅲ期1例列入Ⅱ期,把病理Ⅳ期1例列入Ⅲ期,各期符合率依次为100.00%,85.00%,85.00%,75.00%。结论1.m/z位于5022.4 Da、7965.4 Da、8469.6 Da、4303.7 Da、4122.8 Da、4330.7 Da、4785.6 Da、10836.6 Da、8179.1 Da、5019.2 Da、4143.2 Da、7976.5 Da、8194.4 Da、3290.7 Da、4153.9 Da和3257.6 Da的蛋白质构成的SVM分期判别模型对肾母细胞瘤患儿的准确临床分期和制定合理的治疗方案均具有很好的应用价值。2.运用SELDI-TOF-MS技术结合SVM方法找出在正常儿童和肾母细胞瘤Ⅰ、Ⅱ、Ⅲ、Ⅳ期的差异蛋白质标记物,他们M/Z强度是依次降低的,各期依次降低幅度比较明显(P<0.05);正常儿童和Ⅰ期均高表达,但Ⅰ期强度低于正常儿童;M/Z强度愈高,分期愈低,预后愈好。3.盲法验证模型:蛋白质芯片的分期比CT分期准确性高,与病理结果基本一致,可弥补CT分期在生物学特征定性问题上的缺陷和不足,构建的蛋白质特异性标记物在术前较准确地进行肾母细胞瘤的临床分期和定性,弥补临床辅助检查的不足。4.通过质谱法结合SVM所得出的M/Z峰值,更精确地从成千上万个峰值中筛选出特异性高、敏感性强的蛋白质标记物,为以后肾母细胞瘤的特异蛋白质的分离和提纯提供了一种全新的思路和依据。

雷太龙[10]2017年在《基于机器学习方法的药物毒性的理论预测研究》文中研究说明毒性是导致候选药物开发失败的主要原因之一,为了有效提高药物开发的效率和成功率,需要在药物研发的早期阶段对化合物的毒性进行评价并将毒性较强的化合物尽早排除。毒性的实验评价成本高、周期长、工作强度大,因此发展高效可靠的毒性理论预测和虚拟高通量筛选模型具有重要的意义。在本论文中,我们采用多种机器学习算法,构建了针对急性毒性、呼吸道毒性和泌尿系统毒性的理论预测模型,并探讨了不同机器学习算法的性能和适用情况。主要研究内容及结论如下:(1).基于包含7385个化合物的大鼠经口急性毒性的大型数据集,采用相关向量机、支持向量机、k-最近邻回归、随机森林、局部近似高斯过程、多层感知器集成和极限梯度提升算法等技术构建一系列回归预测模型。采用了卡方统计量对分子描述符和分子指纹(PubchemFP或SubFP)进行了混合数据降维。在所有预测模型中,基于拉普拉斯核函数的相关向量机模型对测试集具有最优的预测能力(qe2xt=0.669~0.689)。此外,我们还构建了多个一致性预测模型,最优的一致性预测模型对测试集中的化合物可以实现较为准确的预测(qext2=0.689)。最后,我们对一些与毒性密切相关的分子描述符和分子指纹进行了深入分析。(2).基于一个包含多个呼吸道毒性终点的小鼠数据集,采用相关向量机、支持向量机、正则化随机森林、极限梯度提升、朴素贝叶斯和线性判别分析算法构建了多个呼吸道毒性回归和分类预测模型。为了确定最优的分子描述符子集,采用标准化一卡方统计量过滤—单变量过滤rfSBF-递归特征消除RFE-RF的四级策略对原参数集进行了降维。在所有预测模型中,基于高斯径向基核的支持向量机模型对测试集的化合物定量预测精度最优(qe2xt=0.707),而极限梯度提升模型对测试集的化合物分类预测效果最优(测试集:MCC=0.644、AUC=0.893、灵敏度=82.24%、特异度=83.21%、全局精度=82.62%)。此外,我们还采用了多种方法分析了模型的应用域,并用杠杆方法确定了训练集中的41个响应异常值分子(hi>0.004)、23个结构性影响的异常值分子(标准化残差>3)和31个强影响分子(Cook距离>0.00388)。最后,我们对回归预测误差较大以及错误分类的化合物的结构特征进行了系统分析。(3).基于一个含有不同泌尿系统毒性终点的小鼠数据集,采用多种机器学习算法(支持向量机、相关向量机、正则化随机森林、C5.0决策树、极限梯度提升、Adaboost.M1、支持向量机提升和相关向量机提升算法)构建了多个回归和分类预测模型。用于回归和分类的最优的分子描述符子集的选择采用了基于随机森林的递归特征消除方法。在所有预测模型中,基于高斯径向基核的支持向量机提升模型对测试集的定量预测精度最优(qext2=0.845),而基于高斯径向基核的支持向量机提升模型对测试集的分类效果最佳(测试集:MCC=0.787、AUC=0.893、灵敏度=89.58%、特异度=94.12%、全局精度=90.77%)。此外,我们还使用了多种方法分析了模型的应用域,并用杠杆方法确定了训练集中的3个响应异常值分子(hi>0.762)、4个结构性影响的异常值分子(标准化残差>3)和10个强影响分子(Cook距离>0.02797)。最后,我们对具有较大回归预测误差的化合物及错误分类的化合物的结构特征进行了系统分析。(4).此外,我们还研究了几种新型机器学习算法的性能和适用性,相关向量机、极限梯度提升和支持向量机提升算法的性能较好,而正则化随机森林和局部近似高斯过程回归算法的性能则有待提高。

参考文献:

[1]. 人工神经网络软件包的开发及其在药物分析中的应用[D]. 白景清. 沈阳药科大学. 2003

[2]. 中药香豆素类化合物的超临界CO_2萃取工艺及产物的非破坏质量监控的实验研究[D]. 弥宏. 吉林大学. 2007

[3]. 投影寻踪模型及其在水土资源中的应用[D]. 赵小勇. 东北农业大学. 2006

[4]. 金属材料压印凹凸小类别字符的识别研究[D]. 赵巍. 昆明理工大学. 2008

[5]. 人工神经网络辅助HPMC缓释片处方设计[D]. 范彩霞. 浙江大学. 2004

[6]. 化学生物信息学新方法及其在医药研究中的应用[D]. 曹东升. 中南大学. 2013

[7]. 人工免疫系统动力学模型及其在优化控制中的应用[D]. 谭光兴. 华南理工大学. 2006

[8]. 综放面瓦斯爆炸危险性非线性分析模型及应用[D]. 严敏. 西安科技大学. 2009

[9]. 肾母细胞瘤血清蛋白质标记物检测与分期模型构建研究[D]. 陈新让. 郑州大学. 2007

[10]. 基于机器学习方法的药物毒性的理论预测研究[D]. 雷太龙. 浙江大学. 2017

标签:;  ;  ;  ;  ;  ;  ;  

人工神经网络软件包的开发及其在药物分析中的应用
下载Doc文档

猜你喜欢