QSAR分析结合实验方法用于T细胞表位快速筛选的研究

林治华^[1]2003年在《QSAR分析结合实验方法用于T细胞表位快速筛选的研究》文中研究指明蛋白质抗原结构与免疫原性关系的研究推动了分子免疫学与结构免疫学的发展，而后者又迫切要求从分子水平更深入地认识复杂的免疫现象。人们已认识到蛋白质抗原并非通过其完整分子发挥功能，而是通过其表位(epitope)体现其特异性。因此，如何进行表位的筛选就成了加快疫苗开发周期的一个重要研究课题，也是其瓶颈问题。而就某一蛋白质抗原而言，有B细胞表位、辅助性T细胞(helper T lymphocyte，Th)表位、CTL(Cytotoxic T lymphocyte，细胞毒性T细胞)表位等与免疫识别密切相关的结构，其中也存在毒性或抑制性表位、优势非中和性表位、病理与自身抗原交叉反应性表位等于保护性免疫不利的因素；另一方面，由于许多天然抗原引发的免疫反应不能满足预防感染或预防发病的需要，为了提高蛋白质抗原的保护性，就必须在表位水平上做出选择、改造以得到更理想的疫苗分子，而这一切必需建立在表位筛选、鉴定的基础上。但对于一个已知序列的蛋白抗原，若单纯用实验的方法来鉴定其表位，常需要合成大量交迭肽或将其全基因裂解为众多小片断加以转染和表达，进而通过多肽结合或免疫功能实验进行筛选和鉴定，这一技术路线费时费力；反之，如先通过表位的预测使待选多肽片断的范围大大缩小，再用相应的实验来鉴定，往往可取得事半功倍的效果。本研究中，我们尝试将定量构效关系(Quantitative Structure Activity Relationship，QSAR)研究的理论和方法用于Th细胞表位以及CTL表位的定量预测中，并借助相应的实验技术进行鉴定，力求建立新的T细胞表位快速筛选的技术平台。Th细胞表位在激发Th细胞免疫反应过程中起着十分重要的作用。当外源性抗原被抗原呈递细胞(antigen-presenting cell, APC)捕获后，蛋白质抗原在内吞系统被裂解成多肽片段，其中的Th细胞表位与MHC II类分子结合，被转运至APC表面供T细胞受体(T cell receptor, TCR)识别，从而激发Th细胞免疫应答，发挥免疫调节作用。由于MHC II类分子的结合槽两端为开口结构，允许与之结合的多肽在氨基和羧基两端均可有一定的延长，故Th细胞表位通常是由9~25个氨基酸残基组成，对其氨基酸序列特征的了解将有助于亚单位疫苗分子的设计与研制以及增加对免疫系统的更进一步<WP=11>的理解。因此，Th细胞表位的预测以及在此基础上进行结构改造将具有重要的理论价值和实际意义。我们结合氨基酸的理化性质与拓扑学方法，构建了能表征Th表位序列结构及电性特征的电子-拓扑参数。在参数构建过程中，将各氨基酸侧链分别看成一个整体即以拟原子(pseudo atom)的方式来处理氨基酸侧链，从而使得参数构建大大简化。在进行Th表位序列的定量构效关系(QSAR)研究时，将属于不同MHC II限制性亚类的Th细胞表位分为两大类，即待预测MHC II限制性亚类的Th细胞表位为一类，称为有活性，记为“+”，其值赋为1；其余各MHC II限制性亚类的Th细胞表位一并作为另一类，称为无活性，记为“-”，其值赋为0。借助多元线性回归技术建立Th表位的电子-拓扑参数与其活性(这里指所属的MHC II限制性亚类)的定量关系模型，运用所建模型对Th表位序列的活性进行估算，如计算出某一Th表位序列的活性值接近1(大于0.5)，则认为其属于待预测MHC II限制性亚类的Th细胞表位；反之，其活性值接近于0(小于0.5)，则认为其不属于该MHC II限制性亚类的Th细胞表位。据此，对从文献中收集的28个属于不同MHC II限制性亚类的Th细胞表位进行了预测，仅有2个被错误分类，随机抽样检验(Random Sampling Validation)与交互检验(Cross Validation)结果进一步表明了该方法的有效性。另一方面，CTL 表位(Cytotoxic T lymphocyte epitopes)在CTL 活化过程中扮演着十分关键的角色，决定了CTL的特异性杀伤效应，从而在机体抗感染和抗肿瘤免疫中发挥着极为重要的作用。近年来，实验方法的发展使得越来越多的CTL表位得以鉴定，并建立了相应的数据库(http://www.unituebingen.de/uni/kxi/downld.htm和http://wehih.wehi.edu.au/mhcpep)；加之，对抗原呈递机制认识的加深，尤其抗原肽与MHC I类分子结合规律得以深层次阐明；肽库技术、计算机科学的发展和介入等，使CTL表位预测方法获得了较大的进展，其预测的效率不断提高。理想的CTL表位预测方法可大大提高表位鉴定的准确率，进而可以阐明更多的病原体、肿瘤和自体抗原的CTL表位，这不仅可以捉进我们对CD8+ T细胞免疫识别机制的深入认识，也为基于CTL表位的多肽或基因疫苗研制开辟了广阔的空间。目前，关于CTL表位预测的方法较多。从简单基序、延展基序到量化基序，这些方法都是在对大量已知CTL表位进行统计所得的定性或半定量结果，它们在排除假阴性方面较好，即有较高的阴性预测值，但假阳性率较高。随着计算机技术的发展，各种智能算法被引入到CTL表位的预测之中，以提高其预测的准确率，如神经网络算法、遗传算法以及隐藏马尔可夫算法等。这些智能算法的引入在提高CTL表位预测的准确率方面也确实收到了一些成效，如提高了阳性预测率。但由于上述预测方法没有从MHC I类分子与CTL表位相互识别的结构基础出发，在表位预测及结构改造方面很难<WP=12>有较大的突破。特别是

梁桂兆^[2]2007年在《生物序列表征体系构建及结构与功能关系研究》文中认为生物序列(肽、蛋白质及核酸)结构表征是其结构与功能关系研究中的重要内容及关键前提,序列表征描述子是否能够合理地反映与其功能密切相关的结构信息,决定其结构与功能关系研究的成败。因为决定生物序列功能的结构信息被编码在其一级序列之中,因此,解析其一级序列特征对于生物序列的结构与功能关系研究至关重要。文中综合考察各种生物序列的一级序列特征,构建了两种生物序列结构表征体系,包括:①收集20种天然氨基酸的516种多维性质参数,经因子分析得广义氨基酸信息因子分析标度(FASGAI);②收集5种碱基的1209种多维性质参数,经主成分分析得广义碱基性质得分(SGBP)。研究结果显示,两种表征体系都具有物理化学意义明确,表征能力强,拓展性能好及操作简便等优点。将FASGAI分别用于苦味二肽、血管紧张素转化酶抑制剂及阳离子抗菌肽的定量构效关系(QSAR)研究,人免疫缺陷病毒蛋白酶(HIV PR)裂解位点预测及特异性分析,HLA-A*0201限制性T细胞表位及人类1型双载蛋白SH3结构域亲和肽的QSAR研究,都取得较好的结果。研究显示,苦味二肽的生物活性与其第1残基的体积性质,第2残基的体积性质与疏水性等性质可能存在较大的正相关关系,而与其第2残基的α-螺旋与转角倾向等性质可能存在较大的负相关关系;血管紧张素转化酶抑制剂活性的第2残基的体积性质与疏水性及第1残基的静电性等性质参数的增大可能有利于其活性的提高,而第2残基的构成特征等性质参数的增大可能易导致其活性的降低;阳离子抗菌肽的第10残基的静电性质,第7残基的体积性质,第12残基的疏水性及第3残基的静电性等性质可能对抗菌活性产生较大的正贡献,而第6残基的疏水性及构成特征,第10残基的疏水性等性质可能对抗菌活性产生较大的负贡献;对HIV PR裂解位点预测及特异性分析知,HIV PR可能识别8肽序列中特定位点的关键特征,第1、2、4、5和6残基的体积性质、二级结构信息、静电性质及疏水性等可能是决定HIV PR是否裂解的重要因素,特别地,体积性质可能是HIV PR被识别的重要特征;HLA-A*0201限制性T细胞表位的第3残基的体积性质与疏水性,第2残基的体积性质及第9残基的疏水性等性质可能对亲和性的正贡献较大,而第4残基的疏水性及第3残基的局部柔性等性质可能对亲和性的负贡献较大;分析影响具有10个残基(P-5P-4P-3P-2P-1P0P1P2P3P4)的人类1型双载蛋白SH3结构域亲和肽亲和性的关键作用力知,第P-3与第P2之间残基(含P-3与P2残基)的相应性质可能对亲和性影响较显着,特别地,第P-3残基的静电性质与疏水性可能对于其亲和性的正、负贡献分别相对最大。发展了全新的不依赖于序列同源性及结构相似性的蛋白结构与功能预测方法。将FASGAI分别用于碱性螺旋-环-螺旋(bHLH)蛋白,蛋白质的β-转角结构,G蛋白偶联受体家族及高致病性禽流感病毒血凝素蛋白分类或识别研究。结果显示,对bHLH蛋白分类影响较显着的变量大多来自其功能基序(第1到第13残基)的第5、8、9及13等位点,少数来自第4、6、10及12等位点,表明这些相应位点的变量可能是DNA亲和区域的一些重要识别特征,方差分析显示,在第5、8、9及13位点,除了第8残基的局部柔性与第9残基的体积性质外,其它性质都存在不同程度的显着差异,利用这些差异可较好地分类bHLH蛋白;β-转角结构预测结果表明,FASGAI可较好地表征β-转角残基特征,且其能提供β-转角的一些重要特征信息;经FASGAI表征,自交叉协方差(ACC)转换,支持向量机(SVM)建模用于G蛋白偶联受体家族及高致病性禽流感病毒血凝素蛋白识别所得结果显示,FASGAI是一种优良的蛋白序列结构表征方法,同时,FASGAI-ACC-SVM方法为G蛋白偶联受体家族及禽流感病毒血凝素蛋白识别提供了新的研究思路。将SGBP分别用于大肠杆菌启动子的启动强度及人类基因启动子预测,都取得较好的结果。研究表明,大肠杆菌启动子(-49 bp到+19 bp)的-45,-38,-28,-27,-22,-21,-5,+4,+8,+14及+15等位点碱基的性质可能对启动强度具有较显着的影响,这为启动子的启动强度预测及序列设计提供了可能。以SGBP表征,ACC转换,SVM建模预测人类基因启动子(-250 bp到+50 bp),所得结果不同程度地相当于或优于其它所对比的预测方法。SGBP-ACC-SVM过程建模可以进一步尝试用于其它启动子识别,mRNA转录特性与RNA二级结构预测等。针对性地比较研究了各种QSAR建模与模式识别方法,特别是偏最小二乘(PLS)、线性判别分析(LDA)及SVM等在生物序列结构与功能关系研究中的应用,其中包含了对变量筛选、参数选择及模型验证等内容的研究和讨论。结果表明,PLS可较好地解决变量数较多且存在多重共线性的情况。LDA用于模式识别所得结果稳健,模型易解释。SVM能较好地解决小样本、非线性、高维数和局部最小等问题,使其在生物序列结构与功能关系研究中具有广阔的应用前景,但其在参数设置等问题上有待进一步研究,文中探索性地将响应面分析法用于SVM的参数设置,结果证明该方法对于其参数设置是较有效的。文中选择性地采用逐步多元回归、遗传算法及逐步方法筛选变量,研究发现,叁种方法都可较好地去除原始变量中的噪声信息。文中通过内部和外部双重验证评价模型质量,采用的内部验证方法有自检验、留一法及留组法验证等,在内部验证的基础上,利用预测集样本对模型进行外部预测能力评价,以确保所得模型的有效性。

孙明伟^[3]2014年在《MHC I类分子递呈修饰后抗原的结构与免疫学研究》文中研究指明主要组织相容性抗原复合体(MHC)是一种存在于脊椎动物中的由一个庞大的基因家族编码的细胞表面分子,介导白细胞,也就是常说的免疫细胞与其它白细胞或体细胞间的相互作用,在机体细胞间识别和区分自已与异己中扮演重要角色。MHC分子作为表达于个体细胞表面的抗原递呈结构,影响着不同来源抗原的T细胞反应。因而,MHC在一定程度上决定了个体对于感染物抗原的免疫应答,这其中也涉及到对疾病的易感性和自身免疫反应的发生。在人类中,MHC又叫做人类白细胞抗原(HLA)。在细胞内,经过抗原加工和蛋白酶体降解途径产生的多肽作为T细胞表位,由MHCI类分子递呈给细胞毒性T细胞(CTLs)。该过程在效应细胞免疫中发挥着重要的作用。另一方面发生了各种翻译后修饰(PTMs)的真核蛋白能够产生一系列修饰的抗原,丰富了MHC相关多肽的类型,递呈于细胞表面成为T细胞受体(TCR)识别的潜在目标。已有研究表明,一些包含翻译后修饰(如甲酰化、脱酰胺化、糖基化、乙酰化、磷酸化和半胱氨酸化)的多肽可以与各自的非修饰类似物被T细胞特异性地区分开。在某种情况下,发生于感染、炎症、细胞转化、凋亡和衰老中的翻译后修饰往往带来新的MHC相关新抗原的产生。因此,表位中的翻译后修饰以及它们在作为肿瘤和自身免疫疾病的免疫治疗疫苗候选中的应用价值受到越来越多的关注。N端乙酰化作为真核蛋白最普遍的翻译后修饰之一,能够产生一系列N端乙酰肽,并由MHC I类分子递呈于细胞表面。虽然这一修饰类型在调节蛋白质降解中扮演重要角色,然而N端乙酰肽的递呈及T细胞识别的分子基础仍然很不清楚。因此,我们解析了HLA-B39与一段天然N端乙酰化多肽的复合物高分辨率晶体结构,以及B39与非修饰多肽的复合物结构。区别于传统非修饰多肽中暴露于A口袋外部的P1残基侧链,乙酰化P1-Ser的羟基侧链则是插入抗原结合槽的A口袋中,而NH2端乙酰基团突出结合槽外参与T细胞识别。此外,N端乙酰化不仅改变了多肽的构象,还显着地造成了B39的α1-螺旋残基的构象摆动,而这可能将影响到TCR结合与免疫识别。N端乙酰肽和一系列人源和鼠源的MHC I类分子的热稳定性检测显示了其普遍降低的稳定性。以人工合成的N端乙酰化HLA-A2限制性表位免疫HLA-A2.1/Kb转基因小鼠激发的CTL应答也表明表位在N端乙酰化以后免疫原性会显着提高。这些发现首次洞察了经典的MHC I类分子对N端乙酰肽的特异性递呈模式,为基于乙酰化表位的免疫治疗和疫苗研发奠定了基础。在以上工作基础上,我们又以A型流感病毒表位为研究对象,从预测和鉴定N端乙酰化的流感病毒CTL表位出发,调查了流感病毒N端乙酰化抗原在健康人群中的T细胞免疫反应水平,进而评价流感病毒潜在N端乙酰化抗原的细胞免疫原性。研究中首次鉴定了病毒来源的N端乙酰化T细胞表位及其在健康个体中激发的特异性T细胞响应,为研究N端乙酰化表位特异性CTL免疫反应提供了试验依据,丰富了翻译后修饰的T细胞免疫表位的范畴,为理解翻译后修饰依赖性的T细胞免疫反应提供了帮助。除了N端乙酰化修饰外,磷酸化作为癌变、恶性转化和凋亡等生理活动的重要标识在肿瘤免疫治疗策略中的应用也越来越引人关注。在邻近两个位点的协同磷酸化又是磷酸化修饰组中最为常见的形式。因此,我们通过X-射线晶体学方法分别解析了一对(10肽和9肽)双磷酸化多肽与HLA-B27的pMHC复合物结构。其结果不但展示出双磷酸多肽不同于单个位点磷酸化多肽的独特递呈特征,而且在将双磷酸化多肽结构与单磷酸化多肽及未修饰多肽结构的比较中,还进一步阐明了自身抗原在经过修饰或蛋白质剪切等多重改变后作为新表位被递呈的分子基础。另外,通过圆二色谱检测,我们揭示了磷酸基团对于多肽结合力和pMHC稳定性具有磷酸化位点依赖性的影响。这些结果也为双磷酸肽这种新型翻译后修饰下的抗原加工递呈研究提供了首次结构学及热动力学依据,进一步预示了多位点磷酸化对于多肽免疫原性和T细胞识别中的潜在影响,揭示了多位点磷酸化形式的潜在T细胞表位亟待作为抗原鉴定中首要考虑和挖掘的目标。多位点磷酸肽有望成为治疗自身免疫病和癌症等的疫苗或药剂成分。除此之外,基于前人的研究结果,我们通过多肽免疫转基因小鼠的方法分别评价了7条A2限制性磷酸化表位的细胞免疫原性,客观评估了磷酸化多肽作为肿瘤疫苗的潜在应用价值。此外,研究还采用5'-RACE技术为免疫优势磷酸化特异性T细胞受体序列的获得提供了方法学依据。总之,通过免疫信息学、小鼠模型、细胞生物学和结构晶体学等方法,我们分别对MHCⅠ类分子递呈N端乙酰化和磷酸化多肽提供了免疫学及结构学调查和评价,展示了同一来源的抗原经添加基团及蛋白质剪切等修饰成为多重改变的自身抗原的面貌和机制,揭示了这些翻译后修饰多肽作为MHCⅠ类抗原的递呈机制及其在T细胞识别中的潜在影响,进而探讨了其在免疫治疗和疫苗设计中的应用价值。

陈婷^[4]2011年在《叁维氨基酸描述子在肽类定量构效关系研究中的应用》文中研究表明近年来,定量构效关系(Quantitative Structure Activity Relationship, QSAR)作为一种间接方法,在计算机辅助药物分子设计中得到了广泛的应用,并已经成为一种不可或缺的工具。进行QSAR研究的关键前提和重要组成部分是分子结构参数化。众所周知,氨基酸的序列中隐藏着肽和蛋白质的功能信息及空间结构。因此,氨基酸的结构信息对肽的QSAR研究至关重要。此外,由于叁维(Three dimension,3D)描述子能够直接反映受体和底物在分子作用过程中的非键合相互作用特征,因此据此所建的定量构效模型在物化意义上更为明确。本文将叁种从生物分子的最基本结构特征出发,并综合立体、电子、疏水效应和分子整体叁维结构信息,以及内部原子之间相互作用和外部分子影响的叁维氨基酸描述子,引入几种肽类药物的结构与生物活性的QSAR模型,为将来此类药物分子的功能预测提供了理论指导。此外,文中将全部样本划分为训练集和测试集两个部分,由训练集样本建立QSAR模型,采用留一法(leave one out, LOO)内部验证对模型进行质量评价,并使用多种评价函数,对模型的外部预测能力进行了评价,确保了模型的真实有效性。本文开展的具体工作有：(1)将从20种天然氨基酸叁维信息中提取出的721个描述子变量经过主成分分析(principal component analysis, PCA)而得到的叁维氨基酸描述子-SVTD(Scores Vector of Three Dimension Descriptors),应用于21个后叶催产素及65个HLA(human leukocyte antigen)-A*0201限制性CTL(cytotoxic T lymphocyte)表位肽样本的定量构效研究中,取得了理想的结果。使用多元线性回归(multiple linear regression, MLR)建模,同时采用内部和外部双重验证的办法对所建模型的稳定性进行深入分析和检验。对于后叶催产素样本,所得模型的相关系数(Rum)、留一法交互校验(Cross-validation, CV)相关系数(Rcv)和外部样本校验相关系数(Qext)分别为0.981,0.962,0.966。对于HLA-A*0201限制性CTL表位肽样本,所得模型的相关系数(Rcum)、留一法交互校验相关系数(Rcv)和外部样本校验相关系数(Qext)分别为0.949,0.899,0.922。结果表明SVTD描述子能很好地表征肽类分子的结构信息,所建模型具有很好的拟合能力和预测能力,为该类药物的开发提供了理论指导。(2)将从20种天然氨基酸的空间构型中得到的WHIM(weighted holistic invariant molecular)描述子进行主成分分析得到的权重整体不变分子指数主成分得分矢量VSW (vector of principal component scores for weighted holistic invariant molecular index),应用于152个HLA-A*0201限制性CTL表位肽以及101个阳离子抗菌肽样本的定量构效关系研究中。对于HLA-A*0201限制性CTL表位肽样本,所得模型的相关系数(Rcum)、留一法交互校验相关系数(Rcv)和外部样本校验相关系数(Qext)分别为0.806,0.756,0.693。对于抗菌肽样本,所得模型的相关系数(Rcum)、留法交互校验相关系数(Rcv)和外部样本校验相关系数(Qext)分别为0.869,0.834,0.702。结果表明VSW描述子可用于肽类药物的活性预测和新型药物的分子设计。(3)将从天然氨基酸中得到的23种电子作用力,37种空间作用力,54种疏水作用力和5种氢键作用力进行主成分分析得到的分离物化性质得分DPPS(divided physicochemical property scores),应用于58个血管紧张素转化酶抑制剂和25个HLA-Cw*0102表位肽的定量构效研究中。对于血管紧张素转化酶抑制剂样本,所得模型的相关系数(Rcum)、留一法交互校验相关系数(Rcv)和外部样本校验相关系数(Qext)分别为0.943,0.909,0.916。对于HLA-Cw*0102表位肽样本,所得模型的相关系数(Rcum)、留一法交互校验相关系数(Rcv)分别为0.868,0.795。结果表明DPPS描述子因其明确的物化含义,可以用于定量构效关系模型的解释,因而可用来指导新型高活性分子的设计。

韩娜^[5]2013年在《基于高维特征选择的定量序效关系研究》文中研究说明定量序效关系主要从生物分子一级序列出发定量研究序列与活性(性质)之间的内在联系,并给出恰当的函数描述,从而达到对未知目标功能预测及指导结构修饰和改造等目的。特征表征和特征筛选是定量序效研究中的两个重要问题。合理的特征表征是决定定量序效研究的重要前提。一级结构决定了序列的高级结构与功能,且高级结构甚难测定而一级结构简便易得,本文提出了仅基于序列的直接表征法和地统计学关联与多尺度组分结合(Geostatistics Correlation-multi-scale Component, GC-MSC)表征法两种特征参数方提取法。直接表征法以531个物化性质参数(对多肽序列)和1123个拓扑结构参数(对碱基序列)对分子序列逐位替换,但要求样本序列长度统一。GC-MSC基于单个氨基酸或碱基的性质参数将地统计学关联与多尺度组分相结合,有效提取序列间的上下文关联、组分信息,具有计算简便、适于不等长序列等优点。特征筛选是定量序效关系研究中的另一个关键。无关和冗余特征将影响预测精度并对模型解释带来困惑。从m个特征中选取最优特征子集理论上有2m种可能,在m较大时无法穷举。本文提出一种基于支持向量机并引入有条件随机矩阵的二元矩阵重排过滤器和多轮末尾淘汰相结合的高维特征筛选方法,能够有效地筛选出意义明确的特征,且具计算简单、筛选速度快等优点。论文从序列表征和特征选择两个方面出发,以支持向量机(Support Vector Machine, SVM)作为基本工具,对152个HLA-A*0201限制性CTL表位、IEDB数据库中4个HLAⅡ分子结合肽综合数据集、38个E.coli启动子启动强度进行了定量序效关系研究,结果报道如下：1.CTL表位鉴定。采用天然氨基酸531个理化性质参数表征HLA-A*0201限制性表位9肽,从531x9个初始描述子出发,经二元矩阵重排过滤器粗筛和多轮末尾淘汰精细筛选,获得18个物化意义明确的保留描述子。以支持向量回归构建定量序效模型,其拟合、留一法交互验证以及外部预测的R2、Qcv2、Rext2、Qext2和RMSEext分别为0.957、0.708、0.817、0.818和0.366,明显优于文献报道。通过对全组合虚拟9肽的预测,得到了多条预测活性高于已知表位肽的9肽,为高活性多肽疫苗分子设计提供了切实指导。2. MHC Ⅱ类分子结合肽预测。基于氨基酸531个理化性质参数,以GC-MSC提取IEDB数据库中4个人类MCHⅡ(HLAⅡ)分子结合肽不等长氨基酸序列的描述子,经二元矩阵重排过滤器和多轮末尾淘汰对获得高维特征集筛选后,各数据集描述子个数均大幅度减少,且基于保留描述子构建的QSAM精度明显提高。3. E.coli启动子启动强度预测。基于碱基1123个拓扑结构参数,以直接表征法和GC-MSC分别表征大肠杆菌启动子序列,产生的高维特征经相关性分析、二元重排矩阵过滤器筛选后,分别保留20和27个描述子,以偏最小二乘回归(Partial Least Square Regression, PLSR)构建的QSAM模型Q_(cv)~2分别为0.806、0.843,以SVM构建的QSAM模型Q_(cv)~2分别为0.838、0.882。通过对保留描述子与启动强度关系的分析,发现大肠杆菌启动子启动强度与某些碱基子串及序列特定区域的相关碱基性质显着相关,对大肠杆菌新型强启动子的设计具参考价值。

孙战强^[6]2007年在《基于环氧合酶-2的食管癌广谱抗原肽的设计、合成及鉴定》文中认为食管癌(ECC)是我国以及其他一些经济相对不发达国家部分地区的高发肿瘤，特别是河南省最高。其中，鳞癌约占90％。由于肿瘤本身易侵袭转移和复发的生物学特性，使传统的手术、放疗和化疗效果比较局限，5年存活率低于10％。发展食管癌新的治疗方法迫在眉睫。由于肿瘤的疫苗治疗没有明显的毒副作用，所以近年来发展很快，提高肿瘤的免疫原性，制备高效的肿瘤疫苗特别是覆盖广泛人群的多价疫苗已成为免疫治疗的热点。另外，免疫反应一旦启动，其效果就不受肿瘤细胞的分型、分化状态的限制。近几十年来，免疫系统在控制肿瘤方面的研究取得了长足进展，大量证据显示源于肿瘤相关抗原(TAA)的HLA限制性抗原肽介导的CTL在肿瘤细胞免疫方面扮演着重要角色，CTL能够直接溶裂肿瘤细胞及分泌有直接杀伤肿瘤细胞的细胞因子如IL-2、TNF、GM-CSF、IFN-γ等。另外，临床研究证实，肿瘤患者能够介导表位特异性CTL起到抗肿瘤细胞免疫作用。TAA抗原肽的鉴定为抗原特异性免疫治疗及设计新的治疗性疫苗提供了便利。虽然肿瘤相关抗原的发现促进了抗原特异性疫苗及T细胞免疫治疗的发展，但受限于广泛高表达于食管癌的抗原，而COX-2正是这样的抗原。此外，COX-2过度表达与多种上皮性肿瘤发生发展关系密切，并且发现许多抑制环氧合酶的药物能够预防和治疗某些肿瘤的发生、发展，可作为预防和治疗肿瘤的靶分子。由于恶性肿瘤的部分HLA等位基因表达下调，单一HLA限制性表位容易发生免疫逃避而丧失免疫活性。在本研究中，我们鉴定了一个源于食管癌广泛高表达抗原COX-2的新的CTL表位——P479，该肽能分别有效激发HLA-A2和HLA-A3超型限制性CTL应答，与单一HLA分子限制性CTL表位相比，多HLA等位基因限制性抗原肽有多方面的优点。一是免疫靶点的广谱性。据统计，仅HLA-A2与HLA-A3两个超型在中国人中的总平均分布频率就超过85％，而同一超型识别的肽序列非常相似。因此，采用同时与几种超型具有亲和力的广谱表位就有可能成为覆盖大部分人群的肿瘤表位肽，能够克服MHC多态性的障碍，为研制出覆盖大部分人群的肿瘤表位疫苗奠定基础。其二是有助于克服免疫逃避。肿瘤细胞丢失某一HLA等位基因是恶性肿瘤逃避免疫监视的重要途径，因此该HLA-I限制性特异抗原介导的CTL就不能识别肿瘤细胞。对于同时表达HLA-A2和HLA-A3的患者，如果其肿瘤细胞仅仅是HLA-A2或HLA-A3的缺失，本研究中筛选出的P479仍然可以引起特异性免疫反应。随着生物信息学和分子免疫学技术的发展，人们已筛选出大量的CTL表位，通过计算机模拟可以快速高效地进行抗原肽分子设计。本研究以矩阵法(Matrices)、叁维定量构效关系(3D-QSAR)及蛋白酶体酶切位点分析，对COX-2抗原的HLA-A*0201／03限制性CTL表位进行预测，从而设计源于COX-2的能同时被HLA-A*0201／03提呈的候选肽。在特异CTL功能评价方面，传统并沿用至今的CTL检测技术为~(51)Cr释放杀伤实验及有限稀释法，是通过T细胞群体中的特异性CTL去识别和选择被放射性核素标记的特异性靶细胞，以其被CTL杀伤的百分率来显示CTL的杀伤活率。ELISPOT是近年来建立的一种检测细胞因子分泌量的新方法，可在体外评价病人PBMC中抗原特异性T细胞的数量和功能状态。它是目前肿瘤抗原治疗中应用最广的免疫检测指标之一。ELISPOT能更准确地反映T细胞在体内的情况，但仍依赖一定时间的肽诱导以产生细胞因子，会低估总的特异性CTL数量。因此，对CTL表位应该从诱导CTL细胞分泌相关细胞因子、递呈过程及杀伤靶细胞等多方面综合评价。本研究进行了多肽体外诱导CTL的杀伤实验。该实验表明，P479九肽刺激的效应细胞，对HLA-A3~+ COX-2~+的EC-1和HLA-A2~+ COX-2~+的EC-9706细胞具有特异性杀伤作用。相同的结果在ELISPOT实验也得到验证，经P479介导的CTL分泌IFN-γ的量均高于阴性对照(P＜0.01)。以上结果显示，P479是一个多等位基因肿瘤抗原肽，能激发COX-2阳性ECC的特异性免疫应答，是一个食管癌的广谱CTL表位。

李润乐^[7]2015年在《新型肝片吸虫多表位疫苗的研究》文中指出本课题组依据机体对肝片吸虫的免疫保护机制和表位疫苗的构建理论,合理选择肝片吸虫鞘脂激活样蛋白2(Fh SAP-2)的Th和B细胞抗原表位,结合生物信息学软件的分析,设计出一个结构新颖的多表位疫苗CTB-SAPE、两个单表位疫苗CTB-S1和CTB-S2。进一步通过基因克隆、表达及蛋白纯化等技术,获得该疫苗的重组蛋白,继而利用免疫学实验鉴定了多表位疫苗CTB-SAPE的免疫原性和免疫特异性。实验方法及结果简述如下:1、肝片吸虫鞘脂激活蛋白样蛋白2(Fh SAP-2)的原核表达及分离纯化生物信息学软件Optimum TM Codon优化密码子适应指数(CAI)、最优密码子频率(FOP)及GC含量以获得适合大肠杆菌BL-21表达的Fh SAP-2基因序列,并克隆到原核表达载体p ET22b和p ET28a中,经IPTG诱导其表达并经亲和层析及离子交换色谱纯化后获得目的蛋白。结果 Optimum TM Codon获得优化后的Fh SAP-2序列,经测序及酶切鉴定结果表明重组质粒p ET22b-Fh SAP-2、p ET28a-Fh SAP-2构建成功,进一步实验结果表明Fh SAP-2在p ET28a中包涵体部位表达,可溶部位不表达;在p ET22b中可溶部位表达量低,包涵体部位无表达。继而经Ni-NTA柱亲和纯化及离子交换色谱纯化获得电泳纯的Fh SAP-2蛋白。2、多表位疫苗CTB-SAPE的设计及重组表达载体的构建本课题组在前期文献调研基础上合理选择Fh SAP-2优势B和Th细胞抗原表位,通过表位疫苗的构建理论和生物信息学分析,对Fh SAP-2抗原表位的连接顺序、间隔序列(Linker)和表位拷贝数,加以分析和确定,为了更好地激活粘膜免疫,在疫苗的设计中引入了分子内佐剂CTB,最终设计出具有科学合理结构的肝片吸虫多表位疫苗CTB-SAPE,并在此基础上设计两个单表位疫苗CTB-S1和CTB-S2。利用酶切和PCR技术构建了重组表达载体p ETCTB-SAPE、p ETCTB-S1和p ETCTB-S2,并将其转入BL21(DE3)大肠杆菌中。实验结果表明:重组表达载体p ETCTB-SAPE、p ETCTB-S1和p ETCTB-S2与设计序列完全一致。3、新型肝片吸虫多表位疫苗CTB-SAPE的表达与纯化本研究诱导表达各个肝片吸虫表位疫苗抗原蛋白CTB-SAPE、CTB-S1和CTB-S2并经Ni-NTA亲和层析纯化目的蛋白。实验结果表明:CTB-SAPE、CTB-S1和CTB-S2均可获得高效表达,并且主要以包涵体形式表达;经Ni-NTA亲和层析纯化后得到电泳纯的CTB-SAPE、CTB-S1和CTB-S2,为肝片吸虫多表位疫苗CTB-SAPE的免疫原性和免疫特异性研究奠定实验基础。4、新型肝片吸虫多表位疫苗CTB-SAPE免疫原性和免疫特异性的研究本研究通过分子生物学和免疫学等方法来鉴定肝片吸虫多表位疫苗CTB-SAPE中各个抗原表位是否保持有其免疫原性和免疫特异性、分子内黏膜佐剂CTB组分与神经节苷脂GM1的结合活性、肝片吸虫多表位肽疫苗CTB-SAPE的免疫原性是否优越于肝片吸虫单表位疫苗(CTB-S1和CTB-S2)。实验结果表明:肝片吸虫多表位疫苗CTB-SAPE具有良好的免疫原性和免疫特异性,能够激发机体产生特异性的细胞免疫应答和高滴度表位特异性抗体。新型肝片吸虫多表位疫苗CTB-SAPE不同于以往所研制的肝片吸虫疫苗,激发的免疫应答具有更高的免疫针对性和免疫特异性。

唐艳^[8]2005年在《TRP-2_（180-188）CTL表位之APL的设计和评价》文中提出基于表位肽的肿瘤疫苗是肿瘤免疫学治疗的主要方法之一。迄今为止已从60多种人肿瘤抗原中鉴定出170多个抗原表位。其中部分基于表位的疫苗已进入临床试验,结果表明,一方面,多肽疫苗在体内无毒副作用,是一种安全的疫苗形式;另一方面,表位肽疫苗体内免疫原性较差,不能诱发足够强度的免疫反应,抗瘤效果不明显。因此,如何提高表位肽的免疫原性是基于多肽疫苗设计的关键问题。通过替换MHC结合位点(锚固性残基)是提高表位免疫原性最常用的方法之一。其原理是:虽然T细胞受体(T cell receptor, TCR)对MHC-Ⅰ类限制性表位的识别是特异性的,但这种特异性不是指一个TCR只能与单一的肽段结合,而是指一个T细胞受体可以识别一系列具有某些共同特性的肽段,其中包括一些经过修饰的非天然肽段,即修饰的肽配体(altered peptide ligand, APL)。APL与T淋巴细胞相互作用后会诱发不同的效应:增强T淋巴细胞活化(激动剂,agonist)或抑制T淋巴细胞活化(拮抗剂,antagonist)。因此,对于免疫原性较低的肿瘤抗原表位肽,通过特定氨基酸位点的修饰可以找到某些具有活化T细胞作用的表位肽,达到增强免疫原性的目的,从而诱发比天然肽更强的CTL反应。在以往的研究中,黑色素瘤分化抗原MART1/Melan A_((27-35))(AAGIGILTV)1L、gp100_((209-217))(ITDQVPFSV)2M和癌胚抗原CAP-1(YLSGANLNL)6D 3条agonists均已应用于临床试验,并观察到较好的临床疗效。 TRP-2,即酪氨酸酶相关蛋白-2,是一种肿瘤相关抗原,与gp100、MART1/Melan A同属于非变异的黑色素瘤细胞分化抗原。TRP-2抗原不但在黑色素瘤广泛表达,在多形性恶性胶质瘤中的表达率为51.2%,TRP-2_((180-188))(SVYDFFVWL)表位在人和小鼠的黑色素瘤细胞和人神经胶质瘤细胞均能被递呈。因此TRP-2_((180-188))是针对黑色素瘤和神经胶质瘤免疫学治疗的理想靶标。但TRP-2_((180-188))天然表位与前述的3条agonists的天然表位一样,在黑色素瘤病人体内存在大量的表位特异性CTL前体,但这些T细胞却处于免疫耐受状态。因此,将TRP-2_((180-188))天然表位特定位点氨基酸加以修饰,增强该表位的免疫原性,就可能诱发强有力的CTL反应,从而打破机体对肿瘤抗原表位的耐受,逆转在体低亲和力CTL“无能”状态,提高天然表位的抗肿瘤效果。

林跃华^[9]2009年在《猪伪狂犬病毒EP0基因生物信息学分析及TK蛋白的同源模建》文中进行了进一步梳理将四川农业大学动物生物技术中心保存FA株、疫苗株783株、Bartha株和SA215株,四川野毒株SN株、SS株、SQ株、SL株和SCZ株,以及由韶关学院英东生物工程学院娄高明惠赠的北京株BJ株、广东株DG、湖北株HS株共计12株伪狂犬病病毒株,应用PCR技术扩增得到了PRV完整的EP0基因的片段12条,同时以FA株为材料,PCR扩增得到PRV完整的TK基因片段。回收PCR产物,成功连接转化到感受态细胞E.coli DH_(5a)中。通过菌落PCR鉴定正确后,送上海英俊生物公司进行测序。将所有的12条序列连同GenBank中登录的3条EP0基因全序列共15条基因序列,使用生物软件对它们的基因序列的同源性、突变区域的定位、遗传进化关系、CpG岛分析、密码子偏爱性,氨基酸序列的同源性、蛋白质亲水性、抗原表位分析、二级结构等生物信息学的内容进行预测和分析。同时,对猪伪狂犬病病毒FA株、疱疹病毒属的单纯疱疹病毒I型、牛疱疹病毒I型、马疱疹病毒I型、马雷克(氏)病疱疹病毒I型以及水痘带状疱疹病毒的早期蛋白的同源性和进化关系的分析。结果表明:PRV-EP0基因的开放阅读框的核苷酸长度在1230～1233bp,氨基酸长度在409～410个之间,核酸同源性为97.6%～99.9%,氨基酸的同源性在96.6%～100%之间,在EP0基因核酸序列最大的差异是在684～688位之间存在一个AGG缺失突变区,不同毒株基因均对GC极为偏爱。毒株间基因蛋白质亲水性、抗原表位和蛋白质二级结构预测等内容的分析结果十分相似,说明PRV-EP0基因具有很高的保守性。疱疹病毒属间的核苷酸同源性在1.4%～41.4%之间,氨基酸同源性在5.9%～42.0%之间。以PRVFA为材料,克隆测序胸苷激酶(TK)基因,用FASTA程序在蛋白质结构数据库(Brookhaven protein data bank,PDB)中搜索同源蛋白,通过同源模建和分子动力学模拟建立胸苷激酶的3D模型,模型的可靠性经Ramachandran图和Profile-3D图验证。采用InsightⅡ/Binding site和Delphi方法准确定位了胸苷激酶的活性位点,在此基础上,设计出胸苷激酶抑制小分子(N-苯基-N'-甲基脲),通过柔性分子对接方法阐明了胸苷激酶抑制剂与靶酶活性位点的相互作用模式。该研究从病原、分子水平、生物信息等方面对PRV-EP0基因进行了研究,摸清该基因的遗传背景,为以后更进一步研究该基因对PRV潜伏感染状态的建立、维持和再激活的作用。同时同源模建TK蛋白的3D模型,预测该蛋白的活性区域,同时设计了配体,讨论了配体对TK蛋白抑制作用。为研究对猪伪狂犬病新的治疗方案(实现先治疗后预防的新的防制方案)奠定基础。

李书艳^[10]2010年在《单点氨基酸多态性与疾病相关关系的预测及其机制研究》文中提出单点氨基酸多态性(Single Amino Acid Polymorphism, SAP)与人类遗传性疾病密切相关,在基因药理学领域扮演着重要角色。而对于致病性SAP位点的识别可以用于考察药物效率、毒性以及代谢等方面针对特定基因群体的效果,并有助于建立针对个体病人的最优治疗方法。因此,针对致病性SAP位点的预测研究已成为了解分子水平上的致病机理的一个关键性手段,也是当前全基因组范围内研究的热点领域之一。本论文着眼于利用多种数学手段,以SAP与人类遗传疾病的相关关系作为主要研究对象,以探索致病性机理为主要研究目标,进行了一系列的生物信息学实验：首先,探索新型的序列描述符,并力图建立简洁、准确并可靠的SAP位点致病性预测模型,并将所建立的数学模型应用于实际工作当中,对全新SAP位点进行致病性预测,在节省实验成本和缩短实验周期的优势前提下,为实验验证提供强有力的理论支持和筛选后备样本集。而后,根据所建的数学模型和筛选的关键性描述符,在一定程度上提供解释SAP位点与疾病相关性机制的理论参考。接下来,我们从蛋白质翻译后修饰(Post-translational Modification, PTM)角度入手,统计分析因SAP破坏的PTM位点的致病性情况,进一步将致病机理解释深入到不同的PTM类型。最后,我们聚焦于棕榈酸化这一具体的PTM类型,考察分析棕榈酸化位点被SAP破坏以后的致病性情况,为SAP的致病性机制探讨提供了更为深入具体的参考资料。论文的第一章概述了SAP研究的背景、意义和现有数据资源,以及针对SAP疾病相关性的预测原理和方法。然后,对本论文中采用的主要研究方法和步骤进行了具体介绍。论文的第二章着眼于建立一个简洁高效的SAP与疾病相关性预测模型。我们本着要求输入简单、过程简洁、预测准确度高的原则,通过随机森林方法,建立了一个以疾病相关的氨基酸单点突变位点为识别目标的数学模型SubSeqPred。充分利用突变前后氨基酸的物理化学性质,仅利用44个蛋白序列描述符作为输入,避免了同源性和保守性等多种复杂计算,获取的模型达到了较为令人满意的效果。此后,将这一模型应用于SwissProt数据库中未分类的单点氨基酸突变位点中,为其进行了疾病相关性的注释。此外,我们根据此模型建立了全新的在线预测服务器(与模型同名为SubSeqPred),仅需输入蛋白序列和突变位点信息即可预测其疾病相关性。论文的第叁章以PTM为入手点考察疾病相关SAP位点的致病性机制。我们搜索了大量数据库中实验验证的PTM数据样本,将其分别与人类疾病相关的SAP位点、癌症体细胞SAP位点以及中性SAP位点进行匹配,并对相应位点的保守性以及氨基酸突变前后的性质变化作以统计。研究结果发现,在疾病相关SAP数据中约有4.5%的氨基酸替换会通过破坏翻译后修饰而影响蛋白功能。而另一方面,约有2%的中性替换也会影响到翻译后修饰功能。这一结果表明,翻译后修饰的破坏并非人类遗传疾病的罪魁祸首。尽管如此,我们仍发现了238个修饰位点的突变会确定性的引发人体疾病以及1289个修饰位点存在于遗传疾病相关的突变的邻域范围内,这些位点信息可作为进一步致病机理研究实验的备选目标。论文的第四章在以上两个工作基础上,开展了针对棕榈酸化的破坏与SAP致病相关性的深入研究。首先我们利用蛋白序列描述符和随机森林方法建立了一个简洁有效的棕榈酸化位点识别模型,然后对所有的人类单点氨基酸突变位点进行预测识别,发现了若干疾病相关单点氨基酸突变位点被预测为棕榈酸化位点。通过查询文献,我们基本可以确认其中5个位点的致病性应与棕榈酸化的破坏有所关联,这一方面证明了我们所建模型的实用性,另一方面为这些SAP的致病机理解释提供了一个有效参考。论文的第五章和第六章分别介绍了关于数学建模研究方面的两个生物信息学工作内容,即建立了T细胞表位的预测和识别的定性模型,以及蛋白质-药物分子配体的结合能力预测研究的定量模型。这两个工作均取得了准确且可靠的预测结果,为SAP建模研究分析打下了比较坚实的数学理论基础。

参考文献：

[1]. QSAR分析结合实验方法用于T细胞表位快速筛选的研究[D]. 林治华. 第叁军医大学. 2003

[2]. 生物序列表征体系构建及结构与功能关系研究[D]. 梁桂兆. 重庆大学. 2007

[3]. MHC I类分子递呈修饰后抗原的结构与免疫学研究[D]. 孙明伟. 中国科学技术大学. 2014

[4]. 叁维氨基酸描述子在肽类定量构效关系研究中的应用[D]. 陈婷. 山西大学. 2011

[5]. 基于高维特征选择的定量序效关系研究[D]. 韩娜. 湖南农业大学. 2013

[6]. 基于环氧合酶-2的食管癌广谱抗原肽的设计、合成及鉴定[D]. 孙战强. 郑州大学. 2007

[7]. 新型肝片吸虫多表位疫苗的研究[D]. 李润乐. 青海大学. 2015

[8]. TRP-2_（180-188）CTL表位之APL的设计和评价[D]. 唐艳. 第叁军医大学. 2005

[9]. 猪伪狂犬病毒EP0基因生物信息学分析及TK蛋白的同源模建[D]. 林跃华. 四川农业大学. 2009

[10]. 单点氨基酸多态性与疾病相关关系的预测及其机制研究[D]. 李书艳. 兰州大学. 2010

标签：基础医学论文; 特异性论文; 抗原表位论文; 细胞免疫论文; 肿瘤免疫论文; 氨基酸残基论文; 抗原抗体反应论文; 多肽合成论文; 抗原呈递细胞论文; mhc限制性论文; 问题疫苗论文;

QSAR分析结合实验方法用于T细胞表位快速筛选的研究

猜你喜欢