大豆起源于亚洲,是一种被大面积种植的油料作物,蛋白质含量约占大豆总质量的40%[1]。大豆富含异黄酮和叶酸,能对人体健康产生有益的影响[2],而被加工成各类食品,在全球范围内被广泛食用。但大豆也是最容易导致人体过敏的八大食品之一[3],过敏患者会出现荨麻疹、哮喘、肠道综合征等反应,严重时还会造成休克威胁生命[4]。HELM等[5]发现大豆中独特的蛋白质可能是大豆过敏反应的原因,尤其是大豆球蛋白和β-伴大豆球蛋白。大豆球蛋白致敏性主要取决于其单体组成亚基的过敏性,大豆球蛋白亚基在还原条件下可以解离为一条酸性多肽链A(30~45 kDa)和一条碱性多肽链B(18~20 kDa)[6],大豆球蛋白A1a(Glycinin A1a)是大豆球蛋白G1亚基中的酸性多肽,DJURTOFT等[7]也证明免疫球蛋白E可以和所有的酸性亚基结合,现有报道表明大豆蛋白的致敏性源自于其酸性亚基,但Glycinin A1a亚基的具体线性B细胞表位未见报道。本实验是对Glycinin A1a亚基上最有可能的B细胞表位进行预测。
过敏反应的产生要依靠免疫细胞对抗原分子的特定部位即抗原决定簇完成识别[8],作为抗原中的线性片段或构象结构,B细胞表位能被抗体特异性识别,因此成为表位预测的重要部分。对于抗原表位的鉴定、预测,李俊慧等[9]总结了一些现有常用生物信息学方法和软件。利用生物信息学软件对蛋白组学和基因组学的原件进行模型建立,同时以数据库中已收录的各种抗原信息为依据,对待研究的过敏原线性表位进行筛选和预测。最后使用生物学知识和免疫学实验来确定预测的表位是否具有功能性,这种多学科交叉的方法,不仅节约大量的人力物力,加快实验进程,而且拓展了表位预测的技术平台,为预测更多未知的抗原表位提供了可能。刘阳星月等[10]通过蛋白质数据库(protein data bank,PDB)和系列生物预测软件、在线网站成功预测出大豆过敏原11S球蛋白G2中A2链的结合表位。闫慧丽等[8]利用SWISS-MODEL和Deep View 4.1完成了大豆主要过敏原Gly m Bd 28K的同源建模和评估,预测出6个构象表位相关区段。皮江一等[11]也凭借该方法预测出了大豆主要过敏原β-伴大豆球蛋白β亚基的抗原表位,并以此为基础对预测表位区域进行了分段克隆,抗原表位的预测成为后续抗原位置鉴定的重要前提。本研究以美国国家生物信息技术中心(National Center of Biotechnology Information,NCBI)数据库中得到的Glycinin A1a亚基氨基酸序列为原材料,以Glycinin A1a的高同源性蛋白质结构为模板,生成Glycinin A1a三维模型。用软件DNAStar、SOPMA、ABCpred和BepiPred 1.0 server、DiscoTope 2.0 server分别进行线性表位和构象表位的预测。为后期大豆球蛋白免疫检测提供理论参考;准确定位大豆球蛋白亚基的过敏位点,就可以有针对性的对过敏位点进行加工处理,为开发降低、消除大豆过敏性的食品加工技术提供帮助。
使用NCBI GenBank数据库查找出Glycinin A1a亚基所对应的氨基酸序列。该序列共有287个氨基酸排列如下:
FSSREQPQQNECQIQKLNALKPDNRIESEGGLIE-TWNPNNKPFQCAGVALSRCTLNRNALRRPSYTNGPQIYIQQGKGIFGMIYPGCPSTFEEPQQPQQRGQSS-RPQDRHQKIYNFREGDLIAVPTGVAWWMYNNEDT PVVAVSIIDTNSLENQLDQMPRRFYLAGNQEQE-FLKYQQEQGGHQSQKGKHQQEEENEGGSILSGFTL-EFLEHAFSVDKQIAKNLQGENEGEDKGAIVTVKGGL-SVIKPPTDEQQQRPQEEEEEEEDEKPQCKGKDKHCQ-RPRGSQSK
查找同源蛋白的PDB在线网站;用于三级结构模型建立和模型稳定性分析的软件SWISS-MODEL和Deep View 4.1;DNAStar软件包中的子程序Protean;其他预测软件:SOPMA、ABCpred、BePiPred 1.0 server和DiscoTope 2.0 server。
1.2.1 Glycinin A1a亚基线性表位预测
DNAStar中的Protean程序可以对氨基酸序列进行分析,包括疏水性、柔韧性、抗原指数、表面可及性[12]。因为所测指标与抗原表位密切相关,准确性也更强,具有较高的参考价值。
SOPMA是在线网站预测工具,打开网站页面直接将Glycinin A1a亚基氨基酸序列以FASTA格式粘贴在序列框内,选用默认的预测参数,提交序列可得到结果。
BepiPred 1.0预测服务器基于隐马尔可夫模型的组合和倾向量表方法对B细胞表位预测[13]。操作方法与SOPMA相类似。
ABCpred所预测的表位氨基酸数量是相等的,排列的顺序是根据表位的可能性大小,预测准确性相对其他软件较低,作为参考。使用参数参照刘阳星月等[10]的方法。
1.2.2 Glycinin A1a亚基同源建模及三维模型稳定性评估
根据Glycinin A1a亚基的氨基酸序列在PDB网站上查找出相应的同源蛋白,以同源性最高的蛋白作为模板[14],将两者的氨基酸序列都输入SWISS-MODEL的序列框中,采用Target-Template Alignment模式建立模型,建立的三维模型保存为PDB文件。打开Deep View4.1软件,在“File”选项下打开模型PDB文件;在工具栏“wind”选项中点击“Ramachandran Plot”即可得到建立模型的拉氏图。
1.2.3 GlycininA1a亚基构象表位预测
使用DiscoTope 2.0 Server在线软件,选择导入的文件为同源建模保存的模型PDB文件,参数使用默认值-3.7,提交文件即可预测。
2.1.1 DNAStar
使用DNAStar中的子程序Protean预测Glycinin A1a亚基的亲水性、柔韧性、抗原指数、表面可及性如图1所示。由于抗原位点是那些被抗体识别的位点,这些位点很可能是容易接触或在蛋白质表面的,这些区域要比内部区域更具流动性,由此推测它们是亲水的,亲水性越强,越容易和抗原表位结合。蛋白氨基酸残基多数处于亲水区,且分布均匀。柔韧性体现在图1中蓝色矩形覆盖区,柔韧性和表面可及性较强时易于折叠、弯曲,能够促进二级结构的形成可作为预测的重点区段[15]。抗原指数是直接就其抗原可能性预测,选择抗原指数>0的区域作为预测的表位。预测时将这4种指标中可能性较高区段进行综合比对,同时符合4种指标要求的序列,更有机会被视为表位。以上预测结果如表1所示。
图1 DNAStar分析结果
Fig.1 DNAStar analysis results
2.1.2 SOPMA
SOPMA可以计算出蛋白质二级结构中的α-螺旋、β-折叠、β-转角和无规则卷曲所占的百分比,如图2所示。Glycinin A1a亚基中无规则卷曲氨基酸残基含量最高占50.52%,α-螺旋是由24.74%氨基酸残基构成,β-转角和β-折叠所含的氨基酸残基分别占16.72%和8.01%。在蛋白质的二级结构中α螺旋和β折叠一般不作为抗原表位[16-19],因为氢键的存在结构稳定不易变形,而且α螺旋和β折叠通常位于蛋白内部,不易与受体接触。而β-转角和无规则卷曲一般位于蛋白质表面,为了满足蛋白质的功能需要,表面结构必须进行适当的改变也更容易被识别与抗原表位结合,是致敏表位的几率更大。由此结果预测的表位如表2所示。
表1 DNAStar 预测的抗原表位
Table 1 Predicted antigen epitope by DNAStar
序号序列起始位1EQPQQN252KPDNRI413WNPNNK564RRPSYTNG815TFEEPQQPQQRGQSSRPQDRHQ1116NED1567NQLDQMPR1748NQEQEF1889KYQQEQGGHQSQKGKHQQEEENE19510LQGENEGED24411PPTDEQQQRPQEEEEEEEDEKPQCKGK26812RPRGS300
图2 SOPMA分析的大豆球蛋白A1a二级结构结果
Fig.2 Secondary structure of the Glycinin A1a analyzed by SOPMA
2.1.3 BepiPred
BepiPred 1.0在线网站预测表位得到的结果如表3所示。序列段长度差别较大,但得到的表位分布较为均匀,而且序列段与DNAStar和SOPMA预测的表位位置区域高度重合,表明预测结果具有较高可信度。
表2 SOPMA 预测的Glycinin A1a抗原表位
Table 2 Predicted antigen epitope by SOPMA
序号序列起始位1FSSREQPQQN212LKPDNRIE403EGG494NPNNK575LNRNALRRPSYTNGPQ756QGKG967YPGCPSTFEEPQQPQQRGQSSR1058FREGD1379PTGV14610NNEDTP15511DTNSL16812GNQEQE18713QQEQGGHQSQKGKHQQEEENEG19714NEGEDKG24815GGL26116KPPTDEQQQRP26717DEKPQCKGKDKHCQRPRGSQS286
表3 BepriPred预测的Glycinin A1a抗原表位
Table 3 Predicted antigen epitope by BepriPred
序号序列起始位1FSSREQPQQNEC212LKPDNRIES403GLIETWNPNNKPFQ514LRRPSYTNGPQEIYI805GCPSTFEEPQQPQQRGQSSRPQDRH1076NEDTPV1567SLENQ1718NQEQ1889QEQGGHQSQKGKHQQEEENEGGS19810NLQGENEGEDKGA24311VIKPPTDEQQQRPQEEEEEEEDEKPQCKGKDKHCQRPRGSQSK265
2.1.4 ABC pripred
ABC pripred对Glycinin A1a亚基预测了18个线性表位,按照可能性大小如表4排列,最有可能的线性表位处于氨基酸序列的24~33位,在综合评价时更侧重于排名前4的预测表位。通过分析发现排名靠前的表位大部分靠近蛋白的N端。
表4 ABC pripred预测的Glycinin A1a抗原表位
Table 4 Predicted antigen epitope by ABC pripred
排序序列起始位1REQPQQNECQ242PQQPQQRGQS1152ALSRCTLNRN693KPFQCAGVAL613IETWNPNNKP533EQEFLKYQQE1903LDQMPRRFYL1764LRRPSYTNGP805PQDRHQKIYN1276LKPDNRIESE406YLAGNQEQEF1846DTPVVAVSII1587FGMIYPGCPS1017EGDLIAVPTG1397QKIYNFREGD1328NGPQEIYIQQ878EGGLIETWNP498LKYQQEQGGH194
注:表中预测的线性表位按评分顺序排列
线性构象表位预测结果,按照刘阳星月等[10]提出的方法对4种软件预测结果进行整合,结果如图3所示,预测出10个可能的Glycinin A1a抗原线性表位EQPQQN、KPDNRI、NPNNK、RRPSYTNG、PQQPQQRGQS、QEQGGHQSQKGKHQQEEENE、NEGED、PPTDEQQQRP、DEKPQCKGK、RPRGS。
图3 Glycinin A1a亚基线性表位
Fig.3 Glycinin A1a sub-baseline epitope
同源建模是按未知结构蛋白氨基酸序列在蛋白质结构数据库中查找出已有的相似的蛋白质的结构,然后将此蛋白结构进行优化,进而建立出未知结构蛋白的模型[14]。SWISS-Model对大豆球蛋白A1a亚基建立模型找出大豆球蛋白A1a亚基的同源蛋白,结果显示1FXZ(大豆球蛋白A1aB1b同源三聚体)与Glycinin A1a亚基同源性高达71%。以1FXZ为模板对大豆球蛋白A1a亚基完成同源建模,模型显示如图4所示。此模型符合大豆蛋白六聚体复合物结构。利用Deep view 4.1对建立出来的Glycinin A1a亚基模型进行稳定性分析,得到的拉氏图如图5所示。
图4 Glycinin A1a亚基预测模型
Fig.4 Prediction model of the Glycinin A1a subunits
图5 Glycinin A1a亚基Ramachandran plot
Fig.5 Ramachandran plot of the Glycinin A1a subunits
以Φ和Ψ为坐标轴所组成的二维图,来表示α碳原子和肽平面间单键的旋转形成的两面角[20],并不是所有Φ和Ψ形成的角都适合多肽骨架,不同的氨基酸残基能够稳定存在时对Φ和Ψ值是有范围的,根据这个范围可将二维图分为允许区(黄色线内区域)、最大允许区(蓝色色线内区域)和不允许区[21]。由图5计算得到Glycinin A1a亚基的氨基酸残基超过90%落在允许区内,即建立的A1a亚基模型是可以稳定存在的。
使用PyMOL软件将DiscoTope 2.0 Server预测的Glycinin A1a亚基构象表位在模型中表示出来如图6所示。发现预测的构象表位均处于模型的表面,而且较多表位处在无规则卷曲处,符合李雪娇等[15]的实验结果,也正是无规则卷曲部位的独特结构使得预测的线性表位和构象表位有部分重合。经过对线性表位和构象表位的对比发现:两者虽然不是完全相同的,但是在线性表位当中包含了部分构象表位。表明预测结果符合已有研究:线性表位和构象表位之间是密切相关的[22]。
a-正面;b-反面
图6 Glycinin A1a亚基构象表位
Fig.6 Glycinin A1a sub-base conformation epitope 注:红色部分表示氨基酸数量>5个的表位,黄色部分表示 氨基酸数量≤5个的表位
抗原表位的预测方法多种多样,但都是基于蛋白质的结构组成和物理化学性质,在本研究中DNAStar分析了Glycinin A1a亚基的亲水性、柔韧性、表面可及性、抗原指数,因为这些性质的不同是抗原表位区别于普通位点的关键。由于α螺旋和β折叠结构不易改变且大多位于蛋白内部难以与抗体接触结合,不作为表位处理,相反,β转角和无规则卷曲凭借良好的柔韧性、处于表面的优势可以较好的被识别,也成为表位预测的重要指标。最终得到了10个可能性较高的线性表位:24EQPQQN29、40KPDNRI45、56NPNNK60、80RRPSYTNG87、114PQQPQQRGQS123、197QEQGGHQSQKGKHQQEEENE216、247NEGED251、267PPTDEQQQRP276、285DEKPQCKGK293、299RPRGS303。本研究还对Glycinin A1a进行了构象表位的预测。预测结果与SAEED等[23]的实验结果相符合,即抗原构象表位位于3D模型的表面。符合一般表位预测原则,处于表面的位点可以更好的与抗体嵌合。
此实验为接下来的Glycinin A1a过敏性表位的筛选和鉴定提供了数据支持,能更有针对性的去验证各个表位的免疫原性。也为改善加工条件,降低大豆致敏性提供理论支持。此研究借助机器预测抗原表位,避免了大量时间,人力和湿实验的耗费[24]。更重要的是并在没有人为干预的情况下对未知数据进行预测。大大降低了实验的误差。
[1] 王军, 张海生, 李方舟, 等.大豆蛋白质的开发与利用[J].农产品加工, 2020(5):11-13.
WANG J, ZHANG H S, LI F Z, et al.Development and utilization of soybean protein[J].Academic Periodical of Farm Products Processing, 2020(5):11-13.
[2] 孙明明, 王萍, 李智媛, 等.大豆活性成分研究进展[J].大豆科学, 2018, 37(6):975-983.
SUN M M, WANG P, LI Z Y, et al.Research progress of soybean active ingredients[J].Soybean Science, 2018, 37(6):975-983.
[3] WILSON S, BLASCHEK K, DE MEJIA E G.Allergenic proteins in soybean:Processing and reduction of p34 allergenicity[J].Nutrition Reviews, 2005, 63(2):47-58.
[4] WANG J L, SAMPSON H A.Food anaphylaxis[J].Clinical and Experimental Allergy, 2007, 37(5):651-660.
[5] HELM R M, COCKRELL G, CONNAUGHTON C, et al.A soybean g2 glycinin allergen[J].International Archives of Allergy and Immunology, 2000, 123(3):205-212.
[6] CHEN J S, WANG J, SONG P X, et al.Determination of glycinin in soybean and soybean products using a sandwich enzyme-linked immunosorbent assay[J].Food Chemistry, 2014, 162(1):27-33.
[7] DJURTOFT R, PEDERSEN H S, AABIN B, et al.Studies of food allergens:Soybean and egg proteins[J].Advances in Experimental Medicine and Biology, 1991, 289:281-293.
[8] 闫慧丽, 席俊, 贺梦雪, 等.大豆主要过敏原Gly m Bd 28K的同源建模和B细胞表位的预测[J].河南工业大学学报(自然科学版), 2016, 37(4):41-45;51.
YAN H L, XI J, HE M X, et al.Homologous modeling and prediction of B cell epitope of soybean major allergen Gly m Bd 28K[J].Journal of Henan University of Technology (Natural Science Edition), 2016, 37(4):41-45;51.
[9] 李俊慧, 邵军军, 常惠芸.抗原表位鉴定方法的研究进展[J].中国兽医科学, 2021, 51(6):678-683.
LI J H, SHAO J J, CHANG H Y.Advance of antigenic epitope mapping methods[J].Chinese Veterinary Science, 2021,51(6):678-683.
[10] 刘阳星月, 张迪, 姚亚亚, 等.大豆过敏原11S球蛋白G2中A2链结合表位的预测[J].食品科学, 2018, 39(18):152-158.
LIU Y X Y, ZHANG D, YAO Y Y, et al.Mapping of IgG-Binding epitopes on the A2 chain of the major soybean allergen 11S globulin G2[J].Food Science, 2018, 39(18):152-158.
[11] 皮江一, 席俊, 贺梦雪, 等.大豆主要过敏原α-伴大豆球蛋白β亚基的抗原表位分析及分段克隆[J].食品工业科技, 2017, 38(18):90-93.
PI J Y, XI J, HE M X, et al.Analysis of antigenic epitopes and cloning of soybean major allergen β-conglycinin beta-subunit[J].Science and Technology of Food Industry, 2017, 38(18):90-93.
[12] LIU M, HUAN F, LI M S, et al.Mapping and IgE-binding capacity analysis of heat/digested stable epitopes of mud crab allergens[J].Food Chemistry, 2021, 344:128735.
[13] LARSEN J E P, LUND O,NIELSEN M.Improved method for predicting linear B-cell epitopes[J].Immunome Research, 2006, 2(1):2.
[14] STUDER G, TAURIELLO G, BIENERT S, et al.Modeling of protein tertiary and quaternary structures based on evolutionary information[J].Methods in Molecular Biology, 2019, 1851:301-316.
[15] 李雪娇, 李欣芮, 范卓妍, 等.小麦主要过敏原CM16线性B细胞表位的预测及初步鉴定[J].食品科学, 2019, 40(24):136-141.
LI X J, LI X R, FAN Z Y, et al.Predicting and identifying linear B-cell epitopes of wheat allergen CM16[J].Food Science, 2019, 40(24):136-141.
[16] 单晓红. 大豆和牛奶致敏原表位预测及加工对其抗原性和结构的影响[D].无锡:江南大学, 2013.
SHAN X H.Prediction of soybean and milk allergen peptides and effects of processing treatment on their antigenicity and conformational structure[D].Wuxi:Jiangnan University, 2013.
[17] 马秀丽, 张九凯, 孙劲旅, 等.芝麻过敏原Ses i 3同源建模及B细胞线性抗原表位预测[J].中国食品学报, 2021, 21(4):9-18.
MA X L, ZHANG J K, SUN J L, et al.Homology modeling and prediction on B cell liner antigenic epitopes of Ses i 3 from sesamum indicum[J].Journal of Chinese Institute of Food Science and Technology, 2021, 21(4):9-18.
[18] 李江英, 白雪娟, 梁艳, 等.用DNAStar软件预测Rv1410c结核分枝杆菌蛋白抗原表位[J].细胞与分子免疫学杂志, 2015, 31(4):474-477.
LI J Y, BAI X J, LIANG Y, et al.Prediction of epitopes of Rv1410c Mycobacterium tuberculosis protein using DNAStar software[J].Chinese Journal of Cellular and Molecular Immunology, 2015, 31(4):474-477.
[19] LI Y H, LIU X F, ZHU Y J, et al.Bioinformatic prediction of epitopes in the Emy162 antigen of Echinococcus multilocularis[J].Experimental and Therapeutic Medicine, 2013, 6(2):335-340.
[20] ZHAO J, CAO Y, ZHANG L.Exploring the computational methods for protein-ligand binding site prediction[J].Computational and Structural Biotechnology Journal, 2020, 18:417-426.
[21] 柯丕余, 黄俊, 胡升, 等.应用拉氏图信息提高短乳杆菌谷氨酸脱羧酶催化性能[J].生物工程学报, 2016, 32(1):31-40.
KE P Y, HUANG J, HU S, et al.Enhancing glutamate decarboxylase activity by site-directed mutagenesis:An insight from Ramachandran plot[J].Chinese Journal of Biotechnology, 2016, 32(1):31-40.
[22] 祝苗. 人肠道病毒71型和柯萨奇病毒A16型抗原表位的生物信息学预测[D].宁波:宁波大学, 2018.
ZHU M.The systematic prediction of antigenic epitopes for human enteroviruses 71 and Coxasckievirus A16[D].Ningbo:Ningbo University, 2018.
[23] SAEED H, GAGNON C, COBER E, et al.Using patient serum to epitope map soybean glycinins reveals common epitopes shared with many legumes and tree nuts[J].Molecular Immunology, 2016, 70:125-133.
[24] KHANNA D,RANA P S.Improvement in prediction of antigenic epitopes using stacked generalisation:An ensemble approach[J].IET systems biology, 2020, 14(1):1-7.