Amycolatopsis sp.的全基因组测序及香兰素合成途径分析

王冠娜,郑义培,郑璞*

(江南大学 生物工程学院,工业生物技术教育部重点实验室,江苏 无锡,214122)

摘 要 拟无枝酸菌(Amycolatopsis sp.)CCTCC NO:M2011265是一株可以转化阿魏酸生成香兰素菌株,该研究利用Illumina Hiseq测序平台对拟无枝酸菌进行全基因组测序、拼接、基因预测及功能注释,并从拟无枝酸菌的全基因组中筛选和鉴定参与香兰素合成的功能基因。结果表明,总共组装得到64个scaffolds,整个基因组组装大小约为8 425 551 bp,总GC含量为71.89%。通过生物信息学分析发现了香兰素合成关键基因echfcsech2基因,及香兰素分解代谢基因vdh基因,其中echfcs为一个基因簇,并进一步构建过表达ech-fcs-ech2菌株,其摇瓶发酵表明转化阿魏酸生成香兰素速率加快,发酵时间显著缩短。该研究获得的拟无枝酸菌的全基因组信息为解析其转化阿魏酸生成香兰素发酵过程中的代谢机理提供遗传信息基础,也为通过代谢工程获得高产香兰素菌株的研究提供理论支持。

关键词 香兰素;拟无枝酸菌;全基因组测序;阿魏酸;基因功能注释

香兰素以游离态和葡萄糖苷的形式存在于植物及植物提取物中,如香荚兰豆、丁香油、甜菜根、秘鲁香脂、吐鲁香脂和天冬门等,其中较集中存在于香荚兰豆中[1]。纯净的香兰素具有浓郁的奶香气,有“香料之王”的美誉,被广泛应用于食品、饮料、香料和医药等领域中[2]。目前,市场上香兰素的生产方式主要包括植物提取法、微生物转化法和化学合成法[3]。植物提取法主要是从香荚兰豆中提取香兰素,但香荚兰的种植受气候的影响,其产量有限,价格昂贵,不能满足市场需求。化学合成法生产的香兰素价格低廉,但其生产过程对环境造成严重污染,而且香型单一,安全性也备受质疑,不符合下游应用市场对天然原料的消费趋势,并且欧盟(European Union,EU)和美国食品药品监督管理局(Food and Drug Administration,FDA)不允许将其用于食品[4]。天然底物经微生物转化产生的香兰素被称为“天然香兰素”。以天然阿魏酸为底物,微生物生产的香兰素在价格和品质方面都比化学合成的香兰素占有优势。其中,Amycolatopsis sp.ATCC 39116[5]Streptomyces sp.strain V-1[6]用于阿魏酸发酵生产天然香兰素,产量可达10 g/L以上。

全基因组测序是对未知基因组序列的生物体进行高通量DNA测序和生物信息学组装以获得全基因组序列信息[7]。全基因组测序有助于了解菌株代谢特点,认识其遗传信息与生理功能之间的联系[8-10]。本实验室前期筛选到1株拟无枝酸菌(Amycolatopsis sp.)CCTCC NO:M2011265,它可以转化阿魏酸合成香兰素[11-13];为深入了解拟无枝酸菌中参与香兰素合成的功能基因及其代谢通路信息,本文通过第二代全基因组测序技术,获得拟无枝酸菌的全基因组信息,然后根据已报道的香兰素合成的基因信息,挖掘拟无枝酸菌(Amycolatopsis sp.)CCTCC NO:M2011265潜在参与香兰素生物合成的功能基因。

1 材料与方法

1.1 材料与仪器

1.1.1 材料与试剂

拟无枝酸菌(Amycolatopsis sp.)CCTCC NO:M 2011265保存于中国典型培养物中心,E.coli JM109和E.coli JM110均为市售菌株,质粒pULcrRNA由中国上海师范大学生命科学学院王金教授赠予;细菌基因组DNA提取试剂盒(柱式法),宝日医生物技术(北京)有限公司;质粒小量制备试剂盒,上海捷瑞生物工程有限公司;ClonExpress Ⅱ 多片段克隆试剂盒,南京诺唯赞生物科技股份有限公司;引物合成和PCR产物测序,金唯智生物科技有限公司;天然阿魏酸,西安冠宇生物技术有限公司;安普霉素(apramycin,Apr),生工生物工程(上海)有限公司;酵母提取物、胰蛋白胨,英国OXOID有限公司;琼脂粉、牛肉浸膏、酵母浸膏、蔗糖、冰醋酸、甲醇、氯化钠,国药集团有限公司。

1.1.2 仪器与设备

5418离心机、Eporator电转仪,德国艾本德公司;HH-4恒温水浴锅,荣华仪器制造有限公司;G154DWS立式高压灭菌锅,美国致微公司;SW-CJ-1FD超净工作台,苏州安泰空气技术有限公司;Waters2487高效液相色谱仪,美国Waters公司;DYCP-31DN核酸电泳仪,北京六一仪器有限公司;Tanon-3500R凝胶成像仪,上海天能科技有限公司;SPX-150-B生化培养箱,上海博泰实验设备有限公司;HYL-C组合式摇床,太仓市强乐实验设备公司;9700A-PCR仪,南京赛飞生物科技公司。

1.1.3 培养基

斜面培养基、种子培养基、发酵培养基参见文献[12],本氏培养基、YEME培养基参见文献[13]

1.2 实验方法

1.2.1 菌体的活化与培养

从-80 ℃冰箱取出保存菌种甘油管,放置冰上融化后用接种环沾取少量的菌液,在本氏固体培养基上划线,30 ℃培养7 d后挑取单菌落,接种至本氏液体培养基于30 ℃、220 r/min培养48 h。

1.2.2 基因组DNA提取、测序与功能注释

将斜面保存的拟无枝酸菌接种于新鲜的本氏培养基中,在30 ℃、220 r/min恒温摇床中培养28 h,获得拟无枝酸菌菌液,使用柱式细菌基因组DNA提取试剂盒提取拟无枝酸菌基因组DNA。提取好的拟无枝酸菌基因组DNA经0.8%(质量分数)琼脂糖凝胶电泳检测,用核酸检测仪测量基因组DNA的浓度,并将合格的样品委托上海伯豪生物技术有限公司进行基因组测序。使用Illumina Hiseq platform进行基因组测序、利用FastQC对样本的测序数据质量进行可视化评估,为了保证信息分析质量,对原始数据进行过滤,得到Clean数据。Reads质量的评估标准为:90%以上的碱基Q值>20。序列拼接使用SPAdes-3.5.0软件,利用软件Prokka结合Swiss-Prot库注释,分别使用KOBAS工具、rpsblast工具、和blast2GO算法,将预测的基因分别与KEGG、COG、GO数据库进行比对以注释其功能[14-17]

1.2.3 香兰素合成与代谢基因筛选

根据已知产香兰素模式菌株Amycolatopsis sp.ATCC 39116(GenBank:NZ_AFWY00000000.3)的产香兰素的关键基因,利用NCBI的BLAST工具(https://blast.ncbi.nlm.nih.gov/Blast.cgi)对拟无枝酸菌CCTCC NO:M2011265的全基因组序列进行序列相似性分析,筛选拟无枝酸菌CCTCC NO:M2011265基因组中可能参与香兰素生物合成的功能基因。

1.2.4 过表达质粒的构建

根据Amycolatopsis sp.ATCC 39116的ech-fcsech2基因设计引物,以拟无枝酸菌CCTCC NO:M 2011265基因组作为模版,分别用引物P1(5′-GTATCTGAAAGGGGATACGCATGAGCACAGCGGTCG-GCAACGGGC-3′)/P2(5′-GCGACGTAGATGACCTGGCCTCAGCCG-AAGCGGCGGCGGACCTCG-3′)和P3(5′-TCCGCCGCCGCTTCGGCTGAGGCCAGGTCATCT-ACGTCGC-3′)/P4(5′-GGGAGATCTACTAGTACGGT-CTTGCCCTGGCTGAACC-3′)扩增获得ech-fcsech2片段,通过一步克隆将回收的ech-fcsech2片段和线性化pULcrRNA质粒按照2∶1的摩尔比,在37 ℃下反应30 min连接。以上连接产物通过热激法转化至大肠杆菌E.coli JM109感受态细胞中,37 ℃孵育45 min后涂布在对应抗性平板上,获得的转化子使用引物P5(5′-GCTGCTCCTTCGGTCGGACGT-3′)和P6(5′-CACTACTTCTCCGGGTCGA-3′)进行菌落PCR验证,将验证正确的质粒命名为pULwgn03。

1.2.5 过表达菌株的构建

将拟无枝酸菌CCTCC NO:M2011265从斜面接到新鲜的YEME培养基,30 ℃,220 r/min培养36~48 h后以5%的接种量转接至新鲜的YEME培养基,30 ℃,220 r/min过夜培养约12 h,将菌体放于冰上冰浴30 min;随后4 ℃,5 000 r/min,离心5 min收集菌体;倒掉上清液,用冰浴的电击缓冲液洗涤2~3次,然后用1~2 mL电击缓冲液重悬菌液。将菌液按每份100 μL装入1.5 mL离心管中。pULwgn03质粒转入E.coli JM110去甲基化;获得的质粒于98 ℃加热10 min后立即放在冰上冷却,与拟无枝酸菌感受细胞态轻轻混匀,冰上放置5 min,随后加入0.1 cm预冷电转杯中,放置于电转仪中,电转条件为1 800 V、5 ms。电击后立刻加入预热本氏培养基,30 ℃,220 r/min孵育约4 h。菌液在5 000 r/min的条件下离心5 min,去除上清液,将菌体重悬涂布于含有安普霉素的固体本氏培养基,30 ℃培养5~7 d,使用P5/P6引物进行菌落PCR和测序验证。

1.2.6 过表达菌株摇瓶发酵分析

阿魏酸生物转化分为两阶段法:生长阶段和转化阶段。种子液的获得:从斜面保存的过表达菌株接两环于种子培养基中30 ℃,220 r/min培养36 h左右获得种子液。按10%接种量将种子液接种于发酵培养基中,温度30 ℃,220 r/min培养16~24 h,加入终质量浓度为12 g/L的底物阿魏酸,同时温度上升至35 ℃。间隔取样,测定发酵过程中发酵液的OD600、阿魏酸和香兰素的含量。

1.2.7 分析方法

取1 mL发酵液12 000 r/min下离心5 min,稀释10倍后用0.22 μm的微孔滤膜过滤后,进行HPLC分析。色谱柱采用C18柱,进样体积为10 μL,柱温35 ℃,流动相为30%甲醇和0.1%乙酸为流动相,流速为1 mL/min,波长选择280 nm。

2 结果与分析

2.1 基因组DNA的质检

拟无枝酸菌(Amycolatopsis sp.)CCTCC NO:M2011265基因组DNA经0.8%琼脂糖凝胶电泳质检(图1),结果为单一且无明显弥散的条带,表明提取基因组DNA的质量较好。如表1的结果显示拟无枝酸菌基因组的总量为0.85 μg,OD260/OD280值为1.80,说明基因组DNA无降解、无污染,达到基因组DNA测序要求,将合格的样品委托上海伯豪生物技术有限公司进行全基因组测序、拼接、注释和生物信息学分析。

表1 拟无酸菌基因组DNA浓度
Table 1 Concentration of Amycolatopsis sp.genomic DNA

体积/μL质量浓度/(ng/μL)总量/μgOD260/OD2803524.400.851.80

图1 拟无枝酸菌基因组 DNA 电泳图

Fig.1 Electrophoretogram of Amycolatopsis sp.genomic DNA

2.2 拟无枝酸菌全基因组概况

拟无枝酸菌CCTCC NO:M2011265可以转化阿魏酸生成香兰素,为了更全面地了解拟无枝酸菌合成香兰素基因信息,采用从头测序技术对拟无枝酸菌菌株进行了全基因组测序分析,得到2 726 966 400 bp测序数据量,使用软件SPAdes进行初步组装后将组装结果进行比对评估,组装总共得到64个scaffolds,总长度为8 425 551 bp,其中scaffold平均长度为131 649 bp,最大scaffolds长度为716 347 bp,整个基因组组装大小约为8.43 M,总GC含量为71.89%,N50长度为363 153 bp。上述结果表明拟无枝酸菌基因组的组装质量较好,结果如表2所示。

表2 拟无枝酸菌基因组序列拼接结果
Table 2 Results of genome splicing of Amycolatopsis sp.

scaffold数量/个总碱基数/bp×N50/bpscaffold平均长度/bp最大scaffold长度/bpGC/%预测总基因数/个648 425 551363 153131 649716 34771.898 185

2.3 基因的预测与功能注释

将上述得到的基因组数据分别使用blast2GO算法、rpsblast工具和KOBAS工具与GO、COG、KEGG数据库进行比对和功能注释[18-19]。结果共有8 185个基因得到注释,占基因总数的97.04%,其中,在COG数据库中得到功能注释的基因较多,为6 910个,占基因总数的84.40%。在GO和KEGG数据库中得到注释的基因分别是5 386和2 824个,分别占基因总数的65.80%和34.50%。

2.3.1 COG注释

COG数据库按照功能一共可以共分为26类,由拟无枝酸菌的COG功能注释统计结果可知,在COG数据库中一共有6 910个基因得到注释,占全部编码基因的百分比为84.40%(图2)。其中Mobilome:prophages,transposons这一分类没有被注释到,一般功能预测基因富集最为显著,达到1 065个,其次是转录类别基因注释为968个,而碳水化合物运输与代谢、氨基酸运输与代谢、能源生产和转换和脂质转运与代谢基因注释也相对较多,分别为555、554、550和447个。

图2 拟无枝酸菌预测基因的 COG 注释图

Fig.2 COG annotated map of predictor genes of Amycolatopsis sp.

2.3.2 GO数据库

GO数据库是基因功能描述的分类系统。总基因的65.80%(5 386)在GO数据库得到了注释,注释结果由细胞组分(cellular component,)、分子功能(molecular function)和生物过程(biological process)组成。GO注释蛋白质分类显示,其中“生物过程”类别注释了4 060个基因、“分子功能”类别注释了4 159个基因和细胞组分类别注释了2 327个基因,且大部分基因被注释了多个类别,表明了拟无枝酸菌拥有较为旺盛的初级和次级代谢过程。

2.3.3 KEGG注释

将拟无枝酸菌的氨基酸序列与KEGG数据库进行BLAST比对,共有34.5%(2 824)的基因得到了注释,比对到了1 665个KO号。其中ABC 2型运输系统-ATP结合蛋白(KO1990:ABC-2 type transport system ATP-binding protein)预测到基因最多,其次是ABC 2型运输系统-通透酶蛋白(KO1992:ABC-2 type transport system permease protein)。在KEGG数据库中有占总数18.6%(1 523)的基因得到了注释,其中部分基因被注释到了多条途径,如图3所示,拟无枝酸菌基因组中基因注释最多的15条途径。其中有986个基因被注释到代谢途径(KO01100:metabolic pathways),其次为次不同环境中微生物代谢(KO01120:microbial metabolism in diverse environments),共有476个。

图3 拟无枝酸菌预测基因的部分 KEGG Pathway 注释结果

Fig.3 Partial KEGG Pathway annotation results of predictor genes of Amycolatopsis sp.

2.4 香兰素合成与代谢途径相关基因预测

根据GO、COG和KEGG数据库的注释结果,将疑似基因在NCBI数据库进行比对,挖掘与香兰素合成与代谢相关的基因。其中在GO注释结果中挖掘到了1个与香兰素合成的基因z4344,将其氨基酸序列在NCBI数据库比对,确定为阿魏酰辅酶A合成酶(fcs);在KEGG注释结果中挖掘到了1个与香兰素合成的基因z4343,将其氨基酸序列在NCBI数据库比对,确定为烯酰辅酶A醛缩酶(ech)。此外,参考其他细菌中香兰素合成代谢途径,结合3个数据库的注释结果,检索到了2个关键基因z7967z8076,分别为烯酰辅酶A醛缩酶2(ech2)和香兰素脱氢酶(vdh)。其中,烯酰辅酶A醛缩酶2在GO数据库中被注释为:烯酰辅酶A醛缩酶活性(enoyl-CoA hydratase activity);在COG数据库中被注释为:脂质转运与代谢(enoyl-CoA hydratase activity)。香兰素脱氢酶在KEGG数据库中被注释为:苯甲醛脱氢酶(benzaldehyde dehydrogenase);在GO数据库中被注释为:醛脱氢酶活性(aldehyde dehydrogenase activity);COG数据库中被注释为:能源生产与转换(energy production and conversion)。将这4个酶与NCBI中其他来源序列进行比对,结果如表3所示。

表3 相关的序列比对结果 单位:%

Table 3 Sequence alignment results of related genes

酶链霉菌V1Amycolatopsis sp.ATCC 39116Amycolatopsis sp.HR167Amycolatopsis methanolicaFCS(z4344)10010010095.6ECH(z4343)10010099.7799.77ECH2(z7967)-100-97.57VDH(z8076)-100-97.67

注:-表示无数据。

如表4所示香兰素合成与代谢相关酶基本信息,其中fcs基因与ech基因为同一个基因簇。此外,参考其他细菌中香兰素合成代谢途径[20],推测阿魏酸在拟无枝酸菌CCTCC NO:M2011265中是在FCS的作用下生成阿魏酰辅酶A,在ECH和ECH2的共同作用下生成香兰素,最后在VDH的作用下生成香草酸,相关的代谢反应推测如图4所示。

表4 香兰素合成与代谢相关的酶
Table 4 Enzymes involved in vanillin synthesis and catabolism

步骤基因名称基因ID号氨基酸长度蛋白质名称fcsz4344491阿魏酰辅酶A合成酶香兰素合成echz4343287烯酰辅酶A醛缩酶ech2z7967150烯酰辅酶A醛缩酶2香兰素代谢vdhz8076486香兰素脱氢酶

图4 拟无枝酸菌中香兰素合成与分解代谢途径

Fig.4 Pathways of vanillin synthesis and catabolism in Amycolatopsis sp.

2.5 过表达(ech-fcs-ech2)菌株转化阿魏酸生成香兰素的分析

2.5.1 过表达菌株的构建

首先以拟无枝酸基因组为模板,分别利用引物P1/P2和P3/P4扩增获得ech-fcs基因片段和ech2基因片段,如图5-a所示,ech-fcs基因片段目的条带约为2 200 bp,与实际大小2 339 bp吻合,ech2基因片段目的条带约为400 bp,与实际大小453 bp吻合,随后将这2个基因片段与线性化pULcrRNA质粒相连,成功构建出过表达质粒pULwgn03。将重组质粒pULwgn03电转入野生型拟无枝酸菌中,涂布在含有安普霉素平板上,生长5~7 d后,随机挑选10个转化子,使用引物P5/P6进行的菌落PCR扩增验证,如图5-b所示,目的条带约为3 000 bp,与实际大小2 792 bp吻合,说明ech-fcs-ech2过表达菌株构建成功。

a-ech-fcsech2基因的PCR产物(M-DNA marker;1-ech-fcs基因片段;2-ech2基因片段);b-转化子的PCR鉴定结果(M-DNA marker;1~10-单菌落)
图5 目的基因ech-fcsech2和转化子的电泳图

Fig.5 Electrophoretogram of target genes ech-fcs, ech2, and transformants

2.5.2 过表达菌株的发酵分析

按照1.2.6节发酵方法将过表达菌株与野生型分别接入摇瓶发酵,研究过表达fcsechech2基因对菌株转化阿魏酸生成香兰素的影响。从图6-a中可以看出过表达菌株与野生型的发酵生长曲线有显著性差异,过表达菌株在48 h后,发酵生长曲线迅速下降,推测是fcs-ech-ech2的组成型表达引起了香兰素的快速合成,短时间内积累高浓度的香兰素对菌体有一定毒害作用,转化至55 h,过表达菌株底物阿魏酸基本上已经消耗殆尽了,转化停止,此时过表达菌株中发酵液香兰素质量浓度达到了11.06 g/L,而野生型菌株的底物阿魏酸残余量为6.41 g/L,香兰素的质量浓度为4.67 g/L(图6-b、图6-c)。过表达菌株代谢阿魏酸和生成香兰素的速率均比野生型快,发酵时间比野生型缩短了一半,野生型在转化94 h时香兰素产量为7.77 g/L(图6-c),过表达菌株比野生型产香兰素的浓度提高了42.30%。上述摇瓶发酵结果证明了echfcsech2基因与香兰素合成密切相关。

a-OD600;b-阿魏酸的质量浓度;c-香兰素的质量浓度
图6 野生型菌株和过表达菌株对阿魏酸的转化

Fig.6 Biotransformation of ferulic acid by the wild-type and mutant strains

3 结论

本研究运用Illumina二代测序技术对拟无枝酸菌CCTCC NO:M2011265进行了全基因组的测序,获得了64个scaffolds,总长度为8 425 551 bp,GC含量71.89%,包含8 185个预测编码蛋白。同时对组装的基因组进行了基因预测、功能注释和聚类分析。最终获得的这些基础数据有益于从分子水平上认识拟无枝酸菌CCTCC NO:M2011265的生理功能、代谢特性。通过生物信息学分析得到香兰素合成相关基因echfcsech2基因,其中echfcs为一个基因簇,香兰素分解代谢相关基因,vdh基因,与已报道Amycolatopsis sp.ATCC 39116香兰素合成与分解代谢的基因一致。构建的过表达ech-fcs-ech2菌株代谢阿魏酸和生成香兰素的速率均比野生型快,发酵时间比野生型缩短了一半。过表达菌株最终产香兰素质量浓度为11.06 g/L,野生型为7.77 g/L,比野生型产香兰素的浓度提高了42.30%,进一步证明了echfcsech2基因与香兰素生物合成密切相关。

参考文献

[1] MA Q Q, LIU L W, ZHAO S, et al.Biosynthesis of vanillin by different microorganisms:A review[J].World Journal of Microbiology and Biotechnology, 2022, 38(3):1-9.

[2] PRIEFERT H, RABENHORST J, STEINBÜCHEL A.Biotechnological production of vanillin[J].Applied Microbiology and Biotechnology, 2001, 56(3-4):296-314.

[3] 吕晓婕. 香兰素行业发展状况[J].现代食品, 2019(7):14-16.
LYU X J.The development of vanillin industries[J].Modern Food, 2019(7):14-16.

[4] MARTU G A, CLINOIU L F, VODNAR D C.Bio-vanillin:Towards a sustainable industrial production[J].Trends in Food Science &Technology, 2021, 109:579-592.

[5] CHRISTIAN F, FLORIAN M, ALEXANDER S.Metabolic engineering of the actinomycete Amycolatopsis sp.strain ATCC 39116 towards enhanced production of natural vanillin[J].Applied and Environmental Microbiology, 2016, 82(11):3410-3419.

[6] HUA D L, MA C Q, SONG L F, et al.Enhanced vanillin production from ferulic acid using adsorbent resin[J].Applied Microbiology and Biotechnology, 2007, 74(4):783-790.

[7] LUO C W, TSEMENTZI D, KYRPIDES N, et al.Direct comparisons of Illumina vs.Roche 454 sequencing technologies on the same microbial community DNA sample[J].PLoS One, 2012, 7(2):e30087.

[8] GARCA-HIDALGO J, BRINK D P, RAVI K, et al.Vanillin production in Pseudomonas:Whole-genome sequencing of Pseudomonas sp.strain 9.1 and reannotation of Pseudomonas putida CalA as a vanillin reductase[J].Applied and Environmental Microbiology, 2020, 86(6):e02442-19.

[9] TANG B A, ZHAO W, ZHENG H J, et al.Complete genome sequence of Amycolatopsis mediterranei S699 based on De Novo assembly via a combinatorial sequencing strategy[J].Journal of Bacteriology, 2012, 194(20):5699-5700.

[10] DAVIS J R, GOODWIN L A, WOYKE T, et al.Genome sequence of Amycolatopsis sp.strain ATCC 39116, a plant biomass-degrading actinomycete[J].Journal of Bacteriology, 2012, 194(9):2396-2397.

[11] 刘琼, 郑璞.常压室温等离子体诱变选育高产香兰素拟无枝酸菌(Amycolatopsis sp.)[J].食品与发酵工业, 2013, 39(10):40-44.
LIU Q, ZHENG P.Induced mutation breeding of high vanillin-production Amycolatopsis sp.by atmospheric and room temperature plasmas[J].Food and Fermentation Industries, 2013, 39(10):40-44.

[12] 王兴林, 郑璞, 刘琼.Amycolatopsis sp.转化阿魏酸生产香草醛[J].工业微生物, 2013, 43(5):33-38.
WANG X L, ZHENG P, LIU Q.Biotransformation of ferulic acid to vanillin by Amycolatopsis sp[J].Industrial Microbiology, 2013, 43(5):33-38.

[13] 郑义培, 吴丹, 郑璞. 利用CRISPR-Cas9技术构建敲除VDH的产香兰素拟无枝酸菌[J].微生物学报, 2021, 61(11):3583-3593.
ZHENG Y P, WU D, ZHENG P.A vanillin producing Amycolatopsis sp.with the VDH gene knockout by CRISPR-Cas9 technology[J].Acta Microbiologica Sinica, 2021, 61(11):3583-3593.

[14] LUO R B, LIU B H, XIE Y L, et al.SOAPdenovo2:An empirically improved memory-efficient short-read de novo assembler[J].GigaScience, 2012, 1(1):18.

[15] SAHARA T, FUJIMORI K E, NEZUO M, et al.Draft genome sequence of Saccharomyces cerevisiae NAM34-4C, a lactic acid-assimilating industrial yeast strain[J].Genome Announcements, 2014, 2(1):e01145-13.

[16] SEEMANN T.Prokka:Rapid prokaryotic genome annotation[J].Bioinformatics, 2014, 30(14):2068-2069.

[17] FRANCIS F, DUMAS M D, DAVIS S B, et al.Clustering of circular consensus sequences:Accurate error correction and assembly of single molecule real-time reads from multiplexed amplicon libraries[J].BMC Bioinformatics, 2018, 19(11):1-8.

[18] OGATA H, GOTO S, SATO K, et al.KEGG:Kyoto encyclopedia of genes and genomes[J].Nucleic Acids Research,1999,27(1):29-34.

[19] CONESA A, GÖTZ S, GARCA-GMEZ J M, et al.Blast2GO:A universal tool for annotation, visualization and analysis in functional genomics research[J].Bioinformatics, 2005, 21(18):3674-3676.

[20] MEYER F, NETZER J, MEINERT C, et al.A proteomic analysis of ferulic acid metabolism in Amycolatopsis sp.ATCC 39116[J].Applied Microbiology and Biotechnology, 2018, 102(14):6119-6142.

Whole genome sequencing and vanillin synthesis pathway analysis of Amycolatopsis sp.

WANG Guanna, ZHENG Yipei, ZHENG Pu*

(The Key Laboratory of Industrial Biotechnology, Ministry of Education, School of Biotechnology, Jiangnan University, Wuxi 214122, China)

Abstract Amycolatopsis sp. CCTCC NO: M2011265 is a strain that can biotransform ferulic acid to produce vanillin. In this study, the Illumina HiSeq sequencing platform was used to perform whole genome sequencing,splicing, gene prediction, and functional annotation were performed to screen and identify functional genes involved in vanillin biosynthesis from the whole genome of Amycolatopsis sp. The results showed that a total of 64 scaffolds were assembled, with the whole genome assembly size of about 8 425 551 bp and the total GC content of 71.89%. Through bioinformatics analysis, the key genes of vanillin synthesis including ech, fcs, and ech2, and the vanillin degradation gene vdh gene were found, in which ech-fcs belonged to a gene cluster. In addition, the overexpression strain of ech-fcs-ech2 was constructed, and the shaker fermentation showed that the conversion of ferulic acid to vanillin was accelerated and the fermentation time was significantly shortened. The whole genome information obtained in this study provides a basis of genetic information for understanding the metabolic mechanism of Amycolatopsis sp. during the fermentative production vanillin from ferulic acid, and also provides theoretical support for the research of obtaining high vanillin-producing strains through metabolic engineering.

Key words vanillin; Amycolatopsis sp.; whole genome sequencing; ferulic acid; gene function annotation

DOI:10.13995/j.cnki.11-1802/ts.035407

引用格式:王冠娜,郑义培,郑璞.Amycolatopsis sp.的全基因组测序及香兰素合成途径分析[J].食品与发酵工业,2024,50(4):25-30.WANG Guanna,ZHENG Yipei,ZHENG Pu.Whole genome sequencing and vanillin synthesis pathway analysis of Amycolatopsis sp.[J].Food and Fermentation Industries,2024,50(4):25-30.

第一作者:硕士研究生(郑璞教授为通信作者,E-mail:zhengpu@jiangnan.edu.cn)

基金项目:国家轻工业技术与工程一流学科计划(LITE2 018-04)

收稿日期:2023-03-07,改回日期:2023-04-02