不同培养条件下酿酒酵母菌的转录组差异分析

杨新1,4，陈莉1,2*，杨双全3*，卢红梅1,2，章之柱1,2

1(贵州大学，贵州省发酵工程与生物制药重点实验室，贵州贵阳， 550025)2(贵州大学酿酒与食品工程学院，贵州贵阳， 550025)3(贵州大学化学与化工学院，贵州贵阳， 550025)4(开阳县市场监督管理局，贵州贵阳， 550300)

摘要从组学水平分析富硒条件下酿酒酵母菌(Saccharomyces cerevisiae)内在分子机制，为酿酒酵母菌富硒研究及富硒基因的挖掘利用提供理论依据。该研究以不加硒培养的酿酒酵母菌作为对照组Kb，以加20 μg/mL硒培养的酿酒酵母菌为实验组Se，利用Illumina高通量测序平台对两组进行转录组测序，通过生物信息学方法对数据进行分析处理。结果表明，转录组测序共获得6 445个Unigenes，分别有1 401个(21.74%)、3 665个(56.87%)、5 630个(87.35%)、6 112个(94.83%)、6 077个(94.29%)、5 059个(78.49%) Unigenes被注释到GO、KEGG、COG、NR、Swiss Prot和Pfam数据库，共有6 150个(95.42%)Unigenes得到注释。在GO功能注释中，共得到41个GO功能小类，在KEGG代谢通路分析时，获得了113条KEGG通路。该转录组测序数据质量高，结果覆盖面广，为酿酒酵母菌富硒基因挖掘和研究提供了一定的理论参考。

关键词酿酒酵母菌；富硒培养；转录组学；生物信息学；差异分析

硒(selenium，Se)是一种人体生长发育所必需的微量元素，具有“生命火种”、“心脏的守护神”和“抗癌之王”的美誉[1-2]。它是体内某些酶和蛋白的重要组成部分，具有抗衰老、抗氧化、抗肿瘤、影响人和动物的生殖发育、增强机体免疫力、拮抗有害重金属和预防多种疾病等生物学功能[1，3-5]。硒元素的缺乏会引起心血管疾病、肿瘤、克山病、大骨节病、癌症、高血压和免疫系统功能紊乱等疾病[6-9]。

酵母菌对许多微量元素具有较强的富集作用，比如铁、锌、硒、铬及锗等微量元素，但其富集机制与富集离子的种类有关[10-11]。此外，取决于酵母菌独特的细胞壁结构，它的主要结构及成分为葡聚糖、蛋白质、甘露聚糖、几丁质及少量脂类。因酵母菌具有体积小，表面积大，即比表面积大的特点，所以它具有代谢旺盛、繁殖速度快、产率高等优点。此外，还具有培养基原料来源广泛，易于人工控制培养，不受时间、季节、气候等条件的影响，且生产成本低、安全无污染、可持续性强等优点。因此，只需要在培养基中加入无机硒，酵母菌在生长繁殖过程中就可以将无机硒转化为有机硒，主要以蛋白质、氨基酸、多糖等结合而存在。故酵母菌是一种优越的富硒载体，富硒酵母菌作为一种理想的功能性食品添加剂，它不仅能提供硒源，而且还可以提供一定的蛋白质、氨基酸等营养物质。作为一种重要的、食品安全级微生物的酿酒酵母菌(Saccharomyces cerevisiae)[12-13]，将其作为富硒载体有着巨大的市场前景。

高通量测序技术又称“下一代”测序技术[14-15]，随着该技术的发展，它在生物体转录组基因表达分析中被广泛应用，而且能够精确便捷地挖掘出相关功能基因[16-19]。转录组测序技术(RNA-sequencing，RNA-Seq)具有通量大、高分辨率、高灵敏度、不需克隆、检测范围广、成本低及操作简单等优点，因此成为转录组研究的主要手段[20-23]，RNA-Seq技术已成功应用于多项研究中[24-26]。本实验采用转录组测序技术对酿酒酵母菌在不同硒浓度(0、20 μg/mL)培养条件下进行测序，然后基于转录组学采用生物信息学对酿酒酵母菌基因的表达差异进行分析，并对差异基因进行GO功能和KEGG富集分析，为今后对酿酒酵母菌富硒基因的挖掘以及研究提供了一定的理论基础。

1 材料与方法

1.1 材料与试剂

1.1.1 材料

具有富硒能力的酿酒酵母菌(实验室保藏)。

1.1.2 药品试剂

葡萄糖、硫酸镁，天津市永大化学试剂有限公司；酵母浸出粉、蛋白胨，上海博微生物科技有限公司；琼脂，北京Solarbio Science & Technology公司；亚硒酸钠，山东西亚化学股份有限公司；磷酸二氢钾，成都金山化学试剂有限公司；化学药品均为分析纯。

1.1.3 仪器与设备

SN-CJ-IF洁净工作台、YXQ-LS-5DS11立式压力蒸汽杀菌器，上海博讯实业有限公司医疗设备厂；SPX-250B智能型生化培养箱、DHG—9140B(101-2B)智能型电热恒温鼓风干燥箱，上海琅玕实验设备有限公司；TG16-WS台式高速离心机，湖南湘仪实验室仪器开发有限公司；BCD-290 W冰箱，青岛海尔股份有限公司；SZ-96A自动纯水蒸馏器，上海嘉措仪器设备有限公司；ZD-2A自动电位滴定仪，上海大普仪器有限公司；ESJ220-4B电子天平，沈阳龙腾电子有限公司。

1.2 实验方法

1.2.1 培养基配制

YPD培养基(g/L)：葡萄糖10.0，蛋白胨20.0，酵母浸出粉10.0，pH自然。

基础发酵培养基(g/L)：葡萄糖20.0、酵母浸出粉10.0、蛋白胨20.0、KH2PO4·3H2O 3.0、MgSO4·7H2O 1.0，121 ℃条件下高压灭菌20 min，pH 4.5，备用。

1.2.2 菌体收集

将酿酒酵母菌种子液以6%的接种量分别接种于硒质量浓度为0、20 μg/mL(每个硒浓度做3个重复)的富硒培养基中，培养基初始pH值为4.5，加硒时间为培养后6 h，装液量为100 mL/250 mL锥形瓶，在30 ℃，150 r/min的恒温摇床上培养72 h。培养结束后，离心收集菌体，分别标记为Kb1、Kb2、Kb3和Se1、Se2、Se3，然后立即置于液氮中保存。

1.2.3 酵母菌总RNA提取与质量检测

根据制造商的说明，使用TRIzol®试剂盒从酿酒酵母菌细胞中提取总RNA，并使用DNase I去除基因组DNA。对提取得到的RNA样品，使用1%(质量分数)的琼脂糖凝胶电泳检测RNA的纯度和完整度，使用NanoDrop2000 RNA检测RNA的纯度及浓度，使用Agilent 2100 Nano检测RNA的完整值(RNA integrity number，RIN)。仅使用高质量的RNA样品来构建测序文库，然后上机测序。

1.2.4 文库制备和转录组测序

RNA纯化，反转录，文库构建和测序均根据制造商的指导在上海美吉生物医药科技有限公司进行。使用Illumina TruSeqTM RNA Sample Prep Kit试剂盒构建RNA-seq转录组文库。立即根据poly(A)选择方法，通过oligo-dT磁珠分离mRNA。首先通过片段缓冲液进行片段化，然后使用SuperScript double-stranded cDNA合成试剂盒和随机六聚体引物合成双链cDNA。再根据文库构建方案对合成的cDNA进行末端修复，即磷酸化和“A”碱基添加，选择大小为2%低范围超琼脂糖上200～300 bp的cDNA目标片段，然后使用Phusion DNA聚合酶进行15个PCR循环进行PCR扩增。通过TBS380定量后，用Illumina Novaseq 6000(2×150 bp读长)对双端RNA-seq测序文库进行上机测序。

1.3 数据分析

使用软件SeqPrep(https://github.com/jstjohn/SeqPrep)和Sickle(https://github.com/najosh-i/sickle)以默认参数对原始的末端读数进行裁剪和质量控制。使用软件TopHat(http://tophat.cbcb.umd.edu/，版本2.1.1)[27]以定向模式将干净的读数分别与参考基因组比对。基于所选参考基因组序列，使用StringTie(http://ccb.jhu.edu/software/stringtie/)软件对Mapped Reads进行拼接，然后与原有的基因组注释信息进行比较。使用DESeq2软件对Raw counts进行统计分析，基于P<0.05 & |log2FC|≥2为筛选条件，筛选获得实验组与空白组之间表达差异的基因。

聚类分析是根据不同条件下差异基因TPM值的表达水平，作层次聚类分析，用于判断DEGs在不同条件下的表达模式。将筛选获得的差异表达基因在GO数据库和KEGG数据库中进行比对，然后根据比对结果进一步分析基因产物的功能及在细胞中的代谢途径。

2 结果与分析

2.1 RNA样品质量分析

转录组测序的RNA样品质量要求OD260/OD280值应为1.8～2.2、OD260/OD230值>2时核酸的纯度较高，RIN为1～10，数值越接近10完整性越好[28]。由图1及表1可知，6个样品RNA的纯度、浓度和完整度等质量指标完全符合后续转录组测序的要求，因此可以构建cDNA文库，进行上机测序。

M-marker;1～6-样品Kb1、Kb2、Kb3、Se1、Se2、Se3
图1 富硒酵母RNA样品琼脂糖凝胶电泳图
Fig.1 Agarose gel electrophoretogram of Se-enriched yeast RNA samples

表1 酿酒酵母RNA样品质量检测结果
Table 1 Quality test results of RNA samples of saccharomyces cerevisiae

样品名称浓度/(ng·μL-1)总量/μgOD260/280OD260/230RIN检测结果Kb11 309.3052.372.192.339.50AKb2693.9027.762.182.349.60AKb31 075.0043.002.182.349.50ASe1967.9038.722.202.379.80ASe21 145.4045.822.212.399.50ASe3780.5031.222.192.349.50A

注：A表示RNA条带清晰，无色素、蛋白、糖类等杂质污染，28/23S亮度大于18/16S，RIN值≥8.0，OD260/280≥1.9，OD260/230≥1.5，总量满足2次标准建库需求，可以进行后续实验

2.2 测序数据质量评估与分析

为探究酿酒酵母菌在不同硒浓度培养条件下的变化机制，首先对其进行转录组测序，共获得261 794 672条原始序列，然后对原始序列进行过滤处理，共获得259 164 884条干净序列。由表2可知，Kb组和Se组的Q20平均值分别为98.90%和98.89%，Q30平均值分别为96.15%和96.12%，此外GC相对含量分别为42.48%和42.23%。因此可知，转录组测序数据质量好，准确性高，可用于后续分析。

表2 测序数据统计表
Table 2 Statistical table of sequencing data

样品原始序列数/条总长度/G干净序列/条干净序列总长度/G碱基错误率/%Q20/%Q30/%GC含量/%Kb144 265 5246 684 094 12443 826 2126 488 693 6660.022 998.9396.2442.40Kb243 572 1906 579 400 69043 123 3626 416 845 9990.023 098.9196.2042.54Kb343 820 9346 616 961 03443 330 4706 439 517 8940.023 198.8596.0142.51Se142 282 3626 384 636 66241 887 5286 226 565 9170.023 098.8996.1142.21Se243 101 2126 508 283 01242 673 6526 351 674 5600.023 098.8996.1142.22Se344 752 4506 757 619 95044 323 6606 594 951 4710.023 098.9096.1442.26

2.3 参考序列比对分析

2.3.1 比对结果统计

本研究选取NCBI中酿酒酵母菌的基因组作为参考基因组。通常情况下，如果参考基因组选择合适，而且相关实验不存在污染，实验所产生的测序干净序列能定位到基因组上的比率通常会高于65%。本研究用Smalt软件对高质量数据进行比对，其结果见表3。

表3 比对结果统计表
Table 3 Statistical table of comparison results

SampleTotal readsTotal mappedMultiple mappedUniquely mappedKb143 826 21241 954 751(95.73%)1 329 786(3.03%)40 624 965(92.70%)Kb243 123 36241 352 081(95.89%)1 518 716(3.52%)39 833 365(92.37%)Kb343 330 47041 548 179(95.89%)1 339 585(3.09%)40 208 594(92.80%)Se141 887 52840 085 040(95.70%)1 918 135(4.58%)38 166 905(91.12%)Se242 673 65240 816 067(95.65%)2 291 950(5.37%)38 524 117(90.28%)Se344 323 66042 351 432(95.55%)1 739 661(3.92%)40 611 771(91.63%)

注：(1) Sample：样本名称；(2) Total reads：测序序列经过过滤后的序列数量统计(即，Clean reads)；(3) Total mapped：能定位到基因组上的Clean reads数；(4) Multiple mapped：在参考序列上有多个比对位置的Clean reads数；(5) Uniquely mapped：在参考序列上有唯一比对位置的Clean reads数

由表3可知，Kb组和Se组转录组测序获得的干净序列中，能定位到基因组上的干净序列片段平均值分别为41 084 180条和41 618 337条，占比为95.55%～95.89%，在参考序列上有多个比对位置的干净序列片段平均值分别为1 396 029条和1 983 249条，占比为3.03%～5.37%，在参考序列上有唯一比对位置的干净序列片段平均值分别为40 222 308条和39 100 931 条，占比为90.28%～92.8%。其中能定位到基因组上的干净序列片段数均大于95%，而在参考序列上有多个比对位置的干净序列片段数均小于10%，因此本次研究所测序列没有受到污染。

2.3.2 测序饱和度分析

转录本的表达水平不同，准确定量所需的测序深度也有所区别，在低表达的转录本中，为了保证定量的准确性，往往需要更大的测序深度，因而，可以通过饱和度曲线来评估不同测序深度条件下不同表达水平转录本是否被准确定量。本研究采用RSeQC-2.3.6软件对6个样品的测序饱和度进行分析，其结果如图2所示。

a-Kb1饱和度；b-Kb2饱和度；c-Kb3饱和度；d-Se1饱和度；e-Se2饱和度；f-Se3饱和度
图2 测序饱和度曲线图
Fig.2 The curve map of sequencing saturation

通常情况下，当TPM值>3.5的基因，在测序序列的40%比对上时接近饱和，即纵轴数值趋近于1，说明饱和度总体质量较高，且转录本表达水平越高相对误差越小。由图2可知，本研究中所有测序量能够覆盖绝大多数的表达基因，因此，该测序深度条件下转录本能够被准确定量。

2.3.3 测序覆盖度分析

测序覆盖度是用来评估测序结果的均一性，它是针对样品中所有基因的5′～3′区域上序列覆盖情况的综合分析。本研究采用RSeQC-2.3.6软件对本研究的6个样品进行分析，其结果如图3所示。其中横坐标为单个基因的碱基长度占总碱基长度的百分比，纵坐标为比对到所有基因的横轴位置上相应区间内的序列条数的总和。由图3可知，该测序所得序列在基因上均匀分布，且测序无偏向性。

图3 测序覆盖度分布图
Fig.3 The distribution map of sequencing coverage

2.3.4 不同区域序列分布

将比对到基因组上的序列在参考基因组不同区域的分布情况进行统计，主要定位区域为5个，即编码区(coding sequence，CDS)、内含子(intron)、基因间区(intergenic region)和5′和3′非翻译区(untranslated region，UTR)。如果测序序列被定位到内含子上，通常情况是因为注释不完全的基因组或是有非成熟的mRNA污染。如果测序序列被定位到基因间隔区域时，通常是因为背景噪音或者注释不完全的基因组。

图4分别为每个样品的序列在参考基因组不同区域的分布情况，可以看出6个样品的序列定位到编码区域最多，分别为98.27%、97.82%、98.23%、97.94%、96.93%和98.80%；定位到内含子区域分别为0.13%、0.13%、0.15%、0.15%、0.15%和0.15%；定位到基因间隔区域分别为0.05%、0.05%、0.05%、0.06%、0.06%和0.06%；定位到5′和3′非翻译区域分别为1.55%、2.01%、1.58%、1.85%、2.87%和0.98%。

a-Kb1;b-Kb2;c-Kb3;d-Se1;e-Se2;f-Se3
图4 不同区域Reads分布统计饼图
Fig.4 Statistical pie charts of Reads distribution in different regions

2.3.5 不同染色体序列分布

为了从宏观上了解所测序列在各染色体上的分布情况，因此将比对到基因组上的序列在参考基因组不同染色体上的分布情况进行统计。图5为6个样品比对到基因组上的序列在不同染色体上的分布统计柱状图，其中横坐标为不同染色体的名称，纵坐标为序列在染色体上的数量。由图5可知，酿酒酵母菌富硒后，NC-001136.10号染色体的序列数变化较大，而其他染色体的变化较小。

图5 不同染色体序列分布统计柱状图
Fig.5 Statistical histogram of reads distribution on different chromosomes

2.4 转录组功能注释

将酿酒酵母菌组装转录本分别在GO、KEGG、COG、NR、Swiss-Prot和Pfam各大数据库的比对结果进行统计(见表4)。其中有1 401个(21.74%)Unigene被注释到GO数据库，有3 665个(56.87%)Unigene被注释到KEGG数据库，有5 630个(87.35%)Unigene被注释到COG数据库，有6 112个(94.83%)Unigene被注释到NR数据库，有6 077个(94.29%)Unigene被注释到Swiss-Prot数据库和有5 059个(78.49%)Unigene被注释到Pfam数据库。

表4 功能注释统计表单位：%
Table 4 Functional annotation statistics table

统计类型Expre Gene numberExpre Transcript numberAll Gene numberAll Transcript numberGO1 381(0.2334)1 374(0.2338)1 401(0.2174)1 401(0.2174)KEGG3 632(0.6139)3 619(0.6159)3 665(0.5687)3 665(0.5687)COG5 527(0.9342)5 499(0.9358)5 630(0.8735)5 630(0.8735)NR5 844(0.9878)5 812(0.9891)6 112(0.9483)6 112(0.9483)Swiss Prot5 838(0.9868)5 806(0.9881)6 077(0.9429)6 077(0.9429)Pfam4 978(0.8414)4 957(0.8436)5 059(0.7849)5 059(0.7849)Total anno5 851(0.989)5 818(0.9901)6 150(0.9542)6 150(0.9542)Total5 916(1.0)5 876(1.0)6 445(1)6 445(1)

注：(1)All(Expre)Gene number (percent)：所有(或表达)基因的数量(百分比)；(2) All(Expre)Transcript number (percent)：所有(或表达)转录本的数量(百分比)；(3) Total：全部的序列数量；(4) Total anno：注释到数据库的基因/转录本数量；(5) GO：注释到GO库的基因/转录本数量；(6) KEGG：注释到KEGG库的序列数量；(7) COG：注释到COG库的基因/转录本数量；(8) NR：注释到NR库的基因/转录本数量；(9) Swiss-Prot：注释到Swiss-Prot库基因/转录本数量；(10) Pfam：注释到Pfam库基因/转录本数量。

2.5 样本间相关性分析

在研究过程中，样品之间基因表达水平相关性通常用皮尔逊相关系数的平方(R2)来表示，相关系数R2的值为0～1，越接近1，表明样品之间的相关性越大，即相似度越高。由图6可知，本研究中6个样品之间的相关系数R2的最小值为0.943，故本研究中结果可靠，同时对样品的选择也合理。

图6 样品间相关性热图
Fig.6 Heat map of correlation between samples

2.6 基因表达水平分析

2.6.1 差异表达基因筛选

同一生物体在不同时间和环境条件下，其某些基因的表达会存在显著性差异。同样，酿酒酵母菌从无硒环境到有硒环境中，主要通过调节机体内的某些基因的表达，来适应有硒环境。因本研究中有生物学重复的样品，其基因差异分析应使用Bioconductor软件包的DESeq2(V1.6.3)进行分析[29-30]，设置P≤0.05，上/下调差异倍数为≥2.0倍。共筛选出差异表达的基因994个，其中有498个基因表现为下调，占总差异表达50.10%，有496个基因表现为上调，占总差异表达49.90%，其结果分析见差异基因火山图及散点图(图7)。

a-火山图;b-散点图
图7 表达量差异火山图及散点图
Fig.7 Expression difference volcanic map and scatter map

通过对基因在各样品中的表达进行聚类，通常表达模式相似的基因具有功能相关性，因此，可以根据聚类分析来判断差异基因在不同实验条件下的表达模式，从而推断未知基因的功能。本研究采用差异分析软件DESeq2进行分析，以P≤0.05，上/下调差异倍数为≥10.0倍进行筛选，得到55个差异显著基因，然后绘制基因热图，结果如图8所示。

图8 基因聚类热图
Fig.8 Heat map of gene cluster

2.6.2 差异基因GO富集分析

对筛选出来的差异表达基因进行GO富集，可以查看其参与的生物学过程、构成细胞的组分及分子功能等信息，因此，对差异表达基因进行GO功能显著性富集分析，可以得到差异表达基因与哪些生物学功能显著相关。

酿酒酵母菌在不同硒质量浓度(0、20 μg/mL)培养条件下的差异基因GO富集分类结果如图9所示，结果显示共分为41个功能组，其中，生物过程(biological process，BP)有17个功能亚类，主要注释为细胞过程、代谢过程、单一生物过程、细胞成分的组织或生物发生等亚类；细胞组成有13个功能亚类，主要注释为细胞、细胞部分、细胞器、细胞器部分、大分子复合物等亚类的组成；分子功能有11个功能亚类，主要注释为催化活性、捆绑等亚类。

图9 GO分类统计柱形图
Fig.9 Statistical histogram of GO classification

2.6.3 差异基因KEGG富集分析

生物体内的生物学功能主要通过不同基因的相互协调而发挥作用，通过对差异表达基因进行通路显著性分析，可以找出差异表达基因相对于所有有注释的基因显著富集的通路，同时还可以确定差异表达基因参与的最主要生化代谢途径和信号转导途径。

酿酒酵母菌在不同硒浓度(0、20 μg/mL)培养条件下的差异基因KEGG富集气泡图是KEGG富集分析结果的可视化方式。纵坐标表示通路名称，横坐标表示比值，其值越大，该代谢通路富集的程度越大，而气泡的大小表示此通路中基因数量，气泡的颜色对应于不同的q值范围。本研究挑选最显著的20条富集基因进行展示。由图10可知，富集到“减数分裂-酵母”通路上的基因共有38个，呈显著富集；其次是“糖酵解/糖异生”、“乙醛酸和二羧酸酯代谢”、“过氧化物酶体”、“淀粉和蔗糖代谢”与“氨基糖和核苷酸糖代谢”通路上的基因分别有24、19、19、17、16个；富集到“半乳糖代谢”与“丙酮酸代谢”通路上的基因均为14个；富集到“甲烷代谢”通路上的基因有12个；富集到“脂肪酸降解”通路上的基因有11个；富集到“果糖和甘露糖代谢”通路上的基因有10个；富集到“谷胱甘肽代谢”与“甘油脂代谢”通路上的基因均有9个；富集到“脂肪酸生物合成”与“丙酸酯代谢”通路上的基因均为7个；富集到“缬氨酸，亮氨酸和异亮氨酸的降解”与“β-丙氨酸代谢”通路上的基因均为6个；富集到“不饱和脂肪酸的生物合成”与“戊糖和葡萄糖醛酸酯的相互转化”通路上的基因均为5个；富集到“抗坏血酸和藻酸盐代谢”通路上的基因为3个。

图10 KEGG富集分析气泡图
Fig.10 Bubble map of KEGG enrichment analysis

3 结论

本研究采用Illumina HiSeq测序平台，对酿酒酵母菌在不同硒质量浓度(0、20 μg/mL)培养条件下的转录组进行测序分析，测序质量良好。其中对照组是以不富硒的酿酒酵母菌为材料，共获得131 658 648条原始序列，经过过滤后得到130 280 044条干净序列；实验组是以富硒的酿酒酵母菌为材料，共获得130 136 024条原始序列，经过过滤后得到128 884 840 条干净序列。基于P<0.05 & |log2FC|≥2为筛选条件，2组样品之间共筛选获得994个显著性差异表达基因，其中有496个基因表达量上调，有498个基因表达量下调。通过差异基因GO富集分析结果可以明确酿酒酵母菌在不同硒浓度培养条件下的细胞组分、生物学过程和分子功能三大分类中的差异表达基因。最后对差异表达基因进行KEGG富集分析，确定了差异表达基因的显著富集通路，同时找出了差异表达基因参与的最主要生化代谢途径和信号转导途径，最终以气泡图的形式对分析结果进行展示。结果表明2组样品的差异表达基因KEGG代谢通路中显著富集的通路有：减数分裂-酵母、糖酵解/糖异生、乙醛酸和二羧酸酯代谢、过氧化物酶体、淀粉和蔗糖代谢、氨基糖和核苷酸糖代谢、硫代谢、半胱氨酸和蛋氨酸代谢、谷胱甘肽代谢及硒化合物代谢等。研究结果为进一步分析酿酒酵母菌富硒基因的挖掘和研究提供了一定理论参考及科学依据。

参考文献

[1] TSAI C F, OU B R, LIANG Y C, et al.Growth inhibition and antioxidative status induced by selenium-enriched broccoli extract and selenocompounds in DNA mismatch repair-deficient human colon cancer cells[J].Food Chemistry, 2013, 139(1):267-273.

[2] FAIRWEATHER-TAIT S, BAO Y, BROADLEY M R, et al.Selenium in human health and disease[J].Antioxidants & Redox Signaling, 2011,14(7):1 337-1 383.

[3] El-DEMERDASH F M.Antioxidant effect of vitamin E and selenium on lipid peroxidation, enzyme activities and biochemical parameters in rats exposed to aluminium[J].Journal of Trace Elements in Medicine and Biology, 2004, 18(1):113-121.

[4] BRYSZEWSKA M A, MAGE A.Determination of selenium and its compounds in marine organisms[J].Journal of Trace Elements in Medicine and Biology, 2015, 29(1):91-98.

[5] 王磊，杜菲，孙卉，等.人体硒代谢与硒营养研究进展[J].生物技术进展，2015，5(4)：285-290.

WANG L, DU F, SUN H, et al.Progress on selenium metabolism and nutrition in human[J].Current Biotechnology, 2015, 5(4):285-290.

[6] IP C, DONG Y, GANTHER H.New concepts in seleniu chemoprevention[J].Cancer and Metastasis Reviews, 2002, (21):281-289.

[7] XUE M, CARLSON B A, GRIMM T A, et a1.Rhesus monkey simian immunodeficiency virus infection as a model for assessing the role of selenium in AIDS[J].Journal of Acquired Immune Deficiency Syndromes, 2002, 31(5):453-463.

[8] TAN J, ZHU W, Wang W, et a1.Selenium in soil and endemic diseases in China[J].Science of The Total Environment, 2002, 284:227-235.

[9] HOU J, WANG T, LIU M F, et al.Suboptimal selenium supply:A continuing problem in Keshan disease areas in Heilongjiang province[J].Biological Trace Element Research, 2011, 143(3):1 255-1 263.

[10] LIN Y L, CHANG Y Y, YANG D J, et al.Beneficial effects of noni (Morinda citrifolia L.) juice on livers of high-fat dietary hamsters[J].Food chemistry, 2013, 140(1):31-38.

[11] CRISTALDI L A, MCDOWELL L R, BUERGELT C D, et al.Tolerance of inorganic selenium in wether sheep[J].Small Ruminant Research, 2005, 56(1):205-213.

[12] ABBOTT D A, ZELLE R M, PRONK J T, et al.Metabolic engineering of Saccharomyces cerevisiae for production of carboxylic acids:Current status and challenges[J].FEMS Yeast Research, 2009, 9:1 123-1 136.

[13] LIAN J, MISHRA S, ZHAO H.Recent advances in metabolic engineering of Saccharomyces cerevisiae:New tools and their applications[J].Metabolic Engineering, 2018, 50:85-108.

[14] SULTAN M, SCHULZ M H, RICHARD H, et al.A global view of gene activity and alternative splicing by deep sequencing of the human transcriptome[J].Science, 2008, 321(5 891):956-960.

[15] SCHUSTER S C.Next-generation sequencing transforms today′s biology[J].Nature Methods, 2008, 5(1):16-18.

[16] 聂文强，吴天祥，钟敏，等.真菌灰树花菌丝体转录组测序及分析[J].食品科学，2017，38(20)：6-11.

NIE W Q, WU T X, ZHONG M, et al.Transcriptome sequencing and analysis of grifola frondosa mycelia[J].Food Science, 2017, 38(20):6-11.

[17] 宋雪飞，郭晶晶，姜静，等.植物乳杆菌FS5-5在盐胁迫下的转录组学分析[J].食品科学，2017，38(6)：20-26.

SONG X F, GUO J J, JIANG J, et al.Transcriptomic analyses of Lactobacillus plantarum FS5-5 against salt stress[J].Food Science, 2017, 38(6):20-26.

[18] QI Y X, LIU Y B, RONG W H.RNA-Seq and its applications:A new technology for transcriptomics[J].Hereditas, 2011, 33(11):1 191-1 202.

[19] 周华，张新，刘腾云，等.高通量转录组测序的数据分析与基因发掘[J].江西科学，2012，30(5)：607-611.

ZHOU H, ZHANG X, LIU T Y, et al.Data processing and gene discovery of high-throughput transcriptome sequencing[J].Jiangxi Science, 2012, 30(5):607-611.

[20] 许波，张伟强，冯晓曦，等.转录组测序技术在玉米中的应用研究进展[J].玉米科学，2014，22(1)：67-72；78.

XU B, ZHANG W Q, FENG X X, et al.Application progress of transcriptome sequencing technology in maize[J].Journal of Maize Sciences, 2014, 22(1):67-72；78.

[21] QI Y X, LIU Y B, RONG W H.RNA-Seq and its applications:A new technology for transcriptomics[J].Hereditas(Beijing), 2011, 33(11):1 191-1 202.

[22] 石浩然. 基于二代测序的转录组数据分析方法的比较研究[D].雅安：四川农业大学，2016.

SHI H R.Comparison of transcriptome analysis methods based on next-generation sequencing technologies[D].Ya′an:Sichuan Agricultural University, 2016.

[23] 姚娜，刘秀明，董园园，等.转录组的测序方法及应用研究概述[J].北方园艺，2017(12)：192-198.

YAO N, LIU X M, DONG Y Y, et al.Advances in application and seguencing methods of transcriptome[J].Northern Horticulture, 2017(12):192-198.

[24] WANG J, DEAN D C, HORNICEK F J, et al.RNA sequencing (RNA-Seq) and its application in ovarian cancer[J].Gynecologic oncology,2019,152(1):194-201.

[25] SALIBA A E, C SANTOS S, VOGEL J.New RNA-seq approaches for the study of bacterial pathogens[J].Current Opinion in Microbiology, 2017, 35:78-87.

[26] 叶美玲. 南极酵母AN5重金属Cu2+胁迫的转录组学研究[D].哈尔滨:哈尔滨工业大学，2015.

YE M L.Transcriptomics of antarctic yeast an5 under heavy metal(Cu2+)Stress[D].Harbin：Harbin Institute of Technology, 2015.

[27] TRAPNELL C, PACHTER L, SALZBERG S L.TopHat:Discovering splice junctions with RNA-Seq[J].Bioinformatics, 2009, 25(9):1 105-1 111.

[28] PATIL K V, CANLON B, CEDERROTH C R.High quality RNA extraction of the mammalian cochlea for qRT-PCR and transcriptome analyses[J].Hearing Research, 2015, 325(7):42-48.

[29] ANDERS S, HUBER W.Differential expression analysis for sequence count data[J].Genome Biology, 2010, 11(10):106-107.

[30] LOVE M I, HUBER W, ANDERS S.Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2[J].Genome Biology, 2014, 15(12):550-553.

Transcriptome analysis of Saccharomyces cerevisiae under different culture conditions

YANG Xin1,4,CHEN Li1,2*,YANG Shuangquan3*,LU Hongmei1,2,ZHANG Zhizhu1,2

1(Guizhou Key Lab of Fermentation Engineering and Biological Pharmacy, Guizhou University, Guiyang 550025, China)2(School of Liquor-making and Food Engineering, Guizhou University, Guiyang 550025, China)3(School of Chemistry and Chemical Engineering, Guizhou University, Guiyang 550025, China)4(Market Supervision Administration of KaiYang, Guiyang 550300, China)

ABSTRACT To analyze the internal molecular mechanism of Saccharomyces cerevisiae under selenium-enriched conditions from the omics level and provide a theoretical basis for the study of selenium-enriched S. cerevisiae and the mining and utilization of selenium-enriched genes, S. cerevisiae cultured without selenium was used as the control group Kb, and S. cerevisiae cultured with 20 μg/mL selenium was used as the experimental group Se. Illumina high-throughput sequencing platform was used to sequence the transcriptome. Data were analyzed and processed by a variety of bioinformatics methods. The results showed that a total of 6 445 Unigenes were obtained by transcriptome sequencing, including 1 401 (21.74%), 3 665 (56.87%), 5 630 (87.35%), 6 112 (94.83%), 6 077 (94.29%) and 5 059 (78.49%) Unigenes were annotated to GO, KEGG, COG, NR, Swiss Prot and Pfam databases, and a total of 6 150 (95.42%) Unigenes were annotated. In the GO functional annotation, a total of 41 GO functional subclasses were obtained, and 113 KEGG pathways were obtained in the KEGG metabolic pathway analysis. The high-quality transcriptome sequencing data and wide coverage provide a certain theoretical reference for selenium-enriched gene mining and research of S. cerevisiae.

Key words Saccharomyces cerevisiae;selenium-rich culture;transcriptomics;bioinformatics;variance analysis

DOI:10.13995/j.cnki.11-1802/ts.024863

引用格式:杨新，陈莉，杨双全，等.不同培养条件下酿酒酵母菌的转录组差异分析[J].食品与发酵工业,2021,47(4):102-109.YANG Xin,CHEN Li,YANG Shuangquan, et al.Transcriptome analysis of Saccharomyces cerevisiae under different culture conditions[J].Food and Fermentation Industries,2021,47(4):102-109.

第一作者：硕士研究生(陈莉副教授和杨双全副教授为共同通讯作者，E-mail：3152539622@qq.com；441221916@qq.com)

基金项目：贵州省科技支撑计划项目(黔科合支撑[2019]2317号)

收稿日期：2020-06-27，改回日期：2020-09-01