枸杞子为茄科(Solanaceae)植物宁夏枸杞(Lycium barbarum L.)的干燥成熟果实[1],系著名药材和保健品,具有抗肿瘤、防衰老、降血脂、抗氧化等功效[2-5]。作为一种“药食两用”的植物资源,随着生活水平的提高和保健观念的增强,国内外市场对于枸杞的需求逐渐扩大。枸杞主要以枸杞干果的形式在市场中流通,另外,枸杞果酒、果汁和籽油等相关附加值产品也深受消费者的喜爱[6]。目前,我国枸杞主产区的绝大多数栽培品种均引自宁夏枸杞系列品种[7]。研究表明,不同品种或不同产地的枸杞果实在多酚、糖类、维生素、氨基酸等[8-12]化学成分含量等方面具有较大差异,从而对口感、风味[13]及品质[14]产生不同程度的影响。例如,枸杞多糖含量可作为枸杞果酒的酿造工艺的衡量指标[15],枸杞营养成分含量是枸杞品质评价的指标之一[16]。因此,开展不同品种枸杞的快速、准确判别,有利于根据不同枸杞品种的差异有针对性地开展枸杞资源的利用,提高资源的利用率。
目前,鉴别不同枸杞品种的方法主要有感官判断和化学方法[17],但是视觉和感官判断通常存在较大误差,化学方法则需要对样品进行粉碎、提取等处理,导致对样品的破坏性较大。近红外光谱(near infrared spectrum,NIR)分析技术具有快速、无损、准确等优点,已被成功应用到不同品种和不同产地枸杞的鉴别工作中。例如,许春瑾等[18]利用近红外光谱技术建立了枸杞的产地判别模型,许生陆等[19]建立了枸杞总糖含量快速准确的检测方法,所建的2种模型效果均较好。但以上工作皆未对枸杞品种分辨展开研究。同时,不同种植区的枸杞品质之间存在较大差异[20],目前暂未有产自柴达木盆地的不同中宁枸杞的红外判别方法报道。可见,亟需建立一种快速且准确的鉴别不同枸杞品种方法,方便生产实践的应用。
因此,本文以12个不同品种的中宁枸杞为研究对象,在谱图解析的基础上,利用近红外光谱技术结合化学计量学方法,建立了不同光谱采集方式下的中宁枸杞品种判别模型,实现了枸杞品种的快速直观识别,所建方法在生产实践中具有较好的推广应用价值,为具体生产实践提供了一种更为准确快捷的检测方法。
12个不同品种中宁枸杞样品于2021年成熟期采自青海省柴达木盆地,由青海大学樊光辉副研究员分别鉴定为大麻叶枸杞、蒙杞1号、宁菜杞、宁杞2号、宁杞3号、宁杞4号、宁杞5号、宁杞6号、宁杞8号、宁杞9号、青黑杞1号和中科绿川1号。每个品种分为3份样品,共得到36份样品。样品经真空冷冻干燥后,粉碎,装入自封袋后置于干燥器中避光备用。
iS50傅里叶变换红外光谱分析仪,美国Thermo Fisher公司,配有NIR-光纤和NIR-积分球漫反射附件;LGT-10C真空冷冻干燥机,四环福瑞科仪科技发展(北京)有限公司;粉碎机。
1.3.1 光谱采集
利用傅里叶变换红外光谱仪的积分球漫反射附件和光纤探头附件分别采集样品的NIR-积分球光谱和NIR-光纤光谱。采集条件均为扫描次数64次,分辨率4 cm-1,光谱采集范围10 000~4 250 cm-1。光谱采集前预热仪器至少30 min,待仪器稳定后使用,采集过程中实时扣除CO2和水的背景干扰,每份样品采集3次,取平均谱图待分析用。实验室温度保持在25 ℃左右,湿度控制在35%以下。
1.3.2 模型建立与评价
在TQ analyst软件中将样品对应的品种赋值到光谱,再将样品光谱按照2∶1的比例随机分为校正集和验证集。以建模方法:距离匹配(distance match,DM)、判别分析(discriminant analysis,DA),光程类型:Constant、多元散射校正(multivariate scattering correction,MSC)、标准正态变换(standard normal variate,SNV),谱图类型:原谱图、一阶导数谱图(first derivative spectrum,D1)、二阶导数谱图(second derivative spectrum,D2)为因素设计3因素3水平正交试验表(表1)进行正交试验。其中,原谱图时不采用平滑处理,D1和D2时进行Norris平滑处理。
表1 建模条件水平因素表
Table 1 Modeling condition level factor of variety discrimination model
水平A(建模方法)B(光程类型)C(谱图类型)1DMConstant原谱图2DAMSCD13—SNVD2
注:—表示无(下同)。
根据正交试验下建模条件的组合,记录不同建模组合条件下模型的校正集、验证集和样本集的误判数,以公式(1)~公式(3)分别计算模型的识别率、预测率和准确率,以此为指标判断模型效果。以准确率最高的建模条件组合为实际最优组合,对正交试验结果进行极差分析,得出理论最优组合。将实际最优组合与理论最优组合进行比较,选出最佳建模条件,同时利用相关系数法(correlation coefficient)确定建模波段。最后,利用优化后的建模条件和建模波段建立品种判别模型。比较2种采集方式下模型的效果,建立品种鉴别模型。识别率、预测率、准确率计算分别如公式(1)、公式(2)、公式(3)所示:
识别率
(1)
预测率
(2)
准确率
(3)
利用Python软件,采用支持向量机(support vector machine, SVM)方法建立模型,以识别率、预测率和准确率为指标评价模型。
对2种NIR采集方式下的谱图特征吸收峰进行归属,对谱图进行分析,比较不同采集方式下NIR的异同。其次,分别利用TQ analyst和Python软件,借助DM、DA、SVM等化学计量学分析方法建立不同光谱采集方式下的中宁枸杞品种判别模型,比较不同采集方式下品种判别模型效果的差异。
不同采集方式下的原始光谱如图1所示。其中,图1-a为NIR-光纤光谱,图1-b为NIR-积分球光谱。由图1-a可以看出,不同采集方式下的近红外光谱谱图变化趋势一致,说明2种不同的采集方式所获得的光谱信息基本一致。而不同样品表现出不同的吸光度,其差异说明各样品化学成分含量不同,光谱数据符合建立红外品种判别模型要求。
a-NIR-光纤光谱;b-NIR-积分球光谱
图1 不同品种中宁枸杞的原始光谱图
Fig.1 Original spectra of different varieties of L.barbarum
不同品种中宁枸杞的NIR-光纤光谱有8 249、6 770、6 339、5 775、5 665、5 155、4 740、4 322 cm-1等8个系列特征峰,NIR-积分球光谱有8 277、6 759、6 355、5 791、5 681、5 156、4 735、4 261 cm-1等8个系列特征峰。二者的特征峰吸收位置基本相似。
由于近红外光谱测定的样品通常为不经过提纯等预处理的复杂样品,各种成分混在一起,即使是单纯物质的近红外光谱,其谱峰也常有重叠,复杂物质的近红外光谱,其谱峰重叠更为严重[21]。因此,对各特征峰进行归属,结果发现8 249 cm-1和8 277 cm-1附近为—CH2的二级倍频吸收,6 770 cm-1和6 759 cm-1附近为醇羟基O—H的一级倍频吸收,6 339 cm-1和6 355 cm-1附近为N—H的一级倍频伸缩振动,5 775 cm-1和5 791 cm-1附近为—CH3中C—H的一级倍频吸收,5 681 cm-1和5 665 cm-1附近为—CH2中C—H的一级倍频吸收,5 155 cm-1附近为水羟基O—H的合频吸收,4 740 cm-1和4 735 cm-1附近为N—H的合频吸收峰,4 322 cm-1和4 390 cm-1附近为—CH3和—CH2中C—H的合频吸收[22]。
为深入分析谱图特征,利用一阶导数进行了谱图处理,扩大种间差异性,结果如图2所示。其中,图2-a为NIR-光纤一阶导数谱图,图2-b为NIR-积分球一阶导数谱图。由图2可知,谱图经过一阶导数的处理后,各样品的NIR-积分球谱图差异扩大,且样品的谱图间差异大于NIR-光纤谱图。
a-NIR-光纤一阶导数光谱;b-NIR-积分球一阶导数光谱
图2 不同品种中宁枸杞的一阶导数谱图
Fig.2 First derivative spectra of different varieties of L.barbarum
2.2.1 DM、DA模型
将样品的近红外光谱输入TQ analyst软件,按照1.3节方法进行实验。利用正交试验优化NIR-光纤、NIR-积分球建模条件,并对试验结果进行极差分析,结果如表2所示。
表2 建模条件优化结果
Table 2 The results of modeling condition optimization
序号建模方法A光程类型B谱图类型CNIR-光纤NIR-积分球识别率/%预测率/%准确率/%识别率/%预测率/%准确率/%1111100.0025.0075.00100.0083.3394.442112100.0066.6788.89100.00100.00100.003113100.0041.6780.56100.00100.00100.004121100.0041.6780.56100.00100.00100.005122100.0050.0083.33100.00100.00100.006123100.0050.0083.33100.00100.00100.007131100.0041.6780.56100.00100.00100.008132100.0050.0083.33100.00100.00100.009133100.0050.0083.33100.00100.00100.0010211100.0075.0091.67100.00100.00100.0011212100.00100.00100.00100.00100.00100.001221395.8391.6794.44100.00100.00100.0013221100.00100.00100.00100.00100.00100.0014222100.00100.00100.00100.00100.00100.0015223100.0091.6797.22100.00100.00100.0016231100.00100.00100.00100.00100.00100.0017232100.00100.00100.00100.00100.00100.0018233100.00100.00100.00100.00100.00100.00K1738.89530.56527.79894.44594.44594.44K2883.33544.44555.55K=4 866.66900.00600.00600.00K=5 383.32K3—547.22538.88—600.00600.00K182.1088.4387.9799.3899.0799.07K298.1590.7492.59K=720.99100.00100.00100.00K=797.53K3—91.2089.81—100.00100.00R16.052.784.630.620.930.93
注:K值为相应因素水平下的预测率总和。
由表2各水平的K值可知,NIR-光纤模型的理论最优组合为A2B3C2,即No.17(DA+SNV+D1)。由R值可知,建模方法是影响判别模型的主要因素,其次为谱图类型,光程类型对模型建立的影响最小。以DA+SNV+D1为建模条件,建模波段为9 880~4 364 cm-1建立品种判别模型,模型识别率、预测率和准确率均为100.00%。NIR-光纤品种判别模型可用于识别不同品种的中宁枸杞。
NIR-积分球除No.1样品外,在其他建模条件下的识别率、预测率和准确率均为100.00%。以DA+SNV+D1为建模条件,建模波段为9 880~4 364 cm-1建立品种判别模型。同一品种样品在空间的同一区域聚集,不同品种间各自分开,表明模型的分类效果较好,可以快速准确判别不同品种中宁枸杞。
2.2.2 SVM模型
将样品的红外数据输入Python软件,在SVM方法下建立2种采集方式下的物种判别模型。其中,NIR-光纤模型的识别率为79.16%,预测率为83.33%,准确率为80.56%;NIR-积分球模型的识别率、预测率和准确率均为100%,二者验证集的分类情况如图3所示。由图3可知,NIR-光纤模型在验证时将蒙杞1号和宁杞5号分类错误,而NIR-积分球模型均识别正确,效果明显优于NIR-光纤模型。
a-NIR-光纤模型分类图;b-NIR-积分球模型分类图
图3 NIR-光纤和NIR-积分球品种判别模型分类图
Fig.3 Classification diagram of NIR-optical fiber and NIR-integrating sphere model
一阶导数处理能有效提升谱图的信噪比,扩大谱图间差异,有利于提升模型识别效率[23-24]。NIR-积分球一阶导数谱图差异大于NIR-光纤一阶导数谱图,表明积分球漫反射采集方式更适合枸杞样品,所采集的光谱质量更优,由近红外谱图上更能呈现不同品种枸杞间的差异。
SVM在解决小样本、非线性和高维模式识别问题中表现出许多特有的优势,被广泛应用于分类识别[25]。针对红外光谱的分类特征点较多且复杂的特点,SVM可以通过将特征映射到核空间中降低问题的复杂性,提高分类的准确率[26],使得分类效果在众多算法模型中脱颖而出。作为一种二元分类模型,SVM在其他药材的的定性鉴别上也取得了良好的效果[27-28]。因此,本研究采用了SVM作为建模方法进行分类。研究结果也表明,使用SVM开发的分类模型具有很强的鲁棒性,可以高置信度地对中宁枸杞的品种进行分类。
比较DM、DA、SVM品种判别模型,均表现为NIR-积分球的分类判别结果优于NIR-光纤结果,虽然二者的准确率均为100.00%,但NIR-积分球模型的区分效果明显优于NIR-光纤模型,在3D空间中无交叉,空间投影也相互独立,分类效果更好,表明NIR-积分球采集方式更适用于不同品种中宁枸杞的分类鉴别。耿姝[29]以三七粉末样品为例,对NIR-积分球和NIR-光纤2种采集方式下的原始光谱及建模效果进行了分析,发现二者的光谱峰形基本一致,但积分球下的光谱更光滑,信噪比更高,谱图质量更优,且所建模型也以积分球模型效果更佳,这与本研究结果一致。
选择更合适的光谱采集方式,结合适当的预处理方法,辅以化学计量学方法等“辅助分析手段”,能有效地提取样品的光谱信息,进而提高模型整体性能[30-31]。
利用近红外积分球漫反射和光纤探头2种采集方式获取了不同品种中宁枸杞的近红外光谱,并对2种谱图进行了分析,结合化学计量学方法,建立了品种快速识别模型,主要结论如下:a)2种采集方式下的一维近红外谱图峰形基本一致,但经过一阶导数处理后,样品在积分球采集方式下得到的光谱图间差异扩大,且差异程度大于光纤探头模式的谱图;b)NIR-积分球模型效果优于NIR-光纤模型,识别率、预测率和准确率均达到100%。研究表明,近红外光谱技术在定性检测中是可行的,所建立的模型可准确地鉴别不同品种中宁枸杞,且积分球漫反射附件采集得到的光谱效果优于光纤探头附件。
[1] 国家药典委员会. 中华人民共和国药典[M].北京:中国医药科技出版社, 2020:260.
Chinese Pharmacopoeia Commission.Pharmacopoeia of the People′s Republic of China[M].Beijing:China Medical Science Press, 2020:260.
[2] AI Y, SUN Y N, LIU L, et al.Determination of biogenic amines in different parts of Lycium barbarum L.by HPLC with precolumn dansylation[J].Molecules, 2021, 26(4):1046.
[3] LIN X E, SONG F Y, WU Y M, et al.Lycium barbarum polysaccharide attenuates Pseudomonas-aeruginosa pyocyanin-induced cellular injury in mice airway epithelial cells[J].Food &Nutrition Research,2022, 66:4585.
[4] 王磊, 覃鸿, 李静, 等.近红外高光谱图像的宁夏枸杞产地鉴别[J].光谱学与光谱分析, 2020, 40(4):1270-1275.
WANG L, QIN H, LI J, et al.Geographical origin identification of Lycium barbarum using near-infrared hyperspectral imaging[J].Spectroscopy and Spectral Analysis, 2020, 40(4):1270-1275.
[5] YANG L L, LIANG Q, ZHANG Y J, et al.Variation of phytochemical composition of Lycium chinense leaves as an endemic high-value healthy resource[J].Scientia Horticulturae, 2021, 281(8):109910.
[6] 葛邦国, 刘志勇, 朱风涛, 等.枸杞加工研究现状与前景展望[J].食品研究与开发, 2014, 35(4):93-97.
GE B G, LIU Z Y, ZHU F T, et al.Present situation and prospect of research on product development of Lycium barbarum L.[J].Food Research and Development, 2014, 35(4):93-97.
[7] 开建荣, 李彩虹, 赵丹青, 等.宁夏不同地区、不同品种枸杞中元素含量差异分析[J].食品与发酵工业, 2020, 46(7):257-264.
KAI J R, LI C H, ZHAO D Q, et al.Analysis of mineral elements in wolfberry (Lycium barbarum) from different regions and varieties[J].Food and Fermentation Industries, 2020, 46(7):257-264.
[8] 杨春霞, 李彩虹, 杨静, 等.宁夏产区不同品种枸杞中总酚含量分析[J].食品研究与开发, 2020, 41(8):183-187.
YANG C X, LI C H, YANG J, et al.Analysis of polyphenols content in different varieties of Lycium barbarum L.in Ningxia producing area[J].Food Research and Development, 2020, 41(8):183-187.
[9] 王益民, 张珂, 许飞华, 等.不同品种枸杞子营养成分分析及评价[J].食品科学, 2014, 35(1):34-38.
WANG Y M, ZHANG K, XU F H, et al.Chemical analysis and nutritional of different varieties of Goji berries (Lycium barbarum L.)[J].Food Science, 2014, 35(1):34-38.
[10] LIU W J, XIA M Q, BAI J, et al.Chemical characterization and 5α-reductase inhibitory activity of phenolic compounds in goji berries[J].Journal of Pharmaceutical and Biomedical Analysis, 2021, 201:114-119.
[11] 孙红亮. 11种枸杞子总黄酮和总硒含量分析[J].分子植物育种, 2022, 20(18):6177-6187.
SUN H L.Analysis of total flavonoids and total selenium content of Lycium barbarum L.of 11 cultivars[J].Molecular Plant Breeding, 2022, 20(18):6177-6187.
[12] 王莹, 时锐, 张南平, 等.不同产地和不同品种枸杞子中多糖成分测定[J].中国现代中药, 2022, 24(6):996-1002.
WANG Y, SHI R, ZHANG N P, et al.Determination of polysaccharides in wolfberry from different producing areas and species[J].Modern Chinese Medicine, 2022, 24(6):996-1002.
[13] 禄璐, 闫亚美, 米佳, 等.枸杞原浆品质分析与评价标准构建[J].食品工业科技, 2022, 43(21):271-281.
LU L, YA Y M, MI J, et al.Quality analysis and evaluation standard construction of fresh Goji (Lycium barbarum L.) pulp[J].Science and Technology of Food Industry, 2022, 43(21):271-281.
[14] 蒋兰, 杨毅, 江荣高.枸杞的药理作用及其加工现状[J].食品工业科技, 2018, 39(14):330-334.
JIANG L, YANG Y, JIANG R G, et al.Pharmacological action of Chinese wolfberry and its comprehensive processing utilization[J].Science and Technology of Food Industry, 2018, 39(14):330-334.
[15] 李曼祎. 枸杞果酒的研制[D].无锡:江南大学, 2021.
LI M Y.Research of wolfberry wine[D].Wuxi:Jiangnan University, 2021.
[16] 周琪乐, 龚凌慧, 纪凤娣, 等.红枸杞、黄枸杞和黑枸杞营养成分比较[J].中国酿造, 2021, 40(10):43-49.
ZHOU Q L, GONG L H, JI F D, et al.Comparison of nutritional constituents of red wolfberry, yellow wolfberry and black wolfberry[J].China Brewing, 2021, 40(10):43-49.
[17] TANG N Q, SUN J, YAO K S, et al.Identification of Lycium barbarum varieties based on hyperspectral imaging technique and competitive adaptive reweighted sampling-whale optimization algorithm-support vector machine[J].Journal of Food Process Engineering, 2021, 44(1):e13603.
[18] 许春瑾, 张睿, 于修烛, 等.基于近红外光谱的中宁枸杞子判别分析[J].食品科学, 2014, 35(2):164-167.
XU C J, ZHANG R, YU X Z, et al.Discrimination of Chinese wolfberry from Zhongning based on near infrared spectroscopy[J].Food Science, 2014, 35(2):164-167.
[19] 许生陆, 高媛, 胡国梁, 等.基于有效波长选择的近红外光谱枸杞总糖含量快速检测[J].食品科学, 2016, 37(12):105-109.
XU S L, GAO Y, HU G L, et al.Rapid determination of total sugar content of Goji berries (Lycium barbarum) by near infrared spectroscopy with effective wavenumber selection[J].Food Science, 2016, 37(12):105-109.
[20] 李曼祎, 沈天辰, 刘春凤, 等.不同产地枸杞品质差异研究[J].食品与发酵工业, 2021, 47(24):56-63.
LI M Y, SHEN T C, LIU C F, et al.Research on the quality of wolfberry from different production areas[J].Food and Fermentation Industries, 2021, 47(24):56-63.
[21] 季晓菲, 游明鸿, 白史且, 等.虉草粗蛋白近红外定量分析模型的建立[J].光谱学与光谱分析, 2019, 39(6):1731-1735.
LI X F, YOU M H, BAI S Q, et al.Establishment of quantitative model for analyzing crude protein in Lycium barbarum L.by near infrared spectroscopy (NIR)[J].Spectroscopy and Spectral Analysis, 2019, 39(6):1731-1735.
[22] 严衍禄. 近红外光谱分析基础与应用[M].北京:中国轻工业出版社, 2005:31.
YAN Y L.Fundamentals and Applications of Near-Infrared Spectroscopy[M].Beijing:China Light Industry Press, 2005:31.
[23] 吴喆, 张霁, 金航, 等.红外光谱结合化学计量学对不同采收期滇重楼的定性定量分析[J].光谱学与光谱分析, 2017, 37(6):1754-1758.
WU Z, ZHANG J, JIN H, et al.Qualitative and quantitative analysis of Paris polyphylla var.yuannanensisin different harvest times with infrared spectroscopy combined with chemometrics[J].Spectroscopy and Spectral Analysis, 2017, 37(6):1754-1758.
[24] YAN H, LI P H, ZHOU G S, et al.Rapid and practical qualitative and quantitative evaluation of non-fumigated ginger and sulfur-fumigated ginger via Fourier-transform infrared spectroscopy and chemometric methods[J].Food Chemistry, 2021, 341(1):128241.
[25] 丁世飞, 齐丙娟, 谭红艳.支持向量机理论与算法研究综述[J].电子科技大学学报, 2011, 40(1):1-10.
DING S F, QI B J, TAN H Y.An overview on theory and algorithm of support vector machines[J].Journal of University of Electronic Science and Technology of China, 2011, 40(1):1-10.
[26] SAMPAIO P S, CASTANHO A, ALMEIDA A S, et al.Identification of rice flour types with near-infrared spectroscopy associated with PLS-DA and SVM methods[J].European Food Research and Technology, 2020, 246(3):527-537.
[27] LI Y, ZHANG J Y, WANG Y Z.FT-MIR and NIR spectral data fusion:A synergetic strategy for the geographical traceability of Panax notoginseng[J].Analytical and Bioanalytical Chemistry, 2018, 410(1):91-103.
[28] Yao S, LI T, LI J Q, et al.Geographic identification of Boletus mushrooms by data fusion of FT-IR and UV spectroscopies combined with multivariate statistical analysis[J].Spectrochimica Acta Part A:Molecular and Biomolecular Spectroscopy, 2018, 198:257-263.
[29] 耿姝. 适宜中药材体系的近红外分析方法影响因素研究[D].杭州:浙江大学, 2016.
GENG S.Studies on influential factors of near-infrared spectroscopy for Chinese medicinal materials system[D].Hangzhou:Zhejiang University, 2016.
[30] CHEN W, FENG Y Z, JIA G F, et al.Application of artificial fish swarm algorithm for synchronous selection of wavelengths and spectral pretreatment methods in spectrometric analysis of beef adulteration[J].Food Analytical Methods, 2018, 11(8):2229-2236.
[31] AN C Q, YAN X, LU C, et al.Effect of spectral pretreatment on qualitative identification of adulterated bovine colostrum by near-infrared spectroscopy[J].Infrared Physics &Technology, 2021, 118:103869.