蓝莓属于杜鹃花科、越橘属植物。果实鲜嫩香甜,富含花青素和膳食纤维等营养成分,被称为“浆果之王”。但蓝莓鲜果含大量水分,不易保存。因此,蓝莓贮藏品质的快速分级对其之后的销售以及在制品的制备都有一定的参考价值。
近红外光谱技术在果蔬检测方面已取得了广泛应用[1-2],遍及成分检测、采摘期鉴别、分级分类等。余克强等[3]通过近红外分析技术对贮藏时期的猕猴桃果肉的色泽变化建立了检测模型,其中对果肉色泽建立的CARS-PLSR模型,测试集的相关系数(Rp)和均方根误差(root mean squared error,RMSEP)分别为0.885 0和1.642 4。李剑等[4]基于近红外建立的偏最小二乘(partial least squares,PLS)模型实现了水蜜桃采摘期的鉴别,测试集的正确鉴别率达到了93.75%。赵海东[5]通过近红外建立的支持向量机(support vector machine,SVM)模型实现了烤烟叶的分级分类,分类准确率达到了88.75%。
由于蓝莓中固有组分特征信息相互重叠、覆盖等因素,传统的一维光谱无法有效地提取特征信息。二维相关光谱提供了研究体系中不同组分官能团吸收峰之间的相关信息,可对弱峰、覆盖峰、偏移峰进行有效解析,具有较高的光谱分辨率[6-7]。白宗秀等[8]实现了羊肉中狐狸肉掺假的定量检测,利用二维相关光谱提取出14个特征波长作为输入建立的支持向量回归(support vector regression,SVR)模型,得到测试集的决定系数(Rp2)和RMSEP分别为0.928和0.03。班晶晶等[9]实现了鸡肉中残留恩诺沙星的检测,利用二维相关光谱提取出5个特征波长作为输入建立的偏最小二乘回归(partial least squares regression,PLSR)模型,得到测试集的Rp为0.997 2。王文秀等[10]实现了猪肉新鲜度的评价,利用二维相关光谱提取出17个特征波长作为输入建立的SVM模型,3个新鲜度的识别准确率分别为94.83%、98.28%和98.28%。因此,二维相关光谱分析具有光谱数据降维,进一步完成定性或定量预测的潜质。
本文以蓝莓鲜果为研究对象,参考了曾明飞等[11]前期的研究,综合考虑了蓝莓的外观品质以及营养成分等理化指标来衡量蓝莓的综合贮藏品质,其理化指标包括硬度、质量损失率、维生素C含量、可溶性固形物含量,经线性正交变换计算综合得分,以此为依据对蓝莓进行贮藏品质的分级。基于最优的光谱预处理方法,以综合得分作为扰动进行二维相关光谱分析,优选特征波长,建立综合评价蓝莓贮藏品质模型,以期为蓝莓鲜果的销售及在制品的制备提供理论支持。
选用绿宝石品种的蓝莓,2022年5月采摘于辽宁省,筛选外观良好新鲜蓝莓,当天采用冷藏车运回实验室,贮藏到温度设为2 ℃的恒温箱内。
LabSpec 5000光谱仪,美国ASD公司;LYT-330型手持式折光仪,上海淋誉公司;UV-1801 型紫外分光光度计,北京北分瑞利公司;PX-70BⅢ型生化培养恒温箱,天津泰斯特公司。
挑选表面无损伤、大小均匀的蓝莓分为300组,每组5个,装于水果专用的涤纶树脂(polyethylene terephthalate,PET)包装盒内,贮藏于2 ℃的恒温箱内。从开始贮藏当天算起,每天取出30组样本,对每组样本进行近红外光谱的采集以及理化指标的测定。
1.4.1 光谱数据采集
光谱数据采用ASD公司LabSpec 5000型光谱仪采集,二分光纤及其探头以及配套软件IndicoProVersion 3.1作为附件。开启机器电源预热30 min进行空白测定,将探头对准标准白板进行空白校准,采集350~2 500 nm的可见/近红外光谱作为空白背景。然后进行样本测定,将探头对准果腹处采集光谱,每隔120°扫描1次。每个单果样本的光谱图取3次扫描的平均结果,以每组样本中5个单果的平均光谱作为该组样本的最终光谱,每组采集前都要进行空白校准。
1.4.2 光谱预处理
为消除噪音、光源散射和基线漂移等外部环境因素的影响,本研究对光谱数据采用Savitzky-Golay卷积平滑(Savitzky-Golay convolutional smoothing,SG)、标准正态变换(standard normal transform,SNV)、多元散射矫正(multiple scattering correction,MSC)和迭代自适应加权惩罚最小二乘法(iterative adaptive weighted penalized least squares,airPLS)进行单一和组合预处理。
1.5.1 质量损失率测定
采用电子天平测定。在样本运回当天测量其初始质量m0,在每组样本进行近红外扫描前测量其质量m,单位为g,按照公式(1)计算质量损失率:
质量损失率
(1)
1.5.2 硬度测定
使用便捷式手持硬度计测定。硬度计探头对准蓝莓果实中心,缓慢施加压力,将探头插入果实,深入至标线,然后读取读数。取每组5个蓝莓的硬度均值作为该组样本的测量硬度值。
1.5.3 可溶性固形物测定
使用手持式折光仪测定。用研钵将一组5个果实捣碎均匀,纱布滤出几滴浆液,在折光仪的棱镜玻璃面上滴2滴蓝莓浆液,读取刻度。重复以上操作3次,取3次测量的均值为该组样本的可溶性固形物含量。
1.5.4 维生素C含量测定
使用紫外分光光度计测定[12]。取2 mL左右上述蓝莓浆液加入2 mL的1%(体积分数)盐酸,摇匀,加入蒸馏水至25 mL。取2 mL提取液,加入0.2 mL的10%(体积分数)盐酸后用蒸馏水稀释到10 mL后摇匀。用蒸馏水作为空白,在243 nm处测定其消光值,查标准曲线(C=15.12A+0.122 2, R2 =0.983 3,由抗坏血酸溶液测得)计算得到该组样本维生素C含量。
本研究将硬度、质量损失率、维生素C含量、可溶性固形物含量4个理化指标进行线性正交变换转化为4个参数,根据各个参数的特征值以及方差贡献率选取最终参数,最终获得贮藏品质的综合得分,计算如如式(2)、公式(3)所示:
Fk=uk′x=uk1x1+uk2x2+uk3x3+uk4x4,k=1,2,3,4
(2)
Y=F1V1+F2V2+F3V3+F4V4
(3)
式中:F1,F2,F3,F4为转化后参数;uk1,uk2,uk3,uk4为特征向量;x1,x2,x3,x4为4个理化指标值;Y为样本综合得分;V1,V2,V3,V4为参数方差贡献率。
二维相关光谱可辨别出一维光谱中被覆盖的一些小峰、偏移峰等。同步二维相关谱图关于对角线对称,显示了两动态信号间的协同作用,位于对角线上的峰为自相关峰,大小表示相关周期中光谱强度动态涨落的总程度;位于对角线外的峰为同步交叉峰,表示不同波长数光谱信号的同步变化情况,受到外部扰动时两光谱强度同时增大或减小,则为正相关峰,若两光谱强度变化方向相反,则为负相关峰[13];异步二维相关谱图关于对角线反对称,显示了2个动态信号的强度变化顺序[14]。
本研究使用四川大学周涛教授开发研制的软件Two-dimensional correlation spectroscopy software进行二维相关光谱分析[15-16],分析了蓝莓贮藏品质的综合得分对蓝莓近红外光谱图的影响,以此来选择特征波长进行后续的建模分析。
支持向量机是建立在统计学习理论、VC维理论和结构风险最小化原理基础上的机器学习方法。它在解决小样本、非线性和高维模式识别问题中表现出许多特有的优势,并在很大程度上克服了“维数灾难”和“过学习”等问题。此外,它具有坚实的理论基础,简单明了的数学模型,在模式分类、回归分析等领域得到了长足的发展[17]。因此本研究使用SVM对蓝莓贮藏品质进行分类预测。
将蓝莓的各个理化数据标准化后,经线性正交变换计算出所提取的参数得分,以各个参数的方差贡献率为权重,计算出不同贮藏时间段下蓝莓的综合得分,结果如表1所示。参数1的特征值为3.161 6,方差贡献率为79.04%,参数2的特征值为0.440 8,方差贡献率为11.02%,参数3的特征值为0.330 9,方差贡献率为8.27%。前3个参数包括了全部98.33%的信息,可以作为评价蓝莓贮藏品质的综合指标。计算出300个样本的综合得分分布情况如图1所示。参考NY/T 3033—2016《农产品等级规格 蓝莓》的规定,将综合得分为65~100划分为一级,35~65为二级,0~35为三级。300个样本中一级品有81个,二级品有129个,三级品有90个。
表1 参数特征值、方差贡献率及累计方差贡献率
Table 1 Eigenvalue, variance contribution rate, and cumulative variance contribution rate of parameter
参数特征值方差贡献率/%累计方差贡献率/%13.161 679.0479.0420.440 811.0290.0630.330 98.2798.3340.066 71.67100
图1 综合得分分布图
Fig.1 Comprehensive score distribution
依据Kennard-Stone方法[18],将每个类别样本按照3∶1划分训练集和测试集,样本划分结果见表2。
表2 样本集划分
Table 2 Sample set partition
类别训练集测试集总计一级612081二级9732129三级682290总计22674300
2.3.1 光谱波段选择
本研究采用LabSpec 5000光谱仪获得的光谱数据为350~2 500 nm,观察原始光谱,发现光谱在350~500 nm、2 300~2 500 nm的噪声较大,信噪比较低,因此选取500~2 300 nm光谱波段进行后续分析。所选取的光谱图见图2。
图2 光谱图
Fig.2 Spectrogram
2.3.2 最优预处理选择
为了选择最优的预处理方法以便后续的建模分析,本研究基于不同的预处理方法,以500~2 300 nm光谱波段作为输入变量建立蓝莓贮藏品质分级的SVM预测模型,结果见表3。结果表明,光谱经SG预处理后建立的模型预测精度达到了94.59%,优于原始光谱和其他预处理方法,所以选择SG预处理之后的光谱数据进行后续建模分析。
表3 基于不同预处理方法的SVM建模结果
Table 3 SVM modeling results based on different preprocessing methods
预处理方法一级二级三级总识别准确率原始光谱90%96.88%72.72%87.84%SG95%93.75%95.45%94.59%SNV75%90.63%54.54%75.68%MSC80%90.63%59.09%78.38%airPLS85%75%81.82%79.73%SG+SNV80%87.5%45.45%72.97%SG+MSC80%87.5%45.46%74.32%SG+airPLS80%84.38%90.91%85.14%SG+SNV+airPLS80%84.38%68.18%78.38%SG+MSC+airPLS80%84.38%68.18%78.38%
本研究以蓝莓贮藏品质的综合得分作为外部扰动进行二维相关光谱分析。考虑到样本综合得分分值的最大间隔为9分且用于二维相关光谱分析的样本数不宜过少,这里间隔量选择10分间隔11个梯度和20分间隔6个梯度分别进行分析,当出现相同得分的情况,求相同得分样本的平均光谱作为代表该得分的样本。使用软件Two-dimensional correlation spectroscopy software进行二维相关光谱分析,设定精细级别为30,除去1%的噪音,获得的同步光谱图和异步光谱图如图3所示。其中,红色表示2个波段在受到外部刺激后变化方向是一致的,蓝色表示变化方向相反,2个同步光谱图对角线上均出现了4个自相关峰,所对应的位置分别在807、1 013、1 220、1 636 nm,805、1 026、1 215、1 637 nm,用2个间隔量进行分析得到4个自相关峰的位置基本一致,但10分间隔所进行二维相关光谱分析得到的同步光谱图中自相关峰强度更高,所以后续分析选择10分作为扰动的间隔量。
以10分作为扰动间隔量进行相关分析得到的同步光谱图中,对角线外的交叉峰强度全为正,805 nm和1 026 nm、805 nm和1 215 nm、805 nm和1 637 nm、1 026 nm和1 215 nm、1 026 nm和1 637 nm、1 215 nm和1 637 nm对外部扰动因素有很强的协同作用,作用方向相同,表明4个自相关峰在受到外扰的情况下变化方向是一致的。异步光谱图中主要有6处正交叉峰和负交叉峰,结合同步光谱图中交叉峰的正负可知,在受到外扰的条件下光谱强度发生变化的先后次序为805 nm→1 026 nm→1 215 nm→1 637 nm。综上分析,4个自相关峰805、1 026、1 215、1 637 nm的光谱强度受蓝莓综合贮藏品质扰动很容易发生变化,是与综合贮藏品质相关的敏感变量,故后续建模以这4个波长作为输入变量。
a-10分间隔同步光谱图;b-10分间隔异步光谱图;c-20分间隔同步光谱图;d-20分间隔异步光谱图
图3 二维相关光谱图
Fig.3 Two-dimensional correlation spectrogram
本研究采用SVM模型的核函数为径向基函数,核参数g和惩罚因子c通过交叉验证寻优后,g取21.112 1,c取5.278 0。用二维相关光谱图提取出的4个波长作为输入变量,建立支持向量机模型,结果见表4所示,一级品和三级品的识别准确率均达到了100%,二级品的预测结果达到了93.75%。结果表明用二维相关光谱作为特征提取的方法优于用全光谱波长的预测模型,预测准确率得到了提升,可见通过二维相关光谱分析提取特征波长来建立蓝莓贮藏品质综合评价的预测模型,可以有效的对蓝莓的贮藏品质进行快速评判,为蓝莓的无损检测提供了新的思路。
表4 SVM建模结果
Table 4 SVM modeling results
蓝莓级别测试集个数正确识别个数识别准确率/%一级2020100二级323093.75三级2222100总计747297.30
采用可见/近红外光谱技术得到蓝莓鲜果的光谱图,利用二维相关光谱分析选出特征波长并建立模型,实现了蓝莓综合贮藏品质的精准预测。在光谱数据的9种预处理方法中,经SG卷积平滑预处理后所建立的SVM模型效果最优,预测准确率达到94.59%。随着贮藏时间的延长,蓝莓的外观品质以及营养成分含量发生变化,以通过理化指标计算出的综合得分作为外界扰动,利用二维相关光谱分析,优选出4个特征波长,以此作为输入建立蓝莓贮藏综合品质的SVM模型,一级和三级的预测准确率达到了100%,二级的准确率也达到了93.75%,由此说明,二维相关光谱分析提取出的特征波长处光谱强度与蓝莓贮藏品质变化有一定的联系。因此,基于可见/近红外光谱技术进行二维相关光谱分析实现了蓝莓贮藏品质综合评价模型的特征波长选择,降低了模型的复杂度,更高效的实现蓝莓综合贮藏品质的预测。本研究可为蓝莓鲜果的销售以及在制品的制备提供理论指导,也可为设计基于分立波长元件的蓝莓品质检测仪提供依据。
[1] 窦文卿, 柴春祥, 鲁晓翔.无损检测技术在水果品质评价中应用的研究进展[J].食品工业科技, 2020, 41(24):354-359.
DOU W Q, CHAI C X, LU X X.Research progress of non-destructive detection technique in fruit quality evaluation[J].Science and Technology of Food Industry, 2020, 41(24):354-359.
[2] LI J T, LI Q F, LI D F, et al.Use of near-infrared reflectance spectroscopy for the rapid determination of the digestible energy and metabolizable energy content of corn fed to growing pigs[J].Journal of Animal Science and Biotechnology, 2016, 7(1):45.
[3] 余克强, 孟浩, 曹晓峰, 等.近红外光谱对贮藏期猕猴桃不同深度果肉色泽的变化研究[J].光谱学与光谱分析, 2020, 40(7):2 240-2 245.
YU K Q, MENG H, CAO X F, et al.Near-infrared spectroscopy for analyzing changes of pulp color of kiwifruit in different depths[J].Spectroscopy and Spectral Analysis, 2020, 40(7):2 240-2 245.
[4] 李剑, 李臻峰, 宋飞虎, 等.基于近红外光谱的水蜜桃采摘期的鉴别方法[J].传感器与微系统, 2017, 36(10):48-50;56.
LI J, LI Z F, SONG F H, et al.Identification method of picking period of juicy peaches based on near infrared spectroscopy[J].Transducer and Microsystem Technologies, 2017, 36(10):48-50;56.
[5] 赵海东. 烤烟叶分级中有效光谱特征筛选及其分类算法研究[D].郑州:郑州大学, 2014.
ZHAO H D.Screening of effective spectral features and its classification algorithm in flue-cured tobacco leaf classification[D].Zhengzhou:Zhengzhou University, 2014.
[6] 杨仁杰, 杨延荣, 刘海学, 等.二维相关谱在食品品质检测中的研究进展[J].光谱学与光谱分析, 2015, 35(8):2 124-2 129.
YANG R J, YANG Y R, LIU H X, et al.Progress in application of two-dimensional correlation spectroscopy for detection of food quality[J].Spectroscopy and Spectral Analysis, 2015, 35(8):2 124-2 129.
[7] 陆珺, 相秉仁, 刘浩.二维相关近红外光谱及其应用[J].药学进展, 2007, 31(7):303-308.
LU J, XIANG B R, LIU H. Two-dimensional near-infrared correlation spectroscopy: Theory and application[J].Progress in Pharmaceutical Sciences, 2007, 31(7):303-308.
[8] 白宗秀, 朱荣光, 王世昌, 等.高光谱图像结合特征变量筛选定量检测羊肉中狐狸肉掺假[J].农业工程学报, 2021, 37(17):276-284.
BAI Z X, ZHU R G, WANG S C, et al.Quantitative detection of fox meat adulteration in mutton by hyper spectral imaging combined with characteristic variables screening[J].Transactions of the Chinese Society of Agricultural Engineering, 2021, 37(17):276-284.
[9] 班晶晶, 刘贵珊, 何建国, 等.基于表面增强拉曼光谱与二维相关光谱法检测鸡肉中恩诺沙星残留[J].食品与机械, 2020, 36(7):55-58.
BAN J J, LIU G S, HE J G, et al.Detection of Enrofloxacin residues in chicken based on surface enhanced Raman spectroscopy and two-dimensional correlation spectroscopy[J].Food and Machinery, 2020, 36(7):55-58.
[10] 王文秀, 彭彦昆, 孙宏伟, 等.基于光谱技术的原料肉新鲜度指标在线检测系统开发及试验[J].光谱学与光谱分析, 2019, 39(4):1 169-1 176.
WANG W X, PENG Y K, SUN H W, et al.Development and test of on-line detection system for meat freshness evaluation based on spectroscopy technology[J].Spectroscopy and Spectral Analysis, 2019, 39(4):1 169-1 176.
[11] 曾明飞, 朱玉杰, 冯国红, 等.基于可见/近红外光谱的蓝莓新鲜度快速评价研究[J].食品与发酵工业,2022,48(20):252-259.
ZENG M F, ZHU Y J, FENG G H, et al.Rapid evaluation of blueberry freshness based on visible/near infrared spectroscopy[J].Food and Fermentation Industries,2022,48(20):252-259.
[12] 黄绵佳, 吴岚芳.热带园艺产品采后实验原理与技术[M].北京:中国林业出版社, 2012.
HUANG M J, WU L F.Principles and Techniques of Post-harvest Experiments on Tropical Horticultural Products[M].Beijing:China Forestry Publishing House, 2012.
[13] 孙海霞, 张淑娟, 李成吉, 等.二维相关光谱的鲜核桃青皮含水率检测[J].食品科技, 2021, 46(1):275-279.
SUN H X, ZHANG S J, LI C J, et al.Detection of moisture content on green peel of fresh walnut using two-dimensional correlation spectroscopy[J].Food Science and Technology, 2021, 46(1):275-279.
[14] 樊奈昀, 刘贵珊, 张晶晶, 等.Box-Behnken法冷鲜滩羊肉蛋白质的高光谱模型优化[J].光谱学与光谱分析, 2021, 41(3):918-923.
FAN N Y, LIU G S, ZHANG J J, et al.Hyperspectral model optimization for protein of Tan Mutton based on boxbBehnken[J].Spectroscopy and Spectral Analysis, 2021, 41(3):918-923.
[15] 周涛, 张爱民.移动窗口二维相关红外光谱计算软件:中华人民共和国软件著作权,2010SR013465[P].2010-03-24.
ZHOU T, ZHANG A M.Moving window 2D correlated infrared spectral calculation software.Software Copyright of the People′s Republic of China,2010SR013465[P].2010-03-24.
[16] 周涛, 张爱民.红外相关光谱分析软件:中华人民共和国软件著作权,2010SR029174[P].2010-06-13.
ZHOU T, ZHANG A M.Infrared correlation spectral analysis software.Software Copyright of the People′s Republic of China,2010SR029174[P].2010-06-13.
[17] 丁世飞, 齐丙娟, 谭红艳.支持向量机理论与算法研究综述[J].电子科技大学学报, 2011, 40(1):2-10.
DING S F, QI B J, TAN H Y.An overview on theory and algorithm of support vector machines[J].Journal of University of Electronic Science and Technology of China, 2011, 40(1):2-10.
[18] ZHANG L N, LI G, SUN M X, et al.Kennard-Stone combined with least square support vector machine method for noncontact discriminating human blood species[J].Infrared Physics and Technology, 2017, 86:116-119.