水蜜桃为亚热带水果,营养丰富,味道鲜美,属于呼吸跃变型果实[1],采后不耐贮,易腐烂变质[2]。低温可以抑制水蜜桃的呼吸强度,延长其贮藏时间,但低温贮藏易引起水蜜桃冷害的出现[3],果肉发生褐变、木质化或絮败等现象[4]。由于冷害发生在果实内部,仅从外部不能判断其是否发生冷害[5]。传统桃果实冷害识别需将水蜜桃切开,人工观察判断是否发生冷害,操作繁琐,具有破坏性。因此,亟需对冷藏期间的水蜜桃冷害进行快速无损检测,监测其质量变化情况,减少冷害造成的损失。近红外(near infrared,NIR)光谱是一种快速无损实时的检测技术,在果蔬采后冷害定性识别方面国内外已有报道[6-9],但目前采用 NIR 光谱对桃果实低温冷害进行识别研究鲜有报道。
本文采集了水蜜桃在低温贮藏期间的NIR光谱,筛选出最佳光谱预处理方法,采用偏最小二乘判别分析(partial least squares-discriminant analysis,PLS-DA)、K-最邻近法(K-nearest neighbor,K-NN)、主成分判别分析(principal component discriminant analysis,PCA-DA)和簇类独立软模式(soft independent modeling of class analogy,SIMCA) 4种方法建立冷害褐变的分类模型,并比较不同建模方法的性能。本研究将为水蜜桃在低温贮藏期间的冷害检测及质量控制提供依据。
试验选用水蜜桃进行试验,于2019年7月15日长沙毛家桥水果市场购入,运至冷库进行处理。挑选七成熟,无机械损伤,大小一致,达到食用要求的水蜜桃作为试验样品。
1.2.1 水蜜桃低温冷藏处理
用0.05 mm厚度的打孔聚乙烯(polyethylene,PE)保鲜袋进行挽口包装,每袋10个果实,在(4±2) ℃冷库中贮藏。贮藏时间为5周,每隔7 d取样,共计取样189个。然后在20 ℃,湿度90%左右条件下放置3 d后,进行光谱采集及指标测定。
1.2.2 水蜜桃冷害褐变指数测定
参考冯磊等[10]的桃果实冷害褐变分级方法,将水蜜桃沿缝合线纵切,并按果肉褐变程度分为 5 级,即:0级,褐变面积为0;1级,褐变面积0~25%;2级,褐变面积25%~50%;3级,褐变面积50%~75%;4级,褐变面积>75%。按照公式(1)计算褐变指数:
褐变指数
(1)
两分类模型:将无冷害褐变样品标为0,冷害褐变的样品标为1;多分类模型:将0、1、2、3和4级冷害桃果实样品分别标为1、2、3、4和5。
采用 Nicolet Antaris Ⅱ傅立叶变换近红外光谱仪,选择积分球固体采样模块采集样品的漫反射光谱,波长范围为1 000~2 500 nm,扫描次数32,分辨率4 cm-1。在果实的赤道处每隔120°进行采集,3次采集平均作为样品的NIR光谱。
研究比较了均值中心化(mean centering, MC)、多元散射校正(multiplicative scatter correction, MSC)、标准正态变化(standard normal variate, SNV)、最小二乘平滑滤波器(savitzky-golay, SG) 以及相互组合的效果, 确定最优光谱预处理方法, 采用 PLS-DA、K-NN、PCA-DA 和 SIMCA 4种方法建立水蜜桃冷害褐变的定性模型。
采用交叉验证准确率、总未分配值对水蜜桃冷害定性模型进行评价。交叉验证准确率越接近100%,表明模型识别准确性越高[11]。总未分配值越大,表明未能准确识别样品类别的个数越多,模型精确性越差[12]。
采用 TQ Analyst 9.5(Thermo Fisher)进行数据采集,利用 MATLAB2017b 软件(Mathwork Inc.)进行分析处理。
2.1.1 果肉纵切面与冷害褐变指数的变化
图1为贮藏期间果肉纵切面图。水蜜桃在4 ℃下,第1周果实纵切面的颜色开始发生变化,果实纵切面的边缘开始出现褐色,第2周纵切面的褐色果肉所占比例有所延长,边缘部分的褐色面积逐渐增大。贮藏3周时,水蜜桃纵切面的果肉开始出现絮状,果实的褐色果肉面积开始蔓延到桃核。贮藏第4周的果实纵切面显示,褐变果肉面积达50%,果肉开始出现腐烂现象。贮藏第5周,大部分果实的褐色果肉面积占比要大于75%,冷害褐变严重,丧失食用价值。随着贮藏时间延长,冷害和褐变程度加剧,桃果实冷害褐变指数逐步上升,从20.8%升到 65%。
图1 4 ℃下贮藏5周的水蜜桃果肉纵切面
Fig.1 Longitudinal section of juicy peaches store at 4 ℃ for five weeks
图2为低温贮藏期间不同冷害程度的水蜜桃原始平均NIR光谱图。由图2可看出,5种不同冷害褐变程度的桃果实样品近红外光谱的波峰波谷出现位置一致,1 200 nm和1 450 nm 附近主要为 C—H键的相关吸收峰,这与桃果实中的糖、水分、淀粉、果胶和纤维素化合物相关。1 785 nm附近主要为纤维素中的—CH2官能团伸缩振动的相关光谱吸收[13],纤维素和果胶组成果肉组织,其含量影响着桃果实果肉硬度的大小。水蜜桃果发生冷害时,果实软化,细胞壁中果胶融化,果肉质地发生变化,因此NIR光谱与桃果实的冷害现象相关[14]。不同褐变等级的光谱交叉重叠,无法直接从原始NIR光谱图中对冷害褐变情况的样品进行直接的判断识别,需采用化学计量学方法进行解析。
图2 不同冷害褐变指数的样品近红外光谱图
Fig.2 NIR spectra of the samples with different chilling browning indexes
图3为样品NIR光谱的主成分分析(principal component analysis,PCA)图,前3个主成分分析表明,5种不同冷害褐变指数的水蜜桃样品NIR光谱的第1主成分(PC1)、第2主成分(PC2)和第3主成分(PC3)的方差贡献率分别为 84.5%、13.5%和1.72%。在三维图上,不同类的水蜜桃样品聚集在一起,重叠较为严重,无明显分界线。使用无监督学习的 PCA算法较难实现对不同冷害褐变指数的样品进行精确识别,因此需要对 NIR光谱进行光谱预处理,采用有监督学习的建模方法对水蜜桃冷害进行识别。
图3 不同冷害褐变指数的样品近红外光谱主成分分析
Fig.3 PCA of NIR spectra of the samples with different chilling browning indexes
按照校正集:验证集为3∶1的比例,利用KS算法[15]将142个水蜜桃作为校正集,47个作为验证集。189个样品经KS算法分类后的统计结果如表1所示。由表1可知,水蜜桃经KS分类后,1级褐变的水蜜桃占总样品比例最高为31.22%,4级褐变所占比例最少为6.88%。校正集和预测集均包含了 0~4 级褐变等级,样本分布均匀,数据适合后续建模分析。
由于 NIR 光谱存在着基线漂移、噪音等问题,影响预测模型的准确性,因此需要对 NIR 光谱进行预处理[16]。本研究采用 MC、MSC、SNV 及相互组合方法对全光谱进行预处理。表2 为不同预处理后的 PLS-DA 模型结果。
表1 样本集的褐变等级划分数据统计
Table 1 Data statistics of browning grade division of sample set
0级褐变1级褐变2级褐变3级褐变4级褐变校正集2846332312验证集19131131总计4759442613百分比24.87%31.22%23.28%13.76%6.88%
表2 不同预处理优化的PLS-DA模型结果
Table 2 PLS-DA model resultsoptimized by different pretreatments
分类模式预处理方法校正集准确率验证集准确率总准确率总未分配值原始光谱0.620.570.600.53MC0.630.520.580.50MSC0.480.580.530.33SNV0.470.540.510.32SG63.0071.0067.000.27多分类模型SG+MSC0.700.710.710.27SG+SNV0.670.710.690.27SNV+MC0.430.550.490.26MSC+MC0.480.580.530.33SG+MC0.630.690.660.20原始光谱0.890.800.850.02MC0.910.830.870.00MSC0.800.810.810.00SNV0.850.890.870.00两分类模型SG0.940.910.930.00SG+MSC0.940.910.930.01SG+SNV0.950.910.930.00SNV+MC0.850.890.870.00MSC+MC0.840.890.870.00SG+MC0.960.870.920.00
由表2可知,多分类模式中,利用SG+MSC算法处理后建立的 PLS-DA模型效果最好,校正集准确率0.70,验证集准确率0.71,总准确率为0.71,总未分配值为0.27,模型准确率较好,未能识别样品褐变等级的个数相对较多。两分类模式经SG+SNV算法预处理后的效果最佳,模型校正集准确率、验证集准确率、总准确率、总未分配值分别为 0.95、0.91、0.93和0,模型预测准确度好,识别精度高。两分类模型效果优于多分类模型,表明无冷害褐变与冷害褐变的样品之间存在较大的光谱差异。这与XIA等[7]利用 NIR 对苹果 4 种不同冷害等级的分类效果一致,其研究结果显示,两分类模型比多分类模型准确性高。这可能因为多分类模式下,冷害褐变等级之间较为相近,易被错误划分,而二分类模型的等级之间差别较为明显,具有较少的分类特征向量,更适合于选择最优信息点,计算函数并进行分类时误差降低,从而提高分类准确度[17-18]。因此 NIR光谱中含有与水蜜桃内部冷害褐变有关的信息,可以对水蜜桃内部有无冷害褐变进行分类,但进行更加精准分级时准确度略低。
2.5.1 PLS-DA 模型的建立
根据筛选出的最佳SG+MSC、SG+SNV算法分别对NIR全光谱进行预处理,分别按照多分类模式、两分类模式建立PLS-DA模型。同时采用十折法进行交叉验证,对水蜜桃冷害褐变等级进行分类[19]。根据准确率和未分配样本值选择最佳潜变量数[12],分别确定了多分类最佳潜变量数为16,两分类最佳潜变量数为7,两分类和多分类的PLS-DA模型校正集和验证集的总正确率分别为0.71和0.93。
2.5.2 K-NN模型的建立
K-NN算法为有监督模式识别法,属于非参数分类方法[20]。其中K-NN模型的K值选择极为重要,影响着定性结果[19]。利用K-NN算法并基于多分类和两分类模式建立定性模型,同时进行交叉验证。根据交叉验证后错误率的大小来选择合适的K值。2种分类模式的定性模型的K值选择如图4所示,分别确定了2种分类模式的定性模型最佳K值为2和8,交叉验证最低错误率分别为0.52和0.14多分类模式下K-NN模型的总准确率为0.55,两分类模式下,K-NN模型的总准确率为0.91。
a-多分类;b-两分类
图4 多分类和两分类K-NN模型的 K值选择
Fig.4 K-value selection of multi-classification and two-classification K-NN model
2.5.3 PCA-DA模型的建立
PCA-DA是基于主成分分析的一种判别方法,可适用于近红外光谱重叠较严重的样本集[21-22]。PCA-DA模型建立时需先对水蜜桃冷害褐变等级进行主成分分析,再建立相关分类模型。分别建立多分类和两分类模式下冷害褐变等级的PCA-DA定性模型,并进行交叉验证。根据交叉验证后的错误率作为指标,确定了多分类和两分类主成分数为18和16时,交叉验证错误率最低为0.46和0.05。多分类模式下PCA-DA模型的校正集的正确划分样品值为80,识别率为56.33%,两分类的PCA-DA模型校正集准确划分样品个数为135,识别率为95.07%。
2.5.4 SIMCA模型的建立
SIMCA算法是以主成分分析为基础的一种判别方法[23],对水蜜桃的每一个褐变等级进行主成分回归之后进行预测,分别选择每个分类等级的最佳主成分值,建立SIMCA模型。灵敏度和特异性曲线交叉时,模型的假阳性与假阴性出现率最低[24]。因此交叉验证错误率低,同时灵敏度、特异度交叉或较接近时对应的主成分值建立模型效果最好。多分类中每个褐变等级的最佳主成分数分别是3、4、2、3和3,此时模型的总准确率和总未分配率分别为0.76和0.62。两分类模型的主成分值为5和6时SIMCA模型效果最好,此时模型的总准确率未分配率为0.94和0.28。
利用上述建立好的模型,对水蜜桃褐变等级进行分类,比较了 PLS-DA、K-NN、PCA-DA和SIMCA 4种算法对水蜜桃冷害褐变等级的分类效果。表3为在多分类和两分类模式下4种建模方法的效果。
表3 四种方法建模结果比较
Table 3 Comparison of modeling results of four methods
分类方法建模方法校正集准确率验证集准确率总准确率总未分配率PLS-DA0.700.710.710.27多分类K-NN PCA-DA0.480.560.620.660.550.610.000.00SIMCA0.760.750.760.62PLS-DA0.950.910.930.00两分类K-NN PCA-DA0.920.950.890.890.910.920.000.00SIMCA0.970.910.940.28
由表3可知,多分类的分类模式中,SIMCA的总准确率为0.76,未分配值0.62,SIMCA模型精确性较差,不适用于本研究中的样品定性分析。PLS-DA模型校正集准确率、验证集准确率以及总准确率分别为0.70、0.71和0.71,准确率较好,模型的分类精确性优于SIMCA。PCA-DA和K-NN的未分配值为0,总准确性分别为0.61和0.55,水蜜桃冷害等级虽被定性,但正确分类的效果较差。因此多分类模式下最优模型为PLS-DA定性模型。
两分类模式中,4种算法的总准确率均大于0.9,其中SIMCA模型的总准确率和未识别率均最高为0.94和0.28,模型准确性好,但精度较差。PLS-DA模型的总准确率为0.93,未识别率为0,分类精度好。K-NN和PCA-DA模型总准确率分别为0.91、0.92,准确率低于PLS-DA模型,因此PLS-DA算法的分类效果最好。
K-NN算法的准确率较低,可能与其为基于实例的无参数方法有关[19],K-NN算法适用于数量少且典型性较好的样本,而水蜜桃的褐变等级之间差异较小,NIR光谱的典型性不足,因此使用K-NN方法时,不能精确识别样本,预测的准确度相应较低。SIMCA算法准确度好,但未分配率较高,这可能与SIMCA需对每一类样本进行主成分分析,而水蜜桃褐变等级之间的品质差别不明显,不容易被SIMCA算法精确识别,因此模型的准确度虽较高,但精度较差[25]。PCA-DA模型结果比PLS-DA差,可能因为PCA-DA模型是基于主成分分析的一种有监督分类方法,而PLS-DA算法是基于PLS的分类方法,预测时PLS-DA算法同时结合了光谱与水蜜桃褐变等级的信息,能够充分对每个样本之间的代表性与典型性进行预测,因此PLS-DA算法预测效果与精度较好。
图5为多分类和两分类模式下的最佳定性模型的样本分类图,图中圆圈代表校正集,五角星代表验证集,纵坐标为模型的PLS-DA的计算响应得分,横坐标表示水蜜桃的样本标签。由图5-a PLS-DA的样本分类图可以看出,0级褐变能够明显区分,但1~4褐变等级没有明显的分界,冷害褐变1~4级区分不显著;由图5-b可以看出,无论是校正集还是验证集,PLS-DA模型均能将无褐变样本与褐变样本很好地区分,表明PLS-DA模型可以用于水蜜桃低温贮藏期间,对果实内部有无冷害褐变进行准确识别。
a-多分类;b-两分类
图5 多分类和两分类的PLS-DA算法样本分类图
Fig.5 PLS-DA algorithm for multi-classification and two-classification sample classification graph
(1)分析了水蜜桃低温贮藏下的冷害症状,将冷害褐变分为 0~4 级,利用近红外光谱技术对不同冷害褐变等级的水蜜桃进行预测分类。
(2)比较了PLS-DA、K-NN、PCA-DA和SIMCA 4种建模方法的模分类效果。多分类模式和两分类模式下,PLS-DA 方法效果均为最好,总准确率分别为 0.71 和 0.93。
(3)多分类模式下的分类准确率低于两分类,可能与多分类模式下类别之间的光谱差异较小有关。
本试验结果为水蜜桃在低温贮藏期间的冷害褐变快速识别提供依据。
[1] 李培中, 许丽, 何惠霞,等.1株水蜜桃采后病害拮抗细菌的鉴定及抑菌作用[J].食品科学, 2019,40(2):102-109.
LI P Z, XU L, HE H X, et al.Identification and antifungal activity of an antagonistic strain against postharvest disease in honey peach[J].Food Science, 2019,40(2):102-109.
[2] LIU H, CAO J K, JIANG W B.Changes in phenolics and antioxidant property of peach fruit during ripening and responses to 1-methylcyclopropene[J].Postharvest Biology and Technology, 2015, 108:111-118.
[3] LI H, FAN Y W, ZHI H, et al.Influence of fruit stalk on reactive oxygen species metabolism and quality maintenance of peach fruit under chilling injury condition[J].Postharvest Biology and Technology, 2019, 148:141-150.
[4] BRUMMELL D A, CIN V D, LURIE S, et al.Cell wall metabolism during the development of chilling injury in cold-stored peach fruit:Association of mealiness with arrested disassembly of cell wall pectins[J].Journal of Experimental Botany, 2004, 55(405):2 041-2 052.
[5] PAN L Q, QIANG Z, WEI Z, et al.Detection of cold injury in peaches by hyperspectral reflectance imaging and artificial neural network[J].Food Chemistry, 2016, 192:134-141.
[6] 翟小童. 猕猴桃冷害近红外无损定性检测研究[J].中国食品工业,2012(11):71-74.
ZHAI X T.Study on near infrared nondestructive qualitative detection of chilling injury of kiwifruit[J].China Food Industry, 2012(11):71-74.
[7] XIA J, YANG Y W, CAO H X, et al.Visible-near infrared spectrum-based classification of apple chilling injury on cloud computing platform[J].Computers and Electronics in Agriculture, 2018, 145:27-34.
[8] 耿红兰. 壳聚糖和变温处理对砂糖橘冷害的控制及其近红外光谱检测[D].晋中:山西农业大学,2015:39-44.
GENG H L.Controlling injury of shatangju with chitosan coating and change temperature treatment and nondestuctive examination with near infrared spectroscopy[D].Jinzhong:Shanxi Agricultural University, 2015:39-44.
[9] HUANG Y P, LU R F, CHEN K J.Detection of internal defect of apples by a multichannel Vis/NIR spectroscopic system[J].Postharvest Biology and Technology, 2020, 161:111 065.
[10] 冯磊, 郑永华, 汪峰, 等.茉莉酸甲酯处理对冷藏水蜜桃品质的影响[J].食品科学, 2003,24(9):135-139.
FENG L, ZHENG Y H, WANG F, et al.Effects study on MeJA treatment for cold storage of peache[J].Food Science, 2003,24(9):135-139.
[11] 王巧华, 李小明, 段宇飞.基于CUVE-PLS-DA的鸡蛋新鲜度在线检测分级[J].食品科学, 2016,37(22):187-191.
WANG Q H, LI X M, DUAN Y F, et al.On-line detection and classification of egg freshness based on consensus uninformative variable elimination-partial least squares-discriminant analysis (CUVE-PLS-DA)[J].Food Science, 2016,37(22):187-191.
[12] 郭珍珠. 基于光谱技术的茶叶等级判别研究[D].温州:温州大学, 2019:18-21.
GUO Z Z.Tea grade discrimination research based on spectral technology[D].Wenzhou:Wenzhou University, 2019:18-21.
[13] JWORKMAN J,WEYER J L.近红外光谱解析实用指南[M].北京:化学工业出版社, 2009.
JWORKMAN J,WEYER J L.Practical Guide to Interpretive Near Infrared Spectroscopy[M].Beijing:Chemical Industry Publishing House,2009.
[14] 周慧娟, 苏明申, 叶正文, 等.桃果实采后生理生化及冷害研究进展[J].果树学报, 2017(9):1 204-1 212.
ZHOU H J, SU M S, YE Z W, et al.Advances in the research into physiological and biochemical characteristics and chilling injury of peach fruits after harvest[J].Journal of Fruit Science, 2017(9):1 204-1 212.
[15] KENNARD R W, STONE L A.Computer aided design of experiments[J].Technometrics, 2012, 11(1):137-148.
[16] XIA J, YANG Y W, CAO H X, et al.Visible-near infrared spectrum-based classification of apple chilling injury on cloud computing platform[J].Computers and Electronics in Agriculture, 2018, 145:27 -34.
[17] YE S, GU X Z, KE S, et al.Hyperspectral reflectance imaging combined with chemometrics and successive projections algorithm for chilling injury classification in peaches[J].LWT, 2017, 75:557-564.
[18] 董高, 郭建, 王成, 等.基于近红外高光谱成像及信息融合的小麦品种分类研究[J].光谱学与光谱分析, 2015(12):3 369-3 374.
DONG G, GUO J, WANG C, et al.The classification of wheat varieties based on near infrared hyperspectral imaging and information fusion[J].Spectroscopy and Spectral Analysis, 2015(12):3 369-3 374.
[19] 朱向荣, 李高阳, 秦燕华, 等.近红外光谱结合模式识别技术快速鉴别煎炸油质量[J].中国食品学报, 2016(12):206-211.
ZHU X R, LI G Y, QIN Y H, et al.Rapid detection for the quality of frying oil using near infrared spectroscopy and pattern discrimination techniques[J].Journal of Chinese Institute of Food Science and Technology, 2016(12):206-211.
[20] 湛燕. K-近邻、K-均值及其在文本分类中的应用[D].保定:河北大学, 2003:8-13.
ZHAN Y.K-NN, K-means and the application in text mining[D].Baoding:Hebei University, 2003:8-13.
[21] 戚淑叶, 单婕, WONG T, 等.西洋参原材料近红外光谱精选研究[J].仪器仪表学报, 2012(6):1 435-1 440.
QI S Y, SHAN J, WONG T, et al.Research on sifting of American ginseng as raw material with near infrared spectroscopy[J].Chinese Journal of Scientific Instrument, 2012(6):1 435-1 440.
[22] 朱向荣, 李高阳, 黄绿红, 等.近红外光谱与化学计量学方法用于镉污染稻米的定性鉴别[J].分析化学, 2015(4):599-603.
ZHU X R, LI G Y, HUANG L H, et al.Near infrared spectroscopy combining with chemometrics for qualitative identification of cadmium-polluted rice[J].Chinese Journal of Analytical Chemistry, 2015(4):599-603.
[23] 卢万鸿, 齐杰, 罗建中.近红外光谱桉树杂交种鉴别[J].光谱学与光谱分析, 2019(5):1 451-1 457.
LU W H, QI J, LUO J Z.Application of NIRs for discrimination of eucalyptus hybrids[J].Spectroscopy and Spectral Analysis, 2019(5):1 451-11 457.
[24] 朱向荣, 李高阳, 江靖, 等.基于多类别的镉稻米近红外光谱识别分析[J].中国食品学报, 2019(5):263-269.
ZHU X R, LI G Y, JIANG J,et al.Rapid discrimination for cadmium-polluted rice based on near infrared spectroscopy and multi-classification algorithm[J].Journal of Chinese Institute of Food Science and Technology, 2019(5):263-269.
[25] 张小燕, 杨炳南, 曹有福, 等.近红外光谱的马铃薯环腐病SIMCA模式识别[J].光谱学与光谱分析, 2018(8):2 379-2 385.
ZHANG X Y, YANNG B N, CAO Y F, et al.SIMCA discrimination of ring rot potatoes based on near infrared spectroscopy[J].Spectroscopy and Spectral Analysis, 2018(8):2 379-2 385.