高光谱技术结合变量选择方法的甘薯冻害检测研究

许建东1,张淑娟1*,郑小南2,薛建新1,孙海霞1

1(山西农业大学 农业工程学院,山西 晋中,030801)2(山西农业大学 软件学院,山西 晋中,030801)

为建立一种快速无损鉴别甘薯冻害的检测方法,利用高光谱技术采集900~1 700 nm完好和冻害两类甘薯的高光谱信息并提取样本完好和冻害区域光谱,获得完好和冻害区域光谱343和476个。采用Kennard-Stone算法挑选训练集和预测集中完好和冻害样本。采用4种预处理方法对原始光谱预处理,选出一阶导数(first derivative, FD)为最佳的预处理方法。通过竞争性自适应重加权算法(competitive adaptive reweighted sampling,CARS)、迭代保留信息变量算法(iteratively retains informative variables,IRIV)以及结合连续投影算法(successive projections algorithm,SPA)的CARS-SPA和IRIV-SPA结合算法分别筛选出46、65、24和35个特征波长,并应用偏最小二乘法(partial least squares,PLS)和最小二乘支持向量机(least squares support vector machines,LS-SVM)建立甘薯冻害识别模型。结果表明,高光谱技术可以有效对甘薯冻害进行检测,CARS方法可以有效选择有用波长变量,是优于IRIV、CARS-SPA和IRIV-SPA算法的特征波长提取方法。CARS-PLS模型运算速度快且预测结果最优,其预测集样本的识别正确率、灵敏度及特异性分别为98.05%、98.84%和97.48%。该研究实现了对甘薯冻害特征的识别,为后续甘薯品质在线分选检测研究和在线检测设备的开发奠定了理论基础。

关键词 高光谱;甘薯;冻害;变量选择;品质检测

冻害[1-3]是造成甘薯腐烂的重要因素,常常由于收获过晚或贮藏中未做好防寒措施而发生,及时发现并剔除冻害甘薯是降低生产损失的关键。由于甘薯冻害表现的滞后性,冻害发生后不会立即腐烂,一般到贮藏15 d左右才会出现腐烂。在甘薯冻害发生早期,冻害甘薯与完好甘薯在外表皮上并无显著差异,从视觉角度无法区分识别。为了完成对甘薯早期冻害检测研究,需要寻求一种快速、高效的无损检测方法来实现冻害甘薯的识别检测。

高光谱技术(hyperspectral imaging,HSI)是一种无创质量评价技术,能够快速获取大量的样本表面结构信息和内部特征信息,对待测物进行分析,已被广泛应用在苹果[4-6]、梨[7-10]、马铃薯[11]等水果和蔬菜的内外部品质的无损检测[12-13]。由于待测物中水分等化学成分对光谱的吸收特性,冻害果肉中水分子由游离态向结晶态逐渐变化,会引起光谱吸收峰的偏移,利用高光谱技术对甘薯冻害特征的识别检测具有一定的可行性。同时光谱无损检测技术也已经在甘薯及其加工制品的水分、淀粉、蛋白质、茎叶色素、黄酮以及重金属等化学成分测定等方面获得应用。国内外已存在一些利用光谱技术对农产品冻害检测相关的研究[14-18]。但利用光谱无损检测技术对甘薯冻害的检测研究还未见相关报道。

本研究以山西太谷黄心甘薯为研究对象,分析冻害甘薯的光谱特性,利用一阶导数(first derivative,FD)对原始光谱预处理,研究竞争性自适应重加权算法(competitive adaptive reweighted sampling,CARS)、迭代保留信息变量算法(iteratively retains informative variables,IRIV)以及结合连续投影算法(successive projections algorithm,SPA)的CARS-SPA和IRIV-SPA共4种不同的筛选变量方法,并结合偏最小二乘法和最小二乘支持向量机得到甘薯冻害检测的优选特征变量以及检测模型,并对预测模型的识别正确率、灵敏度及特异性指标进行分析。

1 材料与方法

1.1 试验材料

本研究以黄心甘薯为研究对象,全部甘薯样本均是采自山西太谷丰农城西农产品批发市场的同一批甘薯样本。挑选无损伤且大小均一的甘薯样本,实验前对样本简单清洁处理。一共选取全部甘薯实验样本696个,其中从全部样本中随机挑选348个样本作为完好样本,放置于常温条件下不做任何处理。将剩余的348个完好甘薯先放置于-2 ℃低温条件下处理48 h,然后再放置于常温条件下贮藏24 h以上获得冻害甘薯样本。

1.2 高光谱采集与分析

样本的高光谱图像获取应用北京卓立汉光有限公司生产的“Gaia Sorter”型高光谱分选仪,配备相应的高光谱采集软件,如图1所示,主要组成为Image-λ-N17E光谱相机、电移动平台、计算机、暗箱和4个35 W溴钨灯等。仪器光谱波段为900~1 700 nm,分辨率为5 nm,像素为320×256,曝光时间为0.13 s。本试验设置平台移动速度为7.0 mm/s,镜头距样本的距离为220 mm。试验中样本置于全黑背景上且采集全程均在暗室内完成。样本的原始高光谱图像信息需要黑白校正,校正公式如公式(1)所示:

(1)

式中:R,校正后样本图像; Iraw,样本原始图像; Idark,全黑标定图像; Iwhite,全白标定图像。

1-电移动平台;2-暗箱;3-光谱相机;4-计算机;5-甘薯样本; 6-溴钨灯
图1 高光谱图像采集平台
Fig.1 Hyperspectral image acquisition platform

以样本质心为坐标,提取图像中完好和冻害区域(200~250个像素)的平均光谱作为2组(完好组和冻害组)样本光谱,共获得样本光谱819个,其中完好组样本光谱343个,冻害组样本光谱476个。去除噪声较大的边缘波段,本文保留930~1 700 nm波段(共243个波长变量)作为有效光谱进一步研究。如图2所示为2组甘薯样本的平均光谱,总体上2组样本的平均光谱曲线具有较高的相似性,在局部存在反射率低于0.05的微弱差异。其中960~1 140 nm为强反射区,1 410~1 570 nm为低反射区。2组样本光谱的波峰与波谷位置相对一致,在1 075和1 290 nm附近有两处明显波峰,两处波谷在1 205和1 470 nm附近主要由水分和碳水化合物的吸收引起[19]

图2 930~1 700 nm波段的有效光谱
Fig.2 Original reflectance spectral of 930~1 700 nm

1.3 样本集的划分

合理划分样本集,将光谱差异大的样本划分为训练集,所建立的模型更加稳健且具备更好的泛化性能。利用Kennard-Stone算法以3∶1的比例将819个总样本集光谱(343个完好和476个冻害)随机分配到训练集和预测集,共计614个训练集样本(257个完好和357个冻害),共计205个预测集样本(86个完好和119个冻害)。

1.4 数据处理

一阶导数预处理能够去除光谱曲线基线漂移,并减少背景干扰使光谱曲线变化更显著。变量标准化(standard normalize variate, SNV)算法通过对假定满足正态分布的各波长变量进行标准化处理,去除光散射、固体颗粒大小带来的的噪声影响。多元散射校正(multiplicative scatter correction, MSC)假定全部样本的平均光谱为基准光谱,利用每一条光谱与基准光谱间的线性关系完成光谱校正,排除样品大小、装载方式等的干扰。Savitzky-Golay卷积平滑法利用卷积平滑处理结合合适的平滑移动窗口数,对移动窗口内的光谱变量进行数据拟合,排除噪声干扰。

竞争性自适应重加权算法[20-22]是以偏最小二乘法(pertial least squares,PLS)模型回归系数作为变量重要性指标,采用评价权重的方式筛选变量,去除无关变量并减少变量间的共线性。迭代保留信息变量算法[23-25]是基于模型集群分析方法的特征选择算法,注重变量间的联合效应,利用变量的随机组合建立PLS模型,逐个计算变量重要性,经过迭代分析去除无效及干扰变量,最后基于剩余变量反向消除保留最佳波长变量。连续投影算法计算波长变量的正交投影,基于不同波长的向量投影筛选变量,消除波长变量之间的共线性问题,获得相关性较小的波长变量组。

PLS是较为经典的线性拟合方法,结合了多元线性回归、相关分析和主成分的优点,在考虑目标变量的前提下通过提取主成分降维,能够较好解决变量间的多重相关性问题和小样本问题。最小二乘支持向量机(least squares support vector machines, LS-SVM)[26-27]是SVM的一种改进算法,可以较好地解决输入变量与输出变量间复杂的非线性关系,通过升维将非线性不可分问题转化为线性可分,利用一次求解线性组来替代支持向量机中复杂二次优化问题,提高了模型的运算速率并降低模型复杂度。本文参考文献[28]定义3个指标(即识别正确率、灵敏度、特异性)来分析评价模型性能。其中,灵敏度为完好组中被正确识别样本的比率,特异性为冻害组中被正确识别样本的比率。若识别正确率、灵敏度、特异性越接近于100%,则表明所建立模型预测准确度越高。

高光谱图像采集及黑白校正在Specview软件完成,光谱信息数据提取采用ENVI 4.7 (ITT Visual Informagtion Solutions, Boudler, USA)软件,预处理、波长提取及模型建立和分析在The Unscrambler X 10.1 (CAMO AS, Oslo, Norway)和Matlab R2012a (The Math Works, Natick, USA)软件中运行完成,平均光谱图及预测结果图在Origin 8.5 (Origin Lab, USA)软件中绘制。

2 结果与分析

2.1 光谱预处理

为去除环境杂光、仪器误差等噪声影响,分别采用FD算法、SNV算法、MSC算法以及Savitzky-Golay卷积平滑法对原始光谱进行预处理,并基于4种预处理后光谱与原始光谱分别建立PLS模型并对训练集和预测集样本进行预测,得到模型结果如表1所示。经一阶导数预处理后建立的PLS模型的预测精度与稳定性最高,模型对预测集的决定系数和均方根误差(root mean square error, RMSEP)分别为0.879和0.176,均优于其他预处理方法。因此一阶导数预处理为最佳光谱预处理方法,后续处理均基于一阶导数预处理后的样本光谱进行分析。经一阶导数预处理后的样本光谱图如图3所示。

表1 不同预处理下建立的PLS模型结果
Table 1 Result of PLS models based on different preprocessing methods

预处理方法PCs训练集预测集R2cRMSECR2pRMSEP原始光谱100.8180.2100.8560.192FD100.8550.1880.8790.176SNV100.8280.2040.8440.197MSC100.8280.2050.8470.195Savitzky-Golay卷积平滑法100.8170.2110.8550.193

图3 经一阶导数预处理后的光谱
Fig.3 Reflectance spectral after FD processing

2.2 光谱特征波长提取

由于高光谱波段较多,且相邻波段间存在较多共线性及冗余信息变量,建立的模型复杂且精度较低,采用变量筛选方法能有效挑选与甘薯冻害信息相关的特征波段,压缩波长变量数,简化模型结构并提高模型性能。采用CARS、IRIV算法以及结合SPA算法的CARS-SPA和IRIV-SPA特征提取方法筛选冻害甘薯的特征波长。

利用CARS算法筛选与甘薯冻害特征信息相关的波长变量。设定蒙特卡罗抽样次数为50次,利用5折交叉验证的RMSECV最小值判定最佳变量。如图4-a所示,前20次采样过程中变量数减少速度较快,随后逐渐减缓。由图4-b可知,随着采样次数的增加,RMSECV值先减小后增大,在第18次采样时RMSECV值达到最小,此时各变量的回归系数位于图4-c中竖线位置,最终CARS算法筛选得到46个特征变量(图4-d),仅占全波段的18.9%。

利用IRIV算法筛选冻害甘薯的特征波长变量。设定IRIV算法的最大主成分为15,交叉验证次数为5,IRIV提取特征变量过程如图5所示。由图5-a可知IRIV算法一共迭代了6轮,随着迭代次数的增加,变量数逐渐减少,其中前2轮迭代过程中变量数减少最快,从243个变量减少到100个,之后变量数下降逐渐平缓,在第5轮迭代移除无效和干扰变量后,进入反向消除。经过5轮迭代分析加反向消除,从全部243个波长变量中筛选出与甘薯冻害相关的特征波长变量65个(图5-b),仅占全波段的26.7%。

a-波长数目的变化;b-均方根误差的变化; c-回归系数趋势图;d-CARS优选变量分布图
图4 CARS提取特征变量过程
Fig.4 Process of CARS variable selection

a-IRIV迭代保留变量数;b-IRIV优选变量分布图
图5 IRIV提取特征变量过程
Fig.5 Process of IRIV variable selection

由于CARS、IRIV 2种特征选择方法筛选的特征变量数目依然较多,本文利用SPA算法对CARS和IRIV筛选出的46和65个特征变量进行二次筛选[29-30]。如图6-a、6-c所示,均方根误差RMSE变化趋于稳定为0.160 98、0.154 14时,CARS-SPA和IRIV-SPA结合算法分别筛选出24和35个特征波长变量,变量分布图如图6-b、6-d所示,仅占全波段光谱变量的9.9%和14.4%。

2.3 模型构建与检验

本研究中完好组样本类别被赋值为1,冻害组样本类别被赋值为2。基于CARS、IRIV以及CARS-SPA和IRIV-SPA算法的波长变量筛选结果,采用PLS与LS-SVM方法分别建立对甘薯冻害特征的识别预测模型,描述甘薯冻害特征与波长变量间的关系,并与未经变量选择的识别模型进行比较。由于模型的预测值非整数,依据定义的完好组和冻害组样本分类赋值1和2,选取0.5为模型预测值的样本分类阈值,所以0.5~1.5被判定为完好样本,1.5~2.5被判定为冻害样本,进一步求得模型的识别正确率、灵敏度以及特异性指标来分析所建立模型的优劣。

表2为基于不同变量选择方法建立的模型预测结果。由表2可知,根据预测集判别结果,各模型的识别准确率均较高,识别准确率均在94.63%以上。CARS-PLS和CARS-LS-SVM模型预测准确率均高于IRIV-PLS和IRIV-LS-SVM模型,说明CARS算法筛选的46个特征波长变量能够更全面的反映与甘薯冻害特征相关的信息,是优于IRIV算法的特征波长提取方法。进一步分析,经过SPA方法二次筛选特征波长变量建立的CARS-SPA-PLS、IRIV-SPA-PLS、CARS-SPA-LS-SVM和IRIV-SPA-LS-SVM模型预测精度均较CARS-PLS、IRIV-PLS、CARS-LS-SVM和IRIV-LS-SVM模型有一定程度的下降,说明在进行特征波长的二次筛选过程中,SPA方法移除了部分对建模有用的特征变量,导致模型精度降低。由此可见,CARS方法为有效的变量选择方法,且CARS方法优于IRIV、CARS-SPA和IRIV-SPA 3种方法。此外,对比10种建模方法,发现CARS-PLS及RAW-LS-SVM所建立的分类模型性能均优于相应的其他方法所建立的分类模型。其中以RAW-LS-SVM模型预测结果最优,其预测集的识别正确率、灵敏度及特异性分别为98.54%、97.67%和99.16%。但是RAW-LS-SVM的波长变量未经过筛选,模型较为复杂。相比之下经CARS变量筛选后,建立的CARS-PLS模型的识别正确率、灵敏度及特异性分别为98.05%、98.84%和97.48%,预测准确率与RAW-LS-SVM模型差异较小,且建模所用的波长变量数减少了81.1%,表明CARS方法在全波段光谱变量中去除了自相关性高的波段,简化了模型结构,缩小了模型运算时间,不仅保持模型精度而且极大降低了模型复杂度,所以选择CARS-PLS模型作为最优模型。如图7所示为CARS-PLS所建立的分类模型对预测集样本的预测结果。由图7可知,误判样本共有4个,其中1个完好样本被误判为冻害,3个冻害样本被误判为完好。

a-不同变量数目下CARS-SPA算法的RMSE分布;b-CARS-SPA优选变量分布图;c-不同变量数目下IRIV-SPA算法的RMSE分布; d-IRIV-SPA优选变量分布图
图6 SPA提取特征变量过程
Fig.6 Process of SPA variable selection

表2 不同变量选择方法及建模方法的预测结果
Table 2 Predicted results of different variable selection and methods

方法变量数目训练集预测集正确率/%灵敏度/%特异性/%正确率/%灵敏度/%特异性/%RAW-PLS24391.8687.1695.2496.5994.1998.32CARS-PLS4696.9196.5097.2098.0598.8497.48CARS-SPA-PLS2495.4494.1696.3697.5697.6797.48IRIV-PLS6593.0093.7792.4496.1097.6794.96IRIV-SPA-PLS3589.7487.5591.3295.1295.3594.96RAW-LS-SVM24397.7295.3399.4498.5497.6799.16CARS-LS-SVM4691.0486.3894.4097.5697.6797.48CARS-SPA-LS-SVM2487.1381.3291.3294.6391.8696.64IRIV-LS-SVM6593.1692.2293.8497.0796.5197.48IRIV-SPA-LS-SVM3592.5189.8894.4097.0796.5197.48

图7 CARS-PLS判别模型对预测样本的预测结果
Fig.7 Predicted results of prediction samples by CARS-PLS classification model

3 结论

本研究利用高光谱技术结合变量选择方法对甘薯冻害特征进行定性识别研究,采用CARS、IRIV以及CARS-SPA和IRIV-SPA算法分别筛选出46、65、24和35个特征波长变量,基于全波段光谱变量和特征波长变量建立冻害甘薯的PLS和LS-SVM识别模型。结果表明,基于CARS特征波长变量的模型识别性能优于其他模型。10种预测模型中,CARS-PLS模型对甘薯冻害特征识别结果最优,预测集样本的识别正确率、灵敏度及特异性分别为98.05%、98.84%和97.48%。CARS算法筛选的特征波长能够更加全面地反映与甘薯冻害相关的信息,是优于IRIV、CARS-SPA和IRIV-SPA算法的特征波长提取方法。本研究从光谱维度实现了对甘薯冻害特征的识别,为后续甘薯品质在线检测设备的开发奠定了理论基础。

参考文献

[1] FERNANDEZ A O, PINATTI C A O, PERIS R M, et al.Freeze-damage detection in lemons using electrochemical impedance spectroscopy[J].Sensors, 2019, 19(18):4 051.

[2] KIM H C, JO H N, KIM Y O.Shooting and fruiting characteristics of ′hachiya′ persimmon tree affected by sub-zero temperature treatment at early budding stage[J].The Journal of the Convergence on Culture Technology, 2019, 5(4):395-399.

[3] CHARRIER G, CHUINE I, BONHOMME M, et al.Assessing frost damages using dynamic models in walnut trees:Exposure rather than vulnerability controls frost risks[J].Plant, Cell &Environment, 2018, 41(5):1 008-1 021.

[4] 马惠玲, 王若琳, 蔡骋, 等.基于高光谱成像的苹果品种快速鉴别[J].农业机械学报, 2017, 48(4):305-312.

MA H L, WANG R L, CAI C, et al.Rapid identification of apple varieties based on hyperspectral imaging[J].Transactions of the Chinese Society for Agricultural Machinery, 2017, 48(4):305-312.

[5] 杨福芹, 冯海宽, 李振海, 等.基于可见光-近红外光谱特征参数的苹果叶片氮含量预测[J].农业机械学报, 2017, 48(9):143-151.

YANG F Q, FENG H K, LI Z H, et al.Prediction for nitrogen content of apple leaves using spectral features parameters from visible and near infrared lights[J].Transactions of the Chinese Society for Agricultural Machinery, 2017, 48(9):143-151.

[6] 冯迪, 纪建伟, 张莉, 等.基于高光谱成像提取苹果糖度与硬度最佳波长[J].发光学报, 2017, 38(6):799-806.

FENG D, JI J W, ZHANG L, et al.Optimal wavelengths extraction of apple brix and firmness based on hyperspectral imaging[J].Chinese Journal of Luminescence, 2017, 38(6):799-806.

[7] 陈欣欣, 郭辰彤, 张初, 等.高光谱成像技术的库尔勒梨早期损伤可视化检测研究[J].光谱学与光谱分析, 2017, 37(1):150-155.

CHEN X X, GUO C T, ZHANG C, et al.Visual detection study on early bruises of korla pear based on hyperspectral imaging technology[J].Spectroscopy and Spectral Analysis, 2017, 37(1):150-155.

[8] 李雄, 刘燕德, 欧阳爱国, 等.酥梨货架期的高光谱成像无损检测模型研究[J].光谱学与光谱分析, 2019, 39(8):2 578-2 583.

LI X, LIU Y D, OUYANG A G, et al.Study on non-destructive testing model of hyperspectral imaging for shelf life of crisp pear[J].Spectroscopy and Spectral Analysis, 2019, 39(8):2 578-2 583.

[9] 潘廷跳. 基于光谱和成像技术的香梨黑斑病发病过程监测与快速检测方法研究[D].广州:华南理工大学, 2019.

PAN T T.Study on pathogenetic process monitoring and rapid detection methods of pear black spot disease based on spectroscopic and spectral imaging technologies[D].Guangzhou:South China University of Technology, 2019.

[10] 朱晓琳, 李光辉, 张萌.基于CARS-MIV-SVR的库尔勒香梨可溶性固体含量预测方法[J].光谱学与光谱分析, 2019, 39(11):3 547-3 552.

ZHU X L, LI G H, ZHANG M, et al.Prediction of soluble solid content of korla pears based on CARS-MIV[J].Spectroscopy and Spectral Analysis, 2019, 39(11):3 547-3 552.

[11] 姜微. 高光谱技术在马铃薯品种鉴别及品质无损检测中的应用研究[D].哈尔滨:东北农业大学, 2017.

JIANG W.Study on nondestructive detection of identification varieties and quality potato using hyperspectral technology[D].Harbin:Northeast Agricultural University, 2017.

[12] 吉海彦, 任占奇, 饶震红.基于高光谱成像技术的不同产地小米判别分析[J].光谱学与光谱分析, 2019, 39(7):2 271-2 277.

JI H Y, REN Z Q, RAO Z H.Discriminant analysis of millet from different origins based on hyperspectral imaging technology[J].Spectroscopy and Spectral Analysis, 2019, 39(7):2 271-2 277.

[13] 陈李品, 于繁千惠, 陶然, 等.基于高光谱成像技术预测牡蛎干制加工过程中的水分含量[J].中国食品学报, 2020, 20(7):261-268.

CHEN L P, YU F Q H, TAO R, et al.Prediction of moisture content in oyster drying process based on hyperspectral imaging[J].Journal of Chinese Institute of Food Science and Technology, 2020, 20(7):261-268.

[14] ZHANG L, SUN H, RAO Z H, et al.Hyperspectral imaging technology combined with deep forest model to identify frost-damaged rice seeds[J].Spectrochimica Acta Part A:Molecular and Biomolecular Spectroscopy, 2020, 229.

[15] WEI C W, HUANG J F, WANG X Z, et al.Hyperspectral characterization of freezing injury and its biochemical impacts in oilseed rape leaves[J].Remote Sensing of Environment, 2017, 195:56-66.

[16] 史萍, 武永峰, 胡新, 等.晚霜冻影响下冬小麦冠层光谱特征与株高要素变化关系[J].光谱学与光谱分析, 2017, 37(12):3 845-3 850.

SHI P, WU Y F, HU X, et al.Relationship between hyperspectral parameters of winter wheat canopy and plant height components under late frost injury[J].Spectroscopy and Spectral Analysis, 2017, 37(12):3 845-3 850.

[17] 孟雷, 武永峰, 胡新, 等.土壤表层湿度影响下冬小麦晚霜冻害及冠层光谱检测[J].光谱学与光谱分析, 2017, 37(5):1 482-1 488.

MENG L, WU Y F, HU X, et al.Using hyperspectral data for detecting late frost injury to winter wheat under different topsoil moistures[J].Spectroscopy and Spectral Analysis, 2017, 37(5):1 482-1 488.

[18] 魏传文. 基于多源数据的油菜冻害遥感机理与方法研究[D].杭州:浙江大学, 2018.

WEI C W.Remote sensing mechanisms and methods of freezing injury in winter oilseed rape using multi-source data[D].Hangzhou:Zhejiang University, 2018.

[19] POLESELLO A, GIANGIACOMO R.Application of near infrared spectrophotometry to the nondestructive analysis of foods:A review of experimental results[J].Critical Reviews in Food Science and Nutrition, 1983, 18(3):203-230.

[20] 宋华鲁, 闫银发, 宋占华, 等.利用介电参数和变量筛选建立玉米籽粒含水率无损检测模型[J].农业工程学报, 2019, 35(20):262-272.

SONG H L, YAN Y F, SONG Z H, et al.Nondestructive testing model for maize grain moisture content established by screening dielectric parameters and variables[J].Transactions of the Chinese Society of Agricultural Engineering, 2019, 35(20):262-272.

[21] 章海亮, 楚秉泉, 叶青, 等.高光谱成像技术鉴别鱼新鲜度[J].光谱学与光谱分析, 2018, 38(2):559-563.

ZHANG H L, CHU B Q, YE Q, et al.Classification of fishness based on hyperspectra imaging technology[J].Spectroscopy and Spectral Analysis, 2018, 38(2):559-563.

[22] 李冠稳, 高小红, 肖能文, 等.基于sCARS-RF算法的高光谱估算土壤有机质含量[J].发光学报, 2019, 40(8):1 030-1 039.

LI G W, GAO X H, XIAO N W, et al.Estimation soil organic matter contents with hyperspectra based on sCARS and RF algorithms[J].Chinese Journal of Luminescence, 2019, 40(8):1 030-1 039.

[23] 于雷, 章涛, 朱亚星, 等.基于IRIV算法优选大豆叶片高光谱特征波长变量估测SPAD值[J].农业工程学报, 2018, 34(16):148-154.

YU L, ZHANG T, ZHU Y X, et al.Determination of soybean leaf SPAD value using characteristic wavelength variables preferably selected by IRIV algorithm[J].Transactions of the Chinese Society of Agricultural Engineering, 2018, 34(16):148-154.

[24] 孙俊, 莫云南, 戴春霞, 等.基于介电特性与IRIV-GWO-SVR算法的番茄叶片含水率检测[J].农业工程学报, 2018, 34(14):188-195.

SUN J, MO Y N, DAI C X, et al.Detection of moisture content of tomato leaves based on dielectric properties and IRIV-GWO-SVR algorithm[J].Transactions of the Chinese Society of Agricultural Engineering, 2018, 34(14):188-195.

[25] WEI L F, YUAN Z R, YU M, et al.Estimation of arsenic content in soil based on laboratory and field reflectance spectroscopy[J].Sensors (Basel, Switzerland), 2019, 19(18):3 904.

[26] 吴宜青, 孙通, 刘津, 等.基于LSSVM和CARS变量优选的食用植物油中铬含量DP-LIBS检测[J].激光与光电子学进展, 2018, 55(1):438-445.

WU Y Q, SUN T, LIU J, et al.Detection of chromium content in edible vegetable oil with DP-LIBS combined with LSSVM and CARS methods[J].Laser & Optoelectronics Progress, 2018, 55(1):438-445.

[27] 高升, 王巧华.基于高光谱图像信息融合的红提糖度无损检测[J].发光学报, 2019, 40(12):1 574-1 584.

GAO S, WANG Q H.Comprehensive detection of internal quality of red globe grape extract based on near infrared spectroscopy[J].Chinese Journal of Luminescence, 2019, 40(12):1 574-1 584.

[28] 孙通, 莫欣欣, 李晓珍, 等.近红外光谱技术结合变量选择方法定性检测食用植物油中的腐霉利[J].光谱学与光谱分析, 2016, 36(12):3 915-3 919.

SUN T, MO X X, LI X Z, et al.Qualitative detection of procymidone in edible vegetable oils by near infrared spectroscopy and variable selection methods[J].Spectroscopy and Spectral Analysis, 2016, 36(12):3 915-3 919.

[29] 许文丽, 药林桃, 孙通, 等.基于CARS-SPA的苹果可溶性固形物可见/近红外光谱在线检测[J].食品工业科技, 2014, 35(22):61-64.

XU W L, YAO L T, SUN T, et al.CARS-SPA baesd visble/near infraed spectroscopy on-line detection of apple soluble solids content[J].Science and Technology of Food Industry, 2014, 35(22):61-64.

[30] 李冠稳, 高小红, 肖能文, 等.特征变量选择和回归方法相结合的土壤有机质含量估算[J].光学学报, 2019, 39(9):361-371.

LI G W, GAO X H, XIAO N W, et al.Estimation of soil organic matter content based on characteristic variable selection and regression methods[J].Acta Optica Sinica, 2019, 39(9):361-371.

Study on the detection of sweet potato freezing damage based on hyperspectral technology and variable selection method

XU Jiandong1,ZHANG Shujuan1*,ZHENG Xiaonan2,XUE Jianxin1,SUN Haixia1

1(College of Engineering, Shanxi Agricultural University, Jinzhong 030801, China) 2(School of Software, Shanxi Agricultural University, Jinzhong 030801, China)

Abstract Freezing damage is an important factor that causes rot in sweet potatoes.Timely detection and elimination of freezing damage of sweet potato is the key to reducing production losses.To establish a rapid and non-destructive detection method for freezing damage of sweet potato in the early stage, this study established a recognition model for the freezing damage of sweet potato in the early stage based on hyperspectral technology and chemometric methods."Gaia Sorter", a kind of hyperspectral sorter, was used to collect the hyperspectral information of the intact and frost-damaged sweet potato samples in the 900-1 700 nm band, and extract the average spectrum of the intact and frost-damaged regions of the samples to obtain 343 spectra for the intact region and 476 spectra for the frost-damaged region.The Kennard-Stone algorithm was used to select intact and frost-damaged samples in the training set and prediction set.Four preprocessing methods were used to preprocess the original spectra, and the first derivative (FD) was selected as the best preprocessing method.The competitive adaptive reweighted sampling (CARS), iteratively retains informative variables (IRIV), and CARS-SPA and IRIV-SPA combined with successive projections algorithm (SPA) were used to screen out 46, 65, 24 and 35 characteristic wavelength variables related to sweet potato freezing damage.Partial least squares (PLS) and least squares support vector machines (LS-SVM) were used to establish identification models of freezing damage in sweet potato, and it was compared with the recognition model without variable screening.The results showed that hyperspectral technology could effectively detect the freezing damage of sweet potatoes.The CARS method could effectively select useful wavelength variables.It was superior to the IRIV, CARS-SPA and IRIV-SPA algorithms.The CARS-PLS model showed fast calculation speed and the best prediction results.The recognition accuracy, sensitivity and specificity of samples in the prediction set were 98.05%, 98.84% and 97.48%, respectively.This study has achieved the identification of the characteristics of freezing damage in sweet potato, which lays a theoretical foundation for the subsequent research on online sorting and detection and the development of online testing equipment for the sweet potato quality.

Key words hyperspectral;sweet potato;freezing damage;variable selection;quality detection

DOI:10.13995/j.cnki.11-1802/ts.026289

引用格式:许建东,张淑娟,郑小南,等.高光谱技术结合变量选择方法的甘薯冻害检测研究[J].食品与发酵工业,2021,47(8):197-203.XU Jiandong,ZHANG Shujuan,ZHENG Xiaonan, et al.Study on the detection of sweet potato freezing damage based on hyperspectral technology and variable selection method[J].Food and Fermentation Industries,2021,47(8):197-203.

第一作者:硕士研究生(张淑娟教授为通讯作者,E-mail:zsujuan1@163.com)

基金项目:国家自然科学基金项目(31801632)

收稿日期:2020-11-27,改回日期:2021-01-14