我国是水果生产大国,其中苹果的种植面积以及总产量排名世界第一,但是因我国苹果的采后分级技术相对落后,使其品质难以把控,不能满足高端市场的需求。水果果实的可溶性固形物含量(soluble solids content, SSC)是衡量水果口感和营养价值的关键指标,也是判断水果成熟度的主要依据,所以检测苹果的SSC对于判断其内部品质和采收时间具有非常重要的意义。
近年来,诸多学者采用折射仪测量果汁的糖度来获取水果的SSC[1-2],该方法的最大缺点就是有损检测,需要破坏被检测对象,而基于高光谱成像技术的无损检测恰好可以弥补不足。高光谱成像技术集图像信息和光谱信息于一体,具有分析速度快、无污染、无损伤等优势,深受国内外学者的青睐,被广泛应用于工业[3]、食品业[4-9]、农业[10-11]等领域。近年来,国内外科研工作者已利用高光谱技术开展了关于猕猴桃[1,12]、梨[13-15]、荔枝[16]和蓝莓[17-18]等水果SSC的无损检测研究,并取得了较好的研究成果。而采用高光谱成像技术结合误差反向传播(error back propagation, BP)网络以及多元线性回归(multiple linear regression, MLR)对苹果SSC的无损检测研究相对较少。
本文采用高光谱图像采集系统采集采后储藏期间“富士”苹果的高光谱图像,并提取感兴趣区域的反射光谱;应用连续投影算法(successive projection algorithm,SPA)和竞争性自适应重加权算法(competitive adaptive reweighted sampling,CARS)对预处理后的光谱数据进行降维,最终基于特征光谱建立了预测苹果SSC的BP网络模型以及MLR模型,以期为苹果SSC的检测提供一种快速、无损的方法。
新鲜“富士”苹果,购买于超市,选取表面无损伤的苹果120个,将其编号储藏在室温(22±2)℃条件下,取样间隔为1 d,每次取样30个,共取样4次,这样目的是使建立的预测模型可以预测范围相对较大的SSC值,增加其适用性。
高光谱图像采集系统(GaiaField-F-V10),四川双利合谱科技有限公司,系统结构如图1所示。
1-CCD相机;2-成像光谱仪(图像空间分辨率为696×700); 3-镜头;4-溴钨灯光源;5-电动平移台;6-暗箱;7-高性能计算机
图1 高光谱图像采集系统示意图
Fig.1 Schematic diagram of hyperspectral imaging acquisition system
ATAGO PAL-α数字手持袖珍折射仪,日本Atago公司;TD4Z-WS台式低速离心机,湖南湘立科学仪器有限公司;JYZ-V911榨汁机,九阳股份有限公司。
1.2.1 高光谱图像采集与校正
将苹果样品放在暗箱中的电动平移台上,调整采集系统的参数确保能采集到清晰又不失真的高光谱图像。相机的曝光时间是9.5 ms,苹果样本距离镜头约40 cm,电动平移台的移动速度是1.35 cm/s。然后,对待检测样本逐一扫描,采集所有苹果样本的高光谱图像。最后,采集全白和全黑的标定图像对原始高光谱图像进行校正。
1.2.2 苹果SSC的测定
在获取苹果高光谱图像后立即进行SSC的测定。先将苹果样本切成小块后榨汁,于3 000 r/min下离心5 min,然后将苹果汁涂抹在折光棱镜的镜面上,连续按测量键按钮多次,当最后液晶显示屏3次显示值一致时记录该值,每个样本分别测量多次的平均值作为其实测值。
1.2.3 样本集划分
采用基于联合X-Y距离的样本划分法(sample set partitioning based on joint x-y distances,SPXY)[19]将120个苹果样本划分为90个校正集样本和30个预测集样本。苹果SSC的统计结果见表1。从表1可知,校正集中苹果样本SSC相比预测集具有较宽的范围,有助于后续建立良好的预测模型。
表1 苹果可溶性固形物含量的统计结果
Table 1 Statistics results of SSC of apples
样本集样本数SSC/%最小值最大值平均值标准差校正集909.514.512.31.1预测集3010.814.412.20.7
1.3.1 光谱预处理
在建模之前需对光谱数据进行预处理,试验采用二阶导数(second derivative, SD)、标准正态变换(standard normal variation, SNV)、多元散射校正(multi-scatter calibration, MSC)3种光谱预处理方法[20]对光谱数据进行预处理,并比较它们对全光谱模型的影响。光谱数据处理在ENVI 5.4和MATLAB R2016b软件平台中完成。
1.3.2 建模方法及模型评价
试验采用SPA和CARS对原始光谱数据进行降维。采用BP网络和MLR建立苹果SSC的预测模型,其中BP网络是一种多层前馈神经网络,其输入信号从输入层经隐含层到输出层,能够实现输入与输出之间的高度非线性映射,而MLR是建立自变量X(光谱数据)和因变量Y(SSC实测值)之间的线性回归方程。以校正集的相关系数(rc)及其均方根误差(root mean square error of calibration set,RMSEC)和预测集的相关系数(rp)及其均方根误差(root mean square error of prediction set,RMSEP)作为判别模型性能的指标。
苹果样本的原始光谱以及经过SNV、MSC和SD预处理后的反射光谱(感兴趣区域为整个苹果样本)如图2所示。为了进一步分析3种光谱预处理方法(SNV、MSC和 SD)对BP网络预测模型的检测效果,分别将原始光谱以及经过3种光谱预处理后的光谱输入BP网络模型中建模,其结果如表2所示。从表2可知,经SD预处理后建立的BP预测模型具有最高的rp(0.87)以及最小的RMSEP(0.52),说明相比于SNV和MSC,SD光谱预处理方法更好,因此本文采用SD对原始光谱数据进行预处理。
2.2.1 采用SPA筛选特征光谱
采用SPA筛选特征光谱时,计算不同有效波长对应的RMSEP,常常依据最小的RMSEP值选定最有效的特征光谱。RMSEP随SPA中有效波长数的变化规律如图3-a所示,RMSEP值随有效波长数的增加而减小,当有效波长数超过5时,RMSEP变化不明显,因此选取5个波长作为特征光谱,采用SPA选取的5个特征光谱分布如图3-b所示。
a-原始光谱;b-SNV预处理;c-MSC预处理;d-SD预处理
图2 经过不同光谱预处理后得到的反射光谱
Fig.2 Reflectance spectra after different spectra preprocessings
表2 基于不同光谱预处理方法的BP模型对苹果 可溶性固形物含量的检测结果
Table 2 SSC prediction results of apples by BP model based on different spectra preprocessing methods
预处理方法校正集预测集rcRMSECrpRMSEPoriginal0.790.680.660.62SNV0.750.730.770.56MSC0.860.540.680.63SD0.820.730.870.52
a-RMSEP随SPA中有效波长数的变化规律; b-选取的特征波长
图3 基于SPA算法从全光谱中提取特征波长
Fig.3 Characteristic wavelengths selection from full spectra by SPA algorithm
2.2.2 采用CARS筛选特征光谱
在采用CARS筛选特征光谱时,将蒙特卡洛采样次数设定为50次,利用5折交叉验证法计算所建立的PLS模型中的交叉验证均方根误差(root mean square error of cross-validation,RMSECV),结果如图4所示。从图4-a可知,RMSECV值随着采样次数的增加呈先减小后增加的趋势,当采样次数达到19时,RMSECV值最小,本文得到的最优波长集包含有43个特征波长,提取的特征光谱分布如图4-b所示。
a-不同采样次数下RMSECV的变化规律; b-选取的特征波长
图4 基于CARS算法从全光谱中提取特征波长
Fig.4 Characteristic wavelengths selection from full spectra by CARS algorithm
分别将经SPA和CARS筛选的特征光谱输入BP网络模型以及MLR模型中,基于不同波长选取方法的BP网络模型以及MLR模型对苹果SSC的检测结果见表3。
表3 基于不同波长选取方法的BP和MLR模型对苹果 可溶性固形物含量的检测结果
Table 3 SSC prediction results of apples by BP and MLR model based on different variable selection methods
模型变量选择方法变量数校正集预测集rcRMSECrpRMSEPBPSPA50.820.730.870.52CARS430.890.490.730.70MLRSPA50.780.650.840.53CARS430.950.330.740.62
从表3可知,SPA-BP模型具有最高的rp(0.87)和最小的RMSEP(0.52),说明SPA-BP模型具有最好的预测性能。SPA-MLR模型的校正性能和预测性能均劣于SPA-BP模型。虽然CARS-MLR模型的校正性能较好(rc=0.95,RMSEC=0.33),但是其预测性能劣于SPA-BP模型。另外采用SPA特征波长选择方法从256个全光谱波段中提取了5个特征变量作为BP网络的光谱输入,明显提升了BP网络模型的运行效率。由此表明基于SPA提取的特征光谱建立的BP网络模型对苹果SSC的无损检测具有良好的预测能力,可实现苹果SSC的快速无损检测。苹果SSC的实测值和预测值如图5所示。
图5 苹果可溶性固形物含量的预测结果
Fig.5 Prediction results of SSC of apples
(1)原始光谱中除了包含自身有用信息外,外界不确定因素(如光的散射以及环境噪声等)也会对建模效果产生一定影响,因此通过综合比较3种光谱预处理方法(SD、SNV和MSC)对预测模型的检测效果表明,SD预处理方法相比于SNV和MSC更好。
(2)为解决高光谱成像技术在水果品质无损检测中存在数据量冗余的难题,对预处理后的光谱数据降维,结果表明,应用SPA和CARS分别从256个全光谱中筛选了5个和43个特征波长,明显提升了预测模型的运行效率。
(3)为得到苹果SSC最优预测模型,采用BP网络模型和MLR模型对SPA和CARS算法提取的特征光谱分别建模,结果表明:基于特征光谱建立的SPA-BP网络模型预测性能最优,其相关系数rp为0.87,均方根误差RMSEP为0.52,可应用于苹果SSC的无损检测。
[1] 董金磊,郭文川.采后猕猴桃可溶性固形物含量的高光谱无损检测[J].食品科学,2015,36(16):101-106.
[2] 尚静,孟庆龙,张艳,等.紫外/可见光谱技术无损检测李子可溶性固形物含量[J].食品工业科技,2020,41(3):228-231.
[3] 汪金花,吴兵,徐国强,等.水泥胶砂中水泥水化的高光谱特征分析[J].硅酸盐通报,2019,38(11):3 646-3 653.
[4] 王芹志,强锋,何建国,等.基于可见-近红外光谱预测灵武长枣脆度及模型优化[J].食品与发酵工业,2017,43(3):205-211.
[5] 孙炳新,匡立学,徐方旭,等.苹果脆度的近红外无损检测[J].食品与发酵工业,2013,39(5):185-189.
[6] JIANG J,CEN H,ZHANG C,et al.Nondestructive quality assessment of chili peppers using near-infrared hyperspectral imaging combined with multivariate analysis[J].Postharvest Biology and Technology,2018,146:147-154.
[7] 孙旭东,刘燕德,李轶凡,等.鸭梨黑心病和可溶性固形物含量同时在线检测研究[J].农业机械学报,2016,47(1):232-238.
[8] HOU J,ZHANG Y,SUN Y,et al.Prediction of firmness and pH for “Golden Delicious” apple based on elasticity index from modal analysis[J].Journal of Food Science,2018,83(1):1-9.
[9] 郭志明,赵春江,黄文倩,等.苹果糖度高光谱图像可视化预测的光强度校正方法[J].农业机械学报,2015,46(7):227-232.
[10] 杨峰,范亚民,李建龙,等.高光谱数据估测稻麦叶面积指数和叶绿素密度[J].农业工程学报,2010,26(2):237-243.
[11] 叶建秋,黄丹平,田建平,等.高光谱图像技术检测大曲发酵过程中的水分含量[J].食品与发酵工业,2020,46(9):250-254.
[12] GUO W C,ZHAO F,DONG J L.Nondestructive measurement of soluble solids content of kiwifruits using near-infrared hyperspectral imaging[J].Food Analytical Methods,2016,9:38-47.
[13] LI B C,HOU B L,ZHANG D W,et al.Pears characteristics (soluble solids content and firmness prediction, varieties) testing methods based on visible-near infrared hyperspectral imaging[J].Optik,2016,127(5):2 624-2 630.
[14] FAN S,HUANG W,GUO Z,et al.Prediction of soluble solids content and firmness of pears using hyperspectral reflectance imaging[J].Food Analytical Methods,2015,8:1 936-1 946.
[15] YU X,LU H,WU D.Development of deep learning method for predicting firmness and soluble solid content of postharvest Korla fragrant pear using Vis/NIR hyperspectral reflectance imaging[J].Postharvest Biology and Technology,2018,141:39-49.
[16] PU H,LIU D,WANG L,et al.Soluble solids content and pH prediction and maturity discrimination of lychee fruits using visible and near infrared hyperspectral imaging[J].Food Analytical Methods,2016,9(1):235-244.
[17] 李瑞,傅隆生.基于高光谱图像的蓝莓糖度和硬度无损测量[J].农业工程学报,2017,33(S1):362-366.
[18] LEIVA-VALENZUELA G A,LU R,AGUILERA J M.Assessment of internal quality of blueberries using hyperspectral transmittance and reflectance images with whole spectra or selected wavelengths[J].Innovative Food Science & Emerging Technologies,2014,24:2-13.
[19] GALVO R K H,ARAUJO M C U,JOSÉ G E,et al.A method for calibration and validation subset partitioning[J].Talanta,2005,67(4):736-740.
[20] 倪力军,张立国.基础化学计量学及其应用[M].上海:华东理工大学出版社,2011.
MENG Qinglong, SHANG Jing, HUANG Renshuai, et al. Nondestructive detection of soluble solids content in apple by visible-near infrared spectroscopy[J].Food and Fermentation Industries,2020,46(19):205-209.