基于高光谱成像技术的科克铁热克葡萄品质预测和地理标志识别

崔希炜1,黄恺文2,江涛2,刘志刚1*,刘岩1,刘海1,于航2

1(阿米检测技术有限公司,江苏 苏州,215100)2(江南大学 食品学院,江苏 无锡,214122)

摘要 科克铁热克葡萄作为地理标志产品,其品质特征与产地环境密切相关,为实现对其快速无损的品质评价与地标保护,该研究基于高光谱成像技术,构建了科克铁热克葡萄品质预测与地标产品识别多任务分析方法。研究获取了新疆科克铁热克地标产区及周边非地标产区葡萄样本的400~1 000 nm高光谱数据,通过滤波平滑、一阶导数、二阶导数、基线校准、标准正态变换、多元散射校正等方法进行光谱预处理,以优化数据质量,基于偏最小二乘回归筛选最佳的预处理方法并构建出可溶性固形物(soluable solid content, SSC)和总酸(total acidity, TA)的品质预测模型。其中基线校准预处理效果最优,SSC品质预测模型测试集决定系数(R2)为0.890 2,均方根误差(root mean square error, RMSE)为0.689 8%,TA品质预测模型测试集R2=0.768 9,RMSE=0.105 0%。针对地标产品识别任务,采用偏最小二乘判别分析构建地标产品识别模型,其滤波平滑预处理的模型性能最佳,为0.825,模型预测指数(Q2)为0.810,最终实现95%的判别准确率。该研究将化学计量学模型结合高光谱成像技术同时实现了科克铁热克葡萄的品质预测和地理标志识别,为农产品地理标志保护和水果品质无损检测提供了一种积极的技术方案。

关键词 高光谱成像;地理标志产品;品质预测;光谱预处理;科克铁热克葡萄

地理标志农产品因其独特的地域属性和品质特征,具有显著的经济价值和文化意义。新疆科克铁热克葡萄作为中国重要的地理标志农产品之一,以其果粒饱满、糖酸比均衡和耐贮运特征而闻名,是新疆区域农业经济发展的支柱性产业。然而,随着市场需求的扩大和品牌价值的提升,科克铁热克葡萄面临严峻的产品掺假与仿冒问题。部分商家通过产地标签伪造、品质等级虚标等手段牟利,不仅损害消费者权益,也造成地标产品信誉缺失和可持续发展阻碍。可溶性固形物(soluble solids contents,SSC)和可滴定酸度(titratable acid,TA)是决定葡萄品质的重要指标[1],传统的SSC和TA测定技术(如糖度计、酸碱滴定分析和高效液相色谱等)虽具有可靠性和精确性,但存在检测周期长、设备成本高、破坏样本、操作复杂等局限性,表明传统方法在葡萄品质实时监测和规模化应用中的不足,难以满足生产流通环节的快速检测需求。因此,开发一种高效、无损和可规模化的品质评价与地理标志溯源技术,已成为科克铁热克葡萄产业亟需突破的瓶颈。

近年来,高光谱成像技术(hyperspectral imaging,HSI)因“图谱合一”的特性,在食品无损检测领域展现出独特优势。HSI技术通过连续窄波段(通常为数百个)的光谱信息采集,结合空间像素级分辨率,能够同时获取样本的物理形态特征与内部成分分布信息。相较于传统方法,HSI的优势体现在3个方面:a)非接触、无损检测:避免样本破坏,适用于在线分选与动态监测;b)多指标同步分析:通过特征波段提取与建模,可同时预测SSC、TA、水分等参数;c)高精度溯源能力:不同产地的土壤、气候差异会在光谱特征中形成特异性“指纹”,结合建模方法可实现地标产品的精准鉴别。吴清松[2]和黄琦[3]使用高光谱成像技术实现了三文鱼和花生的产地溯源和品质参数的无损检测。HSI也在苹果品质预测[4]、柑橘病害识别[5]及普洱茶产地分类[6]中取得显著成效,但其对葡萄的品质检测应用仍集中于常规品种(如赤霞珠、巨峰等)[7],且缺少基于高光谱成像技术的葡萄品质检测和地理标志识别。

不同于单一任务即品质回归预测或产地分类识别,本研究以新疆科克铁热克葡萄为对象,使用HSI结合化学计量学模型,旨在同时实现科克铁热克葡萄SSC和TA的预测以及地理标志产品的判别。此外,本研究对HSI数据采用不同的预处理方法以识别最优的科克铁热克葡萄高光谱数据预处理,所建立的最优品质预测模型和产地判别模型可为科克铁热克葡萄的标准化分级、品牌保护及智能供应链管理提供技术支持,同时为其他地理标志农产品的质量监管体系创新提供参考。

1 材料与方法

1.1 材料与试剂

科克铁热克葡萄是一种具有地方特色的葡萄品种,原产于新疆阿图什,主要在8~9月成熟。新疆气候干旱,昼夜温差大,利于科克铁热克葡萄的糖分积累。由于科克铁热克品种于新疆科克铁热克地区具有极好的品质和独特的地理特征,于2013年获得全国地理标志农产品,并命名为科克铁热克葡萄。本研究从新疆科克铁热克葡萄的地理标志区域以及新疆其他非地理标志区域购买并采集葡萄果实样本。为确保数据的可靠性和真实性,选取果园中不同位置的葡萄藤,每株葡萄藤上选取2~3簇葡萄,由生产者进行采样,尽可能选择形态相似、大小均匀、色泽一致且表面无明显损伤的完整葡萄。采样时分别从葡萄串的上、中、下及阴阳面,不同阳光照射强度的位置摘取,以5颗葡萄为一组。这些葡萄被认为是商业上成熟的且没有虫害和明显损伤。经挑选和排除后,选取74组地理标志样品和46组非地理标志样品,合计120组样品,共600颗葡萄。将采摘后的葡萄按组别编号,置于冰箱低温(4~6 ℃)保存,以待后续实验。

1.2 仪器与设备

GaiaSorter“盖亚”高光谱成像系统,江苏双利合普科技有限公司;PR-101α数字式糖度计,日本爱宕科学仪器有限公司。

HSI主要由高光谱成像仪、透镜、光源、电控移动平台、计算机及控制软件等组成,如图1所示。HSI是一种融合光谱分析与空间成像的先进技术,能够同时获取目标物体的空间信息和连续光谱信息。其核心原理基于物质对不同波长光的吸收、反射和发射特性。具体而言,HSI通过成像光谱仪将入射光分解为数十至数百个连续的窄波段(通常波段宽度小于10 nm),并利用探测器记录每个波段下的光强分布,最终形成“数据立方体”。糖度计主要用于测量可溶性固形物含量。

图1 高光谱成像系统示意图

Fig.1 Diagram of a hyperspectral imaging system

注:电荷耦合器件摄像机(charge coupled device,CCD)。

1.3 实验方法

1.3.1 光谱数据采集

为确保实验的准确性和稳定性,在使用HSI系统时,先打开卤素灯,使仪器预热30 min。为了降低仪器本身和外界环境引入的系统误差(如暗电流、光源不均匀性等)对光谱数据的干扰,确保获取的光谱数据具有准确的辐射度量信息。在采集葡萄高光谱图像前要进行黑白校正,先利用反射率接近100%的白板进行校正,再关闭卤素灯,遮挡镜头进行黑板校正以消除测试误差[8]。为了获取最佳 HSI 图像,葡萄样品以5个一组,放置在传输平台的中央。选择25 mm 光圈,设定光谱范围为400~1 000 nm,光谱分辨率为5 nm,空间分辨率2 048×1 080像素,扫描速度控制在0.5~5 cm/s。2组50 W卤素灯对称照射样本两侧,配漫反射罩以消除镜面反射干扰。曝光时间30 ms,扫描速度2 cm/s,与相机帧率同步,确保空间连续性。

由于采集到的高光谱图像中包含大量信息。因此,使用 ENVI4.3(Exelis Visual Information Solutions,美国)对HSI图像进行提取。选择葡萄样本赤道中心区域,使用100×100的矩形工具选择葡萄样本中的感兴趣区域(region of interest, ROI),提取ROI内所有像素的高光谱并计算平均值,作为当前样本的参考光谱。每组5颗葡萄的光谱数据取平均值,从而得到原始光谱。

1.3.2 建模样本集划分

使用分层抽样法将120组光谱数据按照4∶1的比例随机划分为训练集和预测集[9]。此方法可以保证训练集和测试集样本分布与总数据集样本保持一致。

1.3.3 光谱预处理

HSI系统在数据采集过程中易受传感器性能、环境干扰及传输噪声等多重因素影响,导致原始光谱数据包含非目标物质的干扰信息。为保障后续分析的可靠性,预处理是不可或缺的关键步骤。对原始光谱数据进行预处理可以有效消除传感器误差与系统噪声、抑制环境干扰、增强数据可比性、优化特征提取效率等。在本项研究中,实施了以下处理方式:滤波平滑(Savitzky-Golay smoothing,SG)[10],降低噪声水平,增强光谱连续性;一阶导数(first derivative,1 stD)预处理突出光谱曲线的局部特征(如吸收峰、反射边);二阶导数(second derivative,2 stD)预处理突出吸收峰的精细结构(如肩峰、拐点);基线校准(baseline correction,BSL),减轻基线漂移干扰,提升定量分析精度;标准正态变换(standard normal variate,SNV)[11],提高光谱数据的可比性和分析精度;多元散射校正(multiplicative scatter correction,MSC)[12],校正光谱散射,分离目标物质的化学信息与物理干扰。

Unscrambler X版本10.4.0软件(CAMO,Osla,挪威)用于光谱预处理, 然后建立偏最小二乘(partial least squares,PLS)模型对比预处理结果,选择最佳的光谱预处理方式。

1.3.4 建模

a)品质预测模型:基于偏最小二乘回归(partial least squares regression,PLSR)方法建立科克铁热克葡萄SSC和TA的品质预测模型。利用Unscrambler X版本10.4.0软件进行分析,以评估不同预处理模型对SSC和TA的品质预测模型的影响。使用测试集的决定系数(R2)和均方根误差(root mean square error,RMSE)评估不同预处理光谱的SSC和TA预测模型的性能[13]。一般来说,R2越接近于1,RMSE越低,SSC和TA预测模型的性能就越好。

b)地标产品识别模型:基于偏最小二乘判别分析(partial least squares discriminant analysis,PLS-DA)方法建立模型,利用SIMCA 14.1版本软件(Umetrics,瑞典)对地标产品进行判别分析,使用判别准确率和变量重要性(variable importance in projection,VIP)值进行模型评价。

2 结果与分析

2.1 SSC和TA测定值分布情况

不同数据集中葡萄SSC和TA的参数统计如表1所示。样本SSC和TA校准集的分布区间分别为13.60%~21.40%以及0.42%~1.34%,平均值分别为17.48%和0.74%,标准偏差分别为1.95%和0.19%。验证集的分布区间为14.10%~20.80%和0.42%~1.34%,平均值分别为17.95%和0.77%,标准偏差分别为1.65%和0.18%。样本SSC和TA的校准集和验证集的最小值、最大值、均值和标准偏差都较为接近,表明采样具有较好的代表性,样本划分具有较高的可靠性。

表1 样本SSA、TA频率分布

Table 1 Frequency distribution of SSA and TA in the samples

数据集样本数量SSC/%TA/%最小值最大值平均值标准偏差最小值最大值平均值标准偏差校准集RC9613.6021.4017.481.950.421.340.740.19验证集RP2414.1020.8017.951.650.441.070.770.18

地标与非地标样品的SSC和TA存在显著性差异,如图2所示,两者P都小于0.01,表示具有较高显著性差异,主要归因于地标产品与非地标产品,两者在自然环境、栽培管理方式、品种纯度与遗传特性等方面存在差异,从而影响了葡萄果实的颜色、味道等。

a-地标与非地标样品SSC;b-地标与非地标样品TA

图2 地标与非地标SSC和TA

Fig.2 Significance difference between geographical indication and non-geographical indication samples

注:不同小写字母表示差异显著(P<0.01)(下同)。

2.2 科克铁热克葡萄葡萄的光谱特征

使用高光谱成像设备获取的120组葡萄样品400~1 000 nm波段的原始光谱如图3-a所示,可以区分为吸光度普遍较大且具有明显波峰和吸光度普遍较小且不具有明显波峰2个部分,表明地标产品与非地标产品的光谱数据具有显著差异。

a-原始光谱图;b-SG预处理后的光谱图;c-1 stD预处理后的光谱图;d-2 stD预处理后的光谱图;e-BSL预处理后的光谱图;f-SNV预处理后的光谱图;g-MSC预处理后的光谱图;h-SG-1 stD预处理后的光谱图;i-SG-2 stD预处理后的光谱图;j-SG-BSL预处理后的光谱图

图3 葡萄原始光谱图以及预处理后的光谱图

Fig.3 Original spectra of grapes and spectra after pretreatment

采集到的光谱图像中,675 nm处和750 nm处呈现明显的吸收峰和反射峰。其中,675 nm位于可见光波段为叶绿素a和叶绿素b的主要吸收区域,可能归因于光与叶绿素等色素化合物的相互作用,使葡萄果实呈现肉眼可见的绿色[14]。此外,光谱在675 nm处的反射率与叶绿素含量呈正相关,表明地标和非地标果实叶绿素含量具有正向显著差异。叶绿素是果实光合作用的重要组成,导致果实营养成分积累,最终影响果实的成熟度和品质。750 nm处反射峰与C—H键、O—H键、N—H键及葡萄中的色素(如叶绿素、花青素)有关[15]。葡萄中的含烷基化合物或芳香族化合物、水分子或含羟基化合物、含氨基化合物和叶绿素等相对应。高光谱图像中波峰和波谷的差异可以反映葡萄的糖度、酸度和水分含量等状态,表明地标和非地标科克铁热克葡萄具有显著的品质差异,对科克铁热克葡萄的品质评估具有重要的意义。

400~1 000 nm波段的实时光谱信息可以反映不同化合物中分子键的振动,这对于构建其化学成分预测模型和地理标志判别模型十分重要。然而,与化学成分无关的散射信号和噪声可能会掩盖潜在的吸收峰。因此,需要通过光谱预处理(图3-b~图3-j)揭示光谱数据的这些潜在吸收峰。结果表明,采用SG和BSL预处理,虽然能消除光谱上的局部噪声,但光谱的反射率曲线没有明显变化,无法反映潜在的吸收峰。采用SNV和MSC预处理,可以进一步减小不同样本的光谱差异,提高谱线重合度。在应用1 stD和2 stD预处理后,原始光谱吸收峰变得更加突出,并且能在550 nm和940 nm处观察到2个潜在吸收峰。550 nm位于可见光的绿光波段,其反射率主要与葡萄中的叶绿素和类胡萝卜素等色素分子的化学键电子跃迁特性相关。由于这些色素分子可以通过光合作用和抗氧化性影响葡萄的成熟与贮藏过程,从而直接决定葡萄的色泽、香气等感官属性,是评估葡萄品质、成熟度和贮藏期的重要指标[16]。940 nm处吸收峰的形成与水分子中的O—H键振动特性密切相关[17],直接影响葡萄的品质。葡萄中水分含量的高低也会影响葡萄的可溶性固形物浓度、有机酸浓度,进而影响葡萄品质。因此,这些位于测量波段内的吸收峰可以直接反映葡萄中多种色素含量、水分含量、SSC含量和TA含量的信息,相似研究结果有苹果[18]、水蜜桃[19]、板栗[20]、菠萝[21]、猕猴桃[22]、冬枣[23]等。

2.3 不同预处理对SSC和TA预测模型性能的影响

分别应用不同预处理方式处理光谱数据,采用PLSR模型构建品质预测模型,并记录样品中具有不同预处理光谱的SSC和TA预测模型的性能,如表2和表3所示。

表2 不同预处理方法的SSC训练集和测试集结果

Table 2 Results of SSC train sets and test sets of different pretreatment methods

表3 不同预处理方法的TA训练集和测试集结果

Table 3 Results of TA train sets and test sets of different pretreatment methods

由表2和表3可知,BSL预处理对于显著提升了SSC预测模型性能和TA预测模型性能,对应的成分数分别为1和2,测试集的R2为0.890 2和0.751 9,RMSE为0.689 8%和0.088 7%。成分数代表模型中自变量的数量,成分数较少意味着模型结构简单,计算负担小,并且易于理解和解释,可以降低模型对训练数据噪声的敏感性,提升模型泛化能力,对于新数据能表现出更强的稳定性。R2越高代表BSL预处理能提升品质预测模型的拟合程度,提高品质预测模型对数据的解释能力。RMSE越低代表BSL预处理能提升模型预测精度,使预测更为准确。

由表2可知,使用原始光谱构建的SSC预测模型成分数为10,表明模型复杂度较高,计算效率低。而在采用不同预处理后,都能有效降低模型成分数,表明采用的不同预处理方式都能减少数据噪声、防止过拟合、减轻计算负担。其中,SG和2 stD预处理能显著提升SSC预测模型性能,测试集R2分别为0.866 2和0.859 7,RMSE分别为0.769 2%和0.818 7%,主要归因于有效的抑制了光谱数据中的高频噪声(如传感器噪声、环境干扰),噪声的减少提升了模型学习光谱特征与目标变量之间关系的准确性。对于TA预测模型,SG预处理及SG与其他预处理方式联用能都会降低模型性能,最佳成分数分别为6、2、2、5,测试集R2分别为0.628 3、0.639 7、0.640 3、0.676 0,RMSE分别为0.121 5%、0.119 6%、0.119 6%、0.113 5%,可能的原因是SG预处理会剔除或削弱光谱中的有效信息,导致模型无法充分捕捉特征规律。SNV和MSC预处理对于SSC预测模型和TA预测模型性能的负面影响非常显著,SSC预测模型测试集R2分别为0.386 2和0.401 2,RMSE分别为1.631 8%和1.589 9%,TA预测模型测试集R2分别为0.429 7和0.417 4,RMSE分别为0.134 5%和0.136 0%,则归因于两者改变了数据的原始分布,导致光谱特征与目标变量之间的关系减弱,关键光谱特征丢失,从而降低模型的性能[24]。刘宝花[25]同样基于SG、SNV、MSC、SG+1 stD和SG+2 stD预处理方法建立葡萄的PLSR品质预测模型,其效果均较差。对比其他品种的葡萄,本研究所开发的PLSR模型可能更加适用与科克铁热克葡萄。

综合比较SSC和TA的预测模型,BSL预处理对于科克铁热克葡萄品质预测模型具有积极影响,预测的散点结果如图4和图5所示。SSC和TA的预测模型的拟合曲线都接近于1,95%置信带和95%预测带都较窄,表明模型模型具有高的预测精度和低的预测误判风险(图4)。SSC含量和TA含量的预测值都接近实测值,误差值都较小(图5),表明科克铁热克葡萄的原始光谱数据经过BSL预处理后,与SSC含量和TA含量都呈现较为明显的线性关系,所构建的PLSR模型可以实现科克铁热克葡萄品质的快速无损在线检测。

a-对训练集SSC含量预测散点图;b-对测试集SSC含量预测散点图;c-对训练集TA含量预测散点图;d-对测试集TA含量预测散点图

图4 最佳模型(BSL-PLSR)对SSC和TA含量的预测结果

Fig.4 The prediction results of SSC and TA contents by the best model (BSL-PLSR)

注:校正均方根误差(calibration of root mean square error,RMSEC),预测均方根误差 (prediction of root mean square error, RMSEP)。

a-对训练集SSC含量预测的点残差图;b-对测试集SSC含量预测的点残差图;c-对训练集TA含量预测的点残差图; d-对测试集TA含量预测的点残差图

图5 最佳模型(BSL-PLSR)对SSC和TA含量的预测误差

Fig.5 The prediction error of the optimal model (BSL-PLSR) for the contents of SSC and TA

2.4 不同预处理对地标产品判别模型性能的影响

为了判别不同预处理方式对地标产品判别模型性能的影响,分别构建基于不同预处理的PLS-DA模型,结果如表4所示。

表4 不同预处理方法的PLS-DA模型结果

Table 4 Results of PLS-DA model with different pretreatment methods

注:AUC:ROC(receiver operating characteristic)曲线下的面积(area under curve, AUC)。

在PLS-DA模型中,是评估模型性能的关键指标。反映模型对原始数据X的拟合程度,值越接近1,说明模型对X的结构捕捉越充分,但需警惕过拟合。表示模型对类别标签的拟合能力,高可能意味着训练数据分类效果好,但需结合Q2验证泛化性。Q2衡量模型对新数据的泛化能力,Q2越高,预测能力越强[26]。由表4可知,基于经过各种预处理的原始光谱所构建的判别模型都具有较高的判别准确率,但采用了SNV和MSC预处理的判别模型,其判别准确率相对较低,归因于科克铁热克葡萄的地理标志产品和非地理标志产品在光谱特征方面具有显著性的差异。此外,1 stD、2 stD、SNV、MSC、SG+1 stD、SG+2 stD预处理都对模型性能产生了负面影响,分别为分别为0.778、0.749、0.481、0.458、0.809、0.817;Q2分别为0.769、0.719、0.368、0.360、0.771、0.756,可能归因于1 stD和2 stD预处理可放大噪声,削弱有效信号,掩盖真实的光谱特征[27],最终降低模型的分类能力。SNV预处理可能过度校正散射效应,去除了有用的光谱信息。MSC依赖参考光谱(通常为样本均值),若参考光谱不能代表真实“理想”的光谱,校正后数据可能偏离真实光谱差异[28]。SG、BSL、SG+BSL预处理对模型性能产生了积极影响,分别为分别为0.825、0.824、0.819,Q2分别为0.810、0.789、0.799。SG通过局部多项式拟合对光谱数据进行平滑,有效抑制高频噪声(如仪器噪声、随机干扰),同时保留信号峰形和化学特征。BSL消除基线漂移干扰,增强数据分类性和光谱信息区分度。综合比较PLS-DA地标产品判别模型,SG预处理对于判别分析科克铁热克葡萄具有最好的效果。

图6展示了最佳预处理下PLSDA模型的建模结果。由图6-a可知,科克铁热克葡萄地标产品与非地标产品的分离效果较好,可以被明显区分开。用已构建的PLS-DA模型进行200次置换检验,如图6-b所示,表明模型泛化能力强和稳定性高,可以显示模型在未知数据上的表现[29]。其最右侧的R2Q2均大于0.5,右边的原始点高于左边的的R2Q2,且Q2回归线和纵轴的截距小于0,说明构建的PLS-DA模型未过度拟合,具有较好的预测能力,因此该模型可以用于科克铁热克葡萄的地理标志识别。根据PLS-DA模型生成的VIP值来筛选差异特征波长(VIP>1)(图6-c),表明,VIP>1的波长有40个,多集中于400、750、900 nm附近,如图6-e所示。其中,400 nm附近的吸收峰与葡萄中叶绿素a含量和叶绿素b含量呈正相关。未成熟葡萄中叶绿素含量较高,随着成熟度增加,叶绿素被逐渐降解,从而导致400 nm处吸收峰强度减弱。750 nm附近的吸收峰主要对应有机化合物中C—H键的第三泛频振动,常见于糖类(如葡萄糖、果糖)、有机酸(如酒石酸)和醇类等成分。900 nm附近是水(O—H键)的强吸收区,同时也是糖类的C—H键二次泛频吸收的显著区域,这些物质是葡萄甜度、酸度和风味的主要贡献者。科克铁热克葡萄的糖度(C—H键相关)和酸度(O—H键相关)是品质鉴别的核心参数,同时也是区分地理标志产品和非地理标志产品的重要依据。而750 nm和900 nm附近波段可能同时携带这两类信息,导致其VIP值更高。混淆矩阵用于评估分类模型性能,主要用于展示模型预测标签与实际标签的对比情况,如图6-d所示。结果表明,仅6个非地标样品被错误预测为地标样品,模型综合预测准确率为95%。ROC曲线是一种用于评估二分类模型性能的工具,可通过绘制真正率(true positive rate, TPR)和假正率(false positive rate, FPR)的关系展示模型在不同阈值下区分正负样本的能力,如图6-e所示。ROC曲线越靠近左上角,说明模型性能较好。本研究中AUC为0.997 1,非常接近于1,说明模型分类性能较高。综上所述,基于经过SG预处理的原始光谱所构建的PLS-DA模型有效分级了地理标志和非地理标志样本,实现科克铁热克葡萄地理标志识别。

a-地标与非地标科克铁热克葡萄的PLS-DA得分图;b-模型交叉验证结果图;c-VIP图;d-混淆矩阵图;e-特征波长指示图;f-ROC曲线图

图6 SG-PLSDA的地标识别模型

Fig.6 The geographical indication identification model of SG-PLSDA

3 结论

本研究基于HSI技术结合化学计量学方法,构建出科克铁热克葡萄的品质预测模型和地理标志判别模型,在无损条件下,同时实现了科克铁热克葡萄的品质预测和地标产品识别双重任务。研究验证了HSI技术在地标农产品品质监控与地理标志鉴别中的应用潜力,为乡村振兴背景下特色农产品的标准化生产与品牌化推广提供了技术参考。然而,本研究在模型普适性方面仍有提升空间,后续可考虑纳入更多产地、不同年份的样本,进一步优化模型,增强其在复杂环境下的适应性和可靠性,更好地服务于实际生产。

参考文献

[1] 李记明. 关于葡萄品质的评价指标[J].中外葡萄与葡萄酒, 1999(1):54-57.LI J M.Evaluation index for grape quality[J].Sino-Overseas Grapevine &Wine, 1999(1):54-57.

[2] 吴清松. 三文鱼产地溯源与品质属性的高光谱成像检测方法研究[D].雅安:四川农业大学, 2024.WU Q S.Research on hyperspectral imaging detection method for salmon origin traceability and quality attributes[D].Ya′an:Sichuan:Agricultural University, 2024.

[3] 黄琦. 基于高光谱成像技术与机器学习的花生产地溯源与含水率无损检测研究[D].金华:浙江师范大学, 2023.HUANG Q.Research on hyperspectral imaging technology and machine learning for peanut origin traceability and moisture content nondestructive detection[D].Jinhua:Zhejiang Normal University, 2023.

[4] 董聪颖, 杨天意, 陈谦, 等.高光谱成像技术在苹果品质无损检测中的应用[J].果树学报, 2024, 41(12):2582-2594.DONG C Y, YANG T Y, CHEN Q, et al.Application of hyperspectral imaging technology in non-destructive detection of apple quality[J].Journal of Fruit Science, 2024, 41(12):2582-2594.

[5] 吴叶兰, 管慧宁, 廉小亲, 等.基于高光谱成像和Att-BiGRU-RNN的柑橘病叶分类[J].农业机械学报, 2023, 54(1):216-223.WU Y L, GUAN H N, LIAN X Q, et al.Classification of Citrus diseased leaves based on hyperspectral and att-BiGRU-RNN[J].Transactions of the Chinese Society for Agricultural Machinery, 2023, 54(1):216-223.

[6] 吕海涛, 吴文君, 廖声熙, 等.三类云南普洱茶树的地基光谱反射特征及其差异分析[J].茶叶科学, 2021, 41(2):184-192.LYU H T, WU W J, LIAO S X, et al.Analysis of ground-based spectral reflection characteristics and differences of three types of Yunnan Puer tea[J].Journal of Tea Science, 2021, 41(2):184-192.

[7] 文静, 马雯, 张昂, 等. 高光谱技术在葡萄品质无损检测应用上的研究进展[J]. 食品科学, 2024, 45(21):357-367.WEN J, MA W, ZHANG A, et al. Research progress on the application of hyperspectral technology for non-destructive testing of grape quality[J]. Food Science, 2024, 45(21):357-367.

[8] 杨杰. 葡萄内部品质的高光谱成像检测研究[D].石河子:石河子大学, 2016.YANG J.Research on hyperspectral imaging detection of grape internal quality[D].Shihezi:Shihezi University, 2016.

[9] 昝佳睿, 刘翠玲, 凌彩金, 等.基于高光谱技术的红茶茶多酚可视化研究[J].食品安全质量检测学报, 2023, 14(5):37-44.ZAN J R, LIU C L, LING C J, et al.Study on visualization of black tea polyphenols based on hyperspectral technology[J].Journal of Food Safety &Quality, 2023, 14(5):37-44.

[10] 曾柯宜, 刘禹彤, 张倩, 等.基于多模态融合的玉米种子成熟度的无损检测[J].食品安全质量检测学报, 2025, 16(2):171-177.ZENG K Y, LIU Y T, ZHANG Q, et al.Non-destructive detection of Zea mays L.seed maturity based on multimodal fusion[J].Journal of Food Safety &Quality, 2025, 16(2):171-177.

[11] XIAO Q L, TANG W T, ZHANG C, et al.Spectral preprocessing combined with deep transfer learning to evaluate chlorophyll content in cotton leaves[J].Plant Phenomics, 2022, 2022:9813841.

[12] 张小超, 吴静珠, 徐云.近红外光谱分析技术及其在现代农业中的应用[M].北京:电子工业出版社, 2012.ZHANG X C, WU J Z, XU Y.Near-Infrared Spectroscopy Analysis Technology and Its Application in Modern Agriculture[M].Beijing:Publishing House of Electronics Industry, 2012.

[13] 廖少敏. 基于高光谱成像技术的苹果内外品质无损检测的方法研究[D].南昌:华东交通大学, 2024.LIAO S M.Research on nondestructive detection methods for apple internal and external quality based on hyperspectral imaging technology[D].Nanchang:East China Jiaotong University, 2024.

[14] HUANG Y P, XIONG J, JIANG X S, et al.Assessment of firmness and soluble solids content of peaches by spatially resolved spectroscopy with a spectral difference technique[J].Computers and Electronics in Agriculture, 2022, 200:107212.

[15] 袁伟东, 姜洪喆, 杨诗雨, 等.基于高光谱成像技术的宁夏枸杞产地溯源鉴别[J].食品科学, 2024, 45(6):254-260.YUAN W D, JIANG H Z, YANG S Y, et al.Geographical origin identification of Lycium barbarum fruit using hyperspectral imaging technology[J].Food Science, 2024, 45(6):254-260.

[16] PEUELAS J, FILELLA I.Visible and near-infrared reflectance techniques for diagnosing plant physiological status[J].Trends in plant science, 1998, 3(4):151-156.

[17] XIE C Q, YANG C, HE Y.Hyperspectral imaging for classification of healthy and gray mold diseased tomato leaves with different infection severities[J].Computers and Electronics in Agriculture, 2017, 135:154-162.

[18] 何代弟. 基于深度学习的苹果溯源方法研究[D].阿拉尔市:塔里木大学, 2024.HE D D.Research on apple traceability method based on deep learning[D].Aral:Tarim University, 2024.

[19] 王昳昀, 马芸芸, 杨冕清, 等.基于高光谱成像技术和自适应增强网络的水蜜桃产地溯源[J].食品安全质量检测学报, 2024, 15(23):77-87.WANG Y Y, MA Y Y, YANG M Q, et al.Origin tracing of Prunus persica based on hyperspectral imaging technology and adaptive boosting[J].Journal of Food Safety &Quality, 2024,15(23):77-87.

[20] 孙晓荣, 张晨光, 刘翠玲, 等.基于高光谱成像技术的板栗产地溯源[J].食品安全质量检测学报, 2023, 14(18):59-65.SUN X R, ZHANG C G, LIU C L, et al.Origin tracing of Castanea mollissima based on hyperspectral imaging technology[J].Journal of Food Safety &Quality, 2023, 14(18):59-65.

[21] SEMYALO D, KWON O, WAKHOLI C, et al.Nondestructive online measurement of pineapple maturity and soluble solids content using visible and near-infrared spectral analysis[J].Postharvest Biology and Technology, 2024, 209:112706.

[22] 刘丽, 杨天意, 董聪颖, 等.米良1号猕猴桃贮藏过程中糖酸含量估测模型的构建[J].果树学报, 2025, 42(1):216-226.LIU L, YANG T Y, DONG C Y, et al.Construction of a sugar and acid content estimation model for Miliang-1 kiwifruit during storage[J].Journal of Fruit Science, 2025,42(1):216-226.

[23] 雷大涛, 罗华平, 高峰, 等. 基于偏振高光谱成像的南疆冬枣品质检测[J]. 食品研究与开发, 2025, 46(2):172-177.LEI D T, LUO H P, GAO F, et al. Quality detection of winter jujube from south Xinjiang based on polarized hyperspectral imaging[J]. Food Research and Development, 2025, 46(2):172-177.

[24] ZAUKUU J Z, NKANSAH A A, MENSAH E T, et al.Non-destructive authentication of melon seed (Cucumeropsis mannii) powder using a pocket-sized near-infrared (NIR) spectrophotometer with multiple spectral preprocessing[J].Journal of Food Composition and Analysis, 2024, 134:106425.

[25] 刘宝花. 基于高光谱成像技术的鲜食葡萄内部品质无损检测研究[D].济南:山东农业大学, 2020.LIU B H.Research on nondestructive detection of internal quality of table grapes based on hyperspectral imaging technology[D].Jinan:Shandong Agricultural University, 2020.

[26] 陈慧轩. 高光谱成像技术在枳壳快速识别及其化学成分含量预测的研究[D].镇江:江苏大学, 2022.CHEN H X.Research on rapid identification of fructus aurantii and prediction of its chemical component contents based on hyperspectral imaging technology[D].Zhengjiang:Jiangsu University, 2022.

[27] JIANG T, ZUO W D, DING J J, et al.Machine learning driven benchtop Vis/NIR spectroscopy for online detection of hybrid Citrus quality[J].Food Research International, 2025, 201:115617.

[28] SALVADOR-REYES R, TERESA PEDROSA SILVA CLERICI M, MARTNEZ-VILLALUENGA C.Enhancing the nutritional and bioactive benefits of faba bean flour by combining preprocessing and thermoplastic extrusion:A comprehensive study on digestion-resistant peptides[J].Food Research International, 2024, 183:114231.

[29] 禹洁, 周佳, 黄韡, 等. 基于稳定同位素与矿物元素的蜂蜜产地溯源判别模型的构建[J]. 食品安全质量检测学报, 2024, 15(18):84-93.YU J, ZHOU J, HUANG W, et al. Construction of honey origin traceability discriminant model based on stable isotopes and mineral elements[J]. Journal of Food Safety &Quality, 2024, 15(18):84-93.

Quality prediction and geographical indication identification of Koktiyerek grape based on hyperspectral imaging technology

CUI Xiwei1, HUANG Kaiwen2, JIANG Tao2, LIU Zhigang1*, LIU Yan1, LIU Hai1, YU Hang2

1(Am Incorporation for Metrology and Testing Technology Services, Suzhou 215000, China) 2(School of Food Science and Technology, Jiangnan University, Wuxi 214122, China)

ABSTRACT As a geographical indication product, the quality characteristics of Koktiyerek grapes are closely related to their production environment.To achieve rapid, non-destructive quality evaluation and geographical indication protection, this study utilised hyperspectral imaging technology to develop a multi-task analysis method for predicting the quality of Koketireke grapes and identifying geographical indication products.The study collected hyperspectral data in the 400-1 000 nm from grape samples in the Koketireke geographical indication production area and surrounding non-geographical indication production areas in Xinjiang.Spectral preprocessing was performed using methods such as filtering and smoothing, first-order derivatives, second-order derivatives, baseline calibration, standard normalisation, and multi-spectral scattering correction to optimise data quality.Partial least squares regression was used to select the optimal preprocessing method and construct quality prediction models for soluble solids content (SSC) and total acidity (TA).Among these, baseline correction (BSL) preprocessing yielded the best results.The test set R-square (R2) for the SSC quality prediction model was 0.890 2, with a root mean square error (RMSE) of 0.689 8%, and the test set R2 for the TA quality prediction model was 0.768 9, with a RMSE of 0.105 0%.For the task of identifying geographical indication products, partial least squares discriminant analysis was used to construct a geographical indication product identification model.The model with Savitzky-Golay smoothing (SG) pre-processing performed best, with and a model prediction index (Q2) of 0.810, ultimately achieving a discrimination accuracy rate of 95%.This study combined chemometric models with hyperspectral imaging technology to simultaneously achieve quality prediction and geographical indication identification for Koktiyerk grapes, providing an active technical solution for the protection of agricultural product geographical indications and non-destructive quality detection of fruits.

Key words hyperspectral imaging; geographical indication products; quality prediction; spectral pretreatment; Koktiyerek grapes

第一作者:硕士,中级工程师(刘志刚高级工程师,副教授为通信作者,E-mail:liuzg@htami.com)

基金项目:新疆典型地理标志农产品特征品质挖掘技术研究(天科研[2023]719号)

收稿日期:2025-03-14,改回日期:2025-07-28

DOI:10.13995/j.cnki.11-1802/ts.042706

引用格式:崔希炜,黄恺文,江涛,等.基于高光谱成像技术的科克铁热克葡萄品质预测和地理标志识别[J].食品与发酵工业,2026,52(4):261-270.CUI Xiwei,HUANG Kaiwen,JIANG Tao, et al.Quality prediction and geographical indication identification of Koktiyerek grape based on hyperspectral imaging technology[J].Food and Fermentation Industries,2026,52(4):261-270.