王允海, 马文强, 项斌斌, 崔宽波, 杨莉玲, 马文杰, 何美玲, 祝兆帅, 孙俪娜
为实现贮藏阶段关键品质指标的定性判别及定量预测,该研究以贮藏期‘法兰西’西梅为对象,通过采集西梅在(0、15、30、45、60 d)贮藏期的近红外光谱,结合归一化、卷积平滑(Savitzky-Golay smoothing,SG)、多元散射校正(multiplicative scatter correction,MSC)和标准正态变换(standard normal variate,SNV)等预处理方法,及竞争性自适应重加权采样(competitive adaptive reweighted sampling,CARS)、无信息变量消除算法(uninformative variables elimination,UVE)、遗传算法(genetic algorithm,GA)等特征提取方法,分别构建支持向量机、K最近邻、线性判别分析(linear discriminant analysis,LDA)的贮藏期定性判别模型,与偏最小二乘回归(partial least squares regression,PLSR)的可溶性固形物含量、含水率、硬度单品质基准预测模型。在此基础上,融合可溶性固形物含量、含水率和硬度的表征波长,引入了可解释性机器学习SHAP(SHapley Additive exPlanations)方法,并将其应用于融合后特征波长的贡献度评估和分阶段筛选,构建优化的硬度融合预测模型。结果表明,构建的MSC-GA-LDA贮藏阶段定性判别模型在测试集上100%准确判别(测试集样本量n=75,涵盖全部贮藏阶段);构建的单品质基准预测模型中,可溶性固形物含量、含水率、硬度模型分别筛选出30、54、15个关键响应特征,对应模型的最优表现分别为SNV-CARS-PLSR(R2p=0.922 2,RMSEp=0.663 9%)、SNV-GA-PLSR(R2p=0.809 2,RMSEp=1.806e-02%)、SNV-CARS-PLSR(R2p=0.809 0,RMSEp=0.103 6 N);经SHAP筛选的融合模型显著提升硬度预测效果(R2p=0.848 5,RMSEp=0.097 5 N)。研究结果为西梅贮藏品质的无损检测提供了理论依据与技术支持。