白酒作为中国传统的固态蒸馏酒,承载着丰富的酒文化,至今仍然深受欢迎。白酒生产以谷物和酒曲为原料,经过糖化发酵和蒸馏得到原酒,而原酒的质量直接决定了成品酒的品质、价格和收藏价值[1]。从粮食选择到入窖发酵的所有环节都可能会产生影响原酒风味的物质,同时,物质间进行的多次物理、化学反应,使得原酒中微量成分多样且复杂,呈现出一种动态平衡的状态[2-4],加大了原酒质量判别难度。为准确判别原酒质量,推动白酒行业的数字化发展,统计分析方法被广泛应用于原酒质量判别领域。受限于原酒自身的复杂性,其形成机理若还按照简单科学的方法开展研究[5-6],很多现象解释不清楚,因此采用复杂科学、非线性科学深入研究中国传统白酒是必然的趋势和热点[7]。
支持向量机(support vector machine,SVM),核主成分(kernel principal component analysis,KPCA)等非线性方法被广泛应用于白酒的等级[8]、价格[9]判别中,是通过将非线性的数据投影到更高维的空间中使其具有线性特征后再进行分析。这些方法虽适用于白酒的数据特征但过程复杂、计算成本较大,对噪声更为敏感,更适用于杂质较少的成品白酒[10]。原酒未经勾兑处理,本身含有较多杂质,噪声较大,需进行异常剔除或提取有效的特征物质再分析。除此之外,研究人员对白酒的分析也拓展到了深度学习领域。张建华等[11]使用改进遗传算法优化反向传播神经网络(immune genetic algorithm back propagation,IGA-BP)进行酒精度的预测,决定系数R2能达到0.998 9。陈飞[12]使用神经网络能准确判别出不同年份的白酒。但神经网络通常需要大量的训练数据以防止过拟合,若用于原酒质量判别,会耗费大量时间进行样品采集和分析,成本较大。对此,非线性集成学习方法通过结合多个模型的预测结果来提高判别的整体性能,需要的样本量更小,更适用于原酒的判别分析。王继华等[13]使用深度森林(deep forests,DF)分类器建立浓香型白酒原酒分类模型,成功将4个等级的原酒样本进行分类。刘鑫等[14]结合迭代算法(AdaBoost)、梯度提升决策树(GBDT)、波袋算法(Bagging)、堆叠集成(Stacking)模型融合方法建立质量关系模型,实现原酒物质含量的准确预测。相比之下,极致梯度提升(extreme gradient boosting,XGB)模型通过残差学习和自定义损失函数拥有更高计算效率和精度,加入正则化项后还能有效防止过拟合,适用性更高,在医疗、地理等领域有广泛的应用。LIANG等[15]使用XGB预测硬岩柱稳定性,其预测精度能达到0.831。苏天培[16]利用XGB算法建立模型,通过血糖含量实现对白血病的预测。刘青茹等[17]使用XGB模型对泸型基酒贮存时间鉴别,R2评估结果达到0.987。该模型对具有复杂数据特征的样本很友好,但目前鲜见该方法应用于原酒质量分析。因此,本研究在对样本进行异常检查、关键输入变量提取、不平衡数据集补充后,以XGB方法作为原酒质量判别模型,以期能为白酒行业智能化酿造的转型升级提供理论支持。
看花摘酒:本研究的原酒样本来自四川某知名酒厂的24口混合糟工艺窖池,采样330个(头段样品92个,中段145个,尾段93个),每个样品250 mL。如图1所示,为保证与实际接酒模式一致,一、二、三级酒的过渡段连续取样,其余样本间隔5~10 min取样,样本是由具有10年摘酒经验的师傅根据酒花变化实时接酒得来。根据酒花得到的样本不符合国家白酒分级标准,为确保实验结果可靠,还需交由专业的品评小组根据国家标准评定出最终的原酒等级。
图1 原酒样本采样信息
Fig.1 Sampling information of raw liquor samples
感官评级:品酒小组是由酒厂的五位国家三级品酒师组成,并严格按照国标GB/T 10345—2022《白酒分析方法》对原酒的色、香、味、格4个方面进行综合评价,以确定最终等级。品评结果如图2所示,部分过渡段样本(1-4、2-1、2-2、2-6、2-7、2-8、3-1)由感官评定后进行矫正。一级酒的前段、二级酒的中段、三级酒的尾段样本都表现出明显的等级特征风味,复评结果与摘酒结果一致。最终以感官品评结果作为分析数据。
图2 原酒等级的分段复评结果
Fig.2 Segmented re-evaluation results of raw liquor grades
为了精确和有效地检测出330个原酒样品中的微量物质含量,本研究采用GC-MS检测技术,对原酒样本中微量物质进行准确鉴定和分析。仪器使用的是美国Agilent公司旗下的Agilent 7890B-G7000D三重四极杆气质联用系统,使用内标法进行物质定量分析,具体配置如下所示:
升温程序:初始柱温为60 ℃,保持5 min,然后以10 ℃/min升温至250 ℃,并保持2 min。
定量分析:本实验采用内标法进行定量分析,因2-乙基丁酸化学性质稳定、挥发性弱且不与原酒反应,选其作为内标化合物。参考国标GB/T 10345—2022《白酒分析方法》,利用峰面积法计算最终含量[14]。
定性分析:通过GC获得总离子流色谱图(total ion chromatogram,TIC),提取质谱图并与NIST质谱库比对,结合保留时间指数(retention index,RI)对原酒风味成分进行定性分析。以最高峰高度的0.2%为阈值挑选物质[18],各挥发性化合物的出峰时间间隔宽,分离效果好,基线稳定,可用于原酒挥发性物质的定性分析。
最终在330个原酒样本中,共检测出79种挥发性微量物质,见附表1(https://doi.org/10.13995/j.cnki.11-1802/ts.040992)。
表1 气相色谱配置参数
Table 1 Gas chromatography configuration parameters
工作条件参数内标试剂溶质:2-乙基丁酸(色谱纯,上海麦克林生化科技有限公司);溶剂:乙醇与超纯水按体积比V(乙醇)∶V(超纯水)=3∶2配制;内标试剂质量浓度:20.00mg/L色谱柱DB-Wax气相色谱柱(60m×0.25mm×0.25μm)进样方式自动进样载气氦气(99.999%,He)载气流速1mL/min进样口温度250℃分流比20∶1
表2 质谱配置条件
Table 2 Mass spectrometry configuration conditions
工作条件参数接口温度280℃EI离子源70eV离子源温度230℃扫描方式全扫描扫描质量范围30~540m/z环境温度(20±2)℃空气相对湿度<80%RH
1.3.1 平均斯皮尔曼等级相关系数
在流酒的过程中,同一等级原酒流酒时间相近其物质含量变化规律高度相似,平均斯皮尔曼相关系数是使用数据的大小顺序来代替数字本身,物质含量的大小顺序反而更能反映物质随蒸馏时间变化的情况,使得同一等级原酒具有较高的相关系数,而异常样本相关系数更低。通常认为相关系数大于0.8即具有较强相关关系[19]。由于原酒样本中的物质含量存在一定波动,因此认为当相关系数大于0.7即为同一等级原酒。计算如公式(1)所示:
ρ=
(1)
式中:R(xi)、R(yi)分别代表x、y的顺序位次,分别代表x、y的平均值,n代表样本总数。平均斯皮尔曼(average spearman,AS)则是分别计算每个样本与其他同等级样本间的斯皮尔曼相关系数再除以该等级的样本总数,如公式(2)所示:
(2)
1.3.2 特征筛选方法
(1)最大互信息系数(maximum information coefficient,MIC)
MIC被用来衡量2个特征变量之间的关联,它的主要思想是对2个相关变量的散点图做网格划分,散点的概率密度就可以度量2个变量之间的互信息系数,由此捕捉线性以及非线性的关联[20],属于非监督学习方法。不同的网格绘制方式会使得样本落入不同的二维网格中,统计每个网格区间中的散点数量再与总样本数相比,得到等级与含量的联合分布p(xi,yi)。结合特征边缘分布p(xi),目标边缘分布p(yi),求得原酒等级与物质含量间的相对熵,也就是互信息I(xi;yi)按公式(3)计算。
(3)
根据相对熵计算最大互信息系数,以找到划分等级所包含信息更多的特征物质,按公式(4)计算:
(4)
式中:a、b分别表示x、y方向上划分的格子个数。B为常数,一般设置为数据量大小的0.6次方[21]。
(2)贝叶斯-弹性网络(Bayesian elastic net,B-EN)
B-EN结合了岭回归(Ridge regression)和套索回归(Lasso regression)的优点,Ridge回归通过将系数缩小但不设为0来处理多重共线性,Lasso回归通过产生稀疏模型将一些系数压缩到0,实现特征选择[22],能有效解决原酒数据的高共线性及稀疏性,属于监督学习方法。计算过程则是先根据不同物质对原酒等级进行预测,得到的预测等级与真实等级之间的差距越小则分类越准确,通过最小化损失函数以减小差距从而提高准确率,损失函数按公式(5)计算:
(5)
式中,yi是实际值,是预测值,βj是模型的系数,n是样本数量,p是特征数量,λ1是Lasso惩罚项的权重系数,λ2是Ridge惩罚项的权重系数。通过贝叶斯算法对超参数λ1和λ2进行寻优,利用交叉验证对寻优结果进行验证,从而找到最优的参数组合。最后通过坐标轴下降法不断优化模型以最小化损失函数,当损失函数收敛时,表明此时的预测值与真实值最接近,并计算出此时每种物质的回归系数,回归系数越大,则相关性越高。在本研究中,B-EN主要用于筛选原酒特征,因此Lasso回归应会发挥更大的作用。
1.3.3 XGB判别模型
XGB是基于梯度提升树(gradient boosting decision tree,GBDT)的思想进行改进的算法,通过多棵分类与回归树(classification and regression tree, CART)结果的累加和得到最终的预测结果[23]。和GBDT相似,XGB模型通过不断迭代产生新的树,每次迭代产生的树可拟合上一棵树预测的残差,迭代多次进而形成一个由多个弱分类器组成的强分类器[24]。不同的是XGB模型考虑了树的复杂度,在损失函数中加入了正则项用于控制模型的复杂程度,防止过拟合现象;另外,GBDT使用的损失函数负梯度作为标签,而XGB通过求目标函数极值点和二阶泰勒展开逼近的方式得到树的结构,进一步考虑了梯度变化的趋势,提高了拟合速度和精确度。
采用 Microsoft Excel 2021 对数据进行整理。以VS code September 2024 (version 1.94)为编译器,使用Python 3.8.2rc1进行数据处理和建模,Matplotlib库进行数据可视化。
原酒质量的稳定需要维持特定的协调量比关系,但如果受到外界环境影响酒样中的协调关系就会被打破,酒样表现为酒味变淡,酸味加重等现象,因此在数据分析前应对样本数据进行异常检查。
以样本编号为横坐标,AS值为纵坐标绘制样本的斯皮尔曼相关系数图。如图3所示,标红样本的AS值分别为0.66、0.67、0.64、0.62、0.67、0.67,均小于0.7,明显低于其他一级酒样本,认为是6个异常样本。
图3 一级原酒中的异常样本
Fig.3 Anomalous samples in level one raw liquor
如图4所示,二级酒中物质变化规律相似,相关系数都较高,不存在异常样本。
图4 二级原酒中的异常样本
Fig.4 Anomalous samples in level two raw liquor
如图5所示,三级酒中存在1个异常样本,AS值为0.56,意味着该样本与其他三级样本相关性很低。
图5 三级原酒中的异常样本
Fig.5 Anomalous samples in level three raw liquor
将7个异常样本剔除后,剩余样本数为323个,其中头段样品86个,中段样品145个,尾段样品92个。剩余样本中仍含有79种微量物质,需要进一步进行特征物质的提取,以提高模型性能。
本研究通过MIC结合B-EN提取特征物质,为判别模型提供有效输入变量。
2.2.1 基于MIC的特征物质提取
MIC通过绘制不同的网格,探究物质与等级间的各种相关关系,以提取出相关性更高的特征物质。以乳酸异戊酯为例,以物质含量为横坐标,等级为纵坐标,绘制样本散点图。如图6所示,通过不同的网格绘制方式:2×2、3×3、4×4、5×5等,使样本分别落入不同的网格中,图中数据即为该网格的样本数量。
图6 不同的网格划分方式
Fig.6 Different grid partitioning methods
为便于展示,以图6中3×3的网格进行分析,统计每个网格中的样本数量除以样本总数,得到联合分布由不同等级同一物质(即网格各列)的样本数求和除以样本总数求出特征边缘分布p(x3)=[0.603 7 0.213 6 0.182 7]T。同理,以网格各行的样本数求得目标边缘分布p(y3)=[0.603 7 0.213 6 0.182 7]T。代入公式(3)、公式(4)计算出最大互信息MIC,找到与等级相关性更大的关键物质。最后,通过分箱约束(binning constraint),在保证格子不会无限增加,且防止其过拟合的前提下,当绘制方式为15×15时,乳酸异戊酯的MIC值最高为0.738。如图7所示,网格中蓝色越深,则代表落入该格子中的样本数越多。
图7 15×15网格绘制方式下的乳酸异戊酯分布
Fig.7 Distribution of isopentyl lactate in a 15×15 grid plotting method
在检出的物质中,乳酸异戊酯的MIC值最高,其次是苯乙醇(0.73)、1,1-二乙氧基-3-甲基丁烷(0.72)、戊酸乙酯(0.69)等(括号中的数值为MIC值)。如图8所示,随机选择一组样本,绘制样本含量趋势图,其中横坐标1~4为一级酒,5~12为二级酒,13~14为三级酒,纵坐标为物质含量。可以发现,这些MIC值更大的物质在原酒中的检出率几乎为100%,含量也更高。而从丁酸丁酯(0.24)起,甲酸辛酯(0.19)、己酸异丁酯(0.17)等MIC值更小的物质,其检出率陡然下降,分别为10%、10%,表明在大部分酒样中都未检测到这些物质,其含量也与MIC值更高的物质相差几倍到几十倍不等。
a-苯乙醇;b-1,1-二乙氧基-3-甲基丁烷;c-戊酸乙酯;d-丁酸丁酯;e-甲酸辛酯;f-己酸异丁酯
图8 物质含量分布图
Fig.8 Distribution map of substance concentrations
结合风味成分含量分布分析可知,检出率及含量极低的物质分布较为混乱,不宜作为判别模型输入。
由此,保留以丁酸丁酯(0.24)为阈值的49种特征物质,认为这些物质与原酒质量存在较强的相关性,其得分系数如图9所示。
图9 MIC筛选的特征物质
Fig.9 Feature substances selected by MIC
MIC筛选出的风味物质在原酒中的检出率和含量通常都较高。但分析发现部分特征物质在流酒过程中其含量变化并不显著,也就是说有的物质虽含量较高但在不同等级原酒中含量相似,并不能表征某一等级原酒的特征。这是因为MIC作为一种非监督学习方法,主要关注物质与等级之间的相关关系,不进行等级预测。因此,含量更高的物质往往计算出来的值也就更大,虽然在一定程度上能够剔除原酒中检出率和含量都较低的物质,同时也会忽略掉一些含量较低,但在不同等级原酒中含量差异明显的特征物质。
因此,为了更好地进行等级划分,需要结合监督学习方法再对79种物质进行特征提取,以确保提取的特征物质不仅在原酒中含量较高,且随流酒时间呈现出规律性的变化,才能更好地预测原酒质量。
2.2.2 基于贝叶斯参数优化的弹性网络特征提取
弹性网络属于监督学习算法,通过优化损失函数,减少真实值与预测值间的差距。由贝叶斯算法对超参数自动寻优,得到5折交叉验证最高得分0.703 4。如图10所示,根据该得分在训练集上寻找到最优超参数对:alpha=0.001,L1比例≈0,标红点处。alpha参数所代表的岭回归仅参与0.001的正则调整,岭回归与Lasso回归之比(L1比例)越小,则Lasso回归参数越大,由此可见模型中几乎是Lasso回归的特征选择性能在起作用,符合本研究中对物质进行特征提取的目的。
图10 弹性网络最优超参数对的三维图
Fig.10 3D plot of optimal hyperparameters for elastic net
如图11-a所示,弹性网络筛选出来的特征物质中L(-)-乳酸乙酯、己酸、2-羟基-4-甲基-戊酸乙酯等的正贡献率最大,这些物质随着等级的增加,含量随之增加,表现出较强的正相关关系。如图11-b所示,亚油酸乙酯、乙酸、2-叔丁基-3-甲基环氧乙烷的负贡献率最大,表现出较强的负相关关系。
a-正贡献率最大的前3种物质;b-负贡献率最大的3种物质
图11 具有显著贡献率的物质
Fig.11 Substances with significant contribution rates
如图12所示,有明显贡献率的物质中,十二酸乙酯在原酒中的规律性降低,从一级酒到三级酒的流酒时间里,含量几乎没有变化,不能作为特征物质。低于十二酸乙酯回归系数的其他物质如己酸丙酯、十七酸乙酯等随流酒时间的变化其含量变化大部分呈现无规律性,且对原酒质量贡献值极低。因此,认为大于十二酸乙酯回归系数的物质为原酒的特征物质,与原酒质量存在较强的相关性。
图12 贡献率较低的物质含量分布
Fig.12 Distribution of substances with low contribution rates
如图13所示,从79个物质中共筛选出42个特征物质,回归系数<0(左边)随流酒时间变化物质含量与之呈负相关,回归系数>0(右边)表示呈正相关。
图13 弹性网络筛选的特征物质
Fig.13 Characteristic substances selected by elastic net
2.2.3 MIC结合B-EN的特征物质筛选
将2个模型筛选出的物质取交集,共36种特征物质,在整个流酒过程中,这些物质随蒸馏时间呈现稳定的上升、下降、中段酒含量偏高、尾段酒含量偏高4种变化趋势,与刘志鹏等[25]的研究结果相同。
其中,L(-)-乳酸乙酯随流酒时间的增加含量逐渐增加,能反映不同的原酒等级。亚油酸乙酯以胶状存在酒中其稳定性易受酒精浓度的影响,亚麻酸乙酯、苯乙酸乙酯、3-苯丙酸乙酯都能在一定程度上反映酒精度的变化,酒精度能在一定程度上反映不同等级。此外,壬酸乙酯、癸酸乙酯、乙酸己酯、己酸己酯、庚酸乙酯、辛酸乙酯、戊酸乙酯、己酸丁酯、己酸戊酯、异戊酸丁酯等10种酯类物质,2-甲基丁醇、苯乙醇、异戊醇3种醇类物质以及1,1-二乙氧基-3-甲基丁烷、(2,2-二乙氧基乙基)-苯等物质在WANG等[26]的研究中认为是浓香型白酒中的重要特征物质,与本研究一致。
在候雅磬等[27]的研究中正戊酸、丁酸、己酸、乙酸为白酒中主要的挥发性酸,十四酸乙酯等是浓香型白酒等级划分的特征物质。ZHONG等[28]认为9-十六碳烯酸乙酯为蓝莓酒的主要风味物质。十六酸乙酯、十八酸乙酯等长链脂肪酸乙酯含量整体呈下降趋势,丁酸丁酯在中间段酒中含量最高作为原酒的特征物质与袁宇轩等[29]的研究相同。乳酸异戊酯、十五酸乙酯、反油酸乙酯、乳酸丁酯等在张琦等[30]的研究中是不同年份浓香型白酒中的特征物质。刘欣欣等[31]将2-羟基-4-甲基-戊酸乙酯等物质认为是典型风味物质。仅甲酸己酯、2-叔丁基-3-甲基环氧乙烷在其他研究中少见讨论。由此可见MIC结合B-EN能有效筛选出原酒中的特征物质。
原始数据在XGB中的准确率仅为83.33%,分类效果较差。剔除7个异常样本后,再经过MIC及弹性网络提取特征后,模型的判别准确率达到93.84%,已经能较好的对原酒进行分类。但采集的原酒样本属于不平衡数据集,将数据以训练集∶测试集=8∶2进行划分,训练集中一级酒样本71个,二级酒样本112个,三级酒样本75个,考虑到原酒过渡段样本数据高度相似的情况,采用更注重边界样本的Borderline SMOTE算法进行数据平衡处理,将一、三级样本补充至112个,以充分训练模型。最后,再通过测试集对模型进行验证,分类准确率达到95.38%,如图14所示,红色曲线与蓝色重叠则表示质量预测正确,未重叠则表示预测错误,64个测试集样本仅3个样本被误判。模型的精确率、召回率和F1得分都表现优异,证明该分类模型性能稳定,分类效果较好,如表3所示。
表3 模型评估指标表
Table 3 Model evaluation metrics table
等级准确率/%召回率/%F1得分/分数量/个10.881.000.941521.000.910.953330.941.000.9717
图14 原酒分类预测图
Fig.14 Prediction plot for raw liquor classification
综上所述,经过不平衡处理的数据以XGB为分类器能够有效地区分不同等级的原酒。表明本研究模型可以作为原酒等级分类的有效工具,在实际应用中具有重要的参考价值。
原酒属于多物质复杂体,为贴合酒厂实际摘酒方式,本研究在过渡段连续摘酒,因此需要对样本数据进行多重处理。首先就是对原酒样本进行异常检查,以保障后续分析的有效性,这是很多酒类研究所缺少的一步。其次对于原酒这一类复杂体,需要使用贴合数据特征的方法进行分析,才能提取出更具代表性的相关性更强的物质。并且通过分析提取的特征物质发现,原酒分级与成品酒的分级并不一致,而现有对原酒的研究几乎都是以成品酒为标准。因此在下一步的研究中会针对原酒建立评判标准,将原酒等级划分规范化、标准化、数字化,从而推动白酒产业智能化酿造的全面升级。
[1] WEI Y, ZOU W, SHEN C H, et al.Basic flavor types and component characteristics of Chinese traditional liquors:A review[J].Journal of Food Science, 2020, 85(12):4096-4107.
[2] JI X A, ZHANG L Y, YU X W, et al.Selection of initial microbial community for the alcoholic fermentation of sesame flavor-type Baijiu[J].Food Research International, 2023,172:113141.
[3] ZHAO D R, SHI D M, SUN J Y, et al.Characterization of key aroma compounds in Gujinggong Chinese Baijiu by gas chromatography-olfactometry, quantitative measurements, and sensory evaluation[J].Food Research International, 2018, 105:616-627.
[4] DONG W, DAI X R, JIA Y T, et al.Association between Baijiu chemistry and taste change:Constituents, sensory properties, and analytical approaches[J].Food Chemistry, 2023,437(P1):137826.
[5] HE F, DUAN J W, ZHAO J W, et al.Different distillation stages Baijiu classification by temperature-programmed headspace-gas chromatography-ion mobility spectrometry and gas chromatography-olfactometry-mass spectrometry combined with chemometric strategies[J].Food Chemistry, 2021, 365:130430.
[6] FAN S X, LI Y C, YANG B, et al.Qingxiangxing Baijiu sensory quality grade classification by 1H NMR and GC combined with multivariate statistical analysis[J].Food Control, 2024, 162:110419.
[7] 张贵宇.基于NIR指纹图谱的白酒量质摘酒关键技术研究[D].绵阳:西南科技大学, 2024.ZHANG G Y.Research on key techniques of Baijiu picking according to quality based on NIR fingerprint[D].Mianyang:Southwest University of Science and Technology, 2024.
[8] 韩云翠, 吕志远, 刘玉涛, 等.基于气相色谱与支持向量机的浓香型白酒基酒等级判断模型研究[J].中国酿造, 2023, 42(5):184-190.HAN Y C, LV Z Y, LIU Y T, et al.Grade judgment model of base liquor of strong-flavor Baijiu based on gas chromatography and support vector machine[J].China Brewing, 2023, 42(5):184-190.
[9] 崔安乐, 陈明举, 熊兴中, 等.基于KPCA-BP神经网络与GC-MS图谱的白酒价格预测技术[J].中国酿造, 2023, 42(7):179-184. CUI A L, CHEN M J, XIONG X Z, et al.Price prediction technique of Baijiu based on KPCA-BP neural network and GC-MS spectrum[J].China Brewing, 2023, 42(7):179-184.
[10] HE M, CHEN X L, ZHANG J, et al.Identification of liquors from the same brand based on ultraviolet, near-infrared and fluorescence spectroscopy combined with chemometrics[J].Food Chemistry, 2023, 400:134064.
[11] 张建华, 商建伟, 王唱, 等.基于LSTM和IGA-BP的酒精度预测模型[J].食品与机械, 2022, 38(5):71-77.ZHANG J H, SHANG J W, WANG C, et al.Research on alcohol prediction model based on LSTM and IGA-BP[J].Food and Machinery, 2022, 38(5):71-77.
[12] 陈飞.基于微量组分的白酒基酒分类鉴别与模式识别研究[D].重庆:重庆大学, 2018.CHEN F.Research on classification and identification of baijiu base liquor based on trace components and pattern recognition[D].Chongqing:Chongqing University, 2018.
[13] 王继华, 李兆飞, 杨壮, 等.面向不平衡数据集的浓香型白酒基酒等级分类研究[J].中国酿造, 2024, 43(1):184-189.WANG J H, LI Z F, YANG Z, et al.Research on grade classification of strong-flavor Baijiu base liquor based on unbalanced[J].China Brewing, 2024, 43(1):184-189.
[14] 刘鑫, 韩强, 李陈杰, 等.基于模型融合的浓香型白酒感官与风味成分质量关系模型研究[J].食品研究与开发, 2023,44(13):53-61.LIU X, HAN Q, LI C J, et al.Research on the relationship between sensory evaluation and flavor components of strong aromatic Baijiu based on model fusion[J].Food Research and Development, 2023, 44(13):53-61.
[15] LIANG W Z, LUO S Z, ZHAO G Y, et al.Predicting hard rock pillar stability using GBDT, XGBoost, and LightGBM algorithms[J].Mathematics, 2020, 8(5):765.
[16] 苏天培.基于XGBoost的糖尿病风险预测[J].科技视界, 2019(2):155-156.SU T P.Diabetes risk prediction based on XGBoost[J].Science and Technology Vision, 2019(2):155-156.
[17] 刘青茹, 孟连君, 张晓娟, 等.基于GC-MS指纹图谱和XGBoost机器学习的泸型基酒贮存时间鉴别[J].食品科学, 2022, 43(24):310-317.LIU Q R, MENG L J, ZHANG X J, et al.Identification of the age of Luzhou-flavor base Baijiu by gas chromatography-mass spectrometry fingerprinting and eXtreme gradient boosting machine learning[J].Food Science, 2022, 43(24):310-317.
[18] 钱宇, 胡雪, 孙跃, 等.基于指纹图谱和化学计量学的浓香型白酒分类研究[J].中国酿造, 2021, 40(6):152-156.QIAN Y, HU X, SUN Y, et al.Classification of strong-flavor Baijiu based on fingerprint and stoichiometry[J].China Brewing, 2021, 40(6):152-156.
[19] 李鹏, 罗湘淳, 孟庆伟, 等.基于Spearman相关性阈值寻优和VMD-LSTM的用户级综合能源系统超短期负荷预测[J].全球能源互联网, 2024, 7(4):406-420.LI P, LUO X C, MENG Q W, et al.Ultra short-term load forecasting of user level integrated energy system based on spearman threshold optimization and variational mode decomposition and long short-term memory[J].Journal of Global Energy Interconnection, 2024, 7(4):406-420.
[20] 刘国庆, 王兴起, 魏丹, 等.基于最大信息系数的软件缺陷数目预测特征选择方法[J].电信科学, 2021, 37(5):133-147.LIU G Q, WANG X Q, WEI D, et al.Feature selection method for software defect number prediction based on maximum information coefficient[J].Telecommunications Science, 2021, 37(5):133-147.
[21] 肖飞扬, 顾幸生.基于并行LSTM-CNN的化工过程故障检测[J].华东理工大学学报(自然科学版), 2023, 49(3):382-390.XIAO F Y, GU X S.Fault dection of chemical process based on parallel LSTM-CNN[J].Journal of East China University of Science and Technology (Natural Science Edition), 2023, 49(3):382-390.
[22] BEDOUI A, LAZAR N A.Bayesian empirical likelihood for ridge and lasso regressions[J].Computational Statistics &Data Analysis, 2020, 145:106917.
[23] ZHENG H T, YUAN J B, CHEN L.Short-term load forecasting using EMD-LSTM neural networks with a XGBoost algorithm for feature importance evaluation[J].Energies, 2017, 10(8):1168.
[24] S.Efficient prediction of early-stage diabetes using XGBoost classifier with random forest feature selection technique[J].Multimedia Tools and Applications, 2023, 82(22):11-19.
[25] 刘志鹏, 杨康卓, 王建力, 等.GC×GC-TOFMS解析浓香型白酒蒸馏过程中风味组分的变化规律[J/OL].食品与发酵工业, 2024.https://doi.org/10.13995/j.cnki.11-1802/ts.039347.LIU Z P, YANG K Z, WANG J L, et al.Variation of flavor components in the distillation process of strong aroma type liquor analyzed by GC×GC-TOFMS[J/OL].Food and Fermentation Industries, 2024.https://doi.org/10.13995/j.cnki.11-1802/ts.039347.
[26] WANG J S, CHEN H, WU Y S, et al.Uncover the flavor code of strong-aroma Baijiu:Research progress on the revelation of aroma compounds in strong-aroma Baijiu by means of modern separation technology and molecular sensory evaluation[J].Journal of Food Composition and Analysis, 2022, 109:104499.
[27] 侯雅馨, 王俊山, 武亚帅, 等.浓香型白酒微量成分的研究进展[J].食品研究与开发, 2022, 43(20):194-205.HOU Y X, WANG J S, WU Y S, et al.Research progress on the trace components of strong-aroma Baijiu[J].Food Research and Development, 2022, 43(20):194-205.
[28] ZHONG W, LIU S Q, YANG H, et al.Effect of selected yeast on physicochemical and oenological properties of blueberry wine fermented with citrate-degrading Pichia fermentans[J].LWT, 2021, 145:111261.
[29] 袁宇轩, 张紫瑗, 李姝均, 等.中国传统白酒风味酯合成研究进展[J].食品科技, 2024, 49(3):8-16.YUAN Y X, ZHANG Z Y, LI S J, et al.Research progress on synthesis of Baijiu flavor esters[J].Food Science and Technology, 2024, 49(3):8-16.
[30] 张琦, 沈才洪, 孙啸涛, 等.浓香型白酒蒸馏过程中挥发性风味物质的变化规律[J].现代食品科技, 2018, 34(6):244-254.ZHANG Q, SHEN C H, SUN X T, et al.Variation regularity of volatile substances in Luzhou flavor liquor during distillation process[J].Modern Food Science and Technology, 2018, 34(6):244-254.
[31] 刘欣欣, 武亚帅, 黄河, 等.基于风味交互作用的浓香型白酒关键风味物质探究[J].食品安全质量检测学报, 2023, 14(12):23-34.LIU X X, WU Y S, HUANG H, et al.Research on key flavor substances of Nongxiangxing Baijiu based on flavor interaction[J].Journal of Food Safety and Quality, 2023, 14(12):23-34.