基于贝叶斯算法优化Transformer结合双向门控循环单元对青稞酒的快速识别

许诗咏1,张世芝2,石婷1,张明锦1*

1(青海师范大学 化学化工学院,青海 西宁,810007)

2(青海民族大学 化学与材料科学学院,青海 西宁,810008)

摘 要 面对市场上白酒掺假等现象,寻找快速、无损、科学的白酒品质鉴别方法已成为相关领域研究热点。该研究以快速鉴别我国原产地保护地理标识产品“互助”青稞酒为目标,采集CHQL、其他品牌青稞酒(other brand Qingke liquor,OBQL)和非青稞原料白酒(non-Qingke based Baijiu,NQBB)3类白酒样本,采用紫外-近红外融合光谱对3类白酒的光谱特性进行研究,旨在建立CHQL快速无损鉴别方法。首先采集样本的紫外光谱和近红外光谱,并对光谱进行数据级融合;然后分别考察标准正态变换、Savitzky-Golay平滑、一阶导数、二阶导数等4种预处理方法和双向门控循环单元(bidirectional gated recurrent unit,BiGRU)、Bayes-BiGRU、Bayes-Transformer-BiGRU等3种分类模型对CHQL的识别效果。结果表明,经过二阶导数预处理后得到的数据结合Bayes-Transformer-BiGRU的分类识别效果最好,其分类准确率为94.12%,反应时间为492.89 s,多边形面积度量为0.87,表明Bayes-Transformer-BiGRU结合紫外-近红外融合光谱可实现CHQL快速、无损、精准鉴别。

关键词 “互助”青稞酒;双向门控循环单元;Transformer;贝叶斯优化

青稞酒是我国一种独特的清香型白酒,以中国青藏高原传统的“酒曲”蒸熟青稞发酵而成,由于其高营养价值,不仅是青藏高原地区居民的日常必需品,也受到其他地区消费者的广泛关注[1]。青海“互助”青稞酒(Chinese Huzhu Qingke liquor, CHQL)是中华人民共和国原产地保护地理标识产品。然而,随着青稞酒市场和受众的逐渐扩大,假冒仿冒CHQL现象频发,不仅严重损害了消费者的利益,而且扰乱了市场经济。面对这一现象,如何科学地鉴别青稞酒一直是青海地区分析研究的重点。

紫外光谱(ultraviolet spectrum,UV)和近红外光谱(near-infrared spectrum,NIR)技术被认为是最适合多组分检测的方法之一,具有快速、无损地识别复杂混合物体的优点。于翔等[2]基于紫外分光光度法结合随机森林(random forest,RF)、线性判别分析(linear discriminant analysis,LDA)、支持向量机(support vector machine,SVM)、逻辑回归(logistic regression,LR)建立了不同种类白酒的鉴别模型。HE等[3]用UV、NIR和多路荧光光谱结合LDA、SVM和反向传播神经网络(backpropagation neural network,BPNN)等化学计量学方法对白酒的光谱特性进行了研究。然而,单光谱技术在表征物质的物理化学特性时存在局限,不同化学结构的物质在各自的振动谱带中表现出不同的敏感度。通过光谱数据融合技术,能够整合不同光谱的优势,弥补单光谱技术的不足,从而获得更全面的信息,提高检测的准确性和可靠性[4-5]。赵玉霞等[6]采用UV、NIR及紫外-近红外中级数据融合光谱(ultraviolet spectrum-near infrared spectrum,UV-NIR)结合BPNN法建立了快速、无损、高效的CHQL判别分类模型,结果显示融合光谱可明显提高分类模型的预测能力和稳健性。YUAN等[7]对不同来源黄连的单光谱与数据融合组合分别进行建模,结果显示使用低级数据融合组合不同的建模方法可以实现更高的分类精度。

深度学习是机器学习的分支,通过构建多层非线性神经网络,从原始数据中自动学习层次化特征表示,实现对复杂函数关系的逼近。传统方法如SVM、递归神经网络(recurrent neural network,RNN),常因忽略序列数据的长期依赖性和双向上下文信息而导致分类性能受限[8-9]。而单一深度学习模型,如Transformer和双向门控循环单元(bidirectional gated recurrent unit,BiGRU),在参数优化鲁棒性和不确定性量化方面表现不足,尤其在小样本或类别不平衡场景下易产生过拟合[10]。针对上述问题,本研究提出一种融合贝叶斯优化、Transformer多头注意力机制与BiGRU的混合模型——Bayes-Transformer-BiGRU,用于区分不同类型的白酒。Transformer因其在自然语言处理方面的成功而闻名,它完全依赖于自注意力机制,使其能够捕获全局依赖关系并有效地并行计算[11]。BiGRU是一种基于RNN的模型架构,用于对时间序列数据进行建模和学习,它结合了双向性和门控机制,以更好地捕获序列数据中的长期依赖关系[12]。Bayes优化的核心是构建一个先验模型,用该模型描述目标函数的不确定性,并利用其指导搜索最优解[13]。Bayes-Transformer-BiGRU集成了Transformer的全局建模能力、BiGRU的序列分析能力及Bayes的不确定性量化,为复杂分类任务提供高精度与可信赖的解决方案。

本文以CHQL为研究对象,通过比较CHQL、其他品牌青稞酒(other brand Qingke liquor,OBQL)和非青稞原料白酒(non-Qingke based Baijiu,NQBB)的UV-NIR,将融合光谱结合化学计量学工具,构建CHQL的分类模型,实现CHQL的快速、准确、无损分类。

1 材料与方法

1.1 材料与仪器

CHQL(2023年、42%vol),青海青稞酒股份有限公司;OBQL、NQBB(2023年、42%vol),市售;甲醇(色谱纯),中国赛默飞世尔科技有限公司;无水乙醇(分析纯),中国医药集团有限公司。

Antaris Ⅱ傅里叶变换近红外光谱(Fourier-transform near-infrared spectroscopy,FT-NIR)仪,Thermo Fisher Scientific公司;Lambda系列紫外-可见分光光度计,美国PerkinElmer公司。

1.2 光谱采集

取适量样品于石英比色皿中,以无水乙醇为参比,在室温下用UV仪在波长200~400 nm以1 nm间隔扫描光谱,每个样品扫描3次,取平均光谱;采用NIR仪透射模式在835~2 630 nm波长范围内扫描样品光谱,扫描32次,分辨率为0.38 nm,每个样品重复测量3次,取平均光谱。

1.3 实验方法

1.3.1 样本划分

Kennard-Stone(KS)算法的主要思想是选择欧氏距离差异较大的样本进入数据校正集,剩余的光谱数据进入数据预测集,从而得到2个互补的子集:训练集和测试集。通过最大化样本空间的样本差异性,KS算法能够将具有代表性且解释能力强的数据纳入校正集,避免因校正集数据分布不均导致的模型不稳定等缺点。因此,本文选择KS算法作为样本划分方法。

1.3.2 光谱预处理

为去除干扰信息和消除数据采集引起的变异性,如噪声、基线偏移和仪器漂移,在开发校准模型之前,光谱预处理技术是必不可少的[14]。在本研究中,对原始光谱用4种方法进行预处理:标准正态变换(standard normal variate transform,SNV)、Savitzky-Golay平滑(SG)、一阶导数(first derivative,1st)和二阶导数(second derivative,2nd)。SNV方法消除了由于散射和粒度变化引起的光谱斜率波动,同时去除数据中的噪声。SG平滑消除了光谱数据中的高频噪声,而不减少变量数量[15]。一阶导数和二阶导数可以消除基线漂移,并增强微小的光谱差异[16]

1.3.3 分类模型

Bayes-Transformer-BiGRU是一种结合了Transformer的并行化全局特征提取、BiGRU的序列化局部特征精炼和贝叶斯优化的小样本学习适配的混合深度学习模型。该模型通过多组件协同工作,兼顾全局上下文、局部序列依赖性和不确定性量化,使其在分类任务中表现卓越。Transformer架构的核心优势在于其基于自注意力机制的完全并行化设计。面对2 274维的高分辨率光谱数据,传统循环神经网络需按时间步序逐次处理输入,而Transformer通过构建矩阵的映射关系,可一次性完成整个输入序列的特征交互。这种全连接的注意力机制使得GPU等并行计算硬件能够高效执行大规模矩阵乘法操作,即使序列较长,现代深度学习框架也能通过优化加速矩阵乘法[17]。特别地,多头注意力机制通过多组独立的注意力头并行提取多样化特征表示,既保留了全局依赖关系,又增强了模型对光谱数据中复杂模式的表征能力。另外,自注意力机制具有隐式特征选择功能——通过注意力权重动态聚焦于关键波长位置,如物质特征吸收峰,从而压缩冗余信息并保留判别性特征,这一特性为后续BiGRU模块降低了计算负荷。相较于Transformer的全局视角,BiGRU采用双向门控循环结构实现对光谱数据的建模。前向GRU沿波长递增方向捕获正向依赖关系,后向GRU则逆向遍历序列以捕捉反向关联。然而,BiGRU的天然缺陷在于其串行计算特性,它需要按时间步逐步处理前向和后向2个方向的序列数据,无法并行化,每个时间步的计算依赖前一步的隐状态,导致计算链式延迟。对于长序列,BiGRU的串行计算会成为性能瓶颈[18]。尽管存在此限制,BiGRU的门控机制仍具备独特优势,它能有效过滤噪声干扰并维持长期依赖关系的传递。结合Transformer预先完成的全局特征压缩,BiGRU仅需针对关键波段进行精细化建模,显著缓解了计算压力。两模块的级联设计形成了层次化特征提取体系:Transformer承担全局特征粗筛任务,它的自注意力机制自动聚焦于关键光谱特征,隐式压缩冗余信息,通过注意力权重筛选出关键波长[11, 19],BiGRU在此基础上进行局部特征精修,只需处理更短的序列,而非原始的2 274维,减少计算量,这种“特征压缩”的好处是:Transformer的并行计算规避了BiGRU的串行瓶颈,可显著降低BiGRU的计算负担,二者结合,Transformer负责全局特征提取,BiGRU仅需细化局部特征,减少了整体计算复杂度[18]。此外,在仅有113个样本的情况下,2 274个高维特征容易导致过拟合,而贝叶斯优化模块发挥了关键作用。传统网格搜索难以应对2 274维特征与超参数组合的爆炸式增长,而贝叶斯方法通过建立高斯过程代理模型,将超参数空间映射至验证集损失曲面,利用期望改进准则(expected improvement,EI)智能指导采样方向[20]。具体而言,每次迭代选择使EI指标最大化的超参数组合,快速逼近最优解。更重要的是,Bayes通过引入概率分布,用于自动搜索超参数(如学习率、GRU单元数、Transformer层数),将模型参数视为随机变量而非固定值,目标是最小化验证集损失,能够有效抑制过拟合,提升泛化能力[21],从而提高模型分类的准确率。模型的数学公式如公式(1)~公式(7)所示:

MultiHead(Q,K,V)=Concat(head1,……,headh)WO

(1)

(2)

z(t)=σ(VZX(t)+WZh(t-1))

(3)

r(t)=σ(VrX(t)+Wrh(t-1))

(4)

c(t)=tanh(VX(t)+r(t)Wh(t-1))

(5)

h(t)=z(t)h(t-1)+(1-z(t))c(t)

(6)

(7)

式中:QKV,矩阵;WO,输出权重矩阵;z,更新门输出;X(t),输入单元;VzWz,权重;h(t-1),前一个单元的存储数据;σ,激活函数的范围,为0~1;tanh,非线性激活函数;r,复位门;Wh(t-1),复位门r确定要丢失的信息;h(t),存储当前单位的信息并将其传输到网络;E[.],期望运算符;α,待优化超参数;的损失值;最佳观测值。

1.3.4 评价指标

建模完成后,建立混淆矩阵,通过分类准确率(classification accuracy,CA)和Kappa系数来评价模型,除此之外,本文还引进多边形面积度量(polygon area metric,PAM)作为评价指标[22]。PAM是使用敏感性(sensitivity,SE)、特异性(specificity,SP)、曲线下面积(area under curve,AUC)、杰卡德指数(Jaccard index,J)和F度量(F-measure,FM)点在正六边形中创建的多边形面积计算的。PAM面积越大,说明模型分类效果越好。Kappa系数是用于评估多类分类模型的一致性,提供对预测类别和实际类别之间一致性的全面评估,Kappa系数范围是[-1,1],数值越高表示分类精度越高[23-24]

1.4 数据处理

使用MATLAB R2023b软件进行光谱数据处理及绘图。

2 结果与分析

2.1 原始光谱

图1分别显示了3类白酒的UV和NIR。图1-a显示,在UV区域内,200~220、260~290 nm出现明显的吸收峰,分别为羧基和糠醛吸收峰。糠醛这类物质在白酒中是重要的呈香成分,其结构中含有一个醛基和一个呋喃环,2个双键和1个环醚键,化学性质活泼。当连续波长的紫外光照射白酒样品时,糠醛中的不饱和键中的电子吸收能量从低能级跃迁到高能级,在276 nm处形成较强的特征吸收峰。白酒中的糠醛主要是由美拉德反应和微生物代谢产生的,不同香型的白酒受酿造原料、地理来源、发酵温度、发酵时间、微生物等因素影响,其糠醛含量必然存在差异[25]。白酒的主要成分为水和乙醇。由图1-b可知,白酒的NIR特征吸收峰主要位于1 186、1 423、1 694、1 732、1 763 nm处。1 186 nm附近为次亚甲基(C—H)的一级倍频吸收带,主要为白酒样品中乙醇的特征吸收;1 423 nm附近为H2O的一级倍频吸收带,体现出白酒样品中水的特征吸收;1 694、1 732、1 763 nm附近为—CH3和—CH2的一级倍频吸收带,主要为白酒样品中总酯的特征吸收[26]。从结果看,3类白酒的UV和NIR形状相似,仅从光谱图无法区分3类样品,需要寻找一种新的策略来区分。

图1 UV、NIR原始光谱图
Fig.1 Original UV and NIR spectrogram

2.2 划分数据集

通过KS算法把样本划分为训练集和测试集。测试集用于测试所开发模型区分样本的能力,保证数据的代表性。最终,将113个样本按照7∶3的比例进行划分,其中训练集有79个样本,测试集有34个样本。

2.3 预处理

本研究采用SNV、SG、1st和2nd方法分别对数据进行预处理。为评价4种预处理方法的效果,将原始光谱数据以及经过4种预处理方法处理后的数据分别建立PLS-DA模型,通过比较模型的PAM值来确定一种适用于本研究的预处理方法,PAM值越接近1,代表模型效果越好。由表1可知,2nd的PAM值最大,高于原始光谱和其他预处理方法,因此本文选择2nd作为白酒UV-NIR的预处理方法。

表1 UV-NIR融合光谱预处理结果
Table 1 Preprocessing results of UV-NIR fusion spectra

PAMRAW0.38SNV0.80SG0.381st0.332nd0.98

2.4 模型建立比较

对经过2nd处理后的数据分别建立BiGRU、Bayes-BiGRU和Bayes-Transformer-BiGRU模型。结果如图2所示,BiGRU的训练集准确率为46.84%,测试集准确率为47.06%,结果均不理想。这是因为BiGRU局部特征捕获能力弱,对噪声敏感和特征重要性区分不足[27];计算资源消耗较大,BiGRU的双向结构需要同时处理前向和后向序列,导致计算量和内存占用显著增加,双向叠加可能影响实时应用或资源受限场景的效率[28];双向结构引入额外参数,增加了模型复杂度,增加了超参数优化难度,同时,两方向的梯度可能相互干扰,导致收敛速度慢或训练不稳定,在数据量不足时,容易过拟合,需依赖正则化或数据增强技术[29]

a-训练集准确率;b-测试集准确率

图2 三个模型的训练集和测试集的准确率
Fig.2 Accuracy rates of the training and testing sets for the three models

为了提高建模的准确率,本研究引入Bayes来优化BiGRU。训练集准确率达到了100%,测试集准确率为85.29%,准确率相比于BiGRU有所提升,Kappa系数为0.67,说明Bayes能一定程度优化BiGRU,但当数据集较大时,模型反应时间过长,在CPU主频2.0 GHz、16 G内存的PC机上运行计算为908.92 s,这是因为贝叶斯优化通过概率代理模型和采集函数,高效搜索超参数空间,显著缩短调参时间,通过优化BiGRU的隐含层节点数、学习率等参数,模型表现出更高的准确性,在复数据中,贝叶斯优化能帮助BiGRU更好地捕捉长期依赖关系,减少过拟合风险[30-31]

为进一步提高模型效率,本研究引入Transformer。结果所示,训练集准确率为100%,测试准确率为94.12%,Kappa系数为0.83,在相同设备条件下反应时间为492.893 7 s,准确率和效率相比于Bayes-BiGRU大大提高。图3是Bayes-BiGRU和Bayes-Transformer-BiGRU的PAM图,可以看出,Bayes-Transformer-BiGRU的PAM面积大于Bayes-BiGRU,具体参数结果如表2所示。光谱数据的波长间存在关键吸收峰组合,引入Transformer的自注意力机制能建模全局关系,识别不同波段的协同作用,同时Transformer可并行处理光谱序列,加速训练,BiGRU擅长捕捉光谱数据的局部模式,弥补Transformer对局部细节可能忽略的不足;Bayes减小了模型的过拟合风险,因此Bayes-Transformer-BiGRU三者结合可以有效提高模型分类的准确率和分类效率。

表2 PAM图参数
Table 2 PAM graph parameters

Bayes-BiGRUBayes-Transformer-BiGRU测试集准确率/%85.2994.12PAM0.690.87SE0.81SP0.920.92AUC0.931Kappa系数0.670.83F-measure0.80.91运行时间/s908.92492.89

图3 多边形面积度量图
Fig.3 Polygon area metric diagram

2.5 模型讨论

在同类研究中,SONG等[32]将BiGRU应用于滑坡坝稳定性判别,取得了82.46%的准确率;PANERU等[33]利用Transformer识别用户左右手自主运动产生的脑电信号,开发了一套基于脑电图的虚拟键盘系统,为运动功能障碍人士提供了一种新的人机交互方式,其准确率在85%~88%;本文提出的Bayes-Transformer-BiGRU模型在样本分类中达到了94.12%的准确率,表现出良好的性能。然而,该算法仍属较新的方法,在食品领域的研究应用相对有限,其稳定性和实用性尚需在更多实际场景中进一步验证。

3 结论

本文将UV-NIR结合化学计量学工具对CHQL、OBQL和NQBB进行分类。通过对3类白酒的UV-NIR进行4种预处理方法的比较,确定二阶导数预处理方法为本文的预处理方法;通过对UV-NIR-2nd建立分类模型,比较BiGRU、Bayes-BiGRU和Bayes-Transformer-BiGRU模型的分类效果,发现Bayes优化后的BiGRU模型的分类准确率大大提高,说明Bayes优化了BiGRU的参数,减小了模型的过拟合风险;引入了Transformer的模型的分类准确率也有所提高,模型效率相比于Bayes-BiGRU有所提高,说明Transformer的自注意力机制压缩冗余信息,通过注意力权重筛选出关键波长,减少特征数量,从而提高反应效率,综上,UV-NIR融合光谱结合Bayes-Transformer-BiGRU能够更好地实现CHQL快速、无损、精准鉴别。

参考文献

[1] CHEN L H, CUI C F, WANG S X, et al.Insight into the dynamic changes and relationship between organic acids, amino acids and microbial communities during the fermentation of highland barley wine[J].Journal of Food Composition and Analysis, 2025, 140:107260.

[2] 于翔, 姜珊, 贾儒林, 等.基于UV结合机器学习对白城地区制假白酒案中原料酒的溯源研究[J].山东化工, 2025, 54(9):203-206.YU X, JIANG S, JIA R L, et al.Study on the traceability of raw liquor in the case of counterfeit liquor in Baicheng area based on UV combined with machine learning[J].Shandong Chemical Industry, 2025, 54(9):203-206.

[3] HE M, CHEN X L, ZHANG J, et al.Identification of liquors from the same brand based on ultraviolet, near-infrared and fluorescence spectroscopy combined with chemometrics[J].Food Chemistry, 2023, 400:134064.

[4] WANG X, ESQUERRE C, DOWNEY G, et al.Development of chemometric models using Vis-NIR and Raman spectral data fusion for assessment of infant formula storage temperature and time[J].Innovative Food Science &Emerging Technologies, 2021, 67:102551.

[5] 王微娜, 张炉, 尹华全, 等.基于融合光谱的菜籽油氧化稳定性快速评价[J].中国农业大学学报, 2025, 30(4):81-95.WANG W N, ZHANG L, YIN H Q, et al.Rapid evaluation of the oxidative stability of rapeseed oil based on fusion spectroscopy[J].Journal of China Agricultural University, 2025, 30(4):81-95.

[6] 赵玉霞, 张明锦, 王茹, 等.反向传播神经网络结合紫外-近红外融合光谱对“互助”青稞酒的判别研究[J].光谱学与光谱分析, 2025, 45(5):1290-1299.ZHAO Y X, ZHANG M J, WANG R, et al.Discriminative study on Huzhu Qingke liquor by back propagation neural network combined with ultraviolet-near infrared fusion spectroscopy[J].Spectroscopy and Spectral Analysis, 2025, 45(5):1290-1299.

[7] YUAN M J, DING L Z, BAI R B, et al.Feature-level hyperspectral data fusion with CNN modeling for non-destructive authentication of “Weilian” from different origins[J].Microchemical Journal, 2025, 215:114201.

[8] VAN ZYL D J, DUNAISKI M, TEGALLY H, et al.Alignment-free viral sequence classification at scale[J].BMC Genomics, 2025, 26(1):389.

[9] KHODAEI A, ESKANDARI S, SHARIFI H, et al.PRCFX-DT:A new graph-based approach for feature selection and classification of genomic sequences[J].BMC Bioinformatics, 2025, 26(1):159.

[10] 王玉堂, 何为, 高迩倪, 等.基于上下文分析的长期序列依赖性模型优化方法及系统:中国, CN118468936A[P].2024-08-09.HE Y T, HE W, GAO E N, et al.A method and system for optimizing long-term sequence dependency models based on context analysis:China, CN118468936A[P].2024-08-09.

[11] CHEN J Y, MA X H, LI S K, et al.A hybrid parallel computing architecture based on CNN and transformer for music genre classification[J].Electronics, 2024, 13(16):3313.

[12] YANG Y J, SUN L M, ZHANG N T.An MTBWO algorithm based on BiGRU model[J].Electronics, 2024, 13(7):1195.

[13] 付锦程, 杨仕友.基于贝叶斯优化和特征融合混合模型的短期风电功率预测[J].计算机应用, 2026,46(2):652-658.FU J C, YANG S Y.Short-term wind power prediction using hybrid model based on Bayesian optimization and feature fusion[J].Journal of computer applications, 2026,46(2):652-658.

[14] ONG P, JIAN J B, YIN J H, et al.Characteristic wavelength optimization for partial least squares regression using improved flower pollination algorithm[J].Spectrochimica Acta Part A:Molecular and Biomolecular Spectroscopy, 2023, 302:123095.

[15] KHATUN M S, AL MASUM A, ISLAM M H, et al.Short wave-near infrared spectroscopy for predicting soluble solid content in intact mango with variable selection algorithms and chemometric model[J].Journal of Food Composition and Analysis, 2024, 136:106745.

[16] ZHAO J W, CHEN Q S, HUANG X Y, et al.Qualitative identification of tea categories by near infrared spectroscopy and support vector machine[J].Journal of Pharmaceutical and Biomedical Analysis, 2006, 41(4):1198-1204.

[17] VASWANI A, SHAZEER N M, PARMAR N, et al.Attention is all you need[C].Proceedings of the 31 st Conference on Neural Information Processing Systems.USA, 2017.

[18] LI X, ZHANG F J, HAN L G.Signal reconstruction of arbitrarily lack of frequency bands from seismic wavefields based on deep learning[J].Applied Sciences, 2024, 14(11):4922.

[19] XIANG X Z, CHEN Y M, ABDEIN R, et al.Deep scene flow learning from point cloud with Transformer[J].Neurocomputing, 2025, 641:130350.

[20] SHAHRIARI B, SWERSKY K, WANG Z Y, et al.Taking the human out of the loop:A review of Bayesian optimization[J].Proceedings of the IEEE, 2016, 104(1):148-175.

[21] GUPTA V K, LALWANI S K, BHATI G S, et al.Bayesian optimization based neural architecture search for classification of gases/odors mixtures[J].IEEE Sensors Journal, 2024, 24(5):7119-7125.

[22] AYDEMIR O.A new performance evaluation metric for classifiers:Polygon area metric[J].Journal of Classification, 2021, 38(1):16-26.

[23] 沈沐傲, 陈露, 张鸣原, 等.基于中红外光谱技术的岩石分类研究[J].分析测试学报, 2025, 44(7):1273-1281.SHEN M A, CHEN L, ZHANG M Y, et al.The study on rock classification based on mid-infrared spectroscopy[J].Journal of Instrumental Analysis, 2025, 44(7):1273-1281.

[24] LI S, SHEN X R, SHEN X, et al.Improving the accuracy of soil classification by using vis-NIR, MIR, and their spectra fusion[J].Remote Sensing, 2025, 17(9):1524.

[25] 苏媛媛, 姜雪, 仓义鹏, 等.紫外-可见光谱传感对高温大曲白酒真实性的准确鉴别[J].化学试剂, 2023, 45(10):8-13.SU Y Y, JIANG X, CANG Y P, et al.Accurate identification of high-temperature daqu liquor by UV-vis sensor[J].Chemical Reagents, 2023, 45(10):8-13.

[26] 周涛. 基于近红外光谱法的白酒品质检测分析[D].晋中:山西农业大学, 2023.ZHOU T.Detection and analysis of baijiu quality based on near infrared spectroscopy[D].Jinzhong:Shanxi Agricultural University, 2023.

[27] LIU H B, ZHANG F L, TAN Y, et al.Multi-scale quaternion CNN and BiGRU with cross self-attention feature fusion for fault diagnosis of bearing[J].Measurement Science and Technology, 2024, 35(8):086138.

[28] 张栩, 颜伟, 李辉, 等.基于QR-BiGRU神经网络与区间抗差增广状态估计的线路参数区间追踪估计[J].电工技术学报, 2024, 39(23):7406-7417;7553.ZHANG X, YAN W, LI H, et al.Interval estimation and tracking method for transmission line parameters based on QR-BiGRU neural network and interval robust augmented state estimation[J].Transactions of China Electrotechnical Society, 2024, 39(23):7406-7417;7553.

[29] 李萌, 宗学军, 连莲, 等.基于CNN-ABC-BiGRU的火电厂数据分析与应用研究[J].电子设计工程, 2023, 31(22):11-15;20.LI M, ZONG X J, LIAN L, et al.Data analysis and applied research of thermal power plant based on CNN-ABC-BiGRU[J].Electronic Design Engineering, 2023, 31(22):11-15;20.

[30] 邹智, 吴铁洲, 张晓星, 等.基于贝叶斯优化CNN-BiGRU混合神经网络的短期负荷预测[J].高电压技术, 2022, 48(10):3935-3945.ZOU Z, WU T Z, ZHANG X X, et al.Short-term load forecast based on Bayesian optimized CNN-BiGRU hybrid neural networks[J].High Voltage Engineering, 2022, 48(10):3935-3945.

[31] 蒲嘉鹏, 方勇, 毕浪, 等.一种基于Bayes-Bi-GRU模型的隧道施工期围岩变形预测方法:中国, CN118536660A[P].2024-08-23.PU J P, FANG Y, BI L, et al.A tunnel surrounding rock deformation prediction method during construction period based on the Bayes-Bi-GRU model:China, CN118536660A[P].2024-08-23.

[32] SONG C G.A novel stability discriminant model of landslide dams based on CNN-BiGRU optimized by attention mechanism[J].Landslides, 2025, 22(10):3509-3523.

[33] PANERU B, THAPA B, PANERU B, et al.EEG right &left voluntary hand movement-based virtual brain-computer interfacing keyboard using hybrid deep learning approach[J].Advanced Engineering Informatics, 2025, 65:103304.

Rapid identification of Qingke liquor based on Bayesian algorithm-optimized transformer combined with bidirectional gated recurrent unit

XU Shiyong1, ZHANG Shizhi2, SHI Ting1, ZHANG Mingjin1*

1(College of Chemistry and Chemical Engineering, Qinghai Normal University, Xining 810016, China) 2(School of Chemistry and Materials Science, Qinghai Minzu University, Xining 810007, China)

ABSTRACT In response to the phenomenon of adulteration in the market of liquor, the search for rapid, non-destructive and scientific methods for identifying the quality of liquor has become one of the research hotspots in the relevant fields.This study aims to quickly identify the “Chinese Huzhu Qingke Liquor” (CHQL), a product protected by geographical indication in our country.Three types of liquor samples, namely CHQL, other brand Qingke Liquor (OBQL), and non-Qingke based Baijiu (NQBB), were collected.The spectral characteristics of these three types of liquor were studied using UV-near-infrared fusion spectroscopy.An attempt was made to establish a rapid identification method for CHQL.Firstly, the UV spectra and near-infrared spectra of the samples were collected, and the spectra were fused at the data level.Then, four preprocessing methods (standard normal transformation, Savitzky-Golay smoothing, first-order derivative, and second-order derivative) and three classification models (BiGRU, Bayes-BiGRU, Bayes-Transformer-BiGRU) were respectively examined for the identification effect of CHQL.The results show that the data obtained after second-order derivative preprocessing combined with Bayes-Transformer-BiGRU has the best classification recognition effect, with classification accuracy of 94.12%, response time of 492.89 seconds, and PAM of 0.87.This indicates that Bayes-Transformer-BiGRU combined with UV-NIR fusion spectroscopy can quickly, non-destructively and accurately distinguish CHQL.

Key words Chinese Huzhu Qingke liquor;bidirectional gated recurrent unit(BiGRU);Transformer;bayesian optimization

DOI:10.13995/j.cnki.11-1802/ts.044417

引用格式:许诗咏,张世芝,石婷,等.基于贝叶斯算法优化Transformer结合双向门控循环单元对青稞酒的快速识别[J].食品与发酵工业,2026,52(11):339-345.XU Shiyong, ZHANG Shizhi, SHI Ting, et al.Rapid identification of Qingke liquor based on Bayesian algorithm-optimized transformer combined with bidirectional gated recurrent unit[J].Food and Fermentation Industries,2026,52(11):339-345.

第一作者:硕士研究生(张明锦教授为通信作者,E-mail:zhangmingjin@qhnu.edu.cn)

基金项目:国家自然科学基金项目(22363010);青海省自然科学资金项目(2022-ZJ-769)

收稿日期:2025-09-03,改回日期:2025-10-28