基于滤波器的动植物油光谱信号预处理方法比较及识别分类

邱薇纶1*,丁圣2

1(湖南警察学院 刑事科学技术系,湖南 长沙,410138)2(湖南省长沙市公安局天心分局网安大队,湖南 长沙,410004)

摘 要 为实现对动植物油的快速无损检验,探究滤波器在提高光谱分析模型区分能力方面的可行性,该研究借助衰减全反射-表面增强红外吸收光谱技术,采集了动物油(159份)和植物油(188份)共计347份样本的光谱信息数据,构建了Fisher判别分析、支持向量机和决策树3种分类模型。比较了希尔伯特变换、有限长单位脉冲响应滤波器、无限长冲激响应滤波器、快速傅里叶变换和小波变换5种滤波器对3种分类模型精度的影响,同时考察了滤波器窗函数(矩形窗、汉宁窗、海明窗、布莱克曼窗)、小波基函数(Morlet、Dgauss、Mexhat、Haar、Daubechies、Biorthogonal)、滤波方式(低通、高通、带通、带阻)在动植物油样本区分效果方面的差异性。结果发现,滤波器能显著提升光谱分析模型的准确性,低通和带阻滤波方式,矩形窗和布莱克曼窗函数能有效提升模型对样本的区分能力,相较于其他2种算法,支持向量机对各样本的识别区分能力最好。基于FIR低通/带阻滤波器处理后构建的SVM模型(RBF核函数)可作为动植物油样本识别的最佳模型,其对347份样本实现了100%的“类别-品牌”的两级准确区分。综上,滤波器可有效提升光谱分析模型的准确性,结合ATR-SEIRAS光谱信息数据,可准确区分不同的动植物油样本,这为包括动植物油在内的诸多样本的快速无损分析提供了一定参考,为滤波器在提升光谱分析模型方面的应用提供了一定借鉴。

关键词 动植物油;衰减全反射-表面增强红外吸收光谱;滤波器;Fisher判别分析;支持向量机;决策树

动植物油的快速无损检验是当前法庭科学领域研究的重点之一,主要是检测其脂肪酸相对百分含量及脂肪酸之间的相互关系,从而实现识别和区分目的。现有研究报道中的相关技术有色谱法[1]、质谱法[2]、同位素法[3]、光谱法[4]。值得注意的是,色谱和质谱的方法属于有损分析,不利于样品二次复检,其检验时间相对较长,同时需要对样品开展相对复杂的前处理工作,这不利于处理大批量样本,而且相关仪器精密昂贵且需要专业人员操作和定期维护。相较而言,光谱分析不需要复杂的前处理操作,具有无损检材、操作简单、样品用量少等优点,这满足了快速无损检验分析的需求与目的。

衰减全反射-表面增强红外吸收光谱技术(attenuated total reflection-surface enhanced infrared absorption spectroscopy,ATR-SEIRAS)作为一种高灵敏度技术,简化了对难检测物质的检验,可使物质成分结构分析更加便捷[5]。它在电化学[6]、环境分析[7]以及生物化学[8]领域均有相应报道。在食品快速检测领域,一些文献报道了中红外光谱和近红外光谱在食品鉴伪、品质研究、有害物检测、成分分析方面的应用[9],相比较这些常规红外光谱技术,ATR-SEIRAS提供以金、银等金属纳米材料为增强基底,极大程度上提高了检测灵敏度,从而获取更为丰富的样本信息数据。

在实际分析中,由于实验环境温度、湿度,光源条件和仪器自身等影响,未经预处理的光谱往往存在基线漂移、检测器噪声、背景漂移、高频噪音和散射等干扰情况,这会影响分析的准确性和时效性。因此十分有必要通过预处理来削弱、消除这些干扰信息,提取有效光谱信息,建立稳健、准确的鉴别模型是应用领域所关切的问题之一[10]。滤波器是一种经典的预处理方法,它可以有效剔除实际信号中的噪声和冗余信息,有少部分报道表明原始数据通过滤波器处理后能显著提高分析模型的准确性[11],它在信号分析领域已有应用[12],在光谱分析方面应用报道相对较少[13],且没有讨论比较不同参数譬如窗函数、滤波方式对分析模型准确性的影响情况。

鉴于此,研究借助衰减全反射-表面增强红外吸收光谱分析技术,采集了动植物油共计347份样本的光谱信息数据,基于构建的Fisher判别分析、支持向量机和决策树3种识别分类模型,比较和讨论了希尔伯特变换(hilbert transform,HT)、有限长单位脉冲响应滤波器(finite impulse response,FIR)、无限长冲激响应滤波器(infinite impulse response,IIR)、快速傅里叶变换(fast Fourier transform,FFT)和小波变换(wavelet transform,WT)5种滤波器算法在提升分析模型精度方面的可行性,同时考察了不同滤波器的窗函数、滤波方式、小波基函数在光谱信号预处理过程中的差异,从而为动植物油快速无损检验提供一定的参考,为滤波器在光谱信号处理中的实际应用提供一定的借鉴。

1 材料与方法

1.1 实验样本

结合实际案件情况,从市面上收集了常见的动物油(159份)与植物油(188份)共计347份样本。其中猪油有璞匠、金锣和金恩凡提3个品牌,橄榄油有西奥图、欧丽兰卡和凯特兰3个品牌,花生油有胡姬花、鲁花、金龙鱼和以岭4个品牌,将各样本分别装于0.5 mL的离心管中,并逐一做好标记。各样本基本信息如表1所示。

表1 347份样本的基本信息
Table 1 The details of 347 samples

油样类别品牌数量璞匠 10猪油 金锣 13金恩凡提17动物油牛油 肖老五 22红鑫源 18羊油 大牧纯 40鸡油 金锣 39西奥图 9橄榄油 欧丽兰卡11凯特兰 10花椒油 太和 20胡姬花 8花生油 鲁花 9植物油 金龙鱼 11以岭 12葵花籽油多力 20山茶油 秋满鲜 20藤椒油 金龙鱼 18亚麻籽油金士 20椰子油 娜古香 20

1.2 实验设备与参数

采用Nicolet is10型傅里叶变换红外光谱仪(Thermo Scientific公司),配有衰减全反射附件(Thermo Scientific公司)开展各样本光谱数据采集工作,纳米铟锡金属氧化物基底(北京北科新材料科技有限公司),设备基本参数如表2所示。

表2 实验设备与参数
Table 2 Experimental equipment and parameters

设备参数状态扫描次数64次FTIR标准线性度(ASTM E1421)<0.1% T动态调整130 000 次/sNicolet is10傅里叶变换红外光谱仪信噪比50 000∶1 光谱分辨率 1 cm-1 测量范围 4 500~650 cm-1峰-峰噪音值(DTGS检测器,KBr窗片)<1.24×10-5AU

1.3 数据采集及预处理

调试好设备后采集各样本的光谱信息数据,而后开展预处理工作。选择并比较了HT、FIRIIR、FFT、WT共计5种预处理算法在识别和区分动植物油样本时的差异。

1.4 建模原理

基于预处理后的光谱信息数据,研究选用Fisher判别分析(Fisher discriminant analysis,FDA)、支持向量机(support vector machine,SVM)和决策树(decision tree,DT)共计3种化学计量学算法构建动植物油样本识别与分类模型,比较了不同预处理算法下各模型对样本的识别于区分能力差异。

FDA是一种较为经典的分类方法,其主要是建立合适的判别函数,将高维度的数据信息投影到低维度空间上,基于不同类的样本之间彼此分开、同类样本内部相互聚敛的需求,实现在低维空间上具有最佳的可分离性[14-15]。以二分类为例,其基本原理如下:假设数据集D={(x1,y1),(x2,y2),...,(xm,ym)},其中任意样本xi为n维向量,yi∈{0,1}。定义Nj(j=0,1)为第j类样本的个数,xj(j=0,1)为第j类样本的集合,而μj(j=0,1)为第j类样本的均值向量,定义∑j为第j类样本的协方差矩阵。则μj按公式(1)计算:

(1)

j按公式(2)计算:

(2)

判别函数按公式(3)计算:

f(x)=a0+a1x1+a2x2+a3x3+…+amxm

(3)

SVM是一个具有稀疏性和稳健性的分类器,它通过核函数将样本集向量映射到高维特征空间,在该空间中随机产生一个超平面并不断移动对样本集进行分类,直至不同类别的样本点正好位于该超平面的两侧[16]。从多个超平面中寻找到能使超平面两侧距离最大化则为最优决策超平面,能对分类问题提供良好的泛化能力[16]。因此,它具有结构风险最小化的理论,面对非线性数据集以及较高维度的数据集仍具有极强的鲁棒性[17]。其基本原理如下:

对于给定数据集:T={(x1,y1),(x2,y2),...,(xm,ym)},其中xi∈∈,yi∈{-1,1},1表示少数类,-1表示多数类,对于二分类问题,则有:

(4)

(5)

式中:K(xi,yi)为核函数;αi为拉格朗日系数;C为惩罚系数,求解上式中最优解则分类函数如公式(6)所示:

(6)

式中:为分类超平面的截距项[18]

DT是一种通过现有数据集训练形成决策规则并且可以进行预测或分类的树状算法,它先通过分析数据的特征值合理设定每个节点合适的分割值,再进行分层逐次的比较归类[19]。它包含根节点、内部结点和叶节点。根节点即原始数据集,内部节点为从根节点到叶节点的“路径”,叶节点为所属类别。

2 结果与分析

研究基于5种预处理算法,构建了FDA、SVM和DT共计3种分类模型,同时比较和讨论了不同预处理算法中不同窗函数、小波基函数等对模型分类能力的影响。其中FDA模型选择类内协方差矩阵;SVM模型选择惩罚因子选择0.1,核函数选择RBF核(Gamma值为0.1);DT模型选择CHAID生长算法。其中动植物油样本ATR-SEIRAS谱图如图1所示。

A-植物油;B-动物油
图1 动植物油样本ATR-SEIRAS谱图
Fig.1 The ATR-SEIRAS spectra of animal and vegetable oil samples

2.1 原始数据集模型

图2为基于原始数据集的3种模型对动植物油样本的识别分类结果。

图2 三种模型下各样本的识别分类结果
Fig.2 Recognition results of all samples based on three models

由图2可知,模型对各样本的区分能力有差异,对植物油样本的识别能力普遍高于动物油样本。相比较FDA模型,SVM对各样本的区分能力更强,其对植物油和动物油样本识别准确率分别为80.3%和64.8%。分析认为,在原理上,SVM是由少数支持向量决定了最终结果,计算的复杂性取决于支持向量而不是样本,这在极大程度上剔除了无关变量对结果的负面影响,在某种意义上避免了“数据维数灾难”。加之SVM自身算法相对简单,而且具有较好的“鲁棒”性,这保证了其在识别不同样本时所具备的优越性。FDA是采用降维方式来实现各样本在低维空间可分,这一过程中可能会损失许多的原始信息,这容易造成模型精度上的不足。DT计算简单,运行速度比较快,相对短的时间内能够对大型数据源做出可行且效果良好的结果。它可以灵活处理特征间的交互关系,不用考虑数据异常值或者是否线性。但是当样本类别太多时,它容易在分类时出现错误,导致误判率较高。3种模型总体识别准确率从大到小分别为73.2%(SVM)>65.4%(DT)>62%(FDA)。其对各样本的区分能力有一定不足,基于此,研究比较并讨论不同预处理方法在提升动植物油样本模型识别能力方面的可行性。

2.2 HT预处理后的模型

HT在信号处理方面有诸多优良性,一般而言,时域信号是复数域上信号在实数域的投影,通过希尔伯特变换,能够还原整个复数域上的信号。在光谱信号处理中,HT可以将一维光谱信号转变为信息更为丰富的二维信号,挖掘出原始数据集的潜在信息价值。图3为经过HT处理后各样本在3种模型下的分类结果。

图3 基于希尔伯特变换处理的各样本识别分类结果
Fig.3 Recognition results of all samples based on Hilbert transformation

由图3可知,经过HT处理后分类精度有了大幅度提升,3种模型对各样本的总体分类准确率均在85%以上。相比较植物油样本,各模型对动物油样本的区分能力更强,其分类准确率分别为:95.6%(FDA)、96.8%(SVM)、89.3%(DT)。基于SVM算法构建的模型对动植物油样本的区分能力最强(均在95 %以上),其次为FDA模型(均在92.5%以上)、DT模型(均在83%以上)。经HT处理后,具有丰富信息的二维光谱信号包含了更多的动植物油样本之间的差异性,这保证了3个模型在区分不同类样本时的有效性。HT在提升模型分类精度方面具有积极效应,它可作为一种有效的光谱信号预处理方法。

2.3 FIR预处理后的模型

FIR算法简单,处理速度快,易于实现,滤波效果较好[20],它具有可靠性好、精度高、灵活性大等优点,它可以在保证任意幅频特性的同时具有严格的线性相频特性。按照不同的信号频段,它可分为低通、高通、带通和带阻4种处理方式。研究借助FIR滤波器开展预处理工作,比较了低通等4种滤波方式对模型区分能力的影响。图4为经过FIR预处理后的各样本识别分类结果。

A-植物油;B-动物油
图4 基于FIR预处理的各样本识别分类结果
Fig.4 Recognition results of all samples based on FIR

由图4可知,不同滤波器在一定程度上影响了不同模型对各样本的识别情况。在FDA模型中,4种滤波处理后对各样本总体识别准确率从大到小依次为:低通=带阻(100%)>高通(51.3%)>带通(49.9%),经滤波处理后,植物油样本的分类准确率略高于动物油样本。在SVM模型中,经低通和带阻滤波器处理后,各样本实现了100%的准确区分,其次分别为带通(73.8%)和高通(69.2%),经滤波处理后,模型对植物油样本的识别能力优于动物油样本。在DT模型中,各样本分别实现了96%(低通)、96%(带阻)、73.5%(带通)和70.9%(高通)地准确区分。

总体而言,低通和带阻滤波处理后,模型的精度相对较高。分析认为,红外光属于长波,其光谱信号属于低频信号,而低通滤波允许低频信号通过同时抑制高频信号、干扰信号和噪声,因此经过低通滤波处理后,原始信号中的干扰和噪声被消除了,这保证了后期模型对各样本识别能力的优越性。而高通滤波只允许高频信号通过同时抑制了低频信号,这会导致光谱信号中很多特征信息被消除,从而削弱了模型对样本的识别能力。带通滤波器是低通与高通的串联,经处理信号后,在高通模块抑制了低频率的红外信号,造成样本原始信息损失太多,导致模型分类效果较差。带阻滤波器则是低通与高通的并联,在高通方向虽然抑制了低频信号,但在低通方向保留了原始红外光谱信号,同时二者均抑制了噪声和干扰信号,这保证了模型在区分各样本时的准确性。

2.4 IIR预处理后的模型

IIR滤波器又称无限长冲激响应滤波器,它的幅频特性精度高,相位非线性,可应用于对相位信息不敏感的音频信号。它的首要优点是可在相同的阶数时会取得更好的滤波效果。按照不同的信号频段,它可分为低通、高通、带通和带阻4种处理方式。研究借助IIR滤波器开展预处理工作,比较了低通等4种滤波方式对模型区分能力的影响。图5为经过FIR预处理后的各样本识别分类结果。

A-植物油;B-动物油
图5 基于IIR预处理的各样本识别分类结果
Fig.5 Recognition results of all samples based on IIR

由图5可知,各样本经4种滤波方式处理后,在3种分类模型下的总体分类准确率从高到低依次为:低通>带阻>高通>带通。FDA模型对动植物油样本的区分效果相对较好,相比较植物油,动物油样本的分类准确率相对较高一点。相比较FIR,经IIR预处理后,各样本在3种模型下的区分效果相对略差一些,经带阻滤波后,构建的SVM模型的总体分类准确率最高(99.4%)。由于极点会杂散到稳定区域之外,IIR在处理信号时可能不稳定,加之它无法控制滤波器的相位特性,处理后构建的模型在稳定性方面相对不如FIR。

2.5 FFT预处理后的模型

FFT是一种对信号进行频谱分析的方法,它通过对信号的频谱分析可以定位并过滤其他无关频率的噪声,从而实现去除噪声的目的[21-22]。它运算速度快,能使模型在计算离散傅里叶变换所需要的乘法次数大大减少,特别是被处理的样本维度及样本数越多,FFT算法计算量的节省就越显著。在信号频谱分析的过程中通常存在着频谱泄露现象,频谱泄露将会降低谱分析的精度[22]。因此需要借助窗函数来抑制其泄露情况。经典的窗函数有矩形窗、汉宁窗、海明窗、布莱克曼窗等。表3列举了4个窗函数的比较参数。

表3 四个窗函数的比较参数
Table 3 Comparison of parameters about 4 window functions

窗函数表达式(n=1,2,…,N)旁瓣峰值主瓣宽度幅值恢复系数矩形窗W(n)=1-13 dB4 p/N1汉宁窗W(n)=0.5-0.5cos(2πn/N)-31 dB8 p/N2海明窗W(n)=0.54-0.46cos(2πn/N)-41 dB8 p/N1.852布莱克曼窗W(n)=0.42-0.5cos2π (n-1)(N-1)+0.008cos(4π (n-1)/(N-1))-57 dB12 p/N2.381

研究比较了样本光谱信号经过4个窗函数滤波处理后对3个模型识别分类情况的影响,其结果见图6。由图6可知,FFT滤波处理后不同模型对各样本的识别能力均有不同。SVM模型对各样本的区分效果最好,总体分类准确率均在90 %以上。其次为DT模型(60%以上)、FDA模型(50%以上)。在SVM模型下,不同窗函数处理后,不同样本的识别情况均有一定差异。植物油样本的分类准确率从大到小依次为:布莱克曼窗(97.8%)>矩形窗(94.7%)>汉宁窗(93.6%)>海明窗(91.6%);动物油样本的分类准确率依次为:矩形窗(97.8%)>布莱克曼窗(94.7%)>海明窗(93.6%)>汉宁窗(91.6%)。

A-植物油;B-动物油
图6 基于FFT预处理的各样本识别分类结果
Fig.6 Recognition results of all samples based on FFT

总体来看,矩形窗和布莱克曼窗函数在处理光谱信号中起到了一定的积极效应。一般而言窗函数的主瓣越窄越好,边瓣越小并衰减得越快越好。矩形窗属于时间变量的零次幂窗,它的主瓣相对较窄,频率识别精度高,而布莱克曼窗的旁瓣相对较小,幅值识别精度高,这对于光谱信号来说,有效抑制了信号截断产生的频谱能量泄漏所带来的负面影响,在一定程度上有效提高谱峰的分辨能力,剔除噪声所带来的负面影响。海明窗与汉宁窗都是余弦窗,只是加权系数不同。海明窗加权的系数能使旁瓣达到更小(其峰值为-41 dB),但是其旁瓣衰减不及汉宁窗迅速,而汉宁窗的主瓣加宽,相当于分析带宽加宽,这在一定程度上会导致谱峰的分辨力下降。

2.6 WT预处理后的模型

WT具有快速去除单条谱线的荧光、噪声等背景信号的特点[23]。它可以在不丢失原信号重要信息成分前提下,将原光谱信号边缘部分进行滤化处理,从而消除噪音信息,重构出更加清晰的光谱特征图形[24]。研究选择并比较了连续小波变换(continuous wavelet transform,CWT)和离散小波变换(discrete wavelet transform,DWT)对模型区分各样本的影响情况,同时考察了不同小波基函数对模型区分效果的影响。表4为不同小波基函数滤波后3种模型对各样本的分类情况。

表4 不同小波基函数下各模型对样本的分类情况
Table 4 Recognition results of all samples based on different wavelet basis functions

小波变换小波基函数植物油分类准确率/%动物油分类准确率/%FDASVMDTFDASVMDTMorlet56.494.671.847.250.376.1连续小波变换Dgauss48.461.562.845.383.887.4Mexhat54.890.461.247.825.285.5Haar74.465.685.673.555.448.2离散小波变换Daubechies63.366.754.462.751.875.9Biorthogonal74.465.685.673.555.448.2

由表4可知,经不同小波基函数处理后,各样本的分类情况均有一定差异。在植物油样本中,经连续小波变换处理后SVM模型的分类准确率较高,其次为DT模型、FDA模型。在SVM模型中,借助Morlet小波基函数对光谱信号进行滤波后,模型对植物油样本的区分度最好(94.6%)。在动物油样本中,经连续小波变换处理后DT模型的分类准确率较高,借助Dgauss小波基函数对光谱信号进行滤波后,模型对动物油样本的区分度最好(87.4%)。经Morlet小波基函数处理后,SVM模型对各样本的总体分类准确率最高(74.4%)。经小波变换处理后,各模型对不同样本的识别分类能力不如于其他几种预处理方法,分析认为,小波变换的优势主要针对一维数据,即小波是以“点”为单位捕捉信号的特征,然而高维空间中最为普遍的还是具有“线”或者“面”的特征。研究采集的光谱信号为高维数据,利用小波变换进行滤波处理时,它在一维时所具有的优异特性并不能简单推广到二维或更高维[25]

2.7 动植物油最佳识别模型

综上所述,基于FIR低通/带阻滤波器处理后构建的SVM模型(默认RBF核函数)对动植物油样本实现了100%的准确率识别和分类。它可作为347份动植物油样本的最佳识别模型。鉴于猪油、橄榄油和花生油均有多个品牌,研究借助最佳识别模型开展不同品牌样本的分类工作。在构建SVM模型时,其中惩罚因子选择0.1,核函数选择RBF核(Gamma值为0.1),得到了各品牌的分类结果(表5)。

表5 不同品牌样本的分类结果
Table 5 Recognition results of different brands of samples

类别品牌分类准确率/%璞匠 100猪油 金锣 100金恩凡提100西奥图 100橄榄油欧丽兰卡100凯特兰 100胡姬花 100花生油鲁花 100金龙鱼 100以岭 100

由表5可知,各品牌样本实现了100%的准确分类,这表明借助红外光谱信息数据结合预处理以及模型构建开展对动植物油品牌的识别与分类是可行的,且研究结果较为理想。

3 结论

本研究借助衰减全反射-表面增强红外吸收光谱技术采集了动物油(159份)与植物油(188份)共计347份样本的ATR-SEIRAS光谱信息数据,比较和讨论了HT、FIR、IIR、FFT和WT5种滤波器算法在提升分析模型精度方面的可行性,同时考察了不同滤波器中其窗函数、滤波方式、小波基函数在光谱信号预处理过程中的差异,最终选择基于FIR低通/带阻滤波器处理后构建的SVM模型(默认RBF核函数)作为动植物油样本识别的最佳模型,实现了347份样本100%的准确区分。此外,基于最佳模型开展了对猪油等三类共计10个不同品牌样本的分类工作,也均实现了100%的准确区分。滤波器可有效提升光谱分析模型的准确性,结合ATR-SEIRAS光谱信息数据,可准确区分不同的动植物油样本。

滤波器在处理预处理样本光谱信息数据时产生的效果不一样,有的滤波器会显著提升分类模型的识别精度,如HT、低通/带阻FIR滤波器,也有滤波器会降低模型的区分能力,如高通/带通IIR。同一种滤波器处理后不同模型的区分能力也不一样,相对来看SVM模型的鲁棒性和精度相对高于FDA。分析认为这除了样本数据自身的特性(如红外光属于低频率信号),还与滤波器自身参数如窗函数、小波基函数、滤波方式等有关,也与所选择的分类模型有关。本文验证了滤波器在提升分类模型准确性方面的可行性与应用价值,这对包括动植物油等在内的其他食品类样本的研究有一定应用价值,今后将进一步深入系统性探究不同滤波器在识别不同样本时的差异性,同时采集各样本的其他光谱源数据来构建更为丰富的动植物油识别分类模型,从而提供更为详实的应用依据参考。

参考文献

[1] 张方圆, 吴凌涛, 林晨, 等.气相色谱结合化学计量学用于6种食用植物油的分类[J].分析试验室, 2016, 35(11):1 254-1 258.

ZHANG F Y, WU L T, LIN C, et al.Classification of 6 edible vegetable oils by gas chromatography combined with chemometrics[J].Chinese Journal of Analysis Laboratory, 2016, 35(11):1 254-1 258.

[2] HEIDARI M, TALEBPOUR Z, ABDOLLAHPOUR Z, et al.Discrimination between vegetable oil and animal fat by a metabolomics approach using gas chromatography-mass spectrometry combined with chemometrics[J].Journal of Food Science and Technology, 2020, 57(9):3 415-3 425.

[3] 郭莲仙, 梁福睿, 赵祖国, 等.基于稳定碳同位素技术的痕量动物油和植物油的区分检验研究[J].化学研究与应用, 2014, 26(8):1 232-1 236.

GUO L X, LIANG F R, ZHAO Z G, et al.Discrimination between the oils from animals and vegetables by stable carbon isotope analysis[J].Chemical Research and Application, 2014, 26(8):1 232-1 236.

[4] 涂斌, 陈志, 彭博, 等.基于多源光谱特征融合技术的花生油掺伪检测[J].食品与发酵工业, 2016, 42(4):169-173.

TU B, CHEN Z, PENG B, et al.Research on detection method of peanut oil adulteration based on data fusion technology of multi-source spectral characteristics[J].Food and Fermentation Industries, 2016, 42(4):169-173.

[5] 武烈, 孙建龙, 姜秀娥.表面增强红外吸收光谱——表面敏感的原位免标记光谱电化学技术[J].电化学, 2019, 25(2):202-222.

WU L, SUN J L, JIANG X E.Surface-enhanced infrared absorption spectroscopy-surface sensitive in situ label-free spectroelectrochemistry[J]. Journal of Electrochemistry, 2019, 25(2):202-222.

[6] CHANG R L J, YANG J.Para-Mercaptobenzoic acid-modified silver nanoparticles as sensing media for the detection of ammonia in air based on infrared surface enhancement effect[J].The Analyst, 2011, 136(14):2 988-2 995.

[7] SATO Y, NODA H, MIZUTANI F, et al.In situ surface-enhanced infrared study of hydrogen bond pairing of complementary nucleic acid bases at the electrochemical interface[J].Analytical Chemistry, 2004, 76(18):5 564-5 569.

[8] QI W L, TIAN Y L, LU D L, et al.Research progress of applying infrared spectroscopy technology for detection of toxic and harmful substances in food[J].Foods(Basel,Switzerland), 2022, 11(7):930-942.

[9] GEORGOULI K, MARTINEZ DEL RINCON J, KOIDIS A.Continuous statistical modelling for rapid detection of adulteration of extra virgin olive oil using mid infrared and Raman spectroscopic data[J].Food Chemistry, 2017, 217:735-742.

[10] 张胜利, 李伟.基于窗函数与FFT算法的信号谐波分析[J].工业控制计算机, 2019, 32(5):35-36;38.

ZHANG S L, LI W.Signal harmonic analysis based on window functions and FFT algorithms[J].Industrial Control Computer, 2019, 32(5):35-36;38.

[11] 陈丛, 卢启鹏, 彭忠琦.基于NLMS自适应滤波的近红外光谱去噪处理方法研究[J].光学学报, 2012, 32(5):294-299.

CHEN C, LU Q P, PENG Z Q.Preprocessing methods of near-infrared spectrum based on NLMS adaptive filtering[J].Acta Optica Sinica, 2012, 32(5):294-299.

[12] MACK W, HABETS E A P.Deep filtering:Signal extraction and reconstruction using complex time-frequency filters[J].IEEE Signal Processing Letters, 2020, 27:61-65.

[13] 古锟山, 王继芬, 曾啸虎.基于滤波器-光谱数据降维的指甲地区识别[J].分析测试学报, 2022, 41(5):746-753;760.

GU K S, WANG J F, ZENG X H.Recognition of fingernail region based on filter-spectral feature extraction[J]. Journal of Instrumental Analysis, 2022,41(5):746-753;760.

[14] 何欣龙, 王继芬, 李青山, 等.基于多层感知器-Fisher判别分析的车用保险杠红外光谱鉴别[J].中国测试, 2019, 45(5):74-78;92.

HE X L, WANG J F, LI Q S, et al.Identification of vehicle bumper debris based on multi-layer perception-Fisher discriminant and infrared spectroscopy[J]. China Measurement &Test, 2019, 45(5):74-78;92.

[15] 杜靖媛, 葛宏立, 路伟, 等.基于Fisher判别的层次分类法的森林遥感影像分类[J].西南林业大学学报(自然科学), 2017, 37(4):175-182.

DU J Y, GE H L, LU W, et al.Classification of unbalanced data based on SVM mixed sampling[J]. Mathematics in Practice and Theory, 2017, 37(4):175-182.

[16] 杨红云, 黄琼, 孙爱珍, 等.基于卷积神经网络和支持向量机的水稻种子图像分类识别[J].中国粮油学报, 2021, 36(12):144-150.

YANG H Y, HUANG Q, SUN A Z, et al.Rice seed image classification and recognition based on convolutional neural network and support vector machine[J].Journal of the Chinese Cereals and Oils Society, 2021, 36(12):144-150.

[17] 黄勇, 郭剑辉.结合深度信念网络与支持向量机的地表分类算法[J].计算机与数字工程, 2022, 50(1):129-134.

HUANG Y, GUO J H.Surface classification algorithm based on depth belief network and support vector machine[J].Computer and Digital Engineering, 2022, 50(1):129-134.

[18] 姜飞, 杨明, 刘雨欣.基于支持向量机混合采样的不平衡数据分类方法[J].数学的实践与认识, 2021, 51(1):88-96.

JIANG F, YANG M, LIU Y X.ECG signals pre-processing based on FIR filtering and mathematical morphology[J]. China Medical Devices, 2021, 51(1):88-96.

[19] 孙亚楠, 李仙岳, 史海滨, 等.基于特征优选决策树模型的河套灌区土地利用分类[J].农业工程学报, 2021, 37(13):242-251.

SUN Y N, LI X Y, SHI H B, et al.Classification of land use in Hetao Irrigation District of Inner Mongolia using feature optimal decision trees[J].Transactions of the Chinese Society of Agricultural Engineering, 2021, 37(13):242-251.

[20] 郑秀玉, 卢瑞祥.基于FIR滤波和数学形态学的心电信号预处理算法[J].中国医疗设备, 2015, 30(9):20-23.

ZHENG X Y, LU R X.Research of high precision photoacoustic second harmonic detection technology based on FFT filter[J]. China Medical Equipment, 2015, 30(9):20-23.

[21] 万留杰, 甄超, 邱宗甲, 等.基于FFT滤波高精度光声二次谐波检测技术的研究[J].光谱学与光谱分析, 2020, 40(10):2 996-3 001.

WAN L J, ZHEN C, QIU Z J, et al.Confocal Raman image denoising method based on wavelet transform[J].Spectroscopy and Spectral Analysis, 2020, 40(10):2 996-3 001.

[22] 张胜利, 李伟.基于窗函数与FFT算法的信号谐波分析[J].工业控制计算机, 2019, 32(5):35-36;38.

ZHANG S L, LI W.Signal harmonic analysis based on window functions and FFT algorithms[J].Industrial Control Computer, 2019, 32(5):35-36;38.

[23] 方松琼, 邵荣君, 邱丽荣, 等.基于小波变换的共焦拉曼图像去噪方法[J].光学技术, 2019, 45(3):330-335.

FANG S Q, SHAO R J, QIU L R, et al.Denoising method of confocal raman image based on wavelet transform[J].Optical Technique, 2019, 45(3):330-335.

[24] 肖绪桐, 虞天遥.简述信号特征提取使用小波变换的优点[J].今日科苑, 2009(12):163-164.

XIAO X T, YU T Y.The advantages of wavelet transform in signal feature extraction are briefly described[J]. Modern Science, 2009(12):163-164.

[25] 田秀伟, 郑喜凤, 丁铁夫.基于小波-Contourlet变换的图像压缩算法[J].数据采集与处理, 2010, 25(4):437-441.

TIAN X W, ZHENG X F, DING T F, et al.Image compression algorithm using wavelet-based contourlet transform[J]. Journal of Data Acquisition and Processing, 2010, 25(4):437-441.

Comparison and recognition of spectral signal pretreatment methods for animal and vegetable oils based on filters

QIU Weilun1*,DING Sheng2

1(School of Forensic Science, Hunan Police Academy, Changsha 410138, China)2(Network Security Brigade, Tianxin Branch of Changsha Public Security Bureau, Changsha 410004, China)

ABSTRACT To achieve the rapid and non-destructive determination of animal and vegetable oils and explore the feasibility of the filter in improving the discrimination ability of the spectral analysis model, the study collected the spectral information data of 347 samples of animal oil (159 samples) and vegetable oil (188 samples) with the help of attenuated total reflection-surface-enhanced infrared absorption spectroscopy. Three discrimination models, including Fisher discriminant analysis, support vector machine, and decision tree were constructed. Among them, five filters (Hilbert transform, finite length unit impulse response filter, infinite length impulse response filter, fast Fourier transform, and wavelet transform) were considered to discuss the improvement of the model accuracy. Besides, the discrimination differences of filter window functions (rectangular window, Hanning window, Hamming window, and Blackman window), wavelet basis functions (Morlet, Dgauss, Mexhat, Haar, Daubechies, and Biorthogonal) and filtering methods (low-pass, high-pass, band-pass, and band-stop) were investigated and explored. Results showed that filters could significantly improve the models′ accuracy. Low-pass/band-stop filtering modes, rectangular window, and Blackman window functions were superior and satisfactory. The support vector machine was optimal in distinguishing all samples. The SVM model (RBF kernel function) based on FIR low-pass/band-stop filter could be considered as the favorable model. It achieved 100% accurate differentiation. Filters and ATR-SEIRAS could effectively distinguish animal and vegetable oils. It could provide the application of enhancing the model performance.

Key words animal and vegetable oils; attenuated total reflection-surface-enhanced infrared absorption spectroscopy; filter; Fisher discriminant analysis; support vector machine; decision tree

DOI:10.13995/j.cnki.11-1802/ts.032551

引用格式:邱薇纶,丁圣.基于滤波器的动植物油光谱信号预处理方法比较及识别分类[J].食品与发酵工业,2023,49(8):281-288.QIU Weilun,DING Sheng.Comparison and recognition of spectral signal pretreatment methods for animal and vegetable oils based on filters[J].Food and Fermentation Industries,2023,49(8):281-288.

第一作者:硕士,讲师(通信作者,E-mail:915177230@qq.com)

收稿日期:2022-06-03,改回日期:2022-07-05