八角茴香是木兰科植物八角的干燥成熟果实,每粒果实有7~9个蓇葖果,呈放射状排列成聚合果,又称茴香、大茴香和大料,是常见的“药食同源”调味品与中药材[1-2]。八角茴香香味浓郁且具有抑菌[3-4]、抗氧化[5-6]、抗病毒[7]等功效,在调味品、香料加工、药品和化妆品生产等方面应用广泛[8-10]。由于市场需求巨大,常出现使用含有毒性的莽草、野八角、红茴香等果实冒充八角茴香销售的现象,从而危害消费者利益和生命健康。GB/T 7652—2016《八角》对八角茴香的质量评定指标等内容进行了规定,却未涉及八角茴香真伪识别的方法。八角茴香真伪鉴别通常通过果实性状观察、显微与理化鉴别、光谱鉴别、气味指纹分析、DNA分子标记鉴别等方法进行[11],但性状与显微结构观察带有个人主观性,而仪器和理化鉴别方法步骤繁琐、成本高,难以满足快速无损检测的需求。除了掺假以外,八角茴香还存在硫磺过度熏蒸的问题:八角鲜果采摘后通常会使用硫磺对其进行熏蒸处理,以此来抑制霉菌生长并使其快速脱水,然而该方法往往会使其SO2残留量超标,长期摄入SO2对人体健康会产生不良影响,如损害呼吸道、消化道黏膜,产生恶心、呕吐、哮喘等不良反应,甚至会造成脑组织损伤等伤害[12-13]。在日常生活中,广大消费者普遍缺乏对八角茴香伪品与硫磺熏蒸八角茴香的识别能力,从而危害自身利益和生命安全,如何快速、准确对八角茴香进行鉴别也已经成为监督执法部门与检测部门亟待解决的问题。
随着信息与传感技术的不断发展,利用图像处理分析技术进行谷物[14-16]、水果[17-18]、蔬菜[19-20]等产品识别与品质检测得到了广泛研究与应用。与传统理化、仪器检验方法相比,图像处理与分析具有检测效率高、可避免人为误检等优点,该技术在八角茴香外观与质量检测方面已逐步应用,如姚应方等[21]使用图像处理技术对八角茴香颜色和果形进行识别,为八角茴香外观品质检测提供了新思路。将图像处理与分析技术应用于实际检测,如八角茴香生产、消费流通等环节的现场便携式检测应用,是智能化与无损检测发展的趋势,具有较高理论价值和实际意义,因此本研究使用图像处理技术,探索一种能够快速准确鉴定八角茴香真伪与质量的方法。本研究以八角茴香、硫磺熏蒸八角茴香、莽草、野八角作为研究对象,运用图像处理与分析技术提取其特征参数,对特征参数进行筛选与降维处理后建立相应模式识别方法,用以快速准确识别八角茴香、硫磺熏蒸八角茴香、八角茴香伪品,为图像处理技术在八角茴香品质鉴定中的研究与应用提供参考。
八角茴香(2023年产,采摘自广西省玉林市);莽草(2023年产,采摘自杭州植物园);野八角(2023年产,采摘自连康山国家自然保护区);硫磺,洛阳天之道新材料科技有限公司。将八角茴香样品做热水杀青(水温90~100 ℃)、硫磺熏蒸(按照SO2残留量0.15 g/kg确定所需硫磺的量,使用硫磺熏蒸至八角茴香表面呈淡黄色)、室外阳光晾晒等干燥处理,莽草和野八角样品做晾晒干燥处理,去除杂质后,密封储存于4 ℃左右的恒温冰箱。
纷腾h9型扫描仪(光学分辨率:2 400×4 800 dpi;扫描元件:CCD),中国上海中晶科技有限公司;ST109C型二氧化硫测定仪,中国山东济南盛泰电子科技有限公司。
1.3.1 样品处理
将八角茴香采用2种干燥方式处理:一部分新鲜八角茴香采用热水杀青后晾晒的方式得到无硫干燥八角茴香,另外的新鲜八角茴香采用硫磺熏蒸后晾晒的方式得到硫磺熏蒸八角茴香。参照GB 5009.34—2022《食品安全国家标准 食品中二氧化硫的测定》检测2种八角茴香中SO2残留量,无硫干燥八角茴香中SO2本底值为9.38 mg/kg,硫磺熏蒸八角茴香中SO2残留量为166 mg/kg。
八角茴香与其伪品差异不仅表现在蓇葖果的数量上,更表现在蓇葖果的外观和颜色差异上,且市售八角茴香常常存在完整籽粒与破碎粒混合售卖的情况,部分掺假者也会将破碎的伪品掺入八角茴香中进行售卖。由此可见,对八角茴香及其伪品蓇葖果进行识别更符合实际鉴别需求,实验中以八角茴香及其伪品的蓇葖果籽粒作为图像采集与分析识别对象。
1.3.2 图像采集和预处理
分别将八角茴香、硫磺熏蒸八角茴香、莽草、野八角蓇葖果籽粒放置在扫描仪上,将扫描仪分辨率设置为300 dpi,扫描八角茴香及其伪品RGB图像并以BMP格式储存,共采集520个籽粒图像。为了消除图像噪声对参数提取造成的影响,需要对上述图像进行滤波、图像二值化、形态学运算、图像分割等预处理,以达到去除图像噪声以及图像增强等目的。
1.3.3 图像特征参数提取
由于八角茴香、硫磺熏蒸八角茴香、莽草、野八角在色泽、外观等方面存在差异,因此选择颜色、形态和纹理特征参数反映八角茴香与其伪品之间的差异,并使用MATLAB R2014a软件对特征参数进行提取。
颜色特征提取:由于八角茴香颜色多为红棕色并有光泽,其经硫磺熏蒸后颜色更加鲜艳,莽草颜色偏红褐色,野八角颜色多为棕褐色,因此可根据其颜色特征差异对其进行检测识别。在数字图像处理中,经常使用RGB(红色、绿色、蓝色)颜色模型和HSI(色调、饱和度、亮度)颜色模型反映图像的颜色特征。其中,RGB图像是成像、显示及打印等设备的基础,而HSI图像中I分量与图像彩色信息无关,H和S分量与人感受颜色的方式紧密相关,2种图像可从不同角度反映上述4种籽粒特征差异。本研究将提取RGB和HSI颜色空间模型中的各颜色分量特征参数用于八角茴香真伪与质量鉴别。
形态特征提取:由于八角茴香蓇葖果肥大呈小艇状、先端钝或钝尖,莽草蓇葖果较瘦长、先端有较长且向后弯曲的钩状尖头,野八角蓇葖果呈扁平状广锥形、先端长较尖,因此可根据其形态特征差异对其进行识别。八角茴香、硫磺熏蒸八角茴香、莽草、野八角形态可通过二值图像标记将各个籽粒从整体图像中标记提取出来,籽粒图像经形态学运算(开运算和闭运算)处理后,利用边缘特性和籽粒区域提取八角茴香及其伪品籽粒形态特征参数。本研究使用的形态特征参数包括籽粒区域面积、直径、紧密度、长轴长、短轴长、短长轴比等参数。其中,八角茴香及其伪品蓇葖果形态特征中的区域面积、直径、长轴长、短轴长等参数可以通过区域中像素点个数统计得到,紧密度等特征参数可通过相关参数之间的比率得到。
纹理特征提取:八角茴香及其伪品因其表面褶皱、平滑等情况不同,在纹理特征上也有一定差异。图像的纹理特征是一种全局特征,描述了图像区域所对应物体的表面性质,其需要在包含多个像素点的区域进行统计分析,反映了图像灰度变化的部分规律。图像纹理特征对噪声有较强的抵抗能力,并可定量描述图像信息,本研究使用的纹理特征包括图像的平均亮度、平均对比度、平滑度、三阶矩、一致性、熵等参数,用以描述与度量图像区域中灰度值的平均对比度、图像灰度概率密度分布情况、图像纹理的复杂与混乱程度等。图像的平均亮度表示为:
其中zi为表示亮度的随机变量,p(z)为一个区域中灰度级的直方图,L是灰度级数。其他纹理特征参数表示如公式(1)~公式(5)所示:
平滑度:R=1-1/(1+σ2)
(1)
平均对比度:![]()
(2)
三阶矩:![]()
(3)
一致性:![]()
(4)
熵:![]()
(5)
1.3.4 模式识别模型构建
由于八角茴香、硫磺熏蒸八角茴香、莽草、野八角在形态、颜色等特征参数上的差异不同,使用对八角茴香与其伪品识别贡献较大的参数有利于降低数据冗余并缩短数据分析时间。但由于提取的特征参数数据量大,不同特征参数间也相互关联影响,因此需要在构建识别模型前使用逐步判别分析或主成分分析对特征参数进行筛选或降维。其中,逐步判别分析规定引入特征参数和剔除特征参数的临界值并进行逐步计算,通过计算全部特征参数的判别能力并对特征参数进行检验,通过检验则接受,否则特征参数将被剔除。主成分分析作为数据降维的常用方法,可将复杂的多指标参数转化为少数几个综合指标(即主成分),每个主成分都能够反映原始数据的大部分信息,其所含信息也互不重复。本研究分别使用逐步判别分析和主成分分析对特征参数进行处理,将筛选出的特征参数和最佳主成分作为识别模型的输入。
识别模型构建使用逐步判别分析-线性参数分类器和主成分分析-反向传播(back propagation,BP)神经网络分类器完成。其中,逐步判别分析-线性参数分类器可通过逐步判别分析选入的特征参数作为判别分析的指标,并以其作为参考变量作Bayes判别分析。BP神经网络通过反向传播调整网络的权重和阈值,其设计需要综合考虑各层单元数并选取合适的网络创建、神经元传递、网络训练函数。采集八角茴香、硫磺熏蒸八角茴香、莽草和野八角4种籽粒共520个样本,按照不低于2∶1的比例将其划分为训练集和测试集,完成识别模型的训练、性能评估和效果测试。
使用Excel、SPSS 22对数据进行处理,使用Origin Pro 2022制图。此外,逐步判别分析和线性参数统计分类器构建使用SAS 9.4软件完成,主成分分析和BP神经网络模型构建使用MATLAB R2014a软件编程完成。
采集到的部分八角茴香与伪品图像如图1所示。对八角茴香、硫磺熏蒸八角茴香、八角茴香伪品图像进行预处理,预处理结果如图2所示。图像经中值滤波处理后更加清晰,图像噪声信息明显减少,其轮廓、边缘等信息也能够较好保存。利用OTSU阈值分割法可对灰度图像进行二值化处理并进行形态特征参数的提取,但图像经二值化处理后容易形成孔洞和缝隙等,对图像区域及边界信息描述造成影响。形态学运算中开运算能够平滑图像中物体轮廓、消除细小突出物、填补孔洞,并具有对图像中物体轮廓进行平滑处理又不明显改变其大小等作用。形态学闭运算可熔合图像中较窄的缺口和细长的弯口,并具有填充图像中细小孔洞和轮廓缝隙等作用。依次对图像进行形态学开运算和闭运算处理,使其达到噪声滤波器的作用,经处理后八角茴香与其伪品图像轮廓变得更加清晰,裂缝和孔洞也基本被清除。
a-八角茴香;b-硫磺熏蒸八角茴香;c-莽草;d-野八角
图1 不同品质八角茴香扫描图
Fig.1 Scans of star anise with different quality
a-灰度图像;b-中值滤波图像;c-二值图像;d-形态学处理后图像
图2 八角茴香图像预处理效果
Fig.2 The preprocessing effect of star anise images
对八角茴香、硫磺熏蒸八角茴香、莽草、野八角籽粒进行颜色参数提取时,采用图像分割处理确定各籽粒位置,在RGB图像中对每个籽粒求出其红色、绿色、蓝色分量的均值和标准差,在HSI图像中对每个籽粒求出其色调、饱和度和亮度的均值和标准差,各类型籽粒的颜色特征参数值如表1所示。
表1 各类型蓇葖果籽粒颜色特征值
Table 1 Color feature values for each type follicle
参数八角茴香 硫磺熏蒸八角茴香莽草 野八角R均值 103.797 1±8.267 685.937 7±8.834 699.430 4±7.909 590.308 8±8.414 9G均值 63.745 7±6.185 454.105 1±5.256 362.661 1±5.591 652.591 7±6.111 1B均值 17.898 7±2.468 416.346 5±2.394 617.477 0±2.370 912.243 0±2.311 2H均值 0.004 9±0.003 80.012 4±0.006 30.008 0±0.004 80.010 7±0.005 0S均值 0.801 4±0.043 70.724 5±0.057 60.801 3±0.048 20.866 9±0.039 5I均值 0.001 0±0.003 70.000 5±0.001 20.005 9±0.008 30.000 4±0.001 6R标准差 25.081 4±2.616 331.107 5±3.281 434.100 1±3.469 128.872 0±3.451 6G标准差 20.719 3±1.945 721.234 6±1.589 126.594 6±2.559 923.453 8±2.207 6B标准差 18.311 6±1.746 417.287 0±1.371 917.913 6±1.797 815.080 5±1.758 5H标准差 0.065 3±0.025 00.107 2±0.027 50.085 4±0.024 70.100 2±0.022 7S标准差 0.395 1±0.033 90.442 0±0.030 20.394 5±0.036 40.334 4±0.044 9I标准差 0.019 3±0.024 30.014 2±0.018 60.058 8±0.048 50.009 2±0.017 5
由表1可知,八角茴香、硫磺熏蒸八角茴香、八角茴香伪品由于颜色、光泽方面存在区别,其颜色参数值也有一定差异。例如,对八角茴香及各类型伪品籽粒,红色分量均值最大,蓝色分量均值最小。此外,八角茴香的红色和绿色分量均值高于其他类型的籽粒,而野八角籽粒的蓝色分量均值明显低于其他类型的籽粒。HSI颜色空间模型方面,莽草籽粒的I分量均值最高,说明莽草籽粒的亮度高于其他类型籽粒。野八角籽粒的S分量均值明显高于其他类型的籽粒,说明野八角籽粒的饱和度最大,其图像较其他籽粒也更鲜艳。综上所述,八角茴香等籽粒特征参数在颜色分量数值上存在差异,因此可将颜色特征作为八角茴香品质鉴定的依据。
由表2可知,八角茴香、硫磺熏蒸八角茴香及其伪品在形态特征参数上存在一定差异。以区域面积、直径、长轴长、短轴长为例,硫磺熏蒸八角茴香特征值均大于八角茴香,这与八角茴香进行硫磺熏蒸后水分含量较高,导致其果实较正常晾晒八角茴香体积更大相吻合。此外,与莽草和野八角相比,八角茴香的短长轴比更接近1,这与八角茴香蓇葖果偏椭圆形,莽草蓇葖果狭长的外观相吻合。由此可见,八角茴香及其伪品在形态特征方面也存在明显区别,可将形态特征作为八角茴香品质鉴定的依据。
表2 各类型蓇葖果籽粒形态特征值
Table 2 Shape feature values for each type follicle
参数八角茴香硫磺熏蒸八角茴香莽草野八角投影面积14 175.258 7±1 640.451 119 182.566 4±2 124.917 49 833.209 8±957.725 114 282.454 5±1 063.609 4区域最小凸多边形面积14 900.895 1±1 735.266 820 314.265 7±2 331.049 411 725.111 9±1 138.146 415 580.944 1±1 220.924 9直径476.580 3±33.757 6566.451 5±38.586 1471.229 9±26.766 5519.966 1±30.296 3椭圆离心率 0.733 5±0.050 70.761 5±0.045 20.853 4±0.019 20.822 8±0.035 4区域等面积圆直径 134.121 2±7.773 0156.048 4±8.568 3111.763 4±5.400 8134.252 6±5.017 3
续表2
参数八角茴香硫磺熏蒸八角茴香莽草野八角伸展度0.715 0±0.029 00.709 6±0.030 80.572 2±0.034 40.647 0±0.038 2长轴长 166.671 9±13.835 4199.012 9±14.024 3165.721 6±9.433 6185.331 5±11.818 5短轴长 112.019 6±6.373 2127.832 9±9.153 285.994 7±4.696 2104.223 3±5.978 2紧密度0.951 5±0.014 00.944 8±0.015 30.839 0±0.027 00.910 3±0.022 4短长轴比0.675 6±0.054 60.644 4±0.052 80.520 0±0.032 20.564 9±0.051 5
由表3可知,八角茴香的红色分量平滑度数值明显低于其他类型籽粒,而莽草籽粒的绿色分量平滑度明显高于其他类型籽粒。在蓝色分量方面,野八角蓝色分量的一致性高于其他类型的籽粒,而其蓝色分量的熵低于其他类型的籽粒,因此可作为野八角识别的依据。由此可见,八角茴香及其伪品的纹理特征也有较大差异,可将纹理特征参数作为八角茴香品质鉴定的依据。
表3 各类型蓇葖果籽粒纹理特征值
Table 3 Vein feature values for each type follicle
参数八角茴香硫磺熏蒸八角茴香莽草野八角R平均亮度 104.095 4±8.358 486.094 5±8.915 699.943 9±7.980 090.490 6±8.517 1R对比度 24.873 9±2.673 731.137 8±3.313 633.965 4±3.549 728.793 1±3.472 4R平滑度0.009 5±0.002 10.014 8±0.003 20.017 6±0.003 70.012 8±0.003 3R三阶矩-0.082 2±0.064 80.004 3±0.012 90.007 4±0.017 8-0.164 0±0.103 0R一致性0.012 6±0.001 60.009 6±0.001 00.009 1±0.001 00.011 0±0.001 5R熵6.596 7±0.156 66.920 0±0.135 37.006 4±0.133 66.771 6±0.159 1G平均亮度 63.791 8±6.254 554.129 4±5.312 262.771 0±5.647 652.523 8±6.181 7G对比度20.663 9±1.955 121.251 7±1.605 026.634 2±2.602 223.409 7±2.221 7G平滑度0.006 6±0.001 30.006 9±0.001 00.010 9±0.002 10.008 4±0.001 7G三阶矩0.021 8±0.036 20.028 8±0.039 80.121 1±0.108 60.014 4±0.053 3G一致性0.014 2±0.001 30.014 0±0.001 10.011 9±0.001 10.012 7±0.001 2G熵6.375 1±0.123 56.396 0±0.100 96.666 0±0.121 56.502 4±0.123 1B平均亮度 17.890 7±2.494 216.382 4±2.422 517.431 5±2.397 512.216 0±2.323 3B对比度18.314 4±1.758 717.315 7±1.382 117.932 9±1.822 515.061 7±1.769 7B平滑度0.005 2±0.001 00.004 6±0.000 70.005 0±0.001 00.003 5±0.000 8B三阶矩0.084 3±0.031 20.075 1±0.021 70.092 3±0.045 30.072 5±0.024 9B一致性0.084 3±0.023 60.091 1±0.033 60.071 4±0.019 70.117 4±0.036 0B熵5.122 4±0.251 95.000 9±0.307 15.190 3±0.242 94.610 3±0.340 6
本研究中,利用图像处理和分析技术对八角茴香及其伪品提取了12个颜色特征、10个形态特征和36个纹理特征共58个特征参数。分析特征参数后发现,八角茴香、硫磺熏蒸八角茴香、莽草、野八角在颜色、形态、纹理特征方面均有所差异,将这些特征参数应用于八角茴香品质鉴定是可行的。
2.3.1 基于逐步判别分析-线性参数分类器的分类识别
本研究提取了八角茴香、硫磺熏蒸八角茴香、八角茴香伪品的颜色、形态和纹理共58个特征参数,将引入特征参数和剔除特征参数的显著性水平设定为0.15,并使用SAS 9.4软件中逐步判别分析功能对参数进行筛选,可以得到对判别贡献较大的特征参数,部分特征参数如表4所示。
表4 使用逐步判别分析筛选的前10个贡献较大的特征参数
Table 4 The top 10 contributing feature parameters screened by stepwise discriminant analysis
特征参数平均典型相关平方值偏R2区域等面积圆直径0.282 20.846 7投影面积0.449 70.591 0S均值0.605 80.540 9区域最小凸多边形面积0.630 60.308 1G标准差0.637 20.149 3R一致性0.659 80.131 8H标准差0.675 40.137 8紧密度0.682 80.091 9I平滑度0.687 60.080 7伸展度0.706 20.063 3
由筛选出的特征参数可知,区域等面积圆直径对八角茴香及其伪品识别贡献最大,其次是投影面积、S分量均值等参数。将八角茴香及其伪品各特征参数值导入Excel并作散点图,可观察到数据分布情况。对识别贡献最大的前3个特征参数散点图如图3所示。
a-区域等面积圆直径散点图;b-投影面积散点图;c-S均值散点图
图3 八角茴香及其伪品各特征参数关系图
Fig.3 Relationship diagram of characteristic parameters of star anise and its counterfeits
由图3可知,八角茴香、硫磺熏蒸八角茴香、莽草、野八角在外观、色泽等方面存在一定差异。例如八角茴香、硫磺熏蒸八角茴香、莽草在区域等面积圆直径、投影面积等方面有明显差异,八角茴香与野八角则可根据籽粒S均值进行识别。此外,由筛选出的前10个特征参数可以看出,形态特征能很好地反映出八角茴香、硫磺熏蒸八角茴香、八角茴香伪品之间的差异,其次是颜色特征,纹理特征对八角茴香品质鉴定的贡献相对较小。
基于筛选出的特征变量,使用SAS 9.4软件中的DISCRIM判别过程,进行线性参数统计分类器的构建,八角茴香、硫磺熏蒸八角茴香、莽草、野八角对应的判别函数依次为:
Y1(X)=-13 899-1.82X1+1.77X2-22.03X3-788.98X4+32 208X5-1.65X6-198.37X7-401.82X8+15 048X9+8.57X10;
Y2(X)=-13 796-1.81X1+1.77X2-22.79X3-774.15X4+32 144X5-2.18X6-202.99X7-401.31X8+13 752X9+8.56X10;
Y3(X)=-13 284-1.80X1+1.77X2-26.64X3-812.04X4+31 922X5+4.31X6-246.31X7-406.82X8+13 558X9+3.39X10;
Y4(X)=-13 983-1.83X1+1.79X2-22.66X3-831.31X4+32 407X5+1.46X6-146.55X7-495.31X8+14 968X9+5.93X10
使用上述线性参数判别分析模型对八角茴香及其伪品、硫磺熏蒸八角茴香进行识别,对训练集样本进行判别分析发现,2个硫磺熏蒸八角茴香样本被误判为八角茴香,其余样本均未出现误判现象,该模型对训练集样本的识别率为97.78%~100%,可以较好反映出八角茴香及其伪品之间的差异,对测试集识别结果如表5所示。
表5 线性参数分类器对八角茴香及其伪品的识别结果
Table 5 Identification results of star anise and its forgeries by linear parameter classifier
蓇葖果类型样本数测试集识别结果八角茴香硫磺熏蒸八角茴香 莽草野八角 识别率/%平均识别率/%八角茴香403820095.00硫磺熏蒸八角茴香405350087.50莽草4000400100野八角400004010096.75
由表5可知,八角茴香、硫磺熏蒸八角茴香、莽草、野八角蓇葖果籽粒的平均判别正确率为96.75%,其中莽草、野八角由于形态特征较八角茴香有较大差异,其识别率均达到了100%;由于硫磺熏蒸八角茴香与八角茴香外观一致,因此两者之间容易发生误判,但其识别率也分别达到87.50%和95.00%。
2.3.2 基于主成分分析-BP神经网络的分类识别
使用MATLAB R2014a软件中的主成分分析对提取的特征参数进行处理,得到能够表征图像参数信息的主成分。图像特征参数主成分得分与累计得分如图4所示,当主成分数为2时,其累计方差贡献率已接近90%,满足了保留图像特征信息的基本要求;当主成分数为10时,其累计方差贡献率超过了99.9%,几乎包含了原始图像的全部信息。
图4 主成分得分
Fig.4 Principal component score
将八角茴香、硫磺熏蒸八角茴香、野八角、莽草的颜色、形态和纹理特征参数数据导入Origin Pro 2022并绘制主成分散点图,使用前2个主成分对4种样品进行分类,其分类效果如图5所示。
图5 八角茴香及其伪品主成分散点图
Fig.5 Principal component scattering plot of star anise and its forgeries
由图5可知,使用前2个主成分对八角茴香、硫磺熏蒸八角茴香、八角茴香伪品进行识别时,八角茴香和硫磺熏蒸八角茴香由于在形态、颜色、纹理特征方面最为接近,两者存在较严重的重叠,但对莽草、野八角、硫磺熏蒸八角茴香已经具有较好的识别效果。由此可见,通过主成分分析得到的主成分保留了对八角茴香及其伪品进行识别的能力,并可将其用于BP神经网络模型输入层的输入因子。识别模型输入层的最佳主成分数可通过BP神经网络训练得出,在BP神经网络的学习与训练中,需要对网络期望误差、最大循环次数、修正权值学习效率等训练参数进行设定。本次研究中将网络训练目标误差设置为0.001,训练最大循环次数设置为10 000,网络训练函数选用trainlm,隐含层传递函数采用tansig,网络输出层函数选用logsig。分别将主成分数设定为2、3、4、5、6、7、8、9、10,进行BP神经网络训练,不同主成分数网络训练结果如表6所示。
表6 不同主成分数训练结果对比
Table 6 Comparison of training results of different principal component numbers
主成分数训练次数/次训练时间/s均方误差R2>10 0001270.073 500.714 623>10 0001080.067 200.803 024>10 0001160.021 000.942 545518160.004 250.988 6863130.001 210.996 7672320.000 750.998 0981220.000 240.999 4191920.001 210.996 76101130.000 700.998 26
由表6可知,当主成分数设定为2、3、4时,训练次数达到最大设定值10 000次时,训练仍未结束,不满足网络训练要求。当主成分数设定为5和6时,训练次数明显减少,但其均方误差大于设定的目标值。综合考虑网络训练时间、训练次数、均方误差、相关系数等参数,主成分数为8时训练效果最好,因此将网络输入层节点数设定为8。
本次研究中BP神经网络模型采用单隐含层结构,输入层节点数由特征参数处理得到的主成分因子数确定。参照Kolmogorov定理,网络隐含层节点数可根据n2=2n1+1进行选取(n2为隐含层节点数,n1为输入层节点数),因此隐含层节点数可以取17个。由于BP神经网络输出为4种籽粒类型,因此输出层神经元节点数为4,目标输出模式设为(1000)、(0100)、(0010)、(0001),分别对应于八角茴香、硫磺熏蒸八角茴香、莽草和野八角。综上所述,该BP神经网络模型结构为8-17-4。在此网络结构下观察BP神经网络训练性能,网络训练结果显示,当输入层节点数设定为8,隐含层节点数定为17时,经过12次网络训练后,该网络输出均方误差已降低到0.001以下,目标值与输出拟合值线性回归方程的相关系数>0.999,满足了目标误差要求且网络训练时间较短,可满足BP神经网络识别的建模需求。用160个测试集样本对该BP神经网络的识别率进行测试,其结果如表7所示。
表7 BP神经网络对八角茴香及其伪品的识别结果
Table 7 Identification results of star anise and its forgeries with BP neural network
蓇葖果类型样本数测试集识别结果八角茴香硫磺熏蒸八角茴香 莽草野八角 识别率/%平均识别率/%八角茴香403640090.00硫磺熏蒸八角茴香406340085.00莽草4000400100野八角403003792.5091.88
由表7可知,八角茴香、硫磺熏蒸八角茴香、莽草、野八角的平均识别正确率为91.88%,莽草由于形态等特征参数与其他3种类型蓇葖果有较大差异,其识别正确率达到了100%;由于硫磺熏蒸八角茴香与八角茴香外观一致,因此两者之间容易发生误判现象,其识别率分别为85.00%和90.00%;由于特征参数重叠,部分野八角在识别过程中会与八角茴香发生误判,但其识别正确率也达到了92.50%。
在图像预处理方面,以采集到的八角茴香、硫磺熏蒸八角茴香、莽草、野八角RGB图像为基础,在MATLAB R2014a环境下对图像进行的颜色空间转换、中值滤波、图像灰度化、图像二值化、形态学开运算和闭运算等处理,能够实现消除图像噪声等目的,并满足图像特征参数提取的要求。
在特征参数选择与提取方面,由于八角茴香蓇葖果肥大呈小艇状、先端钝或钝尖、颜色多为红棕色并有光泽,其经硫磺熏蒸后体积更大、颜色更加鲜艳,莽草蓇葖果较瘦长、先端有较长且向后弯曲的钩状尖头、颜色偏红褐色,而野八角蓇葖果呈扁平状广锥形、先端长较尖、颜色多为棕褐色,因此可根据八角茴香、硫磺熏蒸八角茴香、八角茴香伪品的形态、颜色、纹理特征差异对其进行识别。利用图像处理和分析技术对上述4种籽粒提取了12个颜色特征、10个形态特征和36个纹理特征共58个特征参数。通过数据分析可知,颜色、形态等3种类型的特征参数可用于八角茴香品质鉴定。
在特征参数处理与识别模型构建方面,分别使用逐步判别分析-线性参数分类器和主成分分析-BP神经网络2种方法构建分类识别模型,用于八角茴香品质鉴定。其中,通过逐步判别分析筛选出对分类识别影响较大的10个特征变量,构建线性参数统计分类器。通过主成分分析对特征参数进行分析处理,将降维后的主成分因子作为识别模型的输入,构建网络结构为8-17-4的3层BP神经网络识别模型。2种识别模型对八角茴香、硫磺熏蒸八角茴香、莽草、野八角的平均识别率分别为96.75%和91.88%,表明将图像处理应用于八角茴香及其伪品识别以及硫磺熏蒸八角茴香鉴别是可行的。
本研究中八角茴香伪品类型选择有限,在后续研究中增加红茴香、短柱八角、地枫皮果实等常见八角属植物果实进行识别,增加不同产地、不同收获年份八角茴香及其伪品的识别和比较,逐步丰富八角茴香及其伪品图像样本库;本研究中八角茴香与硫磺熏蒸八角茴香中SO2残留量差别较大,后续研究中增加不同SO2残留量梯度的硫磺熏蒸八角茴香进行识别,用以建立八角茴香中SO2残留量的定量预测模型。此外,通过大规模数据的训练得到更具代表性的特征信息,并引入深度学习等多隐层模式识别分析模型[22-24],以提高八角茴香及其伪品识别以及硫磺熏蒸八角茴香鉴别模型的预测准确度。在此基础上,开发相应的在线、无损检测等便携化仪器设备,以满足八角茴香品质鉴定准确快速、便捷高效的检测需求。
[1] SHAHRAJABIAN M H, SUN W L, CHENG Q.Chinese star anise and anise, magic herbs in traditional Chinese medicine and modern pharmaceutical science[J].Asian Journal of Medical and Biological Research, 2019, 5(3):162-179.
[2] 包正宇, 李耀文, 李言, 等.八角茴香的生物学活性及其应用[J].食品与发酵工业, 2023, 49(11):323-329.BAO Z Y, LI Y W, LI Y, et al.Biological activity and application of Illicium verum[J].Food and Fermentation Industries, 2023, 49(11):323-329.
[3] 赵二劳, 徐未芳, 刘乐.八角茴香抑菌作用研究进展[J].中国调味品, 2019, 44(4):191-193.ZHAO E L, XU W F, LIU L.Research progress of the bacteriostasis of star anise[J].China Condiment, 2019, 44(4):191-193.
[4] 孙长花, 王征远, 刘俊, 等.八角茴香提取液的抑菌效果及稳定性探讨[J].食品工业, 2020, 41(12):189-192.SUN C H, WANG Z Y, LIU J, et al.Study on antibacterial effect and stability of Illicium verum extract[J].The Food Industry, 2020, 41(12):189-192.
[5] 郑燕菲, 张强, 蓝亮美, 等.八角茴香壳与籽中挥发油成分分析及抗氧化性研究[J].粮食与油脂, 2022, 35(5):83-86.ZHENG Y F, ZHANG Q, LAN L M, et al.Component analysis and antioxidant activity of volatile oils from star anise shell and seed[J].Cereals &Oils, 2022, 35(5):83-86.
[6] YU C Y, ZHANG J F, WANG T.Star anise essential oil:Chemical compounds, antifungal and antioxidant activities:A review[J].Journal of Essential Oil Research, 2021, 33(1):1-22.
[7] LI W, WU Z N, XIA Y P, et al.Antiviral and antioxidant components from the fruits of Illicium verum Hook.f.(Chinese star anise)[J].Journal of Agricultural and Food Chemistry, 2022, 70(12):3697-3707.
[8] SHARAFAN M, JAFERNIK K, EKIERT H, et al.Illicium verum (star anise) and trans-anethole as valuable raw materials for medicinal and cosmetic applications[J].Molecules, 2022, 27(3):650.
[9] SHARAFAN M, MAILNOWSKA M, EKIERT H, et al.The use of star anise (Illicium verum) and trans-anethole in cosmetology[J].Farmacja Polska, 2022, 78(4):219-231.
[10] 孔馨逸, 江大海, 王洁.八角茴香三萜类化合物分离及其生物活性研究[J].中国调味品, 2022, 47(11):57-60.KONG X Y, JIANG D H, WANG J.Study on isolation and bioactivity of triterpenoids from star anise[J].China Condiment, 2022, 47(11):57-60.
[11] 陈赛赛, 徐民, 吴琼, 等.八角茴香真伪鉴别研究进展[J].食品安全质量检测学报, 2023, 14(13):126-133.CHEN S S, XU M, WU Q, et al.Research progress in adulterants identification of star anise[J].Journal of Food Safety &Quality, 2023, 14(13):126-133.
[12] KHALAF E M, MOHAMMADI M J, SULISTIYANI S, et al.Effects of sulfur dioxide inhalation on human health:A review[J].Reviews on Environmental Health, 2022, 39(2):331-337.
[13] 陈虎, 陈赛赛, 吴琼, 等.八角茴香中二氧化硫残留量分析及安全性评价[J].食品安全质量检测学报, 2024, 15(13):215-223.CHEN H, CHEN S S, WU Q, et al.Analysis and safety evaluation of sulfur dioxide residue in Illicium verum[J].Journal of Food Safety &Quality, 2024, 15(13):215-223.
[14] 张玉荣, 陈赛赛, 姜忠丽, 等.基于图像处理的小麦容重检测方法研究[J].中国粮油学报, 2015, 30(3):116-121.ZHANG Y R, CHEN S S, JIANG Z L, et al.Detection method of volume- weight of wheat by image processing[J].Journal of the Chinese Cereals and Oils Association, 2015, 30(3):116-121.
[15] JAVANMARDI S, MIRAEI ASHTIANI S H, VERBEEK F J, et al.Computer-vision classification of corn seed varieties using deep convolutional neural network[J].Journal of Stored Products Research, 2021, 92:101800.
[16] ZHANG Y Z, LYU C X, WANG D C, et al.A novel image detection method for internal cracks in corn seeds in an industrial inspection line[J].Computers and Electronics in Agriculture, 2022, 197:106930.
[17] MON T, ZARAUNG N.Vision based volume estimation method for automatic mango grading system[J].Biosystems Engineering, 2020, 198:338-349.
[18] GHAZAL S, QURESHI W S, KHAN U S, et al.Analysis of visual features and classifiers for fruit classification problem[J].Computers and Electronics in Agriculture, 2021, 187:106267.
[19] 张展硕, 刘苗苗, 陆雯沁, 等.基于图像传感技术的娃娃菜外观品质检测[J].食品安全质量检测学报, 2021, 12(4):1374-1379.ZHANG Z S, LIU M M, LU W Q, et al.Detection of external quality for baby cabbage by image sensing technology[J].Journal of Food Safety &Quality, 2021, 12(4):1374-1379.
[20] 李明, 王润涛, 姜微.基于机器视觉的马铃薯加工原料分选系统[J].食品与机械, 2021, 37(9):139-144.LI M, WANG R T, JIANG W.Research on separation system of potato processing raw materials based on machine vision[J].Food &Machinery, 2021, 37(9):139-144.
[21] 姚应方, 刘峰, 张海东, 等.基于机器视觉的八角颜色与果形识别研究[J].中国农业科技导报, 2021, 23(11):110-120.YAO Y F, LIU F, ZHANG H D, et al.Research on octagon color and fruit shape recognition based on machine vision[J].Journal of Agricultural Science and Technology, 2021, 23(11):110-120.
[22] WU W, YANG T L, LI R, et al.Detection and enumeration of wheat grains based on a deep learning method under various scenarios and scales[J].Journal of Integrative Agriculture, 2020, 19(8):1998-2008.
[23] LI Y H, CHEN X Y, YIN L N, et al.Deep learning-based methods for multi-class rice disease detection using plant images[J].Agronomy, 2024, 14(9):1879.
[24] LI H, HAO Y, WU W F, et al.Rapid detection of turtle cracks in corn seed based on reflected and transmitted images combined with deep learning method[J].Microchemical Journal, 2024, 201:110698.