基于机理模型和模糊加权最小二乘支持向量机(LSSVM)算法的
农杆菌发酵过程混合建模与优化

邵玉倩1,2,宗原1,2,刘以安1,2,刘登峰1,2*

1(江南大学 物联网工程学院,江苏 无锡,214122) 2(轻工过程控制教育部重点实验室(江南大学),江苏 无锡,214122)

摘 要 针对农杆菌ATCC31749发酵法产凝胶多糖过程中产物质量浓度预测精度不高问题,提出一种基于模糊加权最小二乘支持向量机(least squares support vector machine,LSSVM)算法和机理模型相结合的混合建模新方法。首先通过添加模糊加权思想和混合核函数方法对LSSVM算法进行优化,并用优化后的LSSVM求解农杆菌ATCC31749发酵过程动力学模型,结合鸟群算法对动力学模型参数进行寻优;然后拟合出溶氧体积分数和各参数之间的关联函数模型,并代入到动力学模型,建立起以溶氧浓度作为关键控制变量的发酵动力学模型;最后,用鸟群算法对模型进行寻优,寻找使得发酵产物浓度最大的最优溶氧过程控制策略。实验仿真结果表明,混合模型的预测精度得到提高,产多糖期溶氧体积分数控制为52%时,产物质量浓度最大,为48.85 g/L。该研究所建立的农杆菌发酵过程混合模型及其溶氧优化结果,为发酵工业上进一步通过最佳溶氧控制策略来提高多糖产量提供了方向。

关键词 农杆菌发酵;机理模型;最小二乘支持向量机;混合建模;鸟群算法

第一作者:硕士研究生(刘登峰博士为通讯作者,E-mail:liudf@jiangnan.edu.cn)。

基金项目:国家自然科学基金青年项目(21706096);江苏省自然科学基金青年项目(BK20160162);江苏省博士后科研项目(1601009A);第62批中国博士后科学基金面上资助二等资助(2017M621627)

收稿日期:2018-09-24,改回日期:2019-01-02

DOI:10.13995/j.cnki.11-1802/ts.018877

热凝胶多糖是农杆菌(Agrobacterium sp.) ATCC31749发酵产生的一种重要的高分子量均一线性胞外多糖[1],因其特有的凝胶功能,在食品和制药行业具有十分广泛的应用。随着凝胶多糖在生物医学中应用的重要性日益提高,专家们一直致力于通过提高发酵效价来降低凝胶多糖的生产成本。目前在发酵过程中已经提出了多种策略来提高发酵效价:(1)控制pH值。如LEE等[2]通过控制pH值以遵循最佳分布,并通过反馈最优控制实现凝胶多糖产量的最大化;(2)构建基因工程菌株。如SHIN等[3]使用强有力的启动子和工程菌株将纤维二糖高效地转化为凝胶多糖,以及YU等[4]证实,crdR可通过激活其生物合成基因的表达来调节凝胶多糖合成;(3)添加辅因子和更换廉价底物。如WEST等通过以浓缩玉米蒸馏液为底物[5]和添加嘧啶碱[6]来提高凝胶多糖的产量。

新近研究表明,在热凝胶发酵过程中,溶氧浓度(dissolved oxygen tension, DOT)不仅影响细胞生长速率、死亡速率而且对产物凝胶多糖和副产物合成均有重要影响[1]。因此,如何选择合适的溶氧过程控制已经成为强化凝胶多糖产物合成的关键途径之一,而建立以溶氧为输入变量的高精度热凝胶发酵控制模型,对指导以实现产物最大化的溶氧过程控制优化具有重要的意义。因此,建立基于溶氧浓度为关键输入变量的高精度发酵产物浓度预测模型亟需进行研究。

发酵模型分为白箱模型、黑箱模型和灰箱模型。白箱模型(即机理模型)[7-12]能够清楚地反映出发酵过程中生物量与一些辅助变量之间的关系,展现出发酵过程的主要框架,但模型精度不高。黑箱模型(即经验模型)[13-18]根据对象的输入输出数据,利用智能计算方法直接建模,结构简单,非线性拟合能力强,但由于黑箱模型不考虑发酵过程机理知识,过于依赖训练数据,容易造成模型过拟合,且模型泛化能力弱,不具有可解释性。为了克服这些缺点,灰箱模型应运而生。灰箱模型(即混合模型)是结合了机理模型和经验模型的优点而建立的模型。GHOVVATI等[19]用遗传算法和粒子群算法进行混合来估计动力学模型中的参数,董亚明[20]基于双神经网络与机理模型混联建立了发酵过程混合模型,桑海峰[21]、黎兴宝等[22]均是基于机理知识和最小二乘支持向量机建立了混合发酵模型。

而在农杆菌发酵法产凝胶多糖的溶氧优化方面,ZHANG等[1]在Logistic方程和Luedeking-Piret方程的基础上用Runge-Kutta法来求解动力学模型,并用遗传算法来寻找模型参数,根据模型参数与溶氧浓度的关系建立以溶氧体积分数预测发酵产物浓度的模型,但是该模型求解方法计算量大,求解精度有待提高。针对该问题,本文在ZHANG等建立的机理模型的基础上,首先通过添加模糊加权思想和混合核函数方法对最小二乘支持向量机(least squares support vector machine, LSSVM)算法进行优化改进;然后用改进的LSSVM算法求解机理模型的动力学方程,实现混合建模;最后对建立的混合模型实现关键控制变量的单一化,并进行了以实现产物浓度最大化为目的的溶氧过程控制曲线优化。

1 材料与方法

1.1 菌株

本文所用的微生物农杆菌(Agrobacterium sp.) ATCC31749来源于江南大学生物工程学院。

1.2 培养基

实验种子发酵培养基:葡萄糖、酵母浸膏、KH2PO4、MgSO4,pH 7.0~7.2。

分批补料发酵培养基:葡萄糖、酵母提取液、KH2PO4、MgSO4·7H2O、NH4Cl,还包含少量微量元素(NaCl、CaCl2、MnCl2、FeCl3·H2O)。

1.3 培养方法

将500 mL培养瓶中的100 mL种子发酵培养基接种于土壤杆菌(Agrobacterium sp.) ATCC31749培养物中,初始pH 7.0~7.2,温度为30 ℃,然后在200 r/min振荡18 h。发酵实验在7 L搅拌槽发酵罐中进行,搅拌速率为400 r/min,在细胞生长阶段pH值维持在7.0,当氮被消耗完时调整pH值为5.5,温度为30 ℃。

1.4 不同溶氧浓度下菌株发酵

在发酵过程中通过使用氧电极的方式分别控制溶氧体积分数维持在15%,30%,45%,60%和75%并分批做实验,实验环境与1.3中相同。

2 发酵产物浓度预测的混合建模

为从溶氧控制角度优化发酵过程,实现提高凝胶多糖产量和降低生产成本,本文针对文献[1]中模型精度不高的问题,采用融合建模策略,来实现高精度预测模型的建立。总体思路是首先建立机理模型,在文中为微分方程组,然后将微分方程作为LSSVM的约束方程求出生物量浓度、氮浓度、葡萄糖浓度和多糖产量随时间变化的情况。分别用溶氧体积分数为15%、30%、45%、60%和75%的实验数据进行训练,用鸟群算法寻找不同溶氧体积分数下的最优参数值,分析出溶氧体积分数与模型参数之间的关系,然后用溶氧体积分数作为输入变量建立由溶氧体积分数预测发酵产物浓度的模型,最后用鸟群算法寻找最优溶氧体积分数,使得多糖产物浓度最大(图1)。

图1 混合模型结构流程图

Fig.1 Mixed model structure flow chart

2.1 机理模型

农杆菌ATCC31749发酵合成凝胶多糖只有在限氮的条件下才会进行[1],因此,在农杆菌的发酵过程中,在热凝胶合成阶段,由于缺乏氮源,细胞的生长受到抑制,葡萄糖主要用来合成多糖和维持细胞正常的代谢。所以文中机理模型包括了氮源浓度、葡萄糖浓度、生物量浓度以及多糖产物浓度在发酵过程中随时间变化的关系(参数意义见表1)。

表1 模型参数意义

Table 1 Meaning of model parameters

参数名称参数意义参数名称参数意义X生物量浓度YPG每消耗1g葡萄糖的多糖产量μ生长速率β非细胞生长相关的凝胶多糖形成参数kd死亡速率mGlc维持系数Fi进料流率CGlc,F进料介质中葡萄糖浓度V培养液体积P多糖产量浓度N氮浓度α细胞生长相关的凝胶多糖形成参数YXN每消耗1g氮源的生物量产量βmax最大非细胞生长相关的凝胶多糖形成参数G葡萄糖浓度KG葡萄糖抑制常数YXG每消耗1g葡萄糖的生物量产量kp多糖产量抑制系数

文中机理模型是在两个假设的基础上构建的:(1)氮源是细胞生长过程中的限制性底物;(2)葡萄糖用于细胞生长、细胞维持和多糖生物合成。

生物量浓度、氮源浓度、葡萄糖浓度以及多糖产量浓度在发酵过程中的变化简述如公式(1)~(4)[1]

(1)

(2)

(3)

(4)

其中的动力学参数表示如下:

(5)

(6)

2.2 LSSVM的混合核函数

对LSSVM而言,采用不同的核函数所建立的LSSVM的性能是不同的,因此核函数的选择至关重要。核函数的主要种类为:

线性核函数:K(x,xi)=xTxi;

多项式核函数:K(x,xi)=(γxTxi+r)p,γ>0;

径向基核函数:

σ>0;

Sigmod核函数:K(x,xi)=tanh(γxTxi+r),γ>0,r>0;

根据核函数的特征,可以将核函数分为局部核函数和全局核函数[23-25]。局部核函数的局部学习能力较强,即局部核函数对距离测试点周围小范围的数据影响较大,全局核函数则相反。由文献[23-25]可知,上述核函数中多项式核函数属于全局核函数,径向基核函数属于局部核函数,且基本核函数的线性组合仍为核函数,因此,本文采取的核函数为多项式核函数与径向基核函数的线性组合。

ε∈[0,1]σ>0,γ>0

(7)

对上述核函数求偏导可得:

2.3 模糊加权LSSVM求解动力学模型

由于发酵过程的复杂性和不确定性,不同时期的实验数据对模型建立的重要性是不同的,因此,本文在模型训练时对每个样本加入模糊加权隶属度μi[26]。对于文中一阶非线性常微分方程,在LSSVM框架下,可将微分方程转化为如下的优化问题,以式(1)为例,将式(1)作为LSSVM的约束条件进行计算,具体如下:

s.t. ωTφ′(ti)+b1=f(ti,yi)+ei,i=1,2,k N,

(8)

ωTφ(t1)+b1t1+b=p1,

ωTφ(ti)+b1t1+b+ξi=yi,i=1,2,k N.

其中,yi的初始值。假设有N个样本,第1个样本距离待预测样本最近,第2个样本次最近,…,第N个样本距离最远,因此本文中第i个样本的模糊加权隶属度μi定义为:

(9)

建立拉格朗日函数如下:

由KKT条件可得:

=γμiei+αi=0,i=2,3,k,N,

=ωTφ′(ti)+b1-f(ti,yi)-ei=0,i=2,3,k,N,

=ωTφ(t1)+b1t1+b-pi=0,

=ωTφ(ti)+b1t1+b+ξi-ei=0,i=2,3,k,N,

消去ωeiξi后,整理以上公式如下:

其中, T=[t2,…,tN],f=[f(t2,y2),…,f(tN,yN)]T,D(y)=diag[f′(t2, y2),

通过牛顿法解上式方程组,可以得到一组yi,i=1,2,…N.yit=ti时的值,再将p1yi组成新的序列再以为训练样本,重新构造原方程的近似解转化成LSSVM优化问题,

(10)

建立拉格朗日函数如下:

(11)

由KKT条件并消除得到如下线性方程组:

(12)

为核函数矩阵。

通过解上式方程组可得原非线性常微分方程初值问题的近似解,其形式如下:

(13)

2.4 鸟群算法寻优

鸟群算法是在2015年由MENG等提出的模仿自然界鸟群觅食、警戒和飞行行为的群智能算法[27-28],具有寻优精度高,鲁棒性好等优点。

本文中鸟群算法有两个用处:(1)动力学模型中有一些未知的参数用鸟群算法对这些参数和核函数中的参数(σ)进行寻优,得到使误差最小的最优参数。(2)当建立起由溶氧浓度预测多糖产物浓度的模型之后,用鸟群算法寻找使得发酵产物浓度最大的最优溶氧体积分数。

3 实验仿真、评估与应用

3.1 农杆菌发酵实验与仿真

在不同溶氧体积分数下得到的XNGP的预测值,并与1.4中的实验值进行比较,用误差平方和来衡量预测精度,具体公式如下:

Zall=ZX+ZN+ZG+ZP

(14)

式(14)中:Xi,expNi,expGi,exp以及Pi,exp分别代表农杆菌ATCC 31749发酵过程中生物量浓度、氮浓度、葡萄糖浓度和多糖产量浓度的实验值,而Xi,simNi,simGi,simPi,sim分别代表动力学模型对生物量浓度、氮浓度、葡萄糖浓度和多糖产量浓度的预测值。将文中模型预测结果与ZHANG等的实验结果进行对比,实验结果如图2~图6所示。表2为2种模型的仿真误差对比(模型1是文献[1]中模型,模型2是本文混合模型)。

从图2~图6的实验仿真结果中可以看出:在不同溶氧体积分数下,文中混合模型即模型2对生物量、氮、葡萄糖和凝胶多糖质量浓度的预测值均更贴近实验值。2种模型的误差对比如表2所示,从表2中可以看出,本文中建立的混合模型2,其预测误差平方和比文献[1]中误差平方和的平均值降低了40%。因此,本文中建立的混合模型与已有模型相比,其仿真精度更高。

图2 15%DOT时各参数预测图

Fig.2 Prediction of each parameter at 15% DOT

图3 30%DOT时各参数预测图

Fig.3 Prediction of each parameter at 30% DOT

表2 两种模型误差对比

Table 2 Comparison of the error between the two models

φ(O2)/%模型1(Zall)模型2(Zall)15811.347 8408.404 530306.428 7214.628 345614.614 1272.859 260561.615 1451.332 275776.065 1413.212 0误差平均值614.014 2352.087 2

3.2 不同溶氧浓度下模型仿真中的参数取值

由于微生物农杆菌ATCC31749发酵过程是与非细胞生长相关的,所以α为0。表3中列出了不同溶氧浓度下动力学模型参数的取值,从表3可以看出,μmax值在0.285 0附近,KN值在0.018 5附近,值为0.4附近,均变化不大在溶氧浓度为60%(0.799 1)时最大,然后依次为45%(0.745 7)、30%(0.686 1)、15%(0.596 8)、75%(0.562 5)。mGlc在15%溶氧(0.073 9)时最大,然后依次是75%(0.033 1)、30%(0.024 4)、45%(0.013 2)、60%(0.005 0)。kp的变化趋势与相似,在60%(5.957 1×10-4)时最大,在75%(1.813 3×10-4)时最小。由模型参数值的变化趋势可以推测出多糖产物浓度在溶氧浓度小于60%时是随溶氧浓度增加而增加的,在溶氧体积分数大于60%时是随溶氧浓度增加而减小的。

图4 45%DOT时各参数预测图

Fig.4 Prediction of each parameter at 45% DOT

图5 60%DOT时各参数预测图

Fig.5 Prediction of each parameter at 60% DOT

表3 不同溶氧浓度下的模型参数取值

Table 3 Values of model parameters under different dissolved oxygen concentration

参数DOT(15%)DOT(30%)DOT(45%)DOT(60%)DOT(75%)μmax/h-10.285 00.284 80.284 4 0.285 00.285 0KN/(g·L-1)0.018 40.018 50.018 50.018 50.018 2kd/[L·(g·h)-1]2.098 7×10-42.152 8×10-42.847 5×10-42.954 9×10-43.264 0×10-4YXN/(g·g-1)1.684 51.709 71.751 01.882 61.778 5YXG/(g·g-1)0.400 00.400 60.400 00.432 00.400 0YPG/(g·g-1)0.596 80.686 10.745 70.799 10.562 5mGlc/[g·(g·h)-1]0.073 90.024 40.013 20.005 00.033 1 βmax/(g·g-1)0.108 80.200 30.224 80.247 90.100 0 KG/(g·L-1)19.164 3 20.511 620.279 521.591 620.570 7kp/(g·L-1)2.516 9×10-42.800 0×10-43.615 1×10-45.957 1×10-41.813 3×10-4

3.3 获取溶氧优化控制曲线

在农杆菌ATCC31749发酵过程中,溶氧体积分数影响着细胞生长速率,细胞死亡速率,多糖产物的积累和副产品的生成等,因此溶氧体积分数是影响发酵产物浓度的重要参数。溶氧体积分数分别为15%、30%、45%、60%和75%时用鸟群算法寻找最佳参数取值如表3所示。从表3中可以看出,在不同溶氧下,的取值变化不大,所以文中主要分析了等主要参数与溶氧浓度之间的函数关系(表4)。

在得到溶氧体积分数和主要模型参数之间的函数关系后,用溶氧体积分数代替模型参数进行计算,从而建立起了由溶氧体积分数预测发酵产物浓度的混合模型。表5中列出了文献[1]中模型在不同溶氧体积分数下的凝胶多糖产物体积分数的仿真预测值,混合模型的仿真预测值和实验值。

图6 75%DOT时各参数预测图

Fig.6 Prediction of each parameter at 75% DOT

表4 溶氧浓度与各模型参数的关系

Table 4 Relationship between dissolved oxygen concentration and various model parameters

模型参数模型参数与溶氧浓度的关系kd-1.083 7×10-9×O3+1.438 5×10-7×O2-3.445 1×10-6×O+0.000 229 96YXN-6.217 3×10-6×O3+7.859×10-4×O2-0.025 799×O+1.921 4YPG-2.669 1×10-6×O3+2.866 8×10-4×O2-0.007 545 9×O+0.582 32mGlc2.711 1×10-5×O2-0.002 628×O+0.115 3βmax-2.567 9×10-6×O3+1.942 2×10-4×O2+0.000 284 44×O+0.072 86KG-1.860 7×10-5×O3+0.001 498 6×O2+0.018 352×O+18.714 6kp-1.732 8×10-8×O3+2.106 7×10-6×O2-6.991 1×10-5×O+0.000 897 7

表5 不同溶氧浓度下各模型多糖产物浓度预测值与实验值

Table 5 Predicted values and experimental values ofcurdlan′concentrations in various models under differentdissolved oxygen tensions

溶氧体积分数/%发酵结束多糖产物质量浓度/(g·L-1)模型1预测值模型2预测值实验值DOT(15)27.222.4923.50DOT(30)33.331.7530.30DOT(45)41.337.7338.70DOT(60)41.343.6242.80DOT(75)21.521.1418.90最优溶氧(52)48.548.85

从表5中可以看出,2种模型都能通过溶氧体积分数预测出凝胶多糖产物浓度且2种模型的最优溶氧均为52%,但是模型1的预测值与实验值相差在3左右,而本文所建立的以溶氧为控制参数的模型2与实验值相差仅1左右。因此,模型1的预测精度小于本文所建立的混合模型的预测精度。

在农杆菌发酵工业中,如何通过控制溶氧来实现目的产物的最大化,是农杆菌发酵控制策略开发的主要任务之一。因此,以混合模型为基础,进行了以实现凝胶多糖产量最大化为目的的最优溶氧过程控制策略预测,结果如图7、图8所示。在图7所示的溶氧控制模式下,模型仿真的凝胶多糖的产物质量浓度为48.85 g/L(图8-d)。

图7 溶氧过程控制图

Fig.7 Dissolved oxygen process control chart

4 结论

本文使用优化后的LSSVM对动力学模型进行估计来提高预测精度。建立了以溶氧体积分数为输入控制量的发酵产物浓度混合预测模型。从文中实验仿真结果中可以看出,LSSVM求解的动力学模型精度比传统的数值解法的误差平均降低40%,以LSSVM为基础的混合模型的预测精度约提高2,因此文中混合模型的建立是有效的,模型预测精度更高。最后用鸟群算法找到使得多糖产物质量浓度最大(48.85 g/L)的最优溶氧体积分数(52%)。该混合模型为进一步通过溶氧优化控制来提高多糖发酵产量提供了新的方向。

图8 最优溶氧时各参数值

Fig.8 Parameter value of optimal dissolved oxygen concentration

参考文献

[1] ZHANG Hongtao,ZHU Li,LIU Dengfeng,et al. Model-based estimation of optimal dissolved oxygen profile in Agrobacterium sp.fed-batch fermentation for improvement of curdlan production under nitrogen-limited condition[J]. Biochemical Engineering Journal, 2015, 103: 12-21.

[2] LEE J H, LEE I Y, KIM M K, et al. Optimal pH control of batch processes for production of curdlan by Agrobacterium species[J]. Journal of Industrial Microbiology and Biotechnology, 1999, 23(2):143-148.

[3] SHIN H D, LIU LONG, KIM M K, et al. Metabolic engineering of Agrobacterium sp. ATCC31749 for curdlan production from cellobiose[J]. Journal of Industrial Microbiology & Biotechnology, 2016, 43(9):1 323-1 331.

[4] YU Xiaoqin, ZHANG Chao,YANG Liping, et al. CrdR function in a curdlan-producing Agrobacterium sp. ATCC31749 strain[J]. BMC Microbiology,2015, 15(1):25.

[5] WEST T P. Pyrimidine base supplementation effects curdlan production in Agrobacterium sp. ATCC 31749[J]. Journal of Basic Microbiology, 2010, 46(2):153-157.

[6] WEST T P, NEMMERS B. Curdlan production by Agrobacterium sp. ATCC 31749 on an ethanol fermentation coproduct[J]. Journal of Basic Microbiology, 2008, 48(1):65-68.

[7] 岳国君, 刘文信,刘劲松,等. Logistic模型模拟乙醇发酵产物动力学[J]. 农业工程学报, 2015, 31(5):280-286.

[8] 于晓萌,张京良,孙永超,等.基于发酵优化和动力学建立Levan果聚糖生产的数字化模型[J]. 食品与发酵工业, 2016,42(12):20-25.

[9] 徐莹, 何国庆. 弹性蛋白酶分批发酵动力学模型的建立[J]. 农业生物技术学报, 2007, 15(1): 138-141.

[10] GERNAEY K V, LANTZ A E, TUFVESSON P, et al. Application of mechanistic models to fermentation and biocatalysis for next-generation processes[J]. Trends in Biotechnology, 2010, 28(7):346-354.

[11] 贺晓冉,陈宸,金光石,等. 青霉素发酵过程的模型仿真与补料优化[J]. 化工学报, 2012, 63(9): 2 831-2 835.

[12] 李浩, 任嘉红,叶建仁,等. 吡咯伯克霍尔德氏菌JK-SH007分批发酵动力学模型的构建[J]. 南京林业大学学报(自然科学版), 2016, 40(2):173-178.

[13] 花亚梅,赵贤林,王效华,等. 基于改进BP神经网络的厌氧发酵产气量预测模型[J]. 环境工程学报, 2016, 10(10):5 951-5 956.

[14] 杨小梅, 刘文琦,杨俊. 基于分阶段的LSSVM发酵过程建模[J]. 化工学报, 2013, 64(9): 3 262-3 269.

[15] 朱湘临, 华天争. 基于混沌果蝇优化最小二乘支持向量机的秸秆发酵过程软测量建模[J]. 北京工业大学学报, 2016, 42(10):1 468-1 474.

[16] 沙如意, 楼坚,蔡成岗,等. 基于遗传算法优化BP神经网络的丙酮丁醇梭菌发酵预测模型研究[J]. 发酵科技通讯, 2016, 45(1): 23-26.

[17] 周梦舟, 吴珊,柳念,等. 基于神经网络对枯草芽孢杆菌富硒过程的建模研究[J]. 中国食品学报, 2016,(12):66-74.

[18] 公彦杰. 基于LS_SVM建立发酵过程动态模型的研究及软件实现[D]. 北京:北京工业大学, 2010.

[19] GHOVVATI M, KHAYATI G, ATTAR H, et al. Comparison across growth kinetic models of alkaline protease production in batch and fed-batch fermentation using hybrid genetic algorithm and particle swarm optimization[J]. Biotechnology & Biotechnological Equipment, 2015, 29(6):1 216-1 225.

[20] 董亚明. 融合机理模型与智能模型的复杂过程混合建模研究[D]. 上海:华东理工大学, 2015.

[21] 桑海峰. 基于机理知识与最小二乘支持向量机的诺西肽发酵过程混合建模方法[J]. 系统仿真学报, 2008, 20(2): 468-472.

[22] 黎兴宝. 基于机理知识与改进LS_SVM的谷氨酸发酵混合建模[D].无锡:江南大学, 2011.

[23] 徐飞.基于混合核函数的LSSVM发酵建模[D].大连:大连理工大学,2012.

[24] 刘春卫, 罗健旭. 基于混合核函数的PSO-SVM分类算法[J]. 华东理工大学学报(自然科学版), 2014, 40(1):96-101.

[25] 王立达.基于混合核函数的SVM及其应用研究[D].大连:大连海事大学,2016.

[26] 伍铁斌,刘云连,李新君,等.KPCA_模糊加权LSSVM预测方法及其应用[J].计算机测量与控制,2012,20(3):617-620.

[27] MENG Xianbing,GAO XZ,LU Lihua,et al. A new bio-inspired optimisation algorithm:Bird swarm algorithm[J]. Journal of Experimental & Theoretical Artificial Intelligence, 2015, 28(4): 673-687.

[28] 曾嶒,彭春华,王奎,等. 基于鸟群算法的微电网多目标运行优化[J]. 电力系统保护与控制, 2016, 44(13):117-122.

Hybrid modeling and optimization of Agrobacterium fermentation process based on a mechanism model and fuzzy weighted LSSVM algorithm

SHAO Yuqian1,2, ZONG Yuan1,2, LIU Yian1,2, LIU Dengfeng1,2*

1(School of Internet of Things,Jiangnan University, Wuxi 214122,China) 2(Key Laboratory of Light Industry Process Control Ministry of Education(Jiangnan University), Wuxi 214122, China)

Abstract To solve the low prediction accuracy of curdlan concentration during Agrobacterium sp. fermentation, a new hybrid model based on fuzzy weighted LSSVM (least squares support vector machine) algorithm and a mechanism model was proposed. Firstly, the LSSVM algorithm was optimized by adding fuzzy weighted idea and using a mixed kernel function. The optimized LSSVM was used to solve the kinetic model of fermentation process of Agrobacterium sp. Bird swarm algorithm (BSA) was used to optimize the kinetic model parameters. The correlation functioned model between dissolved oxygen tension and various parameters was summarized and substituted into the kinetic model. A hybrid fermentation kinetic model that used dissolved oxygen tension as a key control variable was established. Finally, the BSA was used to find a controlling strategy for the optimal process of dissolving oxygen that maximized curdlan concentration. The results demonstrated that the prediction accuracy of hybrid model improved. When the dissolved oxygen concentration in the polysaccharide-producing period was 52%, the curdlan concentration reached the highest (48.85 g/L). The hybrid model of Agrobacterium fermentation process established in this study together with the results of optimized dissolved oxygen provided a direction for fermentation industries to further improve the yield of polysaccharides through optimal dissolved oxygen controlling strategy.

Key words Agrobacterium fermentation; mechanism model; least squares support vector machine(LSSVM); hybrid modeling; bird swarm algorithm(BSA)