DOI:10.14186/j.cnki.1671-6620.2026.03.008
中图分类号:TF741.5
范文静, 战东平, 张岩, 杨华峰
| 【作者机构】 | 东北大学冶金学院; 石钢京诚装备技术有限公司 |
| 【分 类 号】 | TF741.5 |
| 【基 金】 | 黑龙江省揭榜挂帅科技攻关项目(2022ZXJ03A02). |
炼钢是在高温条件下发生多相剧烈物理化学反应的过程,其核心任务是冶炼出满足终点成分与温度要求的合格钢水[1].精确的终点温度预报能够及时调整各种辅料的加入策略, 从而对造泡沫渣、供电吹氧等相关工艺的优化操作起到指导性作用[2].然而,钢水温度难以实现实时、连续测量,因此亟需构建精准的终点钢水温度预报模型,以缩短电弧炉冶炼周期、降低生产成本、提升生产综合效率.
根据建模方式的不同,电弧炉终点温度预报模型主要分为静态机理分析和动态算法预测[3-4].静态机理分析在建模时需进行大量简化与假设,这不仅会带来繁杂的计算问题[5-7],难以实现数据的有效、及时反馈,更无法很好地适应钢厂实际生产条件的动态变化[8-10].而动态算法预测立足于数据自身的相关性,无需依赖先验知识积累或逻辑上的归纳、演绎与推理,这一特性使其尤为适用于机理模型过于复杂、难以直接应用的场景[11].近年来,学者们更青睐动态算法预测,涌现了多种算法用于预测钢水终点温度.例如,Takagi-Sugeno 模糊算法[12]、增量神经网络[13]、栈式自编码-拟牛顿回归-差分进化(SAE-SBR-DE)[14]、反向传播(BP) 神经网络[15]、多核支持向量机(M-SVM)[16]、生成对抗网络(GAN)[17]、模糊神经网络[18]、极端梯度提升(XGBoost)[19]等方法,均在钢水终点温度预测领域取得了一定应用成效.但是,受现场工艺参数影响,终点温度预报模型在电弧炉炼钢中的应用始终是一个具有挑战性的难题.此外,与BOF[20]、LF[21]等炼钢设备相比,电弧炉终点温度预报模型与机理知识的融合程度相对较低.将机理建模与动态算法相结合,能够充分发挥二者优势,弥补各自短板,进而提高预测精度与可靠性.因此,深入研究电弧炉熔池成分变化规律,强化机理分析与数据驱动方法的融合,构建高精度、高效率的成分预报模型,已成为该领域当前重要的研究方向.
本文中以某钢厂130 t SHARC 电弧炉生产数据为基础,将机理分析与算法模型紧密结合,筛选确定模型输入变量;在此基础上,通过持续优化算法,构建基于BP 神经网络的终点温度预报模型,以期为企业实际生产提供参考与指导.
人工神经网络技术在冶金领域的持续发展,为冶金科研与工程人员提供了全新的知识获取与处理手段.近年来,BP 神经网络凭借其优异的非线性映射能力与实时性,已被广泛应用于炼钢终点预测、故障诊断及炉料模拟等领域[22-24].本文中选用具备强大非线性映射能力的BP 神经网络,通过其反向传播机制迭代优化网络权值与阈值,直至网络平均绝对误差(MAE)达到最小.本研究采用Python 作为编程语言,以PyCharm 为集成开发环境(IDE),基于TensorFlow 2.1 框架完成神经网络的构建与训练.
在构建有效的SHARC 电弧炉温度预报模型时,合理选取输入变量、降低数据复杂度是关键环节.而高维数据易引发“维度灾难”,因此有必要对模型输入参数进行优化.
结合SHARC 电弧炉的实际生产情况,本研究中影响钢水终点温度的主要变量有电耗量、废钢量、废钢预热温度、碳粉量、石墨球量、石灰量、白云石量、镁球量、冶炼时间、耗氧量、天然气消耗量、出钢量、出钢温度、冷却水量/温度、烟气量/温度等.在上述影响因素中,冷却水、烟气等能量损耗项的数据无法实现在线精确测量;而建立温度预报模型时,要求其输入与输出变量均为每炉次可独立获取且能准确测量的参数.例如,SHARC 电弧炉内的废钢预热温度对过程温度及终点温度影响显著,但在实际生产中无法实现逐炉或逐批次精确测量,因此不能作为模型输入变量.
为精准选取电弧炉终点温度预报模型的输入变量,本研究采用统计分析软件SPSS,对生产现场可直接获取的温度影响因素进行相关性分析.在相关性分析前,先通过Q-Q 图法对各变量数据的分布特征进行检验.结果表明:耗氧量、碳粉量、废钢量、冶炼时间、出钢量、终点温度、白云石量及电耗量的散点分布与理论对角线拟合程度较高,数据服从正态分布;石墨球量、镁球量及天然气消耗量的散点在对角线附近波动,数据近似服从正态分布;而石灰量的散点与对角线偏离较大,不满足正态分布.由于绝大部分变量数据符合正态分布,故本文采用皮尔逊相关系数[25]作为数据相关性度量指标[见式(1)],重点考察这些变量与终点温度的关联度,结果如表1 所列(所有计算出的相关系数均取绝对值进行处理).在表1 中,X1~X11依次代表废钢量、石灰量、石墨球量、白云石量、镁球量、碳粉量、耗氧量、天然气消耗量耗、电耗量、通电时间、出钢量;Z 代表终点温度.
表1 终点温度影响因素的相关性分析
Table 1 Correlation analysis affecting endpoint temperature%
?
式中:ρX,Y为皮尔逊相关系数;cov(X,Y)为变量X和Y 的协方差;σX 和σY 为变量X 和Y 的标准差.
相关系数的值越大,相关性越强.从表1 中可以看出,各变量对终点温度的影响程度从大到小依次排序为:X9>X1>X10>X7>X8>X5>X3>X6>X4>X2>X11.在SHARC 电弧炉炼钢中,主要的能量来源是电能,电耗量X9 会直接影响终点温度.为确保氧化反应充分进行,有效脱除足量碳、磷,使钢液温度与成分均匀稳定,夹杂物充分上浮排除,必须严格保证通电时间X10.废钢量X1 直接决定冶炼过程的能量消耗.氧气与天然气可强化燃烧反应,同时吹氧引发的碳二次燃烧能够释放大量热量,构成重要的潜在热源.石墨球、碳粉等是电弧炉配碳与泡沫渣形成的主要原料,而泡沫渣对提升电弧炉热效率、减少钢渣表面热损失具有关键作用.造渣剂(石灰、白云石等)的质量直接影响泡沫渣形成效果与脱磷效率,是保障良好泡沫渣形态与合适炉渣碱度的必要条件;造渣过程虽伴随成渣热释放,但渣料自身升温同样会吸收热量,因此,石灰与白云石消耗量也是影响SHARC 电弧炉温度的重要参数.本研究中的SHARC 电弧炉主要生产特殊钢,其出钢量要求严格且波动范围小,故与终点温度的相关系数也最小.综上分析,在建立模型的过程中,舍弃相关性系数最小的X11,选取X1~X10作为SHARC 电弧炉终点温度预报模型的输入变量,终点温度Z 作为输出变量.
2.2.1 数据筛选
从SHARC 电弧炉收集的实际生产数据中,存在缺失、错误及异常数据等问题,需要对这些异常数据进行预处理,以确保建立有效的SHARC电弧炉终点温度预报模型.
箱线图可用于直观呈现数据分布特征并识别异常值.其中,箱子上下边界分别对应上四分位数Q3 和下四分位数Q1,箱内横线代表中位数Q2;四分位距IQR 为Q3 和Q1 的差值,通常以1.5 倍IQR 作为判别阈值,正常数值范围为Q1-1.5IQR 至Q3+1.5IQR.本文以某钢厂130 t SHARC 电弧炉采集的1 729 炉生产数据为基础,选取石墨球量、碳粉量及镁球量为例开展数据预处理与分析,其余工艺参数均采用相同处理方法.图1(a)中黑色散点代表石墨球量、碳粉量及镁球量对应的异常值,离群点剔除前后的数据分布分别如图1(a)(b)所示.基于该原理,本文采用箱线图法对终点温度预报模型的输入与输出变量进行异常值剔除.经数据预处理后,最终得到合格生产数据932 组,并按照训练集与验证集10 ∶1 的比例,完成终点温度预报模型的构建训练与验证.
图1 箱线图法
Fig. 1 Boxplot method
(a)—未剔除异常值;(b)—剔除异常值.
2.2.2 数据标准化和反标准化
在某钢厂130 t SHARC 电弧炉实际生产中,模型各输入、输出变量的数量级差异较大,如废钢量为吨级,石灰、镁球等辅料加入量为千克级.这种量级差异会导致终点温度预报模型的权值出现较大波动,影响模型精度.为消除该影响,采用式(2)对模型变量进行标准化处理;在模型预测阶段,则采用式(3)对输出结果进行反标准化,将标准化数据还原为真实数值.
式中
为标准化结果;Xi 为当前数据的实际值;Xmean为样本均值;Xstd为样本方差.
BP 神经网络的主体结构包含输入层、隐含层与输出层. 本文采用Python 语言编程,基于TensorFlow 框架构建全连接层BP 神经网络,并通过损失函数曲线、平均绝对误差(MAE)、命中率(HR)等指标评估模型性能.其中,MAE 值越小、HR 值越大,代表SHARC 电弧炉终点温度预报模型的性能越优.MAE 与HR 的计算公式如下:
式中:yi 为真实值
为预测值;n 为误差满足阈值的个数;N 为总样本数.
为避免模型发生过拟合并提升泛化能力,本研究引入L2 正则化系数.为确定最优正则化系数,基于BP 神经网络设计了5 组对比实验,均采用单隐藏层结构、ReLU 激活函数与Adam 优化器,仅调整L2 正则化系数.方案1~5 的隐藏层层数均为1 层,神经元数量均为8 个,正则化系数依次设置为0.05、0.10、0.15、0.17 和0.18,训练结果如图2 所示.

图2 方案1~5 对照实验训练结果
Fig. 2 Results of control experimental training in 1~5 groups
(a)—方案1;(b)—方案2;(c)—方案3;(d)—方案4;(e)—方案5.
从图2(a)~(d)中可以看出,随着正则化系数增大至0.17,训练集与验证集两条损失曲线由明显发散逐渐趋于平行,表明模型前期的过拟合问题得到有效抑制,训练过程逐步趋于稳定.而在图2(e)中,训练集损失曲线位于验证集上方,说明当L2 正则化系数过大(0.18)时,模型学习会被过度约束.因此,本研究选取最优L2 正则化系数为0.17.
在BP 神经网络中,激活函数的合理选取对网络性能具有直接影响,是模型构建的关键环节.为此,本文重点对比了Sigmoid 函数与ReLU 函数在网络训练中的表现.在单隐藏层结构下,分别设置神经元为8、10、12、14 和15 个,对比不同激活函数对模型预报性能的影响,结果如图3 所示.
图3 不同激活函数的实验结果
Fig. 3 Experimental results of different activation functions
本文中采用平均绝对误差作为评判激活函数优劣的指标.由图3 可以看出,ReLU 激活函数对应的平均绝对误差均低于Sigmoid 函数,表明ReLU 更适用于本预报模型.
隐含层层数直接影响模型对非线性数据的拟合能力,层数越多,模型拟合能力越强,但层数过多反而会导致模型性能下降.本文采用传统试凑法结合隐含层节点数单向渐变法对网络结构进行优化,以确定最优的隐藏层神经元数量.根据前述实验结果(模型激活函数选择ReLU,正则化系数为0.17),设计了方案6~12,如表2 所列.
表2 不同隐藏层的7 种网络结构
Table 2 Seven network structures with different hidden layers
?
图4(a)示出了单隐藏层下不同神经元数量的预测结果.由图可知:当隐藏层神经元为14 个时,温度误差在±15 ℃和±10 ℃范围内的HR 分别为90%和83.3%,MAE 为6.04;若继续增加或减少神经元数量,各项考核指标均呈变差趋势.这说明在单隐藏层结构下,神经元为14 个时模型预测性能最优.图4(b)示出了双隐藏层下不同神经元数量的预测结果.由图可知:当神经元为230 个时,MAE 降至最低值5.7;温度误差在±10 ℃和±15 ℃时,模型HR 分别达到最高值88.9%和95.5%.若进一步增加神经元数量,MAE 会随之升高,HR 则有所下降,这表明模型复杂度已偏高.综合以上分析,最终确定本文终点温度预报模型采用10×14×230×1 结构的BP 神经网络.
图4 不同隐藏层神经元数量考核指标结果
Fig. 4 Results of neurons number in different hidden layers
(a)—1 层隐藏层;(b)—2 层隐藏层.
优化器是神经网络训练的核心组件,主要通过反向传播算法计算梯度,并迭代更新模型参数使损失函数最小化,进而提升模型预报精度与命中率.因此,在同一数据集上,采用不同优化器往往会使模型呈现出显著的性能差异,合适的优化器对提高模型命中率至关重要.本研究在双层隐藏层、每层230 个神经元的条件下,选取Adagrad、Nadam、RMSprop、SGD 及Adam 这5 种优化器进行对比实验,分析不同优化器对模型性能的影响,以确定适用于本预报模型的最佳优化器.
图5示出了5 种优化器的考核指标结果.由图5 可知,当使用Adam 优化器时,模型考核指标均为最优,HR 达到最大值,MAE 达到最小值,网络预测值与实测值的吻合度最高.因此,SHARC 电弧炉终点温度预报模型确定选用Adam 优化器.
图5 不同优化器考核指标结果
Fig. 5 Assessment results of different optimizers
本文结合130 t SHARC 电弧炉的能量守恒关系及现场数据可获取性,利用相关性分析确定了预报模型的10 个输入变量;在BP 神经网络中引入L2 正则化,有效抑制了模型过拟合问题;通过不断优化网络结构,使预测误差降至最低,命中率达到最优;并对比Adagrad、Nadam、RMSprop、SGD及Adam 这5 种优化器,最终选定Adam 为最优优化器,构建得到优化后的BP 神经网络预报模型.为检验该优化模型的实际应用效果,本文选取该130 t SHARC 电弧炉连续90 炉的实际生产数据进行模型验证,结果如图6 和7 所示.
图6 模型优化前后预测曲线
Fig. 6 Comparison of verification prediction curves before and after optimization
从图6 中可以看出:未优化前预测值和实际值的曲线相差较大,最大温度误差为±20 ℃,最小温度误差为±1 ℃.由图7 可知:当未优化模型温度误差为±2、±4、±6、±8、±10、±15 ℃时,命中率分别为25.5%、47.8%、67%、78.9%、82.2%和86.7%;当温度误差为±2、±4、±6 ℃时,命中率更低,对现场操作无指导意义.
图7 优化前后模型命中率的对比
Fig. 7 Comparison of hit rates before and after optimization
优化后的模型预测值与实际值曲线的契合度显著优于优化前模型;最小温度误差由±1 ℃降至0 ℃,最大温度误差由±20 ℃降至±16 ℃.随着训练迭代次数的增加,模型预测稳定性逐步提升,预测值与实际值的偏差进一步减小.当温度误差为±2、±4、±6、±8、±10、±15 ℃时,优化后模型的命中率依次提升至67.7%、76.6%、82%、85.5%、88.9%和95.5%.结果表明,优化后的BP 神经网络预报模型能够满足SHARC 电弧炉终点温度的预报精度要求.
(1)通过对比L2 正则化系数分别为0.05、0.10、0.15、0.17 和0.18 时的损失曲线,确定正则化系数取0.17 可有效抑制模型过拟合,提升网络泛化能力.
(2)结合传统试凑法与隐含层节点数单向渐变法对网络结构进行优化,结果表明,当BP 神经网络结构为10×14×230×1 时,SHARC 电弧炉终点温度预报模型的MAE 与HR 指标均达到最优.
(3) 在Adagrad、Nadam、RMSprop、SGD 及Adam 这5 种优化器中进行对比实验,结果显示,采用Adam 优化器时,模型在同一数据集上表现出最佳的预测性能.
(4)采用连续90 炉实际生产数据对优化后的模型进行测试,温度误差在±10 ℃和±15 ℃范围内的命中率分别达到88.9%和95.5%,满足SHARC 电弧炉终点温度的实际预报精度要求.
[1] Yang L Z,Li B,Guo Y F,et al. Influence factor analysis and prediction model of end-point carbon content based on artificial neural network in electric arc furnace steelmaking process[J].Coatings,2022,12(10):1508.
[2] 朱荣,吴学涛,魏光升,等. 电弧炉炼钢绿色及智能化技术进展[J]. 钢铁,2019,54(8):9-20.( Zhu Rong, Wu Xuetao, Wei Guangsheng, et al.Development of green and intelligent technologies in electric arc furnace steelmaking processes[J]. Iron and Steel,2019,54(8):9-20.)
[3] Rani K Y,Patwardhan S C. Data-driven model based control of a multi-product semi-batch polymerization reactor [ J ].Chemical Engineering Research and Design,2007,85(10):1397-1406.
[4] Bakshi B R. Multiscale PCA with application to multivariate statistical process monitoring[J]. AIChE Journal,1998,44(7):1596-1610.
[5] Bekker J G,Craig I K,Pistorius P C. Modeling and simulation of an electric arc furnace process[J]. ISIJ International,1999,39(1):23-32.
[6] Nyssen P, Colin R, Knoops S, et al. On-line EAF control with a dynamic metallurgical model[C]/ /Proceedings of 7th European Electric Steelmaking Conference, Venice, 2002:293-304.
[7] 刘锟,何平,刘浏. 电弧炉工艺模型及其应用现状[J]. 钢铁研究学报,2004,16(2):1-5.(Liu Kun, He Ping, Liu Liu. Technology model and its application status in EAF [J]. Journal of Iron and Steel Research,2004,16(2):1-5.)
[8] Feng K,Xu A J,He D F,et al. Case-based reasoning method based on mechanistic model correction for predicting endpoint sulphur content of molten iron in KR desulphurization[J].Ironmaking &Steelmaking,2020,47(7):799-806.
[9] Wei G S,Wang Y,Zhu R,et al. Influence of desulfurization with Fe2O3 on the reduction of nickel converter slag[J].Materials,2020,13(10):2423.
[10] Widomski P,Zwierzchowski M,Barełkowski A,et al. Case study of the effect of precoating on the decarburization of the surface layer of forged parts during the hot die forging process[J]. Materials,2021,14(2):422.
[11] 李克燕. 基于神经网络的电弧炉炼钢终点预报方法的研究[D]. 沈阳:东北大学,2010.(Li Keyan. Study on electric arc furnace endpoint prediction method based on neural network[D]. Shenyang:Northeastern University,2010.)
[12] Blaži A,Škrjanc I,Logar V. Soft sensor of bath temperature in an electric arc furnace based on a data-driven Takagi-Sugeno fuzzy model[J]. Applied Soft Computing,2021,113:107949.
[13] 刘锟,刘浏,何平,等. 增量神经网络模型预报100 t 电弧炉终点碳、磷和温度的应用[J]. 特殊钢,2004,25(3):40-41.(Liu Kun,Liu Liu,He Ping,et al. Application of increment artificial neural network model to prediction of end-point carbon, phosphorus and temperature for an 100 t EAF steelmaking[J]. Special Steel,2004,25(3):40-41.)
[14] Liu C,Tang L X,Liu J Y. A stacked autoencoder with sparse Bayesian regression for end-point prediction problems in steelmaking process[J]. IEEE Transactions on Automation Science and Engineering,2020,17(2):550-561.
[15] 刘志明,战东平,葛启桢,等. 基于BP 神经网络的电炉终点碳质量分数预报模型[J]. 工业加热,2018,47(4):28-31.(Liu Zhiming,Zhan Dongping,Ge Qizhen,et al. Prediction model of mass fraction of endpoint carbon of electric furnace based on BP neural network[J]. Industrial Heating,2018,47(4):28-31.)
[16] Yuan P,Mao Z Z,Wang F L. Endpoint prediction of EAF based on multiple support vector machines[J]. Journal of Iron and Steel Research,International,2007,14(2):20-29.
[17] Li C,Mao Z Z. Generative adversarial network-based real-time temperature prediction model for heating stage of electric arc furnace[J]. Transactions of the Institute of Measurement and Control,2022,44(8):1669-1684.
[18] Wang X J, You M S, Mao Z Z, et al. Tree-Structure ensemble general regression neural networks applied to predict the molten steel temperature in ladle furnace[J]. Advanced Engineering Informatics, 2016, 30(3):368.
[19] 徐猛,雷洪,何江一,等. 利用改进XGBoost 预测RH 精炼终点钢水温度[J]. 材料与冶金学报,2023,22(5):437-443.(Xu Meng, Lei Hong, He Jiangyi, et al. Predicting the endpoint steel temperature of RH refining using improved XGBoost[J]. Journal of Materials and Metallurgy,2023,22(5):437-443.)
[20] Wang M,Gao C,Ai X G,et al. Whale optimization end-point control model for 260 tons BOF steelmaking [ J]. ISIJ International,2022,62(8):1684-1693.
[21] Yang Q D,Zhang J,Yi Z. Predicting molten steel endpoint temperature using a feature-weighted model optimized by mutual learning cuckoo search[J]. Applied Soft Computing,2019,83:105675.
[22] He F,He D F,Xu A J,et al. Hybrid model of molten steel temperature prediction based on ladle heat status and artificial neural network [J]. Journal of Iron and Steel Research International,2014,21(2):181-190.
[23] Mesa Fernández J M,Cabal V Á,Montequin V R,et al.Online estimation of electric arc furnace tap temperature by using fuzzy neural networks[J]. Engineering Applications of Artificial Intelligence,2008,21(7):1001-1012.
[24] Roshani G H, Nazemi E, Roshani M M. Flow regime independent volume fraction estimation in three-phase flows using dual-energy broad beam technique and artificial neural network[J]. Neural Computing and Applications,2017,28(1):1265-1274.
[25] Dufera A G,Liu T T,Xu J. Regression models of Pearson correlation coefficient [ J]. Statistical Theory and Related Fields,2023,7(2):97-106.
SHARC electric arc furnace terminal temperature prediction model based on improved BP neural network
X