• 收藏
  • 加入书签
添加成功
收藏成功
分享

基于机器学习的木醋液多组分实时检测与优化方法研究

廖思齐 徐旗阳
  
天卓梵尔媒体号
2025年2期
1.武汉理工大学 2.广州埃登达化工有限公司

打开文本图片集

摘要木醋液是一种通过生物质在无氧或近无氧条件下热解产生的复杂有机液体,主要含有水、乙酸和苯酚等多种成分。为了提高木醋液中乙酸和苯酚的提取效率,本研究构建了基于Aspen Plus的双塔精馏分离模型,并采用机器学习技术优化成分检测过程。实验部分选取水、乙酸和苯酚作为模型化合物,通过调整进料口的质量比例,模拟不同组分配比下的精馏过程。数据预处理采用标准化方法,并将数据集分为训练集和测试集。构建了决策树回归和随机森林回归两种多输出回归模型,评估其在预测进料水、乙酸和苯酚含量方面的性能。结果表明,随机森林模型在所有预测变量上均显著优于决策树模型,特别是在苯酚含量预测上R²达0.9728,显示出卓越的预测能力。研究表明,机器学习技术在木醋液成分检测与优化中具有显著优势,能够提升精馏过程的自动化和稳定性。

关键词:木醋液,精馏分离,机器学习,随机森林,成分检测,Aspen Plus

一.介绍

木醋液,又称焦木酸、木酢液或植物酸,是一种高含氧的有机液体,主要通过生物质在无氧或近无氧条件下热解产生的烟雾冷凝而成。这一过程中涉及一系列复杂的化学反应,包括生物质的分解、挥发性组分的气相反应以及冷凝液化的物理转化。木醋液的生产原料来源丰富,涵盖木材及其废料、农作物及其副产品、城市固体废物、食品加工废料以及水生植物和藻类等多种生物质。原料的多样性为木醋液的生产提供了可靠的资源保障,不同的原料也使木醋液的化学成分和特性存在一定差异。其中,木材及其废料、农作物及其副产品是木醋液生产的主要来源,具有可持续性和经济性优势[1-2]。

木醋液的化学成分复杂多样,包含超过200种化合物,主要成分包括水、有机酸、酚类、醛类、醇类、酯类和呋喃类化合物等。其中,水的含量在80-90%之间,占据木醋液的主要成分;有机酸的含量为10-50%,其中最重要的是乙酸(CH₃COOH),其含量的高低决定了木醋液的pH值通常低于3,表现出较强的酸性。此外,酚类物质的含量为10-25%,其来源主要是木质素的分解,具有显著的抗菌和防腐特性,并赋予木醋液其特有的烟熏气味。木醋液中还包含少量的醛类(如甲醛)、酮类(如丙酮)和呋喃类化合物等。木醋液的化学成分不仅依赖于原料的类型,还受生产工艺中的温度、压力和加热速率的显著影响[3-5]。

在化工领域,木醋液中的乙酸和苯酚被认为是最具商业价值的化学成分。传统上,乙酸和苯酚的生产通常依赖于石化原料,其工艺能耗高,且对化石资源依赖性强。为了提高绿色化工的可持续性,近年来,越来越多的研究关注从木醋液中提取高附加值的化学物质。通过对木醋液的精馏提纯,可以高效分离出乙酸和苯酚。当前,行业内普遍采用的精馏模型是双塔连续精馏系统。通过对塔板数、温度和压力的优化控制,可以在木醋液的精馏分离中实现高纯度的化学成分提取。在这一过程中,使用Aspen Plus化工流程模拟软件对精馏塔的工艺流程进行建模和优化,成为行业内的主流方案[6-8]。

在现代精馏控制中,深度学习和人工智能(AI)技术的引入显著提高了木醋液复杂成分的溯源能力和精馏过程的实时反馈调节能力。在传统的精馏工艺中,木醋液中成分的波动会导致乙酸和苯酚的提取率不稳定。通过引入机器学习算法和大数据反馈,可以对每批木醋液的成分进行在线分析和自动检测,从而生成适应性更强的控制策略。结合Aspen Plus的仿真模型,AI算法可实现多变量耦合的智能反馈控制,使得精馏工艺的优化效率大幅提升,同时降低了能耗和生产成本。

基于深度学习的反馈调节系统的最大优势在于动态调节能力,可通过对大规模历史数据的学习,提前预测可能出现的变化,进而自适应调整操作条件。在深度学习算法的支持下,原料质量的波动对产品质量的影响显著降低,基于AI的控制系统能够自动生成最优的工艺路径,提高木醋液的提取效率,并减少对操作人员的依赖,极大提升了工业生产的自动化水平和稳定性。

二.Aspen实验

1.精馏模拟实验设计思路

本研究选取水、乙酸和苯酚作为模拟简化木醋液的模型化合物,未将木醋液中其他微量成分纳入考量范围。首先,通过测试这三种化合物的可行性,验证模型的适用性。利用Aspen Plus软件构建双塔精馏分离模型,利用NRTL模型对其物理性质进行了数值模拟[15],固定精馏过程中的关键参数,如塔板数、进料位置、双塔的馏出物流率及回流比等,仅调整进料口简化木醋液模型化合物中水、乙酸、苯酚的质量比例。对双塔塔顶流股和塔底流股中的物质成分进行测定,并将塔釜流出物的各组分含量与进料模型化合物的各组分含量进行对比分析。通过大数据分析技术,扩展研究并构建具有规律性的图表模型。该模型为后续处理未知木醋液提供了依据,通过分析双塔塔底馏出物含量,可反向推导出进料木醋液的具体成分,从而提高研究效率并为实际应用提供科学依据。

2.精馏模拟实验

根据上述确定的木醋液双塔精馏分离设计,制定了详细的工艺流程图(参见图1)。为了模拟简化木醋液的组成进料流股,设定模拟简化木醋液的总流量为100kg/h,其组成为三组分:水、乙酸、苯酚。由于数据量巨大,并且在一般情况下,木醋液中水的占比是相当大的,因此设定水的流量范围在70-100kg/h,而乙酸和苯酚的流量范围则设定在0-30kg/h。这样的设定确保了水、乙酸和苯酚的流量总和为100kg/h,其中设定流量梯度变化间隔为5。

在双塔的设计中,为了保证设计的冗余性,均设置了总塔板数为30块塔板。进料口均位于第15块板上方,这样可以确保物料在塔内的充分接触和分离。此外,为了保证精馏过程的稳定性和效率,设定双塔的馏出物流率为30kg/h,回流比均为3。这样的设计参数可以确保在分离过程中,一塔塔顶馏出物、二塔塔顶馏出物和二塔塔底出料产物的三种成分比例只随着进料木醋液模拟液的成分比例改变而改变,进而方便数据库归纳拟合,从而排除其他干扰。

3. 材料与方法

3.1 数据集构成

本研究采用的数据集包含了多组分分离过程中的进料样品组成及两座分离塔的输出数据。原始数据集由12个特征变量构成,包括进料中的水、乙酸和苯酚含量,以及一号分离塔塔顶、二号分离塔塔顶、塔底各自输出流中对应的三种组分含量。进料组成的设计遵循系统性原则,水含量在70%到95%之间变化,共设置了7个基准水平(70%、75%、80%、85%、90%、95%)。在每个水含量水平下,通过调节乙酸和苯酚的相对比例形成完整的组分配比系列。乙酸含量范围为0-30%,苯酚含量范围为0-30%,各组分总和保持在100%。此外,数据集还包含9组补充实验数据,这些数据点的进料组成选择在基准配比之间,用于验证模型的预测能力。例如,水含量为70.5%、71.25%、73.1%等非整数点位的工况数据。

3.2 数据预处理

本研究采用Python编程环境和scikit-learn机器学习库进行数据预处理和建模分析。在数据清洗阶段,系统地处理了数据集中的异常值和缺失值。为了提高模型训练效果,采用StandardScaler对特征数据进行了标准化处理。标准化转换通过以下公式实现:

X_scaled = (X - μ) / σ

其中,X代表原始特征值,μ表示特征均值,σ表示特征标准差。

我们将7个基准水平的原始实验数据作为训练集,补充实验数据作为测试集。特征工程阶段,将九个塔输出参数作为输入特征,三个进料组分含量作为预测目标。

3.3 回归模型构建

本研究采用多输出回归策略,构建了两种不同类型的预测模型。第一种是基于CART算法的决策树回归模型,该模型通过递归二分法将特征空间划分为若干个区域,在每个区域内建立局部预测模型。第二种构建了包含100个基学习器的随机森林回归模型,通过集成学习方法提高模型的泛化能力。随机森林模型采用Bootstrap采样技术构建子模型,并通过随机特征选择增加模型的多样性。

3.4 模型评估与诊断

模型评估采用了多维度的评价体系,包括平均绝对误差(MAE)、均方误差(MSE)和决定系数(R²)。MAE反映了预测值与真实值的平均绝对偏差,MSE通过对误差的平方进行惩罚来衡量模型精度,R²则提供了模型对数据变异性的解释程度。

4.结果与讨论

4.1 模型性能比较分析

以下是决策树(Decision Tree)和随机森林(Random Forest)模型在预测进料水含量、乙酸含量和苯酚含量方面的性能指标对比表:

从表中可以看出,随机森林模型在所有预测变量上均显著优于决策树模型。对于进料水含量(Feed_Water),随机森林的平均绝对误差(MAE)为1.2493,均方误差(MSE)为1.9733,决定系数(R²)达到0.8834,表明模型对水含量的预测具有高度准确性。乙酸含量(Feed_Acetic_Acid)的预测也同样表现出色,随机森林的MAE为1.0886,MSE为1.4421,R²为0.7416,显示出良好的预测能力。

尤为显著的是,随机森林在预测苯酚含量(Feed_Phenol)方面表现卓越,MAE仅为0.2821,MSE为0.1073,R²高达0.9728,表明模型几乎能够完美拟合苯酚含量的数据。然而,决策树模型在预测苯酚含量时表现不佳,R²甚至为负,说明模型无法有效捕捉苯酚含量的变化趋势。

4.2 预测值与实际值对比

基于随机森林模型的预测结果与实际观测值的对比分析显示出不同变量的预测表现具有其独特特征:

综合来看,随机森林模型在三个预测变量上都展现出优秀的性能,特别是在苯酚含量的预测上达到了接近完美的效果。这一结果不仅验证了随机森林模型相对于单一决策树的优势,也为工业生产过程中的参数预测提供了可靠的工具。不过,乙酸含量预测中出现的系统性偏差仍然提示我们,模型在某些特定区间的预测能力还有改进空间。

4.3 模型应用价值分析

本研究通过对决策树和随机森林两种模型的系统性评估,深入探讨了机器学习方法在多组分分离过程参数预测中的应用潜力。研究结果表明,随机森林模型在三种进料组分预测中均展现出优异的性能,尤其在苯酚含量预测方面取得了0.9728的R²值,体现出卓越的预测能力。这种高精度的预测性能为工业生产过程中的实时参数估计和过程控制提供了可靠的技术支持。模型在水含量预测方面同样表现出色,R²值达到0.8834,特别是在75-80%的低水含量区间,预测结果与实际值的吻合度极高,为工艺参数优化提供了重要参考依据。

然而,研究也发现了当前模型存在一些局限性。在乙酸含量预测方面,尽管整体MAE维持在1.0886的可接受水平,但在低浓度区间(5-8%范围)出现了系统性的低估现象。这种预测偏差提示我们需要在特定浓度区间优化模型性能。此外,当前数据集主要基于7个基准水平和9组补充实验数据构建,对更广泛组分配比组合的预测能力还需要进一步验证。决策树模型在苯酚预测方面出现负R²值的情况也说明,单一算法可能无法满足所有预测需求。

基于以上发现,未来研究可以从多个方向展开优化工作。在模型改进方面,可以考虑引入深度学习方法,特别是针对乙酸含量预测中的系统性偏差问题;探索组合模型策略,针对不同组分选择最优算法;通过优化特征工程,引入组分间的交互项作为新特征。在数据扩充方面,建议扩大实验数据的覆盖范围,特别是在当前模型表现欠佳的浓度区间;增加工艺波动条件下的数据采集,提高模型的鲁棒性;考虑引入温度、压力等操作参数作为辅助特征。

[1] G. Iacomino, M. Idbella, A. Staropoli, B. Nanni, T. Bertoli, F. Vinale, G. Bonanomi, Exploring the Potential of Wood Vinegar: Chemical Composition and Biological Effects on Crops and Pests, Agronomy, 14 (2024).

[2] A.S. Pimenta, G.S.P. Gama, F.M.C. Feijó, R.M. Braga, T.K.B.d. Azevedo, R.R.d. Melo, N.d.O. Miranda, G.S.d. Andrade, Wood Vinegar from Slow Pyrolysis of Eucalyptus Wood: Assessment of Removing Contaminants by Sequential Vacuum Distillation, Forests, 14 (2023).

[3] X. Sun, Y. Guo, L. Zeng, X. Li, X. Liu, J. Li, D. Cui, Combined Urea Humate and Wood Vinegar Treatment Enhances Wheat–Maize Rotation System Yields and Nitrogen Utilization Efficiency Through Improving the Quality of Saline–Alkali Soils, Journal of Soil Science and Plant Nutrition, 21 (2021) 1-12.

[4] L. Xingyu, C. Rui, S. Jingwei, J. Qian, G. Junli, W. Ziming, L. Xiaoyan, Separation and microencapsulation of antibacterial compounds from wood vinegar, Process Biochemistry, 110 (2021) 275-281.

[5] L. Xinyou, Z. Yue, L. Xuehan, L. Ying, F. Xinhao, B. Muthukumar, Z. Chuanjie, Q. Mingnan, Y. Jialin, The use of wood vinegar as a non-synthetic herbicide for control of broadleaf weeds, Industrial Crops & Products, 173 (2021).

[6] Z. Li, L. Zhang, G. Chen, L. Wu, B. Liu, Y. Li, S. Sun, H. Zhang, Z. Zhang, Z. Wang, A new routine for comprehensive utilization of wood vinegar including primary distillation, liquid−liquid phase extraction and secondary distillation, Process Biochemistry, 75 (2018) 194-201.

[7] T.V. Chelyuskina, F.N. Bedretdinov, Mathematical modeling of extractive rectification of a butyl butyrate–butyric acid mixture, Theoretical Foundations of Chemical Engineering, 50 (2016) 697-704.

[8] X. Suo, Q. Ye, R. Li, X. Dai, H. Yu, The partial heat-integrated pressure-swing reactive distillation process for transesterification of methyl acetate with isopropanol, Chemical Engineering & Processing: Process Intensification, 107 (2016) 42-57.

*本文暂不支持打印功能

monitor