摘要: 基于数据驱动的工业过程建模需要依赖大量的标记良好的数据集,但与目标任务直接相关的标注数据往往是有限的。因此,可以利用与其具有相关性的辅助训练数据进行建模以实现任务迁移。然而,样本的不平衡问题一定程度上影响了迁移学习的性能表现。因此,提出了一种基于样本平衡策略的多源迁移学习方法,首先,对于同一源域内样本,采用最小二乘方法融合多个候选预测器得到单个源预测器,以协同利用域内不同样本包含的可迁移信息。此外,对于不同源域间样本,基于误差函数将多个源预测器加权组合得到多源预测模型。最后以乙烯精馏塔为对象进行案例分析,验证了所提出方法的有效性。
关键词: 多源迁移学习 样本平衡 Tradaboost算法 决策树 乙烯精馏塔
0 引言
在工业过程中,产品的质量指标预测对于设备的平稳运行、企业的提质增效等方面发挥着至关重要的作用。然而,基于工艺机理的建模方法往往无法高效地在线监测产品质量。近年来,随着数据采集、传输、存储技术的发展,基于数据驱动的建模方法被广泛应用于实际工业过程,包括支持向量机[1