导 师: 彭小刚
授予学位: 硕士
作 者: ();
机构地区: 深圳大学
摘 要: 随着信息技术的迅猛发展,制造业生产过程规模的不断扩大,复杂性日益提高,产生的数据越来越多,从海量的数据中挖掘出有效的信息,从而提高生产过程的安全性和可靠性,提高产品的质量,已经成为制造业领域研究热点之一。质量预测根据生产过程产生的历史数据,利用特征工程技术构建特征,从而建立高效的产品批次质量预测模型,对生产进行过程控制并且做出相应决策有着重大意义。由于影响质量波动的因素存在着维度高、非线性、多时段、数据不等长的特性,目前制造业质量预测仍然面对很多困难和挑战,利用特征工程技术构建高质量的特征和选择合适的质量预测算法是制造业领域的研究热点。目前的研究在特征提取中采用对时间划分子时段的方法提取特征,这种方法不能提供足够的批次波动信息。在特征选择中采用PCA方法选择最优特征,这种方法对于非线性数据不能准确的挑选出对质量影响大的变量。针对生产过程中多时段、高维度、非线性的数据,使用传统的线性回归方法已经无法满足工业界对质量准确预测。本文针对间歇生产过程中数据不等长、维度高、多时段,非线性的特性,设计出一套批次多阶段特征工程和质量预测方法。首先寻找指示变量替代时间,对指示变量值向下归约并且采用指数移动加权平均的方法对指示变量对应的特征值进行采样,解决了数据不等长的问题;然后对指示变量划分多个阶段,在不同的阶段使用统计方法提取统计特征,采用XGBoost和Random Forest相结合的方法进行特征选择,解决了数据维度高的问题;最后建立基于Stacking集成算法的多阶段预测模型对批次质量进行预测。本文采用阿里云众智任务平台提供的制造业质量控制数据集,通过对生产过程历史数据进行探索性分析及可视化,根据加工进度对批次生产过程分为三�