导 师: 许玉格; 王志平
授予学位: 硕士
作 者: ();
机构地区: 华南理工大学
摘 要: 污水处理系统是一个复杂的、影响因素非常多的生化反应系统,污水处理厂在长期运行中容易发生运行故障,如果这些故障没有得到及时恰当的处理,会导致一系列严重问题。运用机器学习与数据挖掘相关的算法,可以对污水处理系统的数据进行实时分析,准确客观地判断出污水处理过程的运行状态,及时诊断故障并处理,对于污水处理具有十分重大的意义。污水处理过程的故障判别存在一个重要问题,即正常状态和故障状态的数据是不平衡的,而大多的经典机器学习算法无法胜任不平衡数据的分类任务,往往将故障状态判别为正常状态,导致故障得不到及时处理,会对污水处理厂造成极大的经济损失。本文以污水处理为应用背景,针对污水处理过程的运行状态的数据不平衡的问题,以加权极限学习机和集成算法为基础,首先提出了一种基于加权极限学习机(Weighted Extreme Learning Machine,WELM)的集成算法模型AdaWELM。通过将WELM的样本权值设置与AdaBoost的样本权值迭代更新进行结合,在算法层面对现有的集成算法进行了改进。另外,利用极限学习机采用单隐层前馈神经网络,不需要迭代式的调整隐层节点的特点,极大的提高了集成算法的学习速度。使得AdaWELM在实现多个类别的不平衡数据分类任务的同时,提升分类效率。应用到污水处理过程故障诊断中,可提高不平衡数据的分类性能指标G-mean值、故障类的查全率以及诊断的实时性。然后,通过进一步对集成算法AdaBoost和加权极限学习机WELM的理论以及两者的结合机制的研究,提出了一种基于G-mean的加权极限学习机集成算法模型AdaGELM。以整体G-mean为训练目标,相比AdaWELM更加提高了污水数据故障类的查全率和整体G-mean值,诊断的实时性相当。最后,本文使用MATLAB软件设计了一个污水处理故障诊断研究平台,在平台上将经典的分类