导 师: 朱建平
学科专业: B0208
授予学位: 博士
作 者: ;
机构地区: 厦门大学
摘 要: 定性数据分析方法有着广泛的应用前景,但随着数据采集和存储技术的进步,我们开始面对日益增多的庞大数据库,由于“总体漂移”及非独立同分布数据的出现,现有定性数据分析方法急待发展与完善。粗糙集作为一种处理离散数据的数学工具,为定性数据分析方法的创新提供了一种新的视角。通过深入研究定性数据分析内容和粗糙集方法,本文从理论与应用两个方面较为全面和系统地提出了基于粗糙集的定性数据分析方法,主要探讨了粗糙集在数据描述、数据预处理、判别分析及聚类分析等方面的应用。 本文创新之处:1.应用粗糙集从数据归纳推理的角度进行定性数据分析方法的研究,这使得分析方法除了数据本身之外不需要任何其他的信息,由推断到推理是方法上的根本转变。2.提出了用分类信息表s={u/r,a,v,f}描述定性数据的方法,将变量之间关系的分析转换为变量等价类之间关系的分析。提出了用关联信息系数ir(xi,xj)描述变量间关联关系的方法,克服了采用x2检验方法的不足。3.提出了基于信息熵进行变量约简的方法和对数据的关联结构进行压缩的方法。4.在引入粗糙集流向图的同时,提出了按照变量的重要性确定流向图层次的方法,避免了分析中由于流向图层次选择不当而可能出现的辛普森悖论问题。5.提出了基于信息量进行判别变量筛选的方法,并将定性数据判别分为完全确定型判别、完全不确定型判别及粗糙型判别。6.借鉴因子分析思想,提出在分析变量子集关联结构的基础上,确定最优等价类簇的聚类方法。 研究表明,本文提出的定性数据分析方法,既可用于大型数据集的分析,也可以用于传统数据的分析,克服了传统分析方法的局限性,研究成果对于定性数据分析方法的发展具有一定的贡献。
关 键 词: 粗糙集理论 定性数据 数据分析 数据采集 数据预处理
分 类 号: [TP311.131]
领 域: [自动化与计算机技术] [自动化与计算机技术]