摘要:当今社会信息资源的意义已毋容置疑,统计作为信息密集型行业在政府部门、企事业单位和科研机构中发挥着至关...当今社会信息资源的意义已毋容置疑,统计作为信息密集型行业在政府部门、企事业单位和科研机构中发挥着至关重要的作用,而飞速发展的信息技术则将统计应用推进到一个崭新的时代。决策是提供统计信息的最终目的。统计信息化使得统计工作的效率大大提高,产生和积累了丰富的统计信息资源。然而,在统计信息资源的有效管理、开发和利用上还有待欠缺,统计的功能得不到有效发挥。本文在阐述统计信息化背景及其存在的问题的基础上,提出把商业智能的管理理念及其关键技术应用到统计工作中。紧扣统计业务和统计数据的特点,论述商业智能的三大关键技术——数据仓库、OLAP和数据挖掘(DM)在统计中的应用。构建了基于商业智能的统计决策分析系统理论框架,并把该思想应用到我国科技统计中。证实部分中,以科技统计中的专利成果主题为例,借助于Microsoft SQL Server BI平台,建立了专利成果的多维数据集和挖掘集,进行了OLAP分析和数据挖掘,展示了商业智能强大的决策分析功能。本文为统计工作及统计数据的开发提供了新的思路。显示全部
摘要:随着近年来海量数据的积累以及竞争的加剧,及时快速的从这些庞大的数据中抽取出决策者所需的信息,为企业获...随着近年来海量数据的积累以及竞争的加剧,及时快速的从这些庞大的数据中抽取出决策者所需的信息,为企业获得更高的经济效益使得数据挖掘的应用越来越受到企业界的重视。而基于数据挖掘技术支撑的商业智能也因其能够及时正确的帮助企业经营者做出决策,协助企业顺利解决问题而变的越来越重要。
关联规则挖掘在数据挖掘技术中应用较为广泛,Apriori算法是其经典算法。但它默认的前提是事务数据库中的所有项在挖掘的过程中是等价值的,但在现实中,不同的项也就是不同的商品往往重要性也不同,换句话说就是不同的商品给商家带来的利润不一样。基于此,本文从利润的角度进行分析,应用数据挖掘方法来帮助企业提升利润。
本文首先介绍了商业智能的概念,数据挖掘技术以及数据挖掘工具的选择。其次详细介绍了关联规则挖掘技术,针对传统的关联规则挖掘算法的不足,提出了基于利润对不同商品项进行加权的思想。在进行关联规则挖掘前,应用该权重信息对原始交易数据进行数据预处理,从而降低了挖掘的规模,提高了挖掘的效率。对于加权后的Apriori算法中支持度和置信度的运算不再适用的情况,给出基于利润加权关联规则中的加权支持度和加权置信度的定义。根据加权思想对原Apriori算法进行改进得到基于利润加权的布尔关联规则挖掘算法,记为LRJQ算法。通过实验将两种算法进行比较,证明了该算法的有效性。最后借助SQL SERVER 2005的商业智能平台,将LRJQ算法应用到商品交叉销售系统中,其中首先进行系统的维度设计,并通过SSIS进行数据抽取、转换和加载,将符合关联挖掘的交易记录抽取到数据仓库数据库中。然后通过SSAS进行LRJQ算法插件的编写,完成挖掘模型的构建,最后对挖掘结果进行展示。根据挖掘结果可以为超市的布局提供合理的依据,提高商家的销售效益。显示全部