摘要:软件测试作为软件生命周期中不可缺少的组成部分对提高软件质量起着重要的作用,随着软件测试的发展,自动化...软件测试作为软件生命周期中不可缺少的组成部分对提高软件质量起着重要的作用,随着软件测试的发展,自动化测试技术也得到了很大的提高。本论文的研究课题是IBM CDL测试即服务创新中心(Test as a Service CompetencyCenter)内部开发的一个自动化测试系统。该自动化测试系统是为WebSphereProcess Server的组件API回归测试定制的自动化测试服务。在WPS的组件API回归测试中,由于软件硬件环境的复杂性和多样性,手动测试耗费了相当大的人力和物力资源。同时,在WPS的回归测试中有大量的测试用例需要执行,在目前的测试工作中采用“再测试全部用例”的方法,这样做企业测试成本高,工作效率低。因此,本文针对目前企业测试的现状,设计并实现了一种基于STAF的分布式测试环境的自动化测试系统--DATS(Automatic Testing System in Distributedenvironment)。本论文作者参与了DATS的设计和开发,并提出了利用关联规则挖掘算法在回归测试阶段进行测试用例选择的思想。在DATS的设计和开发过程中,应用了STAF自动化测试框架,实现了对分布式测试环境的控制和管理,同时,使得整个DATS具有统一的API和高度的一致性,为后续版本的完善提供了可扩展性。DATS还应用了著名的关联规则Apriori算法,从历史的测试结果数据中抽取出Failed_Set的有效数据,并基于Failed_Set的训练集挖掘出各个组件测试用例之间的关联规则,然后利用长度优先算法对这些关联规则进行排序,最终在回归测试中利用这些关联规则实现测试用例的选择。DATS实现了包括选择测试平台、安装WAS及WPS、配置测试环境、选择测试用例并执行、测试用例间的关联规则挖掘、测试结果报表生成等功能。与原有的手工测试相比,该自动化测试系统不仅利用STAF成功解决了分布式测试环境中资源的管理和配置,而且还提供了一套可以根据不同的测试内容和测试环境来定制用户的测试业务的机制,实现了整个测试过程的“一次配置,自动执行”。同时在回归测试阶段,由于利用关联规则的数据挖掘技术来进行测试用例的选择,大大的提高了整个自动化测试系统的可靠性和效率。显示全部
摘要:数据挖掘与知识发现(data mining and knowledge discovery简称为kdd)就是从大量的、不完全的、有噪声的、...数据挖掘与知识发现(data mining and knowledge discovery简称为kdd)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘任务一般可以分为两类:描述和预测。其中,描述性挖掘任务主要把握数据库中数据的一般特性或者根据数据的相似性把数据分组;预测性挖掘任务在当前数据上进行推断,以进行预测。 关联规则挖掘是数据挖掘领域一个非常重要的技术,它由r.agrawal等人首先提出以解决事务数据库分析等问题。物质或对象之间普遍存在空间位置和时间序列之间关联。关联规则挖掘就是从大量数据中项集之间发现有趣的关联或相关,从而达到认识事物客观规律的技术方法。随着大量数据不停地收集与存储数据库中挖掘关联规则显得越来越重要。 本文在对已有的关联规则挖掘的经典算法进行分析,发现原有算法需要扫描多次数据库,而且必须先给定最小支持度,当最小支持度改变的时候,将会导致重新计算关联规则。因此针对搜索速度方面,本文给出基于分类搜索的快速关联规则算法,该算法通过对事务数据进行逻辑分类处理,直接产生满足最小支持度的候选集和频繁集,使数据库的搜索次数不随数据项集数的增大而增大,控制数据库的搜索次数最多为3次,并杜绝“假项”产生,极大地提高了算法的效率。在针对最小支持度的问题上,本文提出一种新算法。新的算法首先从抽样角度入手,创新的给出关联规则极值抽样理论。该理论预先估计出所有支持度为极值的项目集。然后,以所有极值项目集为样本,结合最小二乘支持向量机回归(leastsquares support vector machine,lssvr)算法,计算出所有项目集的支持度。同时针对事务集在线更新的问题,在lssvr算法的基础上结合增量学习和逆学习的算法,提出支持事务集在线更新的回归算法rio svr。在算法试验阶段,本文用新算法针对相应数据进行测试,并用关联规则的传统算法对同一批数据进行测试,试验结果表明:基于极值抽样的关联规则新算法可以较好实现关联规则项目集支持度的回归。显示全部
摘要:随着人才市场竞争日益激烈,学生的教育素质是衡量各高校的一项重要标志,因此教学质量是关键。如今多数高校...随着人才市场竞争日益激烈,学生的教育素质是衡量各高校的一项重要标志,因此教学质量是关键。如今多数高校都有相应的教学管理系统,并累积了大量教学过程中的数据,如学籍数据,成绩数据,教师数据,评教数据,排课数据等,但通常教学管理系统只会对这些数据做一些简单的统计分析,无法发掘数据背后的一些宝贵信息来指导教学。课程体系的设置,人才培养方案的制定是否真的合适,只能通过调研这唯一途径。各个科目的成绩参差不齐,教师的评教成绩处于不稳定状态,怎样将教学效果达到最优,这些都是教学管理人员一直思考的问题[1]。20世纪80年代中期以来,数据挖掘成为一个相对发展较快的产业。该技术是从大量的、不完全的、模糊的、随机的数据中提取隐含在其中,且人们事先不知道的、但又是潜在有用的信息和知识。通过挖掘出来的信息,为教学管理者提供更为全面的分析,运用于教学管理的各个方面。关联规则挖掘比较,是数据挖掘中研究比较多的一个方向,将研究的数据进行关联规则处理,查找出这些数据之间的潜在联系。本文首先对数据挖掘进行基本的介绍,从数据挖掘的产生,到如今数据挖掘的广泛应用。对数据挖掘的不同算法分别进行讨论,简单分析各种算法的特点。结合实际教学管理情况,选择其中的一个关联规则算法——Apriori算法进行数据挖掘。文中详细讲解了Apriori算法频繁项集挖掘的过程,并针对其不足进行改进。同时利用Microsoft SQL Server 2005建立教学管理数据仓库,结合使用改进后的关联规则算法Apriori算法进行教学管理信息挖掘系统的建立。通过数据挖掘,查找出教学过程中教学相关信息之间的联系,具体在教学管理过程中主要应用于以下几个方面:1、从学生评教数据各项指标中得出任课教师、及其所授课程获得学生认可、喜爱并能很好掌握的关键因素。2、学生在学习过程中,课程与课程之间的一些潜在联系。根据课程之间的潜在联系,及专业侧重点的不同,有针对性的对某些课程进行调整。3、教学安排过程中课室、安排的周学时等对学生学习该门课程的影响。显示全部