帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

改进的PrefixSpan算法在Web挖掘中的应用
Application of Improved PrefixSpan Algorithm in Web Mining

作  者: ; ;

机构地区: 暨南大学

出  处: 《科学技术与工程》 2009年第23期7176-7179,共4页

摘  要: 针对PrefixSpan算法不足,采用修改Prefix策略与舍弃非频繁项的方法,减少内存与外存之间频繁地交换,减小在挖掘过程中产生的投影数据库规模,降低构建、扫描投影数据库的时空耗费,从而改进算法。实验结果表明,在长序列模式挖掘中,算法在改进后运行效率比原来提高35%以上,更适用于Web挖掘。 Generating frequent itemsets is a critical step in association rule mining. Through the analysis of Apriori algorithm, a new algorithm for mining frequent itemsets based on set and bit operation is proposed. In this algorithm, digital view is used to express the transaction who used each item, and bit operating is used in digital view to calculate the number of support of each itemset. The problem of repeatedly scanning the database in Apriori algorithm is solved and operating efficiency is improved in the new algorithm.

关 键 词: 挖掘 算法 序列模式

领  域: [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 郭静
作者 赵卫军
作者 唐秋鸿
作者 赵龙文
作者 张新辉

相关机构对象

机构 暨南大学
机构 华南理工大学
机构 中山大学
机构 北京理工大学珠海学院
机构 广东工业大学

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊