作 者: ;
机构地区: 中山大学图书馆
出 处: 《现代情报》 2008年第6期79-81,共3页
摘 要: 随着网络的日益普及和信息技术的进步,Web日志挖掘的数据收集和原始数据处理工作变得越来越复杂,使得预处理技术也要进行相应的提高。本文通过对预处理中出现的复杂问题,进行了详细的分析,并列出了目前比较成熟的算法。 With the growing popularity of network and the advances in information technology, web log mining data collection and processing raw data has become increasingly complex, preprocessing technology also makes corresponding increase. Based on the preprocessing of the complex issues, this paper carried out a detailed analysis and listed the current relatively mature algorithm.
关 键 词: 日志挖掘 预处理 数据收集 数据清洗 用户 会话识别 最佳事务识别
领 域: [文化科学—传播学]