中文会议: 2007年全国高性能计算学术年会论文集
会议日期: 2007-10-26
会议地点: 深圳
主办单位: 中国计算机学会
机构地区: 中南大学信息科学与工程学院
出 处: 《2007年全国高性能计算学术年会》
摘 要: 针对XML数据质量问题, 以XML键为基础、借助多模板隐马尔可夫模型信息抽取策略与粒子群算法构建新的XML数据清洗方法;为了提高XML相似性数据并行检测效率,尝试利用波函数对粒子群算法进行相应优化。对比其它XML数据清洗算法,一系列仿真实验表明改进的XML数据清洗方法不仅自适应学习功能强、人工参与程度低、计算量小,而且时间性能有95%左右提升。
关 键 词: 文档集 粒子群算法 数据清洗策略 隐马尔可夫模型
分 类 号: [TP]
领 域: [自动化与计算机技术]