机构地区: 广西师范大学数学与计算机科学学院
出 处: 《广西科学》 2005年第2期118-122,共5页
摘 要: 为提高数据清洗的质量,提出消除脏数据域、使用统一的缩写、数据的转换等预处理方法,基于这3种方法和链表存储复制记录算法,设计一个数据清洗的系统,与其他方法的效率与准确程度比较可知,该系统的数据准确程度要高于现有的数据清洗系统. For improving the quality of data cleaning,it provides three pre-process methods,such as eliminating dirty data,using unified abbreviation,data converstion.Based on these methods,using link table to store replicate recorders algorithm,implementing a data cleansing system.This cleaning system has a higher veracity than the existing one.
领 域: [自动化与计算机技术] [自动化与计算机技术]