可检索词: (英文)题名=T 作者=A 关键词=K 摘要=R 机构=O 主题=S 刊名=M 分类号=N
检索规则说明: [&]代表"并且";[|]代表"或者";[!]代表"不包含" (运算符两边不需要空格)
检索范例: 范例一:(k=科技[|]k=技术)[&]t=范并思 范例二:t=计算机应用与软件[&](R=C++[|]R=Basic)[!]t=西华师范大学
主办单位:
出版地:
ISSN:
主编:
邮发代号:
中图分类号: 选择
作 者: (徐彬); (杜卫锋); (滕姿);
机构地区: 嘉兴学院数理与信息工程学院,浙江嘉兴314001
出 处: 《福建电脑》 2017年第8期32-34,70,共4页
摘 要: 数据清洗是发现并纠正数据文件中可识别错误的最后一道程序,包括检查数据的一致性,处理无效值和缺失值等。本文通过对一个从相关网站上下载的原始数据源的清洗展现了数据清洗的过程,通过数据清洗,原始数据的数据质量得到了很大的提高,为下一步在此数据集上开展基于用户的协同过滤推荐算法研究打下了坚实的基础。
关 键 词: 数据清洗 一致性 无效值 缺失值 协同过滤