导 师: 倪德明
授予学位: 硕士
作 者: ;
机构地区: 中山大学
摘 要: 本文通过深入广东地税业务及数据仓库技术的学习,从分析税收征管数据出发,针对数据源数据量大、缺乏规范性和准确性的特点,提出了合理,行之有效的税收分析系统数据仓库的设计方案,最后对系统应用效果进行了分析。具体而言: 1.介绍了税收分析系统建设的背景和意义,分析广东地税征管系统现状和建设税收分析系统的紧逼性,提出了系统建设的远期和近期目标。 2.从税收业务的角度去理解数据仓库,对数据仓库的几个关键性问题(如概念,要点,体系结构,数据组织等)去进行税收化的解释,为数据仓库的技术设计打下必要的业务基础。 3.地税对业务的信息量及难度方面的要求要远远高于银行和电信业,比如一张企业所得税申报表就要近百个字段要录入,而且还带几张附表,这些表之间又有着密切的关联性,而且在税收业务处理过程中,许多环节都要进行相应的数据输入输出,数据口径解释缺乏统一和规范,所以税收征管数据具有“数量具大,欠缺规范性及准确性”的特点,而这些特点正是成功构建准确、有效的基础数据平台难点所在。为此,本章从分析数据源出发,结合构造数据仓库的理论,论述了利用征管数据构建税收分析数据仓库的设计方案。在以纳税人为单元的数据组织模式基础上,重点论述了“一次抽取多次加载”的ETL抽取策略及以“规范数据的产生、处理及分析展现流程”为核心的数据质量保证机制,从系统目前运行情况表明,这种策略和机制既减轻征管生产系统压力、提高了抽取效率,又保证了进入数据仓库数据的准确性。 4.本章提出了税收分析系统的逻辑设计架构,总结了第一阶段各系统模块的运行的情况,特别的对系统数据的准确性进行了比较全面地检查和分析,最后展示了部分功能模块的使用界面。
关 键 词: 数据仓库 税收分析系统 抽取策略 数据质量 保证机制
分 类 号: [TP311.13 F812.42]
领 域: [自动化与计算机技术] [自动化与计算机技术] [经济管理]