为保障这一机制的高效运转,浪潮历时近三年时间从需求调研到规划设计,再到落地实施,为河南地税规划建设了全局型的数据管理系统,该系统以“聚合数据、统一平台、开放服务、智能应用”为目标,以“一套标准、一个仓库、三个中心”为主要建设内容,充分利用大数据技术,解决多方数据融合、杂乱数据治理、数据开放共享、沉睡数据唤醒等问题,推动了河南地税税收管理和服务的持续创新。
随着云计算、大数据、移动互联网的飞速发展,信息化建设的重心从IT时代的管理与控制为主转变为DT时代的服务与激发生产力为主。大数据开启了这次重大的时代转型,就像望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉。
——一套标准建设
统一的数据标准与规范是数据管理工作的基础和前提,浪潮在执行总局标准的基础上,为河南地税补充制定了基础数据规范、数据集成规范、数据模型规范、数据服务规范以及数据治理规范等5大类25个标准规范,夯实了数据管理工作的基础。
——一个仓库建设
数据仓库采用“Hadoop+MPP+RDB”的分布式数据库与传统关系数据库相结合的混合架构,基于 Hadoop实现海量结构化和非结构化涉税数据的全量存储和批量离线计算,基于MPP数据库实现海量结构化数据的深度加工和复杂关联查询,基于传统关系数据库实现数据集市高并发的交互式查询。
数据仓库在统一数据标准与规范的基础上,将税务部门业务系统数据、第三方涉税数据、日常管理情报数据、互联网涉税数据以及其他来源的各类结构化和非结构化的涉税数据进行整合,形成全局统一的数据资产,并按照业务域对数据进行分主题建模,浪潮特别针对自然人的税收管理为河南地税建设了自然人主题库,涵盖自然人的基础类、资产类、收入类、支出类、税务类、社会统筹类等六大类信息。
同时,依托MapReduce、Spark分布式计算引擎、Storm流式计算引擎以及MLlib机器学习库等大数据组件,为数据仓库提供强大的数据挖掘与分析能力。
——三个中心建设
在一个数据仓库的基础上,浪潮为河南地税建设了数据管理系统的三个中心,即:数据治理中心、数据开放服务中心以及数据应用创新中心。
数据治理中心将数据治理过程流程化、可视化和体系化,建设完成数据标准管理、采集管理、加工管理、存储管理、质量管理、应用管理、知识管理、元数据管理、安全管理和运维监控管理等十大功能,固化了数据治理的工作流程和岗责体系,实现了数据全生命周期的管理。
数据开放服务中心,采用微服务架构,将数据管理系统中的数据资源、计算资源和存储资源进行服务化封装,基于用户认证和授权体系,通过OpenAPI的方式实现资源的开放共享,以满足税局内部、第三方系统的各类数据服务需求。
数据应用创新中心在开放数据服务的基础上,构建纳税人画像、基因图谱、税务搜索、查询统计、模型评估等大数据创新应用,实现数据深层价值的挖掘。
浪潮在河南地税数据管理系统建设过程中,依托移动互联技术,将数据管理工作逐步向移动智能终端延伸,拓展了数据管理工作的时间和空间。