建立政务数据资源体系是国家电子政务建设与发展的关键因素。资源体系建设是电子政务体系建设颠覆性的一种路径。新时代电子政务发展到一定的阶段,政务信息体系建设是关键的因素。深圳市政务数据资源体系建设做了多方探索,取得了一些成果。

  习近平总书记提出“以数据集中和共享为途径,建设全国一体化的国家大数据中心,推进技术融合、业务融合、数据融合,实现跨层级、跨地域、跨系统、跨部门、跨业务的协同管理和服务。”李克强总理提出“要信息多跑路,群众少跑腿”。作为信息化的部门,如何达到目标,这是应该思考的问题。

  “十三五”提出了实施国家大数据战略,推进数据资源开放共享,国家出台了很多文件,包括《政务信息资源共享管理暂行办法》《政务信息系统整合共享实施方案》,这些规范化的文件,对全国各地信息化主管部门来说都是实实在在的工作要求。

  1.存在的问题

  (1)数据烟囱林立

  经过研究、分析,发现深圳市政务数据应用系统太多,大约有1000多个应用系统,由于这些分散应用系统的存在,给数据整合带来了困难。信息化发展有阶段性,早期是各单位、各部门独立的开发和建设业务系统,如今需要按照以数据为中心去建设云平台业务系统和数据中心。

  (2)数据割裂(入户办理程序)

  在深圳市电子政务资源中心(以下简称“中心”)办理业务过程中,由于业务系统各自独立,办一件事情要跑很多部门,花费很多时间。例如,深圳入户办理的程序,办理时间和办理天数给申请办业务的群众带来很多不便,数据没有跑路,人在跑路,问题非常明显。

  2.出办法:政务信息资源共享管理办法

  深圳市2006年出台了《深圳市政务信息资源共享管理暂行办法》(以下简称《暂行办法》),2015年,《暂行办法》经过完善,定为《深圳市政务信息资源共享管理办法》,这对优化政务信息资源的配置起到了关键作用。

  基于对深圳市的调研,补充和完善出台了《深圳市信息资源管理目录体系》,在2015年,深圳市信息共享开展的制度创新、管理创新和服务创新模式,各部门进行了大胆的探索,创新服务共计617项,深圳市的信息共享工作得到了国家相关部委的充分肯定,获得了全国首个“政务信息共享示范市”称号。

  3.建平台:建立数据共享平台实现数据逻辑集中

  在数据共享平台建立实施当中,第一步做了数据的逻辑集中,早期叫做共享交换平台,解决的是数据的逻辑集中问题,它不是一个物理集中数据库,这是在建立数据共享平台,实现数据逻辑集中的第一项任务。按照共享为原则,不共享为例外原则,建立了深圳市政务信息资源平台,目录包括61个市级单位,10个区,共4308类资源,这是共享平台的数据逻辑集中的一个安排(图1)。

数据共享平台5年变化情况

  从2013年到2017年,接入的单位数逐年递增,资源目录数也在近五年发生了变化,2017年发生的变化最大。信息指标数增加最多,共享交换平台,是解决数据逻辑集中的一个最重要手段。

  (1)数据融合的思路

  数据融合的思路,中心运用模型GLDM:跨部门跨系统跨业务的政府通用LDM(逻辑数据模型,如图2所示):

逻辑数据模型

  (2)数据大融合的方法

  数据大融合是为了实现数据实体集中。逻辑集中没有解决数据融合问题,逻辑集中无法解决数据融合,所以还要做一个物理集中平台,基于数据大融合的思路解决数据融合的问题,数据融合的核心是解决数据跑路的问题。

  (3)数据大融合的框架

  跨部门、跨系统、跨业务的政府通用数据逻辑模型,通过对源数据的清理、脱敏,达到提供开放和交易服务的目的。清晰数据进入资源总目录要实现物理集中,就要对源数据进行分步骤处理,包括原子区、集市区、贴源区、整合区、应用区,最后形成应用系统。数据物理集中的时候,中心规划了物理数据融合大框架,最底层是电子公共平台,中间层是数据层,数据层包括主题数据资源和业务数据资源,上层通过数据挖掘、资源共享、比对服务进行操作。中心建立了几个基础库以后,各个部门的需求慢慢产生,有了资源,大家就有了想法,有了想法就有了办法。最终通过数据开放平台和一些网站,向社会公众和政府部门提供服务。

  4.深圳市公共基础信息资源库

  中心建立了基础信息资源库,主要是人口、法人和房屋三大类,共计148亿条精准数据,人口数据达到了1859万多,法人数据大约288万,企业数据大约300万,房屋数据近83万,房间数据1351万,另有29个部门接入,累计近148亿条数据,这是基础数据库的建设情况。

  (1)人口基础信息资源库

  各部门相关人口的数据融合在一起,不仅仅是简单的公关数据,要实现人口数据大融合,从一个人出生到死亡的相关数据都整合在一起,构造了人口基础信息库,使它具有完整性。教育部门、卫计部门、人社部门、出租屋等等这些数据都有,在每一个节点上都有相关的数据,使人口数据成为一个大融合的数据。

  (2)法人基础信息资源库

  从企业注册开始,到人员招聘、纳税、注销几个阶段。政府部门对企业也是分段管理,就像治理河流一样分段管理,这样容易导致数据分散,通过法人基础数据库的融合,形成一个企业完整生命周期的完整数据。市场监管委的基本信息大概有400多万条,民政局、社团的基本信息有4000多条,企业信用中心有40000多条。社保局提供的个人信息基本数据,公积金的基本数据还有市场监管委出的股东高管信息,这些信息都是属于企业法人库的信息。

  (3)房屋基础信息资源库

  房屋纳税信息出自税务局,房屋的融合数据有两条线,一条线是大楼的起建,包括套数、位置、结构以及配置的电梯,另一条线是出租屋;把这两个数据融合在一起,变成了房屋的基础信息数据库。

  (4)综合监管和公共信用数据库

  除了三个大库以外,中心还建立了综合监管和公共信用数据库,印发了《深圳市综合监管和公共信用信息资源目录》及其数据标准。目录共包括74家信源单位,426项资源信息,其中综合监管占56项,公共信用占370项。建立和使用过程中同时也有问题存在,数据的所有权、使用权和公示权归哪些部门在法律上没有规定,例如一个单位处罚了一个驾驶员,处罚以后,驾驶员认为不合适,处罚单已经纳入到了信息库里,但是被处罚人到了中院起诉行政过错处罚有问题;在这个过程当中,法院出来调解,调解以后达到的结果是被处罚人不希望把这个数据放到信用库里。如果放到了信用库里,谁有权力把它撤掉,在实际操作当中法律上是空白的。信用体系建设面临的问题非常多,因为法律没有认可,主管部门为了减少麻烦,在信息的使用当中,尤其是涉及到当事人的时候,处理起来就比较棘手。

  (5)电子证照数据库

  电子证照库也是中心在建当中的一个技术库,目前已有120个部门进驻了中心证照系统,目前发布34个,增量同步签发26个,力争实现全部达到电子签发,电子签发以后全面实现归级。上述介绍的几个主要的政务数据库的建设,在数据库的建设当中,数据标准的管理也非常重要,必须要进行标准化的处理。

  必要的数据质量监测系统。数据质量监测是动态的,只有业主或者用户使用数据,才知道数据质量是不是有问题;基于这个原因,需要建一套质量监测平台,出现问题,通过平台报告,然后核对,这样才能使数据进行动态化的优化,这是数据信息监测的重要作用。数据服务需要支撑平台。要解决政府内部数据分级服务,安全可控三级等保环境向二级等保环境数据服务,它们不在统一的环境当中,要实现分级,存在一定障碍,需要把收集的数据归集到二级等保环境上,搭建数据支撑平台。

  通过政务数据开放平台,解决政府数据有序对社会开放,安全稳定向政府网络环境开放。有了数据、平台管理系统,保证了数据的质量,下一步是用数据,用数据是最困难的,以前做系统是基于需求来开发系统,但是中心这次做的是基于数据的大归集,向政府其他部门提供服务。

  通过梳理,大约有十大服务事项和内容可以通过数据为社会提供服务。用大数据平台,可以规划深圳市小学学费的情况;还能形成主动服务模式,比如,查找年满65周岁老人的信息,联系当事人,生日当天老人会收到祝福,有了数据,主动服务成为可能;还有深圳的社区健康服务中心数量的规划,可根据数据,由政府规划社区健康服务中心的布局。

  从主观内部协调到客观的制度保障,中心也做了一些工作,为了保障数据质量,出台了管理办法,这是制度保障。大深圳的农民房比较多,每一栋房子都没有编码,房屋的编码标准亟待完善,很多房子都没有路牌,有大量的标准化工作要做。

  5.体会与思考

  从业务角度,中心实现了市级各委办局数据的大融合,提升了资源中心做为城市融合大数据支撑的能力,基于市公共信息资源库进行了二次开发应用。从服务的角度来看,需要将数据应用与安全平衡,中心打造数据的归集平台,不是使用部门,中心建立了三级等保环境,根据不同的使用环境,解决使用的问题。未来,大数据平台还要按照国家的标准和要求进行新的改造升级。深圳市大数据的整体发展有未来五年左右的规划,包括现有云平台技术做的相关工作。

责任编辑:qiuhui