本文为国脉研究院副院长王贝贝在2016中国智慧政府发展年会“政府大数据与数据开放论坛”的主题演讲实录,内容根据录音整理,未经本人审核。

 

 
  1.数据是基础设施
 
  首先,我想和大家先分享一个观点,是从政府的开放数据研究院向基础设施建设委员会的公开信中所提出的观点,数据是基础设施,他们在公开信中强烈建议基础设施建设委员会将数据视为现代社会及其经济运行的根本基础设施。基础设施有三大特性:基础性、公共性和外部溢出性,接下来分析一下为什么要提出将数据作为基础设施。
 
数据是基础设施
 
  首先是基础性,数据是我们构建决策以及提供公共服务的重要基础数据资源。
 
  然后是公共性,这里包含两个方面,首先数据的服务对象,应该是全市的范围。包括政府的部门、单位以及居民,它并不是仅仅针对于一个部门或者是少数人来进行服务。其次是数据连通了各个行业。
 
  第三个是外部溢出性,同实体基础设施,像道路和桥梁具有比较强的外部溢出性,能够带来比较大的经济社会价值。比如说在修建道路和桥梁的时候,它可以带来贸易的便利性,由贸易的便利性所带来的价值,应该远远超过当初修建道路和桥梁所预期到的价值。同样,提高对数据的访问性,通过对数据的利用,我们同样可以提高数据的外部溢出性,它所产生的价值应该比我们数据采集时所预期的价值要高。
 
  现在包括政府单位,应该说内部都有很多的数据宝藏,对这些数据宝藏的充分利用,可以带来很高的经济价值,这些价值不仅仅对于数据的拥有者,同样对于其他团体来说也是非常有价值的。比如手机数据的运用,运营公司对于手机数据的应用可以定位无线电发射的位置;零售商可以利用这些手机位置来分析店面的选址位置和营业的时间;政府可以用手机数据来做应急响应预案等等。
 
  我们平常的基础设施像道路、桥梁,它的主要作用是让我们吃的饱、穿的暖、生活更加美好。对于数据基础设施,可以让我们生活的更加智能化,它存在的主要目的,是让重要的数据可以尽可能的让人们获取和利用。数据基础设施可以帮助我们辨别出那些比较有意义的数据。同时提高数据的可访问性和提高数据的可重用性来挖掘数据宝藏,释放数据价值。
 
  2.政务信息资源目录体系
 
  数据基础设施将成为21世纪的竞争优势,我们也都知道政府部门是数据资源主要的集散地和数据资源进一步开发的主力。统计数据显示,政府所掌握的信息资源超过90%,如何挖掘数据宝藏,这个就需要我们强化数据基础设施的构建。首先,在这里也是提出一个最为基础的工作,就是要建设政务信息资源的目录体系,通过梳理政务信息资源,确定资源一系列属性,编制政务信息资源目录。
 
  要提高数据的可访问性,这里从两个点来说。首先让数据开放来确保数据的授权协议,允许任何人来访问、使用和分享这些数据。第二个让数据可用,通过政策法规来促进数据的可访问性。当然,对于提高数据的可访问性,前提是保障数据安全。
 
  要将数据视为资产,同时加强对数据资产的管理能力,在这里我们要明确,我们并不是发现数据和从中获取价值,我们是创造并维护数据,通过分享数据来增加其价值。对政务信息资源目录体系的建设是作为搭建数据基础设施的基础工作,为什么这么说呢?刚才也提到了,对于数据基础设施,它最重要的目的是挖掘数据宝藏,释放数据价值。大家都知道现在的数据应该说分散在政府的各个部门,也就是说宝藏是在各个部门里面都分散存在的。
 
政务信息资源目录体系"寻宝图"
 
  我们要去挖宝先要有一个寻宝图,首先得知道要挖的这些宝藏,想要的数据是在哪些部门里面有,这个是政务信息资源目录体系主要的定位,它充当了寻宝图的作用。简单来说,寻宝图告诉你,你想要的数据在哪里。但是它又不具体存储数据,也不是说它不是存储的盒子,只是给你一个方向性的指引,告诉你想要的数据在哪里,这个部门有哪些数据,哪些数据是可以共享的,哪些数据是可以开放的。如果说你想要这个宝藏,就要进行到下一步,就是数据的交换,比如说通过搭建共享交换大平台,将数据都存储在平台上,然后供各个部门来进行数据的交换。
 
  国家层面对于政务信息资源目录体系的建设,在这几年也是给予了大力的支持,从2002年关于我国电子政务建设发展的指导意见中明确提出,要研究和设立电子政务信息资源目录与交换体系。在2004年,关于加强政务信息资源开发利用工作的若干意见中,也提出了要建设政务信息资源目录体系和交换体系,加强政务信息资源的开发利用,同时支持和鼓励政务信息资源的公益性开发利用。
 
  在2015年关于运用大数据加强对市场主体服务和监管的若干意见中,也明确提出要建立政府信息资源的管理体系,统筹推进政府信息资源的建设、管理和开发利用。
 
  2016年关于政务信息资源共享管理办法中则明确了三点,将其归纳为三种分类,落实三项任务。首先是明确对政务信息资源进行定义,确定三个分类分为不予共享、无条件共享和有条件共享三类。第二个就是要落实三项任务,其中包括最主要的任务是编制资源目录。同时,在2016年关于全面推进政务公开工作的意见中,也是提出要实施数据资源清单的管理,来强化国家政府数据的统一开放。
 
  我们对政务信息资源目录体系的概念进行了概括,政务信息资源目录体系是按照统一的标准规范,对分散在各级政务部门、各领域、各地区的政务信息资源进行整合和组织,形成可统一管理和服务的政务信息资源目录,实现政务信息资源规范管理、共享交换和信息服务,为使用者提供统一的政务信息资源发现和定位服务。
 
  按照政务信息的应用属性,目录体系又可以分为几个类别,一是部门的政务信息资源目录,这里面又可以分为部门的业务目录,部门的信息共享目录,以及部门的信息公开目录。第二个是政务基础信息共享目录,包括自然人、法人、空间、地理、宏观经济的基础信息目录。第三个是政务主体信息资源的共享目录,包括应急指挥主体、城市管理主体、综合治理主体,以及社会救助主体。不同的目录在编制过程当中,覆盖部门范围和操作方法应该有共性,也有个性。
 
政务信息资源目录体系架构图
 
  上图是对政务信息资源目录体系的架构进行展示:它主要包括基础设施层,软硬件环境和网络基础设施。上面一层是数据资源层,包括政务信息资源库、政务信息资源核心元数据库,以及资源目录、服务目录等。目录服务的功能层,主要的功能包括对编目服务、注册服务、目录的发布服务、目录的查询服务、目录的维护、用户管理以及交换接口。最上面是目录服务的展现层,也就是说各个部门或者说大众查询展现层,包括内部的网站,交换的平台,开放的平台。包括一些其他的应用。同时为了保障目录体系的规范化管理,它还会涉及到保障层,包括对于目录的运维管理,以及目录一系列的标准规范,如信息资源编码规范,以及元数据的规范等等。
 
  对于政务信息资源目录梳理和编制工作的主要意义,我们将其归纳为三点:政务管理、信息共享和信息化工作。首先,对于政务管理来说,通过对政务信息资源的梳理,可以清楚的了解到部门的核心业务是什么,核心业务产生的资源是什么。对于信息共享来说,可以比较清楚的认识到部门的内部以及跨部门的一些信息共享的需求是什么,并且可以根据需求的梳理,编制出信息资源的需求目录。通过梳理我们可以得到比较全面的政务信息资源的地图,可以比较清楚的看到,哪些信息是可以向社会公开的,哪些信息是在部门之间公开的,哪些是部门内部应用的。第三个是对信息化工作的意义,通过对信息资源的梳理,我们可以看到数据有哪些系统支撑的,哪些数据已经进库,核心业务的信息化水平如何,对于下一步跨部门信息系统的集成,也是可以起到很大的作用。比如说未来要新建系统,是不是可以看一下,这个系统一些功能是不是可以通过已经有的应用系统去进行整合或者说改造,它的数据又是可以从哪些系统来获取等等。
 
  政务信息资源目录体系的建设重点解决了3W1H的问题。第一个是WHAT,全面梳理摸清底数可以知道这个部门有什么数据。第二个是WHERE,通过对政务信息资源科学合理的分类,可以对它进行比较精准的导航、检索、定位、发现,可以知道想要的数据在哪里。第三个是WHO,可以比较清楚的知道,这些数据资源是由谁提供,谁想使用它。第四个是HOW,通过对政务信息资源规范管理,可以明确未来如何发布、如何查找、如何维护、如何更新、政务信息资源目录。
 
  3.国内案例分析
 
  国内的一些省市在政务信息资源目录体系建设中进行了积极的探索,这里重点讲四个案例:
 
  浙江省政务数据资源目录体系的建设:通过推进省级单位和设区市政府部门政务信息资源目录体系梳理,整合现有各类跨部门数据交换体系,构建公共数据统一共享交换平台,建设全省统一的政府信息资源管理服务系统和电子证照归集库,建立跨部门数据采集、共享校核机制和比对、清洗机制,实现信息资源共享管理。
 
  上海市构建市区两级联动模式:上海市在2016年开始探索开市区两级联动开放政府数据,鼓励区(县)政府参照市级政务数据资源共享和开放推进模式开展数据资源目录编制、数据开放和平台建设等工作,并与市级形成有效对接,构建市区两级联动模式。
 
  四川省提供数据交换的基础设施:规定省级政务云和信息资源目录只提供数据交换的基础设施,不汇聚部门的数据,也不落地部门的数据,数据的支配权和归属权仍然属于相关部门,来设置信息共享的权限,建立政府数据开放网站。
 
  佛山南海区利用数据资源目录高效开放数据:佛山南海的数据开放平台是基于数据资源目录来建设,各部门预先设置本部门数据资源目录中数据集的“开放”等级,数据开放平台直接读取位于“开放”等级的数据并向社会公众提供下载。
 
  通过在全国其他地区的实践经验,我们将政务信息资源目录的编制实施思路归纳为两种思路,第一种思路是业务导向。第二种思路是技术导向,这两种思路应该说各有优缺点,同时切入点和思路方面有所差异。
 
  业务导向是以单位的业务职能为主要切入点,技术导向则是以已经建设落地的应用系统和数据库为主要的切入点来编制资源目录。思路方面,业务导向的主要思路是从机构职能到业务事项,然后梳理出资源。技术导向则是从已经落地的应用系统去梳理出业务主线,从业务主线再梳理出信息资源。
 
  业务导向比较大的优点,因为它是从业务来出发去梳理,它可能涵盖的比较全面,能够涵盖到各个部门比较全面的业务。它的缺点是成本比较高,见效的比较慢,调研周期比较长。对于技术导向来说,优点就是见效快。因为所梳理的信息资源已经全部落地,可以去导出它的数据结构或者察看它的技术文档等等这样的方式来梳理它的信息资源。缺点就是没有办法全面认识业务,因为所梳理的资源是已经上系统的这部分业务,有些业务可能现阶段还没有上系统,这一块如果以技术导向的思路去做,就没有办法把这一块数据涵盖进来。
 
  所以说在做信息资源目录编制的时候,应该说比较好的方式就是业务导向加技术导向取长补短,两者结合这样去做。我们也根据实践对业务导向和技术导向的实施步骤做了梳理,首先业务导向,第一步是编制编目标准规范,像刚才所说的,第一步就是要将信息资源的编码方案以及元数据的标准规范,把规范编制好。
 
业务导向实施步骤
 
  第二个就是要确定梳理范围,这里的梳理范围应该包含了三个层次,首先是确定梳理部门的范围,这个也资源目录的类型息息相关。如果做各个部门的政务信息资源目录,势必要把所有的部门都调研到。如果做法人库和人口库基础信息目录资源,去调研法人和自然人相关的部门。第二个层级是确定信息集覆盖范围,是要覆盖部门的全部业务,还是主要业务。第三个层级是确定字段的梳理范围,开展信息资源的调研工作,编制调研方案,发送调研表,然后上门调研等这样的形式去开展。第四是梳理部门的业务职能,通过部门的三定方案、权责清单等梳理。第五是深度分析拆解业务事项,分析每一个业务事项办理的提交材料,以及输出的材料,进行深度的分析、拆解。第六是清洗合并相同或者是相似的数据集第七是对数据集的归类。比如说要做城市管理的主题数据库,如果说前期将各个部门的信息资源都梳理完了,下一步就是对城市管理类的数据集进行归类。第八是编制资源目录。
 
  技术导向的实施步骤同业务导向的实施步骤有几个地方的差异,主要是第四、第五,第四个我们要了解系统功能,整理业务属性,通过线上调研察看系统的方式,来了解系统的功能。第五个是按照系统的业务主线来梳理信息资源。比如说刚才所说的通过查看技术文档,导出数据结构等方式来进行梳理,下面都是一样的。
 
  政务信息资源梳理和编目是长期复杂的工作。在具体操作过程当中有几个需要注意的点,首先领导重视是关键,因为政务信息资源涉及到的部门比较广,只有领导重视,将其作为一个一级工程去抓,做的结果可能比较好。第二个是业务人员是主力,政务信息资源目录的编制,同部门的业务职能息息相关。只有工作在一线的业务人员,他们对本部门的业务职能最为清楚,同时对于哪些业务有相应的系统,也是最为了解的。然后是试点先行,稳步推进,采取从简到难的原则,先选择几个部门,先进行一个试点编目,再总结一些经验推广到其他部门。然后是构建长效机制,比如说加强培训等等。
 
  4.国脉服务案例
 
  国脉互联政务信息资源梳理的案例非常丰富:
 
  舟山:建立了“四统一、两清单”,以业务梳理为核心,从业务事项——信息资源——应用系统的顺序进行梳理,建立全市55个部门的“数据资产清单”和“基础数据库的资产清单”;
 
  徐汇:从与部门核心业务和数据相关的已建应用系统和数据库入手进行资源梳理,与核心业务相关的已建应用系统入手,最后推导到相关业务事项;
 
  南宁:业务梳理与应用系统数据梳理两者相结合,通过业务和应用系统的对比,最终得出全市80个部门数据资源清单;
 
  佛山:提出数据银行体系的构建理念,管理层面,建立一套完善的数据生命周期管理制度,制定全市统一数据规范和标准,技术层面,通过改进现有数据共享平台技术缺陷等,以逐步完成数据银行的各系统功能建设;
 
  普陀:编制《公共服务事项目录清单》,以公共服务公平、可及为目标,对全区公共服务事项进行全面梳理,梳理内容细分为办理类和非办理类(单位名录类、场馆信息类、普通信息类);
 
  河北:主题数据梳理,城市管理梳理,对城市建筑物情况、城市部件、市容管理、城市绿化管理等资源进行梳理;社会救助梳理 ,对最低生活保障、医疗救助、教育救助、住房救助、就业救助、临时救助等资源进行梳理。

责任编辑:admin