开放数据发展伊始, 通常被认为是政府透明化工作的一个环节, 是政府信息公开工作的自然延伸。2013年10月,麦肯锡研究院 (Mc Kinsey) 发布的一份报告《开放数据:用流动的信息来开启创新与成效》显示, 开放数据能够带来3万亿~5万亿美元的经济价值, 首次将人们的视线从政府透明化转向开放数据的经济价值。政府信息公开是在政府职能由统治型向服务型转变过程中产生的满足公众知情权、监督权的制度与行为, 随着政府的转型及公众法制意识、信息利用能力的提升, 自上而下的政府信息公开方式以及单纯公开加工处理后的信息已不能完全满足公众的信息权益保障, 必然催生政府与公众之间围绕原始数据需求与利用的互动交流, 即信息公开向数据开放的嬗变。但是, 嬗变的过程是复杂的, 影响因素也是多元的, 既有政府职能转变的战略层面的动力, 也有自下而上的公众需求的拉动, 亦有技术的驱动、媒体的倒逼、开放数据利用实践的推动等。基于此, 本文首先对政府信息公开与政府数据开放的概念及相关要素进行分析, 然后对嬗变的驱动力进行解析, 最后对嬗变的未来走向进行预测。

  1 概念与内涵的演变

  1.1 政府信息公开的相关概念

  信息公开的含义, 既可以理解为一项制度, 又可以理解为一种行为。作为一项制度, 主要是指国家和地方制定并用于规范和调整信息公开活动的法规规定;作为一种行为, 主要是指掌握信息的主体, 即行政机关、单位向不特定的社会对象发布信息, 或者向特定的对象提供所掌握的信息的活动。日常工作和生活中所讲的信息公开, 主要是指公开信息的行为。既然是行为, 无疑包含着行为的主体和客体。主体方面, 瑞典的“公共机关”不仅包括行政机关, 而且还包括国会、地方议会、瑞典国教议事大会等具有决策权的机构。美国制定的《信息自由法》主要针对的是联邦行政机关, 国会和法院已经充分对公众公开。我国的“行政机关”是由国家依法设立、行使国家行政职权, 掌管国家行政事务的国家机构。客体方面, 根据瑞典《出版自由法》第二章第三条的规定, “文件”是指任何能被阅读、收听或通过其他技术的方法获知其内容的文字、图片和音像资料。“官方文件”是指公共机关所持有的由公共机关所制定或由其从别处收到的文件。美国《信息自由法》第六条界定了“机关”与“记录”的概念, 几乎所有的联邦行政机关均在该法的调整范围内, 包括电子形式在内的任何载体形态所承载的信息。许多国家的信息公开制度都将公开对象限定为信息自身, 而日本《信息公开法》将公开对象“行政文件”界定为“文书、图画以及电磁性记录”这类信息的记录载体作为公开的对象, 并非将信息自身作为公开的对象。我国《政府信息公开条例》第二条规定:“本条例所称政府信息, 是指行政机关在履行职责过程中制作或者获取的, 以一定形式记录、保存的信息。”该定义对政府信息的界定包含3个要素: (1) 政府信息的产生者是行政机关。这里的行政机关包括狭义的行政机关和被授权组织。对于被授权组织而言, 只有依授权实施行政管理活动过程中所形成的信息才属于政府信息, 其开展自身业务时所形成的信息则不属于政府信息。 (2) 政府信息是行政机关在履行职责过程中制作或者获取的信息。对于“行政机关在履行职责过程中”, 行政机关对外进行行政管理活动所制作或者获取的信息肯定属于政府信息, 但行政机关内部管理活动尽管没有对外行使公权力并发生法律效力, 但仍然是公共资金运转的结果, 同样需要接受社会公众的监督。因此, 除归属于公务员个人从而与其职位无关的信息以及需要保密的信息之外, 都在公开之列。对于“制作或者获取”, 既包括其自身制作的信息, 也包括其获取的他人信息, 实际上还包括了其他主体制作但与政府职责的履行密切相关的信息。 (3) 政府信息是以一定形式记录、保存的信息。政府信息必须通过有形载体加以记录、保存, 口头消息、社会传闻等不属于政府信息。

  1.2 政府数据开放的相关概念

  “数据”区别于“信息”的最大之处在于它是没有经过任何加工与解读的原始记录, 不具有明确意义。政府在网站上“发布”的数据一般是经过加工的、不完整、不系统、非机读的数据, 无法被直接利用或再次利用, 所以不属于开放数据。政府向社会公众开放其所保有的数据, 供社会进行增值利用和创新应用, 为其生产、生活和经济社会活动服务, 将创造巨大的公共价值, 推动经济增长和社会发展, 提升国家整体竞争力。关于政府开放数据的定义, 目前尚未有统一的标准, 一些学者和机构对此作了探索。比如, 开放政府工作组提出, 政府数据在满足8项条件时方可称之为“开放”, 涉及国家安全、商业秘密、个人隐私或其他特别限制的数据除外。开放定义平台将开放数据定义为“可以被任何人免费使用、再利用、再分发的数据。在其限制上, 顶多是要求遵守一定的协议或授权”。郑磊将开放数据定义为“可以由任何人自由、免费地访问、获取、使用和分享的政府数据”。政府数据开放的目标是将参与方和不同利益引入政府决策和履职的过程中, 扩大信息公开的深度与广度, 推动政府与公众合作以改善政府治理效能, 促进经济发展和社会创新。笔者认为, 政府数据开放涉及多方利益相关者, 各方根据自己的利益取向对其定义也有所区别。从政府数据开放者角度来说, 政府数据开放是指政府部门对其在履行行政职能、管理社会公共事务过程中采集和储存的大量原始数据, 除依法涉密的之外, 全部、及时地以开放的格式永久免费和免于授权地向公众开放。从政府数据利用者角度来说, 政府数据开放是指可以自由、方便、免费和免于授权地访问、获取、利用和分享政府部门在履行行政职能、管理社会公共事务过程中采集和存储的除依法涉密之外的所有原始数据。上述两个定义, 虽然从不同的视角予以界定, 但基本上都涵盖了开放政府工作组对政府数据给出的8项条件。

  关于政府开放数据与其他数据之间的关联, 麦肯锡研究院在其报告中以图1 (笔者翻译) 予以呈现。根据图1, 开放数据不仅包括政府开放的数据, 也包括其他企事业单位等社会化服务机构开放的数据, 开放数据中存在部分可以被开放或加密脱敏后开放的个人数据。而大数据应该是具有挖掘和利用价值且尚未被完全开发利用的数据集合, 特别是可以数字化的机读型数据, 既包括可以开放的数据, 也包括必须保密的数据, 当然开放的数据中也难免存在一些毫无利用价值的数据, 比如一些陈旧的、冗余的数据。全部数据的范围最大, 既包括传统的图书、期刊、学位论文等文献信息资源, 也包括不断产生的数字化信息;既包括过时的、保密的、重复的数据, 也包括尚未被挖掘且富含开发利用价值的数据。

image.png

图1 政府开放数据与其他数据的关系

  2015年, 来自政府、多边组织、民间团体及私人部门的开放数据专家共同起草了一份国际开放数据宪章, 提出了开放数据需遵循的6大原则, 其中第4条就是“具有可比性和互操作性”。政府数据包括结构化数据、半结构化数据和非结构化数据, 不同类型的数据所包含的属性也不相同, 要保证数据的格式、结构以及标识都具有互操作性就必须具有统一的开放数据标准, 这也是政府数据开放工作中的难点。在这方面也出现了一些比较成功的经验和案例, 比如Yelp公司以businesses.csv, inspections.csv, feed_info.csv, violations.csv和legend.csv 5个文件分别包含餐厅信息、检查结果信息、数据源说明信息、检查违例详情信息和数值范围信息, 从而将原本复杂的餐厅卫生检查结果拆分成数据表来包含相应的字段及内容信息。不同地方发布的数据中所包含的信息也不一致, 比如同样是地理位置信息, 有的是文字描述型地址, 有的是经纬度表示型地址。数据的格式包括CSV, XLS, TXT, XML, JSON等, 但为了保证不同数据使用者不加限制地免费访问和利用数据, 推荐使用开放性较强的格式。数据的其他属性还包括公开保密性、时效性、产生时间、来源单位、发布单位等, 这些属性有时以类似元数据的形式被运用, 比如北京市政务数据资源网上提供了“原始数据下载” (包含.xls文件和.txt描述文件) 和“空间数据下载” (包含.dbf, .prj,.sbn, .sbx, .shp, .shx, .xml等空间数据存储与索引等文件) , 其中对数据属性的标识有资源名称、资源分类、数据安全限制分级等。成功的数据标准和格式的制定、推广、采纳、使用等环节都需要政府部门、企业、个人等利益相关者的积极参与和反馈, 从而创建不同领域统一标准的“语言”。比如, 交通领域的GTFS, 投诉举报领域的Open311, 住房领域的House Facts Standard, 合约领域的Open Contracting, 建设项目领域的BLDS等。

  1.3 两者之间的区别与联系

  1.3.1 侧重点不同

  政府信息公开侧重于“公开”, 针对的是政府信息不公开的状况, 对于保障公众知情权, 监督政府行为, 降低行政成本, 预防腐败滋生, 提高政府的行政透明度和公信力等均具有重要作用, 公开的是能够看得懂的政府信息, 比如预决算信息、财政信息、“三公”经费等。政府数据开放侧重于“数据集”, 特别是“原始数据”的彻底开放, 是政府部门和公共服务企事业单位履职过程中产生或搜集的共性的、基础性的、与社会公众生产生活密切相关的, 且能为社会经济发展作出贡献的数据, 比如测绘数据、交通数据、气象数据等。一方面促使社会对政府积累的数据资源进行深度开发利用, 鼓励数据应用创新, 支撑大众创新和万众创新, 促进产业转型升级和社会治理的创新发展;另一方面政府信息公开工作的实施主体是行政机关, 公开即目标, 而政府数据开放目标是使数据得以开发利用, 所以政府数据开放工作不能单独由政府部门来实施, 需要政府部门与用户进行互动沟通, 可以通过原始数据来监督政府决策的依据及其合理性。总的来说, 政府信息公开是“供给导向”, 政府数据开放是“需求导向”。

  1.3.2 用户不同

  政府信息公开的用户是普通公众, 即公民、法人或其他组织, 他们主要通过普通的政府网站所提供的简单数据查询服务来满足其信息需求, 减少了政府与公众之间的信息不对称, 政府信息的使用主体大多是需要了解政府办事流程或相关政策的个人或机构。政府数据开放所面向的是有数据处理能力的用户予以直接使用或从事各种服务开发的机构和个人, 让他们自己去分析、挖掘和利用政府数据资源, 更好地监督政府的同时, 也让政府数据资源得以深度创新应用, 从而减少了政府与公众在数据处理能力上的不对称。

  1.3.3 运作方式不同

  政府信息公开的主体是行政机关, 在技术上的难度不大, 可以采用法律、行政法规、政策等手段和方式进行“一刀切”式的布置和实施。政府数据开放的主体是行政机关及其下属的公共服务型企事业单位, 他们是各类数据库的实际建设者和维护者, 是数据的真正拥有者, 数据开放的目标是产生效益, 而效益的产生与政府数据内容密切相关, 只有公众关心的数据内容才会被增值型的信息服务企业所利用, 才能开发出公众喜闻乐见的App, 所以不能仅靠政府行政手段来运作, 需要营造和构建开放数据生态系统来推动政府数据开放工作的良性发展。

  1.3.4 价值取向不同

  传统的信息公开只关注政府层面的“公开”;而现在的数据开放更关注公共价值的创造, “开放”本身并没有价值, 只有将政府数据转化为信息, 再将信息转化为知识, 公众才可以充分利用这些知识进行决策制定、App开发利用或服务享用等。经济合作与发展组织 (OECD) 的报告将政府数据开放的价值总结为经济价值、社会价值和政治价值。政府技术研究中心的报告将政府数据开放的公共价值分为7种。例如, 北京市政府信息公开的平台是在“首都之窗”上设置的“北京市政府信息公开专栏”, 提供市政府组成部门、市政府直属机构等各部门公开的信息, 例如预决算、批文、办事指南、公示等。而北京市政务数据资源网上提供的是方便公众下载和利用的原始数据以及App应用, 例如“随心停”手机App是一款利用北京市交通委员会提供的备案停车站信息, 其他还有“宠物身边”“上下班路况”等。

  1.3.5 联系

  (1) 政府信息公开为政府数据开放在法律上奠定了基础, 是政府数据开放的前提;政府数据开放是政府信息公开在大数据时代的延伸和跃进, 是充分发挥政府信息对社会服务作用的进一步深化。大数据从“概念”走向“价值”, 最不可或缺的一个环节就是数据开放, 通过主动开放大量的、实时的、结构化的、格式标准化的数据, 鼓励社会力量充分开发利用政府数据资源进行创新增值应用, 同时关注了政府层面和用户层面以及两者之间的互动。比如, 大多数数据开放平台都允许数据开发者提交上传App应用, 鼓励用户开发利用和分享, 同时也提供了交互功能, 方便用户对数据进行请求、评价、评分等反馈。 (2) 政府信息公开和政府数据开放工作的顺利实施, 都依赖于政府部门的统筹规划和各层级部门之间的协调联动, 同时也需要各级财政部门的鼎力支持。 (3) 政府信息公开的效率与成本也是必须考虑的因素, 直接影响着政府信息公开的程度。在互联网时代发展初期, 信息传输速率、信息表现形式、信息处理水平、信息化发展水平以及国民信息素养层次等都决定着当时无法提出“政府数据开放”的构想, 政府信息公开和政府数据开放都是历史的产物, 是时代发展的必然。 (4) 两者均对于打造“透明的政府、智慧的政府、责任的政府”, 实现政府职能转型, 促进数据在社会的自由流动、知识向大众自由流动以及数据价值的释放过程中发挥着重要的作用。

  2 嬗变的驱动力分析

  社会发展的动力, 不是单纯的主体或者客体, 而是主体要素与客体要素相互作用的关系整体。在政府信息公开向政府数据开放嬗变的过程中, 既包括法律、政策、技术等客观环境要素演进变革的驱动, 也包括媒体、公众等主观因素的影响, 这些要素也不是单纯的主体或客体, 而是相互作用的关系整体, 共同推动着政府信息公开向政府数据开放的嬗变。为了更直观地展现政府信息公开向政府数据开放嬗变过程中的影响因素及内在动力机制, 笔者绘制了嬗变的动力机制图, 具体如图2所示。

  从图2可以明显看出, 信息公开是在创建透明政府过程中, 行政机关为了满足公众的知情权和监督权, 将在履行职责过程中制作或获取的以一定形式记录、保存的信息向社会公众公开的活动, 包括预算、决算、批文、公示等形式。在实施政府信息公开过程中, 受到法律、政策、技术等环境因素的影响, 这些环境因素也不是相互独立的, 其间也是相互交叉关联的, 正是由于这些因素随着时代与历史的向前发展不断演进, 最终促使了信息公开向数据开放的嬗变。政府数据开放是在创建透明政府、智慧政府和责任政府的过程中, 政府部门为了满足公众的数据利用权, 对其在履行行政职能、管理社会公共事务过程中采集和储存的大量原始数据, 全部、及时并以开放的格式永久免费和免于授权地向公众开放, 并将公众开发上传的数据产品继而再提供给社会公众使用, 推动经济增长和社会发展, 旨在培育良性循环的政府开放数据生态圈。政府信息公开向政府数据开放嬗变过程是复杂的, 涉及的因素也是多样的, 驱动作用和机制更是复杂和往复的, 下面仅选择关键且明显的几个方面进行分析。

  2.1 法律层面的保障与推动

  美国是最早实行数据开放的国家之一。1966年以前, 美国公民要想获取政府部门持有的文献、档案等政府信息, 主要依据美国1789年制定的《管家法》和1946年的《行政程序法》的有关规定, 但由于这两部法律的条文词义模糊和界定不严, 政府机构常常滥用相关规定拒绝向公众提供信息, 逐渐成为政府秘密的源头。1966年正式颁布《信息自由法》, 并随着时代的发展历经多次修正, 以立法的形式规范和细化豁免公开的9种情况, 特别是1974年的《隐私权法》, 1976年的《阳光政府法》, 1996年的《电子信息自由法》, 2002年的《情报授权法》, 2007年的《公开政府法》以及13489、13526号总统令的签署都从法律层面上保障了信息公开与数据开放工作的开展和实施。我国的《政府信息公开条例》开启了政府信息公开立法的第一步, 2011年8月最高人民法院《关于审理政府信息公开行政案件若干问题的规定》搭建了关于政府信息公开诉讼制度的基本框架, 此后围绕政府信息公开相关事宜进行了一系列法律法规的修改完善以及相关司法解释的出台为政府信息公开工作的顺利实施提供了强有力的法律环境保障。为确保政务数据资源共享开放有章可循, 完善政务数据资源共享管理方面现有的法律制度体系, 为数据资源共享提供立法保障就显得尤为必要和重要。从2015年开始, 我国很多省份已陆续出台了适合自身区域特征的制度规范, 比如, 《山东省政务信息资源共享管理办法》《杭州市政务数据资源共享管理暂行办法》《上海市政务数据资源共享管理办法》等, 明确了政务数据资源范围、职责分工、资源管理平台定位、共享使用流程、安全保障体系和长效机制等。同时, 上海市率先开展了政务数据资源共享开放的探索实践, 初步建立起政务数据资源目录体系, 已建成政府数据资源服务平台, 并打造了公共信用信息服务平台、网上政务大厅等一批跨部门、跨领域的业务协同平台。总之, 应建立健全数据开放的相关法律法规, 从法律层面入手去界定数据开放的机构、职责、许可、开放边界、数据清单、开放内容等方面, 使政府数据资源的开放有法可依, 强制性地推动政府部门、公共服务型企事业单位等部门深刻认识和发现自身所拥有的数据资源并主动开放, 保障数据开放的工作机制与开发利用效率。

图2 政府信息公开向政府数据开放嬗变的动力机制

  2.2 政策的制定与导向

  统筹整合政务信息化工作, 打破数据资源“部门化”壁垒, 促进政府部门间业务协同, 避免重复建设“信息孤岛”, 推进政务数据资源进一步向社会开放, 促进政府职能转变, 激发市场活力, 这已成为大数据时代建设法治政府、开放政府、服务政府的必然要求, 需要国家层面的顶层设计以及相关政策的出台与实施。在美国, 自2009年奥巴马政府《开放政府指令》的出台, 开放政府合作组织的成立, Data.Gov的上线以及世界银行政府数据开放项目的推进, 开放政府数据在许多国家迅速推进。2010年11月, 欧盟首次提出“欧盟开放数据战略”。2011年, 美国、英国、巴西等8国宣布成立“开放政府联盟”, 并发布《开放政府宣言》。2012年, 日本IT战略本部发布电子政务开放数据战略草案, 迈出了政府数据开放的关键一步。2015年8月, 我国国务院印发的《促进大数据发展行动纲要》将“加快政府数据开放共享”作为重要任务进行部署, 明确要求在2017年底前形成跨部门数据资源共享使用格局, 要在2018年底之前建成政府数据统一开放平台, 要在2020年底之前逐步实现交通、医疗等民生保障服务相关领域的政府数据集向社会开放。2016年2月, 中共中央办公厅、国务院办公厅印发的《关于全面推进政务公开工作的意见》中明确指出, 要按照《促进大数据发展行动纲要》的要求, 稳步推进政府数据共享开放, 特别强调要支持鼓励社会力量充分开发利用政府数据资源。所以, 随着政府信息公开工作向纵深方向发展, 关于数据开放的相关政策陆续出台, 必然对政府数据开放工作的未来前景与方向予以定位与规范, 促进信息公开向数据开放的嬗变。

责任编辑:lihui