摘要:数据开放已经成为政务公开的一项制度安排内容。根据相关要求, 我国将构建统一高效、互联互通、安全可靠的国家数据资源体系, 推动公共数据资源向社会开放, 建设全国一体化的国家大数据中心, 推进技术融合、业务融合和数据融合;一些部门和地方政府正在积极探索如何整合建设和开放利用政府数据资源, 这些都给政府数据开放管理提出新的挑战。本研究探讨加强政府数据开放管理的必然性和可行性, 根据国内外实践提出并分析了有待研究解决的数据分类、数据权属、数据生命周期、数据规范、数据质量、数据利用和数据收费等七个基本问题, 为政府数据开放管理后续研究和工作推进给出一些建议。

  政府数据开放是信息技术、政治和社会发展到一定时期的产物, 它是政府数据资源内部生成、协同共享和外部开放利用的一个管理过程, 旨在促进政府治理和服务能力的提升, 提高公共数据资源的开发利用水平。

  一、政府数据开放的必然性

  加强政府数据开放管理, 不仅是适应互联网发展新趋势的要求, 还是全面推进政务公开, 增强互联网+政务服务能力的重要途径, 更是打造廉洁政府、创新政府和服务型政府, 激发市场活力和社会创造力的重要抓手。

  (一) 符合互联网时代发展的大趋势

  数据资源是互联网时代最为宝贵的战略性资源之一。互联网基础设施的快速发展为大数据的产生提供了可能。人类从2012年开始进入大数据时代, 庞大的数据资源使得各个领域开始量化进程, 决策将日益基于数据和分析而做出。我国在1994年接入全球互联网, 历经20多年发展, 互联网已经走进千家万户和普通企业。据CNNIC统计数据, 截至2016年6月, 我国网民人数有7.10亿, 手机网民规模达6.56亿, 网站总数454万个, 域名总数3 698万个, 政府网站 (gov.cn结尾) 55 290个。据中国政府网全国政府网站数据库显示, 截至2016年12月中旬, 我国政府网站运行总数47391个。网络环境的完善和手机上网的普及, 人们对政府数据资源获取的渠道日益便捷。

  互联网大数据的迅猛发展, 正在创造出巨大的经济和社会价值。政府数据资源也是互联网大数据的重要组成部分。目前, 互联网上的数据每年以50%的速度增长。据IDC预测, 到2020年全球将总共拥有35ZB的数据量。以数据开放、数据流转、数据挖掘和数据可视化等为基础发展起来的互联网信息服务业正在成为规模庞大的新兴服务产业。

  在互联网时代, 管好政府数据, 利用政府开放数据为群众和企业服务, 是提高政府透明度, 推进“互联网+政务服务”, 发展政务大数据服务业的重要前提, 可以为产业转型升级和创新创业提供新的支撑点, 符合时代发展的趋势。

  (二) 符合政府管理的国际发展动向

  进入21世纪以来, 各国政府高度重视政府数据资源的管理和利用。发达国家在政府数据的开放、管理和利用等方面已经形成一套完善的制度体系, 引领政府管理的新潮流。

  美国、英国等国在政府数据开放和开发方面已形成完备的法律制度, 通过统一的数据开放平台为公民和企业提供数据服务。美国通过《信息自由法》《电子信息自由法令》《阳光下的政府法》《隐私权法》等来推动和规范政府数据开放。英国2011年推出的《国家数据开放行动方案》、2013年出台的《开放政府合作伙伴2013—2015英国国家行动方案》都提出要推动开放政府数据。美国政府早在2009年建成统一数据开放平台, 英国、法国、加拿大、澳大利亚、新西兰、爱尔兰、新加坡和韩国等相继建立政府数据开放网站平台。2012年, 英国政府成立开发数据研究所, 加快政府开放数据的商业化进程。

  (三) 符合政府建设和政务服务发展预期

  推进政务公开, 建设透明政府既是提升治国理政能力的必然要求, 也是保障公民民主政治权利的基本前提。政府数据开放正是其中一项重要工作。开放政府数据作为互联网时代政府的新职能, 可以增进施政民意基础, 提高政府工作透明度, 加强有效监督, 促进社会创新, 提升社会福祉。

  利用“互联网+”创新提供政务数据服务, 既是加强政府数据管理的必然选择, 也是公共服务发展的新趋势。“互联网+”是创新2.0推动下的互联网发展新形态。河南、重庆、广东和上海等地都在利用“互联网+”的理念将政府服务接入互联网平台。大数据作为“互联网+”的内容载体, 是一国之基础性战略资源, 对经济运行、社会生活和政府行政方式具有重要影响。运用政务大数据推动经济发展、完善社会治理、提升政府服务和监管能力, 深化大数据应用, 推动政府治理能力现代化, 正在成为趋势。其中之一就是大力推动政府数据开放共享, 促进各类公共数据资源有效整合。

  二、政府数据开放的可行性

  经过近三十年的发展, 我国电子政务运行体系基本建成, 各级政府网站和各类业务系统承载大量的政府数据资源。管理和利用好政府数据对于透明政府建设和政务服务能力提升十分重要。

  电子政务建设积累了丰富的政府数据资源, 开放政府数据成为大势所趋。“十五”“十一五”“十二五”期间国家重点推进的金字工程、重要信息系统和基础信息库建设, 已经取得阶段性进展。这些基础信息库和重要信息化工程, 为政府数据资源的积累打下基础。为了促进大数据发展, 建设透明政府, 一些地方和部门分别通过政府网站向社会开放数据。如国家林业局对各级林业主管部门的各类数据成果资料、国内外林业信息资源进行整合, 在2016年2月建成中国林业数据开放共享平台, 免费提供十六大重点数据库的数据资源, 数据库的资源数量为58, 889个。国家统计局、中国气象局以及北京、上海、浙江、武汉、广州、深圳和青岛等地通过建设政府数据开放网站或者专栏, 向公众提供网站数据服务。

  政府网站管理数据已有一定的积累, 取得较好的开放效果。2015年, 全国第一次政府网站普查活动建立了政府网站基本信息数据库, 记录全国各级政府网站的名称、地址、主管单位、运行状态等基本信息, 形成准确、完整的政府网站动态档案库。该数据库在中央政府门户网站开放后, 在两个月时间里, 搜索量达8万余次, 下载1.3万余次, 深受网民和企业的好评。

  一些政府部门也开始与社会合作实现政府数据的社会化再利用, 释放政府数据的潜在价值。据实地调研, 国务院一些部门通过各级政府网站平台向部分企业授权开放政府数据, 充分发挥政府网站数据应用价值。一些地方政府通过举办各种开放数据应用大赛活动推动政府数据再利用, 为社会公众生活提供了更多便利。

  我国政府数据资源的开放和管理虽然已取得一定进展, 但与社会和公众的期望还有一定的距离, 还有一些基本问题有待研究和解决, 如政府开放数据确权、数据源管理、开放流转利用规则、关联部门之间协同关系、数据大通道建设和管理、政务大数据的清洗与隐私保护等。研究和分析这些基本问题对于稳步推进政府开放数据管理有重要的现实意义。

  三、政府开放数据面临的主要问题

  本研究在梳理国际政府数据管理经验的基础上, 结合国内部委和地方相关调研, 提出政府数据开放管理的若干重要问题, 并做如下分析。

  (一) 开放数据分类

  在数据分类方面, 电子数据和科学数据的分类已有一些研究成果。政府开放数据分类研究目前比较少见。根据我们的实践经验, 政府开放数据的来源可以分为四种类型。一是政府部门在管理和服务过程中获取、产生和发布的数据, 如公告、公示、留言回复、办事服务、报告中的数据;二是其他政府部门提供的数据, 如部门或行业后台信息报送库;三是与自然环境互动产生的数据, 如气候气象、环境监测、科学试验等;四是与各类信息化系统交换共享的数据, 如国家基础数据库、政务共享交换平台、数据开放平台、信用信息平台、政务信息化系统提供的数据。

  单纯从网站类数据来看, 政府网站数据又可分为五类:网站行业管理数据、网站用户行为数据、用户个体属性数据、网站系统业务数据和网页内容数据。一是网站行业管理数据, 包括网站管理基本信息、网站地址导航、网站地图等;二是网站用户行为数据, 指用户访问政府网站时后台产生的留痕数据;三是用户个体属性数据, 如用户注册认证、参与互动活动、咨询或投诉时提交的各类个人身份信息;四是网站系统业务数据, 是指依靠政府网站承载业务系统或者自然人文环境监测工作而获取、产生的数据, 有时候包含少部分用户个体属性数据;五是网页内容数据, 主要是网站主管部门和政府相关职能部门通过网站内容管理系统等公开发布或查询得到的页面内容数据。这五类网站数据都在不断增长, 其中, 用户行为数据呈指数级增长。网站数据类型除了数值、文本、图片、图形、语音和视频, 还有地理位置、实时视频流等富媒体数据, 开放程度各有不同。

  开放数据是从数据开放的维度对上述各类政府数据重新进行划分, 二者既有关联, 也有区别。政府开放数据可能来自网站行业管理数据、信息化系统业务数据, 一旦决定通过政府门户网站或者政府数据开放平台对外提供开放数据集, 这类数据就成为网页内容数据。用户行为数据和用户个体属性数据经过脱敏处理后, 也可以选择部分群众急需的有价值的部分内容作为网页内容数据对外开放。因此说, 网站数据是政府数据管理和数据开放的基础, 政府开放数据是政府网站数据对外服务的一种形式。

  政府开放数据的分类需要考虑国家安全和隐私保护等法规的要求, 需要依靠深化政务公开来推进。专家认为, 政府数据开放的内容重在“数据”, 重在“机器可读”的“数据组”, 这是技术层面的考虑。“美国对政府数据开放都是通过立法进行限制, 强调数据的开放必须在国家安全、法律执行、个人隐私保护等方面达成平衡”, 遵守《信息自由法》规定的9项信息公开豁免条款, 符合《隐私权法》《电子信息自由法令》《阳光下的政府法》《文书工作削减法案》《电子政府法》《开放政府指令》《信息自由法的备忘录》《透明和开放的政府备忘录》等。就政府网站数据而言, 虽然不完全属于秘密数据, 但也存在一些敏感数据。比如, 用户个体属性数据, 存在大量的公民和企业敏感字段, 网站系统业务数据也会包括一些敏感信息。网站敏感数据不是固定的, 它是动态变化的, 在数据生产、加工汇总的不同阶段具有不同的敏感度。对于个体信息之类的敏感数据的保护, 目前缺乏相应的制度, 经常成为部门担心开放数据导致泄密的顾虑缘由, 这在政府开放数据的分类中必须予以关注。

  (二) 数据权属关系

  2010年, 英国首相卡梅伦正式提出“数据权”概念, 认为数据权是信息社会一项基本的公民权利。数据开放运动的兴起, 数据权也进入公众的视野。

  根据专家的观点, 数据权基本谱系分为数据主权和数据权利两大框架。

  “数据主权是指国家享有对其政权管辖地域内的数据生成、传播、管理、控制、利用和保护的权力。对数据跨国流动的管理和控制是数据主权的重要内容。数据主权包括数据管理权和数据控制权”, 其主要功能是在信息社会巩固国家主权的地位。欧盟及其成员国在数据方面的立法, 重点是通过加强数据跨国流动的管控, 来保护其数据主权。“数据管理权指对本国数据的传出、传入和对数据的生成、处理、传播、利用、交易、储存等的管理权, 以及数据领域发生纠纷所享有的司法管辖权。数据控制权, 指主权国家对本国数据采取保护措施, 使本国数据免遭被监视、篡改、伪造、毁损、窃取、泄露等危险的权力, 保障数据的安全性、真实性、完整性和保密性。”数据主权不但指向国家安全, 而且直接指向公民整体的隐私、财产和人身利益等。

  由于信息是有意义的数据, 知识是可解释的信息, 数据与知识存在天然的密切关联, 数据权利与知识产权在权利属性上比较接近, 数据权利跟知识产权一样, 是一种兼具人格权和财产权双重属性的权利, 但却与知识产权具体的权利内容迥异。

  数据人格权主要包括数据知情同意权、数据修改权、数据被遗忘权等三大权属, 主要功能是保障公民隐私空间。2015年12月15日, 欧盟《一般数据保护条例》 (General Data Protection Regulation, 简称GDPR) 赋予社会公众数据可携带权、数据被遗忘权和数据知情权。

  数据知情同意权分为数据知情权和数据同意权两部分, 知情是同意的前提, 同意是知情的“后续”, 知情权是同意权的基础, 立法上多是通过对数据收集者或控制者课以告知和证明告知的义务, 来保障数据主体的数据知情同意权。数据知情同意权是指服务提供商 (或政府) 在采集或处理个人数据前均须先告知数据主体数据采集的目的、用途、后续变化、处理方式、撤销方式并征得数据主体同意。从立法趋势来看, 近年来有消极同意 (沉默或不作为推定为同意) 向积极同意 (明确表示同意) 转变的趋势。

  数据修改权和数据被遗忘权, 是指在个人数据因不准确、不完整、滞后等原因可能对个人带来负面影响时有修改和被遗忘 (删除) 的权利。数据修改权具体指数据主体享有或授权他人修改其数据的权利, 也就是数据主体有权通过对相对方设定义务, 禁止他人未经其授权而擅自修改其数据, 旨在维护个人数据的准确性、真实性和完整性。网站数据往往不由数据主体掌控, 而由服务商或政府机构管控, 更需要保障数据主体的修改权。但是, 数据控制者和处理者为数据免遭泄密所做的匿名化处理是业内惯例, 不属于数据主体修改权保护的范围。

  信息技术已经让人类丧失遗忘的能力, 被遗忘权应运而生。欧盟早在1995年《数据保护指令》中就规定了被遗忘权。欧盟和美国的专家认为, 被遗忘权包括传统遗忘权和删除权, 传统遗忘权是针对服务商收集使用个人被动共享公开的数据, 保证个人拥有将某些公开数据 (如搜索引擎、门户网站记录、电商网站记录) 完全删除的权利;删除权针对用户自己公开表达传播的内容, 保障个人拥有删除个体自己传播的数据的权利, 数据主体可以有效控制他们的个人数据。

  数据财产权是与知识产权、物权、债权等并列的一项财产权, 不需要比照物权下的所有权的占有、使用、收益、处分等四项权能配置其权利内容, 不等同于所有权。数据财产权主要包括数据采集权、数据可携权、数据使用权和数据收益权, 其功能是促进数据资源合理高效利用。

  数据采集权是数据主体有权同意或禁止对其数据进行采集的权利, 旨在规范服务商、运营商、政府等初始采集者的数据收集活动, 防止数据“寡头”的出现。

  数据可携权是指数据主体有权要求掌握其数据的相对方协助其将个人数据在不同系统或设备等载体之间进行迁移、保存, 符合“权利带来便利”的逻辑。

  数据使用权是指数据主体, 哪怕没有直接控制或占有自己数据, 也有使用其数据的权利, 借此“对冲”数据寡头所带来的负外部性。

  数据资产并非公共资源或公共资产, 属于增量财产, 能带来财产性收益, 凡是将非自有的数据用于商业目的, 都应当支付“对价”给数据财产权主体, 而不能无偿使用。数据收益权是指数据主体基于其数据获得收益的权利。

  美国的政府数据资源不受著作权保护, 英国政府拥有政府数据资源的著作权。《美国著作权法》第105条规定, “该法规定的著作权不适用于任何美国政府的作品, 但不禁止美国政府获取和持有通过授权、购买或其他方式转让给它的著作权”。英国《1988年著作权、设计和专利法》规定:“政府文件受皇家著作权或议会著作权保护, 或作为法案、行动受到保护。”英国政府认为, 政府信息资源的生产和来源都依赖于人民的纳税, 而从政府信息资源的开发、利用中获得大量经济利益的是少数人。在法律层面上, 我国政府数据资源并没有明确的权属人。

  我国政府数据权属关系也需要在数据主权和数据权利两方面分别构建不同的框架。数据主权需要考虑数据管理权和数据控制权, 数据权利需要考虑数据人格权和财产权。2016年6月的《民法总则 (草案) 》第一百零八条提出权利人依法就数据信息享有知识产权权利, 已将数据财产权与知识产权并列。2016年11月通过的《网络安全法》在数据权利方面做出许多明确的规定, 如网络运营者不得泄露、篡改、毁损其收集的个人信息;个人发现网络运营者违反法律、行政法规的规定或者双方的约定收集、使用其个人信息的, 有权要求网络运营者删除其个人信息;“任何个人和组织不得窃取或者以其他非法方式获取个人信息, 不得非法出售或者非法向他人提供个人信息”。政府数据权属关系如何界定还有待深入研究。

  (三) 生命周期管理

  政府数据管理的生命周期分为六个阶段:数据生成和发布、权限配置管理、网上流转、数据呈现、利用管理和更新管理。以网站数据为例, 不同类型网站数据管理的目的各不相同。网页内容数据管理重在实现页面内容的准确性、一致性、持续性和时效性等;网站用户行为数据管理重在规范行为数据的采集、存储、利用和传播等;用户个体属性数据管理突出Cookies的使用规则、隐私权政策、未成年人的隐私信息保护、网站经营者责任;网站系统业务数据管理重点放在数据的生成、存储、共享、交换、开放、使用和保护等;网站行业管理数据的管理要体现数据的权威性、时效性和便捷性等。

  数据采集是政府数据生成的原始步骤。政府数据共同的来源渠道有政务公开数据、公众互动数据和用户行为数据等, 部分来自部门之间数据共享交换、现场采集或数据上报, 共同的特点就是随政府部门公共职能而产生, 具有行业业务特性。不同渠道采集数据可以实现数据的比对, 确保数据全面和准确, 但也可能导致数据之间存在冲突或不一致, 需要依据行政职能和数据质量进行数据处理。采集后经过处理的数据要展现到网站上让民众知道和下载还需要进行数据发布。数据发布, 无论是自动发布还是人工发布, 都要遵循相应的管理流程。

  数据权限配置管理包括部门权限配置管理和岗位权限配置管理, 岗位权限配置管理包括政府数据的产生、比对校验、调取审计、安全保密、敏感信息审核和审核审批等进行岗位职责和权限的界定。

  政府数据的网上流转主要涉及数据产生过程、处理过程、比对校验过程、审核过程、数据流转方式以及数据留痕管理。流转方式有多种, 包括线下环境流转到网站系统、业务系统数据流转到网站系统、网站系统数据流转到业务系统、政府部门网站之间的数据流转。

  数据呈现需要突出实用性、权威性、人性化、个性化和集成性, 提供良好的用户体验。不同格式种类的数据需要用不同的方式来呈现, 数据呈现方式关系到用户体验和数据使用效果。

  政府数据的利用包括内部利用、外部利用、决策利用和利用评价等四种方式。只有做好数据的利用管理, 才能提升电子政务系统的整体绩效。内部数据利用包括直接利用、授权利用、交换利用等方式, 重在做好权限管理、接口管理和安全保密管理。外部利用主要指社会公众、企业法人和其他社会组织和个人对政府公开数据 (也包括依申请公开的数据) 的利用, 需要体现合法性和公开性的原则, 是政府数据资源充分发挥价值的关键所在。外部利用以免费利用为主, 面向社会营利机构、研究机构提供的整理或再加工的数据, 可以实施收费利用。决策利用主要指向领导层提供决策所需数据的利用。利用评价是指用户对数据利用的反馈, 包括数据利用效果评价、数据利用建议等。

  政府数据有时效性和生命期限, 需要不断更新清理。过期失效的网站数据应该及时清理更新, 或者标示过期失效提示, 对历史数据进行归档存储, 继续提供服务。

  (四) 数据标准规范

  数据标准规范是数据管理和利用的基础。不同部门对数据业务管理的要求不同, 主要体现在不同的数据采集口径、转换和加工规范;对数据的技术管理因开发商的不同也有差异, 主要体现在数据的格式、字段、载体的随意性。

  数据标准规范就是要对各类数据 (主要是元数据和交换数据) 进行规范化定义和统一解释, 实现业务部门、技术机构对政府数据资源的统一理解和规划, 增进数据的一致性, 减少数据格式转换, 规避信息支离破碎, 促进政府数据的信息集成和高效共享, 提供高质量的数据服务。

  在国外, 完善的数据标准管理是政府数据开放成功的关键。美国政府数据开放门户网站data.gov问世前, 超过2万家政府网站提供格式各异的数据格式, 用户搜寻信息、处理信息的难度很高, data.gov按照统一的数据规范来整合各级政府部门、公共机构的开放数据, 通过统一元数据格式及元数据地图对外提供集中的数据服务, 提升政府数据的社会使用效率。美国政府网站数据的标准管理, 主要解决两个方面的问题:一是定义政府网站的标准元数据目录, 消除数据歧义;二是统一数据交换标准, 整合各部门发布的数据资源, 保证数据畅通。

  (五) 数据质量管理

  数据质量管理要保证数据的真实性、一致性和时效性。

  数据真实性是指在网站上发布的数据必须是客观的、真实的, 没有人为干扰的数据。受各种历史原因和现实条件的制约, 开放的政府数据不可避免地会有一些失真、“难看”, 甚至是无意的修饰, 真伪难辨, 产生各种偏差。国外开放数据管理是通过采用优化统计方法、监控数据质量等方式提升数据质量。

  数据一致性包括两个方面:一是同一份分散在不同地方的数据, 或经过简单转化后的数据之间是否一致;二是在业务上有关联的数据之间的逻辑关系是否正确和完整。国外政府网站一般提供一个统一的平台, 由政府统一管理、统一发布, 所以结果是一致的。提高数据一致性, 一是可以按数据类型统一数据发布部门、发布口径, 规范一致性管理, 确保一数一源;二是各部门内部进行数据一致性分析与梳理, 保证符合业务逻辑关系;三是部门之间要分析关联关系与业务规则, 将不一致数据发送回相关部门进行修复;四是在技术上, 建立统一的数据采集和共享发布平台。

  数据时效性就是依靠发布和更新规则及时公开信息, 拓展信息传播和推送渠道。国外政府数据开放网站分别制定了各类数据发布、更新标准, 公布数据发布日程以及修改说明等。

  (六) 数据利用管理

  发达国家普遍建立了政府数据集中管理和整合利用的模式。以满足用户数据需求为核心, 通过多种途径整合前后台资源, 在中央政府和地方政府间, 努力实现跨区域、跨平台的数据服务, 并以集中的方式提供给用户。

  美国不仅重视政府数据资源的管理和开放, 还重视数据资源再利用。美国联邦政府鼓励尽量多地向公众开放有价值的政府数据资源, 鼓励社会公众和私营部门进行开发。美国将政府数据资源再利用分为公益开发和商业开发, 允许和鼓励个人或私营机构对政府原始数据资源进行商业再开发并出售。私营部门拥有公共信息的使用权, 及其研究成果的专利权。美国政府部门负责规范数据开发竞争机制, 只能从事公益性的信息服务, 营利性的开发以私营部门为主。

  英国政府主要采用“贸易基金模式”、“公—私竞争模式”、鼓励公众参与、“许可证框架”等方式来管理和促进政府数据的社会化利用。“贸易基金模式”就是将一些政府数据机构, 如地震局、测绘局、气象局等, 改为“半自立”的政府基金机构, 让它们在半商业化的基础上提供商业性的信息服务, 依据与财政部签署的协议向社会用户收费, 也可通过授权信息的再利用进行收费。“公—私竞争模式”, 即政府部门不仅能够支持私营部门从事政府数据的市场化开发, 而且可以与私营部门展开竞争。公私部门之间的竞争形式具体包括伙伴关系、民营化和合同外包。鼓励公众参与, 就是以互联网为主要参与渠道, 设立互动论坛, 组织有奖竞赛活动, 收集并评估公众需求, 鼓励献言献策, 促进政府数据利用。“许可证框架”包括三个不同的许可证 (见表1) :一是“开放政府许可证”, 授权不论是商业性目的还是非商业性目的的政府信息的免费使用;二是“非商业性政府许可证”, 授权出于非商业性目的的政府信息免费使用;三是“收费许可证”, 授权收费的政府信息使用。

image.png

表1 英国政府许可证对比信息

  我国在政府数据利用方面急需统一的政策。政府开放数据在顶层设计、利用流程管理、资产化管理、数据依申请公开、共享与保密等方面需要建立相应的政策法规体系, 进行前瞻性战略布局;尽快建立并推广统一的政府数据共享开放平台, 大力增进行业与行业之间、地区与地区之间、上级与下级之间对彼此的数据资源的了解和掌握。让那些有强烈数据需求的部门, 可以借助数据共享交换平台快速确定数据的提供者和获取渠道方式, 同时, 配备专责单位来协调提供相应的技术服务, 规范数据的表达和接口。

  (七) 数据收费利用

  我国政府数据的社会化利用在是否收费、如何收费方面没有明确规定。我们在调研中发现, 很多部门有向社会开放数据、提供服务的积极意愿, 政府数据的价值与增值潜力受到空前重视, 公众和企业对政府数据的供给充满期待。

  国际上, 对政府数据社会化利用有明确的收费规定。通行的做法是把信息作为资产进行管理。欧盟国家主要以通过向增值开发用户收取信息使用费的形式来收回数据采集、加工和整理过程中耗费的管理成本。欧盟2003年的《政府信息资源再利用指令》规定, 数据利用的收费原则上应仅限于个人利用请求的边际成本 (复制、提供和传播成本) ;收费不得超过生产和传播数据的成本, 同时考虑合理的投资回报, 鼓励政府机构降低收费或者不收费;当收到数据利用请求时, 应让申请人知晓收费的计算方式;应提前制定并公布收费标准和数据利用的条件, 如果拒绝某项数据利用的请求, 必须解释原因并提供帮助信息;如果政府部门利用其持有的信息提供增值信息服务, 并与私营部门数据利用者进行竞争, 那么政府部门也应付费。美国政府规定, 即便是高价值的数据, 仍尽量保持免费提供的方式, 如果收费, 不得高于信息的传播成本。

  英国政府除了提供公益性的数据服务, 还进行营利性的数据资源开发, 收取“合理的投资回报”。英国政府法规规定对公开信息的加工和再利用需求可以收取一定的费用。英国政府对数据资源社会化利用的收费原则是在生产和传播成本之外, 还可收取一定合理的投资回报。政府部门除了从事公益性、非营利的信息服务, 还可开展营利性的商业信息服务, 与私营部门展开公私竞争。如英国气象局增值开发的特殊天气预报服务通过收费电话和短信来收费。英国的《政府信息资源规定》将收费分为三种情况:一是大部分情况下, 收取信息生产、发布、传播的边际成本;二是当政府部门工作人员需要收入来覆盖大量信息成本时, 可收取信息收集、生产、复制的传播直接和间接成本, 此外, 还可收取一定合理的投资回报;三是图书馆、档案馆和博物馆, 可收取信息收集、生产、复制、传播和保存的直接成本和间接成本, 此外还可收取版权清理费、一定合理的投资回报。

  从实际运作来看, 我国政府数据社会化利用, 存在多种不同形式的间接收费。数据间接成本包括大量的数据采集、清洗、加工、整合、整理、展现。目前, 收费的重点是一些增值服务、海量数据的提供。调研表明, 我国未来可以收费的政府数据类型可分为如下五类。

  1. 需加工处理才能满足需求的数据。

  需对原始数据进行筛选、加工处理或需经过其他加工、运维、软件部署、升级更新工作提取数据的需求。如相关单位要求将政府数据及其相关软件打包部署到自己的独立网络环境中, 实现本地化部署、数据管理软件升级、数据更新等。如果对此进行收费利用的话, 收费主体可以由软件系统或政府数据的运维方, 主要针对数据的运营成本进行收费。

  2. 需提供调用接口才能满足需求的数据。

  这类数据类型复杂、实时性强, 需要提供数据调用接口, 进行二次开发。如某些部门在原始数据之上提供的二次开发接口, 以及相应的应用说明和代码示例, 用户据此可以轻松调取政府数据资源。这类需求的收费主体包括两部分:一是提供数据资源的数据主管部门, 主要针对数据的运维成本进行收费;二是提供二次开发服务或资源接口的服务商, 主要针对数据再利用方面进行收费。

  3. 需跨单位调取整合才能提供的数据。

  数据需求本身横跨多个部门, 需要经过复杂的调取处理流程, 采集来自不同部门、不同业务、不同区域、不同系统的数据, 进行整合后, 才能满足用户提出的数据需求。比如, 交通运输部门春运黄金周期间的全国人口迁徙量、出行距离特征、热点城市、热点出行路线、热点客运枢纽等方面的数据需求。这类数据需求的收费主体可以参考英国的管理模式, 设立专门的机构或委托给相关支撑单位, 按照与政府部门签署的协议, 以及规定的收费标准, 进行半商业化运营, 提供数据供给服务。

  4. 数据量庞大的原始数据。

  这类海量原始数据, 有视频流数据、环境监测数据、海量统计数据等。这类数据需求的收费主体可以参考上述的管理模式, 由专门的机构或相关支撑单位进行半商业化运营, 负责提供数据支撑服务。

  5. 时间跨度较大的历史数据。

  这类数据时间久远, 并未完全数字化, 要恢复提供需要耗费不少人力物力。这类数据需求的收费主体可以参考上述的管理模式, 由专门的机构进行半商业化运营, 负责提供数据支撑服务。

  围绕数据收费, 需要同步建立政府数据管理机制。具体是制定收费原则, 建立收费清单, 明确收费标准, 确定收费职责。对于研究机构或从事公益性使用的用户, 可以免费或低价开放使用。对于个人或者商业机构的数据需求, 制定合理的统一收费标准, 费用主要包括信息收集、生产、复制、传播的直接和间接成本。其中, 涉及承担社会公共责任的商业机构予以低价优惠, 费用不得高于传播成本。针对不同的数据存储介质收取不同的费用。存储介质一般分为电子版数据和纸质版数据两种。

  四、进一步讨论

  数据是互联网时代各级政府的“血液”, 起着润物无声、贯通内外的作用。就信息化发展变化趋势而言, 以应用系统和技术平台建设为重点将向数据开放利用为重点转变。政府数据这座“金山”一直在沉睡, 有必要在政务公开和“互联网+”的大潮中被唤醒, 与社会数据一道承担起新的历史使命, 推动经济社会转型发展。除了加大对以上主要问题的研究, 还需要在如下四个方面开展工作。

  (一) 开展全国政府数据资源普查, 摸清家底

  尽快在全国范围内开展政府数据资源普查, 摸清数据家底, 为政府数据利用和开放提供决策支撑。

  对已有的数据进行梳理标注, 建立数据资源底账。数据资源底账包括元数据、数据溯源信息、数据管理信息等。数据梳理按照地区和条线划分层级, 逐步做到条线和层级的全覆盖。对于某一层级缺失的数据资源要找出缺失原因, 并尽快补足。在此基础上, 制定网站数据开放目录和数据采集更新标准。

  同步开展社会公众在工作生活中的公共数据需求调查, 提出数据需求清单。按照优先推动民生保障、优先做好公共服务的原则, 依托政府网站公开一批社会普遍关注、公众普遍依赖的政府数据, 让公众共享政府网站数据管理和利用的成果。

  (二) 启动开放数据管理利用综合试点, 积累经验

  选择一批有基础、有条件的单位, 启动综合试点。开放数据利用是一项全新的工作, 迫切需要积累经验, 创新发展, 少走弯路, 避免走传统电子政务发展的老路。数据分类、敏感数据、元数据、利用开放、质量控制、生命周期管理、数据收费、考核评估、数据接口、技术平台和PPP等方面的工作, 都需要总结、探索。现有的成功案例需要提炼形成操作指引, 供其他部门参考。

  围绕数据采集、交换、开放和保护等关键环节, 启动管理规范制定的试点。定义标准数据, 防止各级各类政府数据开放平台由于标准缺失造成管理混乱, 同时, 统一政府数据交换标准, 避免交互不畅。统一定义政府基础数据, 形成统一的元数据字典, 每个数据项、指标都有明确定义;“统一数据逻辑, 每个数据和指标的计算逻辑都有明确的规定, 统一计算公式和计算口径;统一数据基本字段的编码, 对数据、指标进行统一编码”;统一数据授权管理框架, 合理配置数据的使用, 保证数据合理合法访问和使用。

  在“互联网+政务服务”实践中, 试点推进政府网站数据整合利用。建立网站数据与电子政务系统数据和其他数据之间的双向流动机制, 形成统一的政府数据管理平台, 发挥政府网站数据集聚、规范和“血库”作用。从内容、技术、管理方面加强数据整合, 以中国政府网综合数据门户为龙头, 依托区域、条线的数据中心, 形成若干个综合政府数据中心, 实现全国政府数据的逻辑互联、整合利用和集中服务, 为国家大数据中心的建设提供内容支撑。

  (三) 开展开放数据管理顶层设计研究, 制度入轨

  政府数据管理利用要实践好“创新、协调、绿色、开放、共享”的发展理念, 就需要做好顶层设计, 主动融入深化改革、发展经济、改善民生、建设透明政府的工作体系中, 统筹规划发展, 推动相关制度规范的出台, 加强数据应用。政府数据管理利用, 离不开制度的保障, 需要分阶段、分步骤地制定并实施。

  尽快推动出台数据管理方面的法规。综合考虑数据采集、加工和利用等环节, 从数据定位、数据权属、数据质量、运行维护等方面对数据管理做出明确规定, 引导各级政府做实开放数据内容, 完善数据管理手段, 扩大影响力, 规范管理。

  加强开放数据应用研究和推广。提高“互联网+政务服务”能力, 现已成为简政放权、放管结合、优化服务的关键环节。充分利用政府开放大数据, 探索应用创新, 加大数据挖掘力度, 共享“互联网+政务服务”发展成果。

  (四) 建立政府数据资源管理体制, 理顺机制

  建立中央和地方两级数据管理体制。理顺政府数据资源管理部门间的协同管理和上下级指导管理, 实现数据管理工作全国“一盘棋”。完善政府数据资源管理和相关职能部门的职责, 既要填补工作空白, 又要减少工作交叉或重叠, 避免出现条线之间、政府层级之间的权责冲突, 厘清责任, 依规管理。

  明确领导体系和责任主体。确定分管领导, 明确工作机构, 配备专职人员或指定兼职人员。建立工作机构与支撑机构之间的协调机制。数据管理作为政务公开的内容之一, 纳入政府绩效考核体系, 保证一定的权重比率。

  作者:鲍静 张勇进 董占广

责任编辑:qinpeng