摘要:政府数据开放对于提高政府信息化效益、确保社会公众知情权、推动国家经济增长具有重要意义;而政府数据开放平台建设则是其中的关键环节。国内外学者针对政府数据开放及开放平台构建开展了较为广泛的研究,文章对目前研究现状(以图书情报领域刊文为例)予以简介并评析。接着选取国内外政府数据开放较为先进、完善的国家(美、英、澳、日)和城市(上海、北京、深圳)为研究对象,对其政府数据开放平台进行了调查,并对调查结果加以对比分析,找出相同和差异之处。结论认为,我国政府数据开放与国外相比尚存在一定的差距,应该进一步加强政府数据开放及开放平台的理论研究和实践探索。

1 引言暨目前国内研究现状简介———基于2017年图书情报领域刊文的分析   

政府是大量信息资源和数据的拥有者;而要挖掘和实现这些原始数据集的价值则需要政府向社会公众开放数据资源,推动整个国家资源的优化配置。政府数据开放在政治上可以提高政府的透明度和满意度,增强民众对政府的公信力;在经济上可以促进社会创新和新兴产业发展,实现产业升级,推动经济增长。因而,政府数据开放关系到国计民生,对于确保社会公众的知情权、助推国家经济的腾飞具有重要意义。

国际上(以美、英为代表)积极开展政府数据开放的相关理论研究和开放平台的实践探讨,并取得了较大成就。国外政府数据开放的相关研究侧重点在于解决具体的实际问题,研究主题主要集中在:开放政府数据的功能与利用、评价;政府数据开放的基础设施建设;政府数据开放项目的实践等。我国的政府数据开放行动也是势在必行。从实践上来看,2015年“数据开放共享”被确立为我国大数据战略的核心,我国也将于2018年底建立国家级政府数据开放平台;如何更好地建设数据开放平台成为我国政府数据开放的关键环节。令人感到欣慰的是,贵阳市采取措施推动政府数据的开放、共享和利用,确保政府数据优先向社会公众开放;制订的《贵阳市政府数据共享开放条例》也已于今年5月1日起施行。河北省政府提出,要推进政府数据的开放共享,到2018年底前建设政府统一数据开放平台。从理论上来看,我国学者围绕“政府数据开放”这一主题积极开展相关研究,取得了较为丰硕的研究成果。图书情报界也不例外,笔者特选取2017年图情刊物发表的最新文献加以描述。首先值得一提的是,我国图书馆学核心期刊、CSSCI来源刊(核心版)《图书与情报》2017年第1期开辟专题“国外政府数据开放的政策保障与启示”,分别介绍了美国、英国、澳大利亚、巴西、丹麦这5个国家政府数据开放的有关政策和法规保障,并从多个方面分析其对我国的有益启示;接着又在第2期载文探讨政府数据开放的评估指标特征及其模式。笔者对其他非专题发表的文献进行初步归类,其主要内容涉及:政府数据开放平台模型和框架构建;国内外开放政府数据平台元数据标准研究;政府数据开放保障和运行机制;政府数据开放与个人隐私权保护及网络舆情监督;国外政府数据开放相关政策及对我国的启示;其他问题,如政府数据开放的障碍、对策、检索方法及变革等。

由上可以看出,我国图书情报界积极开展“政府数据开放”的理论研究和实践探索,取得了一定的研究成果;这些研究对于推进我国的政府数据开放、探讨数据开放平台的实现具有较大的理论参考价值和现实指导意义。笔者并不盲目跟随,而是运用比较研究方法,从“国内外政府数据开放平台的调查”入手,并对结果加以分析(目前研究文献暂无该方面的直接报道)。研究的目的在于抛砖引玉,引发更多学者对“政府数据开放”问题的关注,为我国的政府数据开放平台建设提供参考借鉴;同时,增强图书情报界与政府之间的关联度,扩大图书馆的影响力,提升其社会价值。

2 国内外政府数据开放平台调查

2.1 调查要素

数据开放平台作为政府数据开放的重要内容,对其调查分析是研究各国政府数据开放现状不可缺少的部分。本文对于国外平台的调查以美国、英国、澳大利亚、日本这4个处于数据开放先进水平的国家政府数据网为例,国内则以上海、北京、深圳这3个国内较为完善的数据开放平台为例。

政府数据开放平台的调查基于以下几个基本要素而进行:1)数据对象与组织:包括开放数据的数量、类型、来源、下载格式。2)开放平台的网站结构与分布:包括数据检索、网站模块分布、数据分享互动与用户反馈、网站数据更新频率、数据使用授权信息。3)是否提供API接口:API做为网站应用程序编程接口,它的开放使应用程序与开发人员无需访问源码或理解网站内部工作机制,就可以调用和开发网站的数据资源。因此开放API的站点能为第三方的开发者提供良好的社区支持,吸引更多的技术开发人员参与到数据开发与再利用之中。4)是否支持RSS订阅:RSS可以作为数据开放平台与其他站点之间共享数据信息的一种简易方式。同时作为简易信息聚合技术,RSS订阅会收集和组织平台用户定制的数据信息,按照用户希望的格式、地点、时间和方式,直接传送到用户的计算机上。这将大大促进数据开发者的工作效率,保证用户对数据更新的关注,提高用户获取数据信息的时效性和准确性。

2.2 国外政府数据开放平台调查

2.2.1 美国政府数据开放网

从美国的政府数据开放平台(www.data.gov)网站搜集相关信息得知(注:为了节省文章篇幅,网站主页图省略,以下同):该平台截至2017年5月开放数据集195206个,数据基本上都来源于政府公共部门,提供的数据下载格式为CSV、HTML、XML、RDF等可机读格式。

在网站布局上:“数据搜索”框下方提供了农业、气候、消费者、生态系统、教育等14项数据主题分类,总体包含了数据、分类、影响、应用软件展示、扩展、互动6个主要类目。在扩展类目下提供使用开放数据的应用程序的展示区,公众可以通过IOS平台或Andriod平台下载这些应用程序,了解政府数据开放所能提供的服务和相应的功能,推动对政府开放数据创新应用的开发。该网站基本每日保持着开放数据的更新。并有官方的博客和Twitter,其中官方Twitter拥有2.51万的关注量;在互动类目下提供用户提问与twitter互动,保持与数据用户的互动联系。

网站下方About类目下提供4项授权信息声明:①政府网站原始数据日志不能用于其他目的,并按照国家档案和记录管理指南进行定期销毁。②严格禁止未经授权的上传信息或更改本政府网站服务信息,如果违反将可能受到惩罚。③通过www.data.gov提供的美国联邦数据是免费且无限制的。政府雇员在其雇用范围内创造的数据和内容不受美国的国内版权保护。④通过www.data.gov访问的数据没有、也不应该包含对其最终用途的控制。一旦数据从机构的网站下载,政府就不能保证其质量和及时性。此外,美国政府不能对www.data.gov通过检索的数据进行任何分析。数据检索方式以关键词检索、基于地图位置的检索为主;数据检索内容以相关性、名称的升序或降序、最后修改日期等进行检索排序,检索结果以主题、主题分类、数据集类型、标签等进行分类分面。

在API的开放上,网站目录由CKAN(强大的开源数据平台之一)提供支持,CKANAPI包含有关数据集的元数据。通过CKAN的支持为用户提供所有数据的API接口,允许所用用户通过API对调取的数据进行开发利用。同时Data.gov为API利用提供了GitHub托管平台的支持,该平台拥有超过900万的开发用户,可以随时为www.data.gov用户在API的使用上提供帮助。RSS订阅上,美国的政府数据开放平台支持RSS技术以及数据信息的订阅,并提供相应的网站代码以供不同种类RSS阅读器的使用。

2.2.2 英国政府数据开放网

从英国的政府数据开放平台(data.gov.uk)网站搜集相关信息得知:该平台截至2017年5月提供开放数据集43021个,提供下载格式包括CSV、RDF、XLSM、XML、NII等可机读格式。数据来源于公共部门、私企和部分高等教育机构。

网站布局和结构上,主页提供了包括商业和经济、环境、地图等12个数据主题,网站包括数据、APP应用、互动、登录4项主要类目;APP应用下提供了412个关于政府数据APP的应用。在互动上设置了官方博客,同时在博客互动、网站论坛和评论等功能上采用Drupal系统运行,从而为用户提供完善的站点分析工具和协同共享平台,实现用户与网站之间的双向互动。该平台数据每周进行更新。

在网站FAQ附录下提供了两项明确数据授权声明:①网站上的信息是开放的且可再利用,允许私人和其他第三方网站向平台提供数据信息。②通过data.gov.uk提供的数据和信息的授权可以在单个数据集记录(元数据)的“许可”或“约束”字段中描述的条件下获得,除非另有说明;在data.gov.uk上发布的所有数据集记录(元数据)都是根据开放式政府许可进行许可的。

数据检索上,data.gov.uk采用短语检索和字段检索,采取以名称升降为标准的排序方式,以NII数据集、API、执照、主题、资源格式等这些项目进行结果分类分面。da⁃ta.gov.uk也是基于CKAN数据管理系统进行搭建的,网站API开放只面向注册用户,API的开放还属于试用期,只提供健康与交通两项主题的开放数据。提供GitHub平台的服务功能。同时该网站支持RSS订阅。

2.2.3 澳大利亚政府开放数据网

从澳大利亚的政府数据开放平台(www.data.gov.au)

网站搜集相关信息得知:截至2017年5月提供开放数据集49904个,提供下载格式包括SHP、SLD、WMS、WFS、GeoJSON等可机读格式,数据来源都是本国政府部门。

网站结构上,主页未提供数据主题分类,在数据类目下只提供了商业、经济、环境、科学等8项数据分类,总体上包括数据集、组织、网站统计等8个主要类目,在应用类目下提供了42个关于开放数据的运用软件。其中工具包类目中为用户提供了相应的技术与法律政策上的应用支持,以协助用户对开放数据的开发使用;www.data.gov.au还通过统计模块向用户开放了网站整体运行情况。

但www.data.gov.au没有社交媒体的选项设置,仅提供了用户反馈调查和用户提问的网站模块,在数据的互动共享上略显欠缺。平台数据保持每周更新,该平台准许用户在浏览器上禁用cookie。使用授权上,www.data.gov.au的About类目下提供了两点声明:①对于其所提供的第三方链接数据没有相应的下载授权。②尊重和保护用户的隐私,网站上的所有开放数据依照开放许可协定授予所用用户下载和使用的权力。

www.data.gov.au同样是基于CKAN数据管理系统进行网站搭建,对用户开放所有数据的API,无其他API支持服务;但提供RSS订阅服务。

2.2.4 日本政府开放数据网

从日本政府数据开放平台(www.data.go.jp)网站搜集相关信息得知:截至2017年5月提供开放数据集18717个,数据来源除政府部门外还包括科研机构和大型企业,提供XLMS、CSV、PDF、HTML等可机读下载格式,网站还同时提供日语和英语两种语言服务。

网站结构分布上,首页未对数据种类进行主题分类,在数据类目下将数据分为商业、安全、运输教育等9项主题。网站总体划分为注意事项、数据、数据库列表等6个主要类目。数据检索data.go.jp采用关键词检索和基于地图位置的检索,按照数据的相关性和搜索量进行排序,按照数据集、组织、格式、主题分类进行搜索结果分面。互动上提供了用户数据报告以收集数据用户的相应反馈,并提供了用户数据信息上传通道,允许用户向网站提供数据信息。但没有社交媒体的互动,官方开设的twitter账户没有实时的更新动态,并处于休停状态。

数据使用授权上,在网站的注意事项类目下提供的授权信息声明上显示:data.go.jp根据日本“行政机关保护个人信息法”,网站对部分收集的数据不予授权。其他不在信息法保护内的数据以开放协定为标准,任何用户都可基于data.go.jp的授权进行自由下载和使用。data.go.jp以CKAN数据管理系统搭建,并提供多种类型API,例如组织、数据重置、资源和标签API。使用API以JSON、RDF格式获取元数据,提供所有开放数据的API接口。支持RSS订阅服务。

责任编辑:李慧