2017年7月26日下午,“2017政务数据治理与创新高端研讨会”在北京梅地亚中心多功能厅隆重召开。本次研讨会由中国信息通信研究院、中国社科院信息化研究中心、国脉数据研究院联合主办。中国信息通信研究院高级工程师、大数据发展促进委员会办公室主任韩涵出席会议并发表了《政务大数据--技术发展与标准化》的主题演讲,阐释了“政府战略转型→业务转变→数据应用变革→云化大数据服务”的政务大数据驱动路线以及“数据采集→数据开放→数据共享→统筹汇聚”的政务大数据建设流程,针对数据开放共享存在的问题,她建议建立数据分级/分类机制和数据共享负责人制度。

image.png

中国信息通信研究院高级工程师、大数据发展促进委员会办公室主任韩涵

  以下是会议现场发言实录:

  非常感谢主办方提供的机会,今天分享中国信通院在大数据,尤其是政府大数据领域的研究进展。中国信通院是工信部直属事业单位,是国家《大数据产业发展规划(2016-2020)》编制单位,也是《促进大数据发展行动纲要》编制主要职能单位,信通院在大数据产业发展、标准制定、地方政府产业规划、顶层设计、系统建设方面有一定经验,今天把这些经验分享给各位嘉宾。

  一、我国大数据发展基本状况

  第一,领导层高度重视大数据发展,国家密集出台政务数据开放共享相关政策。从大数据的发展来看,最高级的指示是习总书记提到建设全国一体化的大数据中心,目前网信办在具体讨论该建设方案,中国信通院也是该方案的主要支撑单位。在去年的两会上李克强总理提到大数据是"钻石矿",将大数据技术放在了很高的关键位置上。

  政府部门对于政务数据开放、共享和使用,这十几年一直都在陆续推进相关政策,包括《政务信息系统整合共享实施方案》、去年底发布的《"互联网+政务服务"技术体系建设指南》、6月份落地的《政务信息资源目录编制指南》,文件发布很密集,相关的文件有5个。同时,2004年中办发〔2004〕34号《中共中央办公厅 国务院办公厅关于加强信息资源开发利用工作的若干意见》中提出了以信息化带动工业化、以工业化促进信息化,充分发挥信息资源开发利用在信息化建设中的重要作用,推进经济结构调整和经济增长方式转变,实现经济社会全面协调可持续发展,主要的理念与政务信息的发展如出一辙,因此数据资源的使用,十几年以来在国家的政策中始终都没有变过,这也可以证明大数据发展过程中的一些核心问题依然存在,面对这些问题我们如何开展工作,是需要我们产业界探讨的一个方向。

  第二,政府数据共享开放标准化进程不断加快。从标准的层面,2007年国家发布了《政务信息资源目录体系》和《政务信息资源交换体系》;2007年国务院颁布《中华人民共和国政府信息公开条例》条例,其中要求行政机关应当主动公开政府信息,还详细规定了信息公开的方式、程序、监督和保障措施等。至今十年,没有其它新的电子政务标准发布,不过,国家也成立了大数据领域的机构,陆续的标准正在制定和研讨中,比如正在制定的大数据资源开放目录和信息资源共享交换国家标准正在研讨当中,但落地标准仍是2007年的这套标准。从这个层面来看,电子政务标准化进程十分缓慢,总结出的一些实际困难和问题也和十几年前一样。在各行业层面,陆续也有一些行业标准,比如交通、公安,它们的标准在行业体系内都比较成熟。国家层面非常重视信息化标准的建设,由网信办牵头,联合质监总局和国家标准委发布了《"十三五"信息化标准工作指南》,为信息化标准建设、标准评估等提供一些明确的意见。

  第三,大数据上升为国家战略,全国多片区布局综合试验区。从大数据的视角,国家已将大数据作为国家战略,列入了国家"十三五"规划编制的内容中,工业信息化部发布了《大数据产业规划建设2016-2020》文件,大数据最顶级的三部委批复贵州建设国家大数据(贵州)综合试验区,批准7个区域建设国家大数据综合试验区,试验区注重创新和突破,注重新技术的应用,注重新的产业发展的培育。目前拥有包括京津冀、珠三角和省一级内蒙古、河南、上海和重庆等在内的区域性试验区。

image.png

全国多片区布局综合试验区

  第四,全国各地陆续制订大数据发展政策规划,开展大数据建设项目。前后有31个省市发布了大数据相关文件,近6个月来,文件发布更频繁,包括地方大数据整体的设计指导意见、促进本地大数据产业发展的规划以及推动具体项目落地的行动计划。最近也有很多落实一些公开指导意见的地方性文件,关于落实国家政务信息系统统筹共享的文件以及关于国家信息资源体系的目录文件也在频繁发布中。因此,对于具体的大数据项目来说,政府在这一两年里来,大数据建设项目数量增长非常快,政府的占比也在增加,尤其是在从中央到地级文件的推动之下,大数据建设已从规划战略层面走向项目落地层面。

image.png

  最后,当前政务大数据建设模式与问题。今天谈到的政务大数据,把政务数据资源管理和数据治理作为一个重要角度,对于地方政府来说,政府发展大数据的目标非常清楚,主要面向三大政府需求:领导决策、政府治理和公共服务。数据资源发挥着重大价值,主要的手段就是资源的汇聚统筹和数据的共享。如何从技术的视角来促进政府大数据的建设,技术评价方案可以总结为真实、大量、快速、灵活、全面。从政府的角度,建设大数据系统,利用数据资源,整理政务信息资源目录,提高政务数据质量,能够满足这些基本要求,从而使得数据的价值发挥更大,部署更加灵活,响应更加迅速,同时数据覆盖维度更加全面。

  同时,政府大数据的应用问题也非常显著,2004年中办34号文所提出的相关问题,比如数据孤岛、数据互通、数据增值利用等,这些年也依然存在,物理层集中相对容易,真正的数据资源汇聚很难,从业务层面打通数据,实现协同和联动则是难上加难。

  二、政务大数据建设步骤

  首先是数据采集。数据采集主要存在以下几个问题:一是基层数据采集很困难,主要体现在业务部门太小,要求复杂,口径又不一致,没有管理规范,质量也没有把控的体系。为了实现建设政府大数据的基础,对基层数据的共享和校核是一个非常重要的步骤。目前各地都在建设基础库或者共享主题库的一些基本原则,提倡编制动态、灵活和可变的信息资源目录体系,而不是静态的目录。二是属地化数据管理困难,在数据采集层面信息系统纵强横弱,区域机构难以留存数据,难以建设区域统一的数据平台,基层数据难以形成体系。有些区域级的政府对数据掌握能力比较弱,政务信息资源系统整合的目的以及建设政务信息资源目录的目的也是加强区域级的政府对数据的掌控,同时在政务信息资源目录编制的过程中,后续会采用属地化的分层,而不是采用纵向的行业信息资源系统主题。三是历史珍贵数据不够重视。最后是实时数据获取困难。

  第二是数据开放。数据开放已经成为重要的工程,目前中央网信办正在编制数据开放试点指导文件。从2009年美国建设大数据项目开始,在世界范围内,政府数据开放成为一个比较重要的工作。政府信息开放是政府和企业之间资源共享的主要手段,政府数据共享是政府和政府之间数据共享的主要方法,政府和企业之间是主要的共享手段,企业和企业之间的共享融合主要靠交易,这也是大数据发展并推动数据资源价值利用的主要手段。

  从开放的角度,政府信息公开、政务信息共享和资源目录编制并不是完全一致的,目录包括开放目录、共享目录和服务目录。对数据开放来说,本身是有利的,更多的是政府和企业以及公众之间共享层面的具体工作。数据资源希望流向社会,流向产业从而发挥更大的价值,而美国数据项目的初衷也是希望这些数据最终能流向产业,繁荣产业发展。因此,数据开放目前也是国家层面政府信息建设的主要方向。

  在政府数据开放中存在的问题主要有以下几点:一是“不愿开”,信息资源被视为独家垄断资源,担心开放后部门权力削弱、经济利益受损,并可能暴露部门业务问题;二是“不敢开”,尚缺乏保障数据开放的配套制度,缺少具有可操作性的强制性规定,与政府信息公开、保密法、档案法等相关法律法规衔接不到位,各地对政府数据开放的范围和潜在风险存在“后顾之忧”;三是“不能开”,数据基础不牢,公共部门尚未建立一套完整的数据资源采集、管理、加工和开发利用的体系,很多信息资源缺乏数字化,数据资源多头采集、重复建设、成本高昂,很多数据无人维护、不可持续,数据的质量和准确性也存在问题,有哪些数据资源也不清楚;四是“不会开”,开放质量不高,可利用性差,网站数据的质量问题突出,包括可机读性差、数据更新频率不高、数据互动性差等,网站缺乏标准化,增加了使用者成本。这也是从技术视角来探讨数据开放不得不克服的一些问题。

  第三是数据共享。主要通过共享交换平台来实现,但是传统的数据共享交换体系在大数据时代面临一些问题:首先,在政策制约方面,一是政府数据共享缺乏全国统筹机制,协同不足,二是政府共享数据时,保护部门利益的本位思想较重;其次,在基础制约方面,一是数据交换共享机制问题导致数据不落地,难以满足大数据时代对多维度数据的需求,二是缺乏中心交换的政府数据共享技术,没有数据融合的统一平台。政府大数据共享交换体系与大数据时代未来发展更多维的数据融合以及以人工智能为基础的智能型政府应用之间存在一些矛盾。总结国内各级政府发布的大数据政策中的重点任务要求,可以看到,开放平台、共享平台、目录体系、基础数据库和管理中心是各级政府发展大数据的五项抓手。

image.png

各地方发展大数据的主要工作

  第四是统筹汇聚。在数据中心层面,目前各地前期建设的很多数据中心在物理层是分离的,既拥有第三方数据中心、运营商数据中心,也有政府建设的数据中心,在区域级、行业级,根据不同的需求,历史的数据中心都建设起来了。目前国家政策要求建设绿色、集约、节能、共享的数据中心,如何发挥大量的分散的数据中心的价值?需要实现各种资源整合共享利用,同时对新增的数据中心的管理要严格。关于数据中心建设,国家发改委也多次提出要统筹整合、共享利用已有的资源。在信息平台层面,要统筹利用已有的资源,各地发展大数据时要彻底地整合政府数据。各级政府拥有很多信息平台以及落地的政府项目,为实现融合贯通,需要采用一些技术手段来爬取一些信息资源,建设智慧型的统一共享公共平台。但是对于已建成的分散的信息资源平台,包括网站、信息系统等,不可能再推翻重建,对于落地的政府级项目也不可能把历史的系统都抛弃掉,一般采取的措施是打通既有的旧的平台,抓取相关的平台资源来进行融合贯通,需要考虑到很多具体的实现方案,是采用爬取手段还是与既有平台进行互动等,在“互联网+政务服务”文件中都有所提及。在数据资源层面,目前各地都在建设共享较多的基础数据库,但是承担的部门差异是很大的。数据资源层面同样存在很多割裂的现象,如何真正地推动数据共享融合,提高政府数据的质量,形成资产化管理?除了加强旧的系统,整合既有数据以外,还要提高数据治理,建立数据管理的技术手段和规则以及业务流程。此外,社会普遍在探讨政府和产业界的数据融合建设问题,比如采集部分互联网数据资源,与企业共享一些相关数据。同时,对于大型机构掌握的核心数据,探讨从防垄断的角度来打破数据壁垒,这也是数据资源整合方面非常重要的一点。

  三、中国信通院开展的主要工作

  在《“互联网+政务服务”技术体系建设指南》中,技术层面提出深化大数据和云计算等技术应用,大数据主要实现清洗比对、数据挖掘和数据开放等,云计算主要实现集约建设、共享利用等。政务数据资源的利用离不开以大数据和云计算为代表的技术手段,政务信息资源目录文件的落地实施也需要新的信息技术支持。技术领域如何服务于政府,如何实现国家政策文件中提出的政务数据资源整合共享利用的目标,这是在研究层面需要探讨的问题。我们希望进一步整理出目前面临的实际问题,然后给出非常清晰的标准化的技术语言,让各级政府部门来推动,在实际工作中作为参考。中国信通院开展的主要工作包括以下几个方面:

  一是技术应用白皮书,汇编各领域研究成果,集合业界经验案例并对外发布。

image.png

《政务大数据建设标准体系》主要内容

  二是政府大数据建设标准体系,首先,在技术层面建设大数据,要在多个视角进行体现,研究下一步的数据采集如何搭建目录,数据爬虫如何实现,如何满足不同接口的需求;其次,在存储和计算领域,要形成一个政府的数据化系统。数据量是否足够大?技术要求是否足够高?跨度或者传统数据库是否足够?在这些层面,目前缺少一些明确的技术指标来作为参考;再次,在数据治理层面,我们在质量管理、评估、清洗方面提炼出一些技术标准来供大家作为参考;在数据分析层面,面向政府级的应用也比较复杂,我们希望能够提炼出一些基础性的数据分析参考模型以及面向大众的、普适性的应用来作为导向标准;可视化主要问题是影响决策,希望出台一些指导性意见,更好地引入外部数据;这是数据服务需要讨论的内容,希望在具体领域与业界专家共同探讨服务政府、服务产业界的标准体系,为产业发展做贡献。以上是中国信通院前期的研究内容。

责任编辑:李慧