0、引言

  政务大数据已经成为提升政府治理能力、重构公共服务体系的新动力、新途径。2015年发布的《促进大数据发展行动纲要》提出建立“用数据说话、用数据决策、用数据管理、用数据创新”的管理机制;2016年发布的《“十三五”国家信息化规划》指出“加快推进跨部门、跨层级数据资源共享共用”;2017年发布的《新一代人工智能发展规划》进一步要求加强政务数据资源的整合、开发适于政府服务与决策的人工智能平台。相关行业部门、地方政府也出台了一系列推进政务大数据发展和应用的政策文件, 鼓励相应的实践探索。

  针对政务大数据的发展和应用, 学者们基于扎实的学理分析提出一系列重要观点, 阐释了可能的路径、面临的主要挑战以及推进的策略;针对出台的政策文件, 开展了细致准确的政策解读、政策文本分析研究, 并与其他国家的相关政策做了比较研究;对部分区域、特定领域发展和应用政务大数据的先进经验进行了深入剖析和总结。遗憾的是, 尚没有研究基于已经出台的政策文件揭示我国推进政务大数据发展和应用的内在逻辑, 也没有将政策文件中反映出的推进逻辑与理论分析成果和案例分析发现进行对比, 找出存在的不足。因此, 本文提出并尝试回答如下三个问题: (1) 已经出台的政策文件反映出我国推进政务大数据发展和应用的内在逻辑是什么? (2) 运用理论分析成果和案例分析发现, 通过全面审视上述推进逻辑能够发现哪些不足? (3) 针对政务大数据未来的发展路径, 应从哪些方面进行优化?

  1、文献回顾

  1.1 应用路径研究

  作为公共数据的拥有者, 政府应率先发展并引领大数据应用。政务大数据的应用路径主要包括:一是从更多渠道获取、汇聚更为全面的数据辅助政府科学决策;二是关联比对同一对象的不同数据和信息实现精准治理和服务;三是运用大数据分析技术生成科学、准确、直观形象的预测方案;四是联结众多参与者以凝聚、激发群体智慧;五是营造透明、公开、公平、公正的治理环境;六是扩展深化数据价值链、创造更多公共价值。推进政务大数据发展和应用, 在体制机制、政策法规、技术、系统、数据、人员等方面存在诸多挑战;对策建议包括深化体制改革、完善法律法规、做好顶层设计、提升政策执行力度、突破关键技术、促进产业发展、加强公众参与、保障数据安全等。

  1.2 政策分析研究

  主要包括政策解读、政策文本分析、政策比较3个方面。政策解读研究主要针对国家层面出台的政策文件, 系统阐释大数据应用对提升政府治理能力的重要性以及政策执行中可能遇到的挑战, 并针对贯彻落实提出对策建议。政策文本分析研究还比较少, 仅检索到1篇:李月等对地方政府发布的大数据战略文本进行了质性研究, 对战略发布的时间和地域特点进行总结。张勇进和王璟璇从战略规划、技术能力提升、应用与管理等维度比较分析了主要发达国家的大数据政策;于施洋等在评述国内外政务大数据应用基础上, 指出发展政务大数据应坚持整体性政府、透明化政府和服务型政府3个基本方向。

  1.3 典型案例研究

  从区域和领域两个方面着手, 前者以某一区域的政务大数据发展和应用为研究对象, 后者则针对特定的应用领域。典型的区域案例来自北京、上海、深圳、武汉、贵州等省市, 陈之常以北京市东城区为例提出大数据推进政府治理现代化的应用框架;深圳市坪山新区发展研究中心分析该区的“循数治理”模式;王留军和肖迎霜系统分析了武汉市大数据建设状况。典型领域案例来自社会稳定风险评估、公共服务智慧化供给、大数据驱动的精准扶贫和旅游预测等, 分析大数据应用与业务场景之间的耦合性以及大数据驱动的业务流程重构。

  由此可见, 已有研究对政务大数据应用路径的探讨是比较系统的、对政策和案例的分析也是比较深入的, 但是依然存在深入的空间。例如, 没有针对“政务大数据政策”开展系统分析, 只是在分析政府出台的“大数据政策”中关注了政务大数据。作为大数据应用的核心领域, 政务大数据受到了很大重视, 与之相关的政策文件已经达到一定数量, 可以从中发现推进逻辑;同时, 也很有必要将政策文件反映出的推进逻辑与理论研究发现进行对比分析, 深入思考推进过程中存在的不足, 并针对未来发展提出相应的优化建议。

  2、研究设计

  2.1 政策文本收集

  以中国政府网以及除香港、澳门、台湾外的31个省 (自治区、直辖市) 政府门户网站中与“大数据”相关的政策文本为数据源。具体收集方法如下:在网站“政策文件”栏目检索“主题词”或“内容”中含有“大数据”一词的全部政策文本;检索工作于2017年9月30日至10月2日期间完成;然后, 剔除大数据具体产业安排、大数据小组人员名单等与“政务大数据”主题不是直接相关的政策文本, 最终得到有效政策文本189条。

  2.2 文本分析方法

  运用Cite Space 5.0软件绘制相应的知识图谱对政策文本进行分析, 包括推进过程、热点领域、价值取向三个方面。由于Cite Space 5.0主要针对学术文献, 而不是政策文本。学术文献具有规范的元数据标注;应用于政策文本分析, 应首先做好元数据标注, 包括题名、关键词、来源机构、机构类型等字段。除关键词之外的字段通过人工方式标注。

  关键词标注综合运用自动化和人工两种方法提取完成。对于“大数据”为全文高频关键词的政策文本, 使用“图悦”词频分析软件进行初步的词频分析, 然后基于词频和权重两项指标的综合测评得到关键词列表。例如对于《重庆市人民政府办公厅关于运用大数据加强对市场主体服务和监管的实施意见》, 先使用词频分析软件进行初步词频分析, 得到“政府”“监管”“重庆”“网上”“报告”“等150个关键词的词频和权重列表;根据词语的实际含义和相关程度, 排除“重庆”“月底”等词语, 最终得到“政府”“监管”等10个关键词。

  对于“大数据”仅在某一特定段落高频出现的政策文本, 依据段落内容主旨、词语实际含义以及与“大数据”一词的相关程度三项指标进行人工提取。例如《北京市进一步做好防范和处置非法集资工作的管理办法》中, “大数据”为第五条“强化大数据监测预警, 加强行业数据整合与信息共享”的段落关键词而非全文关键词, 采取人工阅读的方法标注出“非法集资”“大数据”“信息分析”等6个关键词。

  在关键词提取时, 遵循概念内涵尽可能具体的原则, 例如将“创新驱动”“创新服务”“科技创新”等作为单独的关键词, 而不是笼统地标注为“创新”。189条政策文本共提取1566个关键词项构成的关键词列表, 包含122个不同关键词, 对于其中内涵相近的关键词并不作合并处理, 而是在关键词共现网络等分析中聚合相应的概念内涵。

  3、推进逻辑

  3.1 推进过程

  189条中央政府和省级政府政策文本的时间分布如图1所示。结合政策文本内容和标志性的政策文件, 可以将我国推进政务大数据发展和应用的过程分为3个阶段:

640.webp.jpg

图1 中央政府和省级政府政策文本的时间分布

  (1) 地方初探阶段 (2013年7月-2015年6月) :以2013年7月重庆发布《重庆市大数据行动计划》为开端;贵州出台《贵州省大数据产业发展应用规划纲要 (2014—2020年) 》、《关于加快大数据产业发展应用若干政策的意见》等, 对政务大数据应用展开实质性探索;浙江、江苏、福建、北京等地也在政策文件中引入“大数据”的概念。该阶段的核心特征是政策文件数量少, 而且绝大部分由地方政府出台, 国家层面的政策文件很少。

  (2) 顶层设计阶段 (2015年7月-2016年12月) :以2015年7月国务院发布《关于积极推进“互联网+”行动的指导意见》、国务院办公厅发布《关于运用大数据加强对市场主体服务和监管的若干意见》为开端;以国务院2015年9月发布《关于印发促进大数据发展行动纲要的通知》、2016年9月发布《关于加快推进“互联网+政务服务”工作的指导意见》为标志;具有代表性的政策文件还包括《“十三五”国家信息化规划》、《政务信息资源共享管理暂行办法》、《推进“互联网+政务服务”开展信息惠民试点实施方案》、《关于促进和规范健康医疗大数据应用发展的指导意见》等。该阶段的核心特征是国家和地方政府都出台了大量政策文件, 而且大多是顶层设计方面的。国家层面出台了发展和应用政务大数据的纲领性文件, 给出了具体的路线图, 提出了主要战略领域和重点建设工程;地方政策依据国家顶层设计方案出台了相应的规划方案和行动计划。

  (3) 全面探索阶段 (2017年1月—) :以2017年1月国务院办公厅发布《“互联网+政务服务”技术体系建设指南的通知》以及“贵州省公共服务管理办公室”更名为“贵州省大数据发展管理局”为开端;代表性的政策文件还包括《政务信息系统整合共享实施方案》、《新一代人工智能发展规划》、《政府网站发展指引》等。该阶段的核心特征是重点关注如何让政务大数据发展和应用更加深入、能够更为满足领域的精细化需求, 政策文件本身也更具操作性。同时, 上海、贵州等地的政务大数据迈入快速发展阶段, 正在形成特色的推进模式。

  3.2 热点领域

  运用Cite Space生成的关键词共现网络如图2所示, 由122个结点、322条连线构成。通过进一步分析, 可以发现我国推进政务大数据的热点领域主要包括3个方面:

  (1) 政务服务和简政放权。“互联网+政务服务”和“简政放权”形成两个非常明显的子网络。“互联网+政务服务”子网络包含的关键词包括跨层级、跨部门、政务信息资源、协同共享、大数据资源体系、创新服务、主动服务、个性化服务等。基于大数据的政务服务创新主要是通过加强政务信息资源共享、政务信息系统整合, 推动政务服务跨层级、跨部门协同;通过政务服务理念和模式创新, 变被动服务为主动服务, 变政府“端菜式”的供给服务为群众“点菜式”的个性化服务。“简政放权”子网络包含的关键词包括放管结合、平台、职能、智能监管、政务服务、市场主体、市场退出机制等。基于大数据的“放管服”改革是通过构建大数据平台推动市场监管和政务服务的智能化, 进而促使政府职能的转变。

640.webp (1).jpg

图2 政策文本的关键词共现网络

  (2) 社会治理和公共服务。与社会治理相关的关键词主要分布在图2中部靠左的位置, 包括社会信用体系、监测、产品、公共资源、政府治理、大数据平台等。基于大数据的社会治理创新非常强调社会信用体系建设, 通过推动信用信息共享和信用信息系统开发, 汇聚和开发基础信用信息;通过构建大数据平台实现对公共资源、市场运行、产品质量等动态监测和快速分析, 不断提升政府的社会治理能力。与公共服务相关的关键词分布在图2中部靠右的位置, 包括资源、产业、领域、健康、卫生、医疗、规范、云计算、互联网、电子政务等。基于大数据的公共服务创新是以公共资源配置优化为中心, 通过推动数据资源的流动来促进公共服务资源的优化配置、实现公共服务的充分和均衡发展。

  (3) 创新创业和产业转型。相关的关键词分布在图2顶部位置, 包括产业转型、科技创新、创新平台、“互联网+工业”、旅游、交通、创新驱动、试验区、公共经济、创新等。基于政务大数据促进产业发展和经济转型非常强调“创新发展”理念, 通过科技创新、产业创新、制度创新推动经济转型升级。在这个过程中, 政府应搭建创新平台助力产业发展。

  3.3 价值取向

  政策文本中的高频关键词能够在较大程度上反映政策的价值取向。全部政策文本中频率最高的30个关键词及其对应结点的点度中心度见表1。出现频率是指相应关键词出现在多少条政策文本中, 反映该关键词的热门程度;点度中心度是指关键词对应的结点在关键词共现网络中与多少个其他结点相联结, 反映该关键词与其他关键词的关联程度。进一步分析可以发现我国推进政务大数据发展和应用具有3个明显的价值取向:

表1 政策文本的高频关键词及其对应结点的点度中心度

640.webp (2).jpg

  (1) 以创新发展为引领。体现为12个关键词, 包括“创新”“创新服务”“主动服务”“个性化服务”“智能监管”“精准”“科技创新”“创新驱动”等。关键词“创新”出现的频次最高 (高达37) , 对应结点的点度中心度也高达15。将推动经济转型升级、政府治理和公共服务创新作为政务大数据发展和应用的根本目标;同时, 在推进政务大数据发展和应用过程中非常注重理念、体制、机制、技术、平台、流程、模式创新。

  (2) 以数据汇聚为主线。体现为17个关键词, 包括“共享”“开放”“协同”“跨部门”“跨层级”“跨地区”“信息共享”“交换共享”“集约化建设”等。该类关键词数量最多, 在前10个高频关键词中占有6个, 6个关键词对应结点的点度中心度也非常高。试图通过政务信息系统整合、集约化建设和统筹管理, 推动政务信息资源跨层级、跨部门、跨地区共享, 实现对不同来源数据的汇聚, 形成足够“大”的数据资源;同时, 还试图推动汇聚的数据资源面向社会开放共享, 更大程度地发挥其公共价值。

  (3) 以安全保障为前提。体现在关键词“安全”。尽管只有这一个关键词, 但是其出现的频率非常高 (排在第3位, 频次为29) , 对应结点的点度中心度是最高的。2014年2月27日成立中央网络安全和信息化领导小组、2016年11月7日颁布《网络安全法》, 标志着我国信息化工作迈入崭新阶段, 发展和应用政务大数据必须以安全保障为前提。

  3.4 三个阶段推进逻辑的进一步分析

  按照3个价值取向的类别将30个高频关键词的词频分布状况进一步细化到3个推进阶段, 见表2。通过分析可以得到以下两个发现:

  (1) 顶层设计阶段集中形成了3个价值取向。地方初探阶段, 仅涉及一个高频关键词“创新”, 主要是由于该阶段的政策文本数量偏少, 没有形成较为集中的主题;同时反映出各地探索的路径也较为不同。顶层设计阶段, 集中出现了大量高频关键词, 而且反映出全部的价值取向, 是三个价值取向的形成阶段。价值取向的聚焦不仅是由于国家层面陆续出台了相应的顶层设计文件, 而且是由于一些省市也迅速跟进国家战略出台了相应主题的政策文件。

  (2) 全面探索阶段进一步深化了3个价值取向。进入全面探索阶段后, 一方面是一些高频关键词及其出现频率与顶层设计阶段的关键词较为一致, 例如“智能监管”“跨部门”“跨层级”等, 主要是由于更多地方政府和行业部门依据国家战略出台相应主题的政策文件;另一方面是一些内涵更具指向性的新兴高频关键词出现或已有高频关键词的出现频次增加, 例如“主动服务”“个性化服务”“精准”“集约化建设”等, 表明一些地区或部门开始探索更具针对性的推进策略。从中也可以看到, 地方创新性探索有助于顶层设计的真正落实。

表2 三个阶段的高频关键词分布状况

640.webp (3).jpg

  4、未来进路

  发展和应用政务大数据的根本目的是基于数据分析得到的有意义模式创造公共价值。大数据价值链和生态理论均指出大数据的价值创造是通过一系列活动实现的, 包括数据获取、数据存储、数据分析、数据应用等阶段;每个阶段的活动都会影响大数据价值创造的程度;同时, 大数据创造价值的实现需要构建良好的外部环境, 促进利益相关者支持并积极参与。基于相关理论和案例分析, 本文提出一个我国政务大数据发展和应用的价值链模型, 如图3所示。对比分析当前的推进逻辑, 发现存在以下问题:一是非常强调创新发展, 但是较少关注政务大数据价值创造的可能性和程度;二是非常关注数据的汇聚, 但是不够重视数据的分析应用, 尤其是很少运用深度分析技术;三是非常重视网络安全问题, 但是推动数据产权归属界定、个人隐私保护等工作的力度不足、进展缓慢。针对未来发展, 本文提出如下建议:

640.webp (4).jpg

图3 我国政务大数据发展和应用的价值链模型

  第一, 针对具体场景创造更多公共价值。大数据价值创造具有高度的领域依赖性, 数据与具体的应用场景真正结合之后, 才能够创造出“难以想象”的价值。大数据价值创造的形式包括:一是价值生成, 即通过大数据分析直接生成公共价值, 例如基于精准分析确立扶贫资金的分配策略;二是价值提升, 即通过大数据分析提升公共价值, 例如基于医疗数据流动促进优质医疗资源向基层社区流动, 提升优质医疗资源的公共价值创造程度;三是价值转化, 即通过智能化监管促使相关主体发挥公共价值, 例如基于社会信用体系的建设, 引导企业更加注重环境保护问题;四是价值扩散, 即通过制度创新推动相关主体广泛采用基于大数据分析的新型平台, 例如正在全力推进的“互联网+政务服务”建设。在政策制定和改进中, 应在注重创新发展的基础上, 更加强调和促进公共价值创造;尽快组织研究面向领域的大数据应用绩效评估方案, 以绩效评估结果调整优化政务大数据项目的建设内容和资金投入。

  第二, 充分发挥大数据的技术优势, 深度挖掘隐藏模式。汇聚数据只是政务大数据发展和应用的基础性工作, 深度的大数据分析才能够真正实现政务大数据的公共价值创造。依托制度优势, 我们在跨部门、跨部门、跨区域、跨系统政务信息资源共享上迈出了坚实的步伐, 并在一些部门和地方取得重要进展。但是从已有实践探索来看, 目前的数据分析还主要停留在浅层分析上, 主要是发挥数据的一致性和时效性作用, 采用的分析技术主要包括关联比对、判别分析、空间分布分析、时间序列分析等;较少采用深度分析技术, 例如社会计算、知识计算、机器学习、群体交互决策等。在数据汇聚上, 主要精力放在政府内部的数据以及对外的数据开放, 但是对政府外部数据的采集和使用还很不够。目前, 在商业平台上也聚集了大量用户数据, 这些数据对改进政务工作具有重要价值。因此, 政策制定应更加鼓励深度分析技术的应用;构建政府内外部数据的双向流动机制, 充分发挥各类大数据的公共价值。

  第三, 重视产权归属和隐私保护, 构建良好的应用环境。良好的政务大数据应用环境是以网络安全为前提的, 但也需要明确的产权归属和夯实的隐私保护为保障。数据资源的产权界定不清已经是阻碍政务大数据发展和应用的主要障碍之一。政府部门在交换、共享、开放拥有的数据时总是“患得患失”“瞻前顾后”, 严重影响了政务大数据流动的程度和效率;一些部门甚至还担心数据对外公布后可能遇到的麻烦, 例如数据一致性、真实性问题。另一方面, 层出不穷的个人信息泄露事件也对政务大数据发展和应用造成了严重的负面影响。应该认识到“安全”和“隐私”尽管关联紧密, 但是二者并不等同。安全是隐私保护的前提, 但是安全有了保障并不意味着隐私受到了有效保护;还需要针对隐私保护做大量扎实工作。产权归属和隐私保护问题不能一直拖着, 而应尽快行动起来;同时, 这些问题最终要在法律框架下解决。因此, 应尽快总结提炼部门、地方的成功经验, 用于国家层面的顶层设计。

  5、结语

  发展和应用政务大数据已经上升为国家战略, 全力推进能够有力促进国家治理现代化。本文基于对189条国家层面和地方政府发布的政策文本的分析, 揭示了我国推进政务大数据发展和应用的内在逻辑;并结合大数据价值链、生态理论、案例分析结果, 构建了我国政务大数据发展和应用的价值链模型, 指出了当前存在的不足以及未来的发展方向, 对理论研究和实践探索具有一定的推动作用。在未来研究中, 将针对具体应用领域收集相关的政策文本, 深入分析相应领域的政务大数据发展和应用路径。

责任编辑:李泰民