摘要:为推动我国政府数据开放和大数据产业持续健康发展, 针对政府开放数据评估研究发展趋势和不足, 从创新和可持续发展角度, 采用文献调研法、归纳演绎法和“全评价”方法, 考察推动政府数据资产在供给方→利用方→供给方全过程持续运营的内在因素和外在因素, 分析政府数据资产可持续运营评估标准。笔者建议, 构建政府数据资产可持续运营评估理论模型, 为大数据产业发展提供决策依据。

  一、引言

  大数据环境下, 政府广泛开放跨域关联、多源异构的海量数据, 将其作为无形资产开发、增值, 成为大数据产业重要的资源供给, 是顺应国家大数据发展战略、转变政府职能、调整产业结构、改变经济增长方式、实施创新驱动发展规划的必然趋势和智慧选择。数据资产是政府未来的核心资产和社会创新要素, 是促进国家产业转型发展、社会进步的能量源泉, 如何使其可持续运营是“十三五”时期国家实施大数据战略和创新发展的重要命题。本文挖掘影响政府数据持续开放和健康利用的因素, 找出用以判断政府数据资产可持续运营的标准, 构建政府数据资产可持续运营评估理论模型, 以期为大数据产业发展提供决策依据。

  二、基本概念与相关研究述评

  (一) 基本概念

  本文认为政府数据资产指政府部门拥有数据的总和, 包括其采集的各种公共数据、企业数据、市民数据以及其自有的业务数据等。国家享有政府数据资产所有权, 政府拥有数据资产管理权。政府将数据资产以一定方式向社会公众开放, 创造的经济价值从政府税收中获得, 社会价值从政府服务和治理效果中体现。根据可持续发展理论和信息价值理论, 政府数据资产的可持续运营强调数据能持续增值 (经济价值与社会价值) 和再利用。

  (二) 相关研究述评

  数据驱动的环境和发展趋势从2012年开始形成。到目前为止, 国内外政府数据资产运营研究与实践还处于起步和探索阶段, 并以政府数据开放研究为主。政府数据资产运营评估直接成果不多, 但在评估视角、评估目标、评估方法、评估标准等方面的研究积累较多, 颇具参考价值。

  1. 文献综述

  (1) 评估视角

  国内外学者大多从政府数据开放, 即从政府数据资产运营的数据供给视角评估, 而从利用视角的评估研究较少。其中, 典型的从政府数据资产利用视角评估的成果是“open data 500强”, 这一排名用于评估利用政府开放数据形成的创业公司的创新能力[1]。

  (2) 评估目标

  国外的评估目标包括政府数据资产开放度评估、再利用评估、开放数据政策评估、数据可用性以及价值评估。其中, 政府数据开放度评估研究较为成熟, 研究成果包括互联网基金会全球开放数据晴雨表、世界银行开放数据准备度、全球开放数据指数、《联合国2014年电子政务调查报告》中的开放政府数据评估、世界经合组织开放政府数据指数, 以及Cato研究所针对美国联邦政府各部门开放数据出版实践的评估;公共信息再利用也是国外比较关注的评估目标, 如欧盟的欧洲公共部门信息记分牌和西班牙胡安·卡洛斯国王大学的MELODA都是评估政府公共信息再利用情况的工具;此外还有对开放政府数据政策、政府数据可用性、利用政府数据产生的价值和数据价值的评估等。

  国内的评估目标主要分布在数据资产价值评估、政府信息共享能力评估、政府数据开放度评估、数据资产可信度评估、数据质量评估、政府间信息共享信任度评估等。

  (3) 评估方法

  国内外研究大都采用较为传统的定性、定量, 以及定性与定量相结合的方法。如内容分析法、问卷调查、会议访谈、用于数据资产价值评估的成本法、带有结构化调査的桌面研究和定量数据观测、积分卡方法、专家调查与辅助数据相结合、用户问卷调查与专家评估相结合等;在评估模型的构建上多采用灰色模糊评估模型。

  (4) 评估标准

  国外研究主要从数据供给方和内外部环境角度设置开放政府数据评估标准, 鲜有考察数据利用方需求、收益和风险维度。 (1) 典型的从数据供给方设置的标准有:政府部门的支持和内部流程、人员培训、数据开放保障机制、开放数据执行战略、数据再利用收益模式、数据的关联性、兼容性、原始性、可获得性、可用性、数据平台建设情况等。 (2) 从内外部环境角度设置的评估标准有:政治领袖影响、经济和技术、政策法规等。 (3) 典型的从数据利用方设置的标准有:开放数据的简便性和用户下载与分析能力、数据搜索能力、理解能力和利用能力、企业与公民准备度等。 (4) 有关需求、收益和风险性的标准有:政治利益、社区满意度、公共价值等。

  国内研究主要从数据供给方和内外部环境两个方面构建评估标准。如杨兴凯、王延章设计的标准包括政府信息的特性、政府组织间的关系、政府组织的保障、政府信息化水平。鲁义轩认为整合与分析数据是发挥数据资产价值的两个关键因素。张志刚等采用的标准其中包括数据资产建设与运维。李姣等从数据发布单位、数据集主题、开放数据认证、数据开放等级四个维度评估政府数据开放程度。郑磊、高丰从基础层、数据层、平台层考察政府数据开放程度。魏晓菁等认为数据采集方式、数据质量、数据资产完成度影响数据资产的可信度。

  2. 述评

  国内外研究呈现出评估视角集中、评估目标多样、评估方法趋同、评估标准分野的特征, 为政府数据资产可持续运营评估奠定了良好基础, 也提供了有待进一步深入探索的空间。

  (1) 评估视角上, 从数据流动全过程视角的评估亟待补充。除极少数国外研究, 国内外评估视角基本停留在政府数据资产运营的供给环节, 即政府数据开放评估方面, 而对数据增值过程和利用环节的评估缺乏研究。随着政府数据开放日趋完善, 政府职能日益转变, 大数据产业逐渐壮大, 未来将更加关注政府数据资产的价值转化和长效利用, 这就需要从数据流动的全过程视角评估政府数据资产运营问题。

  (2) 评估目标上, 政府数据资产可持续运营评估专门研究欠缺。国内外评估目标虽然多样, 但主要集中于数据资产内外属性评估, 缺乏对运营全局的评估研究。国家可持续发展战略和大数据发展战略要求政府数据资产的可持续运营, 以数据资产可持续运营为评估目标的研究必不可少。

  (3) 评估方法上, 科学的评估模型研究与应用滞后。国内外评估模型构建和实证数据采集方法趋于传统, 未越过传统方法固有缺陷的藩篱, 容易出现定性与定量方法区分不清、标准相关性高度融合、采集数据无法满足评估目标等问题。需要对评估方法论进行深入探索, 重新分类评估方法, 构建既能检验标准相关性, 又能满足评估目标的“全评价”模型。

  (4) 评估标准上, 评估标准的维度表现出局限性。由于受评估目标影响, 国内外评估标准的维度不同程度地表现出局限性。国外的评估维度主要围绕数据供给方和内外部环境设置, 而从数据利用方的需求、数据利用收益和风险维度考察政府数据资产运营的评估研究较少;而国内基本只采用数据供给方和内外部环境两个维度。本文考察在供给方→利用方→供给方的数据流动全过程的各环节, 推动政府数据资产可持续运营的内在因素、外在因素和作用效果, 以及环节间的联系, 将其作为评估标准。

  本文基于国家提出大数据发展战略和可持续发展战略的时代背景, 遵循数据可持续增值的价值理念, 根据政府数据资产运营现实和国务院印发《促进大数据发展行动纲要》描绘的国家数据共享和大数据发展前景, 研究数据资产增值过程中数据供给方、利用方和各利益相关方的角色和关系机理。本研究以信息流理论、信息市场学和信息价值论为理论根基, 从数据流动全过程视角, 以“全评价”的内容评估要素影响效用评估要素, 内容要素与效用要素共同影响评估目标的理论模型为基础[35], 构建包含形式、内容和效用评估标准的政府数据资产可持续运营评估理论模型。

  三、政府数据资产可持续运营机理研究

  政府数据资产运营的内涵与本质可以总结为:社会投入专门的力量和足够的资源进行数据共享、开放、分析和挖掘, 结合具体业务优化中心决策, 实现数据资产的保值增值, 以获取经济效益和社会价值[36]。本文从政府数据资产运营的内涵与本质出发, 将视角扩展到数据流动的全过程, 研究政府数据资产可持续运营问题。根据信息流理论, 政府数据资产的流动包括数据的获取、存储、共享、开放、传输、加工、利用等过程, 整个过程由政府、用户、技术、价值等要素组成一个生态系统, 整个生态系统相互依存, 各要素之间相互关联, 共同构成不可分割的整体。同时, 信息市场学和信息价值理论又告诉我们, 由数据流动形成的数据资产运营价值生态链不是传统的直线形, 而是环形结构。数据供给方和利用方之间会发生数据交换, 产生数据的再次利用, 即数据在由供给方、利用方构成的环形价值生态链中流动, 并能够持续增值和再利用, 这就是政府数据资产可持续运营的基本形态。

  通过借鉴郑磊构建的开放政府数据系统动力学模型, 分析当前和未来政府数据可持续开放、开发和利用模式、数据流动模式、数据流动过程中供给方、利用方和各利益相关方的关系以及数据可持续增值方式, 解析来自数据价值生态链内部, 由需求和供给相互作用产生的, 推动政府数据资产可持续运营的内在因素, 以及来自价值生态链外部, 由法律、政策和标准等组成, 保障数据资产持续运营的外在因素。由两种因素共同作用, 所带来数据 (流入-流出) 的持续增值和再利用效果, 构建政府数据资产可持续运营机理摸型, 见图1。我们看到, 在数据价值生态链内部, 各政府之间对内共享数据, 对外开放数据, 并与非政府机构共享数据, 所有的共享与开放构成了数据的供给形式。数据利用方则包括电信、金融、征信、医疗卫生、娱乐、农业、人才招聘、交通、安防、个人、政府等产、政、学、研应用场景。政府数据以数据存储方、数据加工方、数据产品开发方和数据交易平台为媒介在供给方与利用方之间循环流动, 并在整个过程中保值增值。但数据加工方和数据交易平台的参与对数据的保值和增值影响不大, 不是必备的数据流动环节。这样, 数据的流动过程可分为三种形式: (1) 政府之间、政府与非政府机构共享的数据经过数据存储直接对外开放, 被利用方使用、数据增值后通过共享或交易等方式成为新的政府数据资产流入数据供给方; (2) 在第1种形式的基础上引入数据加工方, 将初步加工的数据对外开放、使用; (3) 在第1种形式或第2种形式的基础上引入数据产品开发方, 制造数据产品, 经过数据交易, 增值的数据产品被数据利用方所用。另外, 在数据价值生态链外部, 相关法律、政策和标准等外在因素保障政府数据资产持续运营。这些外在因素包括:对数据所有权、占有权、使用权、管理权、开发权、受益权和个人隐私权保护的相关法律;数据开放政策、分类开放政策、数据安全保障政策等;与有关法律和政策相对应的标准规范。在数据价值生态链内外部两种因素共同作用下, 政府数据资产持续增值和再利用, 从而带来政府数据资产的社会价值和经济价值。

图1 政府数据资产可持续运营机理模型

注:箭头表示数据流动的方向。数据再利用、数据经济价值与社会价值的保值和增值来自内外部因素的共同作用。

  四、政府数据资产可持续运营评估标准研究

  以政府数据资产可持续运营机理摸型为基础, 将政府数据可持续运营所体现的数据增值和再利用作为主要目标, 从数据流动全过程内外因素和作用效果评估视角, 依据信息市场学和信息价值论, 参考已有文献的研究结论, 挖掘和分析包含11个评估维度和36个评估标准的政府数据资产可持续运营评估标准体系, 见表1: (1) 通过考察数据供给方、利用方和各利益相关方促使数据保值、增值的能力, 以及价值生态链中各供求关系的紧密和健康程度, 研究推动政府数据资产可持续运营的内在因素的评估标准。评估维度包括:数据供给方、大数据基础设施厂商、数据加工方、数据产品开发方、数据交易平台和数据利用方。 (2) 通过考察相关法律、政策和标准等对数据持续增值的保障能力和效果, 研究推动政府数据资产可持续运营的外在因素的评估标准。 (3) 通过考察数据的价值 (流入-流出) 和增值情况, 研究在内在与外在因素共同推动和作用下, 产生的政府数据资产可持续运营效果的评估标准。评估维度包括经济价值和社会价值。

表1 政府数据资产可持续运营评估标准体系

  五、政府数据资产可持续运营评估理论模型研究

  前人在评估模型的选择上, 较多采用灰色模糊综合评价法。如R Zuo等、WZ Bernstein等、杨兴凯等、魏晓菁等的文章都采用了这种方法。成熟的指标权重算法是灰色模糊综合评价法的优势所在, 但此种模型的缺点在于无法对指标进行相似性检验, 选取指标的科学完备性较低。为探索新的评估方法, 一并解决指标权重和相关性检验问题, 本文选择运用创新的“全评价”理论框架。“全评价”理论框架是叶继元在《人文社会科学评价体系探讨》一文中首次提出的。他认为:“人文社会科学学术评价涉及许多方面, 是个复杂的体系, 评价主体、评价客体、评价目的、评价标准与指标、评价方法和评价制度至少六大要素构成了评价体系的第一层结构。”“形式评价是评价主体对评价客体外部特征的评价。”“内容评价指评价客体内含特征, 是关于质量的评价。”“效用评价是实践、时间与历史对评价客体实际作用和价值的验证或最终评价。”“从知识的三要素可以推论出, 所有的评价都可以分成形式评价、内容评价和效用评价三种方式或评价指标的三个方面。”

  将内在因素和外在因素共同构成的“推动因素”作为内容要素 (需要研究评估对象的内部而非外在表象才可做出评估判断) , 将作用效果作为效用要素 (从产生的效果角度判断) , 应用“全评价”理论框架和美国顾客满意指数模型 (ACSI) 为基础推导出的内容影响效用、内容与效用共同影响评估目标的“全评价”模型, 结合体现政府数据资产可持续运营本质, 且便于计量的评估标准体系, 构建政府数据资产可持续运营评估理论模型, 见图2。评估标准体系中几个形式评价指标在实证阶段可以通过标准化方法转化, 以便构成完整的“全评价”评估模型又不影响评估结果的科学性。

图2 政府数据资产可持续运营评估理论模型

  后续研究需要深度挖掘观测变量作为评估指标, 对指标进行相似性检验以剔除高相关度指标并修正模型, 将测量的因子载荷和路径系数作为各级指标权重, 最终构建政府数据资产可持续运营评估模型。

  参考文献:略

责任编辑:qinpeng