信息化建设加速,促使大数据在中国得到发展。国际有关机构统计,中国的数据总量将以年均50%的速度增长,预计到2020年将占全球的21%。当然,作为一个相对新鲜的事物,中国的大数据发展还存在着一定的问题。本文对中国从数据大国向数据强国转型提出了一些对策和建议。

 
  2020年中国数据总量将占全球21%
 
  经过多年信息化建设和互联网发展,中国已经成为数据大国。互联网已经成为生产、生活的重要技术平台,随着信息技术的日益普及和“互联网 ”融合态势的加快,海量数据不断快速聚集,据工信部总工程师张峰在2015中国国际大数据大会上介绍,国际有关机构统计,中国的数据总量将以年均50%的速度增长,预计到2020年将占全球的21%。在新形势下,国务院于2015年6月24日印发了《关于运用大数据加强对市场主体服务和监管的若干意见》,提出要充分运用大数据先进的理念、技术和资源,加强对市场主体服务和监管,推进减政放权和政府职能转变,提高政府治理能力。同年8月31日颁布了《关于促进大数据发展的行动纲要》,并提出“坚持创新驱动发展,加快大数据部署,深化大数据应用,已成为稳增长、促改革、调结构、惠民生和推动政府治理能力现代化的内在需要和必然选择。”
 
  各地出台大数据行动计划
 
  与此同时,全国各地也加快了推动大数据发展的步伐。其中,广东、上海、重庆、贵州、武汉等省市在全国率先制定颁布了推动大数据发展的效果政策文件。早在2012年11月,广东便发布《广东省实施大数据战略工作方案》,提出“为保证大数据战略有效实施,广东省将建设政务数据中心,并为高等院校和企业等成立大数据研究机构提供支持。”2013年7月,上海发布《上海推进大数据研究与发展三年行动计划(2013-2015年)》,提出“突破大数据关键技术,建立以企业为主体、产学研联合的发展机制,形成需求牵引、创新应用的发展模式,发展数据产业,服务智慧城市。”拟成立“上海大数据产业技术创新战略联盟”,建设“上海市数据科学重点实验室”、数据工程技术研究中心等,以大数据技术创新及产业应用为目标、以联盟为纽带促进形成若干引领大数据产业技术创新的企业联合实体。2014年2月,贵州印发《关于加快大数据产业发展应用若干政策的意见》、《贵州省大数据产业发展应用规划纲要(2014—2020年)》,提出了贵州省大数据发展的目标是,即推动贵州省大数据产业稳步快速发展,到2020年,大数据带动相关产业规模达到4500亿元。大数据产业体系基本健全,业务形态较为齐备,创新能力显著增强,安全保障能力明显提高。产业载体建设顺利推进,聚集一批具有较强市场竞争力的骨干企业。数据中心布局合理,政府数据资源实现有效整合,大数据开放与管理机制初步建立,应用水平明显提高,以大数据引领和支撑贵州省经济社会转型发展的能力显著增强。此外,重庆、武汉等其他省市也纷纷颁布了各自的大数据行动计划。
 
  从数据大国向数据强国转变五大制约
 
  在中国积极发展大数据的同时,还存在着若干制约中国从数据大国向数据强国转变的因素,具体来说,主要包括以下几个方面:
 
  1.需求不明确
 
  数据是大数据产业发展的基础,具有商业价值的数据和商业分析真正能够帮助企业提升业务,创造出新的价值。很多企业业务部门不了解大数据,也不了解大数据的应用场景和价值,因此难以提出大数据的准确需求。而大数据部门又是非盈利部门,企业决策层担心投入太多的成本,导致了很多企业在搭建大数据部门时犹豫不决,或者很多企业都处于观望尝试的态度,从根本上影响了企业在大数据方向的发展,也阻碍了企业积累和挖掘自身的数据资产,甚至由于数据没有应用场景,删除很多有价值历史数据,导致企业数据资产流失。
 
  2.共享不充分
 
  由于缺少统一规划和统一的标准,中国政府部门与数据企业在建设信息化系统的过程中形成了众多的“信息孤岛”。在很多企业中尤其是大型的企业,数据常常散落在不同部门,而且这些数据存在不同的数据仓库中,不同部门的数据技术也有可能不一样,这导致企业内部自己的数据都没法打通。如果不打通这些数据,大数据的价值则非常难挖掘。另一方面,中国的大数据市场还不成熟,市场上存在的仅是孤立、不流动、没有整合的数据,客户很难找到完整的、具有商业价值的数据因而不得不从多个数据企业采购数据,这样不但效率低,而且费用高。
 
  3.安全保障低
 
  随着信息技术的不断发展,如何保证用户的信息安全日益成为一个非常重要的课题。在大数据时代,要求将所有的数据存储在同一个地方,这使得保护数据会变得更加简单,但与此同时,在线数据越多越集中,黑客也越容易获得关于人的信息,从而更可能实施犯罪。日前一些知名网站密码泄露、系统漏洞导致用户资料被盗等安全事件已经警醒我们,要加强大数据网络安全的建设。另一方面,随着数据的不断增加,对数据存储的物理安全性,从而对数据的多副本与容灾机制要求也会越来越高。目前,中国多数政府部门和传统企业的数据安全令人担忧。
 
  4.人才队伍少
 
  大数据在中国是新生事物,国内高校开展大数据技术人才培养的时间不长,技术市场上掌握大数据处理和应用开发技术的人才很少。另一方面,大数据的发展速度很快,无论是政府部门还是企业都需要一支掌握懂技术、善管理、有经验的大数据建设专业队伍,包括大数据开发工程师、大数据分析师、大数据架构师、大数据后台开发工程师、大数据算法工程师等。因此,目前中国大数据市场上的技术人才储备与大数据处理和应用需求之间存在着巨大的缺口,而且这一缺口将在未来几年可能持续存在。
 
  5.隐私保护差
 
  在大数据时代,信息公开和数据共享是必然的趋势,但与此同时,随着数据的指数性增长,隐私泄露事件时有发生。目前,中国还没有专门的隐私权保护法律,因而无法保证国家大数据战略进行过程中数据的隐私安全。为促进大数据的健康有序发展,我们必须尽快研究制定相关法律法规,明确对大数据战略中每一个项目的活动周期中产生的数据进行隐私监管,确保数据隐私不被侵犯。
 
  发展中国大数据六大对策建议
 
  在借鉴国外发达国家和地区先进经验的基础上,充分考虑中国具体国情及国内外大数据发展的趋势,中国发展大数据应该采取如下对策建议。
 
  1.推动数据开放
 
  政府拥有大量有价值的数据,因此政府应该着眼于民生福祉,带头推动政府数据的开放共享。要加快建立政府数据开放平台,推动各级政府和公共服务机构优先开放高价值数据资源。加强政府与民间协作,推动各类优质数据资源的开放共享。积极发挥市场的决定性作用,引导更多非公共数据向社会开放,鼓励基于开放数据开展应用创新,通过数据资源的开放利用,促进大数据技术和产业创新发展,并惠及更多民众。
 
  2.健全法律法规
 
  借鉴美欧等发达国家和地区的经验,加快制定完善《中华人民共和国政府信息公开条例》、《中华人民共和国保守国家秘密法》、《中华人民共和国个人隐私法》等有关信息公开、数据安全、网络安全、隐私保护方面的法律法规,规范国家重要数据的存储、备份和迁移,保障数据安全、可靠。在尊重知识产权的前提下,规范数据隐私保护的范围、方式和程序,有效避免信息公开与隐私保护方面的冲突,对相关数据去除敏感信息后实现开放和共享。
 
  3.完善标准规范
 
  尽快制定并试行对数据开放原则和机制规范、数据分级标准、数据发展及使用的责任与权益等大数据发展应用过程中必需的相关标准规范。制定数据编码、处理、共享、交换标准,出台大数据技术、协议、标准等规范;建立数据资产访问、连接和共享机制,搭建数据资产交易平台,形成数据流转的层次化体系结构;研究数据资产的所有权、使用权以及价值评估体系,通过市场化模式保障数据资产流转的可行性。
 
  4.保障信息安全
 
  妥善处理发展创新和安全规范的关系,探索完善安全管理规范措施,切实保障数据安全。建立大数据安全评估体系,做好大数据应用安全评测和风险评估,提高大数据平台信息安全监测、预警和应对能力。加强测试工具研发,开展大数据平台可靠性及安全性评测服务,引导大数据安全可控和有序发展。推动数据保护、个人隐私、数据权益和合理利用等方面的地方立法工作,加快出台实施细则,对重要数据的保存、备份、迁移等进行规范管理。
 
  5.加强人才培养
 
  落实各项人才政策,创建吸引人才、留住人才的良好环境,加快从美、欧等发达国家和地区引进既懂业务知识又具分析技能的复合型数据人才。扶持高等院校大数据相关专业的发展,推进大学课程改革,开设一系列符合现在和未来社会需求的数据技术的相关课程,培养数据存储、数据挖掘、数据可视化等方面的专门人才。鼓励高校和企业通过建立联合实验室、研发中心等形式,联合培养理论与实践相结合的大数据专业人才。充分发挥以岗位培训和继续教育为重点,加大社会化培训力度,提高在职人员大数据应用技能,进一步加强对机关公务员、事业单位、大中型企业工作人员的大数据知识的培训与考核。
 
  6.支持技术创新
 
  加大财政对大数据关键技术研发创新的引导和扶持力度,构建自主的大数据技术体系。加强大数据共性基础技术研发。重点研发大数据存储管理、分析挖掘、可视化、数据安全等关键技术和产品,提前布局自然语言处理、语义理解和机器学习等关键技术。支持国内创新型企业,开发专业化的数据处理分析技术和工具,提供特色化的数据服务。支持高校和科研院所建立大数据开放实验室,推动多学科交叉融合,开展大数据分析关键算法和关键技术研究和大数据专业人才培养,并加强实践应用。
 
  2020年全球大数据将达40ZB,美日欧发展经验启示
 
  随着新一代物联网、云计算、移动互联网等信息技术的不断普及,人类产生的数据量正在呈指数级增长,大约每两年翻一番,而且这个速度将在2020年之前会继续保持下去。这意味着人类在最近两年产生的数据量相当于之前产生的全部数据量。有关资料显示,2011年,全球数据规模为1.8ZB,可以填满575亿个32GB的iPad,这些iPad可以在中国修建两座长城。到2020年,全球数据将达到40ZB,如果把它们全部存入蓝光光盘,这些光盘和424艘尼米兹号航母重量相当。
 
  在此情况下,数据日益成为一种重要的战略资源。近年来,美、欧、日等发达国家和地区也纷纷将开发利用大数据作为夺取新一轮竞争制高点的重要抓手,相继出台了相关的战略规划和配套法规来促进大数据应用与发展,致力于利用大数据来进一步增强自身的综合竞争力。笔者将分析研究上述国家和地区的具体做法和经验,供中国健康有序发展大数据学习借鉴。
 
  美国、欧盟、日本大数据发展现状及举措:
 
  美国
 
  2010年,美国总统科学技术顾问委员会(PCAST)向奥巴马和国会提交的《规划数字化的的未来:美国总统科学技术顾问委员会给总统和国会的报告》指出,大数据技术具有重要战略价值,而联邦政府对其研发投资不足,建议联邦政府“制定一个应对‘大数据’的战略”。此后,奥巴马政府着手采取了一系列主题为“我的大数据”(MyDataInitiatives)的倡议和措施,分别为2010年发起的《“蓝纽扣”计划》、2012年发起的《“绿纽扣”计划》、2012年发起的《“我的学生数据”计划》和2014年发起《“创建副本”计划》,旨在促进美国人可以更安全地获取他们的个人数据,从而更好地处理他们私人领域的申请活动和服务。2012年3月,美国投资2亿美元启动了“大数据研究和发展”计划,该计划涉及国防部、能源部等6个联邦政府部门,用以大力推进大数据的收集、访问、组织和开发利用等相关技术的发展,进而大幅提高从海量复杂的数据中提炼信息和获取知识的能力与水平。政府对大数据带来的负面影响也更加重视,白宫2014年5月,美国发布的白皮书《大数据:抓住机遇,守护价值》提出:“大数据正在改变世界。但是它并没有改变美国人对于保护个人隐私、确保公平或是防止歧视的坚定信仰。”
 
  欧盟
 
  欧盟于2011年12月公开颁布了《开放数据战略》。它以开放数据为核心,以创新、增长和透明治理为引擎,将重点加强在数据处理技术、数据门户网站和科研数据基础设施三方面的投入,旨在欧洲企业与市民能自由获取欧盟公共管理部门的所有信息,建立一个汇集不同成员国以及欧洲机构数据的“泛欧门户”。目前,欧盟正在研究制定数据价值链战略计划,以实现数据的最大价值,尤其是所谓的“大数据”,重点是通过一个以数据为核心的连贯性欧盟生态体系,让数据价值链的不同阶段产生价值。数据价值链战略计划包括开放数据、云计算、高性能计算和科学知识开放获取这四大战略,遵循的主要原则是:高质量数据的广泛获得性,包括公共资助数据的免费获得;作为数字化单一市场一部分,欧盟内数据的自由流动;寻求个人潜在隐私问题与其数据再利用潜力之间的适当平衡,同时赋予公民以其希望形式使用自己数据的权利。
 
  日本
 
  2012年6月,日本IT战略本部发布电子政务开放数据战略草案,迈出了政府数据公开的关键性一步。为了确保国民方便地获得行政信息,政府将利用信息公开方式标准化技术实现统计信息、测量信息、灾害信息等公共信息,在紧急情况时可以较少的网络流量向手机用户提供信息,并尽快在网络上实现行政信息全部公开并可被重复使用。2012年7月,日本总务省ICT基本战略委员会发布的《面向2020年的ICT综合战略》(草案)提出,“提升日本竞争力,大数据应用不可或缺”,战略将重点关注“大数据应用”。2013年6月,安倍内阁正式公布了新IT战略——《创建最尖端IT国家宣言》,全面阐述了2013~2020年期间以发展开放公共数据和大数据为核心的日本新IT国家战略,提出要把日本建设成为一个具有“世界最高水准的广泛运用信息产业技术的社会”。
 
  经验与启示:
 
  1.注重顶层设计
 
  为充分抓住大数据带来的新发展机遇,美、日等发达国家无不从国家层面来制定大数据战略规划,提出国家实施大数据战略的明确目标,并用于引领带动本国大数据的快速发展。如美国的《我的大数据》、《大数据研究和发展》等,日本《面向2020年的ICT综合战略》、《创建最尖端IT国家宣言》等。另一方面,美、日等国政府除了做好大数据项目的统筹规划以外,还会提供充足的资金以支撑提升国家数据能力的基础设施建设以及促进面向大数据创新应用技术的开发,并保证政府部门数据存储需求和数据安全需求。
 
  2.注重数据开放
 
  为保证大数据能够充分发挥作用,美、欧、日等发达国家和地区都实行了开放数据的政策。如美国的《我的大数据》分别从退伍军人健康记录、纳税信息、电力能源使用和学生助学信息四个方面进行信息公开,使得美国人可以更安全地获取他们的个人数据,用来更好地处理他们私人领域的申请活动和服务。《欧盟开放数据战略》旨在欧洲企业与市民能自由获取欧盟公共管理部门的所有信息,建立一个汇集不同成员国以及欧洲机构数据的“泛欧门户”。日本IT战略本部于2014年6月发布电子政务开放数据战略草案;并于2013年7月由日本三菱综合研究所牵头成立了“开放数据流通推进联盟”,旨在由产官学联合,促进日本公共数据的开放应用。
 
  3.注重隐私保护
 
  随着在大数据飞速增长,隐私问题也日益呈现在世人的面前。美、欧、日等发达国家和地区在强力推动大数据的同时,也充分考虑了隐私的保护。随着远程控制技术与云端储存技术在个人电脑与文件管理领域普及,美国政府正在通过发展大数据战略来完善隐私法以保证法律跟上技术发展的脚步。现今美国最高法院正从第三方数据的访问权限、数据和元数据的安全、商业数据服务的政府使用、内部威胁和持续性评估这四个方面着手来完善隐私法。欧盟通过“迎接大数据时代”的推广,呼吁成员国积极推动大数据业务,并就“数据所有权”和数据提供责任作出新规定、制定数据标准等。
 
  4.注重社会参与
 
  由国家出资推进政府与各科研单位、高校、企业的合作,组合社会各界多元力量共同参与大数据战略,是发达国家和地区的重要经验。如美国《大数据研究和发展计划》就是以美国各级政府为主导,依托高校和科研机构,鼓励联邦政府机构和各州政府以及高校、非政府组织和企业等各种力量广泛参与,并通过多种形式进行充分的合作。日本为促进本国大数据的快速发展,成立了由三菱综合研究所牵头、东京大学等机构广泛参与的“开放数据流通推进联盟”。
 
  (作者:武峰)
责任编辑:admin