本文由信息与电子前沿(ID:caeit-e)公众号授权转载。

  作者:中国电子科学研究院粱智昊
  原标题:美国大数据治理的中国启示
 
  (一)美国发展大数据战略的启示
 
  1.政府部门资助大数据技术研发和应用
 
  2012年政府投资2亿美元推动大数据的核心技术研发;美国国防部计划每年投资2.5亿美元开展一系列大数据研究;
 
  2.美国企业加紧开展市场布局
 
  大数据在美国最早为互联网企业所重视,因此美国的企业对大数据的投资尤为重视。美国一些大型公司资助大数据的相关竞赛、为高等院校的大数据研究提供资金、投资建立实验室、收购大数据企业实现技术整合。例如,2013年福特汽车在硅谷创立实验室,处理了400万辆汽车的数据;2013年Twitter与12个合作伙伴一起对大数据的作用进行试验;EMC、惠普、IBM、微软等IT巨头纷纷通过收购“大数据”相关企业来实现技术整合;美国VC看中大数据的发展前景,对大数据领域投资进行投资积极:2009年11亿美元,2010年15.3亿美元,2011年达24.7亿美元。
 
  3.多元化合作共同创造价值
 
  《大数据研究和发展倡议》提出联邦政府希望与行业、科研院校和非盈利机构一起,共同迎接大数据所创造的机遇和挑战。某种程度上,大数据技术在美国已经形成了全体动员的格局。据估计大数据给美国带来的价值约为3000亿美元-5000亿美元。其公共服务领域同样蕴含着大量的潜在价值,公共管理领域预计有2500亿美元的潜在价值,因此,在公共领域以政府给主导的政府与企业的多元化合作为双方带来的双赢。美国国家卫生研究院的国际千人基因组项目,由亚马免费云服务(AWS)提供相关支持;Opower 使用大数据来提高消费用电的能效,预计为美国消费用电每年节省5亿美元。
 
  4.美国大数据国家行动对我国的启发
 
  美国大数据国家行动是以政府对关键领域(安全、公共服务领域)核心技术的研发投入为主体,并鼓励政府、非政府组织、个人、企业、研究机构多方合作共同推进技术领域的创新,从而为大数据发挥作用提供最根本的支持和保障。
 
  在产业层面,由于大数据在美国最早为互联网企业所重视,所以企业会积极参与和支持科研部门的技术研发,并且重视企业自主创新能力的提升,从而保障其在本领域的竞争力。社会资金基于对大数据前景的看好,也对大数据领域投入大量的资金支持其发展。正是在这种以政府引领技术创新为主导,多方共同参与技术创新,以及完全市场化的发展模式使得美国的大数据领域走在世界的前端。
 
  (二)我国大数据发展存在的问题
 
  1.技术水平不高,资金投入不够
 
  我国大数据技术存在水平不高,技术扩散不畅、投入较低的问题。我国大数据技术的发展模式是互联网企业具备快速将国际先进的开源大数据技术整合到自身系统中的能力,并构建了单集群上万节点的大型系统,但仍缺乏原创技术,对开源社区的贡献不足,进而对前沿技术路线的影响比较微弱。我国需要进一步提高企业自主创新能力,研发属于我国的大数据核心技术,推动我国大数据的发展和应用,同时也有利于保障国家安全。
 
  同时,我国大数据仍处于割裂状态,很多单位之间的数据关联、集聚、共享、价值的深度挖掘还不够,在数据计算、可视化、结果呈现等方面仍存在技术难题。而且由于本土开源社区等产业组织发育滞后,国内领先企业在大数据方面的技术创新也难以向社会扩散。目前,我国在大数据研究和发展方面的投入远远不够,方向也不明确,这是推动我国大数据发展的主要瓶颈之一。因此,要加强我国大数据关键技术的突破,避免我国在未来大数据技术方面受制于人。
 
  2.数据质量不高,数据中心盲目建设
 
  丰富的高质量数据资源是大数据发展的前提。近几年在互联网产业及金融、电信信息化快速发展的带动下,我国数据资源总量有了快速增长,已达到全球的13%,但其他行业受信息化水平制约,数据储量仍不丰富。已有数据资源还存在标准化、准确性、完整性低,利用价值不高的情况。
 
  国内对于大数据的概念和相关理论大有追赶潮流之势,而真正对大数据的认知还不够清晰、明确。从而我国大数据中心的大批量建设就可以看出,对大数据发展的盲目性。不仅仅是一、二线城市,甚至三线、四线城市也纷纷表达了对大数据中心的建设热情,重金下注,不仅给地方和企业带来了沉重的负担。而数据中心作为能耗的大户,也造成了全社会能源的巨大浪费。目前中国的数据中心的平均PUE值在2.2-3.0之间,而实际能耗可能远远高于这一数字。对于云计算数据中心建设,应该统筹需要,避免重复建设,使数据中心行业发展更加健康,更有竞争力。
 
  3.数据安全面临重大挑战
 
  数据安全在大数据时代也同样面临挑战。大数据发展的趋势往往与加大信息开放度、设计新的信息收集设备以及为海量数据的庞大存续和分析需求提供支持的云计算等如影随形。带来的副作用是IT基础架构将变得越来越一体化和外向型,对数据安全和知识产权构成更大风险。尤其是我国大数据核心基础设施的跟在美国,容易遭到山姆大叔的窥探,将使我国的国家安全遭受严重威胁。2014年初,爆出美国大规模入侵华为服务器的消息,针对无线路由器等上网设备所造成的重大安全漏洞,可导致用户被“终身监视”的严重后果。因此,要加快出台国家信息安全战略,以大数据为重点构建网络安全保障体系,保障我国的国家安全。
 
  4.个人隐私权与数据公开等相关法律制度的缺失
 
  目前,中国已出台了一批法律、法规、司法解释等规范性文件,形成了国家层面立法、国务院行政法规、部门规章和地方性法规三个层次、覆盖网络安全、电子商务、个人信息保护、网络知识产权等领域的网络法律体系。但是,还应看到,法律治理体系尚有不健全之处。
 
  大数据环境下,关于信息主权的界定和网络用户隐私的保护将对国家安全和数字经济的发展创造良好环境。目前我国关于网络用户隐私保护的问题在相关法律中有所涉及。大数据环境下,这些法律条款在用户隐私保护方面虽然起到一定的作用,但远远不够,目前我国并没有制定关于网络用户隐私安全的单行法律,这是我国大数据发展的一个重要制约因素。数据增值的关键在于整合,但自由整合的前提是数据开放。在大数据时代,开放数据的意义不仅仅是满足公民的知情权,更在于让大数据时代最重要的生产资料、生活数据自由的流动起来,准确、全面地应用起来,以推动我国经济社会经济增长、保障我国国家安全。虽然我国已经制订了《信息公开条例》,政府信息公开也有了一定进展,我国政府、企业和行业信息化系统建设中受到各种因素制约,形成了众多“信息孤岛”,数据开放广度和深度严重滞后。
 
  5.大数据人才的缺失
 
  大数据的迅速发展,对大数据相关人才的需求随之而来。正如《哈佛商业评论》所言:“数据科学家将成为21世纪最性感的职业”。数据科学家是复合型高端人才,数据科学家是采用科学方法、运用数据挖掘工具寻找新的数据洞察的工程师。数据科学家除应具备好奇心和怀疑精神外,还应具有分析能力、技术能力、沟通和合作能力。麦肯锡预计,到2018年,仅在美国市场,数据科学家人才缺口就将达到14-19万,而相关方面的 管理人才缺口将达到150万。人才短缺也是制约我国大数据产业发展的重要因素。
 
  (三)我国大数据发展战略建议
 
  总体来说,我国的大数据产业在技术层面受制于人,因此国家安全存在隐患;从大数据产业发展层面来看,核心技术受制于人,在国际竞争中必然处于劣势,并伴随着严重的风险,也更无从谈起带动国民经济的发展。因此,对于大数据这一以技术为支撑和立足的领域,首要做的就是以政府为主导的技术创新,积极鼓励企业参与大数据核心技术的研发上来,做到产、学、研的有机结合,才能真正发挥大数据的作用。
 
  1.我国大数据发展的路线图
 
  ▲我国大数据国家行动的逻辑框架/注:图由中国电子科学研究院根据公开资料绘制
 
  2.我国大数据的发展战略
 
  ▌第一,发展大数据,必须要技术先行
 
  在核心技术层面:强化政府引领,鼓励科研机构、高校、企业共同参与大数据的技术创新。通过搭建稳定安全的数据收集存储平台、利用云计算技术提高大数据的管理与运用效率,提高数据分析;支持数据加解密、数据审计、数据销毁、完整性验证等数据安全技术研发及应用。
 
  加强核心基础设施建设能力:我国核心基础设施的根在美国,容易遭受监听,使我国的国家安全受到严重威胁,因此应加强核心基础设施能力建设,从源头上降低大数据对国家安全的威胁 。
 
  与云计算产业协同合作,将成为大数据基础设施建设的重点:推进批云计算平台和数据中心的合理建设与规划;加强产学研结合,鼓励企业参与网络设施、平台的投资、研究和建设。
 
  重视和加强人才的培养:人才是大数据发展基本保障之一,根据麦肯锡报告,到2018年美国大数据人才缺口将达到150万,在我国大数据的专业人才更是严重匮乏。因此,应在国家高等院校、科研机构建立大数据人才培养机制,国家资助或成立专项基金支持大数据关键技术研究。
 
  通过建立大数据技术创新的产学研协同创新平台,攻关一批大数据关键技术,形成集海量数据的搜集、存储、管理、分析、挖掘和运用于一体,具有自主知识产权的技术支撑体系。从而通过技术的创新,提高我国大数据的国际竞争力,从而带动产业的发展成熟,进一步促进经济的发展;提升国家网络空间安全的防护能力,使得大数据的技术成果为民所用,提升国家公共服务的水平。
 
  ▌第二, 发展大数据,必须要有制度保障
 
  目前,我国在大数据相关层面的立法滞后,标准不完善,使得大数据的生产、共享和利用处于无法可依,无标准可遵循的混乱状态,因此,需要从国家层面建立完善健全的标准和法规。
 
  从数据的开放与共享,与隐私保护来看,应该完善数据开放的标准和标准,加强大数据标准体系建设,建立面向不同类型、涵盖各个领域、不断动态更新的大数据建设标准,为实现各级各类信息系统的网络互连、信息互通、资源共享奠定数据基础;(如制定科学的数据标准流程、构建前瞻性的数据质量规划、形成有效的数据质量评估机制与管理模式等)。
 
  ▌第三,发展大数据,必须多方合作协同发展
 
  国家安全领域:数据公开与共享:保障国家安全、商业秘密和个人隐私为前提下,正向有序公开、反向彻底透明、横向高效互联的数据公开与共享机制;
 
  基础设施平台建设:加强云计算安全研究,保障云安全;加强基础设施建设,从源头上保障安全;推动数据交换过程中的数据来源追溯和安全保护;网络安全审查机制:宏观战略和微观技术两方面分别采取不同措施。对于进入政府机构、交通、电力、金融等重要领域的产品,需要建立“黑名单”制,不仅对技术也对企业背景进行审查,保障国家信息安全;而对于在市面流通的信息技术产品,需进行“白名单”强制认证,只有符合安全标准的产品才能入市。这种审查只是一种技术评估,普通用户的利益不会受到影响。
 
  公共服务领域:着力开展典型应用示范,选取医疗卫生、食品安全、终身教育、智慧交通、公共安全、科技服务等惠及民生的关键领域,率先开展大数据服务。通过典型应用示范,以点带面,建立健全大数据公共服务平台体系,提升大数据的覆盖面和应用水平。
 
  消费市场领域:以企业为主体,充分发挥市场的作用,政府予以扶持和监督,激励大数据企业的创新、技术成果转化应用以及商业模式的探索,形成完备的大数据产业体系,提升大数据产业的国际竞争力。
 
  网络舆情治理:构建网络舆情治理体系:以技术手段保障数据源的准确性、监测的及时性,分析的科学性为舆情治理提供基本保障建立完善的网络舆情监测预警体系,建立完备的网路舆情研判的标准体系。
责任编辑:admin