到底多大才是“大数据”?“大数据之‘大’并不在于其表面的‘大容量’,而在于其潜在的‘大价值’。”《大数据:正在到来的数据革命》一书的作者、知名信息管理专家涂子沛在第十届国家信息化专家论坛上指出,数据的价值在于计算,未来将兴起一个全计算型的社会,特别是以物联网为核心的机器计算和社会计算,开放数据的目的是鼓励创新、推动网络经济的发展、促进中国经济向精细化转型。

  从全球数据技术投入的资金分布来看,传统的小数据仍然占据绝对的重头。据国际数据集团(IDG)统计,2012年,全球对小数据分析工具的投资为349亿美元,而对大数据分析工具Hadoop的投资仅为1.3亿美元,不及前者的1%。IDG的结论是,传统的小数据软件满足了企业和组织95%的需求。涂子沛认为,目前行业发展的最新态势,是“大”、“小”数据分析工具趋于一体化并在向“云”迁徙。

  未来的计算机会越来越小,会无处不在,跟日常环境联系到一起。涂子沛指出,我们的智能手机就是一台计算机,有传感器也有摄像头,它可以收集数据,反馈数据。美国气象局用来做气象检测的传感器是随着汽车不停行进的,从纽约到波士顿,每10秒钟收集一次数据,一天收集十几万次数据,实时传输到数据中心。在1989年,就已经出现了数据挖掘。摩尔定律解决了一个问题,就是无论有多少信息,我们都可以以很低的成本保存下来。普适计算解决的问题是使得人类收集信息的能力越来越强,感应器、手机、无线网络、望远镜、仿真计算都在产生数据,就是说保存数据的能力很强,收集数据的能力很强,到1989年数据挖掘出现之后,人类分析数据的能力也空前增强。

  涂子沛指出,通过开放数据,大数据还可以成为启动透明政府的利器。这对当下的中国,现实意义毋庸讳言。数据增值的关键在于整合,但自由整合的前提是数据的开放。开放数据是指将原始的数据及其相关元数据以可以下载的电子格式放在互联网上,让其他方自由使用。开放数据和公开数据是两个不同的概念,公开是信息层面的,是一条一条的;开放是数据库层面的,是一片一片的。开放也不一定代表免费,企业的数据,可以以收费的形式开放。开放也是有层次的,可以对某个群体、某个组织,也可以对整个社会开放。在大数据的时代,开放数据的意义,不仅仅是满足公民的知情权,更在于让大数据时代最重要的生产资料数据自由地流动起来,以催生创新,推动知识经济和网络经济的发展,促进中国的经济增长由粗放型向精细型转型升级。

责任编辑:admin