杜小勇:大家好,欢迎大家来到“廉洁文化公开课”!

  非常高兴有机会来和大家来一起讨论“大数据”,这个当下的热门话题。在今年上半年举行的“人机围棋大战”中,AlphaGo最终以3:0的成绩战胜人类棋手,再次让世人惊叹它的强大实力。这台由谷歌旗下的一家英国公司开发的AlphaGo,背后是由超级计算机支持的“神经网络”系统,它依赖谷歌的云数据库和大数据分析,以无数人类大师棋谱数据为基础进行深度学习,它还可以进行自我对弈,不断自我完善。所以,与其说人机大战是AlphaGo的一次胜利,不如说是基于大数据分析、人工智能应用的一个成功案例。

中国人民大学教授、大数据专家:杜小勇

中国人民大学教授、大数据专家:杜小勇

  今天,我们生活在一个数据的时空中,引用一位中国工程院院士的话:“不管你是否认同,大数据时代已经来临,并将深刻地改变着我们的工作和生活。”那么今天,我想就大数据在治国理政方面的应用,从三个方面谈谈个人的认识和理解,与大家分享。

  一、21世纪的“钻石矿”——认识大数据

  第一,多算胜,少算则不胜。古往今来,数据在国家治理过程中起着重要的作用。人口、资源、土地、财产等统计数据都是治国理政的重要依据。中国古代兵书《孙子兵法》中就有“算则胜,不算则不胜;多算胜,少算则不胜”的说法。这里的“算”,指的就是利用数据来估算分析各种复杂的情况。进入21世纪,随着互联网技术的不断发展,新一轮科技革命和产业变革正在孕育兴起,依靠数据决策、依靠数据管理、依靠数据创新正在成为必然趋势。

  2015年6月,习近平总书记在贵阳考察,来到贵阳市大数据广场,听取贵州大数据产业发展、规划和应用情况介绍。在一块电子屏前,总书记听了有关人员的汇报,对当地干部说:“我听懂了,贵州发展大数据确实有道理。”

  今天,我们打电话、聊QQ、刷微信、购物、看病、旅游都在不断产生新的数据,“堆砌”着数据大厦。大数据已经与我们的工作生活息息相关、难舍难分。有人说,大数据时代谁掌握了数据,谁就掌握了主动权。那么大数据到底是什么?它经历了哪些发展阶段?下面我和大家一起做些分析。

  第二,大数据的来龙去脉。在我的理解中,大数据起源于上世纪70年代。我记得有一个重要的事件,1975年在美国召开了第一次国际数据库大会,首次出现了超大规模数据一词,Very Large Data Base,想表达的意义就是大容量的数据集。20世纪末到21世纪初期是大数据的概念逐渐形成和发展时期。我们现在说的大数据有四个重要的特征,就是耳熟能详的“四个V”:大量化Volume、多样化Variety、快速化Velocity和大价值Value。2011年,麦肯锡全球研究院发布《大数据:创新、竞争和生产力的下一个前沿》研究报告。以此为节点,“大数据”就进入我们的视野,进入应用的阶段。

  2012年1月,达沃斯世界经济论坛发布《大数据,大影响》报告,文中提出“大数据已成为一种新的经济资产类别,就像货币或黄金一样”,这一观点再次引起全球范围的关注与热议。2016年9月,G20杭州峰会发布《G20数字经济发展与合作倡议》,拓展了数据应用新领域,为全球大数据发展指明了方向。

  总而言之,大数据能够实现对数量巨大、来源分散、格式多样的数据进行关联分析,进而从中发现新知识和新价值。因此,人们把大数据形象地比喻成21世纪的“钻石矿”。

  第三,大数据拼出宇宙星空。大数据首先在科学领域获得了巨大的应用价值,举一个著名的例子。图灵奖获得者、著名大数据专家Jim Gray,在2002年,推出了一个叫做万维天文望远镜项目,英文叫WWT,World Wide Telescope。这个项目借助大数据技术,将世界上各大机构的天文观测数据,如美国宇航局、哈勃空间望远镜,甚至普通天文爱好者拍摄的星空照片拼接起来。通过视觉增强引擎技术,将这些大数据信息拼接成为一个“无缝数字宇宙”。这个成果对全世界通过互联网免费开放,所以天文爱好者可以利用它研究天文数据,甚至专业人士也可以利用它来研究天文数据,不需要再去预约天文台观测。

  第四,大数据——社会发展的新石油。2012年3月,美国政府发布了《大数据研究和发展倡议》,当时还把大数据称作“未来社会发展的新石油”。短短五年后的今天,大数据就已如空气般渗透到我们日常生活的方方面面。举一些熟悉的例子,我们出行前习惯查询百度或者高德地图,选择一条最佳出行路线;越来越多人喜欢使用智能手表或者手环等可穿戴装备,因为这些产品能够记录热量消耗、睡眠时间、行走路径等信息,通过对数据的分析,为人们的身体健康状况提供各种参考。

  再比如说,基于大数据分析的人脸识别付费,一直是互联网金融领域努力开发的项目。消费者不需要带现金和银行卡,用手机面部识别就可以作为付款凭证。有人会担心人脸被伪造,那么如何防范和避免财产损失呢?应该说它不是一种普通的照相机,或者说拿一张照片来扫描就可以的。它是采用的一种3D活体红外技术,这项技术会从人脸的某一个侧面、某一个角度,提取数百个不同的点,通过大数据分析进行交互的验证。这样的例子很多,这些例子都在说明大数据与我们的生活越来越紧密,大数据掀起的风暴已涉及到生活的各个角落。

  二、大数据,大价值——大数据开辟提升治国理政能力的新途径

  第一,大数据成为国家重要战略资源。牛津大学教授迈尔·舍恩伯格在《大数据时代》一书中有这样一段论述:“大数据是人们获得新的认知、创造新的价值的源泉,还是改变市场、组织机构,以及政府与公民关系的方法。”在全球信息化快速发展的大背景下,大数据已成为国家重要的基础性战略资源,运用大数据推动经济发展、完善社会治理、提升政府服务和监管能力正成为趋势。

  2012年,美国推出“大数据研究与发展倡议”,将大数据作为国家重要的战略资源进行管理和应用。同年,联合国推出“数据脉动”计划。2014年,欧盟推出了“数据驱动的经济”战略,倡导欧洲各国抓住大数据发展机遇。

  第二,实施国家大数据战略,全面实施促进大数据发展行动。有关数据显示,目前我们国家互联网、移动互联网用户规模居全球第一,拥有丰富的数据资源和应用市场优势。举个例子,深圳一个市的手机用户使用量,比欧洲许多国家的手机使用量还要高。所以中国是移动互联网数据的大国。根据社会科学文献出版社《大数据蓝皮书》的数据,到2020年,全球数据总量将达到40ZB,这是什么概念呢?1ZB 大约是1万亿GB。中国的数据总量将会超过8000EB(1EB =10亿GB),基本上是21%的数据将会在中国,届时中国将成为世界第一数据资源大国和全球数据中心。所以说,大数据时代将给我们提供一个千载难逢的机会。

  党的十八大以来,以习近平同志为核心的党中央高瞻远瞩,推出一系列国家战略。党的十八届五中全会提出“实施国家大数据战略”,把大数据作为一个国家战略明确地提出来。“十三五”规划中明确指出“把大数据作为基础性战略资源,全面实施促进大数据发展行动,加快推动数据资源共享开放和开发应用,助力产业转型升级和社会治理创新。”2015年8月,国务院印发了《促进大数据发展行动纲要》,作为大数据发展国家级的顶层设计,为我们国家从“数据大国”到“数据强国”描绘出一张清晰的蓝图。

  可以说,这一系列重大举措,使利用大数据提升我们治国理政能力成为一种可能,下面我们就此做进一步分析。

  1.大数据促进社会生产力的发展,推进资源配置科学化。大数据应用的核心是预测,准确的预测将使资源配置更加科学合理,使生产和流通环节的决策更加精确、效率更高,从而为行政决策提供重要参考依据。举个例子,我们在网络上经常听到或者看到一些词叫做“蒜你狠”、“姜你军”,这是一些诙谐的说法,它是说在某一个地区某种农产品的价格突然成倍地增长。这种现象应该说是反常的,它对于社会稳定、经济增长都有破坏性作用。能不能避免这样一种现象?在大数据时代,我们就有很多种可能性。比如说,通过遥感技术来估算某种农作物的种植面积,它不需要去量了,直接通过遥感自动地识别,就可以来精准地来估算出种植的面积。从而再根据对农作物病虫害情况和对气候情况的观测和分析,就可以大致地算出这种农作物的产量来,从而避免不必要的经济损失。因此,也有人说,大数据的应用,赋予了“实事求是”新的内涵。

  2.大数据推动政府治理体系、治理能力现代化。大数据将提升惠及民生的社会服务质量,助力“智慧城市”建设,促进社会治理精准化。说到“智慧城市”,“智慧”的英文Smart,体现着“以人为本”,离不开大数据、互联网技术的应用和支撑,预期目标是提升政府在人居环境、健康医疗、养老服务、文化教育等民生领域的服务质量,实现城市建设和公共服务的精准化和智能化。

  2012年6月,上海推出了国内第一个政府数据开放平台“上海政府数据服务网”。此后,北京、武汉、无锡等城市的数据平台纷纷上线。2016年底,由交通运输部主导建设的“综合交通出行大数据开放云平台”(出行云)上线运行,成为我国首个交通运输领域的大数据开放平台。建设这些一体化政务服务开放平台,不仅打通后台数据流动环节,“让数据多跑路,让百姓少跑腿”。

  此外,借助大数据实现政府权力清单和责任清单的透明化管理,促进政府简政放权、依法行政。在企业监管、质量安全、环境保护、食品安全等领域将违法失信、投诉举报、消费维权等数据进行汇聚和关联分析,统一公示企业信用信息,预警不正当行为,提升政府决策和风险防范能力,支持加强事中事后的监管和服务,从而不断提高治理体系和治理能力现代化。

  3.大数据将不断激励创新,推进产业发展专业化。来自IDC等专业机构的数据显示,2017年,全球大数据核心产业规模将超过300亿美元。中国信息通信研究院也给出了相关的调研测算报告,2016年我国大数据核心产业的市场规模达到168亿元,2017--2018年还将维持40%左右的高速增长。大数据持续激发商业模式创新,不断催生新业态,已成为互联网等新兴领域促进业务创新增值、提升企业核心价值的重要驱动力。

  在今年5月26日召开的2017年中国国际大数据产业博览会上,3000多家参展商,带来1000多项全球前沿的数据产品、技术和解决方案。比如说,现在最流行的共享单车、网约车,背后离不开大数据的技术支持。也可以说,都是大数据驱动的新的商业模式。摩拜单车正是牢牢抓住了“大数据”这个核心,实现服务的精准化和运维的精细化。

  下面我们来看一段视频。这是摩拜单车从2016年8月,大概半个月的时间,在北京的部署情况。每一个亮点,都是一次开锁行为。可以看到,从北向南逐渐地展开。这是深圳2016年11月19日一天摩拜单车的使用情况。可以看出亮点遍布整个深圳,深圳是一个长条带的城市,非常壮观。

  刚才我们看到的这段视频画面,展示的一个是北京摩拜单车投放的过程,一个是深圳使用的情况。所以说,通过GPS定位不仅可以方便用户预约、使用车辆,也使企业从中获得大量的用户数据,比如骑行方式、热门地点、高峰时段以及遗失损毁情况等等,通过对这些看似庞杂的内容做大数据分析,可以得出最优化的单车投放时间、地点、数量以及维护需求等信息,从而为企业的运维和科学决策提供参考。

  通过以上分析,我们可以看出,大数据不但能够揭示传统技术难以展现的关系,还能为有效处理复杂社会问题提供新的手段,从而开辟了提升治国理政能力的新途径。总之,我们希望能够借助大数据之手,更好感知社会态势、畅通沟通渠道、辅助决策施政。

  三、用大数据为监督执纪插上科技的翅膀

  以上我们分析了大数据如何提升治国理政能力,那么大数据对全面从严治党,推进党风廉政建设和反腐败工作,能够发挥哪些积极作用?下面我与大家做一些分析。从三个方面阐述。

  第一,“数据铁笼”强化权力监督制约。运用大数据技术扎紧制度的笼子,使权力运行全程数据化、透明化,优化权力运行流程和办理环节,强化权力的监督制约,从而实现权力在阳光下清晰、透明、规范运行。

  举个例子,贵州省经过2年时间的试点,从2017年5月正式在全省范围内全面推广“数据铁笼”工程建设。通过运用大数据,规范权力的使用,提升政府部门服务市民的效率。比如说,在“数据铁笼”试点单位贵阳市道路运输管理局,办理每一项从业资格审查和证件发放,都需要经过“数据铁笼”——大数据融合平台研判。该平台会对相关数据整合,流程全面监控,一旦出现异常数据及不规范流程操作,平台就会报警。工作人员在3天内进行自查,若无合理的情况说明,3天后平台就会自动将异常情况推送给上级负责人,运用大数据实现对行政权力运行的实时监控、全程监督。

  第二,大数据可以提供问题线索和证据。现在每一天,我们的工作、学习、生活实际上都留下了一串数字的烙印,我们每个人身后都拖着一条长长的由数字信息构成的“尾巴”。信息化已经渗透到我们生活的方方面面。有关部门依法运用大数据收集线索、分析取证,使大数据为监督廉洁用权插上科技的翅膀。同时,大数据也为社会监督提供更多可能性。比如说,前一段时间,有一条新闻报道:为整饬节日期间公车私用问题,有关部门采用了一些科技的办法,比如说,专门对ETC设备后台进行数据核查。在系统中输入单位名称和查询时间段等信息,该单位在这个特定时间段内,所有公务用车出入高速的信息都将“有迹可循”。还有些单位通过“GPS定位”等信息化技术,对公务用车进行实时轨迹跟踪,加强规范管理。通过这样一些技术手段,让“公车私用”无处可藏。

  除此之外,有关部门还利用增值税电子底账管理系统,收集“四风”问题线索。以往检查公款吃喝问题,采用的都是到餐馆一张一张“点”发票的“笨办法”。有了这样的后台数据系统,不仅可以定点检查某一餐馆一段时间内所有发票记录,还能查出特定时间段,给特定机构的发票记录。这样的例子还有很多。总之,大数据的飞速发展和广泛应用,它时时刻刻在告诫手中握有公权力的每一个人,“手莫伸,伸手必被捉”。

  第三,运用大数据分析腐败现象背后的规律。掌握了规律以后,就可以做到提前预警。反腐败既要治标又要治本,通过对腐败问题和线索进行大数据分析,找出背后的关联和规律,梳理出腐败问题易发多发的领域、地域、时间节点等等,通过采取制度防范、预防提醒等措施,避免腐败问题的再发生,由治标向治本迈进一步。

  比如说,针对节假日期间,公款吃喝、公款旅游、收受礼金易发高发等问题,中央纪委监察部网站通过早打招呼、早提醒等方式,提前预警预防,畅通举报渠道。开通节假日期间违反“中央八项规定精神”监督举报曝光专区,引导和方便群众、媒体参与社会监督,使监督之网越织越密。

  除此之外,有关部门利用大数据织牢反腐败国际追逃追赃的“天网”。2015年,中央正式启动“天网”行动以来,通过大数据技术监测大额资金异常流动,及时发现外逃人员可疑情况,提早进行分析评估并采取必要的措施。根据中央纪委监察部网站的报道,“天网”行动中百名红通人员,截至目前,已经有47人被追回。可以说,大数据助力“天网”越收越紧,让已经潜逃的无处藏身,让企图外逃的丢掉幻想,决不让腐败分子躲进“避罪天堂”!

  总结一下:我们在用大数据解决面临的困难的时候,要树立大数据的这种思维。第一个方面,要用大数据解决问题就要有数据,要打破数据孤岛,让数据能够实现共享。这是中央政府最近一段时间极力推动的一件大事。信息系统的整合共享工作正在紧锣密鼓地展开,这项工作最终的成效,就是“让数据多跑腿,让百姓少跑腿”,服务方便大家。第二个方面,就是要让数据说话,养成让数据说话、听数据说话的习惯。同时加强对预测结果的监测,及时进行调整。第三个方面,就是要用好数据来服务人民。我们每一个人都应有自觉去建立起基于用数据说话、用数据决策、用数据管理、用数据创新的新思路!

  【互动环节】

  杜小勇:下面还有一点时间,可以和大家进行一些互动。关于大数据大家还有什么关心的问题,可以提出来,我和大家一起进行讨论交流。

  1.观众:老师,您好!您刚才提到,在大数据时代,首先就是要有数据,要打破数据孤岛。那么,我们如何实现信息公开和资源共享?

  杜小勇:这个问题很好!2016年10月9日,习近平总书记在主持中央政治局第三十六次集体学习时指出,“我们要深刻认识互联网在国家管理和社会治理中的作用,以推行电子政务、建设新型智慧城市等为抓手,以数据集中和共享为途径,建设全国一体化的国家大数据中心。”总书记提了非常高的要求。这为打破数据孤岛,实现信息共享指明方向。

  可以说,政府数据是我国所有数据中质量最高的一部分。目前,我国信息数据资源80%以上掌握在各级政府部门手里。这些数据的充分运用,不仅能够有效提升社会运行效率,还能为企业提供创新“原材料”,激发巨大的商业价值。

  2017年2月,中央全面深化改革领导小组第三十二次会议审议通过了《关于推进公共信息资源开放的若干意见》,要求着力推进重点领域公共信息资源开放,释放经济价值和社会效应。2017年5月,国务院办公厅印发《政务信息系统整合共享实施方案》,明确要求“推动开放,加快公共数据开放网站建设”。

  落实中央精神,各地政府数据向社会公众开放步子加快。我们来看一组数据:今年年初成立的贵阳市政府数据开放平台,在国内率先实现“领域、行业、部门、主题、服务”5种数据分类,方便公众检索、定位、发现所需要的数据;北京市政府部门公共数据开放单位名单激增,预计到2020年将超过90%,数据开放率超过60%,凡是跟社会、市民、法人、社会管理相关的部门都要进行数据开放……这些信息平台所蕴含的数据量非常巨大,但是如果它们存储在各自相应的系统里面,不遵循标准协议,想要把这些数据用通用的方式挖掘出来就非常困难,这些数据就形成了“信息孤岛”和“数据烟囱”。

  可以说有了数据是第一步,怎么打破数据孤岛,让数据互联互通共享起来,这是当下重要的一步。尽管还有很长的路,但这是必须跨出的第一步。

  2.观众:老师,您好!您刚才提到,在大数据时代,政府部门正在逐步放开数据。老百姓可以在网上查到这些数据,但这些数据都是一串串比较枯燥、抽象的数字和概念,老百姓并不能很好理解,请问如何才能让这些数据更加“接地气”,让老百姓更好地运用这些数据?

  杜小勇:当前,虽然中央政府和一些地方政府设立了数据开放平台,但是数据开放本身不是目的,重要的是让居民享受数据开放带来的便利。

  现在,越来越多的人习惯用自己熟悉的第三方应用APP获取公共信息或服务。打开微信,可以查询社保信息和学历信息;打开支付宝,可以预约看病挂号和查询购房网签;打开百度地图,可以了解公共交通实时位置和车位的情况。政府部门也应该考虑引入并利用第三方应用程序接口,能让“看不懂”的政府大数据变得“接地气”。简单说,数据是冰冷的,开放数据以后,直接来查询的当然是可以的,但是只是其中一部分,更多的是第三方公司利用这个数据来开发一些APP应用,让我们直接更接地气、更方便地使用这些服务。这是我的理解。

  3.观众:我想请问,在大数据时代,个人信息隐私又该如何得到保护?

  杜小勇:实事求是地说,大数据给信息安全带来了新的挑战。的确,如今几乎人人都是数据的记录者。用健身软件,看自己跑了多远,用时多少,消耗了多少卡路里。当你把这些数据同步到网上,不就是在主动“泄露”隐私吗?一方面,我们需要改变保护“隐私”的观念;另一方面,企业也在记录我们的数据,我们外出使用滴滴、摩拜、ofo等共享方式出行,都会记录你的行程,还有移动通信公司,我们在什么地方和谁通话等等都被记录。当然,从个体到国家的信息安全理应得到保障。

  解决这个问题,我想需要两方面:第一方面,在全社会加强宣传、树立隐私保护的观念,提高防范和信息安全的个人意识;第二方面,在技术层面,加快构建关键信息基础设施的安全保障体系,加强信息安全技术的自主知识产权研发,推动国内IT技术产业和网络安全行业的发展。第三方面,我想是需要加快推动和完善有关大数据信息保护的法律制度。现在存在一些“边缘”的情况,我们的数据被一些不法商家买卖,每天接到很多骚扰电话,这些都需要我们尽快地出台相关的信息保护的法律制度,使得我们的信息安全、隐私保护有法可依。

  总之,从观念、技术、法律、管理多个维度来共同推进大数据的信息安全和隐私保护。我想这是一个综合治理的道路。

  杜小勇:感谢大家的提问!

  最后想说,让我们以积极的态度去拥抱大数据!通过加快大数据技术和应用,促进社会公平公正、健康有序发展,不断推进国家治理体系和治理能力的现代化。我们期待基于大数据的智慧城市、智慧生活能够早日到来!今天我们就讲到这里。

  谢谢大家!

责任编辑:qinpeng