“数据治国”的三个关键理念(3)

“数据治国”的三个关键理念(3)

——从互联网思维到未来治理图景

互联网思维

凯文·凯利指出,云计算时代的最大文化动向就是永远在线。⑦人与人、人与设备、设备与设备时时刻刻的连接,将以7×24小时的方式源源不断地产生数据。特别是web2.0之后的用户生成内容(UGC),包括社交网络(SN),是大数据形成的重要原因之一。因此,要做好大数据治理,还必须深入理解互联网思维。

关联思维:万物皆相关。在气象经济学界流行这样一条“德尔菲气象定律”,即气象投入与产出比为1:98,也就是说,在气象信息方面每投入1元,就可以得到98元的经济回报。一个典型的例子是,气温每降低1℃,北京市燃气供暖系统日消耗天然气将增加约200万立方米。如果提高气象预报的精度,实时对供暖系统进行合理调度,无疑将有效降低能源消耗,节省很大一笔经费开支。

这就是大数据的价值所在。通过挖掘海量数据,呈现一个充满关联的世界。诚如舍恩伯格所预言的那样:“将世界看作信息,看作可以理解的数据的海洋,为我们提供了一个从未有过的审视现实的视角。它是一种可以渗透到所有生活领域的世界观。”⑧

在商业案例中,你可能听说过啤酒与尿布、搜索词与流感趋势、女儿怀孕与广告传单的故事;在国家与社会治理中,也有很多运用数据相关性的成功案例。例如,纽约市警方开发了一款电子数据地图——CompStat,通过分析案件发生历史与发薪日、体育赛事、天气变化、假日等变量的相关性,预测最可能发生罪案的“热点”地区,并预先在这些地区部署警力。应用这套系统后的次年,该市犯罪率就出现了明显的下降,凶杀案发生数量创下了50年来最低。⑨

中国海关的“电子口岸”整合了工商、税务、海关、外贸、外汇、银行、公安、交通、铁路、民航、国检等十几家部门的数据。数据之间实时的联网分析,使“电子口岸”在加快报关速度、高效打击不法分子的同时,更成为中国经济的“气象预报台”,能够为国家宏观经济调控提供非常精细、全面的决策支持。

大数据之所以能发掘规律、作出预测,靠的是对相关关系的把握。我们常说“清明时节雨纷纷”,这个结论并不是逻辑推导出来的,而是人们通过多年观察,发现以往每年这几天总是下雨比较多,于是总结出了这样一个朴素的规律。同样的道理,计算机可以在海量的数据上运用数据挖掘等办法,自动地发现一些相关性,然后通过相关关系来预测事情发生的可能性。例如,从公交车辆运行的点数据推断一个路段发生拥堵的可能性,从纳税人的异常数据特征发现偷税漏税的可能性,从人们上网检索的关键词推断流感爆发的可能性,等等。

尽管因果关系是最深刻的一类联系,但是我们很多时候并不能获得。这种情况下,我们是无所作为呢,还是也可以有所作为?答案是明显的,只要我们知道一些相关关系,我们也可以进行预测。相关关系也许不能准确地告知我们某件事情为何会发生,但是它会提醒我们这件事情正在发生。在许多情况下,这种提醒的帮助已经足够大了。如果电子医疗记录显示橙汁和阿司匹林的特定组合可以治疗癌症,那么找出具体的致病原因就没有这种治疗方法本身来得重要。同样,只要我们知道什么时候是买机票的最佳时机,就算不知道机票价格疯狂变动的原因也无所谓了。因此,我们常常说在大数据时代,“是什么”比“为什么”更重要,相关关系比因果关系更重要。

去中心思维:走向网状社会。互联网时代最鲜明的特征是去中心化、平等化。因为互联网在本质上是反垄断的:开源软件社区的发展打破了少数大企业对技术的垄断,信息公开和开放数据打破了信息垄断,云计算等租赁业务的普及打破了资源垄断。

尤其在传播领域,我们可以非常清楚地看到这样一个去中心化的趋势。在报刊、广播、电视流行的传统媒体时期,人们只能听到中心的一个声音。后来,博客的诞生使得每个人都可以发表自己的想法。较之于传统媒体,这是个巨大的飞跃。但是个人的想法能让多少人听到,却依然取决于门户网站的编辑(即自己发表的博客是否被精选)。随着微博的兴起,所有人可以在一个统一的公共讨论空间讨论,更重要的是这个讨论空间,不再依靠一个中心,而是靠着兴趣、关系的链条自动生成、壮大,编辑的力量被前所未有地削弱了。

责任编辑:蔡畅校对:总编室最后修改:
0

精选专题

领航新时代

精选文章

精选视频

精选图片

微信公众平台:搜索“宣讲家”或扫描下面的二维码:
宣讲家微信公众平台
您也可以通过点击图标来访问官方微博或下载手机客户端:
微博
微博
客户端
客户端