大数据时代的社会管理与产业发展

核心提示:大数据服务业属性大于大数据软硬件制造业,对其它产业的影响大于对信息产业的影响,其社会效益大于直接的经济效益。麦肯锡曾经总结过,只要用了大数据,美国的保健一年能节省三千亿美元,欧洲的管理一年能节省两千五百亿欧元,服务提供商一年能赚六千亿美元。互联网+包括消费互联网、产业互联网和金融互联网,其中产业互联网化是互联网+行动计划的重点。

大数据的挖掘提升了决策的智能化水平,支撑了社会管理和智慧城市的建设跟产业升级,实现了“众智成城”,信息技术和新材料技术、能源技术、生物技术、先进技术的结合,催生了产业互联网时代。互联网思维驱动了产业变革,互联网+对于处于经济发展新常态的我国来说,既是机遇,更是挑战。维基百科对于大数据是这样定义的,没有办法在规定的时间里,用常规的软件,对其内容进行抓取、管理和处理的数据集合。当然,并不是说只有大数据才有用,中数据、小数据也是有用的,只不过大数据的代表性更强。今天,我们就“大数据时代的社会管理与产业发展”谈四个方面的问题:一是信息化催生大数据;二是大数据在社会运行方面的应用;三是大数据的产业应用;四是互联网+智能制造。

一、信息化催生大数据

说到信息化,要说到集成电路的发展规律,即:摩尔定律,其内容为:当价格不变时,集成电路上可容纳的元器件的数目,约每隔18-24个月便会增加一倍,性能也将提升一倍。过去30年,汽车引擎技术的进步,使汽车速度提升了200%,同期的集成电路使计算机的速度提升了1万倍,内存价格下降了45000倍,硬盘价格下降了360万倍。如果汽车价格能够跟集成电路硬盘同等速度下降,那么今天我们买一部新车,只要1.01美元;如果汽油的性能能够以集成电路那样的速度发展,那么1升汽油就可让飞行器绕地球飞573圈。也就是说,目前还没有哪一种技术有集成技术发展得这么快。到2018年,预计一个CPU里的晶体管数目可达300亿个,超过人的大脑的细胞数。除了集成电路,软件也越来越重要,软件运行环境从单机发展为网络,从互联网环境发展到普适计算环境,用户数量和复杂度剧增,或要求轻量化和云化。1972年,阿波罗登月飞行器的软件只有4K的代码,雪佛兰、奔驰新车的软件代码规模超过1000万行,空客飞机软件有10亿行代码,Window操作系统超过3000万行代码,安卓、苹果的操作系统有上百万行代码。软件加速向开源化、智能化、高可信、网络化和服务化方向发展。1975年,美国航天总局500万美元买的一台超级计算机,其能力还不如现在我们400美元买的Iphone4。1985年,美国国防部更新了一部全世界最好的计算机,现在它的功能赶不上Ipad2。在1997年,买一个1G的闪存卡,要花将近八千美元,现在只需0.25美元。就是说,信息技术的进步,带来功能的提升和成本的下降。

(一)云计算。20世纪80年代说的是数据库,20世纪90年代说的是互联网数据中心,现在说的是云计算、云服务,未来更重要的是数据服务。随着信息化的发展,很多单位都要建信息化系统,可是现在建的,过一段时间就过时了,每一个单位的实际利用率并不高,由此,就考虑能不能依托第三方来建,利用第三方持有的服务器、存储器、网络,数据等一些东西,把所需信息数据存进去。第三方公司将其基础设施作为服务对外提供,不但如此,还提供一些存储器、服务器,一些中间件、开发工具、数据库,提供需求方所需的一些软件。更进一步地,对于很多中小企业来讲,他们不会用第三方所提供的这些工具,怎么办呢?那就直接给它提供已经做好的软件,倘若企业很小,买不起开发好的软件,可以通过租赁的形式,获得所需服务,还可以利用数据库里的数据开发所需服务。这跟刚开始发明电的时候类似,一开始是企业等用电单位自建发电站,可是后来发现没必要,用电厂的电就行了。现在,信息化也到了这个阶段,不一定所有的信息化都要自建,可以采用集约式的方式,大大节省投资,高效利用。

(二)视频。美国的YouTube,是世界上最大的视频网站,每分钟有100小时的视频节目上传。2016年,互联网的流量会达到每秒720TB,互联网每3分钟可以传送360万小时的视频。最近,美国YouTube网站上传的视频量已经超过美国三大电视台(ABC、NBC、CBS)自1948年开播以来,连续播送所有电视的总和。就是说,网络的视频量比电视台的视频量要大的多,现在网上的视频已经占到互联网流量的一半。我国大概60%的网民在网上看视频。

(三)下一代互联网。互联网技术从70年代的TCP/IP,发展到90年代的WEB,到00年代的P2P/WEB2.0,以及现在10年代的Cyber-PhysicalSystem系统;互联网从最早收发邮件的联系平台,到可以上网下载文件的浏览平台,微博博客出现以后,互联网又是一个交互平台,也是一个工作平台;互联网从传数据,到传话音、传视频,到M2M;从有线,到无线,宽带、移动;从拨号接入到永远在线;从网络业务到电信业务、媒体业务、物联业务;从研究网络到商业网络,到泛在网络。整个互联网的发展才40多年,进入我国才20年,现在已经非常深入地影响到了我们的社会生活。2014年年底,我国互联网普及率已经达到47.9%,2015年有望超过50%,其中手机网民规模达5.57亿。移动互联网屏幕比较小,带宽也不如固定网络,资费也比较贵,但是发展更快,因为它具有碎片化、光纤化、私密化、娱乐化、互动性等特性。很多农民不一定会用PC,但是基本上都会用手机。通过手机可以知道用户的身份、位置,用户在线状态信息,用户终端和应用偏好、用户消费行为统计数据。手机可以提供很多服务。“苹果”上的应用有120万种,安卓上的应用有150万种。

移动通信为了适应移动互联的发展,发生了很大变化,20世纪90年代以前,用的是模拟电路交换,那时候手机很大,叫大哥大,只能打电话。现在大部分人用的还是2G,2009年我国已经启动3G,2013年年底,我国启动了4G,现在杭州已经有支持200兆的4G。在我国4G刚刚开始的时候,国际电信部门已经开始5G的标准化,5G意味着,在高速公路上开车,用无线可以下载10个G,在家里不用网线可以下载50个G。每一代移动通信都是革命的,移动通信十年一代。早年,我们的手机只能听和讲,看和写,现在可以触摸,里面还有地图,可以感知了,人机接口发生了很大变化。大部分人有手机可能是在20世纪90年代后期,2000年手机可以听MP3,2001年有彩屏,2002年有照相机,2003年有手写,2004年可录音,2005年能看电视,2006年有GPS,2007年上WIFI,2008年有触摸屏,2009年有传感器。2013年开始,手机有重力感应器,里面有陀螺仪,老人带上这种有陀螺仪的手机,在摔跤时,可以发短信给亲人或者给医院。手机还有光线感应器,白天不发亮,晚上发亮,一个人老花眼,看短信要靠近,手机就能检测到,并自动将字变大。福岛核事故以后,日本的手机加载了核辐射传感器。微软收购诺基亚之后,装有26种语音连到云端,你这边讲的是中文,朋友讲的是英文,按一下键,你讲中文,朋友听英文,朋友讲英文,你听中文。

2014年年底,在乌镇召开的世界互联网大会上,日本首富孙正义发言说,30年后,假设苹果公司还存在,那么苹果要卖Iphone32了,价格可能还是300美元,可是CPU的性能和存储器的容量将会是现在的100万倍,通信速度是现在的300万倍,可以存5000亿首歌曲,3万部电影。现在,谷歌搞可穿戴设备,摸一下眼镜镜框,就是翻页,眨一下眼睛,就可拍照。百度也做眼镜,在后面有一个摄像头,一边是收发器,将看到的景象送到云端,搜索之后,给以解释,实现了所见即所知。再有,盲人阅读的书本是凹凸不平的,网上的屏幕不可能凹凸,怎么办呢?戴一个指环,上面装有一个摄像头,手指指到哪里,就自动将其读取,甚至可以翻译出来。

习总书记说,信息资源日益成为重要的生产要素和社会财富,信息掌握的多寡,成为国家软实力和竞争力的重要标志。我们通常会把基础设施看作是一个城市的重要资产,今后数据也将成为智慧城市的重要资产。智慧城市的标准,主要包括两个大的方面:一是产业发展状况;二是社会管理和民生服务,以及老百姓是不是能参与到城市管理中来。

(四)感知大数据。随着信息化的发展,产生了大量的数据。其一,摄像头录制的大量数据。北京有80万个摄像头,只要走到街上,即便走的不远,一天至少也给你拍了八次以上。通常,一个城市的摄像资料要保存三个月,几十万个摄像资料要保存下来。

其二,国家有关机关部门产生的众多数据。拿2011年、2012年北京的数据对比看,一年增加了50%。

其三,政法系统收集的众多数据。浙江建成了全省法院的统一法庭管理平台,汇集了几百万案件和庭审录像,还开发了很多相关应用。比如,通过银行联网,一年找回了一千多亿被执行人赖的帐。北京检察院系统建立50万件案件数据。深圳公安局建立了信访综合平台,包括人员档案1.16亿份,电话档案1.39亿份,场所、车辆档案900多万份。

其四,公共服务部门产生的大量数据。国家电网累计产生的数据有5个P。原来,联通每个月开一个单子给用户交钱,用户说,这个月我没上那么多网,干嘛收我这么多钱,就是因为只有一个最终结果,没有中间记录,经常打官司,很难说服用户。因此,联通建立起了自动记录系统,详细地实时记录,现在移动、电信也都在这样处理客户信息。北京交通调度中心每天的数据增量30个G,存量20个G。到银行,数据就更多了。医院也是大数据,医院的病例堆积如山。

其五,网站的数据就更大了。在所谓的光棍节,淘宝一秒钟处理3.8万笔交易,在阿里平台上有超过100PB已处理过的数据,百度每天产生一个TB的日志,腾讯QQ的活跃用户超过8个亿,微信用户超过5个亿,压缩数据量之后,也超过100个P。新浪微博晚高峰时候,一秒钟接受100万次的请求。全世界的网民,1998年平均每个网民每月下载一兆,2008年平均每个网民每月下载1G,2014年平均每个网民每月平均下载10G。2014年和2015年,全世界互联网产生的数据量是有史以来累计到2013年所产生的数据量的总和,可以说两年等于一万年。现在是一个数据爆炸的时代。

归结起来,大数据的特征主要包括:一是量很大;二是变化很快;三是变异品种很多,有结构性的数据,像WORD文档,有非结构性的数据,像数据和照片;四是能有价值。应该说,大数据是价值密度很低的数据集,就是说,可能大数据里面大部分都是垃圾,如果不进行挖掘,那么全部都将是垃圾,我们所做的,就是从这些“垃圾”里找出有价值的东西,正所谓沙里淘金、海底捞针。

责任编辑:李贤博校对:总编室最后修改:
0

精选专题

领航新时代

精选文章

精选视频

精选图片

微信公众平台:搜索“宣讲家”或扫描下面的二维码:
宣讲家微信公众平台
您也可以通过点击图标来访问官方微博或下载手机客户端:
微博
微博
客户端
客户端