2、“垃圾”数据如何重新发光?
阿里巴巴基于淘宝推出的网络零售价格指数(iSPI),以网络交易的实时数据为基础,反映食品、烟酒及用品、衣着等十个商品与服务类别的网络零售价格和交易量的变化趋势。该指数与官方CPI环比指数呈现联动关系,并在关键转折点呈一定领先态势,可以辅助洞悉通货膨胀、经济增长、居民消费等宏观经济指标。
“传统的经济统计在未来将大数据化。”冯煦明认为,以往生产统计更多地停留在行业层面,或局限于规模以上企业,而未来可能是针对所有企业;传统的消费统计主要基于抽样调查,而未来可能具体到每个家庭或个人;传统的价格统计中仅包含千种商品、涉及几万个调查销售网点,而今后可能是几万种商品、所有的在线销售商和大部分线下销售网点。随着大数据技术的成熟,“样本即总体”将成为趋势,抽样越来越不重要。
“相对于传统经济统计而言,大数据引发的变革主要表现在四个方面:更快、更准、更广、更细。”冯煦明说,这些特性有益于未来行业政策和宏观经济决策。
随着计算机和互联网的普及以及电子商务的发展,越来越多的经济行为被记录下来。随着大数据相关技术的成熟,公共部门和私人企业过去积累的大量“垃圾”数据有可能重新焕发光彩。比如用交通事故和犯罪数据指导警力布局、用消费和税收数据指导收入分配、用客流量数据指导铁路和民航调配、用互联网关键词传播数据进行流行病预防等等。
赵彦云认为,在大数据时代,政府可以在国家层面建立数据集中平台,统筹管理经济社会的各项数据,包括经济社会统计数据的空间化,覆盖社会生活的方方面面,可以基于服务业各个部门管理的行政记录、业务统计、监管信息,建设服务业统计核算的科学统计方法体系。
“统计分析不能就数据论数据,还要追根求源,深入分析引起数据变化背后的原因。要做到这一点,就要求我们既要注重宏观分析,也要注重微观分析。”国家统计局局长马建堂说。
传统的平均值指标,掩盖了地域和个体的具体发展趋势。例如,如果把失业率当成全国性问题来处理,肯定是错误的,因为随着地域、性别及教育程度变化,就业趋势会有很大差别。但这些问题没有一个体现在失业率上,通过失业率制定的政策一开始就走错了方向。
专家表示,这些先行指标对于小企业或个人来说作用甚微。个人决定现在是否创业或买房时,不应该去参考失业率或者国家住房数量。对于想开一家服装店或者餐馆的人来说,CPI往往没有任何参考价值。相反,企业家应该注意当地市场动态及本行业的趋势。在30年前,这类统计可能相当困难,而今天获取这些信息只是在电脑上花几个小时而已。在大数据时代,我们需要的是专门为政府、企业、社区和个人的特定需求而定制指标,这在现在成为可能。
3、GDP如何“拥抱”大数据?
2013年11月19日,国家统计局与百度、阿里巴巴等11家企业签订了大数据战略合作框架协议。此举目的在于共同推进大数据在政府统计中的应用,不断增强政府统计的科学性和及时性。马建堂指出,过去传统的统计方式,是由统计专业人员设计统计表格,从名录库里找到企业去调查生产数据。但是,在大数据时代,有很多商业主体在名录库里找不到,却有交易活动和交易数据。这些数据是现成存在的,而且是海量的、非结构化的、非标准化的。统计部门要利用已经存在的数据,这类数据每天都可以获取,是统计的宝藏。
“当前,一个大规模生产、分享和利用大数据的时代正在来临。这是浩浩荡荡,不可阻挡的历史潮流,谁拥有了大数据,谁就占领了制高点,取得了主动权。”马建堂表示,就政府而言,大数据必将成为宏观调控、国家治理、社会管理的信息基础。
然而,大数据的统计并不是那么简单就能实现的。赵彦云指出,在目前各部门信息数据共享平台上,行政记录、业务统计、活动统计、财务信息等,都没有完成可以适应大数据分析的转化。
“指标不一致、指标口径不一致、时间不一致、空间不一致、指标体系不一致、分类不一致、编码不一致等,如此杂乱的数据库,基本上连常规的统计整理、统计描述和分析都无法做到。”赵彦云说,在大数据时代,我国需要推行共享、合作、协同的理念,使得政府职能部门打破传统各自为营的约束,真正开放共享部门数据,实现整体利益的最大化。长期以来,我国各部门过多关注自身利益,所谓共享工作也不过是应付交差。但在大数据时代,这将会直接限制我国经济社会的发展与产业升级。
“需要指出的是,大数据之于传统经济统计,是补充,而非替代。”冯煦明说,横向来看,传统统计方法在经济增长、税收、贸易、收入分配等领域的统计上具有主导优势,而大数据在物价、通货膨胀、失业率、消费等方面的统计上更具有优势。
那么,在大数据时代,GDP统计指标应该如何完善呢?对此,专家认为,应该优化GDP核算数据的来源,保证GDP核算数据的准确性与真实性。今后GDP核算的结果不能仅有总量和速度,还必须有各个产业、行业、类型和不同地区、不同区域的细项、分项指标数据,以此来满足不同对象、不同行业的个性化需求。政府统计将由对“宏观”的把握转变为对“微观”的运用,GDP将逐步成为宏观和微观都适用的大众化指标。同时,应该更多地通过图形、图像、地图、动画等更为生动、易懂的方式来展现数据的大小,诠释数据之间的关系和发展趋势,为人们提供易于理解、便于使用的结果。(光明日报记者 陈 恒)
名词解释
大数据(big data),或称巨量资料,指的是所涉及的资料量规模非常巨大,以至于无法通过目前主流软件在合理时间内撷取、管理、处理并整理成为帮助企业经营决策的资讯。
在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》一书中,大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据的方法。大数据的4V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。
物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器,无一不是数据来源或者承载的方式。(陈恒整理)
已有0人发表了评论