大数据分析下的中国社会舆情:总体态势与结构性特征(4)

大数据分析下的中国社会舆情:总体态势与结构性特征(4)

基于百度热搜词(2009—2012)的舆情模型构建

三、大数据舆情模型构建的有效性检验:以“社会压力”指数为例

基于百度搜索词的大数据分析方法所构建起来的、反映社会舆情总体特点和态势的舆情指标模型是否科学及有效? 我们不妨通过从2009年开始运行的“人大—方正舆情监测分析系统”所采集的另外一套社会舆情的分析逻辑体系中的相关指标———社会运行压力指数来进行有效性检验。

在这套舆情监测分析系统中,社会运行的压力指数被定义为单位时间段内舆情热点事件的数量以及每一舆情事件的单位烈度。因为从社会管理的角度看,每个舆情热点事件对于社会而言,相当于是一个需要耗费管理资源的“火药桶”;而每个事件的舆情烈度指数则代表着每个“火药桶”的TNT当量。因此,将得到一定烈度(“人大—方正”系统的设定值为舆情烈度值60分以上的舆情热点事件)的舆情事件的数量和质量指标加总合成的指数,是衡量中国社会舆情压力或社会紧张系数的重要指标之一。

(一)“人大—方正舆情监测分析系统”所显示的社会运行压力指数

基于“人大—方正舆情监测分析系统”对2009—2012年上述两项舆情指标的测算结果见图8。

从图8可以看出,2012年60分以上的网络热点事件总计455个,超过2011年(349个)一百多个,而2011年为274个,2009年为248个。总体来看,2012年相较于2011年出现了显著增长,事件个体数量增长了106个,年增长率为30.3%,相较于以往三年,中国社会舆情整体压力呈现出逐年提升的加速度趋势。这种趋势的出现,一方面说明微博等社会化新兴媒体的崛起改变了传统的社会话语言说格局和社会话语权分布,草根阶层掌握了更多的社会话语权和话语平台;另一方面也的确说明我们目前所处的社会现实及存在矛盾进一步激化的趋势,为社会管理者进行相应的社会改革尤其是政治体制改革提供的空间和时间越来越有限。

9

如果我们将每月的舆情事件所对应的舆情烈度进行加权,可以得到每月的舆情总指数(见图9),然后再计算出该月度平均每个事件的舆情烈度指数(见图10)。从图9、图10可以看出,与月度舆情事件的个数相对应,四年来整体的舆情态势呈现出逐年上升的趋势,尤其是2012年的增长趋势最为明显,这便在相当程度上证明了中国社会舆情压力在不断提升的社会现实。

10

(二)“人大—方正舆情监测分析系统”与百度热搜词大数据分析模型下相关指标的比较

如果以“社会压力”这一舆情指标为例,将基于百度热搜词的大数据分析的相关结果与基于“人大—方正舆情监测分析系统”所获得的相关结果进行比较分析,我们可以很明确地看到两套数据。虽然数据来源和处理逻辑各不相同,但在反映社会舆情的涨落变化、总体态势方面却惊人的一致。

由于两组数据均进行了等间距的标准值处理,我们对两组数据间的相关度进行了皮尔逊(Pearson)相关分析,数据测定结果表明,这两组数据间的相关系数r=0.964,属于极为强烈的高度相关(见表1)。

11

上述关于“社会压力”两组舆情指标的相关分析的数据测定结果在相当程度上表明:本文所构建起来的见微知著、基于百度热搜词的大数据分析模型是有效的和科学的。

责任编辑:单梦竹校对:总编室最后修改:
0

精选专题

领航新时代

精选文章

精选视频

精选图片

微信公众平台:搜索“宣讲家”或扫描下面的二维码:
宣讲家微信公众平台
您也可以通过点击图标来访问官方微博或下载手机客户端:
微博
微博
客户端
客户端
京公网安备京公网安备 11010102001556号