大数据时代的到来对人类的生活、工作与思维产生变革性影响,深刻改变着商业王国及公共管理等各个领域的面貌,“大数据”日渐成为各行业创新的助推器。当前中国网络舆情环境复杂,网络舆情危机时有发生,社会热点舆情事件和涉官涉政舆情事件不断涌现,造成社会民主生活和政治稳定间的不平衡等诸多影响。大数据背景下的网络舆情正在发生巨大的变化,网络舆情管理变得日益复杂和重要,如何抓住大数据时代为网络舆情管理变革带来的机遇,以“大数据观”变革传统网络舆情管理思维,准确把握网络舆情的内在特征及其在演变过程中的潜在规律,实现网络舆情管理在思维、模式以及技术上的创新,对于新形势下做好网络舆情引导工作,加强和改进网络内容建设,具有重要的理论意义和实践价值。
一、大数据时代必然要求网络舆情管理变革
“大数据”概念最早在20世纪80年代提出,2011年麦肯锡咨询公司发布其研究成果《大数据:下一个创新、竞争和生产率的前沿》,使这个概念得以大范围推广。2012年3月29日,奥巴马宣布将投入2亿多美元启动“大数据发展和研究计划(Big Data Research and Development Initiative)”,将“大数据战略”上升为国家战略。近两年,大数据备受学术界、产业界和政府部门的关注,成为国内外强有力的前沿词汇。大数据又称巨量数据、海量数据、大资料,指的是所涉及的数据量规模巨大到无法通过目前主流软件工具在合理时间内进行抓取、管理和处理的数据集合,是必须通过深度挖掘、计算、分析才能创造价值的海量信息。大数据在体量、复杂性、产生速度及价值密度四个方面都极大地超越了传统的数据形态,具有4V特征:大量(Volume)、多样(Variety)、高速(Velocity)、价值(Value)。数量庞大的网民通过论坛、微博、微信等多种途径方便快捷地发表言论观点,网络舆情的规模和复杂性急速上升,体量巨大而价值密度低,其内在特征的变化必然要求实现网络舆情管理的变革以适应大数据时代的发展,这些要求主要体现在四个“转向”上。
(一)从监测转向预测。大数据的核心和目标就是预测。复杂网络的研究专家巴拉巴西认为,“93%的人类行为是可以预测的,当我们将生活数字化、公式化以及模型化的时候,我们会发现其实大家都非常相似。生活如此抵触随机运动,渴望朝更安全、更规则的方向发展,人类行为看上去很随意、很偶然,却极其容易被预测”[1]。例如,亚马逊可以推荐我们想要的图书,淘宝知道我们的喜好,而人人网可以猜出我们认识谁。传统网络舆情管理把监测已经产生的舆情信息作为起点,这种明显的滞后性使其在网络舆情危机的应对中处于消极被动的位置。而目前留给突发事件的处理时间越来越少,从传统的“黄金24小时”变为“黄金4小时”,如此短的时间使舆情分析和决策尚未来得及参与进来,整个事件就已经造成了爆炸性的效果。在大数据时代,通过挖掘数据相关性,把数学算法运用到海量的数据上进行分析,在敏感消息进行网络传播的初期就提前开始监测,然后建立模型,模拟仿真网络舆情的演变过程,使网络舆情突发事件发生的可能性和倾向性变得可以预测。
(二)从节点转向网络。由监测舆情转向预测舆情的目标实现,最关键的大数据技术就是挖掘数据的相关性。在小数据时代,由于受到数据库和计算分析能力的限制,无论是对于因果关系还是相关关系的追寻,都耗资耗时,并且易受传统的思维模式和特定领域隐含的固有偏见的影响,无法保证舆情分析结果的准确性。因此传统的网络舆情管理只注重舆情内容的监测,通过分析单个数据节点,如网民“说什么”来抓住比较浅层的社会语义表达。大数据则在保留了原始数据的同时,记录了网民“为什么这么说”背后的社会心理和社会关系网。按照大数据思维,每一个数据都是一个节点,可无限次地与其他关联数据形成舆情链上的乘法效应——类似微博裂变传播路径,数据裂变式的关联状态蕴含着无限可能性[2]。通过对海量信息的解构与重构,充分整合政府和企业的数据资产,利用一系列飞速发展的新技术和新工具,描绘、测量、计算各节点之间的关系,深度挖掘数据的相关性,以此排除偏见和视觉盲点,掌握易被忽略的社会动态,预测舆情的发展趋势。因此大数据时代必然要求网络舆情管理变革其监测系统,由节点转向网络,把握相关性,进而分析舆情背后的社会互动,乃至网络族群之间的界限和相互勾连。
(三)从定性转向定量。舆情分析师或解读者从自身经验和视角出发,在传统网络舆情管理的过程中进行定性分析时,必然使其分析结果带有个人价值与理念的主观印记,甚至不同的舆情机构对同一舆情事件会得出相悖的结论。在大数据时代,所有元数据都可通过量化关联转化为有价值的信息,并实现多次利用,每一次利用都是一种创新,大数据成为网络舆情定量管理的力量源泉。尽管数据的相关性决定了某些数据价值的潜藏性,但新技术、新软件的出现使得通过数学分析实现数据的价值转化变为可能。而多维解读舆情和新的深刻洞见的揭示,使舆情分析结果的全面性和客观性大大超越传统的网络舆情管理。但数据的量化并不等同于简单的“数字化”,而是数据的可计算化,舍恩伯格将其称之为“数据化”,是指一种把现象转变为可制表分析的量化形式的过程[3]。“数据化”使态度和情绪转变为一种可以分析的形式,网络舆情的相关信息得以进行深入分析,一些社交媒体如Facebook、Twitter、QQ、微博、微信等坐拥大型数据的宝藏,一旦实现对其自身数据库的深度利用,就能轻易获得社会各个领域和所有用户的几乎全部动态信息。
(四)从样本转向全体。在传统的网络舆情工作模式中,所采集的舆情关联数据仅为样本信息,构建的数据库结构单一、数据量有限。其数据源一般是基于抽样或者针对重点网络站点进行的数据抓取,仅能对小规模、有结构或类结构的数据进行分析,标准不一,难以在不同领域中通用。同时,样本分析并不能保证结果的准确,即使分析方法和操作没有问题,但采样过程的任何偏误都将使舆情分析结果与事实相去甚远。大数据体量巨大,从TB级别跃升至PB乃至ZB级别,完整记录了社情民意,成为人类生存痕迹和心理变化的记录仪。采样的目的是以尽可能少的数据获得尽可能多的信息,但大数据是建立在掌握所有数据,至少是海量数据的基础上的,在数据处理技术日新月异的今天,变革传统舆情管理思维与方法,改变采样的惯性行动成为必要。通过运用大数据技术,建立网络舆情自动分析系统,全天候自动搜索并采集与目标舆情看似毫不相关实则具有内在关联的信息,在抓取和收集页面之后,对信息自动分类、自动获取关键词、自动内容分析和自动报警等。样本扩大至几乎全体,舆情分析的结果更加客观可靠。
已有0人发表了评论