欧阳康:大数据与人文社会科学研究的变革与创新(2)

欧阳康:大数据与人文社会科学研究的变革与创新(2)

探索大数据提供的特殊机遇与挑战

从总体上看,与人文社会现象的多样性和复杂性相对应,人文社会科学也是一个庞大的学科群,内部存在着迥然相异的学科,不同的学科与大数据的关系和关联度也有很大不同。例如,从总体上看,传统的社会科学学科,诸如经济学、管理学、社会学、政治学、法学、教育学等学科对数据的依赖性较强,大数据所展示的意义会更充分,而文学、历史、艺术、哲学等更加关注人们的精神生活、价值理念、心灵世界等,对外在数据的依赖性较低,大数据所展示的意义相对较弱,在大数据时代所受到的影响也相对较小。即就大数据本身而言,也应当看到,大数据并不是一切,并没有根本取代小数据和传统数据;大数据技术尚在发展之中,并不能简单取代传统数据技术;大数据研究也存在很多问题,我们没有必要也不应该简单地用大数据研究来遮蔽传统的人文社会科学研究。

但无法回避的是,方兴未艾的大数据已经给人文社会科学研究提出了很多问题和挑战,也提供了许多创新的机会。

首先,从“假设出发”还是从“数据出发”开始我们的研究?“大胆假设,小心求证”,一直是我们从事人文社会科学研究的基本模式。大数据时代,海量数据甚至“全数据”的存在成为我们很多学科和领域研究的前提,它们表征着许多难以辨析的事实,要求我们做出必要的解读和说明。

其次,以“个别样本”还是以“海量数据”为对象来开展研究?由于采集数据困难,过去人文社会科学的很多研究不得不依赖于抽样调查,采集到的永远是个别样本信息,为此而不得不加大抽样的比例,但最大比例的样本也不可能穷尽对象,因此所有的结论都带有推论的性质。大数据时代,人们有可能通过就一定事物采集全样本,提供全数据,为人文社会科学研究提供更加坚实可靠的对象性基础和前提。

再次,是“感性接触”还是“行为统计”更为可靠?人文社会科学的很多研究以研究者与被研究者的直接接触作为真实可靠的基础,例如直接对话、直面访谈、电话采访等,这有其感性直观和可靠的一面。但人们的思想内在于心灵,充满着理性与非理性的博弈,具有独立性、分散性、个体性和变动性特点,其表达往往受到交往者之间的互动感觉和场景的直接影响,尤其是涉及一些敏感话题会产生某种特殊遮蔽甚至智慧博弈,感性接触并不一定都真实可靠。大数据通过行为统计,对于数据细粒度的分割,全方位长时间累积搜集,尤其是在对人们在大量的“鼠标选择”“网络投票”中展示出的价值取向、美丑好恶、评价标准等,展示出个体真实的心灵世界,勾勒出社会总体心理状态,描绘时代精神的大体走向,有可能为人文学科的理性研究提供更加真实可靠的对象和基础。

又次,以“实体规律”还是以“统计规律”为研究目的?过去,人文社会科学研究主要依托对社会现象的局部观察和实体性探索,大数据将社会变量变成可统计、可度量、可计算的对象,通过追踪社会中作为最小组成单位的“人”以及对全局性社会形态的包容性跟踪累积,在一个相对低廉的研究成本中展现社会和社会组织的高精度社会实景,实现以整体和全体数据为基础的研究,更好地探析社会发展的本质特征、内在规律、演化趋势和未来走向。例如,关于国家治理体系现代化的研究,可以尝试借助于大数据来建立评估体系并进行国际比较,从而得出科学结论。

责任编辑:蔡畅校对:杨雪最后修改:
0

精选专题

领航新时代

精选文章

精选视频

精选图片

微信公众平台:搜索“宣讲家”或扫描下面的二维码:
宣讲家微信公众平台
您也可以通过点击图标来访问官方微博或下载手机客户端:
微博
微博
客户端
客户端