2.3.3 Nonreactive

用大数据源进行测量,影响行为(behavior)的可能性更小。

当人们知道自己正在被研究者观察时,他们有可能会改变他们的行为。这是社会学研究中的一个挑战。社会学家通常成这为 反应(reactivity)Webb et all. 1996)。例如,人们在实验室环境里比在实际环境里显得更慷慨,因为他们发现自己正在被观察(Levitt and List 2007a)。研究者发现大数据的一个优点是参与者通常不会注意到他们的数据正在被记录,或者他们已经习惯了被收集信息以至于这不再会改变他们的行为。得益于参与者的“无动于中(nonreactive)”,许多大数据可以用来研究那些以前不适合进行精确估测的行为(behavior)。例如,Stephens-Davidowitz(2014)用搜索引擎中种族主义术语的热度来估测美国不同区域的种族敌意。使用像调查(survey)这样的其他方式很难去估测的行为,得益于大数据的 nonreactivebig (2.3.1节),可以用大数据来估测。

然而,nonreactive 并不能确保这些数据就是人们真实的行为或态度。例如,一个访谈的被试者说:“我不是没有烦恼,只是不把他放在Facebook上罢了。”(Newman et al. 2011)。换句话说,即使大数据是 nonreactive 的,也并不是说它就不受社会导向的影响——人们总想以他们最好的一面展示自己。进一步的,大数据源所记录的行为可能被平台所有者影响,我称这个问题为 “algorithmic confouding” 。最后,尽管 nonreactivity 通常有利于研究,但没有人们的同意,或在人们没有意识到的情况下,对他们的行为进行跟踪记录,会引起一些道德问题,我将在第六章详细讨论。

我已经介绍了三个大数据通常有益于社会学研究的特性:big,always-on,和nonreactive。接下来,我转而介绍七个大数据通常不利于社会学研究的特性:incomplete,inaccessible,non-representative,drifiting,algorithmically confounded,dirty和sensitive。

Last updated