Bit by Bit
  • 译者手记
  • 作者序
  • 1 简介
    • 1.1 罗夏墨迹
    • 1.2 欢迎来到数字时代
    • 1.3 研究的设计
    • 1.4 本书的主题
    • 1.5 本书的大纲
    • 扩展阅读
  • 2 观察行为
    • 2.1 简介
    • 2.2 大数据
    • 2.3 大数据的十个常见特性
      • 2.3.1 Big
      • 2.3.2 Always-on
      • 2.3.3 Nonreactive
      • 2.3.4 Incomplete
      • 2.3.5 Inaccessible
      • 2.3.6 Nonrepresentative
      • 2.3.7 Drifting
      • 2.3.8 Algorithmically confounded
      • 2.3.9 Dirty
      • 2.3.10 Sensitive
    • 2.4 研究的策略
      • 2.4.1 统计
      • 2.4.2 预报与即时预报
      • 2.4.3 模拟实验
    • 2.5 总结
    • 数学原理简介
    • 扩展阅读
    • 延伸活动
  • 3 问问题
    • 3.1 简介
    • 3.2 提问与观察
    • 3.3 整体性调查误差框架
      • 3.3.1 代表性
      • 3.3.2 衡量标准
      • 3.3.3 成本
    • 3.4 该问谁
    • 3.5 问问题的新方法
      • 3.5.1 生态学的瞬间评估
      • 3.5.2 维基调查
      • 3.5.3 游戏化
    • 3.6 将调查与大数据连接
      • 3.6.1 互补式提问
      • 3.6.2 增广式提问
    • 3.7 总结
    • 数学原理简介
    • 扩展阅读
    • 延伸活动
Powered by GitBook
On this page
  1. 2 观察行为
  2. 2.3 大数据的十个常见特性

2.3.3 Nonreactive

Previous2.3.2 Always-onNext2.3.4 Incomplete

Last updated 6 years ago

用大数据源进行测量,影响行为(behavior)的可能性更小。

当人们知道自己正在被研究者观察时,他们有可能会改变他们的行为。这是社会学研究中的一个挑战。社会学家通常成这为 反应(reactivity)()。例如,人们在实验室环境里比在实际环境里显得更慷慨,因为他们发现自己正在被观察()。研究者发现大数据的一个优点是参与者通常不会注意到他们的数据正在被记录,或者他们已经习惯了被收集信息以至于这不再会改变他们的行为。得益于参与者的“无动于中(nonreactive)”,许多大数据可以用来研究那些以前不适合进行精确估测的行为(behavior)。例如,用搜索引擎中种族主义术语的热度来估测美国不同区域的种族敌意。使用像调查(survey)这样的其他方式很难去估测的行为,得益于大数据的 nonreactive 和 big (2.3.1节),可以用大数据来估测。

然而,nonreactive 并不能确保这些数据就是人们真实的行为或态度。例如,一个访谈的被试者说:“我不是没有烦恼,只是不把他放在Facebook上罢了。”()。换句话说,即使大数据是 nonreactive 的,也并不是说它就不受社会导向的影响——人们总想以他们最好的一面展示自己。进一步的,大数据源所记录的行为可能被平台所有者影响,我称这个问题为 “algorithmic confouding” 。最后,尽管 nonreactivity 通常有利于研究,但没有人们的同意,或在人们没有意识到的情况下,对他们的行为进行跟踪记录,会引起一些道德问题,我将在第六章详细讨论。

我已经介绍了三个大数据通常有益于社会学研究的特性:big,always-on,和nonreactive。接下来,我转而介绍七个大数据通常不利于社会学研究的特性:incomplete,inaccessible,non-representative,drifiting,algorithmically confounded,dirty和sensitive。

Webb et all. 1996
Levitt and List 2007a
Stephens-Davidowitz(2014)
Newman et al. 2011