Bit by Bit
  • 译者手记
  • 作者序
  • 1 简介
    • 1.1 罗夏墨迹
    • 1.2 欢迎来到数字时代
    • 1.3 研究的设计
    • 1.4 本书的主题
    • 1.5 本书的大纲
    • 扩展阅读
  • 2 观察行为
    • 2.1 简介
    • 2.2 大数据
    • 2.3 大数据的十个常见特性
      • 2.3.1 Big
      • 2.3.2 Always-on
      • 2.3.3 Nonreactive
      • 2.3.4 Incomplete
      • 2.3.5 Inaccessible
      • 2.3.6 Nonrepresentative
      • 2.3.7 Drifting
      • 2.3.8 Algorithmically confounded
      • 2.3.9 Dirty
      • 2.3.10 Sensitive
    • 2.4 研究的策略
      • 2.4.1 统计
      • 2.4.2 预报与即时预报
      • 2.4.3 模拟实验
    • 2.5 总结
    • 数学原理简介
    • 扩展阅读
    • 延伸活动
  • 3 问问题
    • 3.1 简介
    • 3.2 提问与观察
    • 3.3 整体性调查误差框架
      • 3.3.1 代表性
      • 3.3.2 衡量标准
      • 3.3.3 成本
    • 3.4 该问谁
    • 3.5 问问题的新方法
      • 3.5.1 生态学的瞬间评估
      • 3.5.2 维基调查
      • 3.5.3 游戏化
    • 3.6 将调查与大数据连接
      • 3.6.1 互补式提问
      • 3.6.2 增广式提问
    • 3.7 总结
    • 数学原理简介
    • 扩展阅读
    • 延伸活动
Powered by GitBook
On this page
  1. 3 问问题
  2. 3.3 整体性调查误差框架

3.3.3 成本

Previous3.3.2 衡量标准Next3.4 该问谁

Last updated 6 years ago

问卷掉哈不是免费的,成本是一个很现实的问题。

到目前为止,我简单的回顾了一下整体性调查误差框架,这个框架可以自己都可以用一本书来讲(; )。尽管这是个复杂的框架,这常常使研究者忽视了一个重要的因素:成本。成本可以从时间和经济两方面来衡量。尽管学界的研究者们很少直接的讨论成本,但这个现实的问题是无法忽视的。实际上,成本是整个调查型研究过程的基础()。一心一意的专注于减少误差而武安却忽略成本,常常不是最好的选择。

下面这个里程碑式的项目,展示了痴迷于减少误差的局限性。Scott Keeter 和他的同事们()探索了通过昂贵的额外操作减少电话调查中的无响应比例,对实验结果会什么影响。Ketter 他们同时进行两个实验,一个使用 “标准的” 招募程序。另一个使用 “严格的” 招募程序,如果调查对象最初拒绝参与这个实验,研究者会更频繁地,在更长的时间范围里,对他们进行额外的回访。这些额外的努力确实降低了无响应比例,但增加了大量的成本。“严格的” 招募程序比标准程序贵两倍,花费时间多八倍。并且,最后这两个实验得到了完全一致的估测结果。这个项目,以及后续的同类研究都得到了相似的结果()。这使得我们会想到:两个合理的调查比一个原始的调查更好吗?如果是 10 个合理的调查与 1 个原始调查相比呢?100 个合理的调查与 1 个原始调查相比呢?「At some point, cost advantages must outweigh vague, nonspecific concerns about quality.」

正如我将在本章的其余部分中展示的那样,数字时代创造的很多机会,并不是明显地降低了估测的误差。相反,这些机遇,在于用不同的数量级的调查对象进行估计,以及更快更便宜的进行估测,即使有时这可能伴随着更高的误差。那些一股脑专注于减少误差,提高质量的研究者,将会错失这些亦可赛艇的机会。在整体性调查误差框架的背景下,我们接下来会关注第三代调查型研究的三个主要部分:新的代表性抽样方式(3.4 节),新的衡量标准(3.5 节),以及结合问卷调查与大数据资源的新策略(3.6 节)。

Weisberg 2005
Groves et al. 2009
Groves 2004
2000
Keeter et al. 2006