Bit by Bit
  • 译者手记
  • 作者序
  • 1 简介
    • 1.1 罗夏墨迹
    • 1.2 欢迎来到数字时代
    • 1.3 研究的设计
    • 1.4 本书的主题
    • 1.5 本书的大纲
    • 扩展阅读
  • 2 观察行为
    • 2.1 简介
    • 2.2 大数据
    • 2.3 大数据的十个常见特性
      • 2.3.1 Big
      • 2.3.2 Always-on
      • 2.3.3 Nonreactive
      • 2.3.4 Incomplete
      • 2.3.5 Inaccessible
      • 2.3.6 Nonrepresentative
      • 2.3.7 Drifting
      • 2.3.8 Algorithmically confounded
      • 2.3.9 Dirty
      • 2.3.10 Sensitive
    • 2.4 研究的策略
      • 2.4.1 统计
      • 2.4.2 预报与即时预报
      • 2.4.3 模拟实验
    • 2.5 总结
    • 数学原理简介
    • 扩展阅读
    • 延伸活动
  • 3 问问题
    • 3.1 简介
    • 3.2 提问与观察
    • 3.3 整体性调查误差框架
      • 3.3.1 代表性
      • 3.3.2 衡量标准
      • 3.3.3 成本
    • 3.4 该问谁
    • 3.5 问问题的新方法
      • 3.5.1 生态学的瞬间评估
      • 3.5.2 维基调查
      • 3.5.3 游戏化
    • 3.6 将调查与大数据连接
      • 3.6.1 互补式提问
      • 3.6.2 增广式提问
    • 3.7 总结
    • 数学原理简介
    • 扩展阅读
    • 延伸活动
Powered by GitBook
On this page
  1. 3 问问题

3.1 简介

Previous延伸活动Next3.2 提问与观察

Last updated 6 years ago

研究海豚的学者不能直接问海豚问题,因此,他们被迫通过观察海豚的行为来进行研究。与之相反,研究人类的学者要容易些:他们的研究对象可以说话。在过去的社会学研究中,与人们进行谈话是很重要的一部分,我认为,谈话在未来依然很重要。

在社会学研究中,与人们进行谈话有两种典型的方式:问卷调查与深入访谈。大体来说,使用问卷调查的研究需要招募大量的参与者,高度结构化的问卷,以及通过统计学方法将结论从被试推广到更大的人群中。另一方面,使用深入访谈的研究,通常参与者的数量会很小,使用半结构化的对话,得出一个丰富的,对被试定性描述的研究结果。问卷调查与深入访谈都是有效的研究途径,但从模拟时代到数字时代的转变,对问卷调查的影响更大。因此,本章我将聚焦于问卷调查。

正如我将在本章中展示的,数字时代为使用问卷调查进行研究,提供了很多亦可赛艇的机遇:收集数据更快也更便宜,可以对不同的人提出不同的问题,以及通过大数据放大问卷数据的价值。然而,调查型研究会被通信技术所改变,这并不是什么新观点。大约在 1970 年,另一种通讯技术——电话,正在驱动着这种的变革。幸运的,理解电话如何对调查型研究产生改变,有助于我们设想数字时代会如何变革调查型研究。

我们今天所认为的调查型研究,开始于 1930 年。在第一代调查型研究中,研究者会随机的从如城市街区等地理位置上进行抽样,然后旅行到那个地方,随机的对当地家庭进行面对面的交流。接着,随着通讯技术的发展,固定电话在发达国家的广泛应用,开启了第二代调查型研究。在第二代中,对抽样的方式以及谈话发生的地点都发生了改变。在第二代,研究人使用一种称作「」的采样方式,随机的从电话号码中进行抽样,而不是根据地理位置进行抽样。并且研究者不再旅行以及进行面对面的交流,而是给他们打电话。这看上去只是方式的小小改变,但这使得调研更快,更便宜,也更灵活。除了为研究赋能,这种改变同样还引起了争议,因为很多研究者认为,这种新的采样和访谈的方式,会引入各种误差。在经过了很多工作后,研究者最终找到了使用随机数字拨号和电话访谈收集可靠数据的方法。因此,研究者通过确定使用新技术的正确姿势,使得调查型研究得以现代化。

如今,另一次通讯技术的革命——数字时代——将最终把我们带往第三代调查型研究。这次变革部分是由于第二代研究方法渐露颓势 ()。比如说,由于各种科技发展和社会原因,无响应率——指被抽样人群中拒绝参与调查的比例,在逐年升高 ()。这种长期趋势意味着在现在的标准电话调查中,无响应率已经超过了 90 % ()。

另一方面,亦可赛艇的新机遇,同样驱动着第三代调查型研究的变革。尽管变革还未平息,我认为,第三代调查型研究将以非概率抽样,电脑管理的访谈,以及调查数据与大数据之间的连接为主要特征。(表 3.1)

表 3.1:基于 的第三代调查型研究

抽样方式

访谈方式

数据环境

第一代

根据地理位置的随机抽样

面对面交流

数据孤岛

第二代

的随机抽样

电话访谈

数据孤岛

第三代

非概率抽样

电脑管理的访谈

调查数据与大数据连接

第二代到第三代调查型研究的转变不是特别平稳,关于研究者应该何去何从有很多激烈的辩论。会看第一代到第二代的转变,我认为其中有一个关键的「insight」:the beginning is not the end。最初很多的第二代基于电话的方法并没有特殊处理,效果也不是很好。但经过研究者的艰苦努力,解决了这些问题。比如说,在 Warren Mitofsky and Joseph Wasksberg 提出随机电话拨号的理论与时间方法之前 (),研究者已经使用了很多年电话抽样。因此,我们不应该把现阶段的第三代方式与其最终的成果混淆。

调查型研究的历史,显示了在科技与社会的驱动下,这个领域的演变与进化。进化是不可阻挡的。我们应该拥抱变化,同时从先前的研究中汲取智慧。这就是我在本章中采取的方式。首先,在 3.2 节中,我会论证大数据并不会取代调查,丰富的大数据资源会增加,而不是减小调查的价值。根据这个源动力,在 3.3 节中,我会介绍总体调查误差框架,这产生与前两个时代的调查型研究。这个框架使得我们能理解新的表示方法——非概率抽样 (3.4 节),以及新的提问方法 (3.5 节)。最后,我会介绍两个连接调查数据与大数据源的研究模板 (3.6 节)。

随机数字拨号
B. D. Meyer, Mok, and Sullivan 2015
National Research Council 2013
Kohut et al. 2012
Grovers (2011)
Waksberg 1978
随机数字拨号