1.1 罗夏墨迹

在2009年夏季,手机的铃声响彻了卢旺达。除了来自家人、朋友以及商业伙伴的数以百万计的电话,大约有1000个卢旺达人接到了来自Joshua Blumenstock以及他同事的电话。这些研究人员正在进行资产与贫困的研究,从卢旺达最大的电信提供商的150万用户中用随机抽样的方式进行调查。Blumenstock与他的同事询问随机抽出的人是否愿意参与调查,向他们解释了研究的性质,然后问了一系列包括人口统计学的,社交的以及经济的问题。

到目前为止,我所讲的一切听起来都像个传统的社会科学调查。但接下来的并不传统————至少现在还不是。除了调查数据(survey data),Blumenstock与他的同事们还获得了那150万用户所有的通话记录。通过结合这两种数据,他们用调查数据训练了一个用通话记录来估算资产的机器学习模型。接下来,他们用这个模型估算了这150万用户的资产情况。同时,用通话记录中的地理位置信息,他们还估计了这150万用户的住宅位置。把所有这些放在一起————估算的资产情况与估计的住宅位置————他们得到了一张卢旺达资产分布情况的高分辨率地图。具体的说,他们能估算卢旺达2148个地方(这个国家最小的行政单位)的资产情况。

不幸的是,无法验证这些估算的准确性,因为没有人在卢旺达用这样细粒度的地理位置估算过。但是当Blumenstock与他的同事们将这个估算汇总为卢旺达的30个地区时,他们发现他们的估计与被广泛认为是发展中国家调查的黄金标准————Demographic and Health Survey的估计十分接近。尽管这两种方式得到了相似的估计,Blumenstock与其同事的方法比传统的Demographic and Health的方式快大约10倍,并且便宜50倍。这种更快速与低成本的估算方式为研究者、政府以及企业提供了新的可能性(Blumenstock, Cadamuro, and On 2015)。

这种研究有点像罗夏墨迹测验(Rorschach inkblot test):人们所看到的取决于他们的背景。许多 社会学家 看到的是一种新的测量工具,能用于检验他们关于经济发展的理论。许多 商人 看到的是一种强大的方式来解锁他们已经收集的大数据的价值。许多 隐私保护提倡者 看到的是一个可怕的提醒:我们生活在一个大规模监控的时代。最后,许多 政策制定者 看到的是一种能帮助我们创建更好世界的新技术。事实上,这项研究就是所有这些东西。因为混合了各种特性,我把它看作是社会科学通往未来的窗户。

Last updated