“数字痕迹”的第一个优点是其几乎可以立即获得。因此,监测经济活动自然而然地成为公共统计领域的应用候选。多年来,法国国家统计局 (INSEE) 一直在监测从互联网上收集的数据的能力,以实时衡量经济现象(即时预测)[大数据、公共统计和经济衡量,法国经济- 账户和文件,2017 年版]。他根据Google Trends测量的 Google 关键词搜索频率做出了这一判断。结果相当复杂,原因如下:
Google Trends 上提供的系列并不对应于保留的术语的详尽计数,而是经过重新处理的样本(例如,调整以纠正互联网和 Google 的日益普及),这些样本并未记录在案并且可能会引入不稳定因素。毕竟,Google 追求的不 兼职数据 是时间的一致性,而是搜索引擎的不断改进,这不可避免地会导致源的不稳定;
我们不可能了解所提出请求的背景,因为这些请求可能有非常多样化的动机,并且与我们试图衡量的经济活动无关。例如,您可能输入“汽车”,因为您想购买一辆汽车,但您可能还想了解该行业的最新丑闻。查询还可以对媒体新闻作出反应,甚至只是呼应统计机构自己的出版物!
统计机构传统数据收集的替代方案?
尽管这并不特别涉及谷歌,但“数字痕迹”的使用可以被视为传统国家统计机构(NSI)收集的替代方案。
因此,在通货膨胀测量领域,国家统计机构最具代表性的使命之一,互联网上的自动化价格收集项目“十亿价格项目”于 2000 年代末在麻省理工学院启动。这一举措之所以引人注目,是因为它是在公共统计领域之外发展起来的,正是为了弥补阿根廷(以及后来的委内瑞拉)公共统计领域的不足。毫不奇怪,阿根廷统计数据的失败得到了证实。在大多数发达国家,由于产品范围和销售点有限,INS 测量的结果没有系统性差异:根据定义,该项目仅涵盖在线销售产品的在线销售价格,而 INS 测量的通货膨胀代表了所有家庭消费。