具体来说,INSEE实施的新方法是“随机密钥法”(单元密钥法)。它基于向每个个体(个人、家庭、企业等)随机分配一个“密钥”(具体来说,是 0 到 1 之间的数字)。这种分配是一次性进行的:每个人始终为所有后续处理保留相同的密钥。在广播数据表时,各个键与“转换矩阵”相结合,以根据原始(未扰动)值确定要应用的偏差以获得将要广播的扰动值。方法表中更详细地介绍了该方法。
通过图2举例说明:
求职者的数据由 QPV 发布,并按性别和年龄组(26 岁以下、26 至 50 岁以下、50 岁以上)细分。管理其传播的保密阈值为 5:因此,通过应用保密管理方法,我们旨在限制数据用户从按性别和年龄组传播的求职者信息中确定信息是否涉及少于 5 个人的可能性。
在图 2的示例中,对应于一个虚构的 QPV,只有 3 名 26 岁以下的男性求职者。因 兼职数据 此,直接传播这些信息将违反信息来源的传播规则。
图 2 – 随机密钥方法应用示例
在此背景下,随机密钥方法的应用如下:
1. 在初始(未受干扰)求职者数据文件中,虚构的 QPV (子图 a)中有 3 名 26 岁以下的男性。
2. 文件中的每个个体都有一个完全随机的“个人密钥”(0 到 1 之间的数字)。对于禁区内的三名 26 岁以下球员来说尤其如此(子图 b)。
3. 将这 3 名男子的个人钥匙加在一起,得出的结果是 1.80。以下只有该总数的小数有用,即 0.80。
4. 初始(未受干扰)值决定了要使用的转换矩阵的行(子图 c),这里是与值 3 相对应的行。在此行中,我们将自己置于上一步计算出的密钥总和的小数部分的级别,即 0.80。
5. 施加于初始值的扰动由相应的转换矩阵(子图 c)的值给出(此处为 +2。