返回

文章详情

美国隐私紧急情况

Hacker News2026年7月3日 00:01

斯科特的前言:辛西娅·德沃克是哈佛大学戈登·麦凯计算机科学教授,也是差分隐私和算法公平领域的先驱。在我最近前往SigmaWest科学营和STOC的旅行中,人们谈论了特朗普政府的一项新举措,该举措将禁止不仅差分隐私,而且几乎所有保护大型数据集隐私的现代技术,例如在2030年美国人口普查中。我意识到我们很多人都有"愤怒疲劳",但这种愤怒对计算机科学理论社区来说确实触动很深。因此,当辛西娅在STOC找到我提议就这一问题撰写客座帖子时,我当然答应了。以下是她发给我的帖子,并得到了该领域许多其他领导者的签名支持。2026年6月4日,美国商务部长发布了一项指令(DAO 216-26),将所有经济分析局(BEA)和美国人口普查局出版物的保密保护降级为可追溯到1970年代早期的技术,背弃了超过半个世纪以来在数据主题的保护和进步。保密措施的进步使得人口普查局能够以更细的颗粒度共享越来越多的数据。这项命令将导致统计数据的实用性降低(或者可用的数据减少)、保护弱化,或者两者兼而有之。我们写这篇文章是为了阐明该命令带来的危险,并动员科学界对此发声。该命令背后的驱动力是政治利益,而非科学价值。DAO 216-26绕过法律要求的行政程序。这满足了遗产基金会2025项目的设计者所作的承诺,反映了由OMB主任拉塞尔·沃特创立的“美国复兴中心”(CRA)代表所持的言论和误解。CRA关于在2020年人口普查中使用差分隐私的解释明确指出了利害关系:“即使公民身份问题被添加到人口普查中,只要使用差分隐私,就不可能确定个体的身份状态。”但是,掩盖这种个人特征数据是《人口普查法》(13 U.S. Code Section 9)法律要求的,该法律规定“发布任何可以识别特定[个人]提供的数据的出版物是犯罪。”保密性也被广泛理解为确保人们响应人口普查的关键。DAO-216-26禁止差分隐私和其他现代(以及不那么现代)技术。它将披露避免技术限制为“粗粒化”,即“降低已发布统计数据的详细程度或特异性,例如通过四舍五入、聚合(分组)和/或使用范围。”“抑制”(“明确修改某些值”)也可以使用,但仅在“最后手段”的情况下。DAO-216-26禁止“噪声注入”,即“通过添加随机值或噪声来修改数据集的方法。”噪声注入正是为了应对在法律禁止发布可再识别数据的情况下,对颗粒数据日益增长的需求而发明的。粗粒化和抑制对于大多数国家、总体统计系列如主要联邦经济指标来说是令人满意的。然而,当这些技术应用于细分的商业和人口统计数据时,它们就无法满足要求。通过禁止噪声注入,指令禁止了过去三十年来在数十个数据发布中核心的披露避免技术。它禁止输入噪声注入,自2002年以来在季度劳动力指标中使用,并且到目前为止计划用于经济分析局统计数据[1]。它禁止自1990年以来用于十年一次的人口普查出版物的交换技术。它还禁止差分隐私,这是获得任何给定隐私级别的最大数据效用的当前最佳已知方法。自2008年以来,差分隐私被用于共享通勤模式的数据(OnTheMap)以及基于2020年人口普查的出版物。在最近的指令之前,差分隐私也计划用于2030年人口普查。还有许多其他产品和程序也受到影响。 1. 插图 DAO-216-26与人口普查局提供保密和使用适宜性的双重任务不兼容。为阐明这一点,我们回顾并扩展了Nathan Goldschlag提供的一个例子,这一例子受到县商业模式(CBP)数据的启发,该数据提供按行业和地理划分的商业活动统计。Goldschlag描述了三种情境,说明提供有用信息与根据人口普查法要求维护响应保密性之间的紧张关系。· “一个小县只有一家酿酒厂。如果CBP发布该县的酿酒厂员工的确切数量,它将披露一家企业的信息(即它雇佣了多少工人),这明显违反了上述法。

赞助内容

NordVPN Next-gen Antivirus

本站免费、广告极少。如果觉得有帮助,可以请我们喝杯咖啡 —— 任何金额都对持续运营有实际帮助。

请我喝杯咖啡