多年来,安全、可持续的数据共享的关键准则是匿名化。只要研究人员或组织采取措施匿名化数据集,它们就可以自由使用和共享。这一概念甚至被嵌入到法律和政策中。例如,《健康保险携带与责任法案》(HIPAA)隐私规则和欧盟《数据保护指令》等法律促进了匿名数据集的共享,对包含个人信息的数据集的限制更少。
但事实证明,“匿名化”并非万无一失。从匿名数据集中正确识别人和属性的可能性引发了隐私法中最活跃和最重要的辩论之一。在过去的20年里,研究人员已经证明,个人可以在许多不同的数据集中被识别出来,这些数据集曾经被认为是通过去识别的方式得到了充分的保护。一个,7特别是,三个著名的重新识别案例已经对去识别方法的有效性提出了质疑,而隐私法律和政策,如HIPAA隐私规则所依赖的去识别方法。一位州长、Netflix和美国在线(AOL)的客户都从据称匿名的数据中被准确识别出来。在每一种情况下,攻击者都利用辅助信息将个人与去识别数据集中的记录联系起来。
没有找到条目