馬賽克效應
馬賽克效應指在信息和數據處理過程中,來自不同來源的非敏感數據被組合後,意外地揭示出敏感或機密信息的現象。[1]這種效應的名稱來源於馬賽克藝術中,由許多小的、獨立的圖塊拼接成一幅完整圖像的概念。應用於公共使用數據時,馬賽克效應的概念表明,即使是單獨看來無害的匿名數據,如果發布了足夠多的包含相似或補充信息的數據集,也可能容易被重新識別。[2]
舉個例子,有下面一個數據集:
時間 | 到達地點 | ||||||||
---|---|---|---|---|---|---|---|---|---|
20240516 | 中國北京 - 中南海 | 20240516 | 中國北京 - 大興國際機場 | 20240517 | 中國哈爾濱 - 中俄博覽會開幕式 | 20240517 | 中國哈爾濱 - 哈爾濱工業大學 | 20240518 | 俄羅斯莫斯科 |
只要結合俄羅斯總統普京的個人行程和代表團成員名單,即使我們隱去了這位用戶的真實姓名,仍然不難將 XXXX 用戶關聯到普京及其代表團的成員身上。如果輔以其他信息,我們還能更加精確的鎖定此人的身份。這種情形被稱為馬賽克效應,這種技術被稱為「推理攻擊」
參考文獻
- ^ mosaic effect – The Centre for Humanitarian Data. [2024-05-22] (美國英語).
Mosaic effect is when disparate pieces of data or information—although individually of limited utility—become significant when combined with other types of information.
- ^ Rushing, Elizabeth. The mosaic effect: the revelation risks of combining humanitarian and social protection data. Humanitarian Law & Policy Blog. 2021-02-09 [2024-05-22] (美國英語).
- ^ https://m.thepaper.cn/newsDetail_forward_27417781. 缺少或
|title=
為空 (幫助)