馬賽克效應

馬賽克效應指在信息和數據處理過程中,來自不同來源的非敏感數據被組合後,意外地揭示出敏感或機密信息的現象。[1]這種效應的名稱來源於馬賽克藝術中,由許多小的、獨立的圖塊拼接成一幅完整圖像的概念。應用於公共使用數據時,馬賽克效應的概念表明,即使是單獨看來無害的匿名數據,如果發布了足夠多的包含相似或補充信息的數據集,也可能容易被重新識別。[2]

舉個例子,有下面一個數據集:

User XXXX個人行程數據[3]
時間 到達地點
20240516 中國北京 - 中南海 20240516 中國北京 - 大興國際機場 20240517 中國哈爾濱 - 中俄博覽會開幕式 20240517 中國哈爾濱 - 哈爾濱工業大學 20240518 俄羅斯莫斯科

只要結合俄羅斯總統普京的個人行程和代表團成員名單,即使我們隱去了這位用戶的真實姓名,仍然不難將 XXXX 用戶關聯到普京及其代表團的成員身上。如果輔以其他信息,我們還能更加精確的鎖定此人的身份。這種情形被稱為馬賽克效應,這種技術被稱為「推理攻擊」

參考文獻

  1. ^ mosaic effect – The Centre for Humanitarian Data. [2024-05-22] (美國英語). Mosaic effect is when disparate pieces of data or information—although individually of limited utility—become significant when combined with other types of information. 
  2. ^ Rushing, Elizabeth. The mosaic effect: the revelation risks of combining humanitarian and social protection data. Humanitarian Law & Policy Blog. 2021-02-09 [2024-05-22] (美國英語). 
  3. ^ https://m.thepaper.cn/newsDetail_forward_27417781.  缺少或|title=為空 (幫助)