信息瓶頸

信息瓶頸(英語:information bottleneck)是信息論中的一種方法,由納夫塔利·泰斯比英語Naftali Tishby、費爾南多·佩雷拉(Fernando C. Pereira)與威廉·比亞萊克於1999年提出。[1]對於一隨機變量,假設已知其與觀察變量之間的聯合概率分布。此時,當需要概括(聚類時,可以通過信息瓶頸方法來分析如何最優化地平衡準確度與複雜度(數據壓縮)。該方法的應用還包括分布聚類(distributional clustering)與降維等。此外,信息瓶頸也被用於分析深度學習的過程。[2]

信息瓶項方法中運用了互信息的概念。假設壓縮後的隨機變量為,我們試圖用代替來預測。此時,可使用以下算法得到最優的

其中分別為之間、以及之間的互信息,可由計算得到。則表示拉格朗日乘數

參考文獻

  1. ^ Tishby, Naftali; Pereira, Fernando C.; Bialek, William. The Information Bottleneck Method (PDF). The 37th annual Allerton Conference on Communication, Control, and Computing: 368–377. September 1999 [2017-10-20]. (原始內容存檔 (PDF)於2017-08-29). 
  2. ^ Naftali Tishby, Noga Zaslavsky. Deep Learning and the Information Bottleneck Principle. 2015. arXiv:1503.02406 .