自監督學習

自監督學習(SSL)是機器學習的一種範式,用於處理未標記數據以獲取有用的表示,以幫助下遊學習任務。SSL方法最顯著的特點是它們不需要人類標註的標籤,這意味着它的訓練完全基於由未標記的數據樣本組成的數據集。典型的SSL流程包括在第一階段學習監督信號(自動生成的標籤),這些監督信號將用於後續階段中的某些監督學習任務。因此,SSL可以視為無監督學習監督學習的中間形式。

典型的 SSL 方法基於人工神經網絡或其他模型(例如決策列表英語Decision list[1]

參考資料

  1. ^ Yarowsky, David. Unsupervised Word Sense Disambiguation Rivaling Supervised Methods. Proceedings of the 33rd Annual Meeting of the Association for Computational Linguistics (Cambridge, MA: Association for Computational Linguistics). 1995: 189–196 [1 November 2022]. doi:10.3115/981658.981684 . (原始內容存檔於2022-12-14).