自监督学习

自监督学习（SSL）是机器学习的一種范式，用于处理未标记数据以获取有用的表示，以帮助下游学习任务。SSL方法最显著的特点是它们不需要人类标注的标签，这意味着它的训练完全基于由未标记的数据样本组成的数据集。典型的SSL流程包括在第一阶段学习监督信号（自动生成的标签），这些监督信号将用于后续阶段中的某些监督学习任务。因此，SSL可以視为无监督学习和监督学习的中间形式。

典型的 SSL 方法基于人工神经网络或其他模型（例如决策列表（英语：Decision list））^[1]

參考資料

^ Yarowsky, David. Unsupervised Word Sense Disambiguation Rivaling Supervised Methods. Proceedings of the 33rd Annual Meeting of the Association for Computational Linguistics (Cambridge, MA: Association for Computational Linguistics). 1995: 189–196 [1 November 2022]. doi:10.3115/981658.981684  . （原始内容存档于2022-12-14）.

[1] Yarowsky, David. Unsupervised Word Sense Disambiguation Rivaling Supervised Methods. Proceedings of the 33rd Annual Meeting of the Association for Computational Linguistics (Cambridge, MA: Association for Computational Linguistics). 1995: 189–196 [1 November 2022]. doi:10.3115/981658.981684  . （原始内容存档于2022-12-14）.

[1]