本條目存在以下問題,請協助 改善本條目或在 討論頁針對議題發表看法。
此條目需要 精通或熟悉相關主題的編者參與及協助編輯。 (2020年3月23日) 請邀請適合的人士改善本條目。更多的細節與詳情請參見討論頁。 |
|
瓦普尼克-澤范蘭傑斯維(Vapnik-Chervonenkis Dimension),簡稱VC維,由弗拉基米爾·瓦普尼克與亞歷克塞·澤范蘭傑斯提出。在VC理論中,VC維是對一個可學習分類函數空間的能力(複雜度,表示能力等)的衡量。它定義為算法能「打散」的點集的勢的最大值。
直觀地,一個分類模型的能力與其複雜程度相關。例如,考慮一個高次多項式的分類模型:若函數值大於0則分類為正,反之則分類為負。高次多項式能夠「擺動」的範圍很大,所以能夠很好地擬合給定的點集。當然因此,這樣的模型也很可能會在其他符合原點集趨勢的點集上分類錯誤。我們說這一多項式是高能力的。如果考慮一個簡單的線性分類模型,就不一定能夠很好地擬合給定的點集。
定義
集合族的VC維
給定一集合族 與一集合 ,定義其交為如下的集合族:
稱 能打散 ,若且唯若 包含 的所有子集,即
的VC維定義為能被 打散的勢最大的集合的勢。
分類模型的VC維
對一個參數記為 的分類模型 ,稱模型 能夠打散一點集 ,若且唯若對任意標籤集 都存在參數 使得 在 上分類完全正確。
模型 的VC維定義為能被 打散的勢最大的點集的勢,或等價地,滿足存在 , 使得 能打散 的最大的 。
參見