殘差平方和

殘差平方和(英語:Residual sum of squares,縮寫:RSS)在統計學上是指將所有做預測時的誤差值平方加起來得出的數:

它是衡量數據與估計模型之間差異的尺度。較小的殘差平方和表示模型能良好地擬合數據。在確定參數和選擇模型時,殘差平方和是一種最優性準則。通常,總的方差=已經被模型解釋了的平方和+殘差平方和。

殘差平方和這個數值在機器學習上是普通最小二乘法演算法的重心。

與皮爾遜相關係數的關係

對於兩變量x和y, 它們的數據組的均值分別記為 ,則兩數據組的皮爾遜相關係數 ,其中,    .

給定最小二乘回歸線方程為  , 其中   ;  . 則這時殘差平方和可以表示為:

 

通過皮爾遜相關係數的公式,可以得到  .