平均絕對誤差

統計學中,平均絕對誤差 (英語:Mean absolute error,縮寫:MAE)是對表達同一現象的成對觀測值之間誤差的測量。 Y與X比較的例子包括預測值與觀測值的比較、後續時間與初始時間的比較,以及一種測量技術與另一種測量技術的比較。 平均絕對誤差MAE的計算方法是絕對誤差之和(即曼哈頓距離)除以樣本量[1]

因此,它是絕對誤差的算術平均值, 其中是預測值,和是真實值。其他公式可將相對頻率作為權重因子。平均絕對誤差使用與測量數據相同的標度。這被稱為與標度相關的精度度量 (scale-dependent accuracy measure),因此不能用於對使用不同標度的預測值進行比較。[2]。 平均絕對誤差是時間序列分析預測誤差英語Forecast error的一個常用度量, 有時會與更標準的平均絕對離差(英語:mean absolute deviation)的定義混淆。 在更廣泛的意義上也存在同樣的混淆。

數量差異和分配差異

 
兩個數據點的平均絕對誤差(MAE) 和均方根誤差 (RMSE) ,數量差異為 0,分配差異為 2。

遙感中,平均絕對誤差(MAE)有時表示為兩個部分的總和:數量差異 (quantity disagreement) 和分配差異 (allocation disagreement)。數量差異是平均誤差的絕對值:[3] 分配差異是平均絕對誤差(MAE)減去數量差異。

還可以通過觀察 圖形來識別差異類型。當X值的平均值不等於Y值的平均值時,就存在數量差異。當且僅當點位於同一直線兩側時才存在分配差異。[3][4]

相關測量方法

平均絕對誤差是比較預測與最終結果的多種方法之一。公認的替代方法有平均絕對縮放誤差 (mean absolute scaled error, MASE)、平均絕對對數誤差 (mean absolute scaled error (MASE), MALE) 和均方誤差 (mean squared error, MSE)。這些方法都是在不考慮預測過高或過低方向的情況下總結預測結果的;而平均符號差 (mean signed difference, MSD)則是一種強調這一點的測量方法。

在使用選定的性能指標對預測模型進行擬合時,從最小二乘法均方誤差相關的意義上講,與均方絕對誤差相對應的是最小絕對偏差 (least absolute deviations, LAD)。

平均絕對誤差均方根誤差 (RMSE) 並不完全相同,儘管有些研究人員是這樣報告和解釋的。平均絕對誤差在概念上比均方根誤差更簡單,也更容易解釋:它只是散點圖中每個點與 Y=X 線之間的平均絕對垂直或水平距離。換句話說,平均絕對誤差是X和Y之間的平均絕對差值。此外,每個誤差對平均絕對誤差的影響與誤差的絕對值成正比。這與均方根誤差不同,均方根誤差涉及差值的平方,因此幾個較大的差值會使均方根誤差比平均絕對誤差增加更多。[3]

參閱

參考文獻

  1. ^ Willmott, Cort J.; Matsuura, Kenji. Advantages of the mean absolute error (MAE) over the root mean square error (RMSE) in assessing average model performance. Climate Research. December 19, 2005, 30: 79–82. doi:10.3354/cr030079 . 
  2. ^ 2.5 Evaluating forecast accuracy | OTexts. www.otexts.org. [2016-05-18]. (原始內容存檔於2018-01-17). 
  3. ^ 3.0 3.1 3.2 Pontius Jr., Robert Gilmore; Thontteh, Olufunmilayo; Chen, Hao. Components of information for multiple resolution comparison between maps that share a real variable (PDF). Environmental and Ecological Statistics. 2008, 15 (2): 111–142. S2CID 21427573. doi:10.1007/s10651-007-0043-y. 
  4. ^ Willmott, C. J.; Matsuura, K. On the use of dimensioned measures of error to evaluate the performance of spatial interpolators. International Journal of Geographical Information Science. January 2006, 20: 89–102. S2CID 15407960. doi:10.1080/13658810500286976.