泰爾-森估算

泰爾-森估算(英語:Theil–Sen estimator)是非參數統計中一種擬合直線的穩健模型,名稱來源於荷蘭計量經濟學家亨利·泰爾英語Henri Theil與美國統計學家普拉納布·森英語Pranab K. Sen

黑線為泰爾-森估算,藍線為簡單線性回歸模型,綠虛線用於生成樣本數據點。

假設有二維樣本數據(xi,yi),泰爾-森估算是指所有樣本點對所形成的斜率(yjyi)/(xjxi)中位數m。當擬合直線的斜率m確定後,可再由yimxi的中位數確定擬合直線的截距。[1]

泰爾-森估算不易受離群值影響。對於偏態分布或異方差的數據,泰爾-森估算的準確度遠高於非穩健的簡單線性回歸,而對於正態分布數據而言其與非穩健模型相比也有着相當的統計功效[2]

參考文獻

  1. ^ Rousseeuw & Leroy (2003), pp. 67, 164.
  2. ^ Wilcox (2001).