數學統計學中,離差(英語:deviation)是變量的一個觀測值與某個特定的參照值(通常是該變量的平均值,此時稱為離均差距平[1])之間差異的度量。離差的正負表示差異的方向(觀測值超過參照值時偏差為正),絕對值的大小表示差異的大小。

類型

觀測值與關注量的真值(期望值,例如總體平均值)之間的離差稱為誤差error)。

觀測值與真值的估計值(例如樣本均值;樣本期望值可用作總體期望值的估計值)之間的離差稱為殘差residual)。這些概念適用於測量區間尺度和比例尺度的數據。

無符號或絕對離差

統計學中,數據集中某個元素的絕對離差absolute deviation)是該元素與給定點之間的絕對差。通常,離差是用中心值計算出來的,它被解釋為某種類型的平均值,通常是數據集的中位數,也有時是平均值

 

其中

  • Di是絕對離差,
  • xi是數據元素,
  • m(X)是所選數據集集中趨勢的度量,有時是平均數 ),但最常見的是中位數

度量

平均離差(帶符號)

對於無偏估計量,在任意的大樣本的情況下,所有可能的觀測的集合到未知的總體參數值的帶符號離差的均值為零。但是構造上,樣本值與樣本均值的有符號離差的平均值始終為零,而與其他集中趨勢度量(例如樣本中位數)的平均帶符號離差未必為零。

分散程度

離差分佈的統計數據被用作離散程度的度量。

  • 標準差是常用的離散程度度量:它使用平方差,有一些很好的特性,但不穩健。
  • 平均絕對離差是離差絕對值之和除以觀測次數。
  • 絕對中位差是一個穩健的統計量,它使用絕對離差的中值,而不是平均值。
  • 最大絕對離差是一種高度不穩健的度量,它是絕對值最大的離差。

標準化

離差具有和樣本相同的單位。可以通過兩種方式進行無量綱化英語nondimensionalize

一種方法是除以尺度度量(離散程度),通常是標準化中的總體標準差,或T-標準化中的樣本標準差。

也可以按位置而不是分散進行縮放:百分比偏差是觀測值減去接受值除以真值乘以100%。

參考文獻

  1. ^ 虞昊. 第2章 概率統計基礎知識. 现代防雷技术基础. 清華大學出版社. 2005: 28. 隨機變量對 的離差(又稱距平) 

參見