超幾何分布(Hypergeometric distribution)是統計學上一种離散機率分布。它描述了由有限個物件中抽出 n {\displaystyle n} 個物件,成功抽出 k {\displaystyle k} 次指定種類的物件的概率(抽出不放回 (without replacement))。
1 n K ( N − K ) ( N − n ) ( N − 2 ) ( N − 3 ) ⋅ {\displaystyle \left.{\frac {1}{nK(N-K)(N-n)(N-2)(N-3)}}\cdot \right.} [ ( N − 1 ) N 2 ( N ( N + 1 ) − 6 K ( N − K ) − 6 n ( N − n ) ) + {\displaystyle {\Big [}(N-1)N^{2}{\Big (}N(N+1)-6K(N-K)-6n(N-n){\Big )}+{}}
例如在有 N {\displaystyle N} 個樣本,其中 K {\displaystyle K} 個是不及格的。超幾何分布描述了在該 N {\displaystyle N} 个样本中抽出 n {\displaystyle n} 個,其中 k {\displaystyle k} 個是不及格的個數:
上式可如此理解: ( N n ) {\displaystyle {\tbinom {N}{n}}} 表示所有在 N {\displaystyle N} 个样本中抽出 n {\displaystyle n} 个的方法数目。 ( K k ) {\displaystyle {\tbinom {K}{k}}} 表示在 K {\displaystyle K} 个样本中,抽出 k {\displaystyle k} 個的方法數目,即组合数,又稱二項式係數。剩下來的樣本都是及格的,而及格的樣本有 N − K {\displaystyle N-K} 个,剩下的抽法便有 ( N − K n − k ) {\displaystyle {\tbinom {N-K}{n-k}}} 若 n = 1 {\displaystyle n=1} ,超幾何分布退化為伯努利分布。
若随机变量 X {\displaystyle X} 服从参数为 n , K , N {\displaystyle n,K,N} 的超几何分布,则记为 X ∼ H ( n , K , N ) {\displaystyle X\sim H(n,K,N)} 。