概率質量函數

PMF,統計學名詞

概率論統計學中,概率質量函數(probability mass function,簡寫作pmf)是離散隨機變量在各特定取值上的概率[1]。有時它也被稱為離散密度函數。 概率密度函數通常是定義離散概率分佈的主要方法,並且此類函數存在於其定義域是離散的純量變量或多元隨機變量英語Multivariate random variable

一個概率密度函數的圖像。函數的所有值必須非負,且總和為1。

概率質量函數概率密度函數的一個不同之處在於:概率質量函數是對離散隨機變量定義的,本身代表該值的概率;概率密度函數本身不是概率,只有對連續隨機變量的概率密度函數必須在某一個區間內被積分後才能產生出概率[2]

具有最大概率密度的隨機變量的值稱為眾數

數學定義

假設X是一個定義在可數樣本空間S上的離散隨機變量 SR,則其概率質量函數 fX(x) 為

 

注意這在所有實數上,包括那些X不可能等於的實數值上,都定義了 fX(x)。在那些X不可能等於的實數值上, fX(x)取值為0 ( xR\S,取Pr(X = x) 為0)。

離散隨機變量概率質量函數的不連續性決定了其累積分佈函數也不連續。

例子

概率質量函數可以定義在任何離散隨機變量上,包括常數分佈, 二項分佈(包括伯努利(Bernoulli)分佈), 負二項分佈, 泊松(Poisson)分佈, 幾何分佈以及超幾何分佈隨機變量上.

有限

存在三個相關的主要分佈,伯努利分佈二項式分佈、和幾何分佈

伯努利分佈

伯努利分佈:ber(p) ,用於對只有兩種可能結果的實驗進行建模。 這兩個結果通常編碼為1和0。

 

一個伯努利分佈的例子是拋硬幣。假設X是拋硬幣的結果,反面取值為0,正面取值為1。則在狀態空間{0, 1}(這是一個伯努利(Bernoulli)隨機變量)中,X = x的概率是0.5,所以概率質量函數

 

無限

以下呈指數下降的分佈是具有無限數量可能結果的分佈示例——所有正整數:

 

儘管可能的結果有無限多,但總概率密度為 1/2 + 1/4 + 1/8 +⋯ = 1,滿足概率分佈的單位總概率要求。

多變量情況

兩個或多個離散隨機變量具有聯合概率密度函數,它給出了隨機變量的每個可能的實現組合的概率。

參見

參考文獻

Template:概率分佈理論