後驗概率

貝氏統計學中的概念

貝葉斯統計中,一個隨機事件或者一個不確定事件的後驗概率(Posterior probability)是在考慮和給出相關證據或數據後所得到的條件概率。同樣,後驗概率分布是一個未知量(視為隨機變量)基於試驗和調查後得到的概率分布。「後驗」在本文中代表考慮了被測試事件的相關證據。

「posterior probability」的各地常用名稱
中國大陸後驗概率
臺灣事後機率
港澳後驗概率
日本、韓國漢字事後確率

定義

後驗概率是在給定證據 後,參數 的概率: 

似然函數相對,其為在給定了參數 後,證據 的概率: 

兩者有以下聯繫:

首先定義先驗概率服從以下概率分布函數 ,則樣本 的似然性為 ,那麼後驗概率可以定義為

 [1]

此處 為標準化常量,對於連續的 ,按如下方法計算

 

對於離散的 ,應對所有可能的 取值求和 

因此,後驗概率與似然性先驗概率的乘積是成比例的

實例

假設一個學校裡有60%男生和40%女生。女生穿褲子的人數和穿裙子的人數相等,所有男生穿褲子。一個人在遠處隨機看到了一個穿褲子的學生。那麼這個學生是女生的概率是多少?

使用貝葉斯定理,事件A是看到女生,事件B是看到一個穿褲子的學生。我們所要計算的是P(A|B)。

P(A)是忽略其它因素,看到女生的概率,在這裡是40%

P(A')是忽略其它因素,看到不是女生(即看到男生)的概率,在這裡是60%

P(B|A)是女生穿褲子的概率,在這裡是50%

P(B|A')是男生穿褲子的概率,在這裡是100%

P(B)是忽略其它因素,學生穿褲子的概率,P(B) = P(B|A)P(A) + P(B|A')P(A'),在這裡是0.5×0.4 + 1×0.6 = 0.8.

根據貝葉斯定理,我們計算出後驗概率P(A|B)

 

可見,後驗概率實際上就是條件概率。

計算

根據貝葉斯定理,一個隨機變量在給定另一隨機變量值之後的後驗概率分布可以通過先驗概率分布似然函數相乘並除以歸一化常數求得

 

上式為給出了隨機變量 在給定數據 後的後驗概率分布函數,式中

  •   的先驗密度函數,
  •   的似然函數,
  •  為歸一化常數,
  •  為考慮了數據  的後驗密度函數。

置信區間

後驗概率是考慮了一系列隨機觀測數據的條件概率。對於一個隨機變量來說,量化其不確定性非常重要。其中一個實現方法便是提供其後驗概率的置信區間

參見

引用

  1. ^ Christopher M. Bishop. Pattern Recognition and Machine Learning. Springer. 2006: 21–24. ISBN 978-0-387-31073-2.