概率积分变换

在概率论中，概率积分变换又称万流齐一 (Probability integral transform；Universality of the Uniform)^[1] 说明若任意一个连续的随机变量 (c.r.v)，当已知其累积分布函数 (cdf)为F_x(x)，可透过随机变量变换令Y=F_x(X)，则可变换为一 Y～U(0,1) 的均匀分布。换句话说，若设 Y 是 X 的一个随机变量变换，而恰好在给定 Y 是其累积分布函数 (cdf) F_x(X) 本身时，可以将此随机变量转化为一均匀 (0,1) 分布。

应用

在统计数据分析中，概率积分变换可用于确认一组观察结果是否能给定特定的分布合理地模型化。具体地来说，此定理能构成一个等值的集合，并进行测试是否成均匀分布以构建数据集。这方面的例子有P-P plot和K-S检验。

第二个用途是耦合(关联结构)，耦合是处理统计中的随机变量相关性问题的一种方法，由一组随机变量的边际分布来确定它们的联合分布。通过关联结构来确定一个联合分布的方法是基于如下的思想，透过此定理可以分别将每个边缘分布都转换为均匀分布的转换组成。这样，一个关联结构（dependence structure）就可以表达为一个基于上述所得平均分布之上的联合分布，而关联结构（copula）即是边缘均匀随机变数之上的一个联合分布。在实际应用中，上述的转换可能被设置为每个边缘变量的初始化步骤，或者上述转换的参数可能根据具体关联结构的对应参数设置。

第三种用途是透过此定理从均匀分布变换为特定分布：这被称为逆变换采样(inverse transform sampling)。

范例

当有一个任意的连续随机变量(c.r.v)，其累积分布函数(cdf)为F_x(x)，设Y定义为

Y=F_{X}(X)\,

具有均匀(0,1)分布

当已知Y～U(0,1)，设Y是X随机变量变换，我们令 X = g^-1(Y)，其中g(.)为一增函数，则g(x)恰为X 之累积分配函数(cdf)即

F_{X}(x)=g(x)\,

若更精确的定义，令X是具有标准正态分布N(0,1)的随机变量时，其累积分配函数(cdf)为:

\Phi (x)={\frac {1}{\sqrt {2\pi }}}\int _{-\infty }^{x}e^{-t^{2}/2}\,dt={\frac {1}{2}}{\Big [}\,1+\operatorname {erf} {\Big (}{\frac {x}{\sqrt {2}}}{\Big )}\,{\Big ]},\quad x\in \mathbb {R} ,\,

其中 $\operatorname {erf} (),$ 是误差函数。若将新的随机变量Y定义为Y=Φ(X）时，则呈均匀分布。

如果X呈指数分布X～Exp（ $\lambda$ ）其累积分配函数(cdf)为 $F_{X}(x)=1-e^{-\lambda x}$ ，当 $\lambda$ 为1时，则可得

　 $F_{X}(x)=1-e^{-x}\,$ 透过此定理可变换为

　 $Y=1-e^{-x}$ 服从均匀分布。

另外透过对称性，可得

　 $Y'=e^{-x}\,$

依然服从均匀分布。

来源

^ Dodge, Y. (2003) The Oxford Dictionary of Statistical Terms, OUP. ISBN 0-19-920613-9

参考文献

Dodge, Y. (2003) The Oxford Dictionary of Statistical Terms, OUP. ISBN 0-19-920613-9
Sklar, A. Fonctions de répartition à n dimensions et leurs marges. Publ. Inst. Statist. Univ. Paris. 1959, 8
张翔提纲挈领学统计

[1] Dodge, Y. (2003) The Oxford Dictionary of Statistical Terms, OUP. ISBN 0-19-920613-9

[1]

概率积分变换

目录

应用

范例

相关条目

来源

参考文献