分层广义线性模型

在统计学中，分层广义线性模型（hierarchical generalized linear models (HGLM)）可视为广义线性模型的推广。在广义线性模型中，误差分量是统计独立的，^[1] 然而这一假设并非总是成立的。即在有些情况下，误差项之间有函数关系。分层广义线性模型允许有不同的误差分量，误差分量可以统计相关的，并不必要满足正态分布。当有不同的聚类存在时，同一聚类中的观测值是相关的，并且是正相关的。在这种情况下，广义线性模型是不适用的，忽略这些关联会引起造成一些问题^[2] 。

概论

模型

在分层模型中，观测值可进行聚类，并且观测值的分布不仅由所有聚类的共同结构决定，也由聚类的具体结构决定。于是，模型要引入随机效应分量，并且不同的聚类有不同的随机效应分量。设 $y$ 为响应变量， $u$ 为随机效应， $g$ 为连结函数。在分层广义线性模型中，需要假设 $y|u$ 和 $u$ 满足：^[3] $y\mid u\sim \ f(\theta ,\,\phi )$ and $u\sim \ f_{u}(\alpha ).$

线性预测器形式为：

g(E(y))=g(\mu )=\eta =X\beta +v\,

其中， $\mu =E(y)$ ， $\eta =X\beta +v$ ， $v=v(u)$ 为 $u$ 的严格单调函数。在分层广义线性模型中，固定效应为 $\beta$ ，对所有观测值都相同。随机分量 $u$ 是不可观测的，不同聚类对应的随机分量取值是随机的。于是，同一聚类的观测值对应的 $u$ 的取值相同，不同聚类的观测值对应的 $u$ 的取值也不同。^[2]

可识别性

为了进行参数推断，有必要保证满足可识别性（英语：Identifiability）^[4] 。在以上模型中，v是不可识别的，因为

X\beta +v=(X\beta +a)+(v-a)\,

其中 $a$ 为常数。^[3] 要使模型可识别，需要对参数另加约束。约束常加在随机效应上，比如 $E(v)=0$ 。^[3]

不同分布函数和链接函数的模型

假设不同的分布函数 $y\mid u$ 和 $u$ ，采用不同的链接函数 $g$ 和 ' $v$ ，可以得到不同的模型。另外，广义线性混合模型（英语：generalized linear mixed model）是分层广义线性模型的一个特例。在分层广义线性模型中，随机效应的分布函数 $u$ 不必要满足正态分布。如果 $u$ 的分布为正态分布， $v$ 的链接函数为恒等函数，此时的分层广义线性模型即为广义线性混合模型。^[3]

$y\mid u$ 和 $u$ 的分布可取为共轭分布，此时分层广义线性模型有一些特殊的性质，并且易于计算和理解^[3]。比如，如果 $y\mid u$ 的分布为平均值一定的泊松分布， $u$ 的分布为伽玛分布，并取标准对数连接函数，则此时分层广义线性模型为泊松共轭分层广义线性模型。如果 $y\mid u$ 的分布为平均值一定的二项分布， $u$ 的分布为共轭贝塔分布，采用标准罗吉特连接函数，则此时分层广义线性模型为贝塔共轭模型。另外，广义线性混合模型其实就是正态共轭分层广义线性模型。^[3]

常见的模型总结如下：^[5]

Commonly used models
模型名字	y的分布	y 和 u的连接函数	u的分布	u 和 v 的连接函数
正态共轭	正态分布	恒等函数	正态分布	恒等函数
二项共轭	二项分布	罗吉特（英语：logit）	贝塔分布	罗吉特（英语：logit）
泊松共轭	泊松分布	对数	伽玛分布	对数
伽玛共轭	伽玛分布	倒数	逆伽玛分布	倒数
二项GLMM	二项分布	罗吉特（英语：logit）	正态分布	恒等函数
泊松 GLMM	泊松分布	对数	正态分布	恒等函数
伽玛 GLMM	伽玛分布	对数	正态分布	恒等函数

拟合

分层广义线性模型适用条件是观测值可归为不同的聚类。估计函数有两类：固定效应估计函数和随机效应估计函数，分别相应于 $\eta =\mathbf {x} {\boldsymbol {\beta }}$ 和 $\mathbf {v(u)}$ 中的参数。有多种方法进行分层广义线性模型中的参数估计。如果只对固定效应估计函数感兴趣，可以采用总体平均模型。如果要推断个体，就需要估计随机效应。^[2] 拟合分层广义线性模型有多种技术。

应用

分层广义线性模型在实际生活中有诸多应用。

工程

这一模型可用于分析半导体制造中相互关联的过程形成的负载的层级过程^[6]^[7]。工程师可以应用此模型发现和分析重要的次过程，同时评估这些次过程对最终性能的影响 ^[6]。

商业

市场问题也可以用分层广义线性模型来分析。研究者应用此模型研究了一国范围内的消费者，以解决国际市场研究中的嵌套数据结构问题^[8]。

参考文献

^ Generalized Linear Models. Chapman and Hall/CRC. 1989. ISBN 0-412-31760-5.
^ ^2.0 ^2.1 ^2.2 Agresti, Alan. Categorical Data Analysis. Hoboken, New Jersey: John Wiley & Sons, Inc. 2002. ISBN 0-471-36093-7.
^ ^3.0 ^3.1 ^3.2 ^3.3 ^3.4 ^3.5 Y. Lee and J. A. Nelder. Hierarchical Generalized Linear Models. Journal of the Royal Statistical Society, Series B. 1996,. Vol. 58, No. 4: 619–678. JSTOR 2346105.
^ Allman, Elizabeth S.; Matias; Rhodes; Elizabeth S. Allman, Catherine Matias, and John A. Rhodes. Identifiability of Parameters in Latent Structure Models with Many Observed Variables. The Annals of Statistics. 2009,. Vol. 37, No. 6A, (6A): 3099–3132. Bibcode:2008arXiv0809.5032A. arXiv:0809.5032  . doi:10.1214/09-AOS689.
^ Lars Rönnegård, Xia Shen and Moudud Alam. hglm: A Package for Fitting Hierarchical Generalized Linear Models. The R Journal. Dec 2010,. Vol. 2/2.
^ ^6.0 ^6.1 Naveen Kumar; Christina Mastrangelo; Doug Montgomery. Hierarchical Modeling Using Generalized Linear Models. Quality and Reliability Engineering International. 2011.
^ Chung Kwan Shin; Sang Chan Park. A machine learning approach to yield management in semiconductor manufacturing. International Journal of Production Research. 2000, 38 (17): 4261–4271. doi:10.1080/00207540050205073.
^ Tasoluk, Burcu; Burcu Tasoluk, Cornelia Dröge, Roger J. Calantone. Interpreting interrelations across multiple levels in HGLM models: An application in international marketing research. International Marketing Review. 2011,. Vol. 28 Iss: 1,: pp. 34–56. doi:10.1108/02651331111107099.

[1] Generalized Linear Models. Chapman and Hall/CRC. 1989. ISBN 0-412-31760-5.

[CDA-2] 2.0 ^2.1 ^2.2 Agresti, Alan. Categorical Data Analysis. Hoboken, New Jersey: John Wiley & Sons, Inc. 2002. ISBN 0-471-36093-7.

[paper1996-3] 3.0 ^3.1 ^3.2 ^3.3 ^3.4 ^3.5 Y. Lee and J. A. Nelder. Hierarchical Generalized Linear Models. Journal of the Royal Statistical Society, Series B. 1996,. Vol. 58, No. 4: 619–678. JSTOR 2346105.

[identifiability-4] Allman, Elizabeth S.; Matias; Rhodes; Elizabeth S. Allman, Catherine Matias, and John A. Rhodes. Identifiability of Parameters in Latent Structure Models with Many Observed Variables. The Annals of Statistics. 2009,. Vol. 37, No. 6A, (6A): 3099–3132. Bibcode:2008arXiv0809.5032A. arXiv:0809.5032  . doi:10.1214/09-AOS689.

[5] Lars Rönnegård, Xia Shen and Moudud Alam. hglm: A Package for Fitting Hierarchical Generalized Linear Models. The R Journal. Dec 2010,. Vol. 2/2.

[engg-6] 6.0 ^6.1 Naveen Kumar; Christina Mastrangelo; Doug Montgomery. Hierarchical Modeling Using Generalized Linear Models. Quality and Reliability Engineering International. 2011.

[7] Chung Kwan Shin; Sang Chan Park. A machine learning approach to yield management in semiconductor manufacturing. International Journal of Production Research. 2000, 38 (17): 4261–4271. doi:10.1080/00207540050205073.

[mktresearch-8] Tasoluk, Burcu; Burcu Tasoluk, Cornelia Dröge, Roger J. Calantone. Interpreting interrelations across multiple levels in HGLM models: An application in international marketing research. International Marketing Review. 2011,. Vol. 28 Iss: 1,: pp. 34–56. doi:10.1108/02651331111107099.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]