广义线性混合模型GLMM （ Generalized Linear Mixed Model ），是 广义线性模型GLM 和 线性混淆模型LMM 的扩展形式，于二十世纪九十年代被提出。GLMM因其借鉴了混合模型的思想，其在处理 纵向数据 （ 重复测量资料 ）时，被认为具有独特的优势。GLMM不仅擅长处理重复测量资料，还可以用于 任何层次结构的数据 （因为本质上又是 多水平模型 ）。

提到GLMM，有必要先介绍几个容易混淆的概念：GLM、LMM、MLM、GMM 和GEE。

广义线性混合模型 GLMM

广义线性混合模型GLMM，可以看做是线性混合模型LMM的扩展形式，使得因变量不再要求满足正态分布；也可以看作是GLM的扩展形式，使得可以同时包含 固定效应 和 随机效应 。

回顾一下，LMM模型的一般形式为：

$y$ 是N*1的向量，表示观测值；X是N*p的矩阵，表示 固定效应 自变量； $\beta$ 是p*1的向量，表示固定效应参数向量；Z是N*q的矩阵，表示 随机效应 变量； $\gamma$ 是q*1的向量（ $\gamma$ 在某些版本中也写成 $u$ ），表示随机因子的效应值； $\epsilon$ 是N*1的向量，表示残差（随机误差）。

GLMM在此基础上做了一些改动。令 linear predictor, $\eta$ , 表示固定效应和随机效应的组合（随机误差不包含在内），即：

令g(⋅)表示link function，用来连接 linear predictor 和 label，h(⋅)为g(⋅)的反函数，即response function。则有：

$g(E(y))=\eta , E(y)=H(\eta )=u$ ，因此： $y=h(\eta )+\epsilon$

此处的 link function 和 response function 的示例，请直接参考GLM中的介绍（但此处会额外接触到几个概念：带随机效应的Logistic回归中的 probability density function 或简称PDF，和带随机效应的Poisson回归中的probability mass function 或简称PMF）。结果的解读，和GLM中的解读类似，细微的差别仅在于随机效应部分的解读。

借鉴知乎上的一个理解：

举个例子，我们认为疗效可能与服药时间相关，但是这个相关并不是简简单单的疗效随着服药时间的变化而改变。更可能的是疗效的随机波动的程度与服药时间有关。比如说，在早上10：00的时候，所有人基本上都处于半饱状态，此时吃药，相同剂量药物效果都差不多。但在中午的时候，有的人还没吃饭，有的人吃过饭了，有的人喝了酒，结果酒精和药物起了反应，有的人喝了醋，醋又和药物起了另一种反应。显然，中午吃药会导致药物疗效的随机误差非常大。这种疗效的随机误差（而非疗效本身）随着时间的变化而变化，并呈一定分布的情况，必须用广义线性混合模型了。对于固定效应来说，参数的含义是，自变量每变化一个单位，应变量平均变化多少。而对于随机效应而言，参数是服从正态分布的一个随机变量，也就是说对于两个不同的自变量的值，对应变量的影响不一定是相同的。

一篇文献以一个案例对以上几种模型进行了比较，值得一读：GEE、GLMM和MLM分析卫生重复测量资料的效果比较

万崇华等. 高级医学统计学. 科学出版社.

Wiki: Generalized_linear_model

Wiki: Mixed_model

Wiki: Generalized_linear_mixed_model

Introduction to generalized linear mixed models

GLM(广义线性模型) 与 LR(逻辑回归) 详解

周婷,兰蓝,邱建青,杜春霖,李晓松,张韬.GEE、GLMM和MLM分析卫生重复测量资料的效果比较[J].现代预防医学,2017,44(16):2881-2885+2899

R中的广义线性混合模型教程该存储库包含（相对）简短的教程，介绍使用R拟合和比较模型的广义线性混合模型（ GLM M）。本教程的一般内容是由Richard McElreath出色的统计学课程“ Statistical Rethinking”启发而来的。有关该材料的最新信息，可以在理查德的找到。特别是，我编写此脚本时借鉴了课程期末考试中出现的一系列问题。这些练习对我来说尤其具有启发性，因为它们说明包含随机效应（又称变化效应）不仅可以改变相对模型排名，而且还强调，添加随机效应可以极大地改变我们对固定效应的估计（即，通常情况下，关心我们的模型中的大多数）。本教程使用R软件包lme4 ， AICcmodavg和rethinking 。赤池的信息准则（AIC）用于比较拟合模型。储存库内容 glm m_tutorial_script.R文件包含我的代码和教程注释 glm m_tutorial_d 同时，在机器学习中，我们称 w 和 b 为线性模型的超参数，满足等式条件的（w，b）组合可能不只一种，所有的超参数构成了一个最优参数集合。注意，这里用”尽可能地准确“这个词，是因为在大多数时候，我们是无法得到一个完美拟合所有样本数据的线性方程的，即直接基于输入数据构建的多元线性方程组在大多数时候是无解的。损失函数用来评价模型的预测值和真实值不一样的程度，损失函数越好，通常模型的性能越好。，选择一个特定的超参数（w，b），使得模型具备最好的泛化能力，机器学习算法的目的不是解方程，而是获得最好的泛化能力。重复测量数据有几个明显的特征，一是个体内数据是反复收集的，同一对象的多次观测结果往往不独立(存在相关性)，二是变异来源上看有个体内变异和个体间变异，三是数据可能存在缺失值。有多个统计模型可以实现重复测量数据的分析：【1】一般线性模型中的重复测量方差分析，可以采用一元方差分析和多元方差分析。重复测量方差分析要求还是比较苛刻的，要求多元正态性、组间方差-协方差矩阵相等(Box’M检验)，数据... 《统计学习方法》虽然分别对两者作了介绍，但没有深入讨论它们之间的联系。本文准备从最大熵模型出发，推导出逻辑斯谛回归模型，并解释两者的联系与区别。本文主要从以下几个方面进行描述：最大熵原理的数学解释如何理解条件分布的极大似然函数将最大熵模型转化为逻辑斯谛模型一、从最大熵模型到逻辑斯谛回归（一）最大熵模型最大熵原理我们知道（参考第5章）信息熵用于衡量一个随机变量的“不确定性”，熵越大，表示随机变量的不确定性越高。也证明了，当随机变量为均匀分布的时候，它的熵最大。 “最大熵原理”的意思之前我们已经探讨了，在构建 GLM 模型之前，如何进行数据预处理，接下来就介绍一下正式的建模过程。首先我们要做的是进一步具体地分析我们应该选择模型的变量。第一步是对一个个变量单独建模，观察他们的p值：这个p值就是假设检验的p值，意思就是我们对模型的参数进行假设检验： H0:βj=0 H_0 : \beta _j = 0 H0:βj=0 检验的就是变量的参数在等于0和不等于0的情况下（bet... GLM M（generalized linear mixed model）广义线性混合模型中的关键是“mixed”，“mixed”是区别于一般的 GLM （generalized linear model）的显著体现。一般的 GLM 指的就是要求因变量符合“指数分布族”即可。关于 GLM 的详细解释可以在stata的help文档中看到， GLM 的两个核心是 Family 和 Link。其中Family指的就是因变量的分布函数，常见的几种因变量的分布如下：连续变量——Gaussian分布/正态分布 binary变量（0， GLM 一般是指 generalized linear model ，也就是广义线性模型；而非 general linear model，也就是一般线性模型；而 GLM M （generalized linear mixed model）是广义线性混合模型。广义线性模型 GLM 很简单，举个例子，药物的疗效和服用药物的剂量有关。这个相关性可能是多种多样的，可能是简单线性关系（发烧时吃一片... 三部分：固定项age，随机项(1|subject)和误差项ε。为什么要加上一个随机项这部分呢？在线性模型中我们将所有的不感兴趣的因素，非系统性的因素，不可预测的因素造成的误差统统由一个ε来代替。这样我们求出的... 为什么要用混合线性模型：比如测量了不同收入水平的人群的收入和幸福感，但每个群体内收入水平是不同的，幸福感也不同，两者之间的关系也是不同的，如果直接用一般线性模型，会造成错误的结论，这个时候要考察的是可以推广到不同收入群体的收入和幸福感之间的关系（即考察的关系不仅可以应用于当前的收入群体，还可以应用到其他的群体）。这时候需要用到混合线性模型（或者层次线性模型）。 R中混合线性模型 ... 笔者做过国赛也做过美赛，其中一类典型问题就是分析相关性，从而进行预测或者其他操作。这类问题通常情况下属于比较常规的问题，一般通过matlab或SPSS分析相关性，得到一个较好的数值即可。然而有的时候不论取哪两个或者哪几个变量，相关性都弱得令人发指，以至于无法昧着良心继续煞有介事地絮叨他们之间的相关性，这个时候，如果变量较多，可以考虑广义相加模型，实质是分析因变量与多个自变量之间的相关性。目... 0. 飞哥感言这篇文章，主要是介绍了抗性数据，如何利用 GLM M 模型进行的分析，文中，他将9级分类性状变为了二分类性状，进行分析。分析中用到了加性效应（A矩阵），空间分析（行列信息）。对比了SAS和ASReml，结果基本一致。其实，9分级性状，可以直接使用ASReml进行有序多分类性状分析，用累计Logistic 模型分析，也可以考虑系谱数据和空间位置信息。这样效果应该更好。回头找下数据，测试一下。 1. 文献 Genetic analysis of resistance to Pseudomona 进行数据分析时，会发现有时候一个模型中的变量之间可能具有相关性（correlation），比如面积和长度就具有高度的相关性，如果同时对这些参数建模，就存在共线性问题，所以一般是只针对其中一个参数建模。而这种相关性，其实还存在于数据之中，比如时间序列数据，在不同的时间，同一个对象的数据之间就是相互有联系的，那么我们应该怎么对这些具有相关性的数据进行建模分析呢。在进一步分析之前，再次强调一下，这里...

相关模型简介

广义线性模型 GLM

线性混合模型 LMM

多水平模型 MLM

高斯混合模型 GMM

广义估计方程 GEE

广义线性混合模型 GLMM