在广义线性模型中,相比简单线性模型,这是对因变量Y进行了变换,使变换后的Y和X呈线性关系
分类:简单广义线性回归(simple glm);多元广义线性回归(multiple glm)
其中,X可以是各种类型的变量(连续、分类)
需要考虑的两个问题,如上图所示。平时使用的linear regression, logistic regression, poisson regression, log-binomial regression等都属于glm的范畴。常用的方法,所对应的family和link如下表所示
# linear regression
regress price weight length mpg i.rep78
glm price weight length mpg i.rep78, family(gaussian) link(identity)
# logistic regression
logistic low age i.smoke i.race
glm low age i.smoke i.race, family(binomial) link(logit)
glm low age i.smoke i.race, family(binomial) link(logit) eform
以上为简要笔记~
广义线性模型
(GLM) 是一个强大的统计框架,它扩展了经典线性回归模型以处理各种数据类型和分布。1970 年代,
统计学
家 John Nelder 和 Robert Wedderburn 引入了 GLM,已成为从流行病学和金融学到生态学和社会科学等领域不可或缺的工具。本文全面概述了 GLM,探讨了它们的基本概念、关键组件和实际应用。
今天我来介绍一种在机器学习中应用的比较多的模型,叫做
广义线性模型
(GLM)。这种模型是把自变量的线性预测
函数当作因变量的估计值。在机器学习中,有很多模型都是基于
广义线性模型
的,比如传统的线性回归模型,最大熵
模型,Logistic回归,softmax回归,等等。今天主要来学习如何来针对某类型的分布建立相应的
广义线性模型
。
Contents
1.
广义线性模型
的认识
一般我们了解的线性模型是针对连续性变量,并且服从正态分布的,但是在实际应用上显得非常的局限。因为我们我看到的数据很多都是离散的,而且不是服从正态分布的。针对这种情况,对传统线性模型进行推广,行成了现在的
广义线性模型
。
广义线性模型
使得变量从正态分布拓展到指数分布族,从连续型变量拓展到离散型变量,这就使得在现实中有着很好的运用,下面开始介绍
广义线性模型
。
###
广义线性模型
(GLM)定义
由以下三...
广义线性模型
(
Generalized
Linear
Model
s,简称GLM)是一种用于描述响应变量与一组解释变量之间关系的高级统计模型
广义线性模型
是一种强大的统计工具,适用于多种数据分析场景,但其有效性和可靠性取决于正确应用模型和满足其假设条件。通过
广义线性模型
,研究人员和数据分析专家能够更好地理解和预测复杂的数据关系,从而在各个领域做出更准确的决策和预测。
广义线性模型
通过三个核心组成部分来描述响应变量与预测变量之间的关系:随机成分、系统成分和链接函数。随机成分随机成分指响应变量的分布类型,通常属于指数族分布。常见的分布包括正态分布、二项分布、泊松分布等。这些分布的概率密度函数或概率质量函数可以表示为指数族的形式,这使得它们在理论和应用中非常便利。fy;fy;θhyexpηθ⋅Ty−Aθ其中,θ( \theta )θ是自然参数,Ty。
在讨论
广义线性模型
之前,先回顾一下基本线性模型,也就是线性回归。
在线性回归模型中的假设中,有两点需要提出:
(1)假设因变量服从高斯分布:$Y={{\theta }^{T}}x+\xi $,其中误差项$\xi \sim N(0,{{\sigma }^{2}})$,那么因变量$Y\sim N({{\theta }^{T}}x,{{\sigma }^{2}})$。
广义线性模型
是一种范围更广、功能更强大的一大类模型,其组成可分为因变量、线性部分和连接函数。许多广泛应用的统计模型都可以归入其中,如一般线性模型仅是它的一个子集。因而,
广义线性模型
更具有普遍性,进一步扩展了一般线性模型的应用,大大扩宽了其适用范围。
广义线性模型
与一般线性模型区别: 1.一般线性模型要求因变量符合正态分布,不同取值之间要相互独立,而且还要符合方差齐性。
广义线性模型
的因...