正态分布的基本描述:
在概率论里面,正态分布(或者叫高斯分布)是非常常见的连续概率分布。由于存在中心极限定理,这使得正态分布十分有用。中心极限定理表明,在观测数据非常大的时候,具有独立分布的独立随机变量的观测样本的平均值是收敛于正态分布的。正态分布的概率密度函数为:
这里μ是分布的均值,或者叫期望值;σ是标准差;σ的平方是方差。
另外,一个具有高斯分布的随机变量也被称为是具有正态分布的,这个变量被称为正态偏差。
标准正态分布:
当μ=0和σ=1的时候,正态分布就是标准正态分布了。标准正态分布的概率密度函数如下:
标准正态分布是关于x=0对称的,并且在x=0的时候获得最大值
,而且标准正态分布的有两个拐点,分别是x=+1和x=-1。
通用正态分布:
每一个正态分布都可以看成是由标准正态分布转化而成的,通过将标准正态分布的定义域先使用标准差σ进行拉伸,然后再平移μ个单位得到。公式如下。
假定Z是一个标准的正态偏差,X=σZ+μ也是具有正态分布的正态偏差,X的期望值为μ,标准差为σ。相反的,如果X是一个期望值为μ、标准差为σ的正态偏差的话,那么通过转换Z=( X - μ ) / σ会得到一个标准正态分布,得到的变量Z也可以叫做X的标准形式。
另外,每一个正态分布都可以写成以二次函数为自然常数的指数的形式。
这里
且
。在这种形式下,正态分布的均值为
,方差为
。当正态分布为标准正态分布的时候,
,
和
。
正态分布的表示符号:
正态分布经常可以用
和
表示。因此,当一个随机变量X是一个均值为μ和标准差为σ的正态偏差时,我们可以用这个形式表达:
。
正态分布的属性:
①正态分布是关于x = μ对称的。
②正态分布曲线有两个拐点,分别在离均值一个标准差的位置,为x=μ-σ和x=μ+σ。
③对于任意的正态偏差X,Z = ( X - μ ) / σ是一个标准正态偏差。
④对于特定的期望值和方差,正态分布是具有最大熵的连续分布。
⑤由于对于离期望值好几个标准差范围之外的取值,它们的概率趋近于0。
⑥正态分布概率的覆盖范围遵循68-95-99.7的规定,这个规定又称为3-sigma规定。也就是说在距离均值一个标准差的范围内的取值的概率大概是68%,在两个标准差范围大概是95,在三个标准差范围大概是99.7%。
正态偏差上的操作:
①对正态偏差进行线性变换得到的也是正态偏差,如Y = aX + b,当X具有正态分布时,Y也具有正态分布。当X的期望值为μ,标准差为σ的时候,Y的期望值为aμ+b,标准差为|a|*σ。
②当X1和X2为两个独立的具有正态分布的随机变量时,如果它们的期望值分别是μ1和μ2,标准差为σ1和σ2,那么X1+X2也是具有正态分布的,对应的期望值为μ1+μ2,方差为σ1的平方加σ2的平方。
③独立正态偏差的线性组合也是一个正态偏差。
④无限可分性:对于任意正整数n,任意均值为μ和标准差为σ的正态分布都是n个独立正态偏差的和,每一个正态偏差均值为μ/n和方差为σ的平方除以n。
⑤Cramer分解定理:如果X1和X2都是独立随机变量且他们的和满足满足正态分布的话,那么,X1和X2一定是正态偏差。换句话说就是,当且仅当两个分布是正态分布时它们的卷积才是正态分布。
⑥Bernstein‘s定理:如果X和Y是独立的并且X+Y和X-Y也是独立的,那么X和Y都必须是满足正态分布的。
正太分布的属性图:
参考资料:
正态分布-维基百科 https://en.wikipedia.org/wiki/Normal_distribution
深度学习或者机器学习中,我们经常提到的数据集、样本,我们假设它属于
正态分布
(高斯分布)或者标准
正态分布
。
1.
正态分布
的平均数为μ,标准差为σ;不同的
正态分布
可能有不同的μ值和σ值,
正态分布
曲线形态因此不同。
2.标准
正态分布
平均数μ=0,标准差σ=1,μ和σ都是固定值;标准
正态分布
曲线形态固定。
当数据集、样本的分布被假设属于标准
正态分布
,可以得知每个类别在数据集里出现的频率是相等的,便于后面计算。
我们来对某一个年级做一项调查,看一看这个年级到底有多巨。于是,他们统计了每个同学一周刷题的时间。得到的结果如下:
可以看出,大多数人每周都有7-8个小时做题,有少部分蒟蒻(比如我)每周只有1-3个小时做题,而一些神犇(比如这位)每周有13-15个小时刷题。
整个图表大致上是轴对称的。中间最多,两边最少。这种分布图称为
正态分布
。
正态分布
又称为高斯分布,他是由高斯发现的。
正态分布
也是最常...
正态分布
(台湾作常态分布,英语:n
orm
al
distribution
)又名高斯分布(英语:Gaussian
distribution
),是一个非常常见的连续概率分布。
正态分布
在统计学上十分重要,经常用在自然和社会科学来代表一个不明的随机变量。
若随机变量XXX服从一个位置参数为μ\muμ、尺度参σ\sigmaσ的
正态分布
,记为:
正态分布
的数学期望值或期望值μ\muμ 等于位置参数,决定了分布的位置;其方差σ2\sigma ^{2}σ2的开平方或标准差σ\sigmaσ等于尺度参数,决定了分布的幅度。
正态分布
(n
orm
al
distribution
)
1、描述的是连续型随机变量
2、如果一个连续型随机变量的probability density function f(x)符合下面的等式,就说明这个随机变量符合
正态分布
。
标准
正态分布
(standard n
orm
al
distribution
)
如果一个
正态分布
的随机变量的均值为0, 方差为1,那么这个分布就是标准
正态分布
。
标准
正态分布
的一些特性
标准
正态分布
的例子
转自:http://blog.csdn.net/rns521/article/details/6953591
正态分布
(N
orm
al
distribution
)又名高斯分布(Gaussian
distribution
),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。
若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布,记为:
上一篇讲了三个典型的离散分布(离散分布概率:几何分布、二项分布和泊松分布https://blog.csdn.net/weixin_41140174/article/details/99634408),这篇开始进入连续型概率分布,最常用的“
正态分布
”。
1. 连续型概率分布和离散型概率分布
离散型概率分布:几何分布、二项分布、泊松分布都是离散型概率分布,一般是求事件出现次数的概率,次数是整数,其...
多元
正态分布
(Multivariate N
orm
al
Distribution
)是在多元统计分析中常用的一种概率分布模型。它是一种由多个
正态分布
组成的联合分布。
多元
正态分布
包含了多个随机变量,每个变量都服从
正态分布
。与单变量
正态分布
类似,多元
正态分布
也由均值向量和协方差矩阵所确定。
在多元
正态分布
中,均值向量代表各个随机变量的平均值。协方差矩阵则
表示
各个变量之间的关联性和变异性。
多元
正态分布
有许多重要的特性。首先,它是一个典型的钟形曲线,集中于均值处。其次,协方差矩阵描述了不同变量之间的相关性。如果两个变量具有正相关,则它们的取值趋于同时增加或减少;如果两个变量具有负相关,则一个变量增加时,另一个变量会减小。最后,多元
正态分布
还具备线性组合的性质,即对于该分布中的多个随机变量,其线性组合也是
正态分布
。
多元
正态分布
在许多领域有着广泛的应用,特别是在统计学、金融学、经济学、生物学和工程学等学科中。通过多元
正态分布
,我们可以对多个变量的分布进行建模和分析,理解它们之间的关系,并进行概率推断和假设检验。
总而言之,多元
正态分布
是多元统计分析领域中常用的概率分布模型,通过均值向量和协方差矩阵的参数化来描述多个随机变量之间的关系。它的应用广泛,在许多领域中起着重要的作用。