高斯分布
其中参数: 被叫做均值, 被叫做方差,方差的平方根,由 给定,叫作标准差,方差的倒数 ,叫作精度。
根据上式,我们可以得到:
并且很容易证明高斯分布式高度归一化的,因此:
因此式(1.46)满足合理地概率密度函数的两个要求。
我们已经能够找到关于 的函数在高斯分布下的期望,特别地, 的平均值为:
的方差被定义为:
分布的最大值被叫做众数,对于高斯分布,众数与均值恰好相等。
对于 维向量 的高斯分布:
上式就是高斯分布的似然函数。
使用一个观测数据集来决定概率分布的参数的一个通用规则是寻找使似然函数取得最大值的参数值。简化后续数学分析和有助于数值计算,写作对数形式:
关于 ,最大化函数可以求得最大似然解:
这是样本均值,及观测到的{ }的均值。关于 最大化函数,我们求得方差的最大似然解:
这是关于样本均值 的样本方差,注意我们要同时关于 和 来最大化函数,但是在高斯分布的情况下, 的解和 无关,因此我们可以先对 求解,然后再对 求解。
下面的对于方差参数的估计是无偏的:
高斯分布公式
正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution),最早由A.棣莫弗在求二项分布的渐近公式中得到。C.F.高斯在研究测量误差时从另一个角度导出了它。P.S.拉普拉斯和高斯研究了它的性质。是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。由于一般的正态总体其图像不一定关于y轴对称,对于任一正态总体,其取值小于x的概率。只要会用它求正态总体在某个特定区间的概率即可。正态分布概念是由德国的数学家和天文学家Moivre于1733年首次提出的,但由于德国数学家Gauss率先将其应用于天文学家研究,故正态分布又叫高斯分布,高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作。但现今德国10马克的印有高斯头像的钞票,其上还印有正态分布的密度曲线。这传达了一种想法:在高斯的一切科学贡献中,其对人类文明影响最大者,就是这一项。在高斯刚作出这个发现之初,也许人们还只能从其理论的简化上来评价其优越性,其全部影响还不能充分看出来。这要到20世纪正态小样本理论充分发展起来以后。拉普拉斯很快得知高斯的工作,并马上将其与他发现的中心极限定理联系起来,为此,他在即将发表的一篇文章(发表于1810年)上加上了一点补充,指出如若误差可看成许多量的叠加,根据他的中心极限定理,误差理应有高斯分布。这是历史上第一次提到所谓“元误差学说”——误差是由大量的、由种种原因产生的元误差叠加而成。后来到1837年,海根(G.Hagen)在一篇论文中正式提出了这个学说。
高斯分布公式
高斯分布公式是X~N(μ,σ^2),Y=(X-μ)/σ所以P(x)=(2π)^(-1/2)*σ^(-1)*exp{[-(x-μ)^2]/(2σ^2)}。1、正态分布也称“常态分布”,又名高斯分布,最早由棣莫弗在求二项分布的渐近公式中得到。C.F.高斯在研究测量误差时从另一个角度导出了它。P.S.拉普拉斯和高斯研究了它的性质。是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。2、高斯定理(Gauss' law)是表明在闭合曲面内的电荷分布与产生的电场之间的关系。3、高斯定理在静电场情况下类比于应用在磁场学的安培定律,而二者都被集中在麦克斯韦方程组中。因为数学上的相似性,高斯定理也可以应用于其它由平方反比律决定的物理量,例如引力或者辐照度。4、设空间有界闭合区域,其边界为分片光滑闭曲面。函数及其一阶偏导数在上连续,即矢量穿过任意闭合曲面的通量等于矢量的散度对闭合面所包围的体积的积分。它给出了闭曲面积分和相应体积分的积分变换关系,是矢量分析中的重要恒等式,也是研究场的重要公式之一。
什么是高斯分布是不是正态分布两者有什么区别
高斯分布,也称正态分布,又称常态分布。 对于随机变量X,其概率密度函数如图所示。 称其分布为高斯分布或正态分布,记为N(μ,σ2),其中为分布的参数,分别为高斯分布的期望和方差。 当有确定值时,p(x)也就确定了,特别当μ=0,σ2=1时,X的分布为标准正态分布。 μ正态分布最早由棣莫佛于1730年在求二项分布的渐近公式时得到;后拉普拉斯于1812年研究极限定理时也被引入;高斯(Gauss)则于1809年在研究误差理论时也导出了它。 高斯分布的函数图象是一条位于x轴上方呈钟形的曲线,称为高斯分布曲线,简称高斯曲线。 1809年,高斯(Carl Friedrich Gauss,1777—1855)发表了其数学和天体力学的名著《绕日天体运动的理论》。 在此书末尾,他写了一节有关“数据结合”(data bination)的问题,实际涉及的就是这个误差分布的确定问题。 他的做法与拉普拉斯相同。 但在往下进行时,他提出了两个创新的想法。 一是他不采取贝叶斯式的推理方式,测量误差是由诸多因素形成,每种因素影响都不大。 按中心极限定理,其分布近似于正态分布是势所必然。 其实,早在1780年左右,拉普拉斯就推广了狄莫佛的结果,得到了中心极限定理的比较一般的形式。 可惜的是,他未能把这一成果用到确定误差分布的问题上来。 高斯的第二点创新的想法是:他把问题倒过来,先承认算术平均是应取的估计,然后去找误差密度函数条件下才能成立,这就是正态分布。 一种概率分布。 正态分布是具有两个参数μ和σ2的连续型随机变量的分布,第一参数μ是遵从正态分布的随机变量的均值,第二个参数σ2是此随机变量的方差,所以正态分布记作N(μ,σ2 )。 遵从正态分布的随机变量的概率规律为取μ邻近的值的概率大,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。 正态分布的密度函数的特点是:关于μ对称,在μ处达到最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点。 它的形状是中间高两边低,图像是一条位于x轴上方的钟形曲线。 当μ=0,σ2=1时,称为标准正态分布,记为N(0,1)。 μ维随机向量具有类似的概率规律时,称此随机向量遵从多维正态分布。 多元正态分布有很好的性质,例如,多元正态分布的边缘分布仍为正态分布,它经任何线性变换得到的随机向量仍为多维正态分布,特别它的线性组合为一元正态分布。 正态分布最早由A.棣莫弗在求二项分布的渐近公式中得到。 C.F.高斯在研究测量误差时从另一个角度导出了它。 P.S.拉普拉斯和高斯研究了它的性质。 高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作。 高斯是一个伟大的数学家,重要的贡献不胜枚举。 但现今德国10马克的印有高斯头像的钞票,其上还印有正态分布的密度曲线。 这传达了一种想法:在高斯的一切科学贡献中,其对人类文明影响最大者,就是这一项。