正态分布(或高斯分布)是统计学中最重要的概率分布。它描述了多少自然现象的分布——测试分数、身高、测量误差、股票收益——并且是大多数统计推断和假设检验的基础。
公式
正态分布的概率密度函数为:
f(x) = (1 / (σ√(2π))) × e^(-(x-μ)²/(2σ²))
在哪里:
- μ (mu) = 平均值(分布中心)
- σ (sigma) = 标准差(分布的扩展)
- x = 您正在评估的值
- e ≈ 2.71828
- π ≈ 3.14159
形状呈钟形曲线,大约 68% 的值落在平均值的 1 个标准差范围内,95% 的值落在平均值的 2 个标准差范围内,99.7% 的值落在 3 个标准差范围内(68-95-99.7 规则)。
工作示例
标准化测试的平均值为 100,标准差为 15。随机分数小于 115 的概率是多少?
首先,转换为 z 分数:
z = (115 - 100) / 15 = 1.0
z 分数为 1.0 意味着 115 比平均值高一个标准差。使用标准正态分布表或计算器,P(z ≤ 1.0) ≈ 0.8413 或 84.13%。
因此大约 84% 的考生得分低于 115 分。
关键属性
正态分布完全由其平均值和标准差定义。移动均值会使曲线向左或向右移动;增加标准差会使它变平并变宽。曲线下的总面积始终等于 1。
任何正态分布都可以使用上面的 z 分数公式转换为标准正态分布(均值 0,标准差 1)。这种标准化允许您使用一个通用标准表。
何时使用
在以下情况下使用正态分布:
- 围绕中心值的数据集群
- 值遵循钟形直方图
- 中心极限定理适用(任何分布的样本均值近似正态)
- 您正在进行假设检验或置信区间
大多数现实世界的连续数据大致遵循正态分布,这使其成为应用统计的主力。
## 尖端
在假设数据正常之前,使用直方图或 Q-Q 图检查正态性。如果数据严重倾斜或存在异常值,则正态分布可能不合适。对于非正态数据,使用非参数检验或数据转换。
使用我们的正态分布计算器 立即查找概率、百分位数和 z 分数。