正态分布(或高斯分布)是统计学中最重要的概率分布。它描述了多少自然现象的分布——测试分数、身高、测量误差、股票收益——并且是大多数统计推断和假设检验的基础。

公式

正态分布的概率密度函数为:

f(x) = (1 / (σ√(2π))) × e^(-(x-μ)²/(2σ²))

在哪里:

  • μ (mu) = 平均值(分布中心)
  • σ (sigma) = 标准差(分布的扩展)
  • x = 您正在评估的值
  • e ≈ 2.71828
  • π ≈ 3.14159

形状呈钟形曲线,大约 68% 的值落在平均值的 1 个标准差范围内,95% 的值落在平均值的 2 个标准差范围内,99.7% 的值落在 3 个标准差范围内(68-95-99.7 规则)。

工作示例

标准化测试的平均值为 100,标准差为 15。随机分数小于 115 的概率是多少?

首先,转换为 z 分数:

z = (115 - 100) / 15 = 1.0

z 分数为 1.0 意味着 115 比平均值高一个标准差。使用标准正态分布表或计算器,P(z ≤ 1.0) ≈ 0.8413 或 84.13%。

因此大约 84% 的考生得分低于 115 分。

关键属性

正态分布完全由其平均值和标准差定义。移动均值会使曲线向左或向右移动;增加标准差会使它变平并变宽。曲线下的总面积始终等于 1。

任何正态分布都可以使用上面的 z 分数公式转换为标准正态分布(均值 0,标准差 1)。这种标准化允许您使用一个通用标准表。

何时使用

在以下情况下使用正态分布:

  • 围绕中心值的数据集群
  • 值遵循钟形直方图
  • 中心极限定理适用(任何分布的样本均值近似正态)
  • 您正在进行假设检验或置信区间

大多数现实世界的连续数据大致遵循正态分布,这使其成为应用统计的主力。

## 尖端

在假设数据正常之前,使用直方图或 Q-Q 图检查正态性。如果数据严重倾斜或存在异常值,则正态分布可能不合适。对于非正态数据,使用非参数检验或数据转换。

使用我们的正态分布计算器 立即查找概率、百分位数和 z 分数。