标准差是统计中最广泛使用的分布度量。它告诉您典型值与平均值的距离 - 无论您的数据是紧密聚集的还是广泛分散的。一旦您手动完成一次计算,这个概念就会变得直观。

标准差告诉您什么

如果一个班级学生的平均考试成绩为 70 分,标准差为 5,则大多数分数落在 65 到 75 之间。如果标准差为 20,分数范围会更广 - 从 50 到 90 甚至更高。

小标准差意味着一致性。大的意味着可变性。

总体与样本标准差

有两个版本,选择正确的一个很重要:

总体标准差 (σ): 当您拥有您关心的群体中每个成员的数据时使用。除以 n

样本标准差: 当您的数据是从较大总体中抽取的样本时使用。除以 n − 1 (贝塞尔校正,它解释了采样引入的不确定性)。

在实践中,您几乎总是使用样本标准差 - 除非您正在分析完整的人口普查或没有缺失成员的受控数据集。

逐步计算

数据集: 4, 7, 13, 2, 1(5个值的样本)

第 1 步:计算平均值

Mean (x̄) = (4 + 7 + 13 + 2 + 1) / 5 = 27 / 5 = 5.4

第 2 步:找出与平均值的每个偏差

从每个值中减去平均值:

值(x) 偏差 (x − x̄)
4 4 − 5.4 = −1.4
7 7 − 5.4 = +1.6
13 13 − 5.4 = +7.6
2 2 − 5.4 = −3.4
1 1 − 5.4 = −4.4

步骤 3:对每个偏差求平方

平方消除负号并强调较大的偏差:

偏差 平方偏差
−1.4 1.96
+1.6 2.56
+7.6 57.76
−3.4 11.56
−4.4 19.36

步骤 4:对偏差平方求和

Sum = 1.96 + 2.56 + 57.76 + 11.56 + 19.36 = 93.2

步骤 5:除以 n − 1(样本标准差)

Variance (s²) = 93.2 / (5 − 1) = 93.2 / 4 = 23.3

第 6 步:求平方根

Standard deviation (s) = √23.3 = 4.83

解释: 此数据集中的值通常与平均值 5.4 相差约 4.83 个单位。

公式写出来

样本标准差:

s = √[ Σ(x − x̄)² / (n − 1) ]

总体标准差:

σ = √[ Σ(x − μ)² / n ]

其中 μ (mu) 是总体平均值。

经验规则(68-95-99.7 规则)

对于服从正态分布的数据,标准差与每个范围内的数据比例具有可靠的关系:

范围 数据比例
平均值±1标准差 〜68%
平均值±2标准差 〜95%
平均值 ± 3 标准差 ~99.7%

应用示例: IQ 分数的平均值为 100,SD 为 15。

  • 68% 的人得分在 85 到 115 之间
  • 95% 分数在 70 到 130 之间
  • 99.7% 分数在 55 至 145 之间

该规则仅适用于正态分布的数据。对于偏斜或重尾分布,请改用切比雪夫不等式。

方差与标准差

方差是平方偏差(上面的步骤 5)——标准偏差是它的平方根。两者都测量分布,但标准差以与原始数据相同的单位表示,使其更易于解释。

如果您的数据以千克为单位,则标准差也以千克为单位。您的方差以千克平方为单位,这很难有意义地解释。

常见应用

金融: 衡量投资波动性。日回报率和标准差较高的股票波动性更大——潜在收益更高,潜在损失也更高。

质量控制: 制造使用 SD 来确保产品保持在公差范围内。 SD 过大的流程会产生过多的缺陷品。

教育: 标准化测试分数。 z 分数告诉您分数高于或低于平均值的标准差有多少:z = (x − 平均值) / SD。

科学: 表达测量不确定性并比较实验结果。

计算快捷键

对于大型数据集,使用避免单独计算偏差的计算公式:

s² = [Σx² − (Σx)²/n] / (n − 1)

这在数学上是等效的,但只需要两次而不是三次遍历数据。

使用我们的标准偏差计算器 计算您输入的任何数据集的标准偏差、方差和完整细分。