标准差是统计中最广泛使用的分布度量。它告诉您典型值与平均值的距离 - 无论您的数据是紧密聚集的还是广泛分散的。一旦您手动完成一次计算,这个概念就会变得直观。
标准差告诉您什么
如果一个班级学生的平均考试成绩为 70 分,标准差为 5,则大多数分数落在 65 到 75 之间。如果标准差为 20,分数范围会更广 - 从 50 到 90 甚至更高。
小标准差意味着一致性。大的意味着可变性。
总体与样本标准差
有两个版本,选择正确的一个很重要:
总体标准差 (σ): 当您拥有您关心的群体中每个成员的数据时使用。除以 n。
样本标准差: 当您的数据是从较大总体中抽取的样本时使用。除以 n − 1 (贝塞尔校正,它解释了采样引入的不确定性)。
在实践中,您几乎总是使用样本标准差 - 除非您正在分析完整的人口普查或没有缺失成员的受控数据集。
逐步计算
数据集: 4, 7, 13, 2, 1(5个值的样本)
第 1 步:计算平均值
Mean (x̄) = (4 + 7 + 13 + 2 + 1) / 5 = 27 / 5 = 5.4
第 2 步:找出与平均值的每个偏差
从每个值中减去平均值:
| 值(x) | 偏差 (x − x̄) |
|---|---|
| 4 | 4 − 5.4 = −1.4 |
| 7 | 7 − 5.4 = +1.6 |
| 13 | 13 − 5.4 = +7.6 |
| 2 | 2 − 5.4 = −3.4 |
| 1 | 1 − 5.4 = −4.4 |
步骤 3:对每个偏差求平方
平方消除负号并强调较大的偏差:
| 偏差 | 平方偏差 |
|---|---|
| −1.4 | 1.96 |
| +1.6 | 2.56 |
| +7.6 | 57.76 |
| −3.4 | 11.56 |
| −4.4 | 19.36 |
步骤 4:对偏差平方求和
Sum = 1.96 + 2.56 + 57.76 + 11.56 + 19.36 = 93.2
步骤 5:除以 n − 1(样本标准差)
Variance (s²) = 93.2 / (5 − 1) = 93.2 / 4 = 23.3
第 6 步:求平方根
Standard deviation (s) = √23.3 = 4.83
解释: 此数据集中的值通常与平均值 5.4 相差约 4.83 个单位。
公式写出来
样本标准差:
s = √[ Σ(x − x̄)² / (n − 1) ]
总体标准差:
σ = √[ Σ(x − μ)² / n ]
其中 μ (mu) 是总体平均值。
经验规则(68-95-99.7 规则)
对于服从正态分布的数据,标准差与每个范围内的数据比例具有可靠的关系:
| 范围 | 数据比例 |
|---|---|
| 平均值±1标准差 | 〜68% |
| 平均值±2标准差 | 〜95% |
| 平均值 ± 3 标准差 | ~99.7% |
应用示例: IQ 分数的平均值为 100,SD 为 15。
- 68% 的人得分在 85 到 115 之间
- 95% 分数在 70 到 130 之间
- 99.7% 分数在 55 至 145 之间
该规则仅适用于正态分布的数据。对于偏斜或重尾分布,请改用切比雪夫不等式。
方差与标准差
方差是平方偏差(上面的步骤 5)——标准偏差是它的平方根。两者都测量分布,但标准差以与原始数据相同的单位表示,使其更易于解释。
如果您的数据以千克为单位,则标准差也以千克为单位。您的方差以千克平方为单位,这很难有意义地解释。
常见应用
金融: 衡量投资波动性。日回报率和标准差较高的股票波动性更大——潜在收益更高,潜在损失也更高。
质量控制: 制造使用 SD 来确保产品保持在公差范围内。 SD 过大的流程会产生过多的缺陷品。
教育: 标准化测试分数。 z 分数告诉您分数高于或低于平均值的标准差有多少:z = (x − 平均值) / SD。
科学: 表达测量不确定性并比较实验结果。
计算快捷键
对于大型数据集,使用避免单独计算偏差的计算公式:
s² = [Σx² − (Σx)²/n] / (n − 1)
这在数学上是等效的,但只需要两次而不是三次遍历数据。
使用我们的标准偏差计算器 计算您输入的任何数据集的标准偏差、方差和完整细分。