标准差告诉您数据在平均值周围的分布情况。标准差小意味着数据聚类紧密;大的意味着它分布广泛。
为什么标准差很重要
两个班级的测试平均成绩均为 75%。但在 A 级,分数范围为 70-80%。 B 类的分数范围为 40-100%。平均值隐藏了重要信息,而标准差则揭示了这一点。
公式
对于总体(所有数据):
σ = √[ Σ(x - μ)² / N ]
对于样本(数据子集):
s = √[ Σ(x - x̄)² / (n-1) ]
在哪里:
- σ (sigma) = 总体标准差
- s = 样本标准差
- x = 每个值
- μ 或 x̄ = 平均值
- N = 总体规模,n = 样本规模
示例公式除以 n-1(而不是 n)以纠正子集估算时的偏差。
分步示例
数据:4、7、13、2、9(5 个值的样本)
第 1 步: 计算平均值:
Mean = (4 + 7 + 13 + 2 + 9) / 5 = 35 / 5 = 7
步骤 2: 从每个值和平方中减去平均值:
| x | x - 平均值 | (x - 平均值)² |
|---|---|---|
| 4 | -3 | 9 |
| 7 | 0 | 0 |
| 13 | 6 | 36 |
| 2 | -5 | 25 |
| 9 | 2 | 4 |
第 3 步: 将平方差相加:9 + 0 + 36 + 25 + 4 = 74
步骤 4: 除以 n-1 = 4:74 / 4 = 18.5
步骤5: 求平方根:√18.5 ≈ 4.30
标准差 = 4.30
68-95-99.7 规则
对于正态分布的数据:
- 68% 的值落在平均值的 ±1 标准差范围内
- 95% 落在 ±2 个标准偏差内
- 99.7% 落在 ±3 个标准偏差范围内
示例: 平均身高 170 厘米,标准差 10 厘米:
- 68% 身高在 160–180 厘米之间
- 95% 的身高在 150–190 厘米之间
实际应用
- 金融:衡量投资波动性(风险)
- 制造:质量控制 — ±3σ 之外的产品为缺陷
- 医学:识别异常测试结果
- 教育:曲线评分
使用我们的标准偏差计算器 计算任何数据集的平均值、中位数、方差和标准差。