标准差是统计中最广泛使用的分布度量。它告诉您值在平均值周围的分布情况。本指南从基本原理和实例进行了解释。
标准差告诉您什么
平均值告诉您数据集的中心。标准差告诉您值通常偏离该中心有多远。
低标准偏差 → 值紧密聚集在平均值周围 高标准差 → 值与平均值相差很大
两个考试班的平均分都是 70%,但是:
- A 级:分数为 68、69、70、71、72 — SD ≈ 1.4(非常一致)
- B 级:分数为 40、55、70、85、100 — SD ≈ 22.4(高度可变)
均值相同,分布却截然不同。
公式
有两个版本,具体取决于您是否拥有完整人口或样本。
总体标准差 (σ)
当您拥有组中每个成员的数据时使用。
σ = √((Σ(x_i - μ)^2) / (N))
样本标准差
当您的数据是来自较大总体的样本时使用(最常见的情况)。
s = √( Σ(x_i − x̄)² / (n − 1) )
分母是 n − 1(不是 n),用于纠正从样本估计总体参数时产生的偏差。这称为贝塞尔修正。
逐步计算
数据集: 6 名学生的测试成绩:72、85、68、91、74、80
第 1 步:求均值
x̄ = (72 + 85 + 68 + 91 + 74 + 80) / (6) = (470) / (6) = 78.33
第 2 步:找出与平均值的每个偏差
| 分数 | 偏差 (x − x̄) | 平方偏差 |
|---|---|---|
| 72 | −6.33 | 40.07 |
| 85 | +6.67 | 44.49 |
| 68 | −10.33 | 106.71 |
| 91 | +12.67 | 160.53 |
| 74 | −4.33 | 18.75 |
| 80 | +1.67 | 2.79 |
步骤 3:对偏差平方求和
Σ(x - x̄)^2 = 40.07 + 44.49 + 106.71 + 160.53 + 18.75 + 2.79 = 373.34
步骤 4:除以 n − 1(样本)
(373.34) / (6 - 1) = (373.34) / (5) = 74.67
第五步:求平方根
s = √(74.67) = 8.64
标准差是 8.64 点。典型的学生成绩与班级平均分相差约 8-9 分。
68-95-99.7 规则
对于正态分布的数据(钟形曲线),标准差与分布具有可预测的关系:
- 68% 的值落在平均值的 1 SD 范围内
- 95% 的值落在平均值的 2 SD 范围内
- 99.7% 的值落在平均值的 3 SD 范围内
应用于我们的示例(平均值 = 78.33,SD = 8.64):
- 68% 的分数:78.33 ± 8.64 → 69.7 至 86.97
- 95% 分数:78.33 ± 17.28 → 61.05 至 95.61
- 99.7% 的分数:78.33 ± 25.92 → 52.41 至 104.25
方差与标准差
方差 是标准差的平方:在我们的示例中,s² = 74.67。
为什么使用标准差而不是方差?
- 标准差与您的数据采用相同的单位(点、美元、米)
- 方差以平方为单位——实际上更难解释 -“平均分偏差8.64分”有意义; “方差为 74.67 点²”不是
实际用途
金融: 每日平均回报率为 0.05%、标准差为 1.2% 的股票比平均回报率相同、标准差为 0.3% 的股票风险要大得多。标准差是波动率测量的基础。
制造: 一家工厂生产目标直径为 10mm、SD 为 0.02mm 的螺栓,其一致性远远高于 SD 为 0.5mm 的螺栓。质量控制依赖于 SD。
医学: 临床试验报告 SD 以及显示治疗对患者效果的一致性的方法。
天气:“平均气温 18°C,标准差 4°C”告诉您的信息远不止平均温度 - 您知道要带什么。
Z 分数
z 分数将任何值转换为标准差单位,从而可以在不同数据集之间进行比较:
z = /x - x̄s
在我们的示例中,学生得分为 91:
z = (91 - 78.33) / (8.64) = (12.67) / (8.64) = +1.47
这个分数比平均值高出 1.47 个标准差——比班上大约 93% 的人要好。
立即计算标准差
我们的统计计算器可以根据您输入的任何数据集计算标准差、方差、平均值、中位数、众数等。粘贴您的数字并立即获得完整结果。