z 分数(或标准分数)衡量数据点与平均值的标准差。它将原始分数转换为标准化量表,以便可以在不同数据集之间进行比较。
Z 分数公式
z = (x − μ) ÷ σ
在哪里:
- x = 单个数据点
- μ (mu) = 总体平均值
- σ (sigma) = 总体标准差
对于样本,将 μ 替换为 x̄(样本均值),将 σ 替换为 s(样本 SD)。
工作示例
一名学生考试成绩为 72 分。班级平均值为 65,标准差为 8。
z = (72 − 65) ÷ 8 = 7 ÷ 8 = 0.875
该学生的得分高于平均值0.875 个标准差。
解释 Z 分数
| Z 分数 | 解释 | 百分位(大约) |
|---|---|---|
| −3 | 极低于平均水平 | 0.1% |
| −2 | 远低于平均水平 | 2.3% |
| −1 | 低于平均水平 | 15.9% |
| 0 | 平均而言 | 50.0% |
| +1 | 高于平均水平 | 84.1% |
| +2 | 远高于平均水平 | 97.7% |
| +3 | 远高于平均水平 | 99.9% |
68-95-99.7 规则
在正态分布中:
- 68% 的数据落在 ±1 标准偏差范围内
- 95% 在 ±2 个标准偏差内
- 99.7% 在 ±3 个标准偏差内
将 Z 分数转换为百分位数
获得 z 分数后,查找 标准正常值表(Z 值表)或使用:
Percentile = Φ(z) × 100
其中 Φ 是累积正态分布函数。
示例: z = 1.5 → Φ(1.5) = 0.9332 → 第 93.3 个百分位
Z 分数的应用
金融:
- Altman Z-Score 预测破产风险
- 用于风险管理以识别异常值
卫生保健:
- 儿童年龄 Z 分数的 BMI
- 骨密度 (DXA) T 分数是 z 分数的一种形式
质量控制:
- 六西格码使用 z 分数来衡量流程能力
- “6-sigma”流程的 z 分数为 6(每百万缺陷 3.4 个)
标准化测试分数:
- IQ 分数:平均值 100,SD 15(z 分数 +2 → IQ 130)
- SAT 分数:平均值 1000,SD 200(根据 z 分数缩放)
比较不同测试的分数
示例: Alice 在测试 A 中得分 80(平均值 70,SD 10)。鲍勃在测试 B 中得了 55 分(平均值 40,标准差 8)。
Alice's z = (80 − 70) ÷ 10 = 1.0
Bob's z = (55 − 40) ÷ 8 = 1.875
尽管原始分数较低,鲍勃相对于他的同龄人表现更好。