标准差是统计中最广泛使用的分布度量。它告诉您值在平均值周围的分布情况。本指南从基本原理和实例进行了解释。

标准差告诉您什么

平均值告诉您数据集的中心。标准差告诉您值通常偏离该中心有多远。

低标准偏差 → 值紧密聚集在平均值周围 高标准差 → 值与平均值相差很大

两个考试班的平均分都是 70%,但是:

  • A 级:分数为 68、69、70、71、72 — SD ≈ 1.4(非常一致)
  • B 级:分数为 40、55、70、85、100 — SD ≈ 22.4(高度可变)

均值相同,分布却截然不同。

公式

有两个版本,具体取决于您是否拥有完整人口或样本。

总体标准差 (σ)

当您拥有组中每个成员的数据时使用。

σ = √((Σ(x_i - μ)^2) / (N))

样本标准差

当您的数据是来自较大总体的样本时使用(最常见的情况)。

s = √( Σ(x_i − x̄)² / (n − 1) )

分母是 n − 1(不是 n),用于纠正从样本估计总体参数时产生的偏差。这称为贝塞尔修正。

逐步计算

数据集: 6 名学生的测试成绩:72、85、68、91、74、80

第 1 步:求均值

x̄ = (72 + 85 + 68 + 91 + 74 + 80) / (6) = (470) / (6) = 78.33

第 2 步:找出与平均值的每个偏差

分数 偏差 (x − x̄) 平方偏差
72 −6.33 40.07
85 +6.67 44.49
68 −10.33 106.71
91 +12.67 160.53
74 −4.33 18.75
80 +1.67 2.79

步骤 3:对偏差平方求和

Σ(x - x̄)^2 = 40.07 + 44.49 + 106.71 + 160.53 + 18.75 + 2.79 = 373.34

步骤 4:除以 n − 1(样本)

(373.34) / (6 - 1) = (373.34) / (5) = 74.67

第五步:求平方根

s = √(74.67) = 8.64

标准差是 8.64 点。典型的学生成绩与班级平均分相差约 8-9 分。

68-95-99.7 规则

对于正态分布的数据(钟形曲线),标准差与分布具有可预测的关系:

  • 68% 的值落在平均值的 1 SD 范围内
  • 95% 的值落在平均值的 2 SD 范围内
  • 99.7% 的值落在平均值的 3 SD 范围内

应用于我们的示例(平均值 = 78.33,SD = 8.64):

  • 68% 的分数:78.33 ± 8.64 → 69.7 至 86.97
  • 95% 分数:78.33 ± 17.28 → 61.05 至 95.61
  • 99.7% 的分数:78.33 ± 25.92 → 52.41 至 104.25

方差与标准差

方差 是标准差的平方:在我们的示例中,s² = 74.67。

为什么使用标准差而不是方差?

  • 标准差与您的数据采用相同的单位(点、美元、米)
  • 方差以平方为单位——实际上更难解释 -“平均分偏差8.64分”有意义; “方差为 74.67 点²”不是

实际用途

金融: 每日平均回报率为 0.05%、标准差为 1.2% 的股票比平均回报率相同、标准差为 0.3% 的股票风险要大得多。标准差是波动率测量的基础。

制造: 一家工厂生产目标直径为 10mm、SD 为 0.02mm 的螺栓,其一致性远远高于 SD 为 0.5mm 的螺栓。质量控制依赖于 SD。

医学: 临床试验报告 SD 以及显示治疗对患者效果的一致性的方法。

天气:“平均气温 18°C,标准差 4°C”告诉您的信息远不止平均温度 - 您知道要带什么。

Z 分数

z 分数将任何值转换为标准差单位,从而可以在不同数据集之间进行比较:

z = /x - x̄s

在我们的示例中,学生得分为 91:

z = (91 - 78.33) / (8.64) = (12.67) / (8.64) = +1.47

这个分数比平均值高出 1.47 个标准差——比班上大约 93% 的人要好。

立即计算标准差

我们的统计计算器可以根据您输入的任何数据集计算标准差、方差、平均值、中位数、众数等。粘贴您的数字并立即获得完整结果。