標準偏差を理解する: その意味と計算方法

標準偏差は、平均付近でデータがどの程度広がっているかを示します。標準偏差が小さいということは、データが密にクラスター化されていることを意味します。大きいものは広範囲に散在していることを意味します。

標準偏差が重要な理由

2 つのクラスはどちらもテストで平均 75% でした。ただし、クラス A では、スコアは 70 ～ 80% の範囲です。クラス B では、スコアの範囲は 40 ～ 100% です。平均値は重要な情報を隠しますが、標準偏差は重要な情報を明らかにします。

母集団 (すべてのデータ) の場合:

σ = √[ Σ(x - μ)² / N ]

サンプル (データのサブセット) の場合:

s = √[ Σ(x - x̄)² / (n-1) ]

どこ：

サンプルの式は、サブセットから推定する際のバイアスを補正するために、n-1 (n ではない) で除算します。

データ: 4、7、13、2、9 (5 つの値のサンプル)

ステップ 1: 平均を計算します:

Mean = (4 + 7 + 13 + 2 + 9) / 5 = 35 / 5 = 7

ステップ 2: 各値から平均を引いて 2 乗します。

ステップ 3: 差の二乗を合計します: 9 + 0 + 36 + 25 + 4 = 74

ステップ 4: n-1 = 4 で割る: 74 / 4 = 18.5

ステップ 5: 平方根を計算します: √18.5 ≈ 4.30

標準偏差 = 4.30

正規分布データの場合:

例: 平均身長 170 cm、SD 10 cm:

標準偏差計算ツールを使用して、任意のデータセットの平均、中央値、分散、標準偏差を計算します。